26.04.2004 В системе Поиск@Mail.ru появилась возможность поска с учетом морфологии русского языка
Компания @Mail.ru объявила о внедрении в системе Поиск@Mail.ru возможности искать с учетом морфологии русского языка. Таким образом, Поиск@Mail.ru стала системой, которая осуществляет поиск информации по всему миру, учитывая при этом особенности запросов, составленных на русском. Новый поисковый сервис на портале @Mail.ru был запущен летом 2003-го года. В качестве поискового механизма была выбрана зарекомендовавшая себя во всем мире технология Google WebSearch, которая осуществляет индексацию ресурсов всего мирового Интернета. Таким образом, Поиск@Mail.ru сразу приобрел большое конкурентное преимущество перед всеми отечественными поисковыми системами, осуществляющими поиск только по русской части сети, на долю которой приходится всего около 8% страниц. Однако, механизм компании Google не был до конца адаптирован к особенностям грамматики русского языка, в частности, при обработке поисковых запросов система не учитывала словоформы, получающиеся в результате склонения и спряжения слов. Таким образом, часть документов с нужными результатами, могла выпасть из поля зрения поискового механизма, если слово в них встречалось в другом падеже, нежели в запросе. Чтобы решить эту проблему, команда разработчиков компании @Mail.ru создала дополнительный программный модуль, усовершенствующий работу механизма Google. Теперь Поиск@Mail.ru умеет учитывать все возможные формы слова в одном запросе. Эта уникальная возможность доступна только пользователям портала @Mail.ru, на сайте поисковой машины Google.com она не реализована. Причем, пользователь может по своему желанию включать и отключать эту возможность, в зависимости от конкретной задачи. Особенно помогает поиск "с учетом морфологии" при поиске информации, которая в сети представлена плохо. Например, при запросе "румынские поэты биография" поисковая машина выдает 7 документов в режиме "без учета морфологии" и 126 документов "с учетом морфологии". Напротив, если результатов поиска слишком много и они не очень релевантны, морфологию можно отключить, сузив таким образом область поиска. |