16.09.2003 Новая версия программного продукта RCO Morphology 2.0
Компания "Гарант-Парк-Интернет" объявила о выходе новой версии программного продукта RCO Morphology 2.0, который предназначен для полного морфологического анализа слов русского языка. Значительной переработке подверглись словари и алгоритмы бессловарного анализа. Ключевой особенностью новой версии является высокое качество анализа таких категорий слов, как фамилии, наименования организаций, географические названия и другие, число которых в языке потенциально неисчислимо. Продукт поставляется в виде динамической библиотеки (dll) для Windows и предназначен для разработчиков информационно-поисковых и аналитических систем, требующих высокоточной обработки текста. Компьютерная морфология необходима в прикладных системах, ведущих поиск и анализ информации на естественном языке. К числу основных функций, обеспечиваемых модулем морфологического анализа, относятся получение всех словоформ слова, постановка слова в заданную форму (например, словарную) и получение грамматических характеристик словоформы (рода, числа, падежа и других). Большая часть слов текста представляет почти неизменный фундамент языка и охватывается словарем объемом около 100 тысяч слов. Другая, более редкая, но не менее важная составляющая лексикона, постоянно пополняется и в принципе не имеет четко очерченных границ, прежде всего в части имен собственных и словообразовательных вариантов известных слов. Тем не менее, общие правила словообразования и словоизменения обладают регулярностью и изменяются относительно медленно, что позволяет в большинстве случаев достаточно точно идентифицировать не только модель словоизменения, но и лексико-семантический разряд неизвестного слова. Модуль RCO Morphology 2.0 предоставляет три возможности: точный анализ известного слова по словарю объемом в 115 тысяч слов (более 3 млн словоформ), высоко достоверный анализ неизвестного слова на основе комплекса правил, вероятностный анализ посредством соотнесения с моделями словоизменения часто встречающихся слов. |