26.06.2009Cognitive Technologies научила СЭД «ЕВФРАТ-Документооборот» понимать документы
Cognitive Technologies представила подсистему «Понимание документов» для СЭД «ЕВФРАТ-Документооборот», которая позволяет регистрировать документ за 3 секунды, что сокращает время регистрации по сравнению с ручным вводом в 5—10 раз. «ЕВФРАТ-Документооборот» — первая в России СЭД, в которой реализованы принципы понимания документов. Система может сама, без участия человека, разбирать содержание документа и понимать его — выделять смысловые части. Понятая таким образом информация автоматически заносится в регистрационную карточку документа для дальнейшей работы с ним в СЭД. Подсистема понимания документов — новый уровень работы с содержанием, который позволяет качественно сократить объем рутинной работы с документами, традиционно выполняемой человеком. В основу подсистемы «Понимание документов» легли результаты научных исследований компании в области анализа информации (синтаксический разбор, структурная модель представления знаний о языке, описание структурных связей). Кроме этого был учтен опыт, полученный в ходе создания информационных систем с модулями понимания документов для Пенсионного фонда РФ и ОАО «ММК». Специалистами Cognitive Technologies создано XML-представление делового документа, на базе которого осуществляется обучение системы «пониманию». Подсистема «Понимание документов» может обрабатывать поступившие в электронном виде документы текстового и графического (после распознавания) форматов или документы, поступившие в бумажном виде (после сканирования и распознавания). В настоящее время система обучена пониманию тех видов документов, потребность в массовой регистрации и учете которых в организациях наиболее востребована: входящая корреспонденция и договоры по различным видам деятельности. Для договоров подсистема «Понимание документов» автоматически заполняет в «ЕВФРАТ-Документооборот» следующие реквизиты: дату заключения, названия компаний, заключающих соглашение, предмет договора, срок действия договора, количество страниц договора, кроме этого она автоматически определяет наличие приложений и дополнительных соглашений, прикрепляя соответствующие файлы к карточке документа. Для входящей корреспонденции система заносит в карточку дату, информацию о корреспонденте (название учреждения, ФИО, должность), адресата (название учреждения, ФИО, должность), краткое содержание, количество страниц. Подсистема «Понимание документов» доступна в рамках проектного решения при условии использования системы «ЕВФРАТ-Документооборот». Комплекс работ по внедрению включает: - изучение вида и структуры документа; - определение информация для «понимания»; - создания XML-модели документа; - обучение системы «ЕВФРАТ-Документооборот» пониманию. Время обучения подсистемы «Понимание документов» для одного вида документов составляет около одной недели. В планах по развитию возможностей понимания документов в СЭД «ЕВФРАТ-Документооборот» стоит обеспечение более глубокой интеграции технологий понимания в систему для организации процессов движения документов и контроля исполнения, внедрение самообучающихся алгоритмов понимания, подключение нового аппарата морфологического разбора и анализатора структурных связей, разрабатываемых в лабораториях компании. О компании Cognitive Technologies