Автоматический поиск опорных элементов на документах полужесткой структуры
От: Ланин Михаил Олегович  
Дата: 18.11.15 21:39
Оценка:
Статья:
Автоматический поиск опорных элементов на документах полужесткой структуры
Автор(ы): Ланин Михаил Олегович
Дата: 09.10.2015
Статья посвящена проблеме потокового извлечения данных из документов полужесткой структуры. В работе кратко рассматривается возможный подход к описанию документов переменной структуры и подробно описывется алгоритм автоматического поиска опорных элементов по пользовательской разметке извлекаемых данных, а так же метод и результаты оценцки его эффективности. Описанный подход показал свою эффективность на реальных платежных документах ряда немецких поставщиков: 89,3% счетов могут быть обработаны без ошибок при минимальном участии пользователя.


Авторы:
Ланин Михаил Олегович

Аннотация:
Статья посвящена проблеме потокового извлечения данных из документов полужесткой структуры. В работе кратко рассматривается возможный подход к описанию документов переменной структуры и подробно описывается алгоритм автоматического поиска опорных элементов по пользовательской разметке извлекаемых данных, а так же метод и результаты оценки его эффективности. Описанный подход показал свою эффективность на реальных платежных документах ряда немецких поставщиков: 89,3% счетов могут быть обработаны без ошибок при минимальном участии пользователя.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.