Аннотация:Рассматривается задача, возникающая при разработке систем электронного документооборота. Речь идёт о переводе документов на бумажных носителях в электронную форму, в частности, о финансовых документах, содержащих таблицы. Таблицы различной структуры и размеров являются непременным атрибутом многих видов документов, таких как счета, ведомости, чеки и т.п. Исходными данными в этой задаче являются цифровые изображения, полученные путем сканирования или фотографирования бумажных документов. Для того чтобы перевести такой документ в электронную форму, нужно найти таблицы в изображениях, определить структуру каждой найденной таблицы, распознать по структуре тип таблицы, выделить поля таблицы и распознать их содержимое. В основе известных решений задачи традиционно лежат дискретные методы обработки и анализа изображений, оперирующие с матрицей пикселей. Дальнейшее развитие подходов и методов решения данной задачи мотивируется широким использованием мобильных телефонов и планшетов для получения изображений документов. При такой съёмке таблицы получают значительные геометрические искажения, в том числе нелинейные, как за счет искривления поверхности бумажного документа, так и в результате не ортогонального ракурса съемки. Поэтому задача разработки новых методов и алгоритмов для распознавания таблиц на таких фотографиях остаётся актуальной.
В работе исследуется новый подход к решению данной задачи, основанный на использовании методов непрерывной морфологии. Основная идея подхода состоит в представлении изображения в виде геометрического графа и решении задач детектирования, распознавания и структурного анализа таблиц на основе анализа этого графа. Целью исследования является повышение производительности и универсальности алгоритмов распознавания таблиц в системах электронного документооборота.
Основными результатами выполненной работы являются следующие алгоритмы:
- обнаружения и локализации таблиц на изображении на основе выделения семейств горизонтальных и вертикальных линий во внутреннем скелете изображения документа;
- устранения геометрических искажений найденных линий (распрямление линий таблиц);
- определения ориентации таблицы и приведения изображения в стандартную форму (нормализация);
- определения и классификации структуры таблицы на основе внешнего скелета изображения документа и сравнения полученной структуры со структурой эталонных описаний;
- сегментации ячеек таблиц и выделения из них текстовых записей для дальнейшего распознавания.