Аннотация:Оптическое распознавание текста на сделанном с произвольного ракурса изображении требует предварительной нормализации изображения – преобразования к такому
виду, как если бы оно было получено с удобного для распознавания ракурса. При этом
неточности нормализации приводят к ошибкам распознавания. На сегодняшний день в
литературе предложен ряд критериев точности нормализации, однако их соответствие качеству распознавания не исследуется. В данной работе для случая документа фиксированной структуры введена нормальная вероятностная модель распознавания, в соответствии с
которой вероятность верного распознавания символа падает по гауссиане с ростом невязки
координат этого символа. Для этой модели доказано, что критерий точности нормализации изображения, равный среднеквадратичной по текстовым полям документа невязке
координат, монотонно связан с вероятностью верного распознавания всего документа. Наконец, среднеквадратичная невязка координат для важнейшего случая проективной нормализации и состоящей из прямоугольников области интереса впервые были вычислена
аналитически