Программы распознавания текста

 Потребность в распознавании текста возникает у многих людей работающих с документами, но они порой и не знают, что для решения этого вопроса есть не только коммерческое программное обеспечение но и бесплатное. Итак, что мы имеем.

Тем, у кого потребность в распознавании текста возникает не чаще раза в месяц, можно посоветовать любой профильный онлайн-сервис или же всем известные бесплатные OneNote и «Google Документы». Можно воспользоваться и пакетом Adobe Acrobat. Однако для работы с большим количеством документов все перечисленные программы неудобны. В связи с этим рассмотрим несколько специализированных решений, созданных для распознавания текста и подходящих для постоянной работы с отсканированными документами

ABBYY Finereader

Эта программа, пожалуй, не менее популярна в своем сегменте, чем Adobe Photoshop среди графических редакторов. И причина, конечно же, не только в продуманной маркетинговой политике, но прежде всего в высокой точности распознавания текста на многих языках и множестве дополнительных возможностей. Последняя версия продукта – 14-я.

Основные преимущества ABBYY Finereader:

  • Распознает 192 языка на основе кириллицы, латиницы, греческого, армянского и арабского алфавитов, а также иероглифического письма. 
  • Множество поддерживаемых форматов входящих файлов с текстом: PDF, PDF/А, TIFF, JPEG, JBIG2, PNG, BMP, GIF, DjVu, DOC(X), XLS(X), PPT(X), VSD(X), HTML, RTF, TXT и др.
  • Сохранение обработанного текста во множество форматов файлов: DOC(X), XLS(X), PDF, PDF/А, RTF, TXT, CSV, ODT, EPUB, FB2, DjVu, PPTX, HTML, TIFF, JPEG, PNG.
  • Программа позволяет работать с PDF как с простыми файлами: редактировать текст, комментировать, защищать документы и т. д. При наличии FineReader программа Adobe Acrobat, по сути, не нужна.
  • Сохранение исходного форматирования отсканированного документа: программа воспроизводит расположение текста, таблиц, колонтитулов, примечаний, нумерацию страниц, содержание, оглавление и т. д.
  • Автоматическая обработка страниц: пользователь может помещать файлы, в которых надо распознать текст, в специальную папку, и программа будет автоматически сохранять обработанные документы. Данная функция доступна только в версиях Business и Enterprise.

Из недостатков можно назвать один, но довольно существенный: бессрочная лицензия самой дешевой версии FineReader стоит 6990 рублей, а подписка на год – 3190 рублей. Но для тех, кто постоянно работает с документами, причем это является частью их бизнеса, данный недостаток вряд ли станет препятствием для приобретения продукта.

Readiris Pro

Довольно мощное решение для распознавания текста в отсканированных документах. Программа совсем немного уступает FineReader в основном назначении и даже имеет дополнительные инструменты, которые отсутствуют у лидера. В настоящий момент актуальна 17-я версия.

 Ключевым отличием от FineReader является то, что Readiris Pro умеет читать вслух PDF-файлы. Насколько это нужно, если у вас стоит задача распознать текст - это еще вопрос. А учитывая то, что:

Пакет предлагается в двух версиях – Readiris Pro и Readiris Corporate (поддерживает еще пакетную обработку документов и создание PDF/A). Обе распространяются с постоянными лицензиями: первая стоит €99, вторая – €199. 

 Нужно еще подумать, а может приобрести FineReader по той же примерно стоимости.

Freemore OCR

Абсолютно бесплатная программа, однако и по функциональности, и по удобству она уступает двум предыдущим. К тому же вместе с Freemore OCR пытается установиться различный рекламный мусор, чему активно сопротивляется антивирус.

 Преимущество у этой программы одно - ее бесплатность, поэтому обозначим ключевые особенности.

Особенности Freemore OSR:

  • По умолчанию поддерживается распознавание только английского текста. Пакеты других языков нужно загружать дополнительно.
  • Несколько инструментов для работы с PDF-файлами. Например, поддерживается шифрование файлов, цифровая подпись.
  • Экспорт обработанного текста в Microsoft Office.
  • Форматирование исходного документа программа, к сожалению, не сохраняет.

Как видим, бесплатное решение явно на уровень ниже развитых платных аналогов. Но все же Freemore OCR распознает текст лучше, чем онлайн-сервисы или программы, в которых эта функция встроена в качестве дополнительной (например, тот же OneNote с ошибками распознает скриншот с самого себя). 

 Так что если у вас задачи по распознаванию текста появляются не часто, но вы хотите результат качественнее чем у онлайн-сервисов, то это решение для вас.

Выводы

Каких-то пять-десять лет назад конкуренция в сегменте программ распознавания текста была выше и количество таких продуктов было больше. Но теперь в явные лидеры выбились FineReader и Readiris Pro, оставив соперников далеко позади.

Что же касается бесплатных решений, то их предложение заметно сузилось. Помнится, CuneiForm распознавала текст почти как FineReader, да и по функциональности не слишком уступала, однако ее поддержка прекращена, как и ряда других аналогов. Похоже, эту нишу прочно заняли онлайн-сервисы и продолжать поддержку программ не имеет смысла.

По материалам www.it-world.ru

Аренда 1С

1c online

Программные продукты 1С в аренду от 700 рублей в месяц. 1 месяц работы бесплатно! Узнать подробнее по ссылке.