Разное
Программы распознавания текста
Потребность в распознавании текста возникает у многих людей работающих с документами, но они порой и не знают, что для решения этого вопроса есть не только коммерческое программное обеспечение но и бесплатное. Итак, что мы имеем.
Тем, у кого потребность в распознавании текста возникает не чаще раза в месяц, можно посоветовать любой профильный онлайн-сервис или же всем известные бесплатные OneNote и «Google Документы». Можно воспользоваться и пакетом Adobe Acrobat. Однако для работы с большим количеством документов все перечисленные программы неудобны. В связи с этим рассмотрим несколько специализированных решений, созданных для распознавания текста и подходящих для постоянной работы с отсканированными документами
ABBYY Finereader
Эта программа, пожалуй, не менее популярна в своем сегменте, чем Adobe Photoshop среди графических редакторов. И причина, конечно же, не только в продуманной маркетинговой политике, но прежде всего в высокой точности распознавания текста на многих языках и множестве дополнительных возможностей. Последняя версия продукта – 14-я.
Основные преимущества ABBYY Finereader:
- Распознает 192 языка на основе кириллицы, латиницы, греческого, армянского и арабского алфавитов, а также иероглифического письма.
- Множество поддерживаемых форматов входящих файлов с текстом: PDF, PDF/А, TIFF, JPEG, JBIG2, PNG, BMP, GIF, DjVu, DOC(X), XLS(X), PPT(X), VSD(X), HTML, RTF, TXT и др.
- Сохранение обработанного текста во множество форматов файлов: DOC(X), XLS(X), PDF, PDF/А, RTF, TXT, CSV, ODT, EPUB, FB2, DjVu, PPTX, HTML, TIFF, JPEG, PNG.
- Программа позволяет работать с PDF как с простыми файлами: редактировать текст, комментировать, защищать документы и т. д. При наличии FineReader программа Adobe Acrobat, по сути, не нужна.
- Сохранение исходного форматирования отсканированного документа: программа воспроизводит расположение текста, таблиц, колонтитулов, примечаний, нумерацию страниц, содержание, оглавление и т. д.
- Автоматическая обработка страниц: пользователь может помещать файлы, в которых надо распознать текст, в специальную папку, и программа будет автоматически сохранять обработанные документы. Данная функция доступна только в версиях Business и Enterprise.
Из недостатков можно назвать один, но довольно существенный: бессрочная лицензия самой дешевой версии FineReader стоит 6990 рублей, а подписка на год – 3190 рублей. Но для тех, кто постоянно работает с документами, причем это является частью их бизнеса, данный недостаток вряд ли станет препятствием для приобретения продукта.
Readiris Pro
Довольно мощное решение для распознавания текста в отсканированных документах. Программа совсем немного уступает FineReader в основном назначении и даже имеет дополнительные инструменты, которые отсутствуют у лидера. В настоящий момент актуальна 17-я версия.
Ключевым отличием от FineReader является то, что Readiris Pro умеет читать вслух PDF-файлы. Насколько это нужно, если у вас стоит задача распознать текст - это еще вопрос. А учитывая то, что:
Пакет предлагается в двух версиях – Readiris Pro и Readiris Corporate (поддерживает еще пакетную обработку документов и создание PDF/A). Обе распространяются с постоянными лицензиями: первая стоит €99, вторая – €199.
Нужно еще подумать, а может приобрести FineReader по той же примерно стоимости.
Freemore OCR
Абсолютно бесплатная программа, однако и по функциональности, и по удобству она уступает двум предыдущим. К тому же вместе с Freemore OCR пытается установиться различный рекламный мусор, чему активно сопротивляется антивирус.
Преимущество у этой программы одно - ее бесплатность, поэтому обозначим ключевые особенности.
Особенности Freemore OSR:
- По умолчанию поддерживается распознавание только английского текста. Пакеты других языков нужно загружать дополнительно.
- Несколько инструментов для работы с PDF-файлами. Например, поддерживается шифрование файлов, цифровая подпись.
- Экспорт обработанного текста в Microsoft Office.
- Форматирование исходного документа программа, к сожалению, не сохраняет.
Как видим, бесплатное решение явно на уровень ниже развитых платных аналогов. Но все же Freemore OCR распознает текст лучше, чем онлайн-сервисы или программы, в которых эта функция встроена в качестве дополнительной (например, тот же OneNote с ошибками распознает скриншот с самого себя).
Так что если у вас задачи по распознаванию текста появляются не часто, но вы хотите результат качественнее чем у онлайн-сервисов, то это решение для вас.
Выводы
Каких-то пять-десять лет назад конкуренция в сегменте программ распознавания текста была выше и количество таких продуктов было больше. Но теперь в явные лидеры выбились FineReader и Readiris Pro, оставив соперников далеко позади.
Что же касается бесплатных решений, то их предложение заметно сузилось. Помнится, CuneiForm распознавала текст почти как FineReader, да и по функциональности не слишком уступала, однако ее поддержка прекращена, как и ряда других аналогов. Похоже, эту нишу прочно заняли онлайн-сервисы и продолжать поддержку программ не имеет смысла.
По материалам www.it-world.ru