Разработчики PDF Commander обновили модуль распознавания текста
Разработчики улучшили алгоритмы программы для распознавания текста. Изменения направлены на повышение точности извлечения данных из сканов и изображений
Работа с отсканированными документами долгое время была «слепой зоной» делопроизводства. Текст на картинке нельзя найти через поиск, скопировать или отправить в работу, не перепечатав вручную. Теперь эту проблему решает технология OCR. Программы могут распознавать символы на изображениях и преобразовывать их в редактируемый текстовый формат.
Разработчики PDF Commander переработали алгоритмы распознавания. Обновленная программа уже доступна всем пользователям.
Что изменилось в OCR-модуле
Теперь программа предлагает два режима.
- Быстрый — для четких и простых изображений.
- Интеллектуальный — распознавание с помощью нейросети, справляется мелкими шрифтами, сложной версткой и плохим качеством исходников.
Главное изменение коснулось работы со сложными макетами. В новой версии появилась ручная сегментация: можно указать, где находится таблица, где — колонка, а где — иллюстрация, и для каждого фрагмента задать свой тип распознавания. Это особенно важно для бухгалтерии, юристов и архивистов, которым часто приходится иметь дело с нестандартными формами.
Также добавлена поддержка более 100 языков распознавания, которые можно загрузить из облака по мере необходимости.

Для каких сфер будет полезно данное обновление
В компании отметили, что обновление OCR-модуля связано с увеличением объема электронного документооборота. Сценарии работы с PDF-документами становятся разнообразнее, а сотрудничество с партнерами из дружественных стран требует поддержки большего количества языков.
Обновленный OCR в российской программе будет полезен для обработки PDF, когда требуется:
- извлечение текста из изображений;
- подготовка документов к редактированию — восстановление текстового слоя для внесения правок, поиска и интеграции с системами CRM;
- оцифровка архивов — перевод бумажных фондов, исторических документов и подшивок в электронный формат.
Возможности актуальны для бизнеса, государственных учреждений, образовательных организаций, юридических и бухгалтерских служб, а также архивов и библиотек.
Источники изображений:
Архив компании
Рубрики
Рекомендации партнеров:
Новости отрасли:
Все новости:
Публикация компании
Профиль
Контакты
Рубрики
