ContentAi / FineReader Engine

Используйте OCR-технологии с элементами искусственного интеллекта.

Посетить официальную страницу FineReader Engine

ВендорContentAi
ПродуктПрограммное обеспечение
ТипСредства разработки
ПрименениеДля бизнеса

FineReader Engine - многофункциональный инструментарий разработчика, который позволяет встраивать в приложения интеллектуальные технологии распознавания данных. С помощью OCR на основе технологий искусственного интеллекта вы можете создавать приложения с функциями качественного распознавания информации из документов, изображений, фотографий, скриншотов, мониторов и дисплеев, определения типа документа, конвертации сканированных документов в файлы форматов Word, Excel и PDF с возможностью поиска.

Возможности:

Полный набор технологий распознавания

Распознавайте печатный текст (OCR), рукопечатный текст (ICR) и штрихкоды (OBR). OCR поддерживает максимальное число языков распознавания, которые можно комбинировать.

Эффективные инструменты обработки PDF

OCR SDK позволяет конвертировать сканы, цифровые фотографии, TIFF, JPEG, BMP и другие файлы различных форматов во множество форматов PDF и PDF/A с возможностью поиска. Кроме того, можно импортировать файлы PDF и PDF/A и обрабатывать их разными способами.

Конвертируйте документы в PDF или обрабатываете файлы PDF и PDF/A — FineReader Engine позволяет обрабатывать и создавать электронные документы в соответствии со стандартами PDF/A-3 и электронные счета ZUGFeRD с помощью целого ряда возможностей и инструментов.

Искусственный интеллект и машинное обучение

Для анализа оформления документов и оценки гипотез FineReader Engine использует алгоритмы на базе искусственного интеллекта, машинного обучения и адаптивной технологии распознавания документов Adaptive Document Recognition Technology (ADRT).

На этапе анализа документа программа разбивает его на отдельные страницы и проверяет оформление каждой из них, а именно, где расположен текст, изображения, штрихкоды и элементы таблиц. Параллельно проверяется логическая структура документа. Таким образом инструмент определяет роль текстовых элементов — например, колонтитулы определяются как колонтитулы, а не как фрагменты отдельных страниц.

Многоядерные процессоры и параллельная обработка

Гибкая и масштабируемая архитектура FineReader Engine позволяет использовать многоядерные процессоры для обработки изображений в параллельных потоках, что значительно повышает скорость распознавания.

По умолчанию FineReader Engine определяет, использовать ли параллельную обработку автоматически в зависимости от нескольких факторов, таких как, число доступных физических и логических ядер процессора, число ядер в параметрах лицензии и числа страниц в документе. При необходимости настройки параллельной обработки можно изменить и выбрать необходимое число активных процессов. FineReader Engine поддерживает два разных объекта, за счет которых обеспечивается параллельная обработка — FRDocument и BatchProcessor. Выбирайте объекты в зависимости от сценария использования.

Поддержка облачных технологий и виртуальной среды

Чтобы обеспечить обработку документов в облаке или виртуальной среде, в FineReader Engine поддержан новый тип лицензирования Cloud-ready. Эта лицензия предназначена для приложений, установленных в облачной среде, работающих на платформах Microsoft Azure и Amazon EC2, а также может быть использована как на рабочих станциях, так и на виртуальных машинах, при условии наличия соединения с интернетом.

Лицензией Cloud-ready могут пользоваться множество пользователей одновременно. Лицензия может использоваться одновременно несколькими облачными инстансами или рабочими станциями, подключенными через интернет, и может быть ограничена количеством страниц для обработки.

Передовые возможности предварительной обработки изображений

После получения изображений FineReader Engine выполняет их предварительную обработку, что позволяет улучшить качество документа и оптимизировать процесс распознавания данных. Таким образом, даже изображения самого низкого качества и документы, сфотографированные на смартфон, эффективно обрабатываются и распознаются в максимально высоком качестве.

Профили распознавания для быстрого внедрения

FineReader Engine содержит предопределенные профили с оптимальными значениями параметров распознавания для решения типовых задач. Они позволяют экономить усилия и внедрять OCR-возможности, не обладая глубокими знаниями параметров OCR.

В ходе интеграции OCR SDK достаточно выбрать профиль, подходящий для конкретной задачи —оптимальные значения параметров выставятся автоматически. Большинство профилей доступно в двух версиях: для оптимизации качества распознавания или для оптимизации скорости обработки.

Готовое решение для распознавания машинно-считываемой зоны (MRZ) в документах, удостоверяющих личность

Во многих документах, удостоверяющих личность, персональная информация кодируется в машиночитаемых зонах, как указано ICAO в Doc 9303. Готовая к использованию технология позволяет автоматически извлекать полевые данные из машинных зон в документах, удостоверяющих личность, и проверять соответствующие контрольные цифры. Результаты могут быть экспортированы в формате XML или JSON. Функция добавляет значительную ценность системам для быстрого захвата и верификации персональных данных - например, во время открытия счета в банке или при верификации клиентов.

Классификация документов: машинное обучение и обработка естественного языка

Инструментарий ABBYY FineReader Engine включает технологию для классификации документов, что позволяет создавать приложения для автоматического распределения документов по предопределенным категориям и классам. В передовых алгоритмах классификации используются технологии машинного обучения и обработки естественного языка, которые позволяют выявить малейшие отличия между документами разных категорий и настроить гибкие процессы классификации.

Новый интеллектуальный классификатор по внешнему виду (Image Classifier) позволяет собирать и обрабатывать визуальную информацию об изображениях документов и быстро классифицировать их. Текстовый классификатор (Text Classifier) работает с текстовой информацией на документах, в том числа анализируя смысл текста, что позволяет повысить точность классификации. Классификаторы по внешнему виду и текстовый можно использовать как отдельно, так и совместно.

Компоненты пользовательского интерфейса

ABBYY FineReader Engine содержит пять визуальных компонент на базе ActiveX, которые позволяют создать интерфейс пользователя для просмотра и предварительной обработки изображений, а также редактирования и верификации распознанного текста и отслеживания процесса. Визуальные компоненты разработаны на основании обширного опыта ABBYY по созданию пользовательских приложений.

Обширная библиотека примеров кода

Наиболее быстрый способ начать использовать инструментарий ABBYY FineReader Engine – это просмотреть файл справки Help и ознакомиться с прилагаемой библиотекой примеров кода, которая поставляется вместе с продуктом. Она включает в себя набор примеров, демонстрирующих наиболее типичные сценарии использования SDK. Каждый раздел библиотеки содержит один или несколько примеров кода, сопровождаемых пошаговой инструкцией по решению той или иной задачи.

Подробная документация SDK и поддержка

Подробная документация и примеры кода позволяют свободно интегрировать возможности распознавания текста с приложениями даже новичкам.

Перед тем как начать работу с FineReader Engine, откройте справочное руководство для разработчиков, которое поставляется с продуктом, и изучите раздел «Основные сценарии использования». Каждый сценарий сопровождается подробным описанием, советами по внедрению и рекомендациями по оптимизации настроек. Если ваша задача не подходит ни под один базовый сценарий, вы можете обратиться к рекомендациям, приведенным в разделе «Продвинутые техники».

Модуль сравнения документов

С помощью модуля сравнения документов на базе ABBYY FineReader Engine можно автоматически сравнивать две версии документа и находить в них различия, чтобы, например, проверить соответствие внесенных изменений договоренностям или убедиться в отсутствии исправлений.

Хотите демонстрацию продукта? Обратитесь к нам по телефону или в любом мессенджере, указанным ниже. Также можно оставить запрос на электронную почту info@neosoft.pro.

Новости и акции ContentAi

Новости30 марта 2023

Обновленная версия ContentReader PDF: свежие подписки уже доступны для заказа!

Новости11 октября 2022

Adobe отзывает действующие лицензии у российских клиентов. Что делать?

ContentAi / FineReader Engine

Искусственный интеллект и машинное обучение

Поддержка облачных технологий и виртуальной среды

Передовые возможности предварительной обработки изображений

Профили распознавания для быстрого внедрения

Готовое решение для распознавания машинно-считываемой зоны (MRZ) в документах, удостоверяющих личность

Классификация документов: машинное обучение и обработка естественного языка

Компоненты пользовательского интерфейса

Подробная документация SDK и поддержка

Модуль сравнения документов

Новости и акции ContentAi