Дизайнер ELMA RPA > Моделирование процесса > Активити / Распознавание документа

Распознавание документа

Активити Распознавание документа позволяет извлекать данные из документов методом Smart Engines. Для распознавания доступны документы в форматах .pdf и .jpg. Вы можете указать контекстные переменные, в которые требуется сохранить распознанный текст, и использовать их в процессе. Подробнее о контекстных переменных можно прочитать в статье «Контекст процесса».

Настройки активити

Чтобы открыть окно настроек, нажмите на активити на графической модели процесса.

Вкладка «Параметры»

На вкладке Параметры отображаются основные параметры активити:

  • Наименование — название активити на графической модели процесса. При добавлении активити его название задается по шаблону. В этом поле название можно изменить;
  • Метод распознавания — выбор метода распознавания.

Распознавание документов методом Smart Engines

Для извлечения данных из официальных документов (паспорт, СНИЛС, виза и т. д.) можно использовать модуль Smart Engines. Это инструмент для распознавания паспортов и других идентификационных документов России и других стран.

По умолчанию он представлен только для ознакомления в качестве ограниченной версии. При этом часть символов распознаваемых данных скрывается. Для активации полной версии требуется приобрести лицензию. Чтобы получить более подробную информацию, напишите на почту info@elma-rpa.ru.

После того как вы выберете метод Smart Engines, заполните следующие поля:

document-recognition-1

  • Документ — документ, данные из которого требуется извлечь. Для выбора доступны контекстные переменные процесса типа Файл;
  • Страна — выбор страны, которой принадлежит распознаваемый документ;
  • Тип распознаваемого документа — выбор типа документа (виза, паспорт, свидетельство о рождении, ИНН и т. д.).

Чтобы задать, какие данные нужно извлечь из документа, и указать переменные, в которые они будут сохранены, нажмите на кнопку Назначить переменные. Далее вы увидите реквизиты выбранного типа документа. Для каждого документа задан свой набор реквизитов.

recognize-document-2

Для каждого реквизита можно выбрать контекстную переменную процесса, в которую сохраняются данные. Вы также можете создать новую переменную, выбрав из выпадающего списка Создать параметр. Чтобы удалить переменную, нажмите на значок delete-icon-2.

В окне отображается точность распознавания выбранного реквизита. Она определяет порог требуемой точности (уверенности) распознавания и зависит от множества факторов. Один из самых значимых — качество изображения документа. Например, вы указали 90% (0.9). Это означает, что, если уверенность в распознавании составляет 90% и выше, вы разрешаете получить распознанное значение. При точности менее 90% значение не принимается, т.е. контекстная переменная не будет заполняться.

При небольшой требуемой точности увеличивается вероятность получить данные с ошибкой. Поэтому нужно аккуратно подбирать этот параметр. В первую очередь нужно учитывать качество документов. Если вы уверены, что оно хорошее, то можно указать точность 97% и выше. Если качество несколько ниже, лучше указать 94%. Если оно будет плохим, можно ввести точность около 90% или ниже.

Если данные не будут распознаны, то процесс прекратится, и возникнет ошибка. Чтобы избежать прерывания процесса, предусмотрите эскалацию для этого активити. Подробнее об эскалации читайте в этой статье.

Вы можете искать реквизиты документов по их названиям. Для этого в строке поиска начните вводить название. Результаты поиска сразу отобразятся в таблице.

Все выбранные реквизиты и переменные отображаются в блоке Извлекаемые данные.

Вкладка «Обработчики»

О вкладке Обработчики можно прочитать в статье «Общие принципы настройки активити».