Поточное сканирование документов

Поделись знанием:
Перейти к: навигация, поиск

Поточное сканирование документов, сканирование анкет — один из способов быстрой обработки результатов анкетирования широкого круга респондентов.





Этапы процесса

Сканирование бумажных документов

Эффективность данного этапа определяется в большей степени качеством используемого оборудования.

Современные поточные сканеры оснащены системой автоматической подачи документов, что позволяет сократить ручной труд и достигнуть скорости оцифровки до 200 изображений в минуту на один сканер.

Распознавание информации

На этапе распознавания используются программные OCR-компоненты. Качество результирующих записей зависит от степени готовности анкеты к машинному чтению и тщательности предварительной настройки программного обеспечения.

Верификация данных

Производится автоматическая верификация полученных после распознавания данных. Наиболее частые проверки — проверка на ожидаемый тип данных (число/чекбокс/строка), проверка на присутствие значений. Все проблемные места, отмеченные на данном этапе, маркируются для передачи на стадию коррекции.

Коррекция данных

Оператор обрабатывает информацию, полученную на стадии верификации данных, и вносит изменения в результирующую запись вручную (ввод с клавиатуры, выбор из списка заранее заданных ответов). На данном этапе повторно производится «обучение» программного комплекса. Все накопленные правки анализируются алгоритмами и применяются для дальнейшей работы с данным набором анкет.

Экспорт данных

Оцифрованные структурированные данные выгружаются в необходимом формате для дальнейшего анализа результатов анкетирования.

Производительность систем ввода анкет

На этапах сканирования и распознавания анкет важную роль играет применяемая техника. Использование профессиональных промышленных сканеров и мощных станций распознавания позволит добиться максимальной скорости оцифровки (около 96000 анкет за 1 рабочий день для 1 сканера). Узким местом на пути получения готовой базы данных является этап коррекции данных. Для обеспечения минимального количества ошибок операторы вручную обрабатывают информацию, помеченную на этапе верификации данных. Процедура занимает много времени и требует серьёзного специализированного обучения сотрудников.

Напишите отзыв о статье "Поточное сканирование документов"

Отрывок, характеризующий Поточное сканирование документов



Весь этот день 25 августа, как говорят его историки, Наполеон провел на коне, осматривая местность, обсуживая планы, представляемые ему его маршалами, и отдавая лично приказания своим генералам.
Первоначальная линия расположения русских войск по Ко лоче была переломлена, и часть этой линии, именно левый фланг русских, вследствие взятия Шевардинского редута 24 го числа, была отнесена назад. Эта часть линии была не укреплена, не защищена более рекою, и перед нею одною было более открытое и ровное место. Очевидно было для всякого военного и невоенного, что эту часть линии и должно было атаковать французам. Казалось, что для этого не нужно было много соображений, не нужно было такой заботливости и хлопотливости императора и его маршалов и вовсе не нужно той особенной высшей способности, называемой гениальностью, которую так любят приписывать Наполеону; но историки, впоследствии описывавшие это событие, и люди, тогда окружавшие Наполеона, и он сам думали иначе.
Наполеон ездил по полю, глубокомысленно вглядывался в местность, сам с собой одобрительно или недоверчиво качал головой и, не сообщая окружавшим его генералам того глубокомысленного хода, который руководил его решеньями, передавал им только окончательные выводы в форме приказаний. Выслушав предложение Даву, называемого герцогом Экмюльским, о том, чтобы обойти левый фланг русских, Наполеон сказал, что этого не нужно делать, не объясняя, почему это было не нужно. На предложение же генерала Компана (который должен был атаковать флеши), провести свою дивизию лесом, Наполеон изъявил свое согласие, несмотря на то, что так называемый герцог Эльхингенский, то есть Ней, позволил себе заметить, что движение по лесу опасно и может расстроить дивизию.
Осмотрев местность против Шевардинского редута, Наполеон подумал несколько времени молча и указал на места, на которых должны были быть устроены к завтрему две батареи для действия против русских укреплений, и места, где рядом с ними должна была выстроиться полевая артиллерия.
Отдав эти и другие приказания, он вернулся в свою ставку, и под его диктовку была написана диспозиция сражения.
Диспозиция эта, про которую с восторгом говорят французские историки и с глубоким уважением другие историки, была следующая: