В ходе переписи населения в Таджикистане с помощью ABBYY FlexiCapture за 7 месяцев было обработано 13 млн бланков
Заказчики: Агентство статистики при Президенте Республики Таджикистан Государственные и социальные структуры Подрядчики: Abbyy Россия Продукт: ABBYY FlexiCaptureДата проекта: 2011/08
|
Технология: СЭД - Системы потокового распознавания
|
Компания ABBYY, разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, объявила в ноябре 2011 года о завершении ввода и обработки бланков с помощью системы ABBYY FlexiCapture в ходе переписи населения и жилищного фонда Республики Таджикистан.
Успешное внедрение решения ABBYY позволило снять с операторов необходимость ручного набора текста, оставив только задачу контролировать правильность ввода данных. Если раньше, при ручном методе, один оператор вводил в день по 200 бланков, то при использовании системы ABBYY FlexiCapture этот показатель возрос до 1500. В результате ввод и обработка информации в процессе второй переписи населения в Таджикистане составили 7 месяцев, по сравнению с предыдущей переписью, когда тот же объем работ при ручном вводе данных занял 18 месяцев. Кроме того, увеличилась достоверность информации, а ошибок стало в 20 раз меньше, чем при ручном методе. Теперь обработанные данные хранятся в электронном виде в архиве.
Центральным статистическим органом Таджикистана является Агентство по статистике при Президенте Республики, ответственное за проведение переписей населения, обследований домохозяйств, демографическую статистику и другое.
В ходе первой переписи населения Таджикистана в 2000 году данные обрабатывались вручную. Такой метод оказался малоэффективным – только на ввод всего объема информации потребовалось более полутора лет, и качество обработки оставляло желать лучшего.
Учитывая этот опыт и планируя проведение второй переписи населения, в Агентстве по статистике посчитали необходимым воспользоваться решением по автоматизированному вводу информации с бланков путем их сканирования и автоматического распознавания.
Подготовка проекта началась за несколько лет до старта кампании. В 2008 году с использованием ABBYY FormReader была осуществлена пробная перепись населения. Для основного этапа переписи в Таджикистане выбрали следующую версию ABBYY FormReader – систему ABBYY FlexiCapture. Это решение оптимально для проведения такого крупного проекта как перепись населения Республики, когда ежедневно надо обрабатывать сотни тысяч документов, и в процесс вовлечены десятки операторов.Российский рынок облачных ИБ-сервисов только формируется
Сотрудники Агентства и специалисты из ABBYY отладили общую систему обработки данных – от регистрации портфелей переписчиков до создания выходных статистических таблиц. Так было подготовлено более 200 рабочих мест для кодировщиков и операторов, налажено взаимодействие с существующей инфраструктурой и базами данных, проведено обучение временного персонала. Особое внимание уделили созданию дополнительных алгоритмов и правил для повторной проверки заполнения данных на бланках и их комплектности. Вторая национальная перепись населения и жилищного фонда Республики Таджикистан проходит в несколько этапов при финансировании из средств государственного бюджета, при поддержке Всемирного Банка и под эгидой Фонда ООН в области народонаселения (ЮНФПА). C 21 по 30 сентября 2010 года состоялся обход домохозяйств и заполнение бланков переписи. Далее следовал этап сбора и подготовки бланков к обработке.
Непосредственно сканирование и ввод данных начали в феврале и полностью закончили в сентябре 2011 года. В результате уже на этапе ввода данных система ABBYY FlexiCapture позволила сократить до минимума количество ошибок, вызванных неправильным заполнением бланков, и при необходимости в короткие сроки найти копии переписных листов. Специально для этого проекта специалистами ABBYY было разработано 10 видов бланков на двух языках – русском и таджикском. В настоящий момент проходит этап статистической обработки результатов переписи.
«При выборе подрядчика мы остановились на ABBYY, потому что в этой компании нам не только предложили программный комплекс для качественной обработки данных переписи населения Таджикистана и поделились опытом аналогичных проектов, но и обеспечили полную техническую поддержку всего проекта, – говорит Бахтия Мухаммадиева, директор Агентства статистики при Президенте Республики Таджикистан. – Эффект от внедрения системы оказался впечатляющим – нам удалось в кратчайшие сроки и с минимальными затратами завершить обработку 13 млн односторонних и двусторонних бланков, получив достоверные и полные данные».