Вход

Методы распознавания образов. Основы построения и функционирования систем распознавания

Рекомендуемая категория для самостоятельной подготовки:
Реферат*
Код 152611
Дата создания 2007
Страниц 27
Источников 7
Мы сможем обработать ваш заказ (!) 22 апреля в 12:00 [мск]
Файлы будут доступны для скачивания только после обработки заказа.
700руб.
КУПИТЬ

Содержание

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
1. МЕТОДЫ РАСПОЗНАВАНИЯ ОБРАЗОВ
1.1. ИНТЕНСИОНАЛЬНЫЕ МЕТОДЫ
1.2. ЭКСТЕНСИОНАЛЬНЫЕ МЕТОДЫ
2. ТЕХНОЛОГИИ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ОБРАЗОВ
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА

Фрагмент работы для ознакомления

К ведущим российским OCR-системам относятся [1]:
Fine Reader, Fine Reader Рукопись и Form Reader фирмы ABBYY Software House (http://www.abbyy.ru), позволяющие распознавать как печатные, так и рукописные многоязычные тексты;
CuneiForm (http://www.cuneiform.ru) фирмы Cognitive Technologies;
Cognitive Forms фирмы Cognitive Technologies (http://cognitive.ru), предназначенная для массового ввода структурированных документов (например, налоговых деклараций, бухгалтерских форм, платежных документов).
Работа системы типа Fine Reader включает два крупных этапа.
1. Анализ графических изображений:
выделение таблиц, картинок;
определение областей распознавания;
выделение строк, символов.
2. Распознавание отдельных символов.
Рассмотрим более подробно второй этап. На данном этапе система распознавания реализуется как классификатор.
Существуют три типа классификаторов:
1. шаблонные (растровые);
2. признаковые;
3. структурные.
Схема классификатора первого типа показана на рис.6. В нем с помощью критерия сравнения определется, какой из шаблонов выбрать из базы. Самый простой критерий - минимум точек, отличающих шаблон от исследуемого изображения. К достоинствам шаблонного классификатора относятся хорошее распознавание дефектных символов («разорванных» или «склеенных»), простота и высокая скорость распознавания. Недостатком является необходимость настройки системы на типы и размеры шрифтов.
Наиболее распространены признаковые классификаторы. Анализ в них проводится только по набору чисел или признаков, вычисляемых по изображению. Таким образом, происходит распознавание не самого символа, а набора его признаков, т. е. производных данных от исследуемого символа. Это неизбежно вызывает некоторую потерю информации.
Структурные классификаторы переводят шейп символа в его топологическое представление, отражающее информацию о взаимном расположении структурных элементов символа. Эти данные могут быть представлены в графовой форме. Такой способ обеспечивает инвариантность относительно типов и размеров шрифтов. Недостатками являются трудность распознавания дефектных символов и медленная работа.
В Fine Reader применяется так называемый структурно-пятенный эталон и его фонтанное (от англ. font — шрифт) представление (рис.7). Оно имеет вид набора пятен с попарными отношениями между ними. Подобную структуру можно сравнить со множеством шаров, нанизанных на резиновые шнуры, которые можно растягивать. При этом обеспечиваются все достоинства шаблонного и структурного классификаторов. Также данное представление нечувствительно к различным начертаниям и дефектам символов.
В современных OCR-системах обычно используются все три типа классификаторов, но основным является структурный. Для ускорения и повышения качества распознавания применяются растровый и признаковый классификаторы.
На рис.8 изображена укрупненная схема работы системы Fine Reader.
Особенности распознавания рукописных текстов:
использование структурно-пятенного эталона с учетом особенностей траектории движения пишущего инструмента (выделяются кольца, дуги, точки, отрезки и другие топологические признаки);
основным механизмом является выдвижение и подтверждение гипотез;
использование методов оптимизации при управлении перебором вариантов.
Пользовательский интерфейс Fine Reader иллюстрирует рис.9. В левом дочернем окне представлено исходное изображение распознаваемой страницы, разбитое на блоки текста (1, 3, 5) и рисунков (2, 4). Распознаванию подлежат блоки текста и таблицы, рисунки включаются в формируемый документ без распознавания. Результаты распознавания выводятся в правом дочернем окне. Фрагменты текста, по которым у системы возникли сомнения, выделены фоном.
В системах типа Fine Reader реализуются интеллектуальные механизмы, характерные для распознающей системы человека: целостное, целенаправленное, адаптивное (настройка на внешние условия и самообучение) восприятие. Экспериментальная проверка на рукописных текстах, написанных более 40 тыс. человек и имеющих суммарный объем более 3 млн. изолированных символов, показала, что такие системы дают 1-2 ошибки на 3000 машиночитаемых знаков.
OCR-система Cognitive Forms представляет собой программный комплекс для массового ввода документов, имеющих стандартизованные формы. Его модули, установленные на компьютерах локальной вычислительной сети, способны взаимодействовать друг с другом, образуя конвейер обработки данных, производительность которого может составлять более 10 тыс. страниц в сутки.
Технология ввода документов в стандартизованных формах включает две стадии: подготовительную и основную. На первой стадии создаются шаблоны документов, которые планируется вводить. Шаблон описывает свойства документа и входящих в него элементов данных: структуру документа, размер страниц, состав элементов данных, размеры и расположение соответствующих им полей, типы данных, форматы их представления, наборы допустимых значений и др. Шаблон может быть построен на основе графического представления документа-образца. Для создания и редактирования шаблонов предназначено средство Cognitive Forms Designer.
Основная стадия состоит из шести этапов.
Сканирование. Перевод бумажных документов в цифровое графическое представление. Управление данным процессом обеспечивают модуль пакетного сканирования Cognitive Forms ScanPack и модуль постраничного сканирования Cognitive Forms AutoScan.
Сортировка и комплектация. Документ может состоять из нескольких страниц, ассоциируемых с разными шаблонами. На этом этапе выполняется группирование полученных ранее графических образов страниц в наборы, соответствующие документам. Указанная задача решается в автоматическом режиме модулем Cognitive Forms Processor, который осуществляет:
предварительную обработку графического представления и выделение графических примитивов (границ полей, строк текста и др.);
выбор наиболее релевантного шаблона документа;
выделение и распознавание элементов данных, значимых с точки зрения оценивания комплектности документа;
контроль комплектности на основе соответствия последовательности типов страниц структуре, указанной в шаблоне.
Корректировка результатов сортировки. Этот этап выполняет оператор, к которому поступают некомплектные документы. Он выясняет причины возникших проблем и устраняет их.
Распознавание основной информации. Процесс реализуется модулем Cognitive Forms Processor. Графические представления страниц и распознанные значения элементов данных записываются в базы данных системы. Для повышения точности распознавания осуществляется логический контроль и контекстный анализ получаемых результатов.
Верификация результатов распознавания. Документы, содержащие элементы данных, которые не распознаны либо распознаны не однозначно (например, из-за низкого качества документа или нарушения правил его заполнения), направляются оператору. Для верификации и корректировки результатов распознавания служит модуль Cognitive Forms Editor.
Экспорт распознанных документов для передачи внешним приложениям.
ЗАКЛЮЧЕНИЕ
Общее решение задачи автоматического распознавания образов должно основываться на организации процесса с такими интеллектуальными составляющими, как целостность восприятия, целенаправленность, предвидение (выдвижение гипотез), максимальное использование контекста и знаний о среде (в пределе — использование модели мира), т. е. учете и реализации интеллектуальных механизмов зрительного восприятия человека.
Важнейшей стороной многоуровневого процесса восприятия является выдвижение гипотез на основе иерархической модели предметной области. В знакомой среде восприятие идет на уровне обобщений (частное-общее), укрупнений (часть-целое) и состоит в подтверждении гипотез на этих уровнях.
Автоматическое зрительное восприятие в настоящее время не достигает совершенства человеческого восприятия образов. Главная причина этого заключается в неумении строить достаточно полные и семантически выразительные компьютерные модели предметной области.
Среди OCR-технологий важное значение имеют специальные технологии решения отдельных классов задач автоматического распознавания образов:
поиск людей по фотографиям;
составление географических карт по исходной информации, используемой в предыдущей задаче;
анализ отпечатков пальцев и рисунков радужной оболочки глаза в криминалистике, охранных и медицинских системах и др.
Для построения системы распознавания объектов необходимо обеспечить как минимум три основных этапа, а именно: улучшение качества изображения путем фильтрации шумовых составляющих, сегментации или кластеризации объектов, присутствующих на изображении, и, наконец, классификации объектов. При этом результат распознавания в одинаковой степени зависит от качества каждого из этапов.
На этапе классификации объектов огромную роль играет набор входных данных для процесса классификации. Если этот набор избыточный или, наоборот, недостаточный, то это также отразиться на качестве распознавания. Как правило, непосредственно перед процессом классификации выполняется процедура выделения характерных признаков во входной информации, т.е. выделение наиболее значимой информации и игнорирование малозначащей. В настоящее время интеллектуальные алгоритмы, основанные на теории нечетких множеств, самостоятельно выполняют данную процедуру. Таким образом, теория нечетких множеств становится мощным инструментом для построения интеллектуальных аппаратно-программных систем распознавания образов.
ЛИТЕРАТУРА
1. Башмаков А.И., Башмаков И.А. Интеллектуальные информационные технологии: Учеб. пособие. – М.: Изд-во МГТУ им Н.Э.Баумана, 2005.– 304с.
2. Дана Х.Баллард, Кристофер М.Браун Зрение: биология бросает вызов технике // Реальность и прогнозы искусственного интеллекта: Сб. статей; Перс. с англ./ Под ред. И с предисл. В.Л. Стефанюка.- М.: Мир, 1987. – С. 103-123.
3. Денисов А.А. Информационные основы управления.–Л.: Энергоатомиздат, 1983. –72с.
4. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. - Новосибирск: Изд-во Ин-та математики, 1999. - 270 с.
5. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
6. Поспелов Д.А. Становление информатики в России. Информатика: Приложение к газете “Первое сентября”. - 1999. - № 19. - С. 7-10.
7. Шамис А.Л. Принципы интеллектуализации автоматического распознавания изображений и их реализация в системах оптического распознавания симоволов// Новости искусственного интеллекта, 2000.- №1.- С.27-30.
1

Список литературы [ всего 7]


ЛИТЕРАТУРА
1. Башмаков А.И., Башмаков И.А. Интеллектуальные информационные технологии: Учеб. пособие. – М.: Изд-во МГТУ им Н.Э.Баумана, 2005.– 304с.
2. Дана Х.Баллард, Кристофер М.Браун Зрение: биология бросает вызов технике // Реальность и прогнозы искусственного интеллекта: Сб. статей; Перс. с англ./ Под ред. И с предисл. В.Л. Стефанюка.- М.: Мир, 1987. – С. 103-123.
3. Денисов А.А. Информационные основы управления.–Л.: Энергоатомиздат, 1983. –72с.
4. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. - Новосибирск: Изд-во Ин-та математики, 1999. - 270 с.
5. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.
6. Поспелов Д.А. Становление информатики в России. Информатика: Приложение к газете “Первое сентября”. - 1999. - № 19. - С. 7-10.
7. Шамис А.Л. Принципы интеллектуализации автоматического распознавания изображений и их реализация в системах оптического распознавания симоволов// Новости искусственного интеллекта, 2000.- №1.- С.27-30.
Очень похожие работы
Пожалуйста, внимательно изучайте содержание и фрагменты работы. Деньги за приобретённые готовые работы по причине несоответствия данной работы вашим требованиям или её уникальности не возвращаются.
* Категория работы носит оценочный характер в соответствии с качественными и количественными параметрами предоставляемого материала. Данный материал ни целиком, ни любая из его частей не является готовым научным трудом, выпускной квалификационной работой, научным докладом или иной работой, предусмотренной государственной системой научной аттестации или необходимой для прохождения промежуточной или итоговой аттестации. Данный материал представляет собой субъективный результат обработки, структурирования и форматирования собранной его автором информации и предназначен, прежде всего, для использования в качестве источника для самостоятельной подготовки работы указанной тематики.
bmt: 0.01273
© Рефератбанк, 2002 - 2024