Распознавание текста
У нас можно купить мужской дипломат. Огромный выбор и низкие цены.
Для работы с растровым текстом необходимо:
• выбрать алгоритм, в соответствии с которым он будет преобразовываться;
• произвести настройки распознавания текста.
Алгоритмы распознавания текста
![]() |
Для распознавания растрового текста необходимо выбрать в закладке Распознавание диалога Параметры конверсии следующие алгоритмы: |
![]() |
Нет – поиск областей, содержащих растровый текст, без их векторизации; |
![]() |
Текстовая область – распознавание и выделение текстовых областей; текстовую информацию в распознанную прямоугольную область можно ввести при помощи процедуры редактирования распознанных текстов; |
![]() |
Полилинии (Контуры) – аппроксимирует растровый текст векторными полилиниями (контурами); |
![]() |
OCR – распознает растровые тексты и создает текстовые объекты. |
Для распознавания текста
=> Установите флажок Текстовая область в закладке Распознавание диалога Параметры конверсии.
=> Выберите подходящий алгоритм для работы с растровым текстом.
=> В закладке Параметры диалога Параметры конверсии введите значение Высота текста, равное максимальной высоте символов растрового текста верхнего регистра на изображении.
=> Настройте параметры распознавания текста в закладке Текст диалога Параметры конверсии:

• Ориентация – выберите ориентацию растровых текстов, содержащихся на изображении;
• Перекрытые графикой – при установленном флажке программа находит растровые тексты, пересекаемые другими растровыми объектами;
• Отдельно стоящие буквы – позволяет находить отдельно стоящие буквы;
Информация. Не рекомендуется использовать режимы Перекрытые графикой и Отдельно стоящие буквы при работе со сложными (насыщенными информацией или плохого качества) документами, чтобы исключить неправильное распознавание в качестве текста мелких объектов графики.
• Шаблоны слов – устанавливается при работе с модулем OCR для улучшения результатов распознавания. Необходимо задать образцы написания текста, содержащегося в растровом документе Шаблоны. Если Шаблоны не заданы, программа будет использовать набор стандартных образцов.
Задание образцов текста
Ниже приведено формальное описание определения образца слова:
“[% [длина]тип символа]II[ буква] ]…”…
где:
% – символ, характеризующий начало последовательности символов;
длина – количество символов (можно не указывать, если количество символов различно);
тип символа – тип последовательности символов.
Типы символов представлены в таблице:
| D | Цифры |
| N | Прописные буквы национального алфавита |
| n | Строчные буквы национального алфавита |
| E | Прописные буквы латинского алфавита |
| e | Строчные буквы латинского алфавита |
| S | Специальные текстовые символы (знаки плюса, минуса, равенства, градуса и другие) |
Примеры:
| Последовательность символов | Шаблон |
| 5 25 5559 22.9 | %D |
| R25 R15 R13 | R%2D |
| Moscow Hanover | %1E%e |
| проект | %n |
| 5V 220V 13.8V | %DV |
| 12° 30° 45° | %2D%1S |
12° 30° 45° – надпись содержит две цифры (2D) и один знак градуса (1S) – %2D%1S.
В надписях 5V, 220V, 13.8V цифры 5, 220, 13.8 являются переменной частью, а V – фиксированным символом. Следовательно, шаблон для указанных надписей можно определить как %DV. Количество цифр в рассмотренных текстовых обозначениях различно и поэтому в шаблоне не указано.
Таблица высот – если вы хотите при векторизации получить тексты заданной высоты, введите требуемое значение высоты текстов в таблицу и установите флажок Таблица высот. При задании нескольких значений высота результирующего текста будет округляться до ближайшего значения в списке.
Файл с OCR-символами – файл для хранения топологических моделей, используемых при работе модуля OCR.
Кроме того, можно обучить программу распознавать другие текстовые символы или другие виды написания текстовых символов, содержащиеся в стандартном файле шаблона.




