Профессиональный гибридный редактор, предназначенный для работы с растровой и векторной графикой, векторизации и растеризации.


Распознавание текста

У нас можно купить мужской дипломат. Огромный выбор и низкие цены.
    Для работы с растровым текстом необходимо:
    • выбрать алгоритм, в соответствии с которым он будет преобразовываться;
    • произвести настройки распознавания текста.

    Алгоритмы распознавания текста

   Для распознавания растрового текста необходимо выбрать в закладке Распознавание диалога Параметры конверсии следующие алгоритмы:
   Нет – поиск областей, содержащих растровый текст, без их векторизации;
   Текстовая область – распознавание и выделение текстовых областей; текстовую информацию в распознанную прямоугольную область можно ввести при помощи процедуры редактирования распознанных текстов;
   Полилинии (Контуры) – аппроксимирует растровый текст векторными полилиниями (контурами);
   OCR – распознает растровые тексты и создает текстовые объекты.

    Для распознавания текста

    => Установите флажок Текстовая область в закладке Распознавание диалога Параметры конверсии.
    => Выберите подходящий алгоритм для работы с растровым текстом.
    => В закладке Параметры диалога Параметры конверсии введите значение Высота текста, равное максимальной высоте символов растрового текста верхнего регистра на изображении.
    => Настройте параметры распознавания текста в закладке Текст диалога Параметры конверсии:



    • Ориентация – выберите ориентацию растровых текстов, содержащихся на изображении;
    • Перекрытые графикой – при установленном флажке программа находит растровые тексты, пересекаемые другими растровыми объектами;
    • Отдельно стоящие буквы – позволяет находить отдельно стоящие буквы;
    Информация. Не рекомендуется использовать режимы Перекрытые графикой и Отдельно стоящие буквы при работе со сложными (насыщенными информацией или плохого качества) документами, чтобы исключить неправильное распознавание в качестве текста мелких объектов графики.
    • Шаблоны слов – устанавливается при работе с модулем OCR для улучшения результатов распознавания. Необходимо задать образцы написания текста, содержащегося в растровом документе Шаблоны. Если Шаблоны не заданы, программа будет использовать набор стандартных образцов.

    Задание образцов текста

    Ниже приведено формальное описание определения образца слова:
    “[% [длина]тип символа]II[ буква] ]…”…
    где:
    % – символ, характеризующий начало последовательности символов;
    длина – количество символов (можно не указывать, если количество символов различно);
    тип символа – тип последовательности символов.
    Типы символов представлены в таблице:

 D  Цифры
 N  Прописные буквы национального алфавита
 n  Строчные буквы национального алфавита
 E  Прописные буквы латинского алфавита
 e  Строчные буквы латинского алфавита
 S  Специальные текстовые символы (знаки плюса, минуса, равенства, градуса и другие)

    Примеры:

 Последовательность символов  Шаблон
 5 25 5559 22.9  %D
 R25 R15 R13  R%2D
 Moscow Hanover  %1E%e
 проект  %n
 5V 220V 13.8V  %DV
 12° 30° 45°  %2D%1S

    12° 30° 45° – надпись содержит две цифры (2D) и один знак градуса (1S) – %2D%1S.
    В надписях 5V, 220V, 13.8V цифры 5, 220, 13.8 являются переменной частью, а V – фиксированным символом. Следовательно, шаблон для указанных надписей можно определить как %DV. Количество цифр в рассмотренных текстовых обозначениях различно и поэтому в шаблоне не указано.
    Таблица высот – если вы хотите при векторизации получить тексты заданной высоты, введите требуемое значение высоты текстов в таблицу и установите флажок Таблица высот. При задании нескольких значений высота результирующего текста будет округляться до ближайшего значения в списке.
    Файл с OCR-символами – файл для хранения топологических моделей, используемых при работе модуля OCR.
    Кроме того, можно обучить программу распознавать другие текстовые символы или другие виды написания текстовых символов, содержащиеся в стандартном файле шаблона.

<< Назад          Вперед >>