Пятница, 29.03.2024, 12:34
Ш  К  О  Л  А     П  И  Ф  А  Г  О  Р  А
      Предмет математики настолько серьезен, что нужно
не упускать случая, сделать его немного занимательным".
                                                                              Блез Паскаль
Главная | Регистрация | Вход Приветствую Вас Гость | RSS
ПАМЯТКИ ПО МАТЕМАТИКЕ   ВЕЛИКИЕ МАТЕМАТИКИ   ТЕОРИЯ ЧИСЕЛ   МАТЕМАТИЧЕСКАЯ ЛОГИКА
УРОКИ МАТЕМАТИКИ В ШКОЛЕ
МАТЕМАТИЧЕСКАЯ КЛАДОВАЯ
В МИРЕ ЗАДАЧ
ЕГЭ ПО МАТЕМАТИКЕ
МАТЕМАТИКА В НАЧАЛЬНОЙ ШКОЛЕ
ВАРИ, КОТЕЛОК!
УДИВИТЕЛЬНАЯ МАТЕМАТИКА
ВЫСШАЯ МАТЕМАТИКА
В МИРЕ ИНТЕРЕСНОГО
Категории раздела
КАРТОЧКИ ПО АЛГЕБРЕ [23]
КАРТОЧКИ ПО ГЕОМЕТРИИ [17]
МАТЕМАТИКА В НАЧАЛЬНОЙ ШКОЛЕ [84]
МАТЕМАТИКА В 4 КЛАССЕ [19]
МАТЕМАТИКА В 5 КЛАССЕ [114]
ВЕЛИКИЕ МАТЕМАТИКИ [79]
МАТЕМАТИЧЕСКАЯ ВСЕЛЕННАЯ [50]
МАТЕМАТИЧЕСКИЕ СКАЗКИ В КАРТИНКАХ [8]
КАРТОЧКИ ПО МАТЕМАТИКЕ [4]
ЗАНИМАТЕЛЬНАЯ МАТЕМАТИКА [188]
МАТЕМАТИЧЕСКИЕ ГОЛОВОЛОМКИ [265]
ДЕНЬГИ [23]
ЛИЧНОСТЬ В НАУКЕ [87]
БЕЙСИК ДЛЯ МЛАДШИХ ШКОЛЬНИКОВ [40]
ИНФОРМАТИКА В НАЧАЛЬНОЙ ШКОЛЕ [82]
ПАМЯТКИ ПО МАТЕМАТИКЕ [193]
ЗАБАВНЫЕ ЗАДАЧИ ЯКОВА ПЕРЕЛЬМАНА [20]
ВИКТОРИНЫ ПО ИНФОРМАТИКЕ [6]
БАЗЫ ДАННЫХ [74]
САМОУЧИТЕЛЬ "СЛЕПОЙ" ПЕЧАТИ НА КОМПЬЮТЕРЕ [20]
РАБОТАЕМ В Microsoft Office [18]
АППАРАТНЫЕ СРЕДСТВА ПЕРСОНАЛЬНОГО КОМПЬЮТЕРА [44]
ОСНОВЫ ИНФОРМАТИКИ ДЛЯ ШКОЛЬНИКОВ И СТУДЕНТОВ [77]
СОВЕТЫ ПО ОБУСТРОЙСТВУ КОМПЬЮТЕРА [72]
МАТЕМАТИКА В 6 КЛАССЕ [148]
МАТЕМАТИКА В 7 КЛАССЕ [85]
МАТЕМАТИКА В 8 КЛАССЕ [36]
МАТЕМАТИКА В 9 КЛАССЕ [153]
ЖИВОЙ УЧЕБНИК ГЕОМЕТРИИ [92]
УДИВИТЕЛЬНАЯ МАТЕМАТИКА [33]
ВЕЛИКАЯ ТЕОРЕМА ФЕРМА [45]
МАТЕМАТИКА В 11 КЛАССЕ [41]
КОНТРОЛЬНЫЕ РАБОТЫ [31]
ЗАНИМАТЕЛЬНЫЕ ЗАДАЧИ ПО ИНФОРМАТИКЕ ДЛЯ 5-6 КЛАССОВ [17]
ОБУЧАЮЩИЕ РАБОТЫ ПО ГЕОМЕТРИИ. 7 КЛАСС [19]
Главная » Статьи » САМОУЧИТЕЛЬ "СЛЕПОЙ" ПЕЧАТИ НА КОМПЬЮТЕРЕ

Применение пользовательсмких эталонов

В последней версии программы реализованы широкие функциональные возможности по распознаванию текстов разных уровней сложности. Далее мы узнаем, каким образом можно «научить» Fine Reader распознавать незнакомые символы или некачественные тексты.

Далеко не всегда процесс распознавания текстов проходит гладко. Особенно это касается документов, которые выполнены декоративным или другим нетрадиционным шрифтом, содержат специфические символы (например, в формулах) или просто плохого качества. В таких случаях Fine Reader сталкивается с затруднениями.

Однако в программе реализован механизм, который позволяет объяснить ей, как надо распознавать нестандартные или некачественные тексты. Для этого нужно создать и обучить специальный пользовательский эталон, в котором для каждого сомнительного или непонятного символа определяется его усредненное точечное изображение и название.

ВНИМАНИЕ
Пользовательский эталон создается на начальном этапе распознавания документа, и в дальнейшем используется для распознавания основного объема текста. Созданный эталон можно сохранить и впоследствии использовать для работы с другими документами. Кроме этого, в программе имеются также встроенные эталоны.
Далее перечислим несколько правил, которые следует учитывать при распознавании текстов с помощью пользовательских эталонов.
• Созданные эталоны впоследствии можно применять для распознавания только тех документов, в которых разрешение, шрифт и его размер совпадают с документом, на основании которого данный эталон был создан. При несоблюдении этого правила результат распознавания может быть непредсказуемым.
• Программа не различает некоторые символы и сопоставляет их с каким-то одним символом. Характерный пример – апострофы: правый (`) и левый (ґ) в программе не идентифицируются и ассоциируются с прямым апострофом ('). Поэтому в распознанном документе никогда не отобразится ни правый, ни левый апостроф: вместо них будет вставлен прямой, причем даже в том случае, когда в процессе обучения эталона были указаны именно они.
• Применять пользовательские эталоны для распознавания имеет смысл лишь тогда, когда документ содержит декоративные или нестандартные символы, либо когда нужно распознать большое количество текста плохого качества. В других случаях это может оказаться нецелесообразно.
• В некоторых случаях Fine Reader делает вывод о сопоставлении изображения тому или иному символу на основании общего анализа текста. В частности, так она может определить, какому символу сопоставить изображение «кружок» – нулю или букве «о», исходя из того, какие символы находятся поблизости (цифры или буквы).
Чтобы войти в режим работы с эталонами, выполните в главном меню команду Сервис→Редактор эталонов либо нажмите комбинацию клавиш Ctrl+Shift+A. В результате на экране откроется окно, изображенное на рис. 4.5.


Рис. 4.5. Редактор эталонов

В данном окне представлен перечень имеющихся в программе эталонов. С помощью кнопки Выбрать осуществляется выбор эталона для распознавания текущего документа, который соответствующим образом помечается в списке.

Чтобы добавить в программу новый эталон, нажмите кнопку Новый. В результате откроется окно, которое показано на рис. 4.6.



Рис. 4.6. Регистрация нового эталона

В данном окне нужно с клавиатуры ввести произвольное имя эталона и нажать кнопку ОК. После этого вновь созданный эталон отобразится в окне редактора (см. рис. 4.5).

С помощью кнопки Редактировать осуществляется переход в режим редактирования эталона. Отметим, что для новых эталонов это не имеет смысла: вначале нужно обучить эталон на основании какого-то документа, и лишь после этого его можно будет как-то изменять.

Если потребуется переименовать какой-то эталон, выделите его в списке щелчком мыши и нажмите кнопку Переименовать, после чего в открывшемся окне (см. рис. 4.6) введите требуемое имя и нажмите ОК.

Для удаления ненужных эталонов используйте кнопку Удалить, после чего подтвердите удаление.

Далее на конкретном примере рассмотрим порядок обучения и применения пользовательских эталонов.

Предположим, что нам нужно распознать сохраненный в формате gif документ, фрагмент которого показан на рис. 4.7.



Рис. 4.7. Фрагмент документа для распознавания

Вначале попробуем распознать его обычным способом – без применения пользовательских эталонов. Для этого выполним команду главного меню Файл→Открыть PDF/изображение (эта команда вызывается также нажатием комбинации клавиш Ctrl+O) и в открывшемся окне укажем путь к требуемому файлу, после чего нажмем кнопку Открыть. Через какое-то время (в зависимости от скорости работы компьютера) отобразится рабочий интерфейс программы. Результат распознавания будет представлен в окне Текст (рис. 4.8).



Рис. 4.8. Результат распознавания документа

Как видно на рисунке, текст документа распознан некорректно: вместо цифры 1 отображается буква г, есть ошибка в слове Фамилия. Кроме этого – программа неуверенно распознала слова имя и отчество (об этом свидетельствует их цветовое выделение).

Чтобы решить проблему, используем механизм распознавания с обучением. Для этого вначале войдем в режим настройки программы, выполнив в главном меню команду Сервис→Опции (эта команда вызывается также нажатием Ctrl+Shift+O). В открывшемся окне перейдем на вкладку Распознать и установим переключатель Обучение в положение Использовать встроенные и пользовательские эталоны. В результате станет доступным флажок Распознавание с обучением, который нужно установить (рис. 4.9).



Рис. 4.9. Включение режима распознавания с обучением

Теперь нужно выбрать эталон для обучения и последующего использования. Для этого нажмем кнопку Редактор эталонов – в результате на экране откроется уже знакомое нам окно Редактор эталонов (см. рис. 4.5). Чтобы выбрать в нем имеющийся эталон, нужно выделить его щелчком мыши, нажать кнопку Выбрать, а затем – кнопку ОК (причем дважды – в окне редактора эталонов и в режиме настройки).

Как мы уже отмечали выше, применять уже имеющиеся эталоны для распознавания новых документов можно лишь при соблюдении определенных условий. В противном случае придется создать для обучения новый эталон. В этом случае он автоматически выбирается для работы с документом.

Теперь возвращаемся в рабочий интерфейс, последовательно закрыв редактор эталонов и окно настройки программы, и запускаем процесс распознавания. В самом начале распознавания на экране откроется окно, информирующее о ходе процесса. Но как только программе попадется незнакомый символ – сразу отобразится окно, которое показано на рис. 4.10.



Рис. 4.10. Режим ручного обучения

В данном окне осуществляется ручное обучение эталона. Смысл данной операции заключается в том, чтобы четко указать программе, каким образом здесь и далее следует распознавать незнакомые ей символы.

На рисунке видно, что первым таким символом в нашем документе является цифра 1, которую программа так и не смогла распознать в обычном режиме (см. рис. 4.8). В верхней части окна он выделен рамкой (см. рис. 4.10).

ПРИМЕЧАНИЕ
Иногда бывает так, что рамка выделяет не один, а сразу два незнакомых символа, т. е. программа воспринимает их как один, хотя распознать их необходимо по отдельности. Случается и обратное – когда рамка делит символ пополам там, где это не нужно. В подобных ситуациях нужно подкорректировать размеры рамки с помощью расположенных справа кнопок со стрелками.
В поле Введите символ, выделенный рамкой нужно указать символ, которым должно распознаваться незнакомое программе изображение. Попросту говоря, вместо неизвестного символа Fine Reader при распознавании вставит тот, который будет указан в данном поле. Чтобы выбрать требуемый символ, нажмем расположенную справа кнопку выбора – в результате на экране откроется окно, изображенное на рис. 4.11.


Рис. 4.11. Выбор символа для распознавания

В данном окне содержится библиотека символов, которые можно использовать в процессе распознавания документов. В нашем случае следует выбрать цифру 1; для этого выделим ее щелчком мыши и нажмем кнопку Вставить. В результате она отобразится в поле Введите символ, выделенный рамкой (см. рис. 4.10), и чтобы зафиксировать в эталоне замену, нажмем кнопку Обучить.

СОВЕТ
При обучении шаблона вы можете назначать символам дополнительные эффекты: включать полужирное или курсивное начертание, а также применять верхний или нижний индекс. Для этого достаточно установить соответствующие флажки, расположенные внизу окна в области Эффекты (см. рис. 4.10).
Сразу после этого рамка в верхней части окна Ручное обучение эталона автоматически переместится на следующий непонятный программе символ. В нашем случае это – буква Ф, являющаяся первой в слове Фамилия (рис. 4.12).


Рис. 4.12. Следующий этап ручного обучения

Как видно на рисунке, в данном случае программа идентифицирует прописную букву Ф со строчной буквой о, что является ошибкой. Чтобы исправить ее, нажимаем рядом с полем Введите символ, выделенный рамкой кнопку выбора, затем в открывшемся окне (см. рис. 4.11) щелчком мыши выбираем прописную букву Ф и нажимаем кнопку Вставить, а в режиме обучения – кнопку Обучить.

Аналогичным образом обучим Fine Reader распознавать все остальные незнакомые символы в данном документе. Если какой-то символ, в правильности которого Fine Reader сомневается, распознан все же верно – при обучении его можно проигнорировать, нажав кнопку Пропустить (см. рис. 4.12). Для возврата к предыдущему символу используйте кнопку Вернуться.

ВНИМАНИЕ
При нажатии кнопки Вернуться рамка переместится на предыдущую позицию, при этом последняя настроенная аналогия (т. е. пара «изображение – символ») будет автоматически удалена из данного шаблона. Помните, что данная кнопка функционирует лишь в пределах одного слова.
После того как обучение эталона завершено, нажмите кнопку Закрыть. При этом программа выдаст запрос относительно сохранения выполненных в эталоне изменений. Чтобы впоследствии применять данный пользовательский эталон с учетом последних изменений, нажмите кнопку Да. При нажатии Нет они будут утрачены, но и в первом, и во втором случае начнется процесс распознавания документа с применением эталона. Чтобы отказаться от немедленного распознавания и возврата в режим обучения нажмите кнопку Отмена.
Если все сделано правильно, то в результате распознавания текста с применением пользовательского эталона наш фрагмент документа будет выглядеть так, как показано на рис. 4.13.


Рис. 4.13. Результат корректного распознавания текста

После распознавания документа тексту можно придать более эргономичный вид, используя для этого инструменты форматирования и оформления, знакомые каждому пользователю редактора Word. Они находятся в инструментальной панели рабочего интерфейса программы (см. рис. 4.3).

Чтобы впоследствии применить обученный пользовательский эталон для распознавания другого документа, нужно выполнить соответствующие настройки (см. рис. 4.9) и выбрать его в редакторе эталонов (см. рис. 4.5).

Любой созданный пользователем эталон впоследствии можно отредактировать. Для этого в редакторе эталонов (см. рис. 4.5) нужно выделить его щелчком мыши и нажать кнопку Редактировать. В результате на экране откроется окно, изображенное на рис. 4.14.



Рис. 4.14. Редактирование эталона, режим «Изображения»

Данное окно имеет два представления: «Изображение» (см. рис. 4.14) и «Вид со свойствами» (см. рис. 4.15). Переключение между ними осуществляется с помощью соответствующих кнопок, расположенных внизу окна.



Рис. 4.15. Редактирование эталона, режим «Вид со свойствами»

И в первом, и во втором случае в окне представлен перечень аналогий, назначенных данному эталону в процессе обучения. В режиме «Изображения» эти аналогии можно только просматривать или удалить, а в режиме «Вид со свойствами» можно также редактировать их свойства путем установки или снятия соответствующих флажков. Отметим, что просматривать и редактировать свойства выбранных позиций можно также в окне (рис. 4.16), открываемом нажатием кнопки Свойства.



Рис. 4.16. Окно Свойства

В данном режиме можно выполнять те же действия, что и при обучении эталона: выбирать символ для замены непонятного или нестандартного изображения, а также применять к нему эффекты. Выполненные изменения вступают в силу после нажатия кнопки ОК.

Чтобы удалить ненужный элемент из эталона, выделите его щелчком мыши (это можно делать как в режиме «Изображения», так и «Вид со свойствами»), и нажмите кнопку Удалить. При этом программа выдаст дополнительный запрос на подтверждение данной операции.

ПРИМЕЧАНИЕ
Обратите внимание – добавлять новые символы в пользовательский эталон в режиме редактирования невозможно. Здесь вы можете лишь просматривать его содержимое и редактировать свойства имеющихся символов. Добавление же новых символов возможно только в процессе обучения эталона.
Каждый пользовательский эталон может включать в себя до 1000 символов. При этом вы можете обучать эталон как символам, так и лигатурам (лигатура – сочетание двух или даже трех символов, которые неделимы из-за особенностей начертания и потому назначаются в виде комбинаций; работа с ними ведется так же, как и с отдельными символами). Но слишком увлекаться лигатурами не рекомендуется – может пострадать качество распознавания.
Таким образом, с помощью пользовательских эталонов мы сможем распознать практически любой нестандартный или плохо читаемый документ. Однако этим дополнительные возможности программы по распознаванию сложных документов не исчерпываются – в частности, вы можете задействовать механизмы словарей и стилей, а также редактор языков. Доступ к этим возможностям осуществляется с помощью команд главного меню Сервис→Просмотр словарей, Сервис→Редактор стилей и Сервис→Редактор языков.
Программа Type Pilot
В данном разделе мы познакомимся с программой, использование которой позволяет существенно ускорить набор текстов – Type Pilot. Она распространяется условно-бесплатно, ее демонстрационную версию можно скачать по адресу http://www.colorpilot.ru/typepilot.html.
Смысл работы данной программы заключается в том, что она позволяет вставлять в документ слова или текстовые фрагменты на основании лишь нескольких первых введенных символов (это напоминает механизм автотекста, хорошо знакомый пользователям редактора Word). Например, можно сделать так, что фраза Добрый день, рады приветствовать Вас будет набрана уже после ввода символов Добр.
Системные требования, предъявляемые программой Type Pilot к аппаратным ресурсам компьютера, достаточно скромны – РС-совместимый компьютер с процессором не ниже 486, операционная система Windows любой версии, начиная с Windows 95, и 200 Кб свободного дискового пространства. Программа работает с любым известным текстовым редактором.
Возможности программы позволяют разместить в ее базе свыше 100000 шаблонных текстовых фрагментов, слов, электронных адресов, наборов символов и т. д., каждый из которых легко вставляется в нужное место документа. Для удобства работы все шаблонные фразы (текстовые фрагменты) можно разложить по тематическим папкам, которые пользователь может создавать самостоятельно.
После установки программы ее значок располагается в правой части панели задач. По умолчанию программа помещается в автозагрузку; для удаления программы из автозагрузки нужно щелкнуть правой кнопкой мыши на значке программы и в открывшемся меню отключить пункт В автозагрузку.
Интерфейс программы представлен на рис. 4.17.


Рис. 4.17. Программа Type Pilot

В левой части данного окна содержится перечень тематических папок, содержащих фразы, в правой – перечень фраз той папки, на которой установлен курсор в левой части окна. Для добавления новой папки нужно выполнить команду главного меню Папка→Новая папка либо нажать комбинацию клавиш Ctrl+Ins. В результате новая папка будет добавлена в перечень папок; имя папки следует ввести с клавиатуры. При необходимости папку можно переименовать с помощью команды главного меню Папка→Переименовать. Для удаления папки из списка нужно установить на нее курсор и выполнить команду Папка→Удалить (также для этого можно воспользоваться клавишей Delete).

Чтобы добавить в базу данных программы новую фразу, текстовый фрагмент и т. п., нужно в левой части окна установить курсор на папку, в которую будет добавлена фраза, и выполнить команду главного меню Фраза→Добавить либо нажать клавишу Insert – в результате на экране откроется окно, изображенное на рис. 4.18.



Рис. 4.18. Добавление текстового фрагмента в базу данных программы

В данном окне в поле Ключ. слово нужно с клавиатуры ввести несколько символов, после набора которых шаблонная фраза должна быть автоматически вставлена в текущий документ. Текст шаблонной фразы вводится с клавиатуры в большом текстовом поле, занимающем основную часть интерфейса. Если рассматривать пример, представленный на рис. 4.18, то в данном случае сразу после ввода набора символов Отч в документ будет вставлен следующтй текст: Доводим до вашего сведения, что все отчеты о работе отдела следует представлять до 1 числа каждого месяца. Подобные шаблоны удобно использовать при необходимости периодически набирать одинаковые (или похожие) тексты, а также в целом ряде иных случаев.

С помощью команд подменю Параметры→Ключевое слово определяется, как и когда должна быть вставлена шаблонная фраза (текстовый фрагмент). Если выбраны пункты Учитывать регистр и Учитывать раскладку, то программа будет автоматически принимать во внимание текущий регистр символов (прописные или строчные) и раскладку клавиатуры. Если включен режим Ждать символ-разделитель, то для того, чтобы шаблонная фраза была вставлена в документ, необходимо после набора ключевого слова нажать любой символ-разделитель (пробел, точка, запятая, точка с запятой, восклицательный или вопросительный знак).

Созданные шаблонные фразы и текстовые фрагменты впоследствии можно отредактировать. Для этого нужно в главном окне программы установить курсор в соответствующую позицию и нажать клавишу Enter либо выполнить команду главного меню Фраза→Редактировать – в результате на экране откроется окно, изображенное на рис. 4.18, в котором выполняются необходимые действия.

Для удаления ненужной шаблонной фразы следует выделить ее курсором и воспользоваться командой Фраза→Удалить либо нажать клавишу Delete.

Любую шаблонную фразу (текстовый фрагмент) можно скопировать в буфер обмена – для этого нужно в главном окне программы установить на нее курсор и выполнить команду главного меню Фраза→Копировать либо нажать комбинацию клавиш Ctrl+C.

В заключение хотелось бы отметить, порядок работы с программой Type Pilot прост и интуитивно понятен, поэтому ее с успехом применяют даже начинающие пользователи.


Категория: САМОУЧИТЕЛЬ "СЛЕПОЙ" ПЕЧАТИ НА КОМПЬЮТЕРЕ | Добавил: admin (31.12.2013)
Просмотров: 854 | Теги: самоучитель слепой печати на компью, метод набора текста, изучаем информатику, компьютер для чайников, все о компьютере, освоение рядов клавиатуры | Рейтинг: 5.0/2
УЧИТЕЛЮ ИНФОРМАТИКИ
КОНСПЕКТЫ УРОКОВ
ВНЕКЛАССНЫЕ МЕРОПРИЯТИЯ ПО ИНФОРМАТИКЕ
ПОСОБИЯ И МЕТОДИЧКИ ДЛЯ УЧИТЕЛЯ ИНФОРМАТИКИ
ИЗ ОПЫТА РАБОТЫ УЧИТЕЛЯ ИНФОРМАТИКИ
ЗАДАНИЯ ШКОЛЬНОЙ ОЛИМПИАДЫ ПО ИНФОРМАТИКЕ
ИНФОРМАТИКА В ШКОЛЕ
ИНФОРМАТИКА В НАЧАЛЬНЫХ КЛАССАХ
ИНФОРМАТИКА В 3 КЛАССЕ
ИНФОРМАТИКА В 4 КЛАССЕ
КОНТРОЛЬНЫЕ РАБОТЫ ПО ИНФОРМАТИКЕ. 3 КЛАСС
КОНТРОЛЬНЫЕ РАБОТЫ ПО ИНФОРМАТИКЕ. 4 КЛАСС
ПРОГРАММИРОВАНИЕ ДЛЯ ДЕТЕЙ
СКАЗКА "ПРИКЛЮЧЕНИЯ ЭЛЕКТРОШИ"

ИГРОВЫЕ ТЕХНОЛОГИИ НА УРОКАХ ИНФОРМАТИКИ
ИГРОВЫЕ ЗАДАНИЯ ПО ИНФОРМАТИКЕ
ВИКТОРИНЫ ПО ИНФОРМАТИКЕ
КОМПЬЮТЕРНЫЕ ЧАСТУШКИ
ОБРАТНАЯ СВЯЗЬ
Поиск


Друзья сайта
  • Создать сайт
  • Все для веб-мастера
  • Программы для всех
  • Мир развлечений
  • Лучшие сайты Рунета
  • Кулинарные рецепты
  • Статистика

    Онлайн всего: 3
    Гостей: 3
    Пользователей: 0
    Форма входа


    Copyright MyCorp © 2024
    Яндекс.Метрика Top.Mail.Ru