FineReader – распознавание текста - РАБОТАЕМ В Microsoft Office - Каталог статей

	Пятница, 23.01.2026, 17:03
	*Ш К О Л А П И Ф А Г О Р А*
	Предмет математики настолько серьезен, что нужно не упускать случая, сделать его немного занимательным". Блез Паскаль
Главная \| Регистрация \| Вход	Приветствую Вас Гость \| RSS

ПАМЯТКИ ПО МАТЕМАТИКЕ ВЕЛИКИЕ МАТЕМАТИКИ ТЕОРИЯ ЧИСЕЛ МАТЕМАТИЧЕСКАЯ ЛОГИКА

УРОКИ МАТЕМАТИКИ В ШКОЛЕ

МАТЕМАТИЧЕСКАЯ КЛАДОВАЯ

УЧЕБНЫЕ ПРОГРАММЫ ДЛЯ УЧИТЕЛЯ МАТЕМАТИКИ
ПОСОБИЯ И МЕТОДИЧКИ ДЛЯ УЧИТЕЛЯ МАТЕМАТИКИ
МАТЕМАТИЧЕСКОЕ ПРОСВЕЩЕНИЕ
ДИДАКТИЧЕСКИЕ ИГРЫ НА УРОКЕ МАТЕМАТИКИ
МАТЕМАТИЧЕСКИЕ ДИКТАНТЫ/АЛГЕБРА
- 5 КЛАСС
- 6 КЛАСС
- 7 КЛАСС
- 8 КЛАСС
- 9 КЛАСС
МАТЕМАТИЧЕСКИЕ ДИКТАНТЫ/ГЕОМЕТРИЯ
- 7 КЛАСС
- 8 КЛАСС
- 9 КЛАСС
МЕТОДИЧЕСКИЕ НАРАБОТКИ
- ИЗ ОПЫТА РАБОТЫ УЧИТЕЛЯ МАТЕМАТИКИ
- ПРЕПОДАЕМ АЛГЕБРУ И НАЧАЛА МАТЕМАТИЧЕСКОГО АНАЛИЗА
  - 10 КЛАСС
  - 11 КЛАСС
УРАВНЕНИЯ И НЕРАВЕНСТВА С ПАРАМЕТРОМ
МАТЕМАТИКА В 5 КЛАССЕ
- УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКТ К УРОКАМ
- ЗАНИМАТЕЛЬНЫЕ ЗАДАЧИ ДЛЯ ПЯТИКЛАССНИКОВ
- БЛИЦ-ОПРОС
- ТЕСТЫ ПО МАТЕМАТИКЕ. 5 КЛАСС
- САМОСТОЯТЕЛЬНЫЕ РАБОТЫ В 5-6 КЛАССАХ
- КОНТРОЛЬНО-ИЗМЕРИТЕЛЬНЫЕ МАТЕРИАЛЫ
- КОНТРОЛЬНЫЕ РАБОТЫ. 5 КЛАСС
МАТЕМАТИКА В 6 КЛАССЕ
- УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКТ К УРОКАМ
- РАЗВИВАЮЩИЕ ЗАДАЧИ
- НЕСТАНДАРТНЫЕ ЗАДАЧКИ ДЛЯ ШЕСТИКЛАССНИКОВ
- ДИДАКТИЧЕСКИЙ МАТЕРИАЛ К УРОКАМ
- ТЕСТЫ ПО МАТЕМАТИКЕ
- ТЕМАТИЧЕСКИЕ ЗАЧЕТЫ
- САМОСТОЯТЕЛЬНЫЕ РАБОТЫ
- КОНТРОЛЬНЫЕ РАБОТЫ
МАТЕМАТИКА В 7 КЛАССЕ
- УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКТ К УРОКАМ
- ДИДАКТИЧЕСКИЙ МАТЕРИАЛ
- САМОСТОЯТЕЛЬНЫЕ РАБОТЫ
- КОНТРОЛЬНЫЕ РАБОТЫ
- ЗАДАНИЯ ДЛЯ ОЛИМПИАДЫ
- ТЕСТОВЫЕ ЗАДАНИЯ
- ОБУЧАЮЩИЕ РАБОТЫ ПО ГЕОМЕТРИИ
- САМОСТОЯТЕЛЬНЫЕ РАБОТЫ ПО ГЕОМЕТРИИ
- КОНТРОЛЬНЫЕ РАБОТЫ ПО ГЕОМЕТРИИ
- ОЛИМПИАДНЫЕ ЗАДАНИЯ И ЗАДАНИЯ ПОВЫШЕННОЙ ТРУДНОСТИ
МАТЕМАТИКА В 8 КЛАССЕ
- КАРТОЧКИ-КОНСУЛЬТАНТЫ
- ТЕСТОВЫЕ ДИАГНОСТИЧЕСКИЕ РАБОТЫ
- ТЕСТЫ ПО АЛГЕБРЕ
- ПРОВЕРОЧНЫЕ РАБОТЫ
- САМОСТОЯТЕЛЬНЫЕ РАБОТЫ
- КОНТРОЛЬНЫЕ РАБОТЫ ПО АЛГЕБРЕ
- ГЕОМЕТРИЯ. 8 КЛАСС
МАТЕМАТИКА В 9 КЛАССЕ
- УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКТ К УРОКАМ
- РАЗВИВАЮЩИЕ ЗАДАНИЯ
- КОНТРОЛЬНЫЕ РАБОТЫ ПО АЛГЕБРЕ
- ПЛАНИМЕТРИЯ В ТЕЗИСАХ И РЕШЕНИЯХ
- ТЕСТОВЫЕ МАТЕРИАЛЫ ПО ГЕОМЕТРИИ
- ЗАДАЧИ ПО АЛГЕБРЕ
- ТЕСТОВЫЕ ЗАДАНИЯ
- ПОДГОТОВКА К ГИА
  - ПОДГОТОВКА К ГИА ПО АЛГЕБРЕ
  - ПРАКТИКУМ ПО ПОДГОТОВКЕ К ГИА. 9 КЛАСС
МАТЕМАТИКА В 10 КЛАССЕ
- МАТЕМАТИЧЕСКИЕ ДИКТАНТЫ ПО ГЕОМЕТРИИ В 10 КЛАССЕ
- ЗАДАНИЯ К ТЕМАТИЧЕСКИМ ЗАЧЕТАМ
- КОНТРОЛЬНЫЕ РАБОТЫ ПО АЛГЕБРЕ
- САМОСТОЯТЕЛЬНЫЕ РАБОТЫ ПО АЛГЕБРЕ
- САМОСТОЯТЕЛЬНЫЕ РАБОТЫ ПО ГЕОМЕТРИИ
- КОНТРОЛЬНЫЕ РАБОТЫ ПО ГЕОМЕТРИИ
МАТЕМАТИКА В 11 КЛАССЕ
- АЛГЕБРА И НАЧАЛА АНАЛИЗА В 11 КЛАССЕ
- КАРТОЧКИ С ПРОВЕРОЧНЫМИ РАБОТАМИ ПО ГЕОМЕТРИИ
- ОЛИМПИАДНЫЕ ЗАДАНИЯ
- КОНТРОЛЬНЫЕ РАБОТЫ ПО АЛГЕБРЕ
КОНТРОЛЬНЫЕ РАБОТЫ
- АЛГЕБРА 10-11 КЛАССЫ
- ГЕОМЕТРИЯ 9-10 КЛАССЫ
АЛГЕБРА. УГЛУБЛЕННЫЙ КУРС С РЕШЕНИЯМИ И УКАЗАНИЯМИ
ОЛИМПИАДЫ ПО МАТЕМАТИКЕ
- МАТЕМАТИЧЕСКИЕ ОЛИМПИАДЫ В 5-6 КЛАССАХ
- ОЛИМПИАДЫ В 6 КЛАССЕ
- ОЛИМПИАДНЫЕ ЗАДАЧИ ПО МАТЕМАТИКЕ ДЛЯ 9-11 КЛАССОВ
- ШКОЛЬНЫЕ ОЛИМПИАДЫ ПО МАТЕМАТИКЕ
- ВСЕРОССИЙСКИЕ ОЛИМПИАДЫ ШКОЛЬНИКОВ ПО МАТЕМАТИКЕ ПРОШЛЫХ ЛЕТ
СТИХИ К УРОКАМ МАТЕМАТИКИ
МАТЕМАТИЧЕСКИЕ СКАЗКИ В КАРТИНКАХ
КАРТОЧКИ ПО АЛГЕБРЕ
- 3 КЛАСС
- 7 КЛАСС
- ДОВОДЯЩИЕ КАРТОЧКИ
КАРТОЧКИ ПО ГЕОМЕТРИИ
- НАГЛЯДНАЯ ГЕОМЕТРИЯ
- РАЗНЫЕ ЗАДАЧИ
ВЫСКАЗЫВАНИЯ О МАТЕМАТИКЕ

В МИРЕ ЗАДАЧ

ЕГЭ ПО МАТЕМАТИКЕ

МАТЕМАТИКА В НАЧАЛЬНОЙ ШКОЛЕ

ВАРИ, КОТЕЛОК!

УДИВИТЕЛЬНАЯ МАТЕМАТИКА

ВЫСШАЯ МАТЕМАТИКА

В МИРЕ ИНТЕРЕСНОГО

Категории раздела

КАРТОЧКИ ПО АЛГЕБРЕ [23]

КАРТОЧКИ ПО ГЕОМЕТРИИ [17]

МАТЕМАТИКА В НАЧАЛЬНОЙ ШКОЛЕ [84]

МАТЕМАТИКА В 4 КЛАССЕ [19]

МАТЕМАТИКА В 5 КЛАССЕ [114]

ВЕЛИКИЕ МАТЕМАТИКИ [79]

МАТЕМАТИЧЕСКАЯ ВСЕЛЕННАЯ [50]

МАТЕМАТИЧЕСКИЕ СКАЗКИ В КАРТИНКАХ [8]

КАРТОЧКИ ПО МАТЕМАТИКЕ [4]

ЗАНИМАТЕЛЬНАЯ МАТЕМАТИКА [188]

МАТЕМАТИЧЕСКИЕ ГОЛОВОЛОМКИ [265]

ДЕНЬГИ [23]

ЛИЧНОСТЬ В НАУКЕ [87]

БЕЙСИК ДЛЯ МЛАДШИХ ШКОЛЬНИКОВ [40]

ИНФОРМАТИКА В НАЧАЛЬНОЙ ШКОЛЕ [82]

ПАМЯТКИ ПО МАТЕМАТИКЕ [193]

ЗАБАВНЫЕ ЗАДАЧИ ЯКОВА ПЕРЕЛЬМАНА [20]

ВИКТОРИНЫ ПО ИНФОРМАТИКЕ [6]

БАЗЫ ДАННЫХ [74]

САМОУЧИТЕЛЬ "СЛЕПОЙ" ПЕЧАТИ НА КОМПЬЮТЕРЕ [20]

РАБОТАЕМ В Microsoft Office [18]

АППАРАТНЫЕ СРЕДСТВА ПЕРСОНАЛЬНОГО КОМПЬЮТЕРА [44]

ОСНОВЫ ИНФОРМАТИКИ ДЛЯ ШКОЛЬНИКОВ И СТУДЕНТОВ [77]

СОВЕТЫ ПО ОБУСТРОЙСТВУ КОМПЬЮТЕРА [72]

МАТЕМАТИКА В 6 КЛАССЕ [148]

МАТЕМАТИКА В 7 КЛАССЕ [85]

МАТЕМАТИКА В 8 КЛАССЕ [36]

МАТЕМАТИКА В 9 КЛАССЕ [153]

ЖИВОЙ УЧЕБНИК ГЕОМЕТРИИ [92]

УДИВИТЕЛЬНАЯ МАТЕМАТИКА [33]

ВЕЛИКАЯ ТЕОРЕМА ФЕРМА [45]

МАТЕМАТИКА В 11 КЛАССЕ [41]

КОНТРОЛЬНЫЕ РАБОТЫ [31]

ЗАНИМАТЕЛЬНЫЕ ЗАДАЧИ ПО ИНФОРМАТИКЕ ДЛЯ 5-6 КЛАССОВ [17]

ОБУЧАЮЩИЕ РАБОТЫ ПО ГЕОМЕТРИИ. 7 КЛАСС [19]

Главная » Статьи » РАБОТАЕМ В Microsoft Office

FineReader – распознавание текста

Ввести со сканера текст в компьютер – задача не слишком трудная. Однако работать с таким текстом невозможно: как и любое сканированное изображение, страница с текстом представляет собой графический файл – обычную картинку. Отсюда возникают проблемы: во-первых, в графическом формате страница занимает слишком много места, и, скажем, отсканированная книга не на каждый жесткий диск поместится. И вторая, самая главная проблема: сканированный текст можно будет только читать, но не редактировать и не вставлять его фрагменты в создаваемый вами документ. Ведь сам сканер распознавать буквы именно как буквы не умеет: они для него – всего лишь пятна и точки черного цвета.

К счастью, на свете существуют программы, способные перевести сканированный текст из графического в текстовый формат – программы распознавания текста или OCR.

Современная OCR должна уметь многое: распознавать тексты, набранные не только определенными шрифтами (именно так работали распознавалки первого поколения), но и самыми экзотическими, вплоть до рукописных. Уметь корректно работать с текстами, содержащими слова на нескольких языках, корректно распознавать таблицы. И самое главное – корректно распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Само собой, распознать текст – это еще полдела. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата – скажем, формата Microsoft Word или Excel.

Как видим, для того чтобы получить электронную, готовую к редактированию копию любого печатного текста, программе OCR необходимо выполнить «цепочку» из множества отдельных операций:

Сканирование. За эту работу отвечает, собственно, не программа OCR, а встроенное в систему программное обеспечение вашего сканера. Именно с его помощью вы можете задать нужные вам параметры сканирования – например, разрешение (рекомендуется 300 dpi), цветовой режим (для простых текстов достаточно черно-белого или LineArt) – и выделить ту область документа, которую вам необходимо «скопировать» в компьютер.

Сегментация. Полученную со сканера «картинку» подхватывает OCR-программа. Но до распознавания еще далеко – сначала надо отделить текстовые элементы от графики, да и текст в ряде случаев разбить на отдельные куски (например, при многоколоночной верстке).

Распознавание. На этом этапе текст переводится из графической формы в обычную текстовую.

Проверка орфографии и правка. Встроенная система проверки орфографии «проходится» по тексту, проверяя и корректируя последствия работы системы распознавания. Спорные слова и символы выделяются особым предупреждающим цветом. Потом наступает очередь пользователя, который также может внести свою лепту в этот ответственный процесс.

Сохранение. Для дальнейшей обработки документ должен быть передан «на поруки» соответствующей программе – как правило, одному из продуктов семейства Microsoft Office. Или сохранен в формате, соответствующем его содержанию: текст – в DOC или RTF, таблица – в XLS... Да и встроенную графику желательно в документе оставить...

Все эти операции в большинстве программ OCR могут выполняться как в автоматическом, с помощью программы-мастера, так и в ручном режиме, по отдельности. С двумя первыми и последней операциями с легкостью справится любая программа распознавания. А вот весь процесс целиком по зубам, увы, только нескольким продуктам, разработанным в нашей стране. Тут надо сделать небольшую поправку: на самом деле корректно работать с русским языком умеют практически все современные «распознавалки», вне зависимости от того, где они были разработаны. Более того, в состав Microsoft Office-2003 уже включена абсолютно бесплатная программа распознавания Microsoft Office Document Scanning! Однако для российских пользователей само понятие «программа распознавания текста» чаще всего неразрывно связано с программой FineReader. Ибо компания ABBYY смогла не просто создать удобный для пользователя и качественный продукт, но и, самое главное, удачно «раскрутить» его.

Одним из козырей FineReader является поддержка неимоверного количества языков распознавания – 176, в числе которых вы найдете экзотические и древние языки, и даже популярные языки программирования (Basic, С/C++, COBOL, Fortran, Java, Pascal)! Так что FineReader сможет без запинки справиться с древнегреческим свитком или с бледными распечатками исходных текстов программ, сделанных вашими предками лет 30 назад. Как ни странно, большинство пользователей на деле интересуется совсем другим. Офисных работников интересует распознавание типовых форм документов, студентов – возможность быстро «передрать» для реферата многостраничный текст из учебника, сканируя и распознавая книжный разворот целиком, бухгалтеров – возможность автоматического распознавания таблиц и документов на бланках... Все это и многое другое FineReader умеет... или не все, а только частично, в зависимости от модификации продукта. Далеко не все возможности из нашего перечня включены в самую простую модификацию программы, которую вы можете получить бесплатно вместе со сканером. Пакетное сканирование, грамотная обработка таблиц и изображений – для всего этого стоит приобрести профессиональную версию программы – FineReader Pro. Заодно она умеет безукоризненно читать штрихкоды, позволяет добавлять в базу данных новые языки. А самая мощная (и дорогостоящая) версия – FineReader Office – без труда справится и с распознаванием любых бланков и форм! Все версии FineReader, от самой простой до самой мощной, объединяет, на мой взгляд, главное достоинство программы – интерфейс. Для запуска процесса распознавания вам достаточно просто положить документ в сканер и нажать единственную кнопку (мастер Scan & Read) на панели инструментов программы. Все дальнейшие операции – сканирование, разбивку изображения на «блоки» и, наконец, собственно распознавание программа выполнит автоматически. Пользователю останется только установить нужные параметры сканирования – рекомендуется разрешение в 300 dpi и режим черно-белого изображения или LineArt. Впрочем, текст можно отсканировать и в цветном режиме: в этом случае FineReader сможет грамотно распознать цветовое выделение шрифтов и сохранить его в готовом документе.

После завершения распознавания страницы FineReader предложит пользователю выбор: сканировать и распознавать дальше (для многостраничного документа) или сохранить полученный текст в одном из множества популярных форматов – от документов Microsoft Office до HTML или PDF. Можно, впрочем, сразу же перебросить документ в Word или Excel и уже там исправить все огрехи распознавания (без них обойтись просто невозможно). При этом FineReader полностью сохраняет все особенности форматирования документов и графическое оформление.