Библиотека knigago >> Компьютеры и Интернет >> Программы >> Программа обработки текста после сканирования AfterScan


СЛУЧАЙНЫЙ КОММЕНТАРИЙ

# 1221, книга: Полумесяц разящий
автор: Клайв Касслер

В своей захватывающей книге «Полумесяц разящий» признанный мастер приключенческого жанра Клайв Касслер погружает читателей в мир шпионажа, интриг и древних секретов. Главный герой, агент ФБР Сэм Риззо, оказывается втянут в смертельно опасный заговор, угрожающий безопасности нации. Когда артефакт из древнего храма в Турции попадает в руки террористов, Риззо отправляется на задание, чтобы вернуть его и разоблачить тех, кто стоит за похищением. Автор умело сочетает захватывающий сюжет с...

СЛУЧАЙНАЯ КНИГА

Я смогла все рассказать. Кэсси Харти
- Я смогла все рассказать

Жанр: Документальная литература

Год издания: 2011

Серия: Реальные истории

Cadet Bigler - Программа обработки текста после сканирования AfterScan

Программа обработки текста после сканирования AfterScan
Книга - Программа обработки текста после сканирования AfterScan.  Cadet Bigler  - прочитать полностью в библиотеке КнигаГо
Название:
Программа обработки текста после сканирования AfterScan
Cadet Bigler

Жанр:

Программы

Изадано в серии:

неизвестно

Издательство:

неизвестно

Год издания:

-

ISBN:

неизвестно

Отзывы:

Комментировать

Рейтинг:

Поделись книгой с друзьями!

Помощь сайту: донат на оплату сервера

Краткое содержание книги "Программа обработки текста после сканирования AfterScan"

Описывается работа с программой AfterScan, которая умеет исправлять ошибки автоматически.
Т.к. в документе имеется таблица, рекомендуется использовать fb2-читалку Cool Reader 3

Читаем онлайн "Программа обработки текста после сканирования AfterScan". [Страница - 3]

стр.
вам вряд ли встретятся, поэтому мы не будем тратить время на их рассмотрение.

HTML документы

Текст анализируется и исправляется в соответствии с правилами экранной типографики для HTML-документов. Текст также проверяется на наличие ошибок ручного ввода.

Для того, чтобы начать работать с текстом, откройте его в окне программы с помощью команды меню Файл → Открыть, горячих клавиш <Ctrl> + <O> или щелкнув по кнопке Открыть файл. Все как в Word.

Программа поддерживает все основные типы текстовых файлов за исключением формата docx Word 2007.

Предположим, что файл, который нам необходимо обработать, имеет расширение doc.

Для примера возьмем страницу из компьютерного журнала со сложным форматированием (рис. 1). Теперь с помощью программы FineReader выполним ее распознавание, причем, чтобы усложнить задачу, выберем заниженное для распознавание текста разрешение - 200 dpi - и не будем пользоваться средствами исправления ошибок FineReader. Передадим распознанный текст в Word, сохраним его на жестком диске и откроем с помощью программы AfterScan. Сравнивая рисунки 1 и 2 замечаем, что программа уже проделала немалую работу: убрала со страницы иллюстрации, переформатировала текст в одну колонку и изменила стиль заголовка. Для простоты удалим текст врезок, хотя, если его нужно сохранить, все врезки из основного текста переносятся в коне статьи. Теперь можно выполнить OCR-чистку. Нажимаем клавишу <F8>.


Книгаго: Программа обработки текста после сканирования AfterScan. Иллюстрация № 1

Рис. 1 Страница из журнала

Книгаго: Программа обработки текста после сканирования AfterScan. Иллюстрация № 2
Рис. 2 Текст в окне программы AfterScan

Книгаго: Программа обработки текста после сканирования AfterScan. Иллюстрация № 3
Рис. 3. Исправление ошибок OCR

Откроется окно, показанное на рис. 3. здесь нам предлагается выбрать режим чистки (интерактивный или автоматический) и тип текста. Для того, чтобы понять, как работает программа, выберем интерактивный режим, в котором каждый этап чистки будет выполняться под контролем пользователя. Впоследствии, освоившись с программой, вы можете для экономии времени выбирать автоматический режим.

Поскольку в нашем распоряжении версия программы Express, выбирать тип текста мы не можем, по умолчанию выбран Текст в современной орфографии (OCR), который, впрочем, подходит для решения большинства задач. Нажимаем кнопку Продолжить. Откроется окно, показанное на рис. 4, в котором будет видно название выполняемой в данный момент задачи и другая служебная информация. Время выполнения чистки сильно зависит от объема текста и быстродействия вашего компьютера.

После окончания чистки откроется следующее окно (рис. 5). Из 616 слов в тексте программа обнаружила 91 слово, которых нет в словаре или которые программа читает ошибочными, причем из этих слов три повторяются неоднократно. В соответствии со своими интеллектуальными алгоритмами программа решила, что эти слова хоть неизвестные, но не ошибочные, и просит пользователя подтвердить это решение. С удовлетворением отмечаем, что программа не ошиблась. А вот если бы она допустила ошибку в каком-нибудь слове, его нужно было бы переместить в раздел Ошибочные слова для последующего исправления.

Нажимаем кнопку Продолжить. Откроется окно, показанное на рис. 6. В этом окне программа сообщает статистику проделанной правки текста и предлагает выполнить аналитические замены в словах. Эти замены производятся опять-таки по внутренним интеллектуальным алгоритмам программы. По умолчанию режим аналитических замен включен, но от него можно отказаться. Какие-либо советы по выбору режима здесь давать сложно: попробуйте оба и выберите тот, в котором программа покажет лучшие результаты.


Книгаго: Программа обработки текста после сканирования AfterScan. Иллюстрация № 4
стр.

Оставить комментарий:


Ваш e-mail является приватным и не будет опубликован в комментарии.

Книги схожие с «Программа обработки текста после сканирования AfterScan» по жанру, серии, автору или названию: