Журнал «Компьютерра» - Цифровой журнал «Компьютерра» № 135
Название: | Цифровой журнал «Компьютерра» № 135 | |
Автор: | Журнал «Компьютерра» | |
Жанр: | Околокомпьютерная литература | |
Изадано в серии: | Журнал Компьютерра #135 | |
Издательство: | неизвестно | |
Год издания: | - | |
ISBN: | неизвестно | |
Отзывы: | Комментировать | |
Рейтинг: | ||
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера |
Краткое содержание книги "Цифровой журнал «Компьютерра» № 135"
Оглавление Интервью
Генеральный директор ABBYY Россия о будущем OCR и облачных сервисах Автор: Андрей Письменный
КолумнистыВасилий Щепетнёв: Рядом с троллем Автор: Василий Щепетнев
Дмитрий Шабанов: «Чувствую какую-то неизбежность...» Автор: Дмитрий Шабанов
Кафедра Ваннаха: Пропустившие взлёт Автор: Михаил Ваннах
Дмитрий Вибе: Ненаблюдавшиеся компаньоны Автор: Дмитрий Вибе
Голубятня-ОнлайнГолубятня: О блогерстве Автор: Сергей Голубицкий
Голубятня: Кококо с Жимини Автор: Сергей Голубицкий
Читаем онлайн "Цифровой журнал «Компьютерра» № 135". [Страница - 3]
- 1
- 2
- 3
- 4
- 5
- . . .
- последняя (19) »
Конечно, за десять лет произошли изменения в качестве самих технологий. Есть два направления развития: первое — улучшение обработки изображений, второе — переход на более высокий уровень абстракции в анализе обрабатываемого документа. Первое направление помогает охватить более широкий спектр источников изображений — например, сделать снимки, получаемые при помощи камер мобильного телефона, более пригодными для распознавания. Второе направление развития направлено на то, чтобы сократить время, затрачиваемое на форматирование текста документа после его распознавания.
Если раньше учёные бились над качеством распознавания одного символа или слова, то сейчас, если качество изображения достаточное, то речь идёт о том, что, пора подниматься на такой уровень абстракции, как весь документ, а не отдельная страница — стараться понять взаимосвязи элементов в документе и настроиться на ту задачу, которую решает потребитель. Если он сканирует и распознает документ, чтобы дальше с ним продолжить работу в текстовом или другом редакторе, это один сценарий. Другой сценарий — когда документ нужно проиндексировать для поисковой системы, третий — сохранить в виде изображения, которое бы передало изначальный внешний вид, а под ним текстовый слой, по которому можно производить поиск. Под каждый из этих сценариев улучшаются компоненты, взаимодействующие с базовой технологией распознавания.
Мобильное использование накладывает дополнительные требования по технологиям обработки изображения. Хоть камеры в телефонах и улучшаются, но по сравнению с обычным сканированием добавляется множество факторов: некачественное освещение, искривления и так далее. Мы, например, последние пять лет активно занимаемся тем, что расширяем количество возможных источников для получения изображений для ABBYY FineReader. В результате появляются приложения и для мобильных телефонов. Например, наш ABBYY TextGrabber я активно использую, когда читаю журналы: если хочу поделиться заметкой с друзьями или коллегами, то фотографирую, распознаю и сразу отправляю в Facebook или по почте. Также вместо МФУ начал активно использовать приложение ABBYY FineScanner для съёмки документов. Ещё несколько лет назад сделать это было сложно, потому что и камеры были хуже, и технологии ещё предстояло доработать.
- Какие ещё тенденции на рынке OCR вы можете выделить? Скажем, изменения спроса на разные языки или сегменты.
- Особых изменений нет. Определённые виды языков были недостаточно качественно реализованы до текущего момента времени. Например, мы начали относительно недавно заниматься китайским — он присутствует в ABBYY FineReader с десятой версии. Мы постоянно улучшаем распознавание всех языков, отдельно я бы выделил только группы языков китайский-корейский-японский.
- Для российского рынка?
- Нет, речь обо всём мире — для экспорта это куда более актуально, чем для нашего рынка. У нас же спрос не изменился: это смешанные документы, преимущественно на русском языке, с появлением слов на иностранных языках. Структура потребления в смысле обрабатываемых материалов тоже не изменилась. А чтобы завоевать передовые позиции в мире, мы работаем не только над повышение качества, но и над поддержкой новых языков. Например, над арабским — он уже появился у нас в одиннадцатой версии, и мы намерены сделать его распознавание лучшим в мире. Сегодня FineReader распознает документы на 189 языках, и это самый высокий показатель в мире.
- Какое соотношение потребления вашей продукции в России и за рубежом?
- Россия и СНГ дают от 20 до 25 процентов.
- Могут ли какие-то тенденции отрицательно повлиять на необходимость в технологиях распознавания? Например, процессорные мощности станут доступнее, и сократится надобность в технологиях распознавания?
- Исходя из того, что человек воспринимает информацию при помощи звука и зрения, в принципе, необходимость анализа текстовой информации вряд ли отпадёт. Вопрос в том, в каком виде эта информация будет поступать на вход. Например, сейчас такие вещи, как извлечение информации из окружающей нас --">- 1
- 2
- 3
- 4
- 5
- . . .
- последняя (19) »
Книги схожие с «Цифровой журнал «Компьютерра» № 135» по жанру, серии, автору или названию:
Журнал «Компьютерра» - Журнал «Компьютерра» № 47-48 от 20 декабря 2005 года Жанр: Околокомпьютерная литература Серия: Журнал Компьютерра (бумажный) |
Журнал «Компьютерра» - Цифровой журнал «Компьютерра» № 94 Жанр: Околокомпьютерная литература Серия: Журнал Компьютерра |
Журнал «Компьютерра» - Цифровой журнал «Компьютерра» № 97 Жанр: Околокомпьютерная литература Серия: Журнал Компьютерра |
Другие книги из серии «Журнал Компьютерра»:
Журнал «Компьютерра» - Цифровой журнал «Компьютерра» № 69 Жанр: Околокомпьютерная литература Серия: Журнал Компьютерра |
Журнал «Компьютерра» - Цифровой журнал «Компьютерра» № 70 Жанр: Околокомпьютерная литература Серия: Журнал Компьютерра |
Журнал «Компьютерра» - Цифровой журнал «Компьютерра» № 157 Жанр: Околокомпьютерная литература Серия: Журнал Компьютерра |
Журнал «Компьютерра» - Цифровой журнал «Компьютерра» № 160 Жанр: Околокомпьютерная литература Серия: Журнал Компьютерра |