Распознавание и оцифровка книг
Электронные книги пользуются большой популярностью. Чтение книги в электронном формате экономит время на поход в библиотеку, и значительно расширяет возможности выбора. Для перевода обычной книги в электронный вид используется метод распознавания и оцифровки.
Первые электронные книги перепечатывали. Это был трудоемкий процесс. Человек брал книгу и просто перепечатывал все страницы. Времени на это уходило много. Человеческий фактор никто не отменял, поэтому случались опечатки, ошибки. Для их исправления нужен был редактор, который вычитывал и вносил корректировки.
Современные методы позволяют оцифровывать книги гораздо быстрее и качественно. Существует два метода оцифровки:
- Обязательная оцифровка, при которой книгу сканируют, фотографируют и получают документ с графическими изображениями.
- Опционная оцифровка – распознавание текста при помощи оптических приборов, в результате которого получают текст с символами.
Каждый метод имеет свои плюсы и минусы. Поэтому чаще используется смешанный способ оцифровки, то есть подходы к распознаванию совмещаются. В результате создается красиво оформленная электронная книга с возможностью поиска нужной главы или абзаца.
Как книга оцифровывается?
На первом этапе каждая страница сканируется, затем при помощи специальных программ распознается текст.
Процесс оцифровывания книги:
- Сканирование страниц.
- Распознавание текста (текст с иллюстрациями или обычный файл txt).
- Дополнительная обработка.
Сканирование страниц
Сканировать книгу труднее, чем обычный документ. Книга имеет переплет, поэтому вытащить страницы по отдельности не представляется возможным. Обычный сканер передаст информацию в искаженном виде, поэтому используется специальный книжный сканер.
Распознавание книги
Чтобы распознать изображения на страницах, используют уникальное программное обеспечение. В результате получается иллюстрированный текст. На всех этапах распознавания оператор контролирует процесс, вручную исправляет ошибки. Это делается для повышения качества текста, так как программа может пропустить ошибку.
В результате получается готовая книга с иллюстрациями, которую читают из приложения на планшете, смартфоне или напрямую из интернета.
Цены на распознавание текста книги
Автоматическое распознавание за страницу (без проверки и корректировки результатов) | 3 руб. |
Распознавание. Простая страница* (за страницу) | 16 руб. |
Распознавание. Стандартная страница* (за страницу) | 23 руб. |
Распознавание. Сложная страница 1 степени* (за страницу) | 39 руб. |
Распознавание. Сложная страница 2 степени* (за страницу) | 56 руб. |
Распознавание. Сложная страница 3 степени* (за страницу) | 85 руб. |
Распознавание. Сложная страница 4 степени* (за страницу) | 115 руб. |
Сверхсложная страница* (за страницу) | 190 руб. |
Наценки к базовой стоимости распознавания текста
Наличие на странице текста на иностранном языке (коэффициент) | умнож. на 1,3 |
Распознавание ксерокопии или наличие на странице засветов или шумов (коэффициент) | умнож. на 1,5 |
Наличие 2-х колонок текста на странице (коэффициент) | умнож. на 1,3 |
Наличие 3-х колонок текста на странице (коэффициент) | умнож. на 1,5 |
Ввод формул в редакторе формул (за элемент) | 35 руб. |
"Распознавание и оцифровка книг"