Распознавание отсканированного текста и сохранение его для последующего редактирования производится при помощи специальных программ. Технология OCR, используемая для преобразования, расшифровывается как Оптическое распознавание символов. Эта аббревиатура часто присутствует в названиях подобных программ.
ПО от производителей сканеров
Отдельные производители предоставляют в комплекте программного обеспечения для сканеров или МФУ приложения для распознавания текста. Например, корпорация HP включает программу Readiris в полнофункциональное ПО для некоторых своих изделий.
Если вы установили полный комплект, но в утилите HP Scan в настройках опция «Сохранить как редактируемый текстовый файл» отсутствует, то на вашем устройстве нет такой программы.
Бесплатные онлайн-сервисы
Небольшие файлы можно преобразовать при помощи онлайн-сервисов, которых достаточно много. Для примера приведем один из них — onlineocr.net.
- Перейдите по ссылке, кликните кнопку Выбрать файл и загрузите в сервис документ со своего компьютера. Конвертер читает текст из PDF и нескольких форматов изображений. Бесплатно и без регистрации на сайте можно распознавать документы размером до 15 MB.
- Примечание. После регистрации пользователю доступные дополнительные возможности.
- Выберите язык, формат, который хотите получить, и нажмите Convert.
- В открывшемся окне можно посмотреть что получилось. Для скачивания файла нажмите Download Output File.
- Для сравнения исходного и конечного документов посмотрите этот скриншот. На изображении видно, что текст распознан, и даже форматирование сохранилось. Однако слова на английском языке конвертер прочитал неправильно. В любом случае после обработки текст вычитывают, исправляют ошибки и форматируют.
- Файл, скачанный из интернета, операционная система пытается заблокировать и дает к нему доступ только в режиме чтения. Нажмите Разрешить редактирование.
Документы Google
Текстовый файл в форматах JPEG / PNG / GIF / PDF можно распознать также на Google Диске. Подробно о преобразовании многостраничного документа PDF рассказано в этой статье.