Как извлечь текст из отсканированного документа

Извлечь текст отсканированного документаВ течение мая я представил несколько программ OCR для извлечения текста из изображений. Их было 5, если быть точным, и все функциональные и точные. Сегодня я делаю аннотацию к этой статье, добавляя шестую программу для извлекать текст из отсканированного документа. Действительно, больше, чем программа, лучше говорить о бесплатном онлайн-приложении.

Следует иметь в виду лишь небольшую дальновидность: он хорошо работает для английских текстов и немного хуже для итальянского, французского и немецкого языков. И, конечно же, его можно использовать только онлайн. Но давайте забудем о болтовне и сосредоточимся на OCRonline.com.

Как извлечь текст из отсканированного изображения

Ссылка | OCRonline

Сайт для извлечения текста из изображения отсканированного документа

Для теоретического объяснения того, что такое OCR, я отсылаю вас к первой статье, в которой я представил первые 5 бесплатных программ для распознавания текста на изображении. Иногда мне кажется, что я педантичен, а также скучен, всегда заново объясняю одни и те же вещи. Таким образом, нет углубленного анализа значения оптического распознавания символов (это значение аббревиатуры OCR) и того, как различные программы улучшились с течением времени.

Однако необходимо сказать одно: для правильного распознавания слова в изображении программа OCR основана на базе данных символов. В результате, если мы загружаем программу с плохо отсканированным, некачественным или нечетким документом, есть большая вероятность, что текст не будет распознан и будет извлечен правильно.

То же самое и с почерком. Правда, есть некоторые программы оптического распознавания текста, которые умеют писать от руки. Но это дорогое, очень дорогое программное обеспечение. Или это программы, которые нужно тренировать. В том смысле, что перед их использованием мы должны написать ряд терминов и связать наше письмо с некоторыми графическими и графологическими правилами.

OCRonline — бесплатное приложение, и не может распознать наш почерк. Но это может позволить нам извлечь текст из изображения и сохранить его как документ. Для этого просто загрузите файл на сайт. Нравиться? Ну как обычно: кнопка загрузки и вы выбираете нужное изображение. Затем запускаем, и ждем нужное время.

Однако есть ограничение, о котором следует помнить. Который? Что мы можем конвертировать максимум 100 страниц в день. Их много или мало? Что ж, думаю для среднего ежедневного использования их более чем достаточно. Еще потому, что лучшее в OCRonline — это не его скорость, а то, что он всегда онлайн. Потому что? Потому что его можно использовать в качестве службы экстренной помощи в тех случаях, когда нам нужно извлечь текст из изображения, но мы не можем использовать наш компьютер и, следовательно, программы, которые мы установили специально для выполнения этой задачи.

Наконец, что я думаю об этом приложении OCR? Положительно, для документов на английском языке. Также положительным является его функция поддержки в тех случаях, когда у меня нет компьютера с собой, но я все еще могу получить доступ к Интернету.
С другой стороны, моя оценка OCR на итальянском языке и его медленное извлечение текста из отсканированного изображения была отрицательной. Отрицательным, даже если не полностью, является выбор ограничения количества документов, которые можно преобразовать до 100 за один день.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован.