Найти - Пользователи
Полная версия: Tesseract для обработки табличных документов
Начало » Python для экспертов » Tesseract для обработки табличных документов
1
BobkovS
Приветствую всех. Проблема такая, столкнулся с задачей распознавания текста на изображении, содержащем таблицы(пример изображения приведен ниже) с дальнейшим занесением данных из каждой ячейке таблицы в базу. Есть ли какой то алгоритм действий для решения таких задач? На данный момент имеется только идея распознавать текст отдельно в каждой ячейке таблицы.
ZerG
Как вы правильно и сказали
https://pypi.org/project/pytesseract/

Однако - учитывая структуру картинки и задачу - думаю что количество ошибок будет очень большим.
И пихать в базу без проверки такие данные нельзя. А сверять только на глаз.
ZerG
Как вы правильно и сказали
https://pypi.org/project/pytesseract/

Однако - учитывая структуру картинки и задачу - думаю что количество ошибок будет очень большим.
И пихать в базу без проверки такие данные нельзя. А сверять только на глаз.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB