Уведомления

Группа в Telegram: @pythonsu

#1 Янв. 9, 2015 11:23:42

eddes
Зарегистрирован: 2015-01-08
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Считывать текст с png or jpg с помощью tesseract for Windows 64

Не получается нормально установить pytesseract ( Py 2.7 or 3.4) . Установил PIL , python-tesseract and tesseract-ocr. Например при вызове print pytesseract.image_to_string(Image.open('C:\Python27\lib\site-packages\PIL\test.png')) выдает: IOError: invalid mode ('rb') or filename: ‘C:\\Python27\\lib\\site-packages\\PIL\test.png’ .

Офлайн

#2 Янв. 9, 2015 11:46:15

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9874
Репутация: +  854  -
Профиль   Отправить e-mail  

Считывать текст с png or jpg с помощью tesseract for Windows 64

\t в пути воспринимается как табуляция. Поставь r перед кавычками.



Офлайн

#3 Янв. 9, 2015 15:01:46

eddes
Зарегистрирован: 2015-01-08
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Считывать текст с png or jpg с помощью tesseract for Windows 64

В этом случае:

>>> print pytesseract.image_to_string(Image.open(r'C:\Python27\lib\site-packages\PIL\test.png'))

Traceback (most recent call last):
File “<pyshell#26>”, line 1, in <module>
print pytesseract.image_to_string(Image.open(r'C:\Python27\lib\site-packages\PIL\test.png'))
File “build\bdist.win-amd64\egg\pytesseract\pytesseract.py”, line 142, in image_to_string
config=config)
File “build\bdist.win-amd64\egg\pytesseract\pytesseract.py”, line 75, in run_tesseract
stderr=subprocess.PIPE)
File “C:\Python27\lib\subprocess.py”, line 709, in __init__
errread, errwrite)
File “C:\Python27\lib\subprocess.py”, line 957, in _execute_child
startupinfo)
WindowsError: The system cannot find the file specified

Офлайн

#4 Янв. 10, 2015 23:31:23

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9874
Репутация: +  854  -
Профиль   Отправить e-mail  

Считывать текст с png or jpg с помощью tesseract for Windows 64

img = Image.open(r'C:\Python27\lib\site-packages\PIL\test.png')
print pytesseract.image_to_string(img)

Вот так запусти и посмотри, что пишет.

Потом посмотри, всё ли правильно передаёшь.
import pytesseract
help(pytesseract.image_to_string)



Офлайн

#5 Янв. 11, 2015 11:34:59

eddes
Зарегистрирован: 2015-01-08
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Считывать текст с png or jpg с помощью tesseract for Windows 64

 
from PIL import Image
import pytesseract
img = Image.open(r'C:\Python27\lib\site-packages\PIL\test.png')
print pytesseract.image_to_string(img)
Выдает тот же текст что и выше. Тот же результат на
import pytesseract.pytesseract
help(pytesseract.image_to_string)
Help on function image_to_string in module pytesseract.pytesseract:
image_to_string(image, lang=None, boxes=False, config=None)
    Runs tesseract on the specified image. First, the image is written to disk,
    and then the tesseract command is run on the image. Resseract's result is
    read, and the temporary files are erased.    
    also supports boxes and config.    
    if boxes=True
        "batch.nochop makebox" gets added to the tesseract call
    if config is set, the config gets appended to the command.
        ex: config="-psm 6"

Отредактировано eddes (Янв. 11, 2015 12:44:02)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version