Хочу прасить таблици, использую ClientTable. Но те страници которые мне нужны выскакивают с ошибкой. Посмотрите:
import urllib2
import ClientTable
response = urllib2.urlopen("http://www.vsego.ru/addurl.phtml")
tables = ClientTable.ParseFile(response,collapse_whitespace=1,recode_entities=None)
response.close()
table = tables
Traceback (most recent call last):
File “D:\—P_Y_T_H_O_N–\A_N_A_L_O_G__1PS\ANALOG.py”, line 49, in ?
tables = ClientTable.ParseFile(response,collapse_whitespace=1,recode_entities=None)
File “C:\Python24\lib\site-packages\ClientTable.py”, line 130, in ParseFile
tp.feed(data)
File “C:\Python24\lib\HTMLParser.py”, line 108, in feed
self.goahead(0)
File “C:\Python24\lib\HTMLParser.py”, line 183, in goahead
self.handle_entityref(name)
File “C:\Python24\lib\site-packages\ClientTable.py”, line 580, in handle_entityref
if self.recode_entities:
AttributeError: TableParser instance has no attribute ‘recode_entities’
при, этом на примерах страниц где находится одна таблица этот код работает.
Поделитесь своими рассуждениями на дану тему и вообще парсингом таблиц и форм.
Кто, что подскажет? Заранее спасибо.