Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 6, 2013 13:07:05

agryn
От: Украина
Зарегистрирован: 2011-12-14
Сообщения: 189
Репутация: +  0  -
Профиль   Отправить e-mail  

Работа с селекторами xpath в grab.doc.xpath (пример внутри)

Подскажите как правильно сформировать xpath-запрос

grab.doc.select('//div[@class="companyInfo"][1]/text()').text_list()
['', '', '', u'China 200030', '', '', '']
Нужно что б выбирало только непустые елементы (в даном случае
[u'China 200030']
)

Отредактировано agryn (Июнь 6, 2013 13:07:44)

Офлайн

#2 Июнь 7, 2013 11:20:10

buddha
От:
Зарегистрирован: 2012-03-02
Сообщения: 422
Репутация: +  15  -
Профиль   Отправить e-mail  

Работа с селекторами xpath в grab.doc.xpath (пример внутри)

Краткость сестра таланта, блин

Отредактировано buddha (Июнь 7, 2013 11:20:20)

Офлайн

#3 Июнь 7, 2013 15:42:59

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Работа с селекторами xpath в grab.doc.xpath (пример внутри)

>>> from grab.selector import Selector
>>> from lxml.html import fromstring
>>> html = "<p> </p><p>Batman</p><p> </p>"
>>> Selector(fromstring(html)).select('//p/text()').text_list()
['', 'Batman', '']
>>> Selector(fromstring(html)).select('//p/text()[normalize-space(.) != ""]').text_list()
['Batman']

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version