Python-сообщество

agryn · Июнь 6, 2013 13:07:05

Подскажите как правильно сформировать xpath-запрос

grab.doc.select('//div[@class="companyInfo"][1]/text()').text_list()
['', '', '', u'China 200030', '', '', '']

Нужно что б выбирало только непустые елементы (в даном случае

[u'China 200030']

)

——

RUSSIAN WAR CRIMES IN UKRAINE

Отредактировано agryn (Июнь 6, 2013 13:07:44)

buddha · Июнь 7, 2013 11:20:10

Краткость сестра таланта, блин

Отредактировано buddha (Июнь 7, 2013 11:20:20)

lorien · Июнь 7, 2013 15:42:59

>>> from grab.selector import Selector
>>> from lxml.html import fromstring
>>> html = "<p> </p><p>Batman</p><p> </p>"
>>> Selector(fromstring(html)).select('//p/text()').text_list()
['', 'Batman', '']
>>> Selector(fromstring(html)).select('//p/text()[normalize-space(.) != ""]').text_list()
['Batman']

Python-сообщество

Уведомления

#1 Июнь 6, 2013 13:07:05

Работа с селекторами xpath в grab.doc.xpath (пример внутри)

#2 Июнь 7, 2013 11:20:10

Работа с селекторами xpath в grab.doc.xpath (пример внутри)

#3 Июнь 7, 2013 15:42:59

Работа с селекторами xpath в grab.doc.xpath (пример внутри)

Board footer