DjangoBB LoFi version

Полная версия: HTML parsing

Начало » Python для экспертов » HTML parsing

1 2

Май 31, 2008 19:36:32

Раньше использовал BeautifulSoup, сейчас пользуюсь html5lib (с xpath). Последний заметно корректнее разбирает кривой HTML, но он и медленнее. Быстрых альтернатив этим библиотекам нет, либо они мне не известны.
Что касается html5lib. Этот пакет формирует DOM, дальше я использую xpath. Скорость сравнивал только по связке html5lib + xpath, как я сказал это медленнее супа. Возможно я делал неоптимальные запросы xpath.

..bw

Naota

Июнь 1, 2008 12:09:35

тесты всякие