Найти - Пользователи
Полная версия: HTML parsing
Начало » Python для экспертов » HTML parsing
1 2
bw
Раньше использовал BeautifulSoup, сейчас пользуюсь html5lib (с xpath). Последний заметно корректнее разбирает кривой HTML, но он и медленнее. Быстрых альтернатив этим библиотекам нет, либо они мне не известны.
Что касается html5lib. Этот пакет формирует DOM, дальше я использую xpath. Скорость сравнивал только по связке html5lib + xpath, как я сказал это медленнее супа. Возможно я делал неоптимальные запросы xpath.

..bw
Naota
тесты всякие
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB