Найти - Пользователи
Полная версия: Очистка веб страницы для чтения (нпободобие http://www.readability.com)
Начало » Python для экспертов » Очистка веб страницы для чтения (нпободобие http://www.readability.com)
1
agryn
Никто часом не сталкивался с такой задачей - очистить вебстраницу от дизайна для получения чистого текста статьи (как это делает readability.com)? Может кто знает библиотеку или наработки какие встречал в открытом доступе? Подскажите.
lorien
Я вот такую штуку писал как-то https://github.com/lorien/grab/blob/master/grab/tools/content.py
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB