Уведомления

Группа в Telegram: @pythonsu

#1 Июль 13, 2013 20:29:54

agryn
От: Украина
Зарегистрирован: 2011-12-14
Сообщения: 189
Репутация: +  0  -
Профиль   Отправить e-mail  

Очистка веб страницы для чтения (нпободобие http://www.readability.com)

Никто часом не сталкивался с такой задачей - очистить вебстраницу от дизайна для получения чистого текста статьи (как это делает readability.com)? Может кто знает библиотеку или наработки какие встречал в открытом доступе? Подскажите.

Офлайн

#2 Июль 14, 2013 13:05:16

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Очистка веб страницы для чтения (нпободобие http://www.readability.com)

Я вот такую штуку писал как-то https://github.com/lorien/grab/blob/master/grab/tools/content.py

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version