Форум сайта python.su
Никто часом не сталкивался с такой задачей - очистить вебстраницу от дизайна для получения чистого текста статьи (как это делает readability.com)? Может кто знает библиотеку или наработки какие встречал в открытом доступе? Подскажите.
Офлайн
Я вот такую штуку писал как-то https://github.com/lorien/grab/blob/master/grab/tools/content.py
Офлайн