Форум сайта python.su
Надо в строке с HTML-тегами закрывать незакрытые теги. Как лучше сделать ?
Офлайн
Ээээ, а откуда знать после чего их закрывать? Сколько текста должно быть болдом, а сколько - нет? Что будет заголовком,а что - нет?
Где заканчивается колонка в таблице?
Офлайн
FerromanКонечно, много случаев, когда это не сработает, и в этом случае - только ручная ругулировка длины отрывка текста. Но все же, думается мне, должно принести пользу в большинстве своем тупое закрытие тэгов. По крайней мере в моем случае. Сами тексты, в 99% случаев набранные в WISIWIG-редакторе статьи. Надо обрубать их, но при этом показывая форматированными.
Ээээ, а откуда знать после чего их закрывать? Сколько текста должно быть болдом, а сколько - нет? Что будет заголовком,а что - нет?
Где заканчивается колонка в таблице?
Офлайн
Попробуй Tidy. К нему есть питоновская оболочка - http://utidylib.berlios.de/
Офлайн
Пробовал для этих целей htmldata, BeautifulSoup, Tidy, html5lib (отсортированы по степени интеллектуальности при закрытии тегов).
Наиболее адекватная, пожалуй, html5lib - http://code.google.com/p/html5lib/.
Отредактировано (Июль 13, 2008 10:57:45)
Офлайн
Я просто думаю, что количество “исключений” - то есть моментов, где придётся руками регулировать больше чем моментов, где можно автоматизировать. Но, может, кое-что все-таки сделать можно.
Офлайн
shizashiza, спасибо.
Пробовал для этих целей htmldata, BeautifulSoup, Tidy, html5lib (отсортированы по степени интеллектуальности при закрытии тегов).
Наиболее адекватная, пожалуй, html5lib - http://code.google.com/p/html5lib/.
Офлайн
а кто нить скажет где найти доки по html5lib или примеры нормальные…
ногами не бейте я в гугле пробовал искать уже;)
Офлайн
derevo
Родная документация чем не угодила?
Офлайн