Найти - Пользователи
Полная версия: BeautifulSoup получает html с \n между тегами - как их убрать ?
Начало » Python для экспертов » BeautifulSoup получает html с \n между тегами - как их убрать ?
1
luk911
перерыл весь интернет не нашел, не знаю у кого спросить:
Собственно html c разметкой удобен, но,

Получаю html - и он уже приходит с переносами строк \n , как их убрать не знаю, собственно функцию которую использую

def get_article(html):
soup = BeautifulSoup(html, “html.parser”)
untranslate = soup.find('div', class_='thecontent')


на выходе получаю между html тегами переносы строк

<p>While many fruits and vegetables are excellent sources of fiber, be aware that they may also contain high levels of oxalate which is one of the major causes of kidney stones. Read more about high-oxalate foods in </p>\n
<h4><strong>8. Kidney Beans</strong></h4>\n
<p>On a similar note (and somewhat ironically) Kidney beans – so called for their resemblance in shape and color to the same-named organ – are also great for clearing up kidney stones.</p>\n
</div>


Все бы ничего, но когда в переводчик засовываю, тот странно себя ведет, половину тегов съедает.

Как удалить эти \n ?? может люди добрые подскажут ?
ayb
>>> "s\n".strip()
's'
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB