Найти - Пользователи
Полная версия: Бьютифул суп
Начало » Web » Бьютифул суп
1
Mozart
Всем привет, возник вопрос по использованию данной либы.
Допустим есть сайт из которого нужно спарсить ключевики, добавляю модули, создаю объект соединения, нахожу в объекте необходимую мне строчку :

object.findAll(attrs={"name": "Keywords"})
Работает все хорошо, но выводит такую строчку :

<meta name=“Keywords” content=“Ключевик”>

Так вот вопрос - можно ли как нибудь выдернуть сразу ключевик из этого отрывка? Перечитал всю документацию, но ответа так и не нашел. string не работает, text тоже не подойдет, т.к. страниц много и ключевики везде разные. Нашел 1 выход из проблемы - это записывать всю полученную инфу в файл, и потом отдельной функцией делать реплейс по всему файлу что бы оставить только ключевики, но это гемор, хотелось бы как нибудь побыстрее все это сделать.

Спасибо …
Mozart
Upd: Допер как сделать проще.

a = soup(attrs={"name": "Keywords"})[0]["content"]
f = open("file1.txt", "w")
f.write(a.encode("cp1251"))
f.close()
Вот так все работает )
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB