Найти - Пользователи
Полная версия: инструменты для получения массива внутренних ссылок сайта (со всех страниц) или Список всех страниц сайта
Начало » Web » инструменты для получения массива внутренних ссылок сайта (со всех страниц) или Список всех страниц сайта
1
Dr.Livsi
Всем доброго времени суток!
Для анализа сайта необходим инструмент, который бы анализировал весь сайт на предмет внутренних ссылок и выдавал в результате список этих самых ссылок. Т.е. результатом хотелось бы получить список всех страниц сайта, не требующих авторизации.
Не хотелось бы заново создавать велосипед. Возможно уже есть готовые решения на эту тему. Ткните носом, плиз.
Dr.Livsi
fata1ex
http://grablib.org/
Ну и поиск:
http://love-python.blogspot.com/2010/09/python-code-to-retrive-links-from-web.html
http://stackoverflow.com/questions/1080411/retrieve-links-from-web-page-using-python-and-beautiful-soup
http://pythonadventures.wordpress.com/2011/03/10/extract-all-links-from-a-web-page/
http://www.python-forum.org/pythonforum/viewtopic.php?f=5&t=10969
http://www.funnyduck.net/2010/01/python-get-links-from-page-matching.html

К сожалению, доступ к интернету на работе ограничен очень небольшим количеством сайтов. Поисковиков в этом списке нет :(

Спасибо за информацию.
Dr.Livsi
fata1ex
http://grablib.org/
http://scrapy.org/

http://www.crummy.com/software/BeautifulSoup/
http://code.google.com/p/html5lib/

Ну и поиск:
http://love-python.blogspot.com/2010/09/python-code-to-retrive-links-from-web.html
http://stackoverflow.com/questions/1080411/retrieve-links-from-web-page-using-python-and-beautiful-soup
http://pythonadventures.wordpress.com/2011/03/10/extract-all-links-from-a-web-page/
http://www.python-forum.org/pythonforum/viewtopic.php?f=5&t=10969
http://www.funnyduck.net/2010/01/python-get-links-from-page-matching.html

Не совсем то. На сколько я понял, эти решения делают список ссылок имеющихся на данной конкретной странице. А мне нужно решение, которое бы обходило все страницы сайта и возвращало список всех страниц сайта.
fata1ex
Dr.Livsi, во-первых, есть решения, которые ищут все ссылки на сайте. Во-вторых, если вы знаете, что такое рекурсия, то из вытаскивания ссылок с одной страницы желаемый вариант можно сделать за пару минут. И в-третьих, если вам всё это не подошло, есть первые две ссылки.

Ну и поисковик: ‘get/extract/retrieve links from site (page)’.
Dr.Livsi
fata1ex
Dr.Livsi, во-первых, есть решения, которые ищут все ссылки на сайте. Во-вторых, если вы знаете, что такое рекурсия, то из вытаскивания ссылок с одной страницы желаемый вариант можно сделать за пару минут. И в-третьих, если вам всё это не подошло, есть первые две ссылки.

Ну и поисковик: ‘get/extract/retrieve links from site (page)’.

Ok, буду смотреть внимательнее. Спасибо.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB