Форум сайта python.su
Привет всем! А так же тем, кто ещё помнит меня :)
Подскажите, пожалуйста, как можно проверить тип прокси сервера средствами питона или при помощи сторонних либ.
Нужно узнать, поддерживает ли прокси HTTP и/или HTTPS? Использует ли прокси SOCKS4 или SOCKS5?
Может, уже есть какие-то готовые решения и мне не придётся глубоко копать в тему ;)
Отредактировано Mkdir (Июнь 13, 2012 00:39:39)
Офлайн
ёпт, какие люди)
socks4 и socks5 смотри протоколы, там по-моему в первом пакете есть маркер + он отличается от http.
https наверно тупо запросом на какой-то сервис + если поддерживается connect метод то скорей всего и https прокатит
из чекеров раньше был гуёвый proxybag на питоне c WX + погугли что такое ProxyJudge, может пригодится
Офлайн
> Подскажите, пожалуйста, как можно проверить тип прокси сервера средствами питона или при помощи сторонних либ.
Запрашиваем какой-нить yandex.ru/robots.txt через проксю, выставляю socks5 тип, если пришёл ответ правильный, значит прокся socks5. Далее запрашиваем этот же урл, используая socks4 тип, и т.д. :)
Офлайн
lorienКстати, ответ очень в тему, потому что я юзаю твой Grab :) Отличная штука! Большое спасибо!
> Подскажите, пожалуйста, как можно проверить тип прокси сервера средствами питона или при помощи сторонних либ.
Запрашиваем какой-нить yandex.ru/robots.txt через проксю, выставляю socks5 тип, если пришёл ответ правильный, значит прокся socks5. Далее запрашиваем этот же урл, используая socks4 тип, и т.д. :)
slav0nicСпасибо! Гляну.
из чекеров раньше был гуёвый proxybag на питоне c WX + погугли что такое ProxyJudge, может пригодится
Офлайн
Mkdir
свой скрипт для проверки анонимности и есть ProxyJudge, в терминологии тех, кто в теме ;)
Офлайн
> И если он не совпадает с IP скрипта прокси-чекера, то значит прокси анонимен. Видимо, придётся на своем серваке поднимать SSL… Иначе как проверить проксю на поддержку HTTPS и анонимность.
А зачем свой скрипт поднимать? Сайтов определяющих ip - тысячи. Я, например, сейчас в скриптах юзаю http://formyip.com :) Конечно, если очень большие нагрузки, то лучше своё поднять, чтобы не завалить ненароком чужой сайт.
Я недавно делал прокси чекер, так я вообще проверял всё с помощью публичных ресусров. Вот кстати его код: http://dumpz.org/217066/
Офлайн
slav0nicНо там перл… :) А мне надо сразу после проверки складывать в БД. Не хочется парсить результаты stdout ProxyJudge и складывать в базу. Криво как-то. Не?
Mkdir
свой скрипт для проверки анонимности и есть ProxyJudge, в терминологии тех, кто в теме ;)
Офлайн
lorienFormyip.com не умеет HTTPS. Но идея хорошая. Странно, что такая простая мысль не пришла мне в голову :)
А зачем свой скрипт поднимать? Сайтов определяющих ip - тысячи. Я, например, сейчас в скриптах юзаю http://formyip.com :)
lorienЧекер будет проверять около 60-70к прокси за один проход. Параллельных соединений не будет, скорее всего. По идее, не завалю.
Конечно, если очень большие нагрузки, то лучше своё поднять, чтобы не завалить ненароком чужой сайт.
lorienО, спасибо!
Я недавно делал прокси чекер, так я вообще проверял всё с помощью публичных ресусров. Вот кстати его код: http://dumpz.org/217066/
Офлайн
> Чекер будет проверять около 60-70к прокси за один проход. Параллельных соединений не будет, скорее всего. По идее, не завалю.
Хм, если предположить что timeout ранве 5 сек, и там будет 20% нерабочих прокси, то этот чекер будет работать, как минимум (5 * 60000) / 5 = 60000 секунд или 16 часов :o)
Офлайн
lorienЧёрт! Точно! Значит надо асинхронный spider юзать.
> Чекер будет проверять около 60-70к прокси за один проход. Параллельных соединений не будет, скорее всего. По идее, не завалю.
Хм, если предположить что timeout ранве 5 сек, и там будет 20% нерабочих прокси, то этот чекер будет работать, как минимум (5 * 60000) / 5 = 60000 секунд или 16 часов :o)
Офлайн