Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 14, 2012 12:09:21

asilyator
От:
Зарегистрирован: 2010-10-24
Сообщения: 276
Репутация: +  -2  -
Профиль   Отправить e-mail  

Почему встроенные модули такое УГ?

Смысл более-менее умного тредпула - чтобы сайт не зафлуживался запросами и не падал или не банил клиента.



Офлайн

#2 Июнь 14, 2012 12:15:45

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Почему встроенные модули такое УГ?

По-моему, мы по разному понимаем слово тред-пул. В моём понимании это просто контроллер, позволяющий выполнить N задач в нескольких тредах, ограниченных числом M. Cобсно вот: https://bitbucket.org/lorien/grab/src/63c804b800d1/grab/tools/work.py - ни про какие сайты этот тред-пул не знает.

> Смысл более-менее умного тредпула - чтобы сайт не зафлуживался запросами и не падал или не банил клиента.
Я иногда думаю подобное написать, но чтобы написать универсальный настраиваемый менеджер потоков надо много энергии затратить. Проще кол-во потоков на глазок ставить. Сайт упал? Ставим меньше :D

Офлайн

#3 Июнь 14, 2012 12:22:38

asilyator
От:
Зарегистрирован: 2010-10-24
Сообщения: 276
Репутация: +  -2  -
Профиль   Отправить e-mail  

Почему встроенные модули такое УГ?

Ну настроек должно быть ровно две - общее количество тредов и на (указанный) сайт. Первое, как я понимаю, уже есть?



Офлайн

#4 Июнь 14, 2012 12:28:02

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Почему встроенные модули такое УГ?

Ага. То о чём вы говорите это скорее функционал Grab:Spider - это фреймворк для написания асинхронных спайдеров. Там можно подумать о нагрузке на конкретный сайт. На самом деле обычно спайдер обрабатывает один определённый сайт. Так что настройка общего кол-ва потоков автоматически превращается в настройку для кол-ва потоков для сайта.

Я бы вообще не рекомендовал использовать треды (thread, threading) для парсинга. Большое количество тредов жрёт память и процессор.

Офлайн

#5 Июнь 14, 2012 12:40:38

asilyator
От:
Зарегистрирован: 2010-10-24
Сообщения: 276
Репутация: +  -2  -
Профиль   Отправить e-mail  

Почему встроенные модули такое УГ?

lorien
Я бы вообще не рекомендовал использовать треды (thread, threading) для парсинга. Большое количество тредов жрёт память и процессор.
Краеугольный камень срача “треды vs кооперативная многозадачность”.

Есть одна программка для проверки проксей. Так вот, при проверке она жрет лишь незначительно больше (ну, может, порядка 10 метров) при том, что она спавнит 500 тредов. ЧЯДНТ?

Что такое “большое количество тредов”? Я читал лишь о “проблеме 10 к соединений”, когда есть 10к+ соединений, где клиенты практически ничего не делают. 10к на клиенте - ситуация редкая, такое больше характерно для серверов.

И кооперативная многозадачность - вовсе не серебрянная пуля. Не говоря о том, что треды лучше параллелятся (для питона неактулально).

И вообще, здесь имхо это оффтоп. Этот тред о том, какое УГ встроенные средстра питона и как смачно питонистам рвет попки, когда им об этом говорят :))



Офлайн

#6 Июнь 14, 2012 12:48:26

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Почему встроенные модули такое УГ?

Краеугольный камень срача “треды vs кооперативная многозадачность”.

Есть одна программка для проверки проксей. Так вот, при проверке она жрет лишь незначительно больше (ну, может, порядка 10 метров) при том, что она спавнит 500 тредов. ЧЯДНТ?

Что такое “большое количество тредов”? Я читал лишь о “проблеме 10 к соединений”, когда есть 10к+ соединений, где клиенты практически ничего не делают. 10к на клиенте - ситуация редкая, такое больше характерно для серверов.

И кооперативная многозадачность - вовсе не серебрянная пуля. Не говоря о том, что треды лучше параллелятся (для питона неактулально).

И вообще, здесь имхо это оффтоп. Этот тред о том, какое УГ встроенные средстра питона и как смачно питонистам рвет попки, когда им об этом говорят :))
не понял

Офлайн

#7 Июнь 14, 2012 12:54:16

asilyator
От:
Зарегистрирован: 2010-10-24
Сообщения: 276
Репутация: +  -2  -
Профиль   Отправить e-mail  

Почему встроенные модули такое УГ?

lorien
не понял
Вообще ничего не понял? :) Speak russian?

lorien
Я бы вообще не рекомендовал использовать треды (thread, threading) для парсинга. Большое количество тредов жрёт память и процессор.
Вот это можете обьяснить?



Офлайн

#8 Июнь 14, 2012 12:57:26

slav0nic
Команда
От: dp.ua
Зарегистрирован: 2006-05-07
Сообщения: 2260
Репутация: +  41  -
Профиль   Отправить e-mail  

Почему встроенные модули такое УГ?

asilyator
Не говоря о том, что треды лучше параллелятся (для питона неактулально).

смелое утверждение %) очередное горе от ума и не понимание GIL в полной мере.

asilyator
Этот тред о том, какое УГ встроенные средства питона и как смачно питонистам рвет попки, когда им об этом говорят :))

нормальный питонист надрывает живот, читая опусы о софте с 500 тредами, я когда-то уже писал, что высоконагруженные СУБД с 200Гб озу юзают пару тысяч тредов при 100% нагрузке на машинах с 64 CPU и им как бы хватает…, да и интересно какой у тебя интернет канал, чтоб рационально использовать 500 тредов + не убить сайт.

Офлайн

#9 Июнь 14, 2012 13:03:52

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Почему встроенные модули такое УГ?

> Краеугольный камень срача “треды vs кооперативная многозадачность”.
Вы заблуждаетесь, я не учавствую в сраче. Просто рекомендую использовать асинхронность т.к. она меньше систему грузит. Если вам нравится использовать треды, ради бога.

Офлайн

#10 Июнь 14, 2012 13:08:54

asilyator
От:
Зарегистрирован: 2010-10-24
Сообщения: 276
Репутация: +  -2  -
Профиль   Отправить e-mail  

Почему встроенные модули такое УГ?

О, а вот и первый пациент :)

slav0nic
asilyator
Не говоря о том, что треды лучше параллелятся (для питона неактулально).
смелое утверждение %) очередное горе от ума и не понимание GIL в полной мере.
Что многотредовое приложение на питоне не будет работать быстрее на многоядернике, чем на одноядернике с такой же частотой?

slav0nic
да и интересно какой у тебя интернет канал, чтоб рационально использовать 500 тредов + не убить сайт.
Ты две строчки способен прочесть?
Я написал о том, что даже на 500 тредах оверхед (правда, в приложении на делфях) абсолютно минимальный. Сколько нужно соединений, чтобы он стал заметным?



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version