Форум сайта python.su
вопрос больше алгоритмический, есть некий бинарный файл размером в несколько гигабайт, данные хранятся кусками по несколько килобайт
есть сервер с несколькими процессорами и кучей ядер и есть много оперативной памяти, достаточно много чтобы засунуть файл в ram диск несколько раз. данные в файле это допустим содержимое ip пакетов, на текущий момент разбор такого файла стандартными средствами занимает много минут. Дисковой нагрузки вообщем нет, тем более что файлик лежит в ram диске, хотя время распаковки что на ssd диске что в памяти практически идентично.
Вопрос как открыть файлик в несколько потоков, распаковать содержимое пакетов и вывести все это дело сохраняя порядок, да и вообще стоит ли игра свеч.
спасибо.
Офлайн
nightfogна этот вопрос отвечает профилировщик
да и вообще стоит ли игра свеч
nightfogи фраза
сохраняя порядок
nightfog.
и вывести все
Офлайн
doza_andпод порядком позразумевается то что одно из полей содержит время и когда смотришь поток вывода , вывод должен быть остсортирован то есть накладывает дополнительный overhead на сортировку.nightfogна этот вопрос отвечает профилировщик
да и вообще стоит ли игра свеч
http://docs.python.org/library/profile.html
Судя по описанию основные затраты времени в декодере, паралелиться будет идеально. Т.е. паралелить смысл есть, а открывать файл несколько раз - нет.
Правда требует пояснений фразаnightfogи фраза
сохраняя порядокnightfog.
и вывести все
Офлайн