На хабре появился очень хорошая статья про ускорение кода: http://habrahabr.ru/blogs/python/135857/
Кто-нибудь из вас пробовал такие методы? У меня не происходит расспараллеливания с использованием OpenMP. Используется только один процессор.
Если запускаю пример, то видно на последнем тесте, что ускорения нет:

Test on size: 3000x3000
Pure python: 8.28869342804
Pure C: 5.65230846405
C plus OpenMP: 5.59680461884
Test - ok