Форум сайта python.su
Детектирование голоса в (телефонном) аудиофайле и вырезание. Какую библиотеку использовать в Python?
Есть задача: из телефонного разговора вырезать голос в отдельные маленькие wav. По каналам звонящий и принимающий я уже разбил, теперь вопрос, как вырезать остальные отрезки голоса, есть ли библиотека на питоне, работающая с этим?
Офлайн
В простейшем случае Zero Cross Rate (ZCR) реализация, например, библиотека PyMir. В более сложных случаях, например детекция голоса на фоне звучащей музыки или сильного шума, необходимо подбирать комбинации из нескольких методов, применять частотную фильтрацию, обучать классификаторы.
Офлайн