Только голос не получиться
Но так как голос в основном находится в обоих стерео каналах,
То можно оставить моно составляющую, поиграться с эквалайзером.
Для того что бы вырезать моно из стерео надо:
1. повернуть фазу одного из стерео каналов на 180 градусов, к примеру левый, сохранить результат, назовём его Left_Faze.
2. суммировать два канала в моно, правый с Left_Faze, и поворачиваем фазу на 180 градусов.
В результате суммирования мы получим не моно составляющие а наоборот то, что есть только в правом и только в левом, с повёрнутой фазой на 180 гр. назовём его Rezultat.
3. Затем стерео исходник конвертируем в моно и суммируем c Rezultat.
В итоге получим моно составляющую из стерео
вО кАк
В общем принцип в том, что при суммирование противофазный сигнал вычитается
Проще описать не получается