Благодарю за развернутый ответ, еще думаю как это реализовать т.к. морфинг может работать не корректно из-за запинок и прочего. Сам хочу подключить api или локальный метод транскрибации речи и уже после синтезировать результат транскрибации. Еще раз спасибо!Вам на входе нужен голос или текст?
Если текст, то вот:
![]()
GitHub - nateshmbhat/pyttsx3: Offline Text To Speech synthesis for python
Offline Text To Speech synthesis for python. Contribute to nateshmbhat/pyttsx3 development by creating an account on GitHub.github.com
Пример кода работы либы:
Python:import pyttsx3 # Инициализация движка engine = pyttsx3.init() # Получение списка доступных голосов voices = engine.getProperty('voices') # Установка женского голоса (voices[1] - индекс может варьироваться) engine.setProperty('voice', voices[1].id) # Синтез речи engine.say("Привет, это женский голос") engine.runAndWait()
Если на входе голос мужской, а на выходе женский. То только через морфинг или нейронки (можно поискать на https://huggingface.co - вставил нужный фильтр в линк для поиска audio-to-audio)
По морфингу была такая либа (еще вроде есть, искать лень):
![]()
GitHub - timmahrt/ProMo: Prososdy Morph: A python library for manipulating pitch and duration in an algorithmic way, for resynthesizing speech.
Prososdy Morph: A python library for manipulating pitch and duration in an algorithmic way, for resynthesizing speech. - timmahrt/ProMogithub.com