Посоветуйте ИИ(если такой есть), который считывает слова человека с ролика и накладывает эту речь на сам ролик в виде субтитров. Для наглядного примера: условно есть видос с подкастом где две персоны общаются, ИИ считывает их речь и воспроизводит в виде субтитров в самом видео.