引用引用第12楼6a95433a于2024-04-30 03:33发表的 :4. 音声翻译(AI翻译)关于音声翻译首推站内大佬自己微调过的whisper模型工具:https://www.north-plus.net/read.php?tid-1919446.html这个工具可以开包即用,纯本地,直出中文.lrc,显存超过4g就能跑,没N卡大不了用CPU跑,就是速度慢点不过缺点也是有的,就是受音声本身的影响,结果容易不稳定,有时候输出会牛头不对马嘴,如果质量比较好的情况下倒是很神如果想要稳定点的输出结果,可以使用whisper原版模型先输出原本的语言(这一步决定准确率),再问大语言模型翻译成中文;第一步推荐的工具是faster-whisper-GUI,这个工具有比较完善的gui界面,推荐使用large-v2模型或者medium模型,英语的内容可以使用含有-en后缀的特化模型,实测准确率95%以上,日语要低一些,不过不太会影响理解.......