
ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本.

亮点
- 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
- 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
- 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。
目前最新的打包安装版是:ChatTTS-UI-0.84
需要设置的提示词:口语化、 笑声、停顿,合理使用会让合成的语音更加逼真自然!
口语化 :[oral] 笑声:[laugh] 停顿:[break]
Google Lab 一键安装:【点击前往】

© 版权声明
文章版权归作者所有,未经允许请勿转载。
暂无评论...