强大的对话式文本转语音模型ChatTTS

描述

该项目是专门为对话场景设计的文本转语音模型，支持中、英双语。它不仅能够生成自然、流畅的语音，还能控制和添加笑声、停顿和语气词等。ChatTTS 生成较短的语音效果很好，几乎听不出 AI “味”。

地址

import ChatTTS
from IPython.display import Audio

chat = ChatTTS.Chat()
chat.load_models(compile=False) # 设置为True以获得更快速度

texts = ["在这里输入你的文本",]

wavs = chat.infer(texts, use_decoder=True)

torchaudio.save("output1.wav", torch.from_numpy(wavs[0]), 24000)