7 论如何优雅的打出gg 3周前 223次点击
和各大大佬们一起写了个indextts,感兴趣的同学们快来看看吧
# IndexTTS 2.0 插件使用帮助
欢迎使用 **IndexTTS 2.0** 语音合成插件!这个插件能让你用不同“发音人”的声音,把文字变成自然、有感情的语音。下面是一份简单明了的使用指南。
---
## 🎙️ 一、选择发音人
插件内置了几位特色发音人:
- **姜文**:沉稳有力,适合讲述类内容
- **马老师**:风趣幽默,带点标志性语气
- **郭老师**:温和亲切,像朋友聊天
- **古装少女**:清脆柔美,适合古风台词
- **自定义参考音频**:你可以上传任意一段人声录音,AI会模仿这段声音说话!
> ✅ **提示**:选“自定义参考音频”时,需要填写一个公开可访问的音频链接(如 `.wav` 文件)。
---
## 🌐 二、选择 API 服务器
插件支持多个服务器,用于处理语音请求。默认使用第一个(1服务器xmccln),你也可以手动切换:
- 1服务器xmccln(推荐)
- 2服务器whj1998
- 3服务器donaldtrunp
- 4服务器indexteam
> ⚠️ 如果某个服务器响应慢或失败,可以尝试换一个。
---
## ❤️ 三、控制语音情感(可选)
你可以让语音带上不同的情绪,比如开心、愤怒、平静等。共有四种方式:
### 1️⃣ **与音色参考音频相同**(默认)
> 直接模仿发音人原音频的情感,无需额外设置。
### 2️⃣ **使用情感参考音频**
> 上传另一段带情绪的语音(如大笑、哭泣),AI会模仿其中的情感。
> - 需要填写 **情感参考音频URL**
> - 可调节 **情感权重**(0~2):数值越大,情绪越强烈
### 3️⃣ **使用情感向量控制**
> 手动调节8种情绪的强度:
> - 喜、怒、哀、惧、厌恶、低落、惊喜、平静
> - **注意**:所有情绪值总和不能超过 **1.5**,单个不超过 **1.4**
### 4️⃣ **使用情感描述文本控制**
> 直接输入文字描述情绪,例如:
> - “非常开心地大笑”
> - “悲伤地低声说话”
> - “愤怒地质问”
> 🔁 切换情感方式后,界面上会自动显示/隐藏对应设置项。
---
## ⚙️ 四、高级参数(一般不用改)
这些是 AI 生成语音的“内部调音台”,普通用户保持默认即可:
| 参数 | 默认值 | 说明 |
|------|--------|------|
| 温度 (Temperature) | 0.7 | 控制随机性:越高越自由,越低越稳定 |
| Top P | 0.9 | 控制生成多样性 |
| Top K | 50 | 限制候选词数量 |
| 最大 Token 数 | 20 | 控制生成长度(影响语速和停顿)|
> 💡 除非你知道自己在做什么,否则建议不要调整这些参数。
---
## 📥 五、如何使用“自定义参考音频”
1. 准备一段清晰的人声录音(最好是干净、无背景音乐的 `.wav` 文件)
2. 将音频上传到网络(如 GitHub、网盘等),获取 **公开直链**
3. 在插件中选择 **“自定义参考音频”**
4. 在弹出的输入框中粘贴你的音频链接
5. 输入文字,点击播放即可!
> ❗ 链接必须以 `http://` 或 `https://` 开头,否则会报错。
---
## ❓常见问题
**Q:为什么语音生成很慢?**
A:首次请求或服务器繁忙时可能需要等待几秒到几十秒,请耐心等待(最长5分钟)。
**Q:生成失败怎么办?**
A:检查:
- 网络是否正常
- 自定义音频链接是否有效
- 情感设置是否完整(如选了“情感参考音频”但没填URL)
**Q:能生成英文吗?**
A:目前仅支持中文(`zh`)。
---
## 📝 总结操作流程
1. 选择发音人(或自定义音频)
2. (可选)选择情感控制方式并设置
3. 输入你想合成的文字
4. 点击播放,等待语音生成
---
祝你玩得愉快!用 IndexTTS 创作出富有表现力的语音作品吧 🎧✨
点击下载ps:声音克隆虽好玩,但请注意合法使用
你这个名字挺有意思
哇,这个可以。必须支持