现在tts server也可以克隆声音了

7 Misterwang 7个月前 588次点击

和各大大佬们一起写了个indextts，感兴趣的同学们快来看看吧

# IndexTTS 2.0 插件使用帮助

欢迎使用 **IndexTTS 2.0** 语音合成插件！这个插件能让你用不同“发音人”的声音，把文字变成自然、有感情的语音。下面是一份简单明了的使用指南。

---

## 🎙️ 一、选择发音人

插件内置了几位特色发音人：

- **姜文**：沉稳有力，适合讲述类内容

- **马老师**：风趣幽默，带点标志性语气

- **郭老师**：温和亲切，像朋友聊天

- **古装少女**：清脆柔美，适合古风台词

- **自定义参考音频**：你可以上传任意一段人声录音，AI会模仿这段声音说话！

> ✅ **提示**：选“自定义参考音频”时，需要填写一个公开可访问的音频链接（如 `.wav` 文件）。

---

## 🌐 二、选择 API 服务器

插件支持多个服务器，用于处理语音请求。默认使用第一个（1服务器xmccln），你也可以手动切换：

- 1服务器xmccln（推荐）

- 2服务器whj1998

- 3服务器donaldtrunp

- 4服务器indexteam

> ⚠️ 如果某个服务器响应慢或失败，可以尝试换一个。

---

## ❤️ 三、控制语音情感（可选）

你可以让语音带上不同的情绪，比如开心、愤怒、平静等。共有四种方式：

### 1️⃣ **与音色参考音频相同**（默认）

> 直接模仿发音人原音频的情感，无需额外设置。

### 2️⃣ **使用情感参考音频**

> 上传另一段带情绪的语音（如大笑、哭泣），AI会模仿其中的情感。

> - 需要填写 **情感参考音频URL**

> - 可调节 **情感权重**（0~2）：数值越大，情绪越强烈

### 3️⃣ **使用情感向量控制**

> 手动调节8种情绪的强度：

> - 喜、怒、哀、惧、厌恶、低落、惊喜、平静

> - **注意**：所有情绪值总和不能超过 **1.5**，单个不超过 **1.4**

### 4️⃣ **使用情感描述文本控制**

> 直接输入文字描述情绪，例如：

> - “非常开心地大笑”

> - “悲伤地低声说话”

> - “愤怒地质问”

> 🔁 切换情感方式后，界面上会自动显示/隐藏对应设置项。

---

## ⚙️ 四、高级参数（一般不用改）

这些是 AI 生成语音的“内部调音台”，普通用户保持默认即可：

| 参数 | 默认值 | 说明 |

|------|--------|------|

| 温度 (Temperature) | 0.7 | 控制随机性：越高越自由，越低越稳定 |

| Top P | 0.9 | 控制生成多样性 |

| Top K | 50 | 限制候选词数量 |

| 最大 Token 数 | 20 | 控制生成长度（影响语速和停顿）|

> 💡 除非你知道自己在做什么，否则建议不要调整这些参数。

---

## 📥 五、如何使用“自定义参考音频”

1. 准备一段清晰的人声录音（最好是干净、无背景音乐的 `.wav` 文件）

2. 将音频上传到网络（如 GitHub、网盘等），获取 **公开直链**

3. 在插件中选择 **“自定义参考音频”**

4. 在弹出的输入框中粘贴你的音频链接

5. 输入文字，点击播放即可！

> ❗ 链接必须以 `http://` 或 `https://` 开头，否则会报错。

---

## ❓常见问题

**Q：为什么语音生成很慢？**

A：首次请求或服务器繁忙时可能需要等待几秒到几十秒，请耐心等待（最长5分钟）。

**Q：生成失败怎么办？**

A：检查：

- 网络是否正常

- 自定义音频链接是否有效

- 情感设置是否完整（如选了“情感参考音频”但没填URL）

**Q：能生成英文吗？**

A：目前仅支持中文（`zh`）。

---

## 📝 总结操作流程

1. 选择发音人（或自定义音频）

2. （可选）选择情感控制方式并设置

3. 输入你想合成的文字

4. 点击播放，等待语音生成

---

祝你玩得愉快！用 IndexTTS 创作出富有表现力的语音作品吧 🎧✨

点击下载

ps：声音克隆虽好玩，但请注意合法使用

玩机互助

共 7 条评论

xq 7个月前

话说，本人对这些手机上的声音克隆软件一点兴趣都没有啊，没有啊。那根本就和电脑没办法比呀。

Misterwang [楼主] 7个月前

不是用的本地算力

冰淇淋 7个月前

这个克隆的太难听了

Misterwang [楼主] 7个月前

我觉得还可以啊

用户170336 7个月前

你这个名字挺有意思

迷壶博士 7个月前

哇，这个可以。必须支持

迷壶博士 7个月前

是我使用姿势不对吗？等了很久，结果time out了

添加一条新评论

登录后可以发表评论去登录

作者

Misterwang

积分：8117

一个热爱科技喜欢音乐的super boy。

作者其它话题

正在申请硅基流动的 powered by siliconflow公益项目计划，给大家说一下当前进度

盘点那些你可能随口都在说，但却可能不理解的编程概念。

重磅，我居然用周杰伦的歌考倒了AI音乐之王Suno。