来看看豆包给我找的声音克隆网站克隆出来的效果

10 活在梦里的猫猫 3周前 316次点击


这个是原本的声音


下面是链接

https://nicevoice.org/zh/

点击打开浏览器克隆
共 20 条评论
活在梦里的猫猫 [楼主] 3周前
0 

很明显是有区别的,一个音色比较明亮一个比较闷

是的是的,第1个好听明亮特别高清,那第2个只能有点小小的水印,声音不怎么行,那效果有点类似于微信打电话的效果,
活在梦里的猫猫 [楼主] 3周前
0 

我个人的感觉的话已经够好了总比那种糊糊的感觉好

喵呜
活在梦里的猫猫 [楼主] 3周前
0 

觉醒吧,喵喵
活在梦里的猫猫 [楼主] 3周前
0 

你觉醒才对

0 

嗯这个东西怎么用啊?我有点用不来?

活在梦里的猫猫 [楼主] 3周前
0 

这个是我找到的使用方法最简单的一个了,导入1到30秒的音频必须是mp 3或者是其他他提示的格式,最完美的时长是15秒然后他开始训练了语音模型。这里提示一下导入的音频不能有杂音,之后它会有一个文本输入框输入你想让他读的内容下面就有一个配音还是克隆的按钮。然后他就开始生成,你可以选择下载到本地,对了,免费的

666
0 
第二个有那种就是AI独有的那种声音
活在梦里的猫猫 [楼主] 3周前
0 

确实有一点

冰淇淋 3周前
0 

这个模型的声音克隆度、相似度还是挺可以的,很久以前有人已经分享过了,但是最开始是在争渡论坛那边分享的。其实只要你的克隆音频越长,它的生成式效果也就越好。

活在梦里的猫猫 [楼主] 3周前
0 

他的最高导入时长是30秒

冰淇淋 3周前
0 
对呀,我的意思是他的时间越长,然后它的生成度就越高,如果说你的时间比较短的话,你的音频时间,然后它生成的效果就没有那么强。其实是很好做对比的,你可以找一个短一点的同一个人的说话音频,和长一点的同一个人说话音频,它生成的效果是完全不一样的。
活在梦里的猫猫 [楼主] 3周前
0 

他提示最好的时长是15秒

冰淇淋 3周前
0 
但是说实话,15秒的那个克隆出来的音色真的不怎么样。我觉得最好是越长,最好是把30秒给弄完整。
活在梦里的猫猫 [楼主] 3周前
0 

但是如果文件太大上传不了

冰淇淋 3周前
0 
一般30秒MP3的就可以了,30秒的文件能有多大呢?
活在梦里的猫猫 [楼主] 3周前
0 

昨天我上传了30秒的结果他说文件太大我就捡到了24秒

添加一条新评论

登录后可以发表评论 去登录