5 绿树成荫 9小时前 154次点击
CloneTTS是一款安卓本地运行的离线文字转语音引擎,支持1-3秒人声克隆生成专属音色,系统级集成兼容主流阅读器。具备多音色轮换、语速音量调节、发音纠错及音色备份功能,所有计算本地完成,无需联网。内置HTTP API服务,支持文本朗读与多角色听书,提升阅读体验。
上述是官方介绍。。
接下来先说一下个人体验和实际测试。
实际使用并没有描述的那么理想。克隆出来的声音效果较差。使用时延迟很大或者半天没反应,甚至没有动静。
这个应该跟软件还是有很大关系吧,当然本人也不懂是软件问题,还是调教的问题,还是参数设置的问题。。
简单说说它实际的使用方式吧。。
克隆出来的声音角色,在软件内双击就选中使用了。。使用方式是通过系统文字语音引擎调用。
语音引擎名字
CloneTTS Engine
这个就是他在语音引擎里面的名称,在系统文字转语音引擎里面选中它就是了。
这样不管是支持阅读,还是读屏软件,调用此语音库理论上都是可以的。
为什么是理论上可以?因为实际并不理想。不是不能用,可以用,但效果只能用来玩玩,娱乐一下。。
想要达到真正日常使用的话,这软件的路还有点长,也不知道作者会不会继续开发。。
下面简单说下使用方式。
首次安装好之后,该飞的常规权限就不用多说了,什么后台运行之类的。
软件主页面有几个已经内置打包在里面的发音人。可以点击试听效果。。每个发音人后面都有一个更多按钮,点开之后可以进行编辑或者删除。。
重点说说自己克隆音频声音角色。。
软件主页面右上角找到更多选项点开。找到添加音色点击。这里有个弹窗,下面点击同意继续。。
从上往下浏览,分别有两种添加声音的方式。。
按钮, 外部选取。
按钮, 录音室采音。
点击第1个从外部选取。找到手机根目录。找到你准备好的存放音频素材的文件夹。。点开看到你准备的音频素材点击。
完了之后又回到软件页面。
这个时候你准备的音频素材就已经导入进来了。
然后继续往下。。编辑框。 音色名称 (必填)。
这里在编辑框内给你这个音色,也就是发音人填写一个名称。。后续制作好了,你直接可以看到你填写的这个名称的发音人点击就可以使用。
继续往下一个编辑框能看到。编辑框。 发音参考文本 (需与录音精准匹配)。
在这个编辑框内,要填入和你音频素材里面说话内容一致的文字。也就是你音频素材里面说的是什么内容,这个地方要用一模一样的文字。要把音频素材里面的内容的文字版本填写在此。
到了这一步,基本上就算完成了。然后往下面进行浏览,可以看到好几个配置参数之类的东西,这个咱也不懂,大家自行探索研究吧。如果不动他也可以,就让他默认。。
滑到最后找到保存并启用的按钮点击。这个时候就等待一会儿,制作好了就会回到软件主页面。。然后在软件主页面就能看到你刚刚添加的发音人了。
这个时候就算真正完成了。。点击旁边可以试听效果。。第1次试听的时候可能半天没有动静,多尝试几次就好了。。
当然软件内还有其他更多的一些比较复杂的设置,这里就不做过多赘述,大家自行探索研究吧,因为我也不懂。。
最后简单说下如何调用。。开篇已经大概说过了。在系统文字语音引擎里面选中这个引擎就可以了。读屏调用也一样,选中这个引擎就可以。但是想用读屏调用的话,基本不太可能因为选中了之后就不说话了,或者非常反应慢。。
还有一种玩法就是用文字转音频的工具调用词语音库输入文字转换成音频。。
到时候转换出来的音频,说话声音就是你所选中的发音人。。
最终总结。。用来探索娱乐玩一下可以。想要上手实际日常使用,目前还不行。。至于克隆出来的音频效果,那跟电脑做出来的完全没法比。。
希望作者能够继续更新优化吧。当然也不要问我作者的联系方式或者是谁,因为我也不知道,都是在网上无意间发现的软件。。
没有作者的联系方式。。
补充一下。。音频素材在四五秒钟或者更长都是可以的。。但音频素材尽量不要有杂音,只有干声,而不要有配乐和背景音乐之类的。。至于有背景音乐的音频素材能不能成功?没测试过。另外音频素材我选用的是MP3格式,是可以正常导入的,至于其他格式的音频也没测试过。。
大致使用方式就是如此。。
感兴趣的小伙伴可以共同研究探索,发现了什么新的参数设置或者玩法,可以一起交流。
软件大小200多兆。。
最后再次声明,这东西目前也就只能用来研究娱乐一下,达不到自己想要的理想效果也没办法。
那些有电脑的小伙伴们,就可以不用折腾了。毕竟电脑弄出来的效果好无数倍,好多都几乎真实还原本人的声音了。
当然如果好奇,闲着无聊,想折腾一下也是可以的。。
下面直接上链接。。
下载链接是迅雷的。。
分享文件:
[www.ghxi.···v0.6.4.apk
链接:https://pan.xunlei.com/s/VOuPUP0ySkt7colQHMMYzeBpA1?pwd=5ehr# 复制这段内容后打开手机迅雷App,查看更方便
当然如果不想在迅雷网盘下载的,也可以加Q群下载。
493686591
最后再把官方的完整介绍贴下面。。
CloneTTS 是一款运行在安卓系统本地的文字转语音 (TTS) 原生引擎。它可以让您在手机上离线克隆所需的声音,并直接使用这个声音来朗读书籍或长文本。无需联网,所有推理计算均在本地完成。
软件特色
离线音色克隆:录制 1~3 秒人声即可生成专属音色
系统级 TTS:注册为安卓系统 TTS 引擎,兼容开源阅读、Moon+ 等阅读器
HTTP API 服务:内置本地 HTTP 服务器,支持 GET 和 POST 请求
多音色轮换:启用多个音色后自动按句切换,适合多角色听书
语速与音量调节:0.5x ~ 2.0x 语速,0% ~ 200% 音量
发音纠错:自定义替换规则(纯文本或正则),可导入多音字修正词库
音色备份:ZIP 格式导入/导出,支持追加或覆盖导入
嗷,这个迅雷自己玩的挺嗨啊,点击楼主分享的这个文件名称下载的是迅雷的安装包
迅雷, 版本:25.0.7.50, 大小:185.8MB
我有一个想法哈,就是如果这个软件的合成能力,如果能挺清晰的话,其实我想能有办法去搞个vvTts安卓版了,哈哈
请问一下楼主目前安卓手机端没有比较好用的声音克隆软件吗?克隆完就像楼主说的可以用来做语音库,或者是反应慢的话能用来做个离线阅读的语音库也可以呀。