7 小心 1年前 1896次点击
其实有些事情我搞不懂,我想问一下各位铁友,为什么你们渴望64位读屏软件语音库出来的时候必须要搞得像真人一样呢?目前我们没有搞得像真人一样这样的技术。除了心智无障碍,那边有一些特殊的情况弄一些不怎么好的那些语音库出来之外。有些事情我始终都弄不明白,听个语音库,你们为什么渴望要弄个真人语音库出来呢?现在市面上大多数的科大讯飞不满足你们的要求吗?然后想另外一方面,如果这个国内没有了科大讯飞的离线识别,不知道是不是作为盲人的安卓用户,只能够强制用那些手机自带的语音库的语音引擎呢,这样特别的延迟离谱。
其实真人语音库也不是特别的难做,参考最近的Sovits4.0,它已经可以90%还原真人的声音了,还可以自己做一些歌曲何搞笑视频。但是我觉得真人语音库听起来怪怪的,并不是那么好,还不如内置讯飞的小烟呢。
这个Sovits4.0在哪里下载呀?是手机的还是电脑的?
在电脑上只要搜sovits官网下载就OK了,但是你给他提供的音频文件必须要在10兆以上,而且不能有杂音,有杂音会不太像。据说有人用这个东西调教了30多个小时才成功。你不嫌麻烦可以试试。
那手机上有这种类型的软件吗?
不知道,应该没有吧。
我觉得这只是人家的个人喜好吧,或许你觉得声音不是很重要,但是有的人就是觉得很重要啊
就像楼主觉得语音库延迟大离谱所以你喜欢延迟小速度快,有的人就是宁愿延迟大也希望声音像真人呗
对我来说,速度中等就行,但是声音要好听。
我很赞成楼主的说法。真人语音库,好家伙,加上了人的。说话口气速度快一点,那简直的。如果拿去朗读小说,现在的智能根本就理解不了文章的内容,明明是很悲伤的,但是里面有一些快乐的。词语那怎么办?就像某些小说软件里面一样。其中一段。快回家吧,你爷都摔断腿了,你还在外面吃喝玩乐,还高兴的像个傻瓜。这里面有几个词语,你说他怎么能知道?是不好的事情他还给你读的挺高兴,有时候听起来怎么说呢,违和感太强。然后就是清晰度的问题了,人读的,扫描的有些词语一段快了,那就对不起了。我只要读得顺畅,逗号句号能分开一点。声音不要太单薄,那就够用了。
然后就是声音音色的问题了,我发现很多语音库高频都是太高,好家伙,听久一点的耳朵简直就受不了,要不然就闷的要死。那清晰度也有待提高,可是很多所谓做软件的清晰度提高,估计是把它调亮了一点吧,那尖锐的啊。还是那句话,千万别再加什么感情朗读了。
一直喜欢讯飞
我还是喜欢讯飞3.0那个
或者百度语音也行
我借楼主这个帖也想问一下,你们这帮家伙到底是怎么想的?现在都有这么多的语音给你们用了,还不知足吗?为啥一定要搞一个真人语音出来呢?我真的是有点懵圈呢。