7 迷糊博士 1年前 372次点击
在将来。听说会有朗读修正功能,他也被排上了日程,我希望在增加此功能的时候,针对朗读做一些更细化的处理。在播报中是否可以增加一个分割功能?目前我发现在语音加速的时候确实会进行分割合成。使得苹果语音库等一些声音反应速度是增加了不少。经考证苹果等一些语音库在合成文本太长时延迟也会相对较高,使用分割合成可以明显减缓他们的延迟。目前可用的语音库越来越多,甚至可以拿自己的声音制作语音。但也因此带来了各种不变。使用苹果语音库时碰到很长文本,稍微一下的卡顿总是让人非常难受。使用自定义语音碰到长文本时。读了一会儿就停不由让人十分着急。
Ps目前可调用自定义语音的语音开发者已经不再维护,所以就想通过其他方式解决一下此问题。
曾通过TTS server使用自己编写的分割脚本来朗读。读着读着就停止的问题解决了,但反应速度确实是更慢了。毛毯是否可以考虑在播报设置中增加文本太长时分割的功能。让大家使用上极速又好听的声音呢。甚至可以设置一个分割范围,合成次数超过多少时分割合成。
以上只是个人建议,希望采纳。
这个问题说起来确实挺复杂,但理论上说他既实用,说起来还挺简单的。这个功能的目的也只是为了提高语音库的稳定性和减小语音库的延迟。提高响应速度。