我做的豆包配音网站,迎来新版本了。

8 阿飞哥 1天前 215次点击



在昨天我发布了一篇帖子,分享了,我做了一个能调用豆包音色来配音的网站,很快啊,也是受到小伙伴们很热烈的欢迎啊,我呢,也很快收到了不少反馈,也收到了不少建议,作为一个很听劝的开发者,所以很快的我就对网站迎来了更新,在说新功能之前,首先我先来介绍一下,我们调用的服务豆包语音合成模型以下是它的文字介绍,

豆包语音合成大模型 标题 1

依托新一代大模型能力,豆包语音合成大模型能够根据上下文,智能预测文本的情绪、语调等信息。并生成超自然、高保真、个性化的语音,以满足不同用户的个性化需求。相较于传统语音合成技术,豆包语音合成大模型能输出在自然度、音质、韵律、气口、情感、语气词表达等方面更像真人。

产品优势 标题 1

大模型能力:依托新一代语音大模型能力,语音模型可以根据上下文,智能预测文本情绪、语调等信息,并进行自然演绎;

高自然度:在口语自然度、连贯性、拟人度、音质、韵律、气口、情感、语气词表达等各方面,可以带来更生动、更具情感表现力的听觉体验;

个性化:可生成高保真、个性化的语音,以满足不同用户的个性化需求,适配趣味聊天、视频剪辑、有声阅读等多个场景。

应用场景 标题 1

聊天陪伴:用于豆包等同等类型聊天陪伴场景,通过文本预测控制音色的重音、停顿,赋予音色多样的语气,提供超自然拟真人的交互体验;

有声书合成:在自然播报的基础上,实现笑声、哭腔等副语言现象建模能力,让AI演绎更加真实生动;

音视频配音:打造多维场景音色矩阵,覆盖视频趣味剪辑、专业创作、广告营销、新闻播报、电商带货等,为各类场景提供适配性强、国民认知度高的音色;

数字人播报:高拟人度表现,与数字人虚拟形象做好口型驱动配合;

语音客服:用于智能客服场景,自然的TTS播报可以有类真人客服的表现。

以上就是该模型的详细介绍了,接下来是答疑解惑环节,

问为什么没有温柔桃子这个音色,答,温柔桃子音色是人家豆包app的,看板娘来的, 我都翻遍了语音合成模型的所有音色了,都没有温柔桃子这个音色。所以我猜测该音色是人家app的看板娘来的,

问题2, 为什么只能合成1000字,答,因为我觉得1000个字符已经够满足需求了,我通过后台数据看了看,合成1000个字符,只需要消耗大概两块钱或三块钱左右,如果我们开放给大家能合成更多的字符,那我这边所消耗的费用就会很夸张了,一个人使用那还好,关键是我这个是一个活广告来的一旦有太多人使用了不出几天,我很快就要破产了,所以不得不限制大家的字符上限,

问题3。调用的是合法api接口吗,答试用的是合法接口,最后一个问题。问,做这个项目初衷是什么?为什么要免费给我们使用。答, 起因是我找到了落寞工具箱的开发者落寞,希望他能够在落寞工具箱里面集成豆包的音色,因为我觉得豆包的声音非常的好听。虽然落寞答应了,但是不能保证立刻能做出来,理由是微软的语音合成就已经够用了,为什么还要接豆包的音色呢,哪怕我提供了我的api密钥,落寞才松口,说那好吧,你给我1万块钱,我给你做一个特别的版本,能调用你的api,不收你积分,直接走你自己的火山引擎账号,我看到这就气不打遗出来1万块钱就为了需要一个功能就把我当冤大头呢,于是我找到了腾讯元宝跟他提了提需求,于是他就帮我做出来了,说白了免费开放给大家使用,就是为了让大家自发的帮豆包宣传,只要你们觉得豆包的音色好听,情绪饱满那落寞,等第三方开发者就会自发地推进接入豆包的语音合成了,说的再多不如眼见为实,链接就在下方,点击下方链接即可使用,觉得不错的话,不要忘了给我写个五星好评。

点我体验。
共 20 条评论

楼主,你那个阿飞AI配音为什么下载不了配音之后的音频

阿飞哥 [楼主] 1天前
0 
你换一个浏览器看看。
0 

好家伙一万块钱这么夸张

萤火0212 1天前
0 

楼主你好。请问可以加个私聊吗?我想我可以把这个TTS变为系统TTS,让其他APP调用。QQ3387176270。

阿飞哥 [楼主] 1天前
0 

别别别。这样子会加快我破产的速度的,我昨天晚上刚充了100块钱,今天让你们霍霍的只剩下40块钱了。

小金龙 1天前
0 
你好棒,昨天我有下载你这一个。体验一下还是不错的。
小金龙 1天前
0 
请问楼主,今天你发这一个为啥下载不了啊?
阿飞哥 [楼主] 1天前
0 

指的是哪里下载不了音频吗?换一个浏览器试试。

小金龙 1天前
0 
我明白了,你今天发这一个只是在网页体验一下。而不是安装包,我以为你今天是个安装包。微笑
勿扰 1天前
0 
所以我想你的证书不安全,赶紧换个证书吧
小金龙 1天前
0 
好像不可以调运速的。
阿飞哥 [楼主] 1天前
0 

火山引擎这边没有给我们提供调语速的接口啊,我们试着自己写了一下,传过去直接就报错了。

小金龙 1天前
0 
是的,有机会向你学习。嘿嘿
阿飞哥 [楼主] 1天前
0 

而别向我学习,我不牛逼的。这个项目是,DeepSeek写出来的。

小金龙 1天前
0 
你是使用开发工具生成吗?
阿飞哥 [楼主] 1天前
0 

不是开发工具,是直接让,DeepSeek干活写代码。

如果能调用自己克隆的音色就好了。
阿飞哥 [楼主] 1天前
0 

我去能调用自己克隆的音色,那价格就老贵了,而且克隆音色的接口没对我们个人用户开放,只对企业开放。

那就只能在豆包软件里面用录屏,把声音录下来了。
0 

请问你这个网页是怎么托管的,以前静态网页可以用减含云记托管创建网址,现在没法用了

添加一条新评论

登录后可以发表评论 去登录