大家需不需要电脑端的语音输入法?

5 阿飞哥 3天前 190次点击

大家好,我是飞言TTS的站长阿飞哥。

今天是3月29日,我正式调整了飞言TTS开发团队的业务方向。

2026年开年的时候,我给大家画过一个大饼:宣布年内会自行部署满血版的B站声音复刻功能。但计划很美好,现实却很骨感。先给大家看一下我们平台3月1日到3月29日的运营数据:总用户数704人,日均活跃用户仅16人,全月总使用次数962次。

看着这么惨淡的数据,团队的小伙伴最先问我:我们还要硬着头皮部署满血版的B站声音复刻吗?

毕竟自己部署模型和调用第三方API完全是两回事:调用别人的接口,用户不使用就不会产生费用;但自己部署满血版的B站声音复刻模型,哪怕没有一个用户用,服务器、算力的钱也得天天烧,停都停不下来。所以再三权衡之后,我们正式决定:转型做电脑端的语音输入法。

为什么要做电脑端的语音输入法?有三个核心原因。

第一个原因,也是最现实的原因:在我看来,飞言TTS这个项目,大家似乎只把它当个新鲜玩具玩,既没有真正解决大家的刚需,我们也没赚到钱。这也是我们放弃部署满血版B站声音复刻的核心原因——我实在不想看到,我们砸了大量人力物力把满血版功能做出来端上桌,最后却没人来用。难过是小事,钱白烧了、开发同学的心血白费了,才是最可惜的。也是在团队小伙伴的劝说下,我才下定决心换个方向。

第二个原因,来自我自己的刚需。众所周知,我本身不会打字,平时哪怕用电脑写文档,都得先用手机上的讯飞输入法语音转文字,再发到电脑上粘贴,办公的时候没少被人调侃:“你都用电脑了还不会打字?还用手机写文档,干脆直接用手机得了。”好吧,他们说的也没错。中途我也试过不少电脑端的语音输入法:比如之多云,它的无障碍适配做得特别好,按一下左Ctrl就能呼出语音输入,体验非常丝滑,但它的语音识别实在一言难尽——我们扒了一下代码,它用的居然还是10年前讯飞提供的识别引擎,效果还不如手机端的讯飞输入法。后来我也试了豆包电脑端的语音输入,识别准确率确实没话说,但无障碍适配做得特别拉胯,识别出来的内容得先复制到剪贴板,我才能手动粘贴到输入框里,完全没法用。既然豆包的语音识别模型这么能打,那不如我们自己来做一款好用的。

第三个原因,是我观察到的行业现状。像保益悦听、争渡读屏、天坦读屏这些主流的读屏厂商,就算做AI语音输入法,也全都是针对手机端的,电脑端几乎被他们彻底放弃了。可能在他们,甚至很多盲圈电脑用户的认知里:你都能用上电脑了,肯定会打字啊,还要什么语音输入法?用语音输入的都是不会打字的新手,不会打字你用什么电脑?但我偏不信这个理,既然没人愿意做,那我们就来打破这个僵局,自己做。

这款输入法名字就叫「阿飞输入法」,核心用的是豆包语音识别大模型,开发框架选用.NET,是Windows桌面端应用程序,不是系统级输入法,不会和大家现有的输入法、读屏软件起冲突。

给大家说一下最简单的使用流程:你只要打开阿飞输入法,软件就会自动挂在后台运行;需要打字的时候,长按左Ctrl键开始录音说话,说完松开Ctrl键就会停止录音,后端会把你的音频传给豆包语音识别模型处理,识别完成后,文本会自动插入到你当前光标停留的输入框里。说了这么多可能大家觉得复杂,总结成一句话就是:它的使用逻辑和之多云一模一样,上手零门槛。

至于大家最关心的收费问题,我们直接沿用飞言TTS的计费模式,服务配额体系和用户体系,和飞言TTS完全打通。也就是说,你只要是飞言TTS的用户,就能直接用阿飞输入法,每一次语音识别都会扣除对应的飞言TTS服务配额;配额用完了,直接在飞言TTS平台购买就能继续用,不用额外注册、额外付费,非常方便。

这个项目今天才正式立项,整体开发成本预计1500元,预计会在2026年暑假和大家正式见面。

共 35 条评论
0 
我也想要手机版啊,没有会员,没有天坛会员,然后飞檐tts那边还有1000多配额呢,1000多还是多少来着,都是活动送的,还有点浪费,然后我没电脑,想要手机版的。手机版豆包输入法无障碍太差,天坦输入法又没有会员,所以求手机版的这个输入法
0 

能打盲文键盘的吗?

0 
我也不知道啊,楼主还没回我呢,只要能用上豆包输入法的语音输入就行
0 

要是能用盲文输入的话,我那我要一个吧。

阿飞哥 [楼主] 3天前
0 

不是说了吗?我这个项目是纯语音输入法。盲文输入法我们也想做啊,但可惜没有现成的框架给我们用,我们不可能从头开始做吧。

0 
1066 服务配额,不知道这么点玩意儿可以用多久
Sleep 3天前
0 

你还是开发课程吧。

云亭 3天前
0 
价格高不高?不高的话值得搞一搞。当然,说我用的是智慧人生的语音输入接口。这个接口也不差。如果你这个计费没有智慧人生的高,或者跟那个差不多,我就换你这个用了。毕竟豆包还是要比智慧人生用的讯飞准一点。这个是毋庸置疑的。我用智慧的云输入法,每年是100元。
阿飞哥 [楼主] 3天前
0 

具体的费用的话,到时候得等我们把产品端上桌,我们才能定啊,不过肯定会比智慧人生便宜,不过现在嘛,我自己连成品我都还没摸到呢。

云亭 3天前
0 
那可以啊,你们加油。豆包的这个接口肯定要比智慧人生的好用。
0 
大伙看看就好,当然不是喷楼主,调用豆包大模型接口语音你知道开销得多少吗?想的太简单了,建议楼主先去了解一下收费规则在说开发输入法的事情
云亭 3天前
0 
现在用的是智慧人生的语音输入。我开他的会员,大部分的用处也在这里吧。因为咱跟楼主一样也是一个打字比较慢的人。语音输入是主要,其他的是附带哈哈。所以楼主的这个语音输入法如果好用且计费跟智慧差不多,我可以考虑换这个的。
云亭 3天前
0 
智慧人生的语音输入法在会员期内都是可以免费用的,这个是挺好,一年100。有资源库,也有语音输入,还有其他一些小功能。
落雪 3天前
0 
啊,智慧人生的语音输入要会员吗?本来说要用它的,要开会员那还是算了。嗯。主要是好像也不怎么用它
落雪 3天前
0 
就只需要用语音输入,别的功能可能暂时是用不到的,怕到时候会员在那里浪费了
阿飞哥 [楼主] 3天前
0 

毕竟智慧人生它是一个综合性软件,语音输入只是它的一个附加功能。

落雪 3天前
0 
好吧
云亭 3天前
0 
要。能打字最好,但是我虽然喜欢打字,但也不习惯打字,咋说呢?一种很奇怪的感觉,嘿嘿。我喜欢打字这种感觉,但是因为效率太慢,所以又不喜欢。是不是很纠结?所以只要不急,我手打。要是急的话,我还是会用语音输入。可以用智慧的语音输入,如果不开会员,你也可以用微信的。其实微信的语音输入现在也不错。所以楼主的这个市场感觉很小。同类的产品太多。智慧输入法本身就挺好用的,微信也有微信语音输入,也很好用。
落雪 3天前
0 
我打字不太熟练,然后一般给别人回信息都不太习惯打字,虽然不熟练就得多练,但是就是不太想打字,所以一般就用知多云的语音输入。然后那个微信的语音输入,快捷键是什么呀?应该不用下载别的软件,直接就可以用吧
云亭 3天前
0 
多云的就算了吧。十年前的接口了,太老。也可以用微信。把微信更新一下。更新到最新版微信应该是Ctrl Windows,你如果没有把这个快捷键改掉的话。
落雪 3天前
0 
Ok,那我到时候把微信更新一下,他最新版的微信应该没啥无障碍的问题吧,没有的话我就更新了
云亭 3天前
0 
嘿嘿,有问题是有问题,就看你能不能遇到了,哈哈。啥问题你看我之前发的过吐槽贴。
云亭 3天前
0 
是。
落雪 3天前
0 
那这对于我来说应该也没事吧,因为我一般都是把微信挂在后台就是一打开电脑登微信,登完了之后就去干别的事,比如说去玩游戏,然后需要的时候从后台打开微信
云亭 3天前
0 
这倒无所谓。别把窗口掉了就行。
0 
这个好像不是问题,你去通知那里展开,在这里找到微信回车进去看看。桌面上图标重新打开,它打开的是一个全新的窗口。
0 
它现在跟QQ那个一个逻辑,真搞不懂腾讯想搞什么。但是有一个好处,好像能多个微信账号同时在电脑上登录和切换。
落雪 3天前
0 
Ok,别的应该就没啥问题了吧,那我明天更新去
云亭 3天前
0 
微信的语音输入法跟争渡的起始点是冲突的。所以我把它关了。微信的是Ctrl加Windows。争渡设置其指点的是Ctrl Windows加四六。
0 
即使真做出来了估计也长久不了,用户一多根本扛不住,如果你通过别的方式买配额这种的收费太贵,就没人用了,收费便宜扛不住,当然你是土豪那就当我没说,我没有想喷楼主或者吵架的意思,我说的是事实
好奇怪,也挺离谱的,电脑的语音输入竟然要收费!咱们在手机上用的,无论是天坦读屏,还是其他的,都是免费的
0 
挺好的
0 

其实,手机版更有市场

阿飞哥 [楼主] 3天前
0 

手机版开发难度也更大。毕竟手机端我们得面对一堆厂商魔改过的安卓系统。电脑端就不用担心这个烦恼了,只需把它挂在后台,让他监听ctrl键有没有被触发就可以了。

添加一条新评论

登录后可以发表评论 去登录