飞言TTS:好用,才是设计的核心

6 飞言TTS 3天前 164次点击


在飞言TTS,设计不止是“看着怎样”和“感觉怎样”,更是“用起来怎样”。这个理念从飞言TTS诞生之初,就驱使着我们一定要做出符合盲人朋友使用习惯的操作方案。

苹果认为设计不只是让产品视觉美观、触感舒适,更重要的是实际使用时的流畅与便捷,核心是把“好用”作为设计的根本。飞言TTS也深受这一理念的影响,在开发过程中,我们始终觉得设计不该只追求网页的视觉观感,更关键的是让盲人朋友用得顺手。从项目启动开始,我们就抱着这个初衷,一定要打造出盲人能轻松接受、顺畅操作的使用方式。

选择表单式设计,正是因为它的交互逻辑高度契合盲人用户的操作习惯。我们为盲人朋友设置了F1、F2、F3、F4以及Alt+Z五个快捷键:盲人试听音色时,无需用Tab键逐个查找试听按钮,按下F1就能直接播放对应音色的试听音频;按F3可一键前往用户中心,按F2则快速回到语音合成页面。这样设计的原因很简单,网页的选项卡位于屏幕下方,而盲人操作网页大多依赖光标键、Tab键或Shift+Tab键反向切换,这两个快捷键能让他们跳过繁琐的切换步骤,直接抵达目标功能区。

即便页面视觉上看起来简洁,所有信息都按逻辑有序排布,盲人用户通过上下光标就能浏览内容,按下回车键即可完成选中。面对复选框和单选框,盲人只需按空格键就能完成选择;遇到“请选择语音合成项目”“请选择音色”这类组合框,正常人会用鼠标点开后通过滚轮选择,而盲人则能通过上下光标键移动,听到对应的音色名称时便默认选中,可直接进行语音合成操作。

除了快捷键,我们还为读屏软件传递了丰富的参数信息。比如语音合成时,页面会展示动画,我们同时添加文字标识,读屏软件会实时播报“语音合成正在进行中”;合成完成后会弹出弹窗提示,盲人按F4就能播放音频,播放结束后读屏软件还会播报“音频播放完成”的反馈。

为了让操作更有感知,我们还加入了听觉反馈:盲人按F2或F3切换页面时,会听到翻书的音效。对盲人来说,即便页面切换没有延迟,没有反馈也会让他们不确定操作是否生效,而音效能让他们立刻确认页面已完成切换。至于F1试听音色不加音效,是因为按下后会直接播放音频,额外的音效反而画蛇添足。

在文本框设计上,我们也加入了不少细节:“请输入提示词”的输入框会附带示例提示,比如“你能模仿粤语的口音吗”,帮助盲人用户理解输入要求;音频播放状态也会通过按钮元素传递给读屏软件,让盲人能实时知晓播放进度。

其实做无障碍设计并不难,苹果能做到,我们这些草根团队也能做到。核心是无障碍适配远没有芯片、操作系统研发那么高深复杂,它考验的从来都是开发者和产品经理够不够用心,能不能站在盲人的角度思考问题。

有些明眼人开发者总觉得无障碍适配很难,说到底只是没把视角切换到盲人这边。国内不少开发者图省事,用一张图片应付所有元素,或是为了视觉美观设计复杂特效——比如部分手机运营商的活动页面全是图片、领取福利时弹出礼花特效,这些设计让正常人看着满意,对盲人来说却是使用灾难,读屏软件根本无法识别这些视觉元素。

无障碍从来不是科技产品的附加题,而是面向所有用户的必答题。它不需要多么尖端的技术,只需要开发者多一份耐心,多一次换位思考:少用一张应付事的图片,多写一行适配读屏的代码;少追求一个华而不实的视觉特效,多做一个能被盲人感知的交互反馈。苹果的设计理念告诉我们,好的产品终究要回归“好用”本身,而对盲人用户来说,这份“好用”就是能平等地触达科技的温度。我始终相信,只要越来越多的开发者愿意放下偷懒的念头,把无障碍做到实处,科技的便利就不会再成为某一群体的“专属福利”,而是能真正抵达每一个人的手中。

点击这里前往。飞言 TTS

如有问题或建议加入官方QQ群,和我们取得联系。664504747

阿飞语音合成官方微信群二维码。

福利大放送。在飞言 TTS,用户中心,兑换码充值,输入,该兑换码即可领取300服务配额的积分,能复刻6个音色。

兑换码。afei-tts.

共 3 条评论
小葡萄 2天前
0 

我还以为是语音库呢

飞言TTS [楼主] 2天前
0 

是声音克隆,不是语音库。

添加一条新评论

登录后可以发表评论 去登录