时隔近6个月时间,vivo看见迎来了又一次更新,主要带来语音说话打断和画面记忆回溯功能

12 今梦 23小时前 360次点击

Hello大家!

今天,vivo应用商店上线了vivo看见5.0.1.0版本。我来给大家介绍一下本次发现的更新点:

首先,第1个变化是在开启问答后增加了说话打断功能。以前在问答过程中,若想打断模型的回答,必须点击停止;现在模型在回答时,只需说话就能打断。但问题也很明显,在嘈杂环境中,旁边有人说话就可能导致误打断。希望这个难题在后续版本中能得到优化,目前我个人觉得体验不太好。当然,同类产品也面临类似问题,比如豆包。

另一个新功能是记忆回溯。具体来说,打开问答后,在提问前,直接拿着手机绕周围转一圈,然后提问,例如“你都看到了些什么”,模型就能自动解析刚才镜头经过的所有画面,并解释给我们听。从某种角度看,这能帮我们快速熟悉周围环境,无需反复转圈询问。更大的作用是帮我们找物品,比如找杯子,以前得挪动镜头多次询问,现在如果认为杯子在某个区域,只需将手机在该区域移动一圈,然后询问“有没有看到杯子”,模型会记住10秒钟内镜头经过的画面,并告知是否看到杯子。这个功能用途是这样,但好不好用、是否实用,还需要大家在实际使用中检验。也希望大家把体验结果反馈到评论区,帮助团队改进这一功能。

针对大家经常反馈的,识别准确度问题,本次更新了一个云测大模型功能,通过云端的模型来辅助,使画面的描述更加准确,大家可以在实践中体验云策大模型。

除此之外,还有一些bug修复。之前有伙伴反映,描述完画面后,若画面中有文字,会收到“检测到文本”的语音提示,朗读检测到的文本稍显冗余,很多伙伴在评论区留言希望替换。在本次版本中,这一建议得到落实,将检测到文本的语音提示换成了“叮咚”音效提示,让信息反馈更高效及时。

此外,还有语速的跟随优化。先前不少伙伴说,即便调用vivo自带语音库,也存在语速无法跟随三方读屏的情况。在该版本中,语速可以跟随三方读屏调节,但目前仍只能调用vivo自带语音库,无法换成第三方的。

这次还规范了设置语速和发音人选择列表的控件,去除了已选和未选的冗余提示。

还有一些细节变化,比如点击拍照按钮后,再点击左下角的查看按钮,上一版本会进入相册首页,而在该版本中点击照片可直接进入照片详情页。

感谢vivo的同学一直以来对信息无障碍的关注,也期待后续版本能给我们带来更多贴近生活的帮助。如果大家有更好的建议或使用问题,欢迎在评论区留言,我会转达给vivo的同学。

vivo看见详情页截图 图片

目前已上架小米应用商店和vivo应用商店,大家可以下载更新使用啦!

点击跳转VIVO应用商店下载VIVO看见
共 24 条评论
冰淇淋 23小时前
0 

哈哈,我抢到沙发的位置了,已经更新了,正在试玩VIVO的云大模型,感谢VIVO官方对无障碍的重视和作出的支持。

银河比邻星 23小时前
0 

顶帖支持

小星星 23小时前
0 
其实有一个问题我实在搞不懂,由于这个描述嘛,它只是一个图像抓取而已,对方说话的时候打断很正常,环境嘈杂的时候打断很正常,但是呢我发现在你们的想象中如果说话的时候,我说的时候他就打断环境,说的时候不会打断,请问这种技术如何去做到呢?我觉得100%不可能做到的。毕竟那里环境很嘈杂的时候,甭管你身边离你近的人也好,离你远的人也好,只要说几句话,打断是一个很正常的现象啊,谁叫它是一个图像抓取呀,包括豆包也是又不是真正的视频通话,如果是真人志愿者的话那就不一样了,但是你们这种要求我觉得太难实现了。自己说话的时候能打断周围环境,嘈杂的时候不希望打断,我觉得这是100%不可能的。所以我觉得这种想法是天方夜谭。毕竟你这个豆包也好,我看见也好,又不是真人视频通话。人家识别的时候不像你们想象的那样,哎,我说话的时候就可以打断周围环境嘈杂的时候就可以。不打断甚至有些人的想象太无语和丰富了,说什么啊?只要让豆包也好,小易看见也好,告诉我前面有啥啊,这个没问题。哎,突然来一句待会儿那个绿灯转红灯的时候可不可以告诉我可以走啦?然后转绿灯的时候,突然豆包给你来一句,好的,主人已经转绿灯了,现在可以放心的走啦,所以我倒想问大家一个问题,请问这两种技术该怎么去实现呢?毕竟它是一种图像采集,在你们的想象中希望可以实际在现实中是不可能的哦。
行色匆匆 22小时前
0 

现在已经有这个技术了。就是自己说话可以打断,别人说话就不行的那种技术。

空灵 22小时前
0 

应用商店这个vivo看见和手机自带的不是一个软件吧,我手机自带的软件版本好像是二点几的检查最新版本说已经是最新版本最新版本,然后我去应用商店下载了一个,好像没有显示升级,直接显示安装的

今梦 [楼主] 22小时前
0 
是一个软件,只不过自带的vivo软件需要跟随系统ota更新可能会比较慢,而应用商店的通用App迭代的比较快,也可以及时更新,不用跟着系统的ota走。
冰淇淋 22小时前
0 

啊,反馈一个问题啊。这个在实时问答当中,通过说话的方式打断,在红米TURBO4PRO这边不太好使。还是只能按一下打断按钮才可以。

今梦 [楼主] 22小时前
0 
不好意思呀,是我写的时候不够严谨,刚刚找产品经理确认了一下,目前该功能在vivo上是有的,但在其他手机上由于不同系统的优化差异,可能体验不是很好,所以暂且把语音说话打断功能下架了,后续。如果优化好了会重新上的。
冰淇淋 22小时前
0 

好的,谢谢

空灵 22小时前
0 

原来是这样,我也不太清楚,不过很纳闷的是,用微软桌面这个vivo看见的快捷方式,就是没办法创建的微软桌面上去

今梦 [楼主] 22小时前
0 
这个情况我反馈一下
海阔凭鱼跃 22小时前
0 

就是能不能把这个vivo看见的人像拍照给他优化一下,因为。什么呢?像我们用的华为手机,每次拍照的时候双击点点不动,就是在人像拍照的时候

海阔凭鱼跃 22小时前
0 

假如我想来一个自拍或者是给小孩拍一张照片,但是对焦了之后,点拍照双击总是点不动

今梦 [楼主] 22小时前
0 
可以说一下你的华为型号吗
海阔凭鱼跃 22小时前
0 

华为诺尔8鸿蒙系统4.2

0 
非常感谢楼主已经更新了内容
微风细雨 22小时前
0 
好的,马上更新
微风细雨 22小时前
0 
那个人像模式声音很小,那个有没有修复啊
今梦 [楼主] 8小时前
0 
可以更新看看呢
启明星辰 20小时前
0 

鹅鹅 第1次听到有人喊开发者为同学,太亲切了。

今梦 [楼主] 8小时前
0 
哈哈习惯了,一般就是称呼伙伴和同学。
空灵 9小时前
0 

哈哈,最新版本的vivo看见是可以在微软桌面创建快捷方式的,谢谢了

今梦 [楼主] 8小时前
0 
OK

语音打断功能,我这边没反应的,必须全部读完才能继续提问。我的是红米手机。反馈来源点名圈用户。胖葫芦只作为转发希望能反馈,谢谢。

添加一条新评论

登录后可以发表评论 去登录