10 音乐小屋 9个月前 689次点击
科技助残、AI赋能,信息无障碍的时代真正开启,美好的事情刚刚发生!
2023年,是人工智能突飞猛进的一年。这一年,国内外人工智能技术如雨后春笋般蜂拥而至,这是令人振奋的技术爆炸,也是信息无障碍的春天。点明软件在过去的一年高度关注人工智能的技术发展,并不断尝试从中寻找到能够赋能于视障者的技术方案,而今天,我们迎来了这一成果的第一次交付。本次升级,新增的视觉对话、图像识别、图标识别、滑块验证码和点选验证码的自动操作,均建立在强大的人工智能基础之上,相信一定能给您带来相对于以往判若云泥的使用体验。
下面是具体升级日志:
点明安卓
1、文字图像识别,新增视觉对话。基于讯飞星火认知大模型,可完成图像理解和基于图像初次理解结果的再次追问;
您可以从点明安卓的文字图像识别菜单中,选择焦点视觉对话或全屏视觉对话。选择焦点视觉对话,将针对当前焦点的图像内容进行识别理解,全屏视觉对话,则将截取整个屏幕进行识别理解;
视觉对话可以用生动全面的自然语言为您详细的描述图片信息,在识别界面,您还可以选择点击继续追问,向大模型追问图片中的细节。同时,点击历史对话,还可以基于之前的识别结果进行提问;
焦点和全屏视觉对话,由于星火认知大模型需要向讯飞购买,为避免被滥用,每日均各提供50次的免费使用,普通使用应该完全足够,超过将按次数收取点币;
2、文字图像识别,新增图像描述功能。图像描述,是点明自行搭建、自行训练的AI识别大模型技术,可以完成对一张图片的概要描述,可以用简洁的自然语言,用一句话为您描述图片中的内容;
您可以选择焦点图像描述和全屏图像描述,焦点图像描述将为您描述当前焦点的图片内容,而全屏图像描述,则将截取当前整个屏幕进行识别并描述;
您还可以打开自动图像描述,在遇到图片时,将自动识别,自动描述图片中的内容;
3、文字图像识别,新增图标识别。图标识别,用于识别部分应用没有文字描述的控件信息,例如我们经常碰到的按钮xx等。基于图标描述的功能,这些应用将在易用性上得到极大程度的提升,您再不用因为找不到第三方软件上的某个按钮而发愁;
您可以选择手动图标识别或自动图标识别。当您打开自动图标识别后,在遇到这类控件时,软件将自动为您尝试识别并读出;
图标识别也是点明自行搭建、自行训练的AI识别大模型技术,目前我们已经针对各种场景下的不同类型、不同形状,不同位置的图标数据进行了多伦训练,但可能还是存在部分应用自定义的特殊图标没有学习到,或者学习的不是非常精准,后续我们会不断学习、训练更多的图标。如果遇到不识别的图标,也可以通过手动焦点图像描述,进行图标形状的一句话描述,供操作参考。
图像描述和图标识别,由于是自行训练,公司承担了所有的费用,目前对大家完全免费,没有使用次数限制,后续根据使用成本压力,可能会适当考虑收取一定的费用;
4、文字图像识别,新增滑块验证码自动操作。基于人工智能的通用解决方案,无需特意适配某个应用,在验证码界面,直接从文字图像识别菜单选择滑块验证码识别即可自动完成操作;
5、文字图像识别,新增点选验证码自动操作。在点选验证码界面,经常会碰到选择某类特定图片的情况,例如,请选择带有自行车的图片。现在,您可以从文字图像识别菜单中选择点选验证码识别,即可自动帮您完成点击;
部分应用的滑块验证和点选验证可能会是一个非常复杂的界面,举个例子,有一些滑块和滑块背景几乎是同色,即隐藏的很深,肉眼有的时候都无法轻易找到,这样的滑块可能不一定能操作成功,大家可以尝试多刷新,我们也会不断优化滑块的识别技术;
滑块和点选验证码识别,每日各有50次的免费使用次数,我们认为正常使用应该完全充足,超过将会有使用限制提示,主要考虑避免一些恶意操作行为;
6、识别设置/查看识别记录下,新增保存手动图像描述识别结果、保存焦点视觉对话识别结果、保存全屏视觉对话识别结果开关,开启后,您的上树识别结果都可以到对应的识别记录中查看;
7、识别设置下,新增自动识别结果提示选项,可选择使用音效、振动等交互提示;
8、识别设置下,新增更新滑块验证数据,用于手动同步更新服务端适配的更多滑块验证码数据;
9、增加更多 emoji 表情的朗读;
10、点明设置/点明账号/会员中心/点明看看下,新增余额转点币入口,使用余额转点币,可将原识别充值剩余余额转换为相同价值的点币;
自该版本起,基于识别服务的支付(原图片验证码识别和百度文字识别)都将以点币进行结算,焦点和全屏视觉对话每日各有50次的免费使用次数,点明看看的讯飞星火认知每日有50次的免费使用次数,超过每日的次数限制,可以通过点币支付继续使用,一次使用为5个点币。
11、点明设置-读屏设置-提示设置-音效主题-主题商店,新增加了"重剑无锋"和"气泡之声",两个主题音效,供大家免费下载使用,这个也是头脑风暴小组团队为大家送上的一份新年贺礼,我们已经上传商店,大家可以直接下载使用
12、由于微信支付引入了更高级别的安全机制,因此暂时移除快捷设置/自动输入密码设置下,微信支付密码功能;
13、提升读屏响应速度以及更多其他细节优化;
点明看看:
1、看图说话,新增讯飞星火认知引擎。使用该引擎,可以用自然、生动的语言和全面的角度描述手动拍摄或从图库中选择的图片。同时,支持对所描述的图片进行追问;
2、看图说话,新增一句话描述引擎,使用该引擎,将以一句话的形式,用简洁的自然语言描述图片中的内容;
3、看图说话,新增保存一句话描述引擎识别结果和保存讯飞星火认知识别结果开关,开启后,可从对应的识别记录中查看过去的识别记录;
点明输入法:
1、优化语音输入,解决快速语音输入时,提示未找到匹配结果和未检测到声音的问题;
2、解决语音输入启动延迟问题;
3、大幅度优化语音输入准确度;
4、调整语音输入标点模式,新增智能标点、无标点、句末无标点、空格替代选项;
AI新纪元,美好的事情刚刚发生。相信在科学技术的不断发展中,在各信息无障碍团队的不断探索下,视障者的生活一定会越来越丰富多彩,越来越美好。
南京点明软件科技有限公司
2024年1月23日 编辑框。但愿咱们小猫才能搞一个自己的模型吧,唉
我都说了嘛,今天是闲聊,无事的时候看看别的公司的公告
我去这个牛逼。尤其这个识别对话。真的很哇塞。
天坦赶紧上啊,不然没有动力开会员
视频对话Be My Eyes也可以
这样对比的话,点明是多了一个图像继续追问的功能。但是点名那边每天50次的次数限制,天坦这边似乎是没有次数的限制。另外天坦这边的那个一句话描述图片,估计也是跟点名说的一样,是自己训练的人工模型。
我们早就用上了,我自从更新了点名软件早就用上了你才发现。
这个是上个月的大版本升级日志。
他那个是绝对化是挺好用的。好像用的是讯飞星火的接口。那天我听发布会。这个功能在讯飞星火的APP里识别效果是一样的。
希望我们天坦这边也引用大模型接口
不是早就引入了吗
话说公司可以真的考虑一下这个图片追问的功能。
其实这个可以考虑和语音助手合在一起。直接引用讯飞的接口。既能做到图片描述,还能做到日常使用。就类似于心智助手。 他们的小智不就用的是chat gpt的接口吗。
我觉得点名的这个除了他那个图片继续追问的那个功能,剩下其他的就是模仿的感觉这么强烈呢。比如说一句话,图片图标识别什么的,给我一种模仿的感觉。
首先我们小毛毯第一必须要训练自己的接口第二,我说的训练自己的借口也就是说训练自己的ai模型,如果是不能训练自己的ai模型,那有一个方法花钱花钱去更其他的ai模型比如百度讯飞,我个人建议是讯飞讯飞毕竟是生活学习办公用的百度它只是娱乐文本处理,对话生成用的。如果是自己的话,那就只有自己好好训练。然后第三你说的语音助手。问题那小茅台又只能自己开发一个语音助手识别引擎可以用第三方的,也可以用他们自己的,但是语音助手能力要么你自己训练自己添加,要么你就又花钱。去买别人的权限像什么?点名他们就是自己发的,然后语音助手的话可以去买买别人的,比如说百度的或者讯飞的或者谁都行,如果是自己研发的要资源的可以去跟相关平台买合作,比如说音乐qq音乐,酷狗音乐,酷我音乐新闻,百度新闻今日头条,人民日报这些,反正资源自己搞自己搞,语音助手就是去跟别人合作谈资源,如果是第3方,那就是买买别人的资源,反正必须要。这两个你体重必须要达到一个才可以
所以这个语音助手有点难。但是一种提问识别的可以考虑引用讯飞的接口。话说公司有这财力吗。我个人认为这个图片追问的功能还是挺实用的。毕竟用图片识别,它总会有些问题。但是这个图片追问。多问几次就可以了。光图片识别的话,想要准确度更高,你得多识别几次。所以隔壁的这个图片追问功能还是挺实用的。建议官方可以考虑一下引用讯飞的接口。培训一个属于自己的ai大模型,有点麻烦。又耗时又耗精力。就看官方有没有这个兴趣了。建议是官方可以考虑一下。毕竟我们现在是开了会员的提点,意见也没问题。
至于资金不够。我也说的。可以把类似的功能列入会员。当时如果还是不够。那就提高会员价格,这部分资金由我们消费者自己承担呀。官方可以少出一点这样不就好了。那有人又会说这个功能就算开出来了,把会员价格提高了,有些人用不着开,那个会员也没必要。可以考虑把这个功能跟之前的所有功能一样独立出来。每次使用都扣除一点积分吧。
总而言之,就按照我说的两个方法第一要么自己训练第二去跟第三方的合作买他们的权限,买就要考虑资金的问题,还有语音助手也是如果是第三方的语音助手,也要买权限,如果是自己的语音助手还要跟资源平台第三方的资源平台合作,就比如说音乐方面新闻方面。等等
反正一个耗时间,一个耗资金。耗资金的话,资金可以让我们自己承担。至于说耗时间的事情,我们办不到。
走了去用隔壁的去帮你们试试水
我觉得吧,都可以
这个就得看官方怎么想的。
我觉得你上面的那个建议不错,就是说还是把它列入会员功能,然后不开会员的话,花积分使用,我觉得你这个想法挺不错的这样不仅兼顾了会员用户,对普通用户来说也是比较友好的。但是我觉得可能官方如果能做的话,可能时间也会比较慢。你有没有发现一个这样的情况?就是说只要是免费的功能,天坦出的都特别快,但是一涉及到付费的这个功能的话,一般情况下推出都比较慢。感觉来说好像是官方想让咱们用的便宜,所以在不停的拉锯。所以我觉得如果能做的话,可能也得挺长时间了。
慢不慢无所谓。主要是看官方有没有想法。
应该是会做的,你没看,只要是别人家有的功能,天坦都会跟进吗?只是说出的速度可能会慢一些。就像那个图片描述什么的。
然后我记着你上面好像说就是是你说还是别人说就是开了会员以后,现在能用的会员功能比较少。我现在也感觉比较少。自从百宝箱的几个功能,让社区的一些人才给弄报废了以后,我觉得会员的特权确实少了很多。但是官方说把白宝箱拿回去推岛重座了,我觉得可以期待一下,说不定可以上线很多比较好的功能,到时候会员就应该能体现出它的价值了。
那几个功能我都不用的,随便他怎么玩,上传文件我都是用的是百度网盘或者是迅雷,就这两个云盘我都不会管的
话说哪些功能被社区人才给玩废了,我还忘了
对呀。超级会员的权限确实很少。哎,其实倒是官方可以考虑把百宝箱也并入到天坦*里面。我不是说把他们两个软件合并。就是说可以给百宝箱弄一个积分制度。然后积分跟天坦*的共用。这样需要的充会员,不需要的可以用积分。
对了,我去跟你们试的谁点名的自动图标识别不怎么滴,除了他那个图像识别对话好用一点以后其他的都不怎么滴,真的是图个识别乱识别你*的。把拨号的图标识别成了什么扬声器,然后呢,把扬声器那个图标声音又识别成了聊天,然后最好的是把更多按钮都识别成了分享,然后把分享的事变成了其他的,反正是根本很难符合,哎呀,我的天呐,真的好老火识别的,只能说少数能识别绝大多数复杂的根本就不能识别,还不如咱们小毛毯好用,真的是唉
确实我早应该就不花15块钱的原价去买那个死会员,气死我了。还好,只是买一个月还不算亏
不然总感觉现在的会员说实话有点不太值。官方多上一点付费功能。这样用的会员也就值一点。
你总说现在的会员相对来说不太值,但是你有没有看他那个更新日志,他那个限次数超过次数需要另外花钱,但是咱这个不需要。就是说他那个图片功能好像都需要另外花钱,超过多少次以后。看那个更新日志好像是开完会员也需要。另外花钱。但是咱们这个除了那个超级鹰验证码,好像全是免费的。开完会员以后。
但他那个限制是一天50次呀。基本上等于没有。你总不能一天要识别50多次吧。
倒也是,但是我感觉他这优点就是他那个滑块和图形验证做的好像挺好,比天坦这边要稍微好一些。就像qq那个登录,如果用天坦的话,还得先用屏幕探测识别一下,然后再去浏览,再选中。但是他那个好像直接就能过,我觉得这个要比天坦要简便。但是缺点就是他那个太贵了。对于我来说有点用不起呀。可能有人会喷我说他那个不是有买断枝的吗?问题是如果在买断的这段时间,你手机坏了,挪机的话,还得另外花钱。天坦的好处就是你挪手机不用另外给他钱。而且可能天坦不增加,这个是有原因的,因为资金可能不够。你有查过他们两个公司的公开资料吗。点名的注册资金在100万左右。天坦的话,我没记太清楚,好像是100000,所以说你觉得点明的收入还做的挺丧心命狂的,所以他能花起钱,天坦不一定能花起钱。
你买账号版的就行了,现在有帐号版
我就是很好奇,当年点名做宣传的时候,说他们老板是农民起家,然后怎么怎么苦,怎么怎么苦的。我就在想,一个农民竟然能掏出100万来注册个公司,这个农民到底有多有钱?他是正经农民不。
我想说的是他这次软件升级之后比以前更难用了我就在想要不要放弃她们这个软件当然我说的是点明
别放弃,这可是创新的一大步卖了就跟咱们小猫谈一样,要学会适应,如果你是一个软件的忠实用户的话,确实要适应,除非是要么他不良心的不听用户的心声的,要么就是没有什么创新之类的,那是可以放弃,只是说个人确实现在都是这样的,我指的是第三方的软件或者是其他方面的产品
点明这是升级还做了一个新的输入法,还是可以的。最主要就是有一个追问功能,这个呢比较实用,每天限制50次呢,正常使用也用不了那么多。但是它的图标识别功能不行,不如天坦。估计后期会优化和升级,还有它的输指尖输入法没有轴线性马达震动的支持。总的来说,点明肯定还是做了这么长时间有积累。但是在第三方*上,确实不如天坦。我个人感觉我使用天坦保益和点名在第三方软件的支持上,天坦算是最好的。反正大家都继续加油吧,谁的性价比高?这个对于咱们盲人用户群体来讲,就选择谁不过呢有条件的都一样,买一个都支持一下都可以好好好。
讯飞星火我正在用呢。哈哈。
这个早就有了,你才发出来