来说一项更先进的功能,希望天坦读屏可以增加

7 平安 3天前 413次点击

天坦读屏,能不能实现更先进的功能,比如说无障碍的视频旁白,也就是说,我想看一部电影或者是电视剧,在播放过程中,我可以把它打开,这样的话,可以描述视频中的场景

共 19 条评论
视频描述,别的应用已经有了 就比如那个啥子工具箱,你可以去那里看一下
0 
落寞工具箱。还有那个什么通义。
以后应该会出单这两年应该大概可能不会
读屏要是接入AI,那应该大概可能会简单一些吧
0 
目前保育阅听有,其他的没听说过。但是他目前只能识别40秒以内的视频好像。
平安 [楼主] 3天前
0 

保益乐听,那个需要上传,我说的是可以对接模型引擎,再用手势或者是边缘菜单打开这项开关,这样的话,不管是看电影还是看电视剧,尤其是,一个背景音乐的视频,视频中没有说话的声音,就可以读出视频中的所有场景,就像视频字幕一样

你这个想法以现在这个技术想要实现的话,应该是比较困难,因为。首先。手机要把识别到的场景上传给服务器,然后服务器识别完了上传回来结果。这就造成了一个时间差,它会有延迟。所以,如果你想做到实时描述,那是不可能的。现在能做到的就是。你把整个一个大视频文件打包上传给服务器,服务器识别完了,把结果和视频一起传回来给你。
0 

那现在有这样的模型吗?你让天坦去哪里给你对接去?

0 
首先你的处理器的运算能力不够。
0 
的机器再快也没有人类的大脑这么快。
0 
人类的大脑是一个低功耗不发热。反应速度快。目前的机器还模仿不了。
小心 3天前
0 
你做梦呢你目前的视频描述必须得上传一段视频再进行。那个帧率分析才可描述啊,你以为一打开画面就可以实时帮你描述啊,你想得美。目前市面上的AI模型是做不到的,再加上目前的AI模型,它上传一段视频的时候,你知道要花费多少钱吗?4~5块呀,你以为这个公司出的起吗?如果你想实时画面描述的话,那你最起码也得要等到10年或者20年后再说。
0 
那跟识别字幕就不是一个难度的东西。识别字母本质上就是文字识别,这个现在是可以直接在本地进行的,并且反应速度和效果都还不错。至于描述场景这个,在线进行吧,那巨大的延迟估计你也不愿意。例如你执行了手势,要让读屏进行场景识别,结果过了半分钟,你想要的描述才姗姗来迟,关键他跟你描述的还是半分钟之前的事情,这种的想来你也不愿意吧。要是本地进行的话,拜托,你还是饶了你的手机吧。
0 

点名的和宝玉的上传视频的话都是要收费的。

平安 [楼主] 3天前
0 

看来这个只能在等十几年了,如果这项功能可以出来,就可以边播放边朗读了,就像无障碍版西游记一样

0 
即使能做出来,效果那肯定是不理想的,因为延迟太大。延迟太大的话,还不如不要。
0 

Netflix上很多电视剧早就自带音频描述了,你要是用新加坡或者台湾区这种华人比较多的地区,还有专门的普通话描述分区

0 

目前做不到,以后没准儿有可能实现。就比如现在的AI图片描述,在前些年想来是多稀罕的事物啊,如今不是也都普及了。

huanghang 2天前
0 
其实也有跟通易类似的免费的软件,而且好像描述的时长不限,既可以描述视频,也可以描述图片。这个软件是国外的好像叫PiccyBot
添加一条新评论

登录后可以发表评论 去登录