6 青青子衿 7小时前 220次点击
所有的测试都是没有开深度思考模式下测试的我问了他,豆包和千问同一个问题,就是极乐净土的日文歌曲,中文翻译的歌词是什么豆包告诉我二个版,第一个版本蛮押韵的,但是我质疑它是不是?它说不是。然后它告诉我真正的歌,日文歌词版本是什么。然后我听了之后感觉又不对,我说你到底去,是不是缺点?它说它说还是它它承认它是瞎编的。然后呢我就跑到千问,去问千 请问请问回答了我一两个版本一个版本,他的,前文说是日语直译版本,最接近日语本意。然后一个是意义版本,是中文重新填词的押韵版本从这二个回答来看,我觉得还是千问比较靠谱1点,至少它的回答答案让我很难发现其中的破绽。而豆包的那个破绽太大了,我一听就知道不对,所以我才我才询问它,你是不是确定这个答案是正确的同样是我我对 AI 的反问,豆包立刻就回复,他说承认自己是瞎说的。然后呢说给我另一个答案,正确答案。然后我再次质疑,他又再次承认自己是胡胡编乱造的。然后呢我去质问那个千问千问这个 明确告诉我没有真正的中文版本的日语版本的歌曲,极乐净土的歌曲在网络上流传,全都是网友自己填重新填词的然后我我有质疑,我说我听听到过原唱声音版本的极乐净土中文歌词版本的歌曲。他说应该是其他的中国歌手翻唱的,不是原唱翻唱的。我对这个答案,虽然我没有去验证,我觉得应该是真的毕竟有些人的声音,歌手能力强可以模仿原来真正歌手的声音。所以我没有去,虽然我没有验证,但我觉得可信度很高。对比这两个 AI 的给我,最终给我的答案,我判断以后我询问问题,我还是多问问千问吧,至少正确率高1点
他是知道你在说啥,然后他再给你来,胡说八道,还瞎编乱造,让你自己都不知道,他说的对不对
对我们盲人来说,信息的准确性其实是更加重要的,对于豆包的聊天机制,我不反对,但是在准确性来说,差得很远很远,你如果开专家模式,也就只能回答那么十几二十条,后面就不行了,反正我是聊天就用豆包,如果是找信息的话,还是用千问吧,把准确性关键词多发几个过去,他就能很准确的帮你列出来
我现在也不用豆包来查别的东西,挺多听听他拍拍马屁,做个参考,玩个搞笑。哪怕开了深度思考,专家模型他都不一定准,越问越乱,越说他聊得越偏越对不上,对的几率很小,几乎也就那么一两次。
那你们有没有想过?如果问一些历史上的重大事件,比如说历史上某一场战争或某一个事件,咱们你们搞的都是些小事见,如果搞一些比较重大的事情来询问的话,只问过去的事不问现代的事,因为话题过于敏感小事情,他会胡说八道,如果是大事情呢,反正我是我是觉得他说大致上好像豆包没有什么胡说八道的,比如说某个历史上某个人物或者某个朝代某个时期之类的对比一下其他AI你们搞的,这都是些小事情,如果问一些大一点的事情,应该没那么错那么多呀,我是觉得我天天跟豆包聊天,就是聊历史既然一些小事情,他胡说八道,那那就讲一些历史重大事件,总不会胡说八道了吧反正我自己的,他们就胡说八道,基本上可以说十分有七分是真的