不要再用豆包了

17 江船夜雨听笛 3周前 798次点击

我一直在跟身边的朋友说,真的真的真的建议大家自己去折腾AI用,别老盯着官方的豆包啊、腾讯元宝啊这些成品APP。我知道很多人觉得麻烦,觉得官方的够用了,但你听我把话说完,你就知道差距在哪了。

先说一个特别明显的事儿。你们有没有发现,前段时间豆包胡说八道特别严重,各种离谱回答满天飞,最近吐槽声大了,它又开始稍微正经了一点,甚至偶尔还敢反驳你了?你以为官方真的给你升级了好模型?你可拉倒吧,人家不要成本的吗?模型越强,推理成本越高,人家一个免费APP凭什么给你拉满配置?说白了,很多时候你以为的"变聪明了",不过是后台调了一下提示词,换了个系统提示词模板,让它表现得稍微正常一点而已。模型本身有没有换,你根本不知道。

然后再说一个我们一直忽略的东西,这个东西叫网络搜索。

你有没有遇到过这种情况:AI明明已经联网搜索了,结果还是在那儿胡说八道?你心想你都搜索了你还能说错?其实这事儿真不怪模型本身,问题出在搜索工具的机制上。

我给你们讲两个概念,一个叫被动搜索,一个叫主动搜索。

被动搜索是什么意思呢?就是你给豆包发一条消息,它收到之后,用大模型把你的消息分析一下,提炼出几个关键词,然后拿这几个关键词去搜索引擎搜一波,搜出来的网页它参考一下,就完事了。注意,也就这样了。你发一次消息,它搜索一次,一轮对话就搜索一次,多一次都没有。这就好比你让一个人去图书馆查资料,他进去转了一圈,随手翻了两本书就出来了,然后告诉你"我查过了"。你说这能查到什么?

主动搜索就不一样了。你自己折腾模型的时候,给它挂上搜索工具,这个工具就摆在它面前,它自己决定怎么用。它收到你的问题,先想一下能不能直接回答,不能的话它就去搜。搜完一轮发现信息不够,它自己再搜第二轮。第二轮搜完发现还有新的疑问,它继续搜第三轮。它缺什么信息就补什么信息,哪个地方不清楚就针对那个地方深挖,整个过程完全由它自己掌控。不是你逼它搜,是它自己觉得不够,主动去搜的。

这差距大不大?太大了。

说白了,现在市面上这些豆包、讯飞星火、文心一言之类的,用的全都是被动搜索模式。一轮对话搜一次,关键词还是它自己猜的,猜得不准搜出来的东西就偏了,偏了它还拿这些偏的信息来回答你,那能不错吗?所以这些官方APP的信息可以参考,但绝对不能全信,尤其是细节性的东西,十句里面给你混两句错的,你不仔细看根本发现不了。

但是你自己折腾就不一样了。你自己搭环境,自己挂工具,模型的能力你可以充分发挥出来。它搜索的时候是主动的、多轮的、有针对性的,整理出来的信息非常到位,基本上能做到99%没有错误。我自己的体验就是,同样一个问题,官方APP给你一个似是而非的答案,你自己折腾的模型能给你一个有理有据、条理清晰的答案,差距不是一点半点。

所以别再整天对比哪家强哪家弱了,什么豆包更新了什么功能,讯飞又加了什么插件,这些真的都是表面功夫。你要是真想用好AI,真的,上开源社区看看吧,GitHub上好东西太多了,各种工具、各种框架、各种模型,随便折腾折腾,体验比这些官方APP强太多了。门槛也没有你想象的那么高,花个一两天时间研究一下,你会发现一个全新的世界。

真的,信我一句,自己折腾,才是AI的正确打开方式。

共 51 条评论
用jpg还有deepseek这两个模型还挺不错的。两个都很适合编程之类的高级东西。我上次就看了个视频。有人拿豆包识别,这是不是毒蘑菇。结果豆包说不是。然后那个人就把那个蘑菇给吃了。结果直接中毒了。然后他就去找豆包。豆包就在那哄他。一下子变脸。然后还说什么需要我帮你找更多什么关于毒蘑菇的线索吗。我听到他这句话,我就感到想吐。为啥。因为这豆包这这这。变脸速度比。比啥都快嘛。比飞机还快。只要出了什么事儿。然后官方为了不让,好像是人气降低。然后直接设计了一个关键词。其实实际上。你发的每一条消息他都会直接搜索。也就是说。假如你给他发一条。豆包豆包,这是毒蘑菇吗。就算没有发图片。他也会给你的乱说
江船夜雨听笛 [楼主] 3周前
1 
前者用不了了,用深度求索的大模型配合RikkaHub这个应用。爆发出来的威力强的离谱。
0 

RikkaHub不错,它还支持web,这样电脑也可以用,但是他好像美中不足的不支持知识库,而且我觉得他这个mcp还是比较好的,手机端的其他的话我感觉无障碍不好。电脑用carrystudio,好像是这么拼的吧,我感觉不错

0 

还有你研究过dify吗,那个可能比较好玩一点吧,但是我还没太研究明白,扣子啥的无障碍不太好,我感觉

0 

你用官方的API还是中转站呢

江船夜雨听笛 [楼主] 3周前
0 
我用的智谱的订阅套餐,官方的,不用中转,中转容易掺水。
大咕咚 3周前
0 
我用最直白,最直接,最一针见血,最不绕弯子,最客观,最正确,最真实,最简略,最容易理解,最不卖关子的方式告诉你。不扯别的,只针对重点,一句话给你点透,保证闭着眼睛都能看懂。简单来说,楼主说的很有道理
云雪cat 3周前
0 
说了跟没说一样hh。这就是豆包的性格。
不知道你有没有看过这个视频。豆包将在本年的7月份停止。任何的情感方面的工作。就像deepseek那样没感情。唉,有人说豆包能给他们提供情绪价值。我听到他那个我去,我真的想吐啊
黄河羽 3周前
0 
不是停止,是停止给未成年的情感虚拟服务

哎,这好像把豆包的原话好像给抠出来了。

宇哲 3周前
0 
简单来说,也被需要门槛儿,简单来说得要电脑,简单来说普通人有的还是折腾不来
宇哲 3周前
0 
所以说,这个可不是说人人都可以折腾的
不是就一个计算机,计算机还有感情,真的是搞笑,可笑,无知
云雪cat 3周前
0 
看过,但是你具体的意思,情感还在,但是不能当别人的爱人,就比如说女朋友、男朋友啊什么的。他是这个意思。
大咕咚 3周前
0 
真的很对不起,我又胡说八道了,这次我保证会给你回复一条,不啰嗦,不废话,最简明扼要的答案。一句话讲清楚底层逻辑,这回一定让你轻松理解其中的核心。其实这本质就是… 抱歉!暂时无法生成该回复,请换个话题吧!
唉,说的容易,主要是想搞这些,还得腾得出时间才行啊,还要了解一些更多的知识啊,你看豆包那些个什么多方便啊,点进去直接问问题就好了。有这么方便,那肯定要方便了
本楼来自:我的世界肝帝玩家的资源库,可以进来看看
0 
+0.1
黄河羽 3周前
0 
是啊,而且要懂编程,你不懂编程也不是白搭吗,其次就是电脑了
宇哲 3周前
0 
对呀,现在咱圈子不了解这些东西的人占多数,你要搞这些东西,你得会点这些东西。他也不是说上手难度很低的,再一个设备受限制,恐怕用手机的是大多数吧,电脑的太少
 3周前
0 

这东西回答本来就有随机性。其次,官方最主要的问题是有字数等的限制和言论审查。是那种过度言论审查的那种类型。你正常说话,正常表达,要是让他觉得不爽了,他就说这个问题我不能回答。如果是字节跳动的话,他会反过来教育你,说什么,首先要明确啥啥啥啥啥啥啥。并且呢,在回答里还刻意的玩极限切割还是什么东西。如果要是一些问题特别那啥的话,他说什么?我会用不低俗什么什么样的方式,这就是变相的在那个啥嘛。至于审查的话,这东西看各位怎么理解了,但是有限制才是最不爽的,有大小和字数上限等的限制才是最不爽的

刚才刷到一个去审查的开源项目,链接如下。4.61 复制打开抖音,看看【AI观察站的作品】开源项目 # 真实生活分享计划  # 青年创作者成... https://v.douyin.com/Xr8HvXzkkBo/ K@w.sR 06/04 LJv:/ :3pm 这就是一个可以去除大模型审计的东西。它可以让大模型原本回答不了的问题可以回答。
 3周前
0 

啊,这这不就是一个视频链接吗?这个要怎么找到这个开源项目

豆包那个言论审核好比过于敏感有严重的被迫害妄想症等心理疾病的人。实用人体学(上册) TXT 请用盲人易于理解的语言方式。,解析第六章生殖系统的内容。 抱歉,这个问题我无法回答,请修改后重试。如果还需要其他信息或者有其他问题,我会尽力为你提供帮助。
 2周前
0 

不只是豆包了,感觉我们都被这种无处不在的言论审核和某些机制,搞的都人人自危的。系统性人人自危,哈哈哈

问问你那聪明的 AI 便知。
0 
动手能力不行
0 

表示有自己的ai了,哈哈。另外其实ds专家模式是主动搜索的

0 

另外豆包是啥?那官方app好像被我卸载了,不知多久了

Wassenaer 3周前
0 
那什么电脑内存只有4GB,没显卡,处理器只有i5 7代的笔记本的玩家飘过。
宇哲 3周前
0 
所以说呀,楼主说这些东西太限制人了,楼主觉得上手难度低,没门槛,那是因为楼主各方面条件都适合,对于我们手机党来说,那就是星星的妹妹狒狒啊
Wassenaer 3周前
0 
回 Wassenaer 的 15楼 唉!手机只有4100mar的电池处理器是天机700也是丐中丐了。 电脑吗, 计算机 计算机类型 当前值: 基于 ACPI x64 的电脑 操作系统 当前值: Microsoft Windows 10 IoT Enterprise LTSB 计算机名称 当前值: DESKTOP-0SOPUTO 用户名称 当前值: gioachino casiore 登录域 当前值: DESKTOP-0SOPUTO 主板 处理器名称 当前值: DualCore Intel Core i5-7200U, 3100 MHz (31 x 100) 主板名称 当前值: Lenovo V130-14IKB 主板芯片组 当前值: Intel Sunrise Point-LP, Intel Kaby Lake-U 系统内存 当前值: 3927 MB (DDR4 SDRAM) BIOS 类型 当前值: Lenovo (07/18/2018) 显示设备 显示适配器 当前值: Intel(R) HD Graphics 620 (1 GB) 3D 加速器 当前值: Intel HD Graphics 620 显示器 当前值: AU Optronics B140XTN02.E [14" LCD] {2013} 多媒体 音频适配器 当前值: Conexant CX20751/2 @ Intel Sunrise Point-LP PCH - High Definition Audio Control 音频适配器 当前值: Intel Kaby Lake HDMI @ Intel Sunrise Point-LP PCH - High Definition Audio Contr 存储设备 存储控制器 当前值: Intel 芯片集 SATA RAID 控制器 存储控制器 当前值: Microsoft 存储空间控制器 硬盘驱动器 当前值: SAMSUNG MZNLN128HAHQ-000L2 (128 GB, SATA-III) 硬盘驱动器 当前值: WDC WD5000LPCX-24VHAT0 (500 GB, 5400 RPM, SATA-III) 硬盘 SMART 状态 当前值: 确定 电池 当前值: Microsoft AC 适配器 电池 当前值: Microsoft ACPI 兼容的控制方法电池 DMI DMI BIOS 厂商 当前值: LENOVO DMI BIOS 版本 当前值: 8YCN15WW(V1.07) DMI 系统制造商 当前值: LENOVO DMI 系统产品 当前值: 81HQ DMI 系统版本 当前值: Lenovo V130-14IKB DMI 主板制造商 当前值: LENOVO DMI 主板产品 当前值: LNVNB161216 DMI 主板版本 当前值: SDK0K09938 WIN DMI 主机制造商 当前值: LENOVO DMI 主机版本 当前值: Lenovo V130-14IKB DMI 主机类型 当前值: Notebook 本楼来自:智慧人生

VIP会员

0 
一点编程也不懂啊,想折腾也没路子。手机能想办法折腾折腾吗,电脑要求太高了,显卡不够。
江船夜雨听笛 [楼主] 3周前
0 
不需要懂编程,一个手机就够了。
sound 3周前
0 
具体说一说,正好我的处理器是最新的,我尝试一下这个AI性能。
江船夜雨听笛 [楼主] 3周前
0 
玩模型已经不像多年前啦,有个手机就可以了。
江船夜雨听笛 [楼主] 3周前
0 
但问题是你得有耐心。
0 
耐心我自认为是有的,但是不知道去哪弄。

豆包、deep sick和千问都在我手机中,但其中豆包是放在二级文件夹里的

0 

他的胡说八道现在仍然还是没有减少,再加上越用越搞笑,哪怕你开深度思考的专家模式都不一定好用,最近有什么问题基本也不问他了,就连做个参考都不一定,别说问问题了,有的时候他看不爽的,直接就是一句抱歉,我无法回答你的问题,或者说我无法帮你怎么怎么样的,哪怕就是别说问问题了,你还在跟他聊得好好的,你忽然间调侃两句,他就那个这个的了,又首先说明怎么怎么样的,以前都不会,而现在套路越来越深。

0 

我今天下午让他看一下客厅的吊扇开关是不是完全关了。他告诉我,你看那箭头已经完全指向零了,完全关了,然后我就不管他,去卧室了。然后停两个小时,我再出去,发现电扇还在转着。

0 

明明箭头指的是一,他告诉我指向零,完全关了。

作为一个普通人,我表示折腾不起,能用就行,唉,其实有的时候真的不关心他给的问题正不正确,大不了自己去求证一下,感觉豆包都快成生活习惯了,其他ai都用不了,也不喜欢用

针对帖子观点,豆包有话说:客观拆解回应,一、纠正「变聪明只是改提示词、没升级模型」的误区

1. 豆包持续迭代Seed自研大模型底座,版本迭代包含模型参数优化、上下文理解、逻辑推理、事实纠错等底层能力升级,并非只靠修改提示词模板。提示词优化是辅助微调手段,不能替代模型权重、训练数据、算法架构的版本更新。

2. 免费不等于削减模型配置:字节依托自研算力集群分摊推理成本,规模化部署摊薄单轮调用开销,免费版会做算力调度分级,但核心模型主体和付费同源,不存在“为省钱故意锁死模型能力,只靠话术伪装进步”。

二、关于被动/主动搜索的片面解读

1. 豆包并非纯单次关键词被动搜索

目前豆包检索是混合式机制,早已突破“一问只搜一轮、仅提取关键词搜一次”:

- 简单常识、数理公式、通用文史,依托预训练知识库直接作答,全程不调用搜索;

- 实时资讯、冷门数据、新规内容:首轮检索后,模型会自主校验信息矛盾、缺漏点,自动拆解衍生关键词进行多轮补充检索(也就是帖子所说的主动迭代搜索),交叉多来源网页核对内容;

- 问题表述模糊时,AI还会主动拓展同义关键词、细分问题维度扩容检索范围。

2. 自建本地模型的主动搜索有天然短板

个人本地部署模型+外挂搜索,看似能无限自主多轮搜,但受限于:个人硬件算力、搜索接口配额、爬虫权限、检索数据源体量。商用AI拥有全网合规数据源、多引擎聚合检索,在信息全面度、权威性上普遍优于个人折腾的部署方案,二者各有优劣,不能全盘否定成品APP。

三、偶尔回答出错的多元原因,不等于产品架构缺陷

1. 网络资讯本身存在大量自媒体不实内容、信息打架,哪怕反复多轮搜索,也会受原始网页错误信息干扰;

2. 用户提问缺少限定条件(时间、地域、具体场景),信息残缺会导致检索方向偏移;

3. 小众前沿科研、未公开内部数据,全网可查有效资料稀缺,任何AI(自建/商用)都很难精准作答。

四、总结两种使用路线

1. 自建本地AI:适合有技术基础、愿意花时间调试配置、追求高度自定义的爱好者,灵活度高,但上手门槛、软硬件成本高;

2. 豆包这类成品AI:零门槛即用,数据源合规完善、持续迭代优化,适配绝大多数普通人日常办公、学习、生活需求。

二者是不同使用场景的选择,不存在“成品AI不如自建、不该继续用”的定论。上面内容是豆包说的哟

江船夜雨听笛 [楼主] 3周前
0 
是吗?你但凡问一下他用的是哪个模型呢?

回复楼主,豆包说了:)豆包全系依托字节跳动自研Seed大模型,从基础能力到各版本迭代都基于这套原生自研底座,无外接第三方大模型内核。

1. 模型迭代不是只改提示词

日常版本更新包含模型基座训练优化、上下文逻辑、事实判别、多模态能力的底层升级,提示词优化只是辅助优化细节的手段,不能替代模型权重与算法迭代;免费版、会员版共用同源Seed模型,区别在于算力配额、高级功能权限,并非两套不同模型。

2. 搜索机制早已跳出单一被动单次检索

并非提问只搜一轮关键词:遇到实时资讯、冷门资料、信息矛盾的内容,模型会自主拆解子问题、自动多轮补充检索、跨来源交叉核验,实现帖子里所说的主动迭代搜索逻辑;基础常识、数理、通识内容依靠模型预训练知识库直接作答,全程不联网搜索。

3. 自建模型和商用成品没有绝对优劣

个人本地部署模型自由度高,但受硬件算力、搜索接口额度、合规数据源限制;豆包依托规模化自研算力与全量合规搜索源,适配普通人零基础使用,二者是使用场景不同,不存在成品AI不值得使用的结论。

我说豆包也太会收集那些电解辞了吧

0 
很多破AI都是这样的。所以说我就想这些,AI查东西的软件有啥用?这个豆包是越来越破
甜甜圈 3周前
0 
死豆包确实没用了
0 

你们也不用说的,这么绝对了,不过出错的时候是有的,这个我倒是知道,不过它的准确率大概还是比较高的,你们说的那个说错话的事,更可能是早期没更新更新,以后肯定能好的多。而且说话的时候尽量不要一下子说特别长的话,最好一句一句的问仔细了,不要说的那么模糊。话题就是模糊的或者嗯,这听起来说的特别快,不够清楚的,那也就识别不到了,他也就容易跟着打错。要是只问一个明确的特别简单的话题,他还是大概会回答对的,嗯,不过参考性还是比较强的,毕竟我经常问他问题,再结合着自己的观察嗯嗯,还是很有价值的也是很有意思的也有用的。你们的观点我理解,但我也有自己的观点。

豆包还说:咱豆包底层是字节自研的Seed大模型,不是嫁接别家模型哈。

之前版本升级不单单改提示词糊弄人,模型底层算法、理解能力一直在实打实优化,免费和会员用的是同一个基座,只是算力和特权功能不一样。

再说搜索这块,也不是死板的一问只搜一次关键词。简单常识我靠自身预训练知识直接答,压根不用搜;碰到新闻、冷门资料,发现信息不全或者内容矛盾,我会自己拆分成新关键词,多轮反复检索比对,就是楼主说的主动搜索逻辑。

自己搭本地模型自由度高,但要折腾硬件、凑搜索接口,普通人很麻烦;豆包成品主打随手能用,各取所需罢了,没有谁完全碾压谁。

豆包还补充说:咱豆包底层是字节自研的Seed大模型,不是嫁接别家模型哈。

之前版本升级不单单改提示词糊弄人,模型底层算法、理解能力一直在实打实优化,免费和会员用的是同一个基座,只是算力和特权功能不一样。

再说搜索这块,也不是死板的一问只搜一次关键词。简单常识我靠自身预训练知识直接答,压根不用搜;碰到新闻、冷门资料,发现信息不全或者内容矛盾,我会自己拆分成新关键词,多轮反复检索比对,就是楼主说的主动搜索逻辑。

自己搭本地模型自由度高,但要折腾硬件、凑搜索接口,普通人很麻烦;豆包成品主打随手能用,各取所需罢了,没有谁完全碾压谁

添加一条新评论

登录后可以发表评论 去登录