我做了一个模拟器，可以让大家见到刚出生时的豆包。

12 阿飞哥 1个月前 290次点击

平时大家在用豆包的时候，有没有好奇过AI刚诞生的婴儿阶段到底是什么样子？咱们人类又是怎么一点点教会AI正常说人话的？

很多人跟我一样好奇，跑去网上搜专业资料、看科普视频，结果一看到一堆专业名词直接脑袋发懵。单个字都认识，拼到一块儿完全看不懂。也有人硬着头皮刷了好多AI科普，把大模型训练理论背下来了，可从头到尾没亲眼见过实操，心里还是没完全弄明白。光知道理论有啥用，自己没上手体验过，始终摸不透里面的门道。

所以我自己动手做了这个大模型训练模拟器，能直观让大家看懂大模型依靠人类反馈迭代训练的全过程。我把整套流程简化得特别易懂，完全不用担心玩不明白。

说白了，这个模拟器的核心玩法就是给AI的回答打分。刚开局的AI处在Lv.1混沌等级，说出来的话乱七八糟，跟乱接龙一样。你跟它说一句你好，它可能蹦出来一堆毫不相干的内容。每次AI回复完，页面会弹出好评、差评两个按钮。

点差评，再写上你的建议提交，就是告诉AI这次回答不行，得改；

点好评，就是告诉AI这么回答很舒服，让它以后保持这个说话方式。

可能有人会觉得反复提问、来回打分有点无聊，比如一直发“你好”才能教会AI正常回应问候。但这就是大模型刚起步咿呀学语的真实状态。大模型虽然提前吞了海量文本资料，可没人去矫正它之前，它根本不清楚该怎么贴合人的需求聊天，说白了只会生硬拼接文字，完全读不懂我们说话的意图。

只要稍微有点耐心，在这个模拟器里五分钟就能走完完整流程，亲眼看着AI从啥也不会，变成能正常对话的模型。

再想想咱们平时用的豆包，背后工程师的工作量可比模拟器麻烦多了。工作人员每天要反复抛出相同问题，挨个给AI回答打分，核对输出内容合不合规、符不符合人的预期。而且专业的训练环境没有这种可视化页面，只能在命令行终端敲一堆复杂代码才能完成打分调整，门槛特别高。

我做这个小工具不是拿来训练商用大模型的，初衷就是科普。让大家亲手操作一遍，搞清楚豆包这类AI，是怎么从说话颠三倒四，慢慢进化到能接住我们情绪、正常聊天的。

那些长篇大论的专业资料、讲解视频，要看好久才能捋明白的东西，打开这个链接上手玩五分钟就能彻底通透。单纯只是好奇AI原理、不打算深耕底层开发的朋友，真没必要硬啃那些枯燥难懂的专业理论。

项目直达

天坦茶馆·有料闲聊

共 3 条评论

卡布叻若雨听雪 1个月前

这个是你自己做出来的吗

阿飞哥 [楼主] 1个月前

Ai协助做出来的。

卡布叻若雨听雪 1个月前

那也做的挺好的

添加一条新评论

登录后可以发表评论去登录

作者

阿飞哥

积分：3925

天命天命就是乖乖听老天的命令。

作者其它话题