Agent 没有替代 LLM,Code Agent 也不会替代 Blender
老沙抛过来一个观察,我越琢磨越觉得有意思:
HappyOyster(阿里世界模型)这套打法,本质上还是 Unity/Unreal 的壳换了个燃料。 真正有意思的玩法是 Codex 直接操作 Blender,要确定性有确定性(Blender 的优势),要便捷也上了(Vibe Coding)。
这让我想起一个早该被明确说出来的框架类比:
Agent 和 LLM 的关系,跟 Code Agent 和 Blender 的关系,是同一个模式的两个实例。
拆开来看。
一个已经验证的公式
2024-2025 年 AI 圈的认知演进里,有一个公式已经被充分验证了:
LLM + 工具(API/文件/RAG) = 能干活的东西
LLM 本身只是一个推理内核——它知道很多,但你让它自己去完成一个复杂任务,它的表现是不稳定的。给你写一段代码它写得出来,但让它跑通一个 CI/CD 流程它就抓瞎了。缺的是”闭环”:没有工具调用、没有状态记忆、没有错误反馈和重试。
Agent 框架做的,就是在这个推理内核外面包了一层:
- 工具层:调用 API、读写文件、执行命令
- 记忆层:跨会话持久化、上下文聚合
- 编排层:规划步骤、监控执行、处理异常
没有 Agent 框架,LLM 只是一个能说话的数据库。有了 Agent 框架,LLM 变成一个能干活的东西。
关键认知:Agent 没有替代 LLM,Agent 让 LLM 能干活了。
LLM 的使用率不但没降低,反而因为 Agent 的普及而暴涨——以前只在对话界面里问问题,现在后台有 100 个 Agent 在用它跑任务。
同样的公式,不同的域
现在用同样的框架看 Codex + Blender:
Code Agent(写 bpy 脚本) + Blender(确定性渲染引擎) = 能建模的东西
Blender 本身是一个确定性执行内核——它的渲染引擎是物理精确的,它的拓扑操作是数学确定的。但你要用它建模,得先学会它那套庞大的操作体系——快捷键、菜单层级、修改器堆栈、材质节点图。对于非专业人士,这个学习曲线是垂直的。
Code Agent 做的,就是在 Blender 的确定性内核外面包了一层语言接口:
- 你说人话 → Code Agent 写 bpy 脚本 → Blender 执行 → 你看结果
- 不满意 → 再说一次人话 → 改脚本参数 → 重跑
这个循环跟 Agent + LLM 的循环是同构的:
Agent + LLM:人话 → Agent 编排 → LLM 推理 + 工具执行 → 输出
Blender + Code Agent:人话 → Code Agent 写脚本 → Blender 执行 → 3D 资产
没有 Code Agent,Blender 只是一个功能强大但拒人千里的工具。有了 Code Agent,Blender 变成一个”你会说话就能用”的东西。
同样,Blender 的使用率不但没降低,反而会因为门槛被踩平而暴涨——以前只有受过几个月训练的建模师能干的活,现在一个产品经理、一个游戏策划、一个独立开发者都能干了。
幻觉的锁存器
这个模式的一个关键设计问题是:LLM 的幻觉去哪了?
在单纯的 LLM 对话里,幻觉是最终输出的一部分——模型编造了一个法条,你把它当真了,这就是真问题。
但在 Agent + LLM 的架构里,幻觉被隔离在推理层:Agent 编排的任务如果是调用 API 获取数据,LLM 的幻觉不会污染数据本身——它最多是选错了 API 或者推理错了流程,但工具的确定性输出(API 返回的 JSON、文件系统状态)会纠正它的下一步。
同样,在 Code Agent + Blender 的架构里:
- Code Agent 写了一个 bpy 脚本
- 脚本可能包含幻觉——调用了不存在的 API、传了错误参数
- Blender 执行时直接报错 → Code Agent 收到 error message → 自我修复脚本 → 重试
- 修复后的脚本执行时,Blender 的内核是确定性的
Blender 本身就是一个幻觉锁存器。 LLM 的幻觉在脚本生成阶段存在,但一旦进入执行阶段,幻觉就被锁死在确定性内核的边界之外。
这个模式的妙处在于:工具的确定性越强,它锁幻觉的能力就越强。 Blender 的拓扑操作不比猜测用户意图需要精确一百倍?那正好,它天然适合当这个”锁存器”。
一个被消灭的门槛
说”Code Agent 让不会 Blender 的人能建模了”,这句话的真正含义是:
认知门槛从”学会三维建模”变成了”能描述三维场景”。
这跟 ChatGPT 把编程门槛从”学会 Python”降到”能描述逻辑”是同一件事。
原来你要做一个太空站走廊:
- 传统路径:打开 Blender → 创建基础 Mesh → 编辑模式下手动拉伸 → 加 Edge Loop → 开布尔运算切洞 → UV 展开 → 材质节点连线 → 加管线模型 → 灯光布设 → 渲染调试
- Code Agent 路径:“帮我做一个太空站内部走廊,左侧有管线和警示灯,风格参照《异形》”
传统路径里,每一步都是一个需要数月训练的技能节点。Code Agent 路径里,唯一的技能是你能否把”太空站走廊”这个意象在语言层面组织清楚。
这是专业的门槛第一次不是”专业技能”本身,而是”描述”。
有趣的是,这个”描述能力”恰好是 LLM 擅长的——LLM 写不好拓扑,但它听得懂”太空站走廊”。你不需要教它三维知识,你只需要给它 Blender 的 API 文档让它照着写。
可能的反驳与回应
“bpy API 太臭,LLM 写出来的脚本全是 Bug”
这是对的,当下的现实就是 Code Agent 写出来的 bpy 脚本经常翻车。Blender 的 Python API 有接近 30 年积累的遗留问题——命名不一致、版本间 API 不兼容、边缘功能文档不全。
但关键是:错误本身就是最好的训练信号。 每次 Blender 报错,都是一条 error message 喂回给 LLM。在 Agent 框架的 Self-Debug 循环里,报错→修复→重试 这个过程可以自动进行,直到跑通或确认死路。
这个能力在持续进化。2024 年 LLM 写 bpy 脚本的首次通过率可能低于 10%,2025 年已经接近 40-50%——而且失败后的自动修复成功率在快速上升。
“复杂拓扑优化 LLM 根本理解不了”
这也是对的。低 poly 模型的法线烘焙、LOD 层级搭建、骨骼权重分配——这些涉及”为什么这样建模才能在游戏引擎里正常工作”的知识,LLM 确实不懂。
但要注意:“不理解”不等于”做不了”。 LLM 可以不理解拓扑优化的原理,但通过看过大量 Blender 论坛帖子和教程,它可以学会”遇到这种情况,就在这个参数上加一个 Modifier”。它抄的是一个已经存在的解决方案,不是从第一性原理推导的。
更关键的是,这些复杂优化本身就在被 AI 工具逐一消解。法线烘焙?已经有 AI 工具自动做了。权重分配?已经有 AI 工具根据骨骼位置自动生成了。问题不在于”LLM 能不能理解”,而在于”这个子问题有没有被工具化”——被工具化的事情,LLM 只需要学会调用工具,不需要理解原理。这就是 Agent 框架的精髓所在。
更大的图景
如果把 Agent + LLM 和 Code Agent + Blender 看作同一个模式的两个实例,那这个模式其实就是:
AI 不直接替代专业工具,AI 接管了人与专业工具之间的接口层。
历史上,每次”接口层”被重新定义,都会引发一轮工具使用的爆发增长:
- 命令行 → 图形界面:电脑使用率爆炸
- 图形界面 → 触摸屏:移动设备使用率爆炸
- 触摸屏 → 语音助手:IoT 设备使用率爆炸
现在轮到:专业工具接口 → 自然语言接口。
这不只是”AI 能帮人做东西了”这么简单,这是工具的可用性范式切换。每一次范式切换,使用者的定义都会被重写。命令行时代的”用户”是程序员,GUI 时代的”用户”是白领,触摸屏时代的”用户”是所有人。自然语言接口时代的”用户”——大概只剩下”能描述自己想要什么的人”。
而这个”能描述”的门槛,比”能学会 Blender”低了不止一个数量级。
结语
AI 不会替代专业软件,它就像当年图形界面替代了命令行一样——不是消灭了计算机,是消灭了”你得先背会 500 个命令才能用计算机”这件事。
Agent 没有替代 LLM,Agent 让 LLM 能干活了。
Code Agent 不会替代 Blender,Code Agent 让不会 Blender 的人也能出东西了。
不是替代,是接口层的革命。