世界模型的下一个坎:目标函数问题
世界模型的下一个坎:目标函数问题 > 来源:Roblox 140亿参数视频世界模型实践 + AIGC检测乱象 → 共同指向同一个AGI底层问题 > 2026-05-23 核心素材 Roblox论文(Alberto Hojel): 140B参数视频世界模型,24fps实时生成,根据WASD操作实时改变画面 模型把控制拆成四维度:操作、世界、角色、动态 交给开发者试用后立刻发现问题:玩家不知道自己该干什么 画面有了、操控有了、世界也有了——但没有血量、没有任务、没有”死了”和”赢了”的判断 AI生成的世界是”美丽的荒野”,不是游戏 解法:Game Cartridge(卡带架构) 游戏引擎(代码)→ 管状态机(血量/背包/任务进度) 视频模型(AI)→ 管画面渲染 VLM(观察员)→ 管画面到状态的映射(”玩家捡到能量罐了吗?”) 代码管逻辑,AI管画面,各司其职 VLM作为纽带:持续盯画面,满足条件就回调通知游戏引擎 逻辑闭环:代码存变量跑确定性逻辑,VLM做感知,模型做渲染 现存局限: 空间控制不精准——玩家转向后AI还在原地生成物品 角色漂移——KV缓存撑不住角色外貌一致性 AGI映射 核心论点:世界模型(或AI能力)解决了”能做什么”,但没有解决”要做什么”。 Roblox case → AI画面生成能力再强,没有外部状态机提供目标结构,就是无意义的荒野 AIGC检测 case…