让开源模型和闭源顶流同台写游戏:GLM-5.2 对阵 Claude Opus 4.8

让开源模型和闭源顶流同台写游戏:GLM-5.2 对阵 Claude Opus 4.8

_

GLM-5.2 是智谱 AI 的最新旗舰模型,采用 MIT 协议开放权重,支持免费下载、本地部署或通过 API 调用。它配备 100 万 token 的上下文窗口,专为需要运行数小时的超长多步骤编码任务设计,有「高」和「最高」两档思考深度可选。但它是纯文本模型,无法处理图片——这意味着依赖截图或图表的工作流仍需多模态模型来完成。

作者给 Opus 4.8 和 GLM-5.2 布置了同一道题:从零开始,用原生 WebGL 手写一个 3D 平台游戏,不借助任何游戏引擎或 Three.js 这类渲染库。

任务包含:GLB 模型解析器、矩阵与向量数学、GLSL 着色器、骨骼蒙皮动画、固定时间步循环、碰撞检测、跟随摄像机——全是硬核底层实现。3D 美术素材统一使用 Kenney 的 CC0 平台游戏素材包,确保两边的差异只来自 AI 的代码能力。

结果很直观:Opus 4.8 在约 34 分钟内完成,GLM-5.2 耗时约 71 分钟,Opus 快了将近一倍。更关键的是,Opus 交付的游戏更干净——没有材质缺失、没有物理 bug。GLM-5.2 的版本则明显粗糙,人物材质不完整,尖刺障碍物无法杀死角色。

不过 GLM-5.2 赢在价格:输出 token 成本不到 Opus 的五分之一,硬件允许的话还能完全免费本地运行。开放权重也意味着不会被厂商随时停服或限制。相比之下,闭源模型的命运总在别人手里。

两人都建议将 GLM-5.2 作为 Opus 的补充选项——对质量要求极高的任务继续用 Opus,对成本敏感或需要长期稳定调用的场景,GLM-5.2 是值得信赖的备选。

编注:信源为技术博客实测报告,材料覆盖同题编码测试全流程与价格对比,未涉及两模型在非编码任务上的表现对比。


Deno 桌面打包工具登场:Web 项目直接变三平台 App 2026-06-22
Codex日志漏洞年写640TB,或在一年内耗尽消费级SSD寿命 2026-06-22