AI写代码最大成本不在写代码,而在代码审查

AI写代码最大成本不在写代码,而在代码审查

_

一项针对AI程序员资源消耗的研究揭示了一个反直觉的事实:在多智能体协作写代码的过程中,近六成算力其实花在了代码审查阶段,而非代码生成本身。

研究方法与背景

这项研究来自arXiv预印本,分析了ChatDev框架中GPT-5推理模型的执行记录,覆盖30个完整软件任务。研究者将开发流程拆解为设计、编码、补全、审查、测试、文档六个阶段,分别统计输入、输出、推理三类token的消耗,从而量化各环节的资源占比。

关键发现

结果最出乎意料的地方在于:代码审查(Code Review)阶段平均占据59.4%的token消耗,远超编码阶段。更值得注意的是,输入token占总消耗的53.9%,意味着模型接收的上下文信息量远大于它输出的内容。

研究者解释,这是因为AI Agent采用迭代式工作流——生成代码后,需要反复将代码连同指令一起发回模型进行检查和修正,每次循环都产生大量输入token。简单说,AI写代码的「写」并不贵,贵的「改」和「检查」。

实际意义

对于使用AI编程辅助工具的团队,这个比例意味着:降低审查轮次、优化prompt以减少冗余上下文,可能比压缩生成质量更能控制成本。对于AI编程产品的提供商,理解这个成本结构也有助于在性能和定价之间做更精准的权衡。

编注:信源为arXiv预印本,研究基于ChatDev框架的30个任务样本,方法为执行轨迹分析。材料未涉及具体代码修改策略或商业化建议。


德国联合国安理会竞选落败:104票创历史最低,双重标准外交惹的祸? 2026-06-06
沃什上任两周即迎加息大考:非农爆表逆转降息预期 2026-06-07