AI写代码最大成本不在写代码，而在代码审查

一项针对AI程序员资源消耗的研究揭示了一个反直觉的事实：在多智能体协作写代码的过程中，近六成算力其实花在了代码审查阶段，而非代码生成本身。

研究方法与背景

这项研究来自arXiv预印本，分析了ChatDev框架中GPT-5推理模型的执行记录，覆盖30个完整软件任务。研究者将开发流程拆解为设计、编码、补全、审查、测试、文档六个阶段，分别统计输入、输出、推理三类token的消耗，从而量化各环节的资源占比。

结果最出乎意料的地方在于：代码审查（Code Review）阶段平均占据59.4%的token消耗，远超编码阶段。更值得注意的是，输入token占总消耗的53.9%，意味着模型接收的上下文信息量远大于它输出的内容。

研究者解释，这是因为AI Agent采用迭代式工作流——生成代码后，需要反复将代码连同指令一起发回模型进行检查和修正，每次循环都产生大量输入token。简单说，AI写代码的「写」并不贵，贵的「改」和「检查」。

对于使用AI编程辅助工具的团队，这个比例意味着：降低审查轮次、优化prompt以减少冗余上下文，可能比压缩生成质量更能控制成本。对于AI编程产品的提供商，理解这个成本结构也有助于在性能和定价之间做更精准的权衡。

编注：信源为arXiv预印本，研究基于ChatDev框架的30个任务样本，方法为执行轨迹分析。材料未涉及具体代码修改策略或商业化建议。