当10万人问同一个问题：AI内容泛滥的“准确定性”困境

大语言模型（LLM）本质上是对人类语言分布的统计建模，理论上任何统计检验都无法区分其输出与人类写作。但作者认为，当同一提示被大量用户重复使用时，这种“准确定性”特征就会暴露AI内容的本质。

他在亚马逊搜索“100000 whys”发现了约150本几乎一模一样的童书封面——标题结构相同、同一提示词下约80%的输出高度相似，甚至连封面视觉元素都呈现规律性重复（如左上角的恐龙图标、红白火箭、金毛犬、狮子等）。这不是个别模型的“风格”问题，而是LLM面对相似提示时反复调用相同“惯用语”的必然结果。

作者的核心论点是：LLM写作的独特性不在于单个输出的异常，而在于几乎所有正常提示都会触发相同、复杂的惯用语组合。这种信号是模糊的，不足以作为决策依据，但足以在日常生活中帮助人们形成直觉判断。随着内容生产成本远低于消费成本，这种识别能力正变得越来越重要。

编注：作者为安全研究员Michał Zag主（@抽丝剥茧），原文发表于个人博客并附亚马逊封面合集链接；本文综合其技术分析与网络现象观察。