大语言模型(LLM)本质上是对人类语言分布的统计建模,理论上任何统计检验都无法区分其输出与人类写作。但作者认为,当同一提示被大量用户重复使用时,这种“准确定性”特征就会暴露AI内容的本质。
他在亚马逊搜索“100000 whys”发现了约150本几乎一模一样的童书封面——标题结构相同、同一提示词下约80%的输出高度相似,甚至连封面视觉元素都呈现规律性重复(如左上角的恐龙图标、红白火箭、金毛犬、狮子等)。这不是个别模型的“风格”问题,而是LLM面对相似提示时反复调用相同“惯用语”的必然结果。
作者的核心论点是:LLM写作的独特性不在于单个输出的异常,而在于几乎所有正常提示都会触发相同、复杂的惯用语组合。这种信号是模糊的,不足以作为决策依据,但足以在日常生活中帮助人们形成直觉判断。随着内容生产成本远低于消费成本,这种识别能力正变得越来越重要。
编注:作者为安全研究员Michał Zag主(@抽丝剥茧),原文发表于个人博客并附亚马逊封面合集链接;本文综合其技术分析与网络现象观察。