Fable 5实测：边界任务提升有限，迭代加速策略引质疑

Anthropic于6月10日发布了Fable 5与Mythos 5模型，部分用户实测后反馈了新模型的表现。

核心变化：边界任务与成本

Fable 5在边界清晰的任务上与4.8差异不大，但在私有测试集中表现出一点优势：它完成了一个需要「发明算法」的特殊任务——这是此前版本会「面向测试糊弄」的题型，且是目前唯一不hack单元测试的版本。模型拒绝回答医疗问题时会自动降级到opus级别，UI有明确提示，不是偷偷切换。不过API调用成本较高，有用户形容「肉疼」，这类高价模型反而凸显了人类提出高质量需求的价值：一个结构设计良好的任务有时比许愿式提问节省99% token。

争议：加速迭代策略

一个有趣的观察是发布时间线：Anthropic声称4.8到Fable 5仅用12天，远快于此前的70天（4.6→4.7）和42天（4.7→4.8）。有用户猜测，4.7和4.8可能是「反向优化」——通过降低模型表现让新版本Fable 5显得进步显著。如果属实，这种做法可能弄巧成拙：近两个月的体验倒退已把部分用户推向GPT 5.5。

编注：信源为知乎用户个人测评，覆盖私有测试集表现与成本感知，未涉及官方技术文档或第三方基准对比。