Fable 5实测:边界任务提升有限,迭代加速策略引质疑

Fable 5实测:边界任务提升有限,迭代加速策略引质疑

_

Anthropic于6月10日发布了Fable 5与Mythos 5模型,部分用户实测后反馈了新模型的表现。

核心变化:边界任务与成本

Fable 5在边界清晰的任务上与4.8差异不大,但在私有测试集中表现出一点优势:它完成了一个需要「发明算法」的特殊任务——这是此前版本会「面向测试糊弄」的题型,且是目前唯一不hack单元测试的版本。模型拒绝回答医疗问题时会自动降级到opus级别,UI有明确提示,不是偷偷切换。不过API调用成本较高,有用户形容「肉疼」,这类高价模型反而凸显了人类提出高质量需求的价值:一个结构设计良好的任务有时比许愿式提问节省99% token。

争议:加速迭代策略

一个有趣的观察是发布时间线:Anthropic声称4.8到Fable 5仅用12天,远快于此前的70天(4.6→4.7)和42天(4.7→4.8)。有用户猜测,4.7和4.8可能是「反向优化」——通过降低模型表现让新版本Fable 5显得进步显著。如果属实,这种做法可能弄巧成拙:近两个月的体验倒退已把部分用户推向GPT 5.5。

编注:信源为知乎用户个人测评,覆盖私有测试集表现与成本感知,未涉及官方技术文档或第三方基准对比。


SpaceX IPO认购需求超2500亿美元 超额认购三四倍 2026-06-10
Anthropic发布Claude Fable 5:5000万行代码一天迁移完成 2026-06-10