AI 前沿 重要度 5

Claude Fable 5重发后基准下滑

独立基准BridgeBench显示Claude Fable 5在7月1日重新上线后,调试、重构和幻觉检测成绩较6月12日版本大幅下降。帖子称下滑可能与Anthropic新增安全分类器和请求重路由机制有关,但仍需更多独立验证。

事件进展(1 篇报道)

  1. 2026-07-03 05:38

← 返回首页