AI 前沿 重要度 8

FACTS事实性基准发布

Google DeepMind联合Kaggle推出FACTS Benchmark Suite,用于系统评估大语言模型回答的事实准确性。该套件扩展了既有FACTS Grounding Benchmark,新增参数化事实性等多项评测。

事件进展(1 篇报道)

  1. 2025-12-09 19:29

← 返回首页