FACTS事实性基准发布
Google DeepMind联合Kaggle推出FACTS Benchmark Suite,用于系统评估大语言模型回答的事实准确性。该套件扩展了既有FACTS Grounding Benchmark,新增参数化事实性等多项评测。
事件进展(1 篇报道)
-
2025-12-09 19:29
Google DeepMind联合Kaggle推出FACTS Benchmark Suite,用于系统评估大语言模型回答的事实准确性。该套件扩展了既有FACTS Grounding Benchmark,新增参数化事实性等多项评测。