ScarfBench评测编码Agent
Hugging Face 博客发布 ScarfBench,用于评测 AI Agent 在企业 Java 跨框架迁移中的能力。该基准强调真实应用现代化场景,覆盖代码迁移、行为保持、构建系统适配和运行时依赖处理。
事件进展(1 篇报道)
-
2026-07-01 02:32
Hugging Face 博客发布 ScarfBench,用于评测 AI Agent 在企业 Java 跨框架迁移中的能力。该基准强调真实应用现代化场景,覆盖代码迁移、行为保持、构建系统适配和运行时依赖处理。