VAKRA评测企业级Agent能力
Hugging Face介绍VAKRA基准,用可执行环境评测AI Agent在企业类场景中的推理、工具调用和失败模式。该基准包含8000多个本地API、真实数据库和62个领域文档集,强调多步工作流的完整执行轨迹评估。
Hugging Face介绍VAKRA基准,用可执行环境评测AI Agent在企业类场景中的推理、工具调用和失败模式。该基准包含8000多个本地API、真实数据库和62个领域文档集,强调多步工作流的完整执行轨迹评估。
HCompany在Hugging Face介绍HoloTab浏览器扩展,将其电脑使用AI能力带入Chrome。用户可用自然语言描述任务,Agent在网页内导航、填写字段并完成跨网站操作,降低电脑操作模型的使用门槛。