📰 最新 AI 日报:2026-07-04 早报 →

最新动态

开发者与开源 重要度 7

HF Jobs一键运行vLLM

Hugging Face 发布教程,介绍如何用 hf jobs run 在 HF Jobs 上一键启动 vLLM OpenAI 兼容服务。该方式适合测试、评测和批量生成,按硬件使用分钟计费,区别于生产级 Inference Endpoints。

开发者与开源 重要度 8

NeMo加速MoE微调

Hugging Face介绍NVIDIA NeMo AutoModel,可在Transformers v5上通过专家并行、DeepEP与TransformerEngine提升MoE微调效率。官方称吞吐提升3.4至3.7倍,显存占用降低29%至32%,且兼容from_pretrained接口。

开发者与开源 重要度 6

HF用AI周更hub客户端

Hugging Face分享huggingface_hub每周发布的工程流程,使用开源工具、开放权重模型和GitHub Actions自动化发布。流程保留人工审核节点,强调无需闭源模型或供应商合约即可复用。

开发者与开源 重要度 6

HF试验跨源存储API

Hugging Face 在 Transformers.js 中试验拟议的 Cross-Origin Storage API,目标是改善浏览器端模型缓存体验。该方案有助于 Web AI 应用复用模型权重、降低重复下载成本,但仍依赖浏览器标准推进。

开发者与开源 重要度 7

PP-OCRv6登陆Hugging Face

PaddleOCR 的 PP-OCRv6 模型家族上线 Hugging Face,参数规模从 150 万到 3450 万,支持文档、截图、场景文字等 OCR 任务。中小规模版本支持 50 种语言,并可通过 PaddlePaddle、Transformers 或 ONNX Runtime 集成。

开发者与开源 重要度 9

OpenAI推开源安全计划

OpenAI 发布 Patch the Planet,这是 Daybreak 计划下支持开源维护者的安全倡议。项目将用 AI 和专家审查帮助维护者发现、验证并修复漏洞,指向 AI 辅助开源供应链安全的新场景。

开发者与开源 重要度 6

OpenAI分享Codex长任务用法

OpenAI 介绍 Jason Liu 使用 Codex 处理长周期工作的经验,包括保留项目上下文、管理复杂任务并让工作跨越单次提示持续推进。该内容偏方法论,反映 AI 编程工具在项目管理和长期协作中的使用方式。

开发者与开源 重要度 6

HF用本地模型分拣代码仓库

Hugging Face 分享用 Gemma、Qwen 等本地模型配合 agent harness,对 OpenClaw 仓库进行免费议题分拣和标签分类的实践。文章强调在闭源模型可能下线的背景下,企业应提升本地 AI 栈的可控性。

开发者与开源 重要度 6

HF探讨LoRA之外微调方法

Hugging Face 发文比较 LoRA 与其他参数高效微调技术,提醒开发者不要默认选择单一方案。文章围绕显存、性能、工具链和任务适配性,讨论如何为开放模型微调选择更合适的 PEFT 方法。

开发者与开源 重要度 7

HF评测开源模型工具调用能力

Hugging Face 介绍面向代理的软件工具调用评测方法,不只看最终答案,还分析模型选择库、调用 API、调试错误的全过程。该工作强调库设计、文档和 API 易用性会直接影响编码代理的成本与可靠性。

开发者与开源 重要度 7

HF连接LeRobot与实体机器人

Hugging Face 介绍 AWS 开源 Strands Robots SDK 与 LeRobot 的集成,可把机器人抽象、仿真和硬件流程封装为 AgentTools。开发者可从 Hub 上的数据出发,用单个 Strands agent 组织录制、训练、仿真和部署流程。

开发者与开源 重要度 8

HF参与ARD代理发现标准

Hugging Face介绍Agentic Resource Discovery开放规范,该规范由微软、谷歌、GoDaddy、HF等参与制定。ARD旨在让智能体在运行时跨联邦注册表发现工具、技能和其他代理,而不是预先安装能力。

开发者与开源 重要度 6

Nextdoor工程团队使用Codex

OpenAI介绍Nextdoor工程师如何使用Codex和GPT-5.5排查难复现问题、跨平台开发并聚焦产品结果。该案例体现AI编程工具在真实工程团队中的落地方式。

开发者与开源 重要度 7

HF展示代理串联Spaces建3D画廊

Hugging Face展示编码代理如何直接调用两个Spaces,生成巴黎地标图片与3D Gaussian splats,并组装成静态3D展示网站。文章将其视为由小型组件和代理协作构建多媒体软件的早期样例。

开发者与开源 重要度 7

HF Jobs支持迁移GitHub CI

Hugging Face介绍将GitHub Actions调度到Hugging Face Jobs运行的方案。Trackio迁移后CPU CI时间缩短约30%,并启用了需要真实CUDA硬件的GPU测试套件。

开发者与开源 重要度 10

OpenEnv转入HF推动开源Agent RL

OpenEnv宣布由包含Meta-PyTorch、Nvidia、Microsoft、Hugging Face等机构的委员会协调,并迁入huggingface/OpenEnv。该项目用于创建终端、浏览器等代理执行环境,目标是支撑开源Agentic RL训练生态。

开发者与开源 重要度 8

HF重构CLI适配编码代理

Hugging Face介绍重新设计官方hf CLI,使其更适合Claude Code、Codex、Cursor等编码代理使用。新CLI覆盖Hub资源管理、Jobs、Buckets、Inference Endpoints等操作,并通过基准验证其在多步骤任务中的代理友好性。

开发者与开源 重要度 7

DPO用于OCR退化修正

Hugging Face文章介绍将直接偏好优化用于聊天机器人之外的结构化OCR场景。方法利用模型自身失败样本构造拒绝对,降低文档转写中的重复循环和文本退化率。

开发者与开源 重要度 8

Wasmer用Codex开发边缘运行时

Wasmer使用Codex和GPT-5.5构建面向边缘的Node.js运行时,声称开发效率提升10至20倍,并将交付周期从数月压缩到数周。案例凸显AI编程工具在系统软件和边缘计算中的实际落地。

开发者与开源 重要度 7

Reachy Mini接入MCP工具

Hugging Face介绍为Reachy Mini机器人添加远程MCP工具的方式,支持通过一条命令接入天气等工具空间。文章说明工具、配置档案和远程调用限制,扩展机器人对话中的动作与外部能力。