Bitidea News

开发者与开源重要度 9 06-02 17:00

OpenAI扩展Codex多角色工作流

OpenAI发布Codex插件、站点和注释等能力，面向分析师、营销、设计、投资等非传统编程岗位扩展使用场景。Codex正从开发者工具向通用知识工作生产力平台延伸。

OpenAI Blog

开发者与开源重要度 9 06-02 10:00

OpenAI称Codex走向全员生产力工具

OpenAI发布《知识工作下一时代》报告，称Codex正在用于研究、数据分析、流程自动化和内容创作。报告强调AI编程能力将扩展到更广泛的企业岗位与工作流。

OpenAI Blog

开发者与开源重要度 8 06-01 23:45

JetBrains发布Mellum2

JetBrains推出Mellum2，一个12B参数MoE模型，每token激活约2.5B参数，面向代码、RAG、路由、摘要和私有部署。模型以Apache 2.0开源，在同级模型中主打更高推理吞吐和低延迟。

Hugging Face Blog

开发者与开源重要度 8 05-29 20:00

Braintrust用Codex把需求转代码

Braintrust工程团队使用Codex与GPT-5.5将客户请求转化为代码，并加速实验与开发流程。该案例展示AI编码工具在产品反馈闭环和工程迭代中的应用。

OpenAI Blog

开发者与开源重要度 6 05-29 08:00

HF发布PyTorch性能剖析教程

Hugging Face发布PyTorch性能剖析系列第二篇，从nn.Linear推进到融合MLP实现。文章讲解如何阅读profiler traces，并用性能数据指导算子融合和优化。

Hugging Face Blog · Hugging Face Blog （2 个来源）

开发者与开源重要度 8 05-28 20:00

Endava用AI Agent重塑交付

Endava正围绕AI Agent、ChatGPT Enterprise和Codex重构软件交付流程，用于加速开发、自动化工作流并推动AI原生文化。案例显示企业级软件服务商正在把Agent嵌入交付体系。

OpenAI Blog · OpenAI Blog （2 个来源）

开发者与开源重要度 8 05-27 19:00

思科用Codex重塑工程

Cisco与OpenAI合作扩大Codex在企业工程中的应用，用于AI-native开发、AI Defense项目推进和缺陷修复自动化。该案例体现大型网络设备厂商将AI编程工具嵌入工程交付链路。

OpenAI Blog

开发者与开源重要度 7 05-27 08:00

Reachy Mini支持全本地语音

Hugging Face介绍Reachy Mini全本地运行方案，通过VAD、STT、LLM、TTS级联管线提供兼容Realtime API的语音后端。推荐组件包括llama.cpp、Gemma 4、Silero VAD、Parakeet-TDT和Qwen3-TTS。

Hugging Face Blog

开发者与开源重要度 8 05-27 08:00

TRL引入增量权重同步

Hugging Face TRL 合入 Delta Weight Sync，用稀疏 safetensors 只同步相邻 RL 训练步中变化的权重，并通过 Hub Bucket 供 vLLM 拉取。该方法在 Qwen3-0.6B 上将单步传输量从 1.2GB 降至 20-35MB，面向大模型异步 RL 训练降本提效。

Hugging Face Blog

开发者与开源重要度 6 05-25 08:00

HF梳理Agent强化学习术语

Hugging Face 发布 LLM 时代强化学习环境术语指南，聚焦 harness、scaffold 等 Agent 训练中常被混用的概念。文章旨在统一实践者对环境构建、扩展和评测组件的理解。

Hugging Face Blog

开发者与开源重要度 6 05-19 08:00

Ettin重排序模型家族发布

Hugging Face 社区发布六款基于 Ettin ModernBERT 的 Sentence Transformers CrossEncoder 重排序模型，参数规模覆盖 17M 到 1B。作者同时开放训练数据和蒸馏配方，面向检索增强和排序任务。

Hugging Face Blog

开发者与开源重要度 6 05-18 23:12

PaddleOCR 3.5接入Transformers

PaddleOCR 3.5 新增 Transformers 推理后端，OCR 与文档解析模型可通过 engine 参数切换运行栈。该版本支持 dtype、设备放置和注意力实现等后端配置，并上线 Hugging Face Spaces 演示。

Hugging Face Blog

开发者与开源重要度 7 05-15 02:55

Granite多语种嵌入R2发布

IBM/Hugging Face 发布 Apache 2.0 许可的 Granite Embedding Multilingual R2，包括 97M 和 311M 两个 ModernBERT 架构模型。新模型覆盖 200 多种语言、支持 32K 上下文，并提升多语种与代码检索表现。

Hugging Face Blog

开发者与开源重要度 6 05-14 08:00

HF讲解异步连续批处理

Hugging Face 发布高效 LLM 推理系列文章，介绍如何将 CPU 与 GPU 工作解耦，以减少连续批处理之外的等待浪费。文章面向推理服务成本优化，强调提升 H200 等 GPU 的实际利用率。

Hugging Face Blog

开发者与开源重要度 7 05-12 07:18

HF梳理AWS模型基础设施

Hugging Face介绍在AWS上进行基础模型训练与推理的基础组件，涵盖加速器集群、低延迟网络、分布式存储、资源编排和可观测性。文章强调开源软件生态在模型开发、集群管理和规模化部署中的作用。

Hugging Face Blog

开发者与开源重要度 7 05-07 03:06

HF验证vLLM V1用于RL

Hugging Face总结将强化学习工作负载从vLLM V0迁移到V1的校准过程，修复了rollout logprobs、运行时默认值、权重更新路径和fp32 lm_head等差异。文章强调先保证后端行为正确，再调整RL目标。

Hugging Face Blog

开发者与开源重要度 6 05-06 08:00

HF为ASR榜单加私有集

Hugging Face为Open ASR Leaderboard引入由Appen和DataoceanAI提供的高质量英语语音识别私有数据集，覆盖脚本和会话语音及多种口音。默认平均WER仍基于公开数据，用户可切换查看私有集影响，以降低刷榜和测试集污染风险。

Hugging Face Blog

开发者与开源重要度 6 04-29 08:00

HF接入DeepInfra推理

Hugging Face宣布DeepInfra成为Hub上的Inference Provider，开发者可在模型页面及JS、Python SDK中直接调用。DeepInfra提供覆盖100多个模型的无服务器推理服务，主打较低token价格和快速集成。

Hugging Face Blog

开发者与开源重要度 6 04-27 08:00

HF演示OpenAI隐私过滤应用

Hugging Face 展示如何用 OpenAI Privacy Filter 构建可扩展 Web 应用，包括文档隐私查看、图片匿名化和文本脱敏分享。文章重点介绍 gradio.Server 如何承载自定义前端、队列、ZeroGPU 和 SDK 调用。

Hugging Face Blog

开发者与开源重要度 6 04-23 08:00

HF教程讲解浏览器本地AI

Hugging Face 发布 Transformers.js Chrome 扩展教程，介绍在 Manifest V3 约束下运行本地 AI 的架构。示例包含后台 service worker 承载模型、侧边栏聊天 UI 和内容脚本页面操作。

Hugging Face Blog

最新动态