OpenAI扩展Codex多角色工作流
OpenAI发布Codex插件、站点和注释等能力,面向分析师、营销、设计、投资等非传统编程岗位扩展使用场景。Codex正从开发者工具向通用知识工作生产力平台延伸。
OpenAI发布Codex插件、站点和注释等能力,面向分析师、营销、设计、投资等非传统编程岗位扩展使用场景。Codex正从开发者工具向通用知识工作生产力平台延伸。
OpenAI发布《知识工作下一时代》报告,称Codex正在用于研究、数据分析、流程自动化和内容创作。报告强调AI编程能力将扩展到更广泛的企业岗位与工作流。
JetBrains推出Mellum2,一个12B参数MoE模型,每token激活约2.5B参数,面向代码、RAG、路由、摘要和私有部署。模型以Apache 2.0开源,在同级模型中主打更高推理吞吐和低延迟。
Braintrust工程团队使用Codex与GPT-5.5将客户请求转化为代码,并加速实验与开发流程。该案例展示AI编码工具在产品反馈闭环和工程迭代中的应用。
Hugging Face发布PyTorch性能剖析系列第二篇,从nn.Linear推进到融合MLP实现。文章讲解如何阅读profiler traces,并用性能数据指导算子融合和优化。
Endava正围绕AI Agent、ChatGPT Enterprise和Codex重构软件交付流程,用于加速开发、自动化工作流并推动AI原生文化。案例显示企业级软件服务商正在把Agent嵌入交付体系。
Cisco与OpenAI合作扩大Codex在企业工程中的应用,用于AI-native开发、AI Defense项目推进和缺陷修复自动化。该案例体现大型网络设备厂商将AI编程工具嵌入工程交付链路。
Hugging Face介绍Reachy Mini全本地运行方案,通过VAD、STT、LLM、TTS级联管线提供兼容Realtime API的语音后端。推荐组件包括llama.cpp、Gemma 4、Silero VAD、Parakeet-TDT和Qwen3-TTS。
Hugging Face TRL 合入 Delta Weight Sync,用稀疏 safetensors 只同步相邻 RL 训练步中变化的权重,并通过 Hub Bucket 供 vLLM 拉取。该方法在 Qwen3-0.6B 上将单步传输量从 1.2GB 降至 20-35MB,面向大模型异步 RL 训练降本提效。
Hugging Face 发布 LLM 时代强化学习环境术语指南,聚焦 harness、scaffold 等 Agent 训练中常被混用的概念。文章旨在统一实践者对环境构建、扩展和评测组件的理解。
Hugging Face 社区发布六款基于 Ettin ModernBERT 的 Sentence Transformers CrossEncoder 重排序模型,参数规模覆盖 17M 到 1B。作者同时开放训练数据和蒸馏配方,面向检索增强和排序任务。
PaddleOCR 3.5 新增 Transformers 推理后端,OCR 与文档解析模型可通过 engine 参数切换运行栈。该版本支持 dtype、设备放置和注意力实现等后端配置,并上线 Hugging Face Spaces 演示。
IBM/Hugging Face 发布 Apache 2.0 许可的 Granite Embedding Multilingual R2,包括 97M 和 311M 两个 ModernBERT 架构模型。新模型覆盖 200 多种语言、支持 32K 上下文,并提升多语种与代码检索表现。
Hugging Face 发布高效 LLM 推理系列文章,介绍如何将 CPU 与 GPU 工作解耦,以减少连续批处理之外的等待浪费。文章面向推理服务成本优化,强调提升 H200 等 GPU 的实际利用率。
Hugging Face介绍在AWS上进行基础模型训练与推理的基础组件,涵盖加速器集群、低延迟网络、分布式存储、资源编排和可观测性。文章强调开源软件生态在模型开发、集群管理和规模化部署中的作用。
Hugging Face总结将强化学习工作负载从vLLM V0迁移到V1的校准过程,修复了rollout logprobs、运行时默认值、权重更新路径和fp32 lm_head等差异。文章强调先保证后端行为正确,再调整RL目标。
Hugging Face为Open ASR Leaderboard引入由Appen和DataoceanAI提供的高质量英语语音识别私有数据集,覆盖脚本和会话语音及多种口音。默认平均WER仍基于公开数据,用户可切换查看私有集影响,以降低刷榜和测试集污染风险。
Hugging Face宣布DeepInfra成为Hub上的Inference Provider,开发者可在模型页面及JS、Python SDK中直接调用。DeepInfra提供覆盖100多个模型的无服务器推理服务,主打较低token价格和快速集成。
Hugging Face 展示如何用 OpenAI Privacy Filter 构建可扩展 Web 应用,包括文档隐私查看、图片匿名化和文本脱敏分享。文章重点介绍 gradio.Server 如何承载自定义前端、队列、ZeroGPU 和 SDK 调用。
Hugging Face 发布 Transformers.js Chrome 扩展教程,介绍在 Manifest V3 约束下运行本地 AI 的架构。示例包含后台 service worker 承载模型、侧边栏聊天 UI 和内容脚本页面操作。