过去 24 小时,OpenAI 与 Google DeepMind 同时密集推进模型、智能体、科研和企业生态,竞争重心从单一模型能力扩展到工具链、云分发与垂直场景。另一条主线是算力与资本:自研芯片、1GW 数据中心、潜在上市与政府持股讨论,显示 AI 基础设施和治理结构正在被重新定价。
头条大事
OpenAI 预览 GPT-5.6 Sol,称其在编程、科学和网络安全能力上进一步增强,并配套更先进安全体系;若性能兑现,这将是前沿模型竞争的新基准点。 详情
Google DeepMind 发布 Gemini 3.5 系列,首发 3.5 Flash,强调 Agent、编码和前沿智能,并接入 Gemini 应用、搜索、Antigravity、API 与企业平台;Google 正以产品矩阵而非单点模型参与竞争。 详情
有报道称 Sam Altman 正与特朗普政府讨论美国政府获得 OpenAI 约 5% 股份的可能性,谈判仍处早期;AI 产业收益分享和国家介入,正在从监管议题转向股权与资本安排。 详情
OpenAI 确认已向 SEC 秘密提交 S-1 注册声明草案,但尚未决定后续时间;若后续推进上市或资本市场交易,将显著改变 AI 行业融资预期。 详情
模型与产品
Anthropic 发布 Claude Science,面向科学家整合分散工具和数据集,并可生成图表与可视化内容;其自研药物开发计划显示 Claude 正向科学发现深水区延伸。 详情
OpenAI 推出 Daybreak 安全工具,包括 Codex Security 和 GPT-5.5-Cyber,覆盖企业漏洞发现、验证和修补;安全正在成为模型商业化的高价值入口。 详情
ChatGPT 升级 Dreaming 记忆系统,用于更好记住用户偏好并跨对话更新上下文;长期记忆将直接决定个人助手的实用上限。 详情
OpenAI 计划收购 Ona,以增强 Codex 的安全、持久云环境能力;长时运行 Agent 与企业工作流自动化,是开发者工具链的关键方向。 详情
Google DeepMind 发布 Nano Banana 2 Lite,并开放 Gemini Omni Flash;低成本图像生成与视频编辑能力进一步进入开发者和企业 Agent 平台。 详情
Gemini 3.5 Flash 原生支持 computer use,可在浏览器、移动端和桌面环境中看屏、推理并执行操作;这降低了长任务自动化的集成门槛。 详情
Google 发布 Gemini 3.5 Live Translate,支持 70 多种语言实时语音到语音翻译,并保留语调、节奏和音高;语音交互正从识别转向自然交流体验。 详情
Google 发布 Gemma 4 12B,定位为可在笔记本运行的中型多模态模型,并首次在 Gemma 中型模型加入原生音频输入;本地多模态部署空间继续扩大。 详情
Google 将 Project Genie 连接 Street View,使世界模型可基于真实街景生成交互式环境;这对机器人和导航 Agent 的仿真训练具有现实意义。 详情
Google 发布 Gemini Omni,支持以图像、音频、视频和文本生成高质量视频,并可对话式编辑;多模态生成正在向统一视频工作流靠拢。 详情
Google 推出 Antigravity 2.0,定位为新一代 AI 开发与代理环境;开发者工作流将成为模型厂商争夺高频入口的重点。 详情
Google 推出 Gemini for Science,集合科研发现工具和实验;科研场景已成为大模型公司展示复杂推理与工具使用能力的主战场。 详情
DeepMind 介绍 Co-Scientist 多智能体科研伙伴,用于假设生成、评估和跨学科推理;科研自动化正从检索辅助走向研究流程参与。 详情
DeepMind 称 AlphaEvolve 已用于优化 TPU 设计和缓存策略,部分电路设计进入新一代 TPU 硅片;AI 辅助硬件设计开始产生可验证产业回报。 详情
IBM 发布 Apache 2.0 开源的 Granite 4.1 dense LLM 家族,覆盖 3B、8B、30B,并支持最高 512K 上下文;企业开源模型仍在长上下文和许可友好性上寻找差异化。 详情
DeepMind 提出 Decoupled DiLoCo 分布式训练架构,以降低跨数据中心带宽需求并提高容错;前沿训练的瓶颈正转向系统工程。 详情
DeepSeek-V4 强调百万 token 上下文与更低 KV cache、推理成本,面向长时 Agent 工作负载;长上下文竞争已进入成本效率阶段。 详情
Google 发布 Gemini Robotics-ER 1.6,提升机器人空间推理、多视角理解和环境感知;具身智能模型正在靠近真实任务执行。 详情
Google 推出 Gemini 3.1 Flash Live,面向语音优先应用提升实时音频质量、自然节奏和可靠性;实时语音模型正在成为消费与企业入口。 详情
DeepMind 提出 AGI 认知评测框架,并与 Kaggle 发起黑客松;评测体系建设是 AGI 叙事走向工程化的必要环节。 详情
Google 推出 Gemini 3.1 Flash-Lite 预览版,定位为 Gemini 3 系列最快、最低成本模型;高吞吐、低价格仍是开发者采用的硬约束。 详情
芯片与硬件
报道称 OpenAI 已推进首颗自研推理芯片,Anthropic 也被曝与三星接触探索自研 AI 芯片合作;头部模型公司正试图用定制硬件降低推理成本和供应风险。 详情
OpenAI 宣布在密歇根启动 1GW 数据中心项目,纳入 Stargate 计划;大模型竞争继续向能源、选址和本地经济承诺延伸。 详情
行业与资本
OpenAI 发布 Partner Network,并投入 1.5 亿美元支持全球伙伴推动企业 AI 采用;生态渠道建设正成为其企业商业化的关键抓手。 详情
OpenAI 前沿模型和 Codex 正式登陆 AWS,企业可通过既有 AWS 环境、控制体系和采购流程接入;这扩大了 OpenAI 在主流云生态中的分发半径。 详情
社区风向
OpenEnv 宣布迁入 huggingface/OpenEnv,并由 Meta-PyTorch、Nvidia、Microsoft、Hugging Face 等参与协调;开源 Agentic RL 正在围绕可复现实验环境形成基础设施共识。 详情