Bitidea News

过去 24 小时，OpenAI 与 Google DeepMind 同时密集推进模型、智能体、科研和企业生态，竞争重心从单一模型能力扩展到工具链、云分发与垂直场景。另一条主线是算力与资本：自研芯片、1GW 数据中心、潜在上市与政府持股讨论，显示 AI 基础设施和治理结构正在被重新定价。

头条大事

OpenAI 预览 GPT-5.6 Sol，称其在编程、科学和网络安全能力上进一步增强，并配套更先进安全体系；若性能兑现，这将是前沿模型竞争的新基准点。详情

Google DeepMind 发布 Gemini 3.5 系列，首发 3.5 Flash，强调 Agent、编码和前沿智能，并接入 Gemini 应用、搜索、Antigravity、API 与企业平台；Google 正以产品矩阵而非单点模型参与竞争。详情

有报道称 Sam Altman 正与特朗普政府讨论美国政府获得 OpenAI 约 5% 股份的可能性，谈判仍处早期；AI 产业收益分享和国家介入，正在从监管议题转向股权与资本安排。详情

OpenAI 确认已向 SEC 秘密提交 S-1 注册声明草案，但尚未决定后续时间；若后续推进上市或资本市场交易，将显著改变 AI 行业融资预期。详情

Anthropic 发布 Claude Science，面向科学家整合分散工具和数据集，并可生成图表与可视化内容；其自研药物开发计划显示 Claude 正向科学发现深水区延伸。详情

OpenAI 推出 Daybreak 安全工具，包括 Codex Security 和 GPT-5.5-Cyber，覆盖企业漏洞发现、验证和修补；安全正在成为模型商业化的高价值入口。详情

ChatGPT 升级 Dreaming 记忆系统，用于更好记住用户偏好并跨对话更新上下文；长期记忆将直接决定个人助手的实用上限。详情

OpenAI 计划收购 Ona，以增强 Codex 的安全、持久云环境能力；长时运行 Agent 与企业工作流自动化，是开发者工具链的关键方向。详情

Google DeepMind 发布 Nano Banana 2 Lite，并开放 Gemini Omni Flash；低成本图像生成与视频编辑能力进一步进入开发者和企业 Agent 平台。详情

Gemini 3.5 Flash 原生支持 computer use，可在浏览器、移动端和桌面环境中看屏、推理并执行操作；这降低了长任务自动化的集成门槛。详情

Google 发布 Gemini 3.5 Live Translate，支持 70 多种语言实时语音到语音翻译，并保留语调、节奏和音高；语音交互正从识别转向自然交流体验。详情

Google 发布 Gemma 4 12B，定位为可在笔记本运行的中型多模态模型，并首次在 Gemma 中型模型加入原生音频输入；本地多模态部署空间继续扩大。详情

Google 将 Project Genie 连接 Street View，使世界模型可基于真实街景生成交互式环境；这对机器人和导航 Agent 的仿真训练具有现实意义。详情

Google 发布 Gemini Omni，支持以图像、音频、视频和文本生成高质量视频，并可对话式编辑；多模态生成正在向统一视频工作流靠拢。详情

Google 推出 Antigravity 2.0，定位为新一代 AI 开发与代理环境；开发者工作流将成为模型厂商争夺高频入口的重点。详情

Google 推出 Gemini for Science，集合科研发现工具和实验；科研场景已成为大模型公司展示复杂推理与工具使用能力的主战场。详情

DeepMind 介绍 Co-Scientist 多智能体科研伙伴，用于假设生成、评估和跨学科推理；科研自动化正从检索辅助走向研究流程参与。详情

DeepMind 称 AlphaEvolve 已用于优化 TPU 设计和缓存策略，部分电路设计进入新一代 TPU 硅片；AI 辅助硬件设计开始产生可验证产业回报。详情

IBM 发布 Apache 2.0 开源的 Granite 4.1 dense LLM 家族，覆盖 3B、8B、30B，并支持最高 512K 上下文；企业开源模型仍在长上下文和许可友好性上寻找差异化。详情

DeepMind 提出 Decoupled DiLoCo 分布式训练架构，以降低跨数据中心带宽需求并提高容错；前沿训练的瓶颈正转向系统工程。详情

DeepSeek-V4 强调百万 token 上下文与更低 KV cache、推理成本，面向长时 Agent 工作负载；长上下文竞争已进入成本效率阶段。详情

Google 发布 Gemini Robotics-ER 1.6，提升机器人空间推理、多视角理解和环境感知；具身智能模型正在靠近真实任务执行。详情

Google 推出 Gemini 3.1 Flash Live，面向语音优先应用提升实时音频质量、自然节奏和可靠性；实时语音模型正在成为消费与企业入口。详情

DeepMind 提出 AGI 认知评测框架，并与 Kaggle 发起黑客松；评测体系建设是 AGI 叙事走向工程化的必要环节。详情

Google 推出 Gemini 3.1 Flash-Lite 预览版，定位为 Gemini 3 系列最快、最低成本模型；高吞吐、低价格仍是开发者采用的硬约束。详情

报道称 OpenAI 已推进首颗自研推理芯片，Anthropic 也被曝与三星接触探索自研 AI 芯片合作；头部模型公司正试图用定制硬件降低推理成本和供应风险。详情

OpenAI 宣布在密歇根启动 1GW 数据中心项目，纳入 Stargate 计划；大模型竞争继续向能源、选址和本地经济承诺延伸。详情

OpenAI 发布 Partner Network，并投入 1.5 亿美元支持全球伙伴推动企业 AI 采用；生态渠道建设正成为其企业商业化的关键抓手。详情

OpenAI 前沿模型和 Codex 正式登陆 AWS，企业可通过既有 AWS 环境、控制体系和采购流程接入；这扩大了 OpenAI 在主流云生态中的分发半径。详情

OpenEnv 宣布迁入 huggingface/OpenEnv，并由 Meta-PyTorch、Nvidia、Microsoft、Hugging Face 等参与协调；开源 Agentic RL 正在围绕可复现实验环境形成基础设施共识。详情