📰 最新 AI 日报:2026-07-04 早报 →

最新动态

AI 前沿 重要度 7

涌生智能发布生物实验 Agent

华大智造子公司涌生智能与上海人工智能实验室发布 ProtoPilot 和 BioLab Bench,瞄准生命科学实验室中的多智能体自动化。系统尝试从自然语言实验意图到设备执行形成闭环,被视为 Physical AI 在生物实验场景的落地探索。

AI 前沿 重要度 7

地瓜机器人发布Uranus

地瓜机器人发布世界模型 Uranus,将其定位为具身智能开发基础设施,而非直接作为机器人“大脑”。Uranus 重点用于评测 VLA 和世界模型,并缓解仿真到真实场景的 sim-to-real gap。

AI 前沿 重要度 6

扎克伯格称Agent进展不及预期

据报道,Meta CEO扎克伯格在内部会议上表示,AI Agent发展速度未达到管理层此前预期。他还谈及此前裁员与AI团队重组,显示Meta在用AI替代工作流程方面遇到落地阻力。

TechCrunch · Reddit r/technology (2 个来源)
AI 前沿 重要度 5

Claude Fable 5重发后基准下滑

独立基准BridgeBench显示Claude Fable 5在7月1日重新上线后,调试、重构和幻觉检测成绩较6月12日版本大幅下降。帖子称下滑可能与Anthropic新增安全分类器和请求重路由机制有关,但仍需更多独立验证。

AI 前沿 重要度 7

Meta低调推出AI游戏应用Pocket

Meta推出Pocket应用,允许用户通过AI提示词生成小型互动应用和游戏,并在信息流中体验他人作品。该产品源于Meta收购vibe-coded游戏平台Gizmo团队,显示大厂正在试水AI原生UGC游戏形态。

AI 前沿 重要度 10

美国或持有OpenAI股份

报道称 Sam Altman 正与特朗普政府讨论美国政府获得 OpenAI 约 5% 股份的可能性。相关谈判仍处早期,政府也据称接触了 Google、Meta 等 AI 公司,显示 AI 产业收益分享和国家介入成为新政策议题。

Ars Technica · TechCrunch (2 个来源)
AI 前沿 重要度 5

能源行业加速部署工业AI

文章以 Woodside Energy 为例,介绍 AI 在能源行业的预测分析、钻探、维护和工厂运营中的应用。工业场景显示 AI 正从聊天机器人走向关键基础设施运营层。

AI 前沿 重要度 6

Gemma 4实时语音演示上线

Hugging Face 社区展示基于 Parakeet、Gemma 4 31B、Qwen3TTS 的开放实时语音 Demo,由 Cerebras 承载推理以降低延迟。该方案可作为 OpenAI Realtime API 的开源替代,并支持本地或云端运行。

AI 前沿 重要度 6

Springboards 破除LLM同质化

澳大利亚初创公司 Springboards 推出 LLM Flint,试图解决主流大模型回答过于可预测、创意输出趋同的问题。其目标场景包括头脑风暴、创意规划等需要多样化答案的任务。

AI 前沿 重要度 7

谷歌AI扩张推高用电37%

谷歌2025年年度用电量同比增长37%,创公司历史最大增幅,主要受Google Cloud、YouTube以及AI数据中心建设和运营推动。谷歌称通过大规模采购清洁能源控制运营碳排放,但总用电量较2019年已增长逾250%。

AI 前沿 重要度 6

Weave 推家务机器人 Isaac 1

具身智能初创公司 Weave Robotics 发布移动式家庭整理机器人 Isaac 1,售价 7999 美元,计划今年秋季向首批用户交付。该机器人采用轮式移动与可伸缩躯体,可执行叠衣、收纳等家庭任务。

AI 前沿 重要度 9

Anthropic 恢复 Fable 5 访问

Anthropic 在暂停访问后恢复 Fable 5,并部分解禁 Mythos 5。恢复后的模型安全过滤更严格,部分请求会回退到 Opus 4.8,用户额度和 usage credits 规则也发生变化。

爱范儿 · 量子位 · InfoQ 中国 (3 个来源)
AI 前沿 重要度 7

曝 Meta 外包测试竞品 AI 安全

《连线》报道称,Meta 曾通过代号「Cannes」的项目组织外包人员冒充未成年人,用高风险提示词测试 ChatGPT、Gemini 和 Character.AI。项目涉及自杀、毒品、未成年保护等敏感场景,引发 AI 安全与商业竞争伦理争议。

AI 前沿 重要度 4

稀缺标签优化分类器

Gnosys 展示其 autonomous model engineer 在标签稀缺场景下优化安全分类器的案例。其在 ToxicChat 基准中以固定 5% 误报率为条件,提高了有害内容捕获率,并与 GEPA 等提示优化方法对比。

AI 前沿 重要度 6

Springboards 破除LLM同质化

澳大利亚初创公司 Springboards 推出 LLM Flint,试图解决主流大模型回答过于可预测、创意输出趋同的问题。其目标场景包括头脑风暴、创意规划等需要多样化答案的任务。

AI 前沿 重要度 8

Anthropic 发布 Claude Sonnet 5

Anthropic 发布 Claude Sonnet 5,定位为更具 agent 能力且成本低于 Opus 的主力模型。新模型强调计划制定、浏览器与终端工具调用、复杂任务自主执行,意在把高端模型能力下放到开发者常用产品线。

AI 前沿 重要度 7

飞书推出多维表格智能体

飞书发布多维表格智能体,可在群聊、评论区和表格侧边栏中直接调用业务数据并完成分析、记录整理和流程推进。该产品把个人 AI 助手扩展为团队可共享的业务 Agent,面向企业协作场景。

AI 前沿 重要度 8

Gemma 4实时语音演示上线

Hugging Face 与 Cerebras 推出基于 Gemma 4 的实时语音 AI 演示,采用 Parakeet 语音识别、Cerebras 承载 Gemma 4 推理、Qwen3TTS 语音合成的开放模块化链路。该方案面向开发者,可替换 OpenAI Realtime API,用于助手、机器人和研究原型。

AI 前沿 重要度 10

Anthropic 推科学工作台

Anthropic 发布 Claude Science,定位为面向科学家的 AI 工作台,可整合分散工具和数据集,并生成图表与可视化内容。公司还表示将推进自研药物开发,进一步把 Claude 拓展到生物医药和科学发现场景。

The Verge · MIT Tech Review · MIT Tech Review (3 个来源)
AI 前沿 重要度 10

谷歌发布Nano Banana 2 Lite

Google DeepMind 发布 Nano Banana 2 Lite,并将 Gemini Omni Flash 开放给开发者。前者定位为更快、更低成本的图像模型,后者面向视频生成和对话式编辑,均接入 Google AI Studio、Gemini API 和企业 Agent 平台。