📰 最新 AI 日报:2026-07-04 早报 →

最新动态

AI 前沿 重要度 8

Co-Scientist辅助肝病机制发现

DeepMind 披露爱丁堡大学团队使用 Co-Scientist 从海量文献中寻找 MASH 肝病的潜在机制和组合疗法线索。该系统帮助研究者缩小候选药物组合空间,形成可实验验证的新假设。

AI 前沿 重要度 6

Co-Scientist连接ALS跨学科研究

DeepMind 介绍 MIT 与波士顿儿童医院团队用 Co-Scientist 串联神经肌肉组织模型和细胞表面 RNA 研究。系统帮助研究者快速消化 ALS 文献,将跨领域线索转化为可测试假设。

AI 前沿 重要度 8

Co-Scientist筛选肝纤维化旧药

DeepMind 披露斯坦福研究团队使用 Co-Scientist 从既有药物文献中寻找肝纤维化再利用候选药。研究者让系统提出候选并解释依据,再与人工候选一起进入实验验证。

AI 前沿 重要度 9

WeatherNext助预测牙买加飓风

DeepMind 称 WeatherNext 帮助美国国家飓风中心提前判断飓风 Melissa 将从一级迅速增强至五级,并预测其登陆牙买加。该预报为当地社区争取了更长预警和疏散准备时间。

AI 前沿 重要度 10

Gemini 3.5系列发布

Google DeepMind发布Gemini 3.5系列,首发3.5 Flash,强调前沿智能、Agent能力和编码表现。该模型已面向Gemini应用、搜索AI模式、Antigravity、Gemini API及企业平台开放,3.5 Pro仍在开发中。

AI 前沿 重要度 10

DeepMind发布Co-Scientist

Google DeepMind介绍Co-Scientist多智能体AI科研伙伴项目,目标是通过假设生成、评估和跨学科推理加速科学研究。该项目由医学、AI和生物科学团队联合推进,是其AI科研自动化布局的重要组成。

AI 前沿 重要度 10

AlphaEvolve扩展科研影响

Google DeepMind称Gemini驱动的编码Agent AlphaEvolve已从试点进入核心基础设施,用于优化下一代TPU设计、缓存替换策略等任务。其部分电路设计已被集成进新一代TPU硅片,显示AI辅助硬件与算法优化的实际价值。

AI 前沿 重要度 9

DeepMind启动AI协同临床

Google DeepMind宣布AI co-clinician研究计划,探索AI如何放大医生专业能力并提升患者护理质量。项目面向全球医护短缺背景,延续其从医学考试模型到临床辅助系统的医疗AI路线。

AI 前沿 重要度 10

IBM发布Granite 4.1

IBM Granite团队发布Granite 4.1 dense LLM家族,包含3B、8B和30B模型,训练约15T tokens并支持最高512K长上下文。模型经SFT和GRPO强化学习优化,8B instruct宣称可匹敌或超过上一代32B MoE小模型,并以Apache 2.0开源。

AI 前沿 重要度 8

Nemotron全模态模型发布

NVIDIA Nemotron 3 Nano Omni 发布,面向文档、图像、音频、视频和代理式电脑使用等场景。该模型扩展了 Nemotron 多模态能力,并在复杂文档理解、视频音频理解等榜单上取得领先表现。

AI 前沿 重要度 10

DeepSeek-V4支持百万上下文

DeepSeek-V4 面向长时间运行的 Agent 工作负载,强调百万 token 上下文不仅要容量,还要降低 KV cache 和推理成本。文章解析其架构与后训练设计,意在解决长任务中断、上下文溢出和工具调用退化等问题。

AI 前沿 重要度 10

DeepMind提出Decoupled DiLoCo

Google DeepMind提出Decoupled DiLoCo分布式训练架构,将大规模训练拆分到相对解耦的计算岛上,以降低跨数据中心带宽需求并提升硬件容错能力。该方法瞄准未来前沿模型训练中同步成本和集群可靠性的瓶颈。

AI 前沿 重要度 6

阿语LLM质量榜单QIMMA发布

Hugging Face 介绍 QIMMA 阿拉伯语大模型榜单,重点不是简单汇总基准,而是先对评测数据做质量验证。团队发现常用阿语基准存在系统性质量问题,可能扭曲模型排名。

AI 前沿 重要度 7

Ecom-RLVE训练电商对话Agent

Hugging Face 介绍 Ecom-RLVE,将可验证环境从单轮推理扩展到多轮、工具增强的电商对话任务。项目提供 8 类环境、程序化生成、难度课程和可验证奖励,并用 Qwen 3 8B 进行 DAPO 训练展示早期结果。

AI 前沿 重要度 9

Gemini 3.1 Flash TTS发布

Google DeepMind 发布 Gemini 3.1 Flash TTS,提升语音自然度、可控性和表达力。该模型已通过 Gemini API、Google AI Studio、Vertex AI 和 Google Vids 预览推出,面向开发者、企业和 Workspace 用户。

AI 前沿 重要度 8

VAKRA评测企业级Agent能力

Hugging Face介绍VAKRA基准,用可执行环境评测AI Agent在企业类场景中的推理、工具调用和失败模式。该基准包含8000多个本地API、真实数据库和62个领域文档集,强调多步工作流的完整执行轨迹评估。

AI 前沿 重要度 10

Gemini机器人推理模型升级

Google DeepMind 发布 Gemini Robotics-ER 1.6,强化机器人在真实环境中的具身推理能力。新模型提升空间推理、多视角理解和环境感知精度,面向更自主的物理世界任务执行。

AI 前沿 重要度 8

Waypoint-1.5世界模型发布

Overworld发布Waypoint-1.5实时视频世界模型,主打在普通桌面GPU上运行交互式生成世界。新版提升视觉保真度、扩展本地硬件覆盖范围,继续推进无需数据中心级算力的交互式世界模拟。

AI 前沿 重要度 10

Google发布Gemma 4 12B

Google DeepMind 发布 Gemma 4 12B,定位为可在笔记本运行的中等规模多模态模型,填补 E4B 与 26B MoE 之间的能力空档。该模型采用统一、无编码器架构,并首次在 Gemma 中型模型中加入原生音频输入。

AI 前沿 重要度 8

Falcon Perception发布

Hugging Face介绍Falcon Perception,一个0.6B参数早期融合Transformer,用于开放词汇目标定位与分割。模型在SA-Co上Macro-F1达68.0,高于SAM 3,并同步提出PBench诊断基准与0.3B参数Falcon OCR模型。