Bitidea News

AI 前沿重要度 8 05-16 16:00

Co-Scientist辅助肝病机制发现

DeepMind 披露爱丁堡大学团队使用 Co-Scientist 从海量文献中寻找 MASH 肝病的潜在机制和组合疗法线索。该系统帮助研究者缩小候选药物组合空间，形成可实验验证的新假设。

Google DeepMind

AI 前沿重要度 6 05-16 15:53

Co-Scientist连接ALS跨学科研究

DeepMind 介绍 MIT 与波士顿儿童医院团队用 Co-Scientist 串联神经肌肉组织模型和细胞表面 RNA 研究。系统帮助研究者快速消化 ALS 文献，将跨领域线索转化为可测试假设。

Google DeepMind

AI 前沿重要度 8 05-16 15:40

Co-Scientist筛选肝纤维化旧药

DeepMind 披露斯坦福研究团队使用 Co-Scientist 从既有药物文献中寻找肝纤维化再利用候选药。研究者让系统提出候选并解释依据，再与人工候选一起进入实验验证。

Google DeepMind

AI 前沿重要度 9 05-16 11:14

WeatherNext助预测牙买加飓风

DeepMind 称 WeatherNext 帮助美国国家飓风中心提前判断飓风 Melissa 将从一级迅速增强至五级，并预测其登陆牙买加。该预报为当地社区争取了更长预警和疏散准备时间。

Google DeepMind

AI 前沿重要度 10 05-16 06:50

Gemini 3.5系列发布

Google DeepMind发布Gemini 3.5系列，首发3.5 Flash，强调前沿智能、Agent能力和编码表现。该模型已面向Gemini应用、搜索AI模式、Antigravity、Gemini API及企业平台开放，3.5 Pro仍在开发中。

Google DeepMind

AI 前沿重要度 10 05-12 22:40

DeepMind发布Co-Scientist

Google DeepMind介绍Co-Scientist多智能体AI科研伙伴项目，目标是通过假设生成、评估和跨学科推理加速科学研究。该项目由医学、AI和生物科学团队联合推进，是其AI科研自动化布局的重要组成。

Google DeepMind

AI 前沿重要度 10 05-06 18:43

AlphaEvolve扩展科研影响

Google DeepMind称Gemini驱动的编码Agent AlphaEvolve已从试点进入核心基础设施，用于优化下一代TPU设计、缓存替换策略等任务。其部分电路设计已被集成进新一代TPU硅片，显示AI辅助硬件与算法优化的实际价值。

Google DeepMind

AI 前沿重要度 9 04-30 20:14

DeepMind启动AI协同临床

Google DeepMind宣布AI co-clinician研究计划，探索AI如何放大医生专业能力并提升患者护理质量。项目面向全球医护短缺背景，延续其从医学考试模型到临床辅助系统的医疗AI路线。

Google DeepMind

AI 前沿重要度 10 04-29 23:01

IBM发布Granite 4.1

IBM Granite团队发布Granite 4.1 dense LLM家族，包含3B、8B和30B模型，训练约15T tokens并支持最高512K长上下文。模型经SFT和GRPO强化学习优化，8B instruct宣称可匹敌或超过上一代32B MoE小模型，并以Apache 2.0开源。

Hugging Face Blog

AI 前沿重要度 8 04-28 23:58

Nemotron全模态模型发布

NVIDIA Nemotron 3 Nano Omni 发布，面向文档、图像、音频、视频和代理式电脑使用等场景。该模型扩展了 Nemotron 多模态能力，并在复杂文档理解、视频音频理解等榜单上取得领先表现。

Hugging Face Blog

AI 前沿重要度 10 04-24 08:00

DeepSeek-V4支持百万上下文

DeepSeek-V4 面向长时间运行的 Agent 工作负载，强调百万 token 上下文不仅要容量，还要降低 KV cache 和推理成本。文章解析其架构与后训练设计，意在解决长任务中断、上下文溢出和工具调用退化等问题。

Hugging Face Blog

AI 前沿重要度 10 04-22 18:20

DeepMind提出Decoupled DiLoCo

Google DeepMind提出Decoupled DiLoCo分布式训练架构，将大规模训练拆分到相对解耦的计算岛上，以降低跨数据中心带宽需求并提升硬件容错能力。该方法瞄准未来前沿模型训练中同步成本和集群可靠性的瓶颈。

Google DeepMind

AI 前沿重要度 6 04-21 18:09

阿语LLM质量榜单QIMMA发布

Hugging Face 介绍 QIMMA 阿拉伯语大模型榜单，重点不是简单汇总基准，而是先对评测数据做质量验证。团队发现常用阿语基准存在系统性质量问题，可能扭曲模型排名。

Hugging Face Blog

AI 前沿重要度 7 04-16 08:00

Ecom-RLVE训练电商对话Agent

Hugging Face 介绍 Ecom-RLVE，将可验证环境从单轮推理扩展到多轮、工具增强的电商对话任务。项目提供 8 类环境、程序化生成、难度课程和可验证奖励，并用 Qwen 3 8B 进行 DAPO 训练展示早期结果。

Hugging Face Blog

AI 前沿重要度 9 04-16 00:03

Gemini 3.1 Flash TTS发布

Google DeepMind 发布 Gemini 3.1 Flash TTS，提升语音自然度、可控性和表达力。该模型已通过 Gemini API、Google AI Studio、Vertex AI 和 Google Vids 预览推出，面向开发者、企业和 Workspace 用户。

Google DeepMind

AI 前沿重要度 8 04-15 20:07

VAKRA评测企业级Agent能力

Hugging Face介绍VAKRA基准，用可执行环境评测AI Agent在企业类场景中的推理、工具调用和失败模式。该基准包含8000多个本地API、真实数据库和62个领域文档集，强调多步工作流的完整执行轨迹评估。

Hugging Face Blog

AI 前沿重要度 10 04-13 23:52

Gemini机器人推理模型升级

Google DeepMind 发布 Gemini Robotics-ER 1.6，强化机器人在真实环境中的具身推理能力。新模型提升空间推理、多视角理解和环境感知精度，面向更自主的物理世界任务执行。

Google DeepMind

AI 前沿重要度 8 04-09 08:00

Waypoint-1.5世界模型发布

Overworld发布Waypoint-1.5实时视频世界模型，主打在普通桌面GPU上运行交互式生成世界。新版提升视觉保真度、扩展本地硬件覆盖范围，继续推进无需数据中心级算力的交互式世界模拟。

Hugging Face Blog

AI 前沿重要度 10 04-02 08:00

Google发布Gemma 4 12B

Google DeepMind 发布 Gemma 4 12B，定位为可在笔记本运行的中等规模多模态模型，填补 E4B 与 26B MoE 之间的能力空档。该模型采用统一、无编码器架构，并首次在 Gemma 中型模型中加入原生音频输入。

Google DeepMind · Google DeepMind · Hugging Face Blog （3 个来源）

AI 前沿重要度 8 04-01 15:13

Falcon Perception发布

Hugging Face介绍Falcon Perception，一个0.6B参数早期融合Transformer，用于开放词汇目标定位与分割。模型在SA-Co上Macro-F1达68.0，高于SAM 3，并同步提出PBench诊断基准与0.3B参数Falcon OCR模型。

Hugging Face Blog

最新动态