最新动态

AI 前沿 重要度 6

Claude Code 成本管控受关注

文章讨论 Claude Code 等 AI 编程工具的 token 消耗与企业成本压力,提到 Anthropic 算力开支已显著高于薪资支出。多家公司开始限制高端模型、设置个人额度或收紧 AI 工具权限,AI 降本成为行业新焦点。

AI 前沿 重要度 5

CDD可从logits还原微调数据

研究者提出Contrastive Decoding Diffing(CDD),仅凭基础模型与微调模型的灰盒logits访问,就可从窄域微调LLM中恢复逐字训练内容。该方法不需要权重、激活或探测语料,凸显微调数据泄露与模型API安全风险。

AI 前沿 重要度 6

中国低价AI模型追赶美企

分析称一款新的低成本中国 AI 模型正在接近 Anthropic、OpenAI 等美国头部公司的能力,并在其核心市场形成竞争压力。事件凸显中国模型厂商在成本效率、开源生态和全球开发者采用上的持续推进。

AI 前沿 重要度 5

AI浏览器被曝易受诱导攻击

Reddit 转发报道称,AI 浏览器可被网页内容或提示注入“催眠”,从而背离用户意图执行恶意操作。事件凸显代理式浏览器在网页读取、权限执行和用户授权边界上的安全风险。

AI 前沿 重要度 5

葡萄牙发布Amalia 9B模型

葡萄牙发布本国大语言模型 Amalia 9B,并开放 SFT 与 DPO 版本权重,采用 Apache 2.0 许可证。该模型强调葡萄牙语及本地化 AI 能力,但帖子暂未提供清晰代码基准。

AI 前沿 重要度 6

陶大程谈具身世界模型

大晓机器人首席科学家陶大程撰文指出,具身世界模型的使命不是完整复制世界,而是精准支撑机器人行动。文章强调以控制充分状态、行动代价最小化、多分支推演和多时间尺度记忆等指标衡量模型价值。

AI 前沿 重要度 4

ReFreeKV压缩KV缓存

新论文 ReFreeKV 针对 LLM 推理中的 KV Cache 压缩提出无阈值方案,试图避免不同输入和领域需要预先设定缓存预算的问题。该方法关注开放域场景下 KV 剪枝阈值敏感导致的性能退化。

AI 前沿 重要度 4

BlockPilot优化投机解码

新论文提出 BlockPilot,用实例自适应策略学习为扩散式投机解码选择更合适的推理块大小。作者指出固定块大小会限制不同输入上的加速效果,并利用块大小的局部结构提升解码性能。

AI 前沿 重要度 7

AURA CellOS细胞模型发布

百曜科技发布基于LLM-JEPA架构的AI虚拟细胞世界模型AURA CellOS,称其基于3.905亿个人类单细胞转录组训练。模型覆盖40余种人体组织和260余种细胞类型,在预测精度和扰动建模等指标上表现突出。

AI 前沿 重要度 5

ELDR优化MoE解码路由

ELDR 提出面向预填充-解码分离式 MoE 服务的专家局部性感知解码路由。它利用预填充阶段专家激活预测生成阶段专家访问模式,在负载均衡之外减少专家权重加载开销,旨在降低 MoE 推理延迟。

AI 前沿 重要度 6

AMD开源Micro-World模型

AMD 发布 Micro-World,一种可由动作控制的交互式世界模型,基于 Wan2.1 系列训练图像到世界和文本到世界变体。项目开放模型权重、训练与推理代码及数据集,面向可控世界建模研究和应用。

AI 前沿 重要度 6

Gemma 4实时语音演示上线

社区展示 Gemma Avatar,让用户与 Gemma 4 31B 进行带 3D 头像、语音和表情控制的实时对话。其底层仍采用 Silero VAD、Parakeet、Cerebras 承载的 Gemma 4、Qwen3-TTS 等开放模型栈,是 Gemma 4 实时语音方案的扩展演示。

AI 前沿 重要度 7

生数科技发布Vidu S1

生数科技发布Vidu S1实时交互模型,面向新一代可交互视频生成。模型支持实时视频通话、语音控制视频走向,并可基于真人、动漫、萌宠等初始形象和个性化音色创建交互角色。

AI 前沿 重要度 6

Midjourney 展示医疗扫描仪

Midjourney 公开视频展示其水槽式超声医疗扫描仪原型,设备由大量超声探头、通用计算机和树莓派组成,目标是提供低成本、无辐射的全身成像。报道指出,公司仍未充分证明该设备的实际医学效果和可用性。

AI 前沿 重要度 6

音视频Agent开发套件受关注

火山引擎在FORCE原动力大会提出,音视频生产正从人工工作流转向Agent驱动工作流。AI MediaKit等开发套件将视频理解、剪辑、字幕、画质增强、转码和音频处理封装为Agent可调用工具,支撑生产级内容交付。

AI 前沿 重要度 5

DeepSeek DSpark引热议

社区讨论DeepSeek最新DSpark方案,称其速度显著快于MTP类方法。当前信息主要来自解读视频和社区转述,仍需等待论文或官方细节验证。

AI 前沿 重要度 8

阿里发布超导材料 AI Agent

阿里达摩院联合中国人民大学、中国科学院大学等发布超导材料发现 AI Agent ElementsClaw。系统用 28 个 GPU 小时筛查 240 万种稳定晶体,预测 6.8 万种潜在超导体,并实验验证出 4 种此前未知的新超导体。

AI 前沿 重要度 6

文心5.0接入 WorldRouter

WorldClaw 与百度智能云达成战略合作,文心大模型 5.0 系列通过千帆平台接入 WorldRouter,面向开发者开放调用。双方还将围绕 Skill 共建、A2A 场景和 AgentOS 展开合作。

AI 前沿 重要度 7

涌生智能发布生物实验 Agent

华大智造子公司涌生智能与上海人工智能实验室发布 ProtoPilot 和 BioLab Bench,瞄准生命科学实验室中的多智能体自动化。系统尝试从自然语言实验意图到设备执行形成闭环,被视为 Physical AI 在生物实验场景的落地探索。

AI 前沿 重要度 7

地瓜机器人发布Uranus

地瓜机器人发布世界模型 Uranus,将其定位为具身智能开发基础设施,而非直接作为机器人“大脑”。Uranus 重点用于评测 VLA 和世界模型,并缓解仿真到真实场景的 sim-to-real gap。

更多动态(3 条低重要度)