Bitidea News

AI 前沿重要度 6 07-04 03:27

Claude Code 成本管控受关注

文章讨论 Claude Code 等 AI 编程工具的 token 消耗与企业成本压力，提到 Anthropic 算力开支已显著高于薪资支出。多家公司开始限制高端模型、设置个人额度或收紧 AI 工具权限，AI 降本成为行业新焦点。

InfoQ 中国

AI 前沿重要度 5 07-04 03:01

CDD可从logits还原微调数据

研究者提出Contrastive Decoding Diffing（CDD），仅凭基础模型与微调模型的灰盒logits访问，就可从窄域微调LLM中恢复逐字训练内容。该方法不需要权重、激活或探测语料，凸显微调数据泄露与模型API安全风险。

Reddit r/MachineLearning

AI 前沿重要度 6 07-04 01:33

中国低价AI模型追赶美企

分析称一款新的低成本中国 AI 模型正在接近 Anthropic、OpenAI 等美国头部公司的能力，并在其核心市场形成竞争压力。事件凸显中国模型厂商在成本效率、开源生态和全球开发者采用上的持续推进。

Reddit r/technology

AI 前沿重要度 5 07-04 01:05

AI浏览器被曝易受诱导攻击

Reddit 转发报道称，AI 浏览器可被网页内容或提示注入“催眠”，从而背离用户意图执行恶意操作。事件凸显代理式浏览器在网页读取、权限执行和用户授权边界上的安全风险。

Reddit r/technology

AI 前沿重要度 5 07-03 23:38

葡萄牙发布Amalia 9B模型

葡萄牙发布本国大语言模型 Amalia 9B，并开放 SFT 与 DPO 版本权重，采用 Apache 2.0 许可证。该模型强调葡萄牙语及本地化 AI 能力，但帖子暂未提供清晰代码基准。

Reddit r/LocalLLaMA

AI 前沿重要度 6 07-03 23:17

陶大程谈具身世界模型

大晓机器人首席科学家陶大程撰文指出，具身世界模型的使命不是完整复制世界，而是精准支撑机器人行动。文章强调以控制充分状态、行动代价最小化、多分支推演和多时间尺度记忆等指标衡量模型价值。

InfoQ 中国

AI 前沿重要度 4 07-03 22:53

ReFreeKV压缩KV缓存

新论文 ReFreeKV 针对 LLM 推理中的 KV Cache 压缩提出无阈值方案，试图避免不同输入和领域需要预先设定缓存预算的问题。该方法关注开放域场景下 KV 剪枝阈值敏感导致的性能退化。

Reddit r/LocalLLaMA

AI 前沿重要度 4 07-03 22:41

BlockPilot优化投机解码

新论文提出 BlockPilot，用实例自适应策略学习为扩散式投机解码选择更合适的推理块大小。作者指出固定块大小会限制不同输入上的加速效果，并利用块大小的局部结构提升解码性能。

Reddit r/LocalLLaMA

AI 前沿重要度 7 07-03 22:28

AURA CellOS细胞模型发布

百曜科技发布基于LLM-JEPA架构的AI虚拟细胞世界模型AURA CellOS，称其基于3.905亿个人类单细胞转录组训练。模型覆盖40余种人体组织和260余种细胞类型，在预测精度和扰动建模等指标上表现突出。

量子位

AI 前沿重要度 5 07-03 22:19

ELDR优化MoE解码路由

ELDR 提出面向预填充-解码分离式 MoE 服务的专家局部性感知解码路由。它利用预填充阶段专家激活预测生成阶段专家访问模式，在负载均衡之外减少专家权重加载开销，旨在降低 MoE 推理延迟。

Reddit r/LocalLLaMA

AI 前沿重要度 6 07-03 21:47

AMD开源Micro-World模型

AMD 发布 Micro-World，一种可由动作控制的交互式世界模型，基于 Wan2.1 系列训练图像到世界和文本到世界变体。项目开放模型权重、训练与推理代码及数据集，面向可控世界建模研究和应用。

Reddit r/LocalLLaMA

AI 前沿重要度 6 07-03 21:23

Gemma 4实时语音演示上线

社区展示 Gemma Avatar，让用户与 Gemma 4 31B 进行带 3D 头像、语音和表情控制的实时对话。其底层仍采用 Silero VAD、Parakeet、Cerebras 承载的 Gemma 4、Qwen3-TTS 等开放模型栈，是 Gemma 4 实时语音方案的扩展演示。

Reddit r/LocalLLaMA

AI 前沿重要度 7 07-03 19:55

生数科技发布Vidu S1

生数科技发布Vidu S1实时交互模型，面向新一代可交互视频生成。模型支持实时视频通话、语音控制视频走向，并可基于真人、动漫、萌宠等初始形象和个性化音色创建交互角色。

36氪

AI 前沿重要度 6 07-03 19:49

Midjourney 展示医疗扫描仪

Midjourney 公开视频展示其水槽式超声医疗扫描仪原型，设备由大量超声探头、通用计算机和树莓派组成，目标是提供低成本、无辐射的全身成像。报道指出，公司仍未充分证明该设备的实际医学效果和可用性。

The Verge

AI 前沿重要度 6 07-03 19:48

音视频Agent开发套件受关注

火山引擎在FORCE原动力大会提出，音视频生产正从人工工作流转向Agent驱动工作流。AI MediaKit等开发套件将视频理解、剪辑、字幕、画质增强、转码和音频处理封装为Agent可调用工具，支撑生产级内容交付。

InfoQ 中国

AI 前沿重要度 5 07-03 17:19

DeepSeek DSpark引热议

社区讨论DeepSeek最新DSpark方案，称其速度显著快于MTP类方法。当前信息主要来自解读视频和社区转述，仍需等待论文或官方细节验证。

Reddit r/LocalLLaMA

AI 前沿重要度 8 07-03 15:35

阿里发布超导材料 AI Agent

阿里达摩院联合中国人民大学、中国科学院大学等发布超导材料发现 AI Agent ElementsClaw。系统用 28 个 GPU 小时筛查 240 万种稳定晶体，预测 6.8 万种潜在超导体，并实验验证出 4 种此前未知的新超导体。

量子位

AI 前沿重要度 6 07-03 15:12

文心5.0接入 WorldRouter

WorldClaw 与百度智能云达成战略合作，文心大模型 5.0 系列通过千帆平台接入 WorldRouter，面向开发者开放调用。双方还将围绕 Skill 共建、A2A 场景和 AgentOS 展开合作。

量子位

AI 前沿重要度 7 07-03 13:24

涌生智能发布生物实验 Agent

华大智造子公司涌生智能与上海人工智能实验室发布 ProtoPilot 和 BioLab Bench，瞄准生命科学实验室中的多智能体自动化。系统尝试从自然语言实验意图到设备执行形成闭环，被视为 Physical AI 在生物实验场景的落地探索。

量子位

AI 前沿重要度 7 07-03 09:19

地瓜机器人发布Uranus

地瓜机器人发布世界模型 Uranus，将其定位为具身智能开发基础设施，而非直接作为机器人“大脑”。Uranus 重点用于评测 VLA 和世界模型，并缓解仿真到真实场景的 sim-to-real gap。

量子位

最新动态