智谱发布GLM-5.2
Two Minute Papers介绍智谱AI的GLM-5.2,称其代表新一代大模型能力进展。视频附带官方发布链接,但热度信号较低,需结合论文和实测进一步验证其领先性。
Two Minute Papers介绍智谱AI的GLM-5.2,称其代表新一代大模型能力进展。视频附带官方发布链接,但热度信号较低,需结合论文和实测进一步验证其领先性。
OpenAI推出LifeSciBench,用于评估AI系统处理真实生命科学研究任务和决策的能力。该基准由专家撰写并审查,聚焦科研场景中的专业判断与工作流表现。
Anthropic发布自然语言自编码器相关研究,试图用更可读的方式观察Claude内部表征。该工作延续其机制可解释性路线,对大模型安全评估和行为理解有重要意义。
Google DeepMind介绍AI Control Roadmap,用于保护内部系统免受更强大且未完全对齐的AI Agent带来的风险。该框架采用纵深防御思路,试图在模型对齐之外增加系统级控制层。
OpenAI介绍Deployment Simulation方法,使用真实对话数据在发布前预测模型部署后的行为。该方法旨在提升安全评估准确性,提前发现模型上线后的潜在风险。
英伟达公开Nemotron 3 Ultra相关研究,被定位为免费可用的大模型能力进展。该事件同时涉及模型开放和算力生态绑定,对开发者与AI基础设施市场有关注价值。
OpenAI Academy推出三门新课程,帮助用户建立实用AI技能、构建可复用工作流,并将Agent应用到日常工作中。该动态属于OpenAI面向大众和企业用户的教育生态扩展。
OpenAI介绍天体物理学家Chi-kwan Chan如何使用Codex构建黑洞模拟工具。该案例展示AI编程助手在极端物理研究和广义相对论验证中的科研辅助价值。
Google DeepMind 联合 Schmidt Sciences 等机构发起最高 1000 万美元研究资助,聚焦多智能体 AI 系统的安全、协作与可预测性。随着大量代理在数字环境中交互,该方向被视为下一阶段 AI 安全的重要基础设施问题。
Google DeepMind 发布 Gemini 3.5 Live Translate,用于实时语音到语音翻译。模型可自动识别 70 多种语言,并保留说话者语调、节奏和音高,区别于传统等待整句结束的轮流翻译系统。
Google DeepMind公布与Fab AI及塞拉利昂教育部合作的随机对照试验结果。研究覆盖12所学校、1763名初中生,评估Gemini引导式学习在8周内对数学学习进展的影响,强调AI辅助教师而非替代教师。
OpenAI发布“Built to benefit everyone”计划,强调AI普惠访问、安全部署与共享繁荣。该计划延续其AGI治理叙事,试图为未来能力扩张建立公共利益框架。
OpenAI推出Economic Research Exchange,面向研究者开放项目申请,聚焦AI对就业、生产率和宏观经济的影响。该计划将为AI政策制定和劳动力转型提供更多实证研究。
DeepMind公开AlphaProof Nexus相关结果,展示AI在数学证明和推理任务上的新方法。该方向代表前沿模型从语言生成走向形式化推理,具有较高技术关注度。
Hugging Face介绍Nemotron 3.5 Content Safety,面向企业AI安全管线提供可定制的多模态内容安全评估。新版本可将用户提示、图片和助手回复放入统一上下文判断,覆盖文本与图像交互产生的违规风险。
OpenAI介绍名为Dreaming的新记忆系统,旨在让ChatGPT更好记住用户偏好,并在对话间保持更新、相关的上下文。记忆能力提升将直接影响个性化助手和长期任务体验。
OpenAI发布“智能时代生物防御”行动计划,强调利用AI增强生物安全、疫情响应和科研韧性。该议题涉及AI能力边界、国家安全和生命科学治理,政策敏感度较高。
Two Minute Papers介绍AI“协同科学家”概念,强调AI在科研假设生成、实验设计和知识发现中的辅助作用。该内容属于AI科研应用科普,信息密度有限但契合AI for Science趋势。
Anthropic推出Claude Opus 4.8,视频重点讨论其在诚实性、可靠性和安全表现上的变化。作为Claude高端模型迭代,该进展值得关注。
OpenAI提出美国前沿AI治理框架,强调以联邦层面统一安全、韧性和国家安全规则。该方案延续其近期政策倡议,聚焦高能力模型监管与产业竞争力平衡。