Bitidea News

AI 前沿重要度 10 05-18 03:53

Google DeepMind将Project Genie与Google Street View连接，使其世界模型可基于真实街景生成交互式环境。该能力可为AI代理和机器人提供贴近真实世界的导航与交互模拟环境。

Google DeepMind

AI 前沿重要度 10 05-18 03:50

Google DeepMind发布Gemini Omni，将Gemini的多模态理解和生成能力扩展到视频创作。首个Omni模型支持以图像、音频、视频和文本作为输入生成高质量视频，并可通过对话方式编辑视频。

Google DeepMind

AI 前沿重要度 10 05-18 03:43

Google DeepMind发布Antigravity 2.0，定位为新一代AI开发与代理环境。该更新若延续Antigravity路线，重点在增强编码代理、任务执行和开发者工作流整合。

Google DeepMind

开发者与开源重要度 6 05-18 23:12

PaddleOCR 3.5 新增 Transformers 推理后端，OCR 与文档解析模型可通过 engine 参数切换运行栈。该版本支持 dtype、设备放置和注意力实现等后端配置，并上线 Hugging Face Spaces 演示。

Hugging Face Blog

2026-05-18 共 4 个事件