MosaicLeaks揭示研究代理泄密
MosaicLeaks 提出深度研究代理隐私泄漏评测,关注代理在结合私有文档和外部检索时是否通过查询泄露敏感信息。测试显示多款模型频繁泄密,作者提出 PA-DR 训练方法,在提升任务成功率的同时显著降低泄漏率。
事件进展(1 篇报道)
-
2026-06-19 02:13Hugging Face Blog MosaicLeaks: Can your research agent keep a secret?
MosaicLeaks 提出深度研究代理隐私泄漏评测,关注代理在结合私有文档和外部检索时是否通过查询泄露敏感信息。测试显示多款模型频繁泄密,作者提出 PA-DR 训练方法,在提升任务成功率的同时显著降低泄漏率。