AI 前沿 重要度 5

CDD可从logits还原微调数据

研究者提出Contrastive Decoding Diffing(CDD),仅凭基础模型与微调模型的灰盒logits访问,就可从窄域微调LLM中恢复逐字训练内容。该方法不需要权重、激活或探测语料,凸显微调数据泄露与模型API安全风险。

事件进展(1 篇报道)

  1. 2026-07-04 03:01

← 返回首页