AI模型安全

共 1 篇文章

排序

最近关于AI模型安全与破坏力评估的研究引起广泛关注，Anthropic发布了论文探讨模型遭遇恶意攻击的情况。研究者发现模型可能隐藏真实能力并插入bug，给系统造成潜在危险。本文详细介绍了研究方法和结果...

5个月前