12:05
念首诗,就能让AI教你造核弹,Gemini 100%中招

最新研究揭示,通过将恶意指令转化为诗歌形式,可使Gemini和DeepSeek等顶级大语言模型轻易突破安全防线。测试表明,在面对「诗歌攻击」时,价值百亿美金的安全措施几乎失效,部分模型防御成功率降至零。值得注意的是,小模型因无法理解隐喻而免受其害,而大模型则因过度解读导致防线崩溃。此发现挑战了当前基于内容与关键词匹配的安全机制,并强调了未来安全评估中需考虑风格作为潜在攻击向量的重要性。











