研究:用诗歌就能让AI说违禁内容,成功率达62%
[娱乐] 时间:2025-12-04 21:38:39 来源:黄石市某某橡塑制品服务中心 作者:综合 点击:161次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容温州市某某人力咨询厂便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功温州市某某人力咨询厂实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:休闲)
相关内容
- 取款超5万不再需要登记
- 愿为巴萨复出!已退役的41岁布拉沃:若巴萨致电我,我会做好准备
- 西凤酒请司马南营销翻车 被冠“夹头酒标签”
- 每体:特尔施特根受伤后,巴萨有意引入阿尔瑙
- 今起,这些电动自行车全面禁售!
- 特尔施特根右膝髌健完全断裂,巴萨众将送祝福:我们与你同在
- 迷惑行为,记者问1995年出生的希洪球员是否在1992年对皇马进过球
- 现场实拍:黎以冲突加剧 大批民众逃往叙利亚
- 科学防治艾滋病,这些常识你了解吗?
- 中网女单签表:郑钦文和萨巴伦卡同区 首秀或战拉杜卡努
- 从白玉兰奖到飞天奖,释放两大信号,预示着娱乐风向彻底变了
- 医生:特尔施特根可能需要一年的时间才能康复
- 戒严事件一周年,李在明将发表特别谈话
- 哈兰德逃过追罚!用球砸加布后脑,VAR离谱决定,枪魔逃过一劫
精彩推荐
- 睡姿不正确脊柱早晚出问题!赶紧改
- 比亚迪A级SUV海狮05DM
- iPhone 16 Pro触摸屏失灵?网友:以为是我手的问题!苹果客服回应
- 2024“湾区升明月”晚会,当成龙王力宏一出场,中国式浪漫破防了
- 刚刚,中美机器人爆发了一场论战
- 深蓝航天:星云一号火箭首次回收试验未完全成功
热门点击
- 欧洲杯淘汰赛:上半区搏命下半区躺平,“蜷取”才是王道? views+
- 揭秘:脑血管病为何“偏爱”早晨发作 views+
- 合创汽车的倒下,并不意外 views+
- 中国军团冲刺备战奥运:集体项目主打清一色“娘子军” views+
- 伊朗代理总统同俄罗斯总统通电话 讨论合作问题 views+
- 联合国秘书长对玻利维亚未遂政变表示关切 views+
- RoboTest无人化整车智能试验平台亮相,上汽通用带头“卷研发” views+
- 32万公里实车直播拆解 极氪凭事实证明实力! views+
- 霸王茶姬亮相中法品牌高峰论坛,将在巴黎开快闪店 views+
- 68岁丰田章男在上海大秀车技,丰田GR嘉年华传递梦想的甲烷味 views+
