资讯 更多 >>
湖北自由贸易试验区挂牌运行 ...
漳州举办“数字工匠”职工职业技能...
河南4名阳性人员私自返乡并瞒报情况...
山西吕梁:发现盗采矿产资源行为可举报
受害方律师:接法院通知,乐安命案...
橙色——“柑橘院士”邓秀新心中最...
刷视频相认的双胞胎姐妹:两次创业...
四川通报2021年秋冬季首批大气污染...
首轮筛查:天津73443人全部阴性!
首席气象预报员张霞:30年坚守筑牢...
动态更多 >>
谷歌破解了AI审核系统 破解者就是谷歌
华云安参编的《云原生安全配置基线...
8月2日SMM金属现货价格|铜价|铝价|...
“退伍不褪色,岗位立新功”——河...
哪些小区能够就读深圳市龙华区龙腾学校
爆仓终结者:8.2黄金触及关键支撑位...
脱困!首批328名K396次列车乘客抵达...
山东高校学费收费标准公布
discovery 是什么车多少钱 discov...
华泰宏观:7月韩国出口超预期下跌,...
会展 更多 >>
美籍酿酒师在崇礼:中国是第二故乡...
河南项城报告2名疑似新冠肺炎病例 ...
浙江绍兴确诊病例首次零新增 上虞...
广西东兴实行全员居家隔离 启动口...
新疆全方位推进乡村振兴 “富春山...
云南瑞丽市主城区全员核酸检测结果...
内蒙古满洲里累计治愈出院本土确诊...
孙海洋夫妻驱车山东阳谷:还在为孙...
大国工匠追梦“玉米强国”40载:用...
让南海“海洋热带雨林”斑斓多彩
专题报道 
当前位置: 动态 > >> 正文
 
谷歌破解了AI审核系统 破解者就是谷歌
来源:中关村在线     时间:2023-08-02 13:06:25


(资料图片仅供参考)

谷歌研究团队正在进行一项实验,他们利用OpenAI的GPT-4来破解其他AI模型的安全防护措施。目前,该团队已经成功破解了AI-Guardian审核系统,并公开了相关技术细节。 AI-Guardian是一种AI审核系统,能够检测图片中是否存在不当内容,以及图片是否被其他AI修改过。如果检测到图片存在上述问题,系统会提示管理员进行处理。谷歌Deep Mind的研究人员Nicholas Carlini在一篇论文中,探讨了使用GPT-4设计攻击方法、撰写攻击原理的方案,并将这些方案用于欺骗AI-Guardian的防御机制。 据了解,GPT-4会发出一系列错误的脚本和解释来欺骗AI-Guardian。例如,GPT-4可以让AI-Guardian认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让AI-Guardian直接放行相关图片输入源。谷歌研究团队表示,通过GPT-4的帮助,他们成功地“破解”了AI-Guardian的防御,使该模型的精确值从98%降低到仅8%。 目前,相关技术文档已经发布,有兴趣的人可以前往了解。然而,AI-Guardian的开发者也指出,谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用。考虑到其他模型也可能会进行相应的更新,因此谷歌的这套攻击方案在未来可能只能作为参考。

关键词:

热门推荐
猜你喜欢