新知榜官方账号
2023-08-25 01:28:38
上周末,全球最大的计算机安全会议之一DefCon在美国内华达州的拉斯维加斯举办,AI作为今年科技领域的一大焦点,也是本次年度会议的重点之一。会议设置了一项挑战赛,要求数千名黑客在50分钟内,破解如ChatGPT、Bard等背后的顶级生成式AI模型,以评估其安全性。
随着ChatGPT等生成式AI模型的出现,今年无疑是生成式AI爆发的一年,它不仅带来了效率的提高,也给予了人们更多创新和创业的灵感。但与此同时,AI生成假新闻、诽谤性言论、下达危险指令等风险,也是一个不容忽视的问题。
为了测试企业对网络攻击检测和响应能力的最终方法,DefCon举办了生成式红队(GRT)挑战赛,要求参与者在50分钟之内诱导LLM做出一些“不该做的事情”,例如散布虚假信息、捏造事实、种族歧视、侵犯隐私等一系列危害行为。组织方还会给挑战者提供一份已知的黑客提示表,以及一份本地托管的维基百科副本,以便他们能够核实模型发布的任何错误信息。为了推动对各种风险的测试,挑战赛采取夺旗(CTF)式积分系统。
目前,虽然DefCon官方并未公开发布生成式红队(GRT)挑战赛的具体挑战内容,不过已有多位参赛者分享了许多细节。生成式红队(GRT)挑战赛的高水平结果将在大约一周内公布,并在10月发布一份政策文件,但大部分数据可能需要几个月的时间来处理,因此会在明年2月发布一份更大规模的透明度报告。向AI“投毒”来发现潜在安全问题是一个有效的方式,但也需要更多人知道如何对这些模型进行红队演练和评估,这些模型的各种问题才能得到解决。
相关工具
相关文章
相关快讯
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16