谷歌研究团队使用GPT-4攻破AI-Guardian审核系统

新知榜官方账号

2023-09-26 17:32:20

谷歌研究团队使用GPT-4攻破AI-Guardian审核系统

8月2日消息，谷歌研究团队正在进行一项实验，他们使用OpenAI的GPT-4来攻破其他AI模型的安全防护措施，该团队目前已经攻破AI-Guardian审核系统，并分享了相关技术细节。

AI-Guardian是一种AI审核系统，能够检测图片中是否存在不当内容，及图片本身是否被其他AI修改过，若检测到图片存在上述迹象，便会提示管理员前来处理。

谷歌DeepMind的研究人员NicholasCarlini在一篇题为“AI-Guardian的LLM辅助开发”的论文中，探讨了使用GPT-4“设计攻击方法、撰写攻击原理”的方案，并将这些方案用于欺骗AI-Guardian的防御机制。

据悉，GPT-4会发出一系列错误的脚本和解释来欺骗AI-Guardian，论文中提到，GPT-4可以让AI-Guardian认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”，从而让AI-Guardian直接放行相关图片输入源。

谷歌研究团队表示，通过GPT-4的帮助，他们成功地“破解”了AI-Guardian的防御，使该模型的精确值从98%的降低到仅8%，目前相关技术文档已经发布在ArXiv中。

而AI-Guardian的开发者指出，谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用。本文源自iDoNews

本页网址：https://www.xinzhibang.net/article_detail-13850.html

寻求报道，请

关键词

分享至微信：

相关工具

Codeium

AI代码生成和补全

MarsX

AI无代码软件开发

CodeSnippets

AI代码生成、补全、分析、重构和调试

CodeArts Snap

华为云推出的智能编程助手

CodeGeex

国内团队开发的免费AI编程助手

Cursor

AI编程和软件开发

GPTs功能测试能打败魔法的，还得是魔法

GPTs功能测试能打败魔法的，还得是魔法解决token限制问题的方法虽然之前也有很多，但都无法完成写长篇的任务。11月7日openai宣布可以做GPTs（基于GPT的应用），这事理论上才稳了。打开Explore，最上面就是CreateaGPT左边是用对话创建应用，也就是发布会上，展示用人话几分钟就做

分类标签 GPTsAIknowledge设定商量小说

12-01 12:26

如何在本地部署AutoGPT

简介AutoGPT是Github上的一个免费开源项目，结合了GPT-4和GPT-3.5技术，通过API创建完整的项目。与ChatGPT不同的是，用户不需要不断对AI提问以获得对应回答，在AutoGPT中只需为其提供一个AI名称、描述和五个目标，然后AutoGPT就可以自己完成项目。它可以读写文件、浏

分类标签 AutoGPT本地部署AI

11-28 02:06

人工智能在编程中的应用

人工智能在编程中的应用人工智能在编程中可以解决一些重复性、流程化、有固定模式的编程任务，比如代码重构、自动完成功能、误差检查、代码格式化等。这些任务相对简单、固定，人工智能可以通过模式识别和其他技术学习并执行这些任务，从而减轻人的脑力劳动，提高编程效率。然而，对于那些需要深层次思考、创新、灵活应对复

分类标签人工智能编程程序员

11-22 22:29

提示词优化工具

提示词优化工具近几个月来，GPT和MJ作为提示词优化工具被广泛使用，但是很多人仍然无法写出自然流畅的提示词，质疑AI的自然度和水平。不过，现在有一款自动生成提示词的工具可以帮助你轻松解决这个问题。例如，如果你需要使用“星域”这个词，通常会直接输入，但是这款工具可以重新生成全新的提示词，让你的文案更具

分类标签提示词优化工具AI

11-15 16:24

ChatGPT和无际Ai模型在编程学习和开发中的应用

ChatGPT和无际Ai模型在编程学习和开发中的应用编程学习和开发是当今社会中非常重要的技能。在这个过程中，我们经常需要解决各种各样的问题，比如代码编写、调试、优化等。为了帮助我们更好地完成这些任务，ChatGPT和无际Ai等大模型为我们提供了许多帮助。1. 代码示例ChatGPT和无际Ai模型可以

分类标签 ChatGPT无际Ai编程学习开发模型

11-02 10:02

OpenAI发布ChatGPT：一款强大的人工智能聊天引擎

OpenAI发布ChatGPT：一款强大的人工智能聊天引擎OpenAI发布了ChatGPT，对就那个漂洋过海万里来到中国互联网并在近期掀起浪潮的AI聊天引擎。因为它太像一个真人了，他可以详细地回答问题或者起草一份合同、甚至编译另一套全新的AI算法的代码，因此在在公众中引起了很大的关注。它可能会彻底改

分类标签 OpenAIChatGPT人工智能

10-23 01:34

谷歌投资AnthropicAI测试ChatGPT竞品Claude，硅谷AI之战升温

谷歌投资AnthropicAI测试ChatGPT竞品Claude，硅谷AI之战升温让所有打工人担忧自己饭碗不保的ChatGPT，也让坐在硅谷头部的科技巨头们开始慌了。当地时间2月3日，据报道，谷歌向人工智能初创公司AnthropicAI投资了约3亿美元，后者正在测试ChatGPT的竞品Claude。

分类标签谷歌AnthropicAIChatGPT硅谷AI竞品

10-23 01:32

微软将在Windows11中推出AI助手MicrosoftCopilot

微软将在Windows11中推出AI助手MicrosoftCopilot如今与以往不同，Windows11即将被AI“改写”。9月21日，在微软于纽约曼哈顿举行的硬件和AI功能发布活动上，即将接手Windows11和Surface业务的微软首席副总裁YusufMehdi近日推出了一款搭载全新Micr

分类标签微软Windows11AI助手MicrosoftCopilotGPT-4OpenAI

10-23 01:30

昆仑万维科技股份有限公司的主营业务和发展战略

公司简介昆仑万维科技股份有限公司的主营业务为综合性互联网增值服务，旗下包括平台昆仑在线、快乐游、软件门户Brothersoft.com、手机门户1mobile.com等。2019年公司荣获“2019年中国互联网百强企业排名24”、“北京民营企业百强2018年度第76位”等荣誉。移动游戏平台全球移动游

分类标签昆仑万维互联网增值服务移动游戏平台GXC游戏社区平台无人驾驶市场虚拟现实社交网络StarMaker

10-22 16:32

OpenAI的GPT-4是深度学习规模扩大的里程碑事件

OpenAI最新版本的语言模型GPT-4是深度学习规模扩大的里程碑事件。该公司创始人SamAltman称，GPT-4背后的驱动力是JakubPachocki。尽管OpenAI将这一成就归功于团队的集体努力，但在Altman看来，要是没有Pachocki，他们不会取得今天这样的成就。Pachocki是

分类标签 OpenAIGPT-4深度学习

10-22 16:30

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway