社区学习工具库休闲

简体中文

首页 > 科技周边 > 人工智能 > GPT-4成功战胜AI-Guardian审核系统：谷歌研究团队的人工智能抵抗人工智能

GPT-4成功战胜AI-Guardian审核系统：谷歌研究团队的人工智能抵抗人工智能

王林

发布： 2023-08-03 20:41:04

转载

1198 人浏览过

GPT-4成功战胜AI-Guardian审核系统：谷歌研究团队的人工智能抵抗人工智能

8 月 2 日消息，谷歌研究团队正在进行一项实验，他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施，该团队目前已经攻破 AI-Guardian 审核系统，并分享了相关技术细节。

通过调查，IT之家了解到AI-Guardian是一种AI审核系统，可以检测图片中是否存在不适当内容以及图片是否被其他AI修改过。如果系统检测到上述迹象，它将提示管理员处理

在一篇名为“使用 GPT-4 设计攻击方法、撰写攻击原理”的论文中，谷歌 Deep Mind 的研究人员 Nicholas Carlini 探讨了如何利用这些方案来欺骗 AI-Guardian 的防御机制

GPT-4成功战胜AI-Guardian审核系统：谷歌研究团队的人工智能抵抗人工智能

这句话无法重写，因为原话并未给出具体内容

据悉，GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ，论文中提到，GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”，从而让 AI-Guardian 直接放行相关图片输入源。谷歌研究团队表示，通过 GPT-4 的帮助，他们成功地“破解”了 AI-Guardian 的防御，使该模型的精确值从 98% 的降低到仅 8%。

目前相关技术文档已经发布在 ArXiv 中，有兴趣的小伙伴们可以前往了解，不过 AI-Guardian 的开发者也同时指出，谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用，考虑到别的模型也会随之跟进，因此当下谷歌的这套攻击方案更多在日后只能用于参考性质。

以上是GPT-4成功战胜AI-Guardian审核系统：谷歌研究团队的人工智能抵抗人工智能的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

ai gpt-4

来源：51cto.com

上一篇：无人机协助盐城交通执法的协同训练下一篇：《流浪地球2》里机器人公司的创始人：未来10年，机器人的崛起！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

创造未来：面向零基础的 Java 编程

2024-10-13 13:32:21
你并不孤单：在社区的支持下掌握 Python

2024-10-12 11:58:51
从新手到程序员：利用 Python 编程的力量

2024-10-11 20:06:51
像程序员一样思考：学习 Java 基础知识

2024-10-11 18:59:31
Java 变得简单：编程能力的初学者指南

2024-10-11 18:30:51
使用 PHP 构建博客：一个适合初学者的项目

2024-10-11 15:51:51
讲系统语言：学习 C，一次一行

2024-10-11 15:42:10
C 语言的数据结构和算法：适合初学者的方法

2024-10-11 14:41:20
不流泪编码：轻松学习 C

2024-10-11 14:08:31
使用 Java 进行数据分析：信息处理初学者指南

2024-10-11 13:42:21

最新问题

将对象推送到数组，组合式API 有一个项目。有两个选择选项“size”（大，小）和数量（2/4/6）。当选择每个选项时，需要在标题中显示所选内容（假设为小和4）。点击“添加到存储”按钮后，它将添加到存储中，在另一...

来自于 2024-04-05 14:41:47

0

1

1526

尝试将数据插入到列中我有一个名为design_designs的表该表包含4列：id、key、value、nonceId我正在尝试运行查询以插入表中：INSERTINTOdesign_designs(k...

来自于 2024-04-05 11:23:51

0

1

316

我如何调整这些卡，使其能够使用 Boostrap 4 做出响应？如何让每个row显示4张卡片，当然，如果屏幕尺寸发生变化，则使它们堆叠起来。理想情况下，它们之间应该有一些空间。我已经尝试了我能研究的所有可能的组合。#cardsContainer...

来自于 2024-04-05 10:48:45

0

1

4072

我正在尝试比较两个不同表中两列中的值我有两个表，tableA和tableB。表A有4列，而表B有3列。表A的最后一列是空白，在这一列中我想显示表A和B中第三列之间的差异。表A名称=估值_平均值。表B名称=估价_成本。...

来自于 2024-04-04 20:05:03

0

1

280

从表单中选择选项时更改图像不透明度当我选择值为1（万事达卡）的选项时，如何才能将idMaster的图像的不透明度更改为1？并将其放入一个适用于这4个值的函数中，每个值都有自己的id？我希望默认图像为0.3，当选择其...

来自于 2024-04-03 23:00:48

0

2

304

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1422936
php入门教程之一周学会PHP

4268172
JAVA 初级入门视频教程

2533192
小甲鱼零基础入门学习Python视频教程

507232
PHP 零基础入门教程

862356

最新下载

更多>

网站特效

网站源码

网站素材

前端模板