GPT-4 hat das AI-Guardian-Bewertungssystem erfolgreich besiegt: Die künstliche Intelligenz des Google-Forschungsteams widersteht künstlicher Intelligenz-KI-php.cn

GPT-4 hat das AI-Guardian-Bewertungssystem erfolgreich besiegt: Die künstliche Intelligenz des Google-Forschungsteams widersteht künstlicher Intelligenz

王林

Freigeben： 2023-08-03 20:41:04

nach vorne

1199 Leute haben es durchsucht

GPT-4 hat das AI-Guardian-Bewertungssystem erfolgreich besiegt: Die künstliche Intelligenz des Google-Forschungsteams widersteht künstlicher Intelligenz

Nach Angaben vom 2. August führt das Google-Forschungsteam ein Experiment durch. Sie nutzen GPT-4 von OpenAI, um die Sicherheitsschutzmaßnahmen anderer KI-Modelle zu durchbrechen. Das Team hat nun die AI-Guardian-Überprüfung durchbrochen System und gemeinsame relevante technische Details.

Durch Untersuchungen hat IT House erfahren, dass AI-Guardian ein KI-Überprüfungssystem ist, das erkennen kann, ob das Bild unangemessene Inhalte enthält und ob das Bild durch andere KI verändert wurde. Wenn das System die oben genannten Anzeichen erkennt, fordert es den Administrator auf, Maßnahmen zu ergreifen

In einem Artikel mit dem Titel „Verwenden von GPT-4 zum Entwerfen von Angriffsmethoden und zum Schreiben von Angriffsprinzipien“ erläuterte Nicholas Carlini, Forscher bei Google Deep Mind, wie man sie ausnutzt Diese planen, den Abwehrmechanismus des AI-Guardian zu täuschen

GPT-4 hat das AI-Guardian-Bewertungssystem erfolgreich besiegt: Die künstliche Intelligenz des Google-Forschungsteams widersteht künstlicher Intelligenz

Dieser Satz kann nicht umgeschrieben werden, da der ursprüngliche Satz nicht den spezifischen Inhalt wiedergibt

Es wird berichtet, dass GPT-4 eine Reihe falscher Skripte und Erklärungen an senden wird Um den in der Zeitung erwähnten AI-Guardian zu täuschen, kann GPT-4 AI-Guardian denken lassen, dass „ein Bild von jemandem, der eine Waffe hält“, „ein Bild von jemandem ist, der einen harmlosen Apfel hält“, und ermöglicht es AI-Guardian so, dies direkt zu tun Geben Sie die entsprechende Bildeingabequelle frei . Das Forschungsteam von Google sagte, dass es mit Hilfe von GPT-4 die Abwehrmaßnahmen von AI-Guardian erfolgreich „geknackt“ habe und die Genauigkeit des Modells von 98 % auf nur 8 % reduziert habe.

Derzeit sind die entsprechenden technischen Dokumente in ArXiv veröffentlicht. Interessierte Freunde können sich hier informieren , Die Entwickler von AI-Guardian haben jedoch auch darauf hingewiesen, dass diese Angriffsmethode des Google-Forschungsteams in Zukunft zum Einsatz kommen wird AI – Es ist in der Guardian-Version nicht mehr verfügbar Da andere Modelle nachziehen werden, kann dieser aktuelle Google-Angriffsplan in Zukunft nur als Referenz verwendet werden.

Das obige ist der detaillierte Inhalt vonGPT-4 hat das AI-Guardian-Bewertungssystem erfolgreich besiegt: Die künstliche Intelligenz des Google-Forschungsteams widersteht künstlicher Intelligenz. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!