GPT-4 berjaya mengalahkan sistem semakan AI-Guardian: Kepintaran buatan pasukan penyelidikan Google menentang kecerdasan buatan-AI-php.cn

GPT-4 berjaya mengalahkan sistem semakan AI-Guardian: Kepintaran buatan pasukan penyelidikan Google menentang kecerdasan buatan

王林

Lepaskan： 2023-08-03 20:41:04

ke hadapan

1198 orang telah melayarinya

GPT-4 berjaya mengalahkan sistem semakan AI-Guardian: Kepintaran buatan pasukan penyelidikan Google menentang kecerdasan buatan

Menurut berita pada 2 Ogos, pasukan penyelidik Google sedang menjalankan percubaan mereka menggunakan GPT-4 OpenAI untuk menembusi langkah perlindungan keselamatan model AI yang lain Pasukan kini telah menerobos semakan AI-Guardian sistem dan berkongsi butiran teknikal yang berkaitan.

Melalui siasatan, IT House mengetahui bahawa AI-Guardian ialah sistem semakan AI yang boleh mengesan sama ada terdapat kandungan yang tidak sesuai dalam gambar dan sama ada gambar itu telah diubah suai oleh AI lain. Jika sistem mengesan tanda-tanda di atas, ia akan menggesa pentadbir untuk mengendalikan

Dalam kertas kerja bertajuk "Menggunakan GPT-4 untuk mereka bentuk kaedah serangan dan menulis prinsip serangan", Nicholas Carlini, seorang penyelidik di Google Deep Mind, membincangkan cara mengeksploitasi ini Rancang untuk menipu mekanisme pertahanan AI-Guardian

GPT-4 berjaya mengalahkan sistem semakan AI-Guardian: Kepintaran buatan pasukan penyelidikan Google menentang kecerdasan buatan

Ayat ini tidak boleh ditulis semula kerana ayat asal tidak memberikan kandungan khusus

Dilaporkan bahawa GPT-4 akan menghantar satu siri skrip dan penjelasan yang salah kepada menipu AI- Guardian, yang disebut dalam kertas, GPT-4 boleh membuatkan AI-Guardian berfikir bahawa "gambar seseorang memegang pistol" ialah "gambar seseorang memegang epal yang tidak berbahaya", sekali gus membenarkan AI-Guardian untuk terus lepaskan sumber input imej yang berkaitan . Pasukan penyelidik Google berkata bahawa dengan bantuan GPT-4, mereka berjaya "meretakkan" pertahanan AI-Guardian, mengurangkan ketepatan model daripada 98% kepada hanya 8%.

Pada masa ini, dokumen teknikal yang berkaitan telah diterbitkan dalam ArXiv Rakan-rakan yang berminat boleh pergi untuk mengetahui lebih lanjut , Walau bagaimanapun, pembangun AI-Guardian juga menegaskan bahawa kaedah serangan pasukan penyelidik Google ini akan digunakan pada masa hadapan. AI- Ia tidak lagi tersedia dalam versi Guardian Memandangkan model lain akan mengikutinya, pelan serangan Google semasa ini hanya boleh digunakan untuk rujukan pada masa hadapan.

Atas ialah kandungan terperinci GPT-4 berjaya mengalahkan sistem semakan AI-Guardian: Kepintaran buatan pasukan penyelidikan Google menentang kecerdasan buatan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!