Menurut laporan, OpenAI baru-baru ini melancarkan ciri baharu yang membolehkan tapak web menghalang perangkak web mereka daripada mengikis data daripada tapak web mereka untuk melatih model GPT bagi menangani isu seperti privasi data dan hak cipta
GPTBot ialah program perangkak web yang dibangunkan oleh OpenAI Ia boleh mencari dan mengekstrak maklumat secara automatik di Internet, dan menyimpan kandungan web untuk digunakan dalam melatih model GPT
Menurut catatan blog OpenAI, pentadbir tapak web boleh menghalang GPTBot daripada mengikis data daripada tapak web dengan melumpuhkan akses GPTBot dalam fail Robots.txt tapak web mereka, atau dengan menyekat alamat IPnya. OpenAI juga menyatakan bahawa halaman web yang dikikis menggunakan ejen pengguna GPTBot boleh digunakan untuk menambah baik model masa hadapan, sambil menapis sumber teks yang dibayar untuk akses, diketahui mengumpul maklumat pengenalan peribadi (PII) atau melanggar dasar OpenAI. Untuk sumber yang memenuhi kriteria pengecualian, membenarkan GPTBot mengakses tapak web akan membantu meningkatkan ketepatan, keupayaan umum dan keselamatan model AI
Atas ialah kandungan terperinci OpenAI mengehadkan akses perangkak web untuk melindungi data daripada digunakan untuk latihan model AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!