Anda bercakap tentang ChatGPT, perkara yang ditulisnya sangat realistik sehingga anda tidak dapat membezakannya?
Tidak mengapa!
Kini, "musuh"nya ada di sini -
Seorang lelaki Cina telah mencipta tapak web sedemikian untuk mengenal pasti sama ada teks ditulis oleh AI atau manusia.
Anda hanya perlu menampal kandungan yang sepadan dan hasilnya akan dianalisis dalam masa beberapa saat.
Ia: "Saya tahu ia adalah AI."
Sebaik sahaja alat ajaib ini dikeluarkan, boleh dikatakan ia cepat menawan hati semua orang.
Tidak, ia akan ranap pelayan sepenuhnya (nasib baik, ada yang ganti).
Kini, "anak-anak nakal" yang menggunakan ChatGPT untuk membuat kerja rumah mereka juga akan menderita?
Tapak web saya ini dipanggil GPTZero.
Ia bergantung terutamanya pada "perplexity", iaitu, "perplexity" teks, sebagai penunjuk untuk menentukan siapa yang menulis kandungan yang diberikan.
Rakan dalam bidang NLP tahu bahawa penunjuk ini digunakan untuk menilai kualiti model bahasa.
Di sini, apabila anda menyuap GPTZero sekeping kandungan ujian, ia akan mengira masing-masing:
1 Jumlah kekeliruan teks
Semakin tinggi nilai ini, semakin besar kemungkinannya telah dibuat oleh tangan manusia.
2. Rata-rata kebingungan semua ayat
Semakin panjang ayat, semakin rendah nilai ini biasanya.
3 Tahap kekeliruan setiap ayat
dibentangkan dalam bentuk carta bar Anda boleh tuding tetikus di atas setiap kotak untuk melihat apa ayat yang sepadan ialah.
Pengarang juga menjelaskan sebab carta palang sebegitu dilukis:
Menurut beberapa penyelidikan terkini: beberapa tulisan manusia The ayat mungkin mempunyai tahap kekeliruan yang rendah (seperti yang dinyatakan sebelum ini, kekeliruan manusia agak tinggi), tetapi semasa anda terus menulis, tahap kekeliruan pasti akan memuncak.
Sebaliknya, dengan teks yang dijana mesin, kebingungan diagihkan sama rata dan sentiasa rendah.
Selain itu, GPTZero juga akan memilih ayat yang mempunyai tahap kekeliruan yang paling tinggi (iaitu, ayat yang paling menyerupai manusia):
Itulah peraturannya, mari kita ambil ujian praktikal.
Pertama, berikut ialah berita Inggeris terkini (Bahasa Cina tidak disokong pada masa ini):
Tampal Enter kotak ujian (sila ambil perhatian bahawa setiap ayat mesti mempunyai sekurang-kurangnya 5 perkataan, adalah disyorkan bahawa setiap perenggan mempunyai 10 ayat, keputusan akan lebih tepat).
Tidak lama kemudian, GPTZero mengira bahawa jumlah kebingungan teks bagi teks ini ialah 27, dan purata kebingungan ayat ialah 171.2 Graf kebingungan bagi setiap ayat kelihatan seperti ini:
dan ayat dengan kekeliruan tertinggi mempunyai nilai 476. Melihat hasil ini, anda mungkin telah meneka jawapan kepada GPTZero:Ia ditulis oleh manusia.
Jawapan yang betul.
Mari kita lihat ChatGPT.
Tampalkan kandungan ke dalam kotak ujian Didapati jumlah kekeliruan teks perenggan ini ialah 31, purata kekeliruan ayat ialah 76.67, dan graf kekeliruan setiap satu. ayat adalah panjang.
Nampaknya setiap nilai kekeliruan agak berbeza daripada yang di atas. Anda sepatutnya dapat meneka bahawa ia ditulis oleh AI.
Malangnya, GPTZero tidak dapat memberikan jawapannya, dan saya harap kita boleh menambah sedikit lagi teks untuk dicuba.Jelas sekali, perenggan ini mempunyai perkataan yang mencukupi, tetapi tidak cukup ayat untuk membolehkan GPTZero melihat melalui "penyamaran" ChatGPT sepintas lalu.
Ujian 3: Berjaya
Kemudian mari cuba ChatGPT sekali lagi.Kali ini isinya cukup panjang dan cukup ayat.
Sudah tentu, tiada masalah GPTZero menjawab secara langsung:
Nampaknya ia telah mengetahui beberapa helah:
Iaitu, walaupun terdapat banyak perkataan, Bilangan ayat juga mestilah besar, sekurang-kurangnya 5 ayat, supaya GPTZero dapat mengenali melalui pengedaran histogram, dan ketepatan akhir dapat dipertingkatkan.
Perkara lain yang perlu dinyatakan ialah apabila cabaran itu gagal, selain kegagalan yang disebutkan di atas untuk mengenali, terdapat juga ralat pengecaman langsung - Sebagai contoh, jika AI menulis Hakim sama ada berita itu ditulis oleh manusia: Nilai sama ada berita yang ditulis oleh manusia adalah AI:
Dalam kes ini, mengikut petua yang dinyatakan di atas, menambah lebih banyak kandungan mungkin dapat mengembalikan hasilnya.
(Perhatikan bahawa mungkin. Bagi berita di atas, kami menampal semua kandungan, tetapi ia berkata tidak, dan meminta lebih banyak.)
Beliau kini seorang pelatih di Microsoft, telah menulis artikel teknikal untuk BBC, Bellingcat dan syarikat lain, dan juga telah menyertai pasukan pengasas alat peta Representable.
Semasa pengajiannya, dia datang ke Universiti Tsinghua untuk menyertai seminar penyelidikan bandar selama empat minggu.
Menurutnya, permohonan ini telah disiapkan di sebuah kedai kopi semasa cuti Tahun Baru. Sebab saya ingin membangunkan aplikasi ini adalah kerana terlalu banyak gembar-gembur tentang ChatGPT, dan manusia harus tahu artikel yang ditulis oleh AI. Pada masa ini dalam peringkat barebones, penambahbaikan pada model dan analisis dijangka dalam beberapa minggu akan datang. Selain itu, dia juga mendedahkan bahawa dia sedang menguji set data artikel berita yang ditulis oleh pelajar dan berharap akhirnya menerbitkan kertas kerja.Malah, lelaki ini bukan seorang sahaja yang tidak menyukai ChatGPT. Terdapat organisasi manusia lain yang telah membangunkan pengesan teks AI, AKA pembunuh ChatGPT.
Idea umum adalah serupa, iaitu, "gunakan sihir untuk mengalahkan sihir" dan gunakan perkara yang ditulis oleh AI untuk melatih AI baharu.
Sebentar tadi, OpenAI bekerjasama dengan Harvard dan universiti lain untuk bersama-sama mencipta pengesan: Pengesan Output GPT-2.
Pengarang mula-mula mengeluarkan set data "kandungan hasil GPT-2" dan WebText (diambil khas dari bar siaran asing Reddit) untuk membolehkan AI memahami "bahasa AI" Perbezaan antara " dan "pertuturan manusia".
Seterusnya, set data ini digunakan untuk memperhalusi model RoBERTa, dan pengesan AI diperolehi. Pertuturan manusia sentiasa diiktiraf sebagai Benar, dan kandungan yang dijana AI sentiasa diiktiraf sebagai Palsu.
(RoBERTa ialah versi BERT yang dipertingkatkan. BERT asal menggunakan set data saiz 13GB, tetapi RoBERTa menggunakan set data 160GB yang mengandungi 63 juta item berita Inggeris.)
Satu lagi Pemain wakil dalam tahun-tahun awal juga disebut semula kerana perkembangan baru ini.
Ia adalah model GLTR yang dibangunkan oleh Makmal AI Watson MIT-IBM dan Makmal NLP Harvard.
Ia menjalankan analisis statistik dan visualisasi teks, dan digunakan untuk mengesan model yang sama atau serupa yang asalnya digunakan untuk menjana teks. Pada masa ini, ia menyokong dua model: GPT-2 dan BERT.
Memandangkan output ialah kedudukan semua perkataan yang diketahui oleh model, setiap perkataan teks dikodkan warna mengikut kedudukan 10 teratas adalah hijau, 100 teratas adalah kuning, 1000 teratas adalah merah, dan ungu adalah perkataan yang kurang mungkin.
Jika sekeping teks mempunyai terlalu banyak warna kuning-hijau, maka teks ini dijana terutamanya oleh AI.
Kali ini GPTZero muncul lagi, dan ramai netizen berseru: Kerja luar biasa!
Tetapi sesetengah orang mengatakan bahawa pengesan teks hanyalah perlumbaan senjata yang gagal dan keputusan sebenar mereka tidak baik. Ia tidak boleh menghentikan pembangunan ChatGPT.
Pada masa yang sama, beberapa netizen membincangkan keperluan "sama ada artikel itu perlu ditunjukkan dengan jelas untuk ditulis oleh AI atau manusia."
Seorang pencipta lagu percaya bahawa ini adalah perlu, sama seperti apabila membaca majalah, ia akan menandakan "iklan", ini sepatutnya menjadi keperluan yang mudah.
Tetapi beberapa netizen segera menyatakan bantahan mereka. Ini seperti menggunakan PS dan kemudian menambah tanda air Adobe, yang tidak membawa apa-apa faedah kepada produk.
Apa pendapat anda tentang isu ini?
Pautan percubaan:
https://etedward-gptzero-main-zqgfwb.streamlit.app/
Pautan rujukan:
[1 ] https://brackets.substack.com/about
[2]https://www.reddit.com/r/programming/comments/102hxlg/gptzero_an_app_to_efficiently_tell_if_an_essay_is/
[3] https ://twitter.com/Marc__Watkins/status/1601746409203863553
[4]http://gltr.io/
Atas ialah kandungan terperinci 'Musuh' ChatGPT ada di sini! Adakah pengarang artikel itu manusia atau AI? Ia mengambil masa beberapa saat untuk mengesannya semasa cuti Tahun Baru.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!