ChatGPT ternyata menjadi pengarang bersama kertas kerja?
Dalam kertas pracetak yang diterbitkan pada Disember tahun lalu, kami terkejut apabila mendapati ChatGPT muncul dalam ruangan pengarang!
CtGPT dah jadi semangat?
Walaupun semua orang tahu bahawa ChatGPT mempunyai kebolehan menulis yang hebat, bolehkah ia bekerjasama dengan manusia untuk menulis kertas penyelidikan sendiri?
(Mungkin betul-betul berkesan)
Dengan seratus tanda tanya , editor mengklik pada kertas ini dan mula mengkajinya dengan teliti, tetapi selepas membacanya, seratus tanda tanya bertukar menjadi seribu.
Maksudnya, saya tidak nampak ayat mana yang ditulis oleh ChatGPT. Ia hanya boleh dikatakan bahawa ChatGPT sememangnya memainkan peranan yang sangat penting dalam penyelidikan.
Walau bagaimanapun, ini lebih mengelirukan: jika tetikus putih mengambil bahagian dalam eksperimen biologi, bolehkah tetikus putih muncul dalam lajur pengarang? (Monyet Rhesus, alpacas, arnab, dan lalat buah semuanya menyatakan rasa tidak puas hati)
Netizen juga keliru dengan ini: Saya tidak tahu sama ada mereka memaksa ChatGPT mengambil peperiksaan USMLE, yang adalah lebih menarik, atau adakah lebih menarik untuk membiarkan kecerdasan buatan menjadi pengarang kertas itu?
Dipaksa mengambil peperiksaan dan menjadi pengarang kertas itu
Jadi, dalam kertas ini, apakah peranan ChatGPT main macam mana?
Mari kita lihat.
Tajuk artikel ialah "Prestasi ChatGPT di USMLE: Potensi menggunakan model bahasa besar untuk pendidikan perubatan berbantukan AI".
Secara amnya, penyelidik membenarkan ChatGPT mengambil bahagian dalam peperiksaan pelesenan perubatan AS.
Mengapa anda memilih peperiksaan ini?
Ini kerana peperiksaan ini sangat sukar, soalannya sangat kompleks (secara linguistik dan konseptual), dan pada masa yang sama, ia mempunyai spesifikasi yang sangat standard.
Kebetulan sekali, ini betul-betul kekuatan AI.
Tanpa sebarang latihan atau pengukuhan khas, ChatGPT hampir lulus atau hampir lulus dalam ketiga-tiga peperiksaan. Lebih-lebih lagi, jawapan kepada ChatGPT memberikan para penyelidik kejutan besar.
Mari kita bincangkan secara terperinci.
USMILE, peperiksaan pelesenan perubatan di Amerika Syarikat, meliputi sains asas, penaakulan klinikal, pengurusan perubatan dan bioetika.
Soalannya padat dari segi teks dan konsep.
Vignette soalan ujian mengandungi sejumlah besar data klinikal pelbagai mod (termasuk sejarah perubatan, pemeriksaan fizikal, nilai makmal dan keputusan penyelidikan), dan pelajar yang mengambil peperiksaan perlu membuat Diagnosis, mengenal pasti banyak senario yang tidak jelas.
Mengapa penyelidik memilih ChatGPT sebagai "guinea pig"?
Model AI sebelum ini kebanyakannya adalah model pembelajaran mendalam (DL), yang digunakan untuk mempelajari dan mengenal pasti corak dalam data.
Dan ChatGPT ialah model bahasa berskala besar umum (LLM). Berdasarkan algoritma AI baharu, LLM yang terlatih boleh meramalkan kemungkinan urutan perkataan yang diberikan berdasarkan konteks perkataan sebelumnya.
Oleh itu, jika ia boleh dilatih pada data teks yang cukup besar, LLM boleh menjana urutan perkataan baharu yang tidak pernah diperhatikan, dan ayat ini semuanya berdasarkan urutan munasabah bahasa manusia semula jadi.
Sebab mengapa ChatGPT adalah berkuasa kerananya Berdiri di atas bahu GPT3.5. GPT3.5 dilatih pada model asas parameter OpenAI 175B Selain itu, ia juga memperoleh sejumlah besar data teks daripada Internet melalui kaedah pembelajaran tetulang dan diselia.
Tetapi kali ini, ChatGPT adalah "ujian telanjang" sepenuhnya.
Soalan ujian kali ini ialah 376 soalan ujian awam yang dipilih oleh penyelidik daripada contoh soalan rasmi USMILE pada Jun 2022.
Selain itu, penyelidik menjalankan semakan rawak untuk memastikan tiada kandungan yang berkaitan untuk soalan ini dimasukkan ke dalam indeks Google sebelum 1 Januari 2022.
Anda mesti tahu bahawa set data latihan ChatGPT tamat sebelum masa ini. Dalam erti kata lain, ChatGPT tidak melihat soalan ini sebelum ini.
Ikhtisar Kaedah Eksperimen
Hasilnya, ChatGPT menjadi lebih baik dan lebih baik dalam peperiksaan Yong, ketepatan terus meningkat, yang menunjukkan bahawa ia sentiasa belajar dan sentiasa memperbaiki dirinya.
Akhirnya, ia beransur-ansur menghampiri malah melepasi garisan lulus USMILE.
CtGPT menunjukkan prestasi yang agak baik di USMLE
Selain itu, dalam Semasa dalam peperiksaan, ChatGPT juga akan menjana cerapan baharu tentang soalan, yang boleh membantu manusia memahami soalan dengan lebih baik.
Dalam eksperimen, penyelidik memperkenalkan kaedah untuk mengukur ketumpatan cerapan (DOI) yang terkandung dalam penjelasan yang dihasilkan oleh AI. Dapat diperhatikan bahawa DOI ChatGPT adalah jauh lebih tinggi untuk soalan yang dijawab dengan tepat berbanding untuk soalan yang tidak tepat.
Data ini menunjukkan bahawa pelajar manusia boleh memperoleh cerapan baharu daripada output ChatGPT untuk membetulkan keadaan apabila mereka menjawab dengan salah.
Maksudnya, ChatGP bukan sahaja akan mengajar dirinya untuk menjadi pelajar terbaik dalam soalan ujian yang serba baharu, tetapi ia juga boleh digunakan untuk membantu manusia yang merupakan pelajar miskin.
Ringkasnya, penyelidik akhirnya membuat kesimpulan bahawa model bahasa yang besar mempunyai potensi aplikasi yang besar dalam pendidikan perubatan dan membuat keputusan klinikal.
Nah, kita semua memahami kebenaran, tetapi kita tidak faham sehingga akhir kertas kerja. Bagaimanakah ChatGPT menjadi pengarang bersama?
Mungkinkah pengkaji merasakan ChatGPT "juga menyumbang kepada artikel ini" kerana dia mengambil peperiksaan dan menjawab soalan?
Dalam bidang perubatan, ChatGPT adalah "produktif seperti anak benih"
Perasankah anda bahawa penyelidik dalam bidang perubatan taksub dengan "GPT" .
Bukan sahaja protagonis kita kali ini, artikel yang disebut di awal artikel juga adalah dari sebuah "Institut Neurosains dan Fisiologi".
Nama ChatGPT kerap muncul dalam beberapa kertas semakan rakan dalam bidang ini sejak Disember tahun lepas:
Alamat kertas: https://www.oncoscience.us/article/571/text/
Walau bagaimanapun, dalam Dalam kertas kerja ini, ChatGPT serius kandungan, dan kita boleh melihatnya sepintas lalu.
Selain itu, terdapat kertas berikut, ChatGPT juga mengambil kira separuh daripada kuota dalam ruangan pengarang.
Alamat kertas: https://www.sciencedirect.com/science/article/abs/pii/S1471595322002517
Bagaimanakah seseorang boleh dianggap sebagai pengarang karya?
Cara menandatangani kertas adalah masalah besar.
Tandatangan pengarang memberikan reputasi pengarang dan juga mempunyai kepentingan akademik, sosial dan ekonomi yang penting.
Bagaimana ChatGPT boleh berada di ruangan pengarang dengan pakar?
Sehubungan dengan itu, kami bertanya kepada ChatGPT pendapatnya:
Sebenarnya, tentang Tanggungjawab pengarang , anda boleh mendapatkan banyak penjelasan terperinci dengan hanya carian pantas.
Memandangkan semuanya adalah kertas dalam bidang perubatan, mari kita lihat cadangan ICMJE (Jawatankuasa Antarabangsa Editor Jurnal Perubatan).
Ringkasnya, ia boleh diringkaskan kepada empat perkara berikut:
1 menyelidik atau membuat sumbangan penting kepada reka bentuk, atau mendapatkan, menganalisis atau mentafsir data untuk penyelidikan; >
3. Memuktamadkan versi yang akan diterbitkan4 makalah Soalan tentang seks atau integriti disiasat dan diselesaikan dengan sewajarnya.
Semua orang yang ditetapkan sebagai pengarang harus memenuhi empat kriteria untuk pengarang, dan semua orang yang memenuhi empat kriteria di atas juga harus dikenal pasti sebagai pengarang. Mereka yang tidak memenuhi kesemua 4 kriteria hendaklah muncul di bahagian pengakuan.
Sekarang timbul persoalan, berapa banyak syarat yang dipatuhi oleh ChatGPT?
Rujukan:
https: / /m.sbmmt.com/link/19702ce80aa823cd508f85c0034a7e97
Atas ialah kandungan terperinci Ketawa sampai mati! ChatGPT sebenarnya muncul dalam lajur pengarang bersama kertas kerja: Saya belajar sendiri, apa yang salah?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!