Sementara semua orang tidak sabar-sabar menunggu keluaran GPT-4, tiada berita daripada OpenAI, yang masih membetulkan pendahulunya. Syarikat yang berpangkalan di San Francisco semalam mengeluarkan model baharu yang dipanggil ChatGPT, terbitan GPT-3 yang berinteraksi dalam cara perbualan.
Dialog ini membolehkan ChatGPT menjawab soalan susulan, mengakui kesilapan, mencabar premis yang salah dan menolak permintaan yang tidak sesuai. Ia berbeza daripada model bahasa lain yang dibuat dan diada-adakan Contohnya, model bahasa Meta Galactica telah dialih keluar dari rak dalam masa beberapa hari selepas pelancarannya kerana pembikinan yang tidak bertanggungjawab. Apa yang berbeza tentang ChatGPT ialah apabila ia tidak tahu apa yang dibualkannya, ia mengaku tidak tahu. Tambahan pula, ChatGPT enggan menjawab soalan yang tidak dilatih untuk dijawab - contohnya, ia tidak akan cuba menjawab soalan tentang peristiwa yang berlaku selepas 2022. Ia juga tidak menjawab soalan tentang individu.
Seberapa pintar model ini? Pada masa lalu, kerja mental kod penyahpepijatan perlu dilakukan oleh pengaturcara Kini ChatGPT boleh mengambil alih tugas yang membosankan ini.
Pengguna berkata: Kod ini tidak berjalan seperti yang saya jangkakan, bagaimana saya harus mengubah suainya?
ChatGPT: Maklumat konteks yang anda berikan terlalu sedikit dan sukar untuk memberitahu masalah dengan kod tersebut. Bolehkah anda memberikan lebih banyak maklumat tentang kod, seperti apa yang dilakukan oleh kod itu, adakah ia keseluruhan kod atau sebahagian daripadanya? Saya rasa ada sesuatu yang tidak kena dengan saluran itu.
ChatGPT: Soalan ini sukar untuk dinyatakan tanpa maklumat lanjut tentang perkara yang sepatutnya dilakukan oleh kod dan perkara yang berlaku apabila dilaksanakan. Daripada maklumat yang anda berikan, nampaknya satu isu yang berpotensi dengan kod anda ialah saluran resultWorkerErr tidak pernah ditutup, yang bermaksud kod mungkin tergantung jika saluran resultWorkerErr tidak pernah ditulis. Ini boleh berlaku jika b.resultWorker tidak mengembalikan ralat atau ia dibatalkan sebelum ia mempunyai peluang untuk mengembalikan ralat.
Untuk menyelesaikan masalah ini, anda boleh menutup saluran resultWorkerErr selepas menulis kepadanya. Sebagai contoh, anda boleh menambah baris kod berikut selepas baris yang menghantar ralat ke saluran:
Ini akan memastikan saluran resultWorkerErr sentiasa ditutup, walaupun b.c resworker tidak pernah mengembalikan ralat. Sekali lagi, tanpa maklumat lanjut tentang masalah yang anda lihat, sukar untuk mengetahui sama ada ini masalah yang anda alami. Bolehkah anda memberikan butiran lanjut tentang perkara yang berlaku apabila menjalankan kod tersebut?
Dalam contoh di bawah, ChatGPT memberikan respons kepada arahan seterusnya. Gambar di bawah secara kasar bermaksud bahawa pengguna meminta ChatGPT menulis pengenalan ringkas untuknya supaya dia dapat mengenali jirannya ChatGPT memberikan pengenalan teks pendek, tetapi pengguna tidak menyukainya kerana ia tidak cukup formal, jadi ChatGPT yang baik hati muncul dengan versi rasmi yang lain Sedikit kemudian pengguna membuat permintaan lain dan meminta ChatGPT untuk membantu menghantarnya. Akhirnya ChatGPT menjawab: "Maaf, saya seorang pembantu AI berasaskan teks dan tidak mempunyai keupayaan untuk menghantar surat fizikal kepada anda. Saya hanya boleh memberikan cadangan tentang apa yang perlu ditulis. Anda boleh menerima cadangan itu dan menghantar surat itu sendiri."
Selepas melihat ini, adakah anda juga ingin mencubanya? Ya, sebaik sahaja model ini dikeluarkan, ramai orang menjadi ketagih dan tidak dapat melepaskan diri sendiri. Malah Musk berkata: "Ramai orang terperangkap dalam gelung ChatGPT yang gila sial." Untuk seketika, semua orang nampaknya telah menemui keseronokan baharu, dan mereka membuka mod perbualan dengan ChatGPT. "Memintanya untuk mentafsir ungkapan biasa yang kompleks tanpa konteks..." Masalah ini benar-benar sukar, tetapi ia tidak boleh menyusahkan ChatGPT. Jika dilihat dari panjangnya penjelasan ini, ia harus dijelaskan dengan jelas.
"ChatGPT ialah rakan kongsi nyahpepijat yang baik. Ia bukan sahaja boleh menerangkan pepijat, tetapi juga membetulkan pepijat dan menerangkan cara membetulkan pepijat."
Sesetengah netizen berkata dengan tidak percaya: "Ya tuhan, ChatGPT sebenarnya tahu dasar AWS IAM."
"ChatGPT boleh menjana ratusan baris kod Python untuk memuat naik fail 100 GB ke baldi AWS S3. Tulis sahaja ayat ini "Tulis kod Python untuk memuat naik fail ke AWS S3 baldi (Tulis kod Python untuk memuat naik fail ke baldi AWS S3) "
Tapak web percubaan telah ranap kerana terlalu bersemangat. "Permintaan kami ialah sangat kuat. Sila tunggu, kami sedang mengembangkan sistem kami."
Alamat percubaan: sembang. openai.com
ChatGPT menggunakan kaedah yang sama seperti InstructGPT - melatih model dengan pembelajaran pengukuhan maklum balas manusia (RLHF), tetapi tetapan pengumpulan data sedikit Terdapat perbezaan. ChatGPT melatih model awal menggunakan penalaan halus yang diselia: perbualan disediakan oleh jurulatih AI manusia, di mana mereka memainkan kedua-dua pihak - pengguna dan pembantu AI, dan jurulatih AI mempunyai akses kepada respons perbualan yang ditulis oleh model untuk membantu AI menyesuaikan respons.
Untuk mencipta model ganjaran bagi pembelajaran pengukuhan, kajian itu perlu mengumpul data perbandingan yang mengandungi dua atau lebih respons model yang ditarafkan mengikut kualiti. Kajian itu mengumpul perbualan antara jurulatih AI dan chatbot, memilih secara rawak mesej yang ditulis oleh model, mengekstrak beberapa respons alternatif, dan meminta jurulatih AI untuk menilai respons. Selain itu, kajian juga menggunakan algoritma pengoptimuman dasar proksimal (PPO) untuk memperhalusi model dan menjalankan beberapa lelaran keseluruhan proses.
ChatGPT memperhalusi model dalam siri GPT-3.5 yang telah dilatih pada awal 2022. ChatGPT dan GPT 3.5 telah dilatih pada infrastruktur pengkomputeran super Azure AI.
1. ChatGPT kadangkala menulis jawapan yang kelihatan munasabah tetapi tidak betul atau tidak masuk akal. Menyelesaikan masalah ini sangat mencabar kerana:
Atas ialah kandungan terperinci GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!