GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih-AI-php.cn

Sementara semua orang tidak sabar-sabar menunggu keluaran GPT-4, tiada berita daripada OpenAI, yang masih membetulkan pendahulunya. Syarikat yang berpangkalan di San Francisco semalam mengeluarkan model baharu yang dipanggil ChatGPT, terbitan GPT-3 yang berinteraksi dalam cara perbualan.

Dialog ini membolehkan ChatGPT menjawab soalan susulan, mengakui kesilapan, mencabar premis yang salah dan menolak permintaan yang tidak sesuai. Ia berbeza daripada model bahasa lain yang dibuat dan diada-adakan Contohnya, model bahasa Meta Galactica telah dialih keluar dari rak dalam masa beberapa hari selepas pelancarannya kerana pembikinan yang tidak bertanggungjawab. Apa yang berbeza tentang ChatGPT ialah apabila ia tidak tahu apa yang dibualkannya, ia mengaku tidak tahu. Tambahan pula, ChatGPT enggan menjawab soalan yang tidak dilatih untuk dijawab - contohnya, ia tidak akan cuba menjawab soalan tentang peristiwa yang berlaku selepas 2022. Ia juga tidak menjawab soalan tentang individu.

Seberapa pintar model ini? Pada masa lalu, kerja mental kod penyahpepijatan perlu dilakukan oleh pengaturcara Kini ChatGPT boleh mengambil alih tugas yang membosankan ini.

Pengguna berkata: Kod ini tidak berjalan seperti yang saya jangkakan, bagaimana saya harus mengubah suainya?

GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih

ChatGPT: Maklumat konteks yang anda berikan terlalu sedikit dan sukar untuk memberitahu masalah dengan kod tersebut. Bolehkah anda memberikan lebih banyak maklumat tentang kod, seperti apa yang dilakukan oleh kod itu, adakah ia keseluruhan kod atau sebahagian daripadanya? Saya rasa ada sesuatu yang tidak kena dengan saluran itu.

ChatGPT: Soalan ini sukar untuk dinyatakan tanpa maklumat lanjut tentang perkara yang sepatutnya dilakukan oleh kod dan perkara yang berlaku apabila dilaksanakan. Daripada maklumat yang anda berikan, nampaknya satu isu yang berpotensi dengan kod anda ialah saluran resultWorkerErr tidak pernah ditutup, yang bermaksud kod mungkin tergantung jika saluran resultWorkerErr tidak pernah ditulis. Ini boleh berlaku jika b.resultWorker tidak mengembalikan ralat atau ia dibatalkan sebelum ia mempunyai peluang untuk mengembalikan ralat.

Untuk menyelesaikan masalah ini, anda boleh menutup saluran resultWorkerErr selepas menulis kepadanya. Sebagai contoh, anda boleh menambah baris kod berikut selepas baris yang menghantar ralat ke saluran:

Ini akan memastikan saluran resultWorkerErr sentiasa ditutup, walaupun b.c resworker tidak pernah mengembalikan ralat. Sekali lagi, tanpa maklumat lanjut tentang masalah yang anda lihat, sukar untuk mengetahui sama ada ini masalah yang anda alami. Bolehkah anda memberikan butiran lanjut tentang perkara yang berlaku apabila menjalankan kod tersebut? GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih

Dalam contoh di bawah, ChatGPT memberikan respons kepada arahan seterusnya. Gambar di bawah secara kasar bermaksud bahawa pengguna meminta ChatGPT menulis pengenalan ringkas untuknya supaya dia dapat mengenali jirannya ChatGPT memberikan pengenalan teks pendek, tetapi pengguna tidak menyukainya kerana ia tidak cukup formal, jadi ChatGPT yang baik hati muncul dengan versi rasmi yang lain Sedikit kemudian pengguna membuat permintaan lain dan meminta ChatGPT untuk membantu menghantarnya. Akhirnya ChatGPT menjawab: "Maaf, saya seorang pembantu AI berasaskan teks dan tidak mempunyai keupayaan untuk menghantar surat fizikal kepada anda. Saya hanya boleh memberikan cadangan tentang apa yang perlu ditulis. Anda boleh menerima cadangan itu dan menghantar surat itu sendiri."

Selepas melihat ini, adakah anda juga ingin mencubanya? Ya, sebaik sahaja model ini dikeluarkan, ramai orang menjadi ketagih dan tidak dapat melepaskan diri sendiri. Malah Musk berkata: "Ramai orang terperangkap dalam gelung ChatGPT yang gila sial." Untuk seketika, semua orang nampaknya telah menemui keseronokan baharu, dan mereka membuka mod perbualan dengan ChatGPT. "Memintanya untuk mentafsir ungkapan biasa yang kompleks tanpa konteks..." Masalah ini benar-benar sukar, tetapi ia tidak boleh menyusahkan ChatGPT. Jika dilihat dari panjangnya penjelasan ini, ia harus dijelaskan dengan jelas.

GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih

"ChatGPT ialah rakan kongsi nyahpepijat yang baik. Ia bukan sahaja boleh menerangkan pepijat, tetapi juga membetulkan pepijat dan menerangkan cara membetulkan pepijat."

GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih

Sesetengah netizen berkata dengan tidak percaya: "Ya tuhan, ChatGPT sebenarnya tahu dasar AWS IAM."

GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih

"ChatGPT boleh menjana ratusan baris kod Python untuk memuat naik fail 100 GB ke baldi AWS S3. Tulis sahaja ayat ini "Tulis kod Python untuk memuat naik fail ke AWS S3 baldi (Tulis kod Python untuk memuat naik fail ke baldi AWS S3) "

GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih

Tapak web percubaan telah ranap kerana terlalu bersemangat. "Permintaan kami ialah sangat kuat. Sila tunggu, kami sedang mengembangkan sistem kami."

GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih

Alamat percubaan: sembang. openai.com

Kaedah

ChatGPT menggunakan kaedah yang sama seperti InstructGPT - melatih model dengan pembelajaran pengukuhan maklum balas manusia (RLHF), tetapi tetapan pengumpulan data sedikit Terdapat perbezaan. ChatGPT melatih model awal menggunakan penalaan halus yang diselia: perbualan disediakan oleh jurulatih AI manusia, di mana mereka memainkan kedua-dua pihak - pengguna dan pembantu AI, dan jurulatih AI mempunyai akses kepada respons perbualan yang ditulis oleh model untuk membantu AI menyesuaikan respons.

Untuk mencipta model ganjaran bagi pembelajaran pengukuhan, kajian itu perlu mengumpul data perbandingan yang mengandungi dua atau lebih respons model yang ditarafkan mengikut kualiti. Kajian itu mengumpul perbualan antara jurulatih AI dan chatbot, memilih secara rawak mesej yang ditulis oleh model, mengekstrak beberapa respons alternatif, dan meminta jurulatih AI untuk menilai respons. Selain itu, kajian juga menggunakan algoritma pengoptimuman dasar proksimal (PPO) untuk memperhalusi model dan menjalankan beberapa lelaran keseluruhan proses.

ChatGPT memperhalusi model dalam siri GPT-3.5 yang telah dilatih pada awal 2022. ChatGPT dan GPT 3.5 telah dilatih pada infrastruktur pengkomputeran super Azure AI.

Batasan

1. ChatGPT kadangkala menulis jawapan yang kelihatan munasabah tetapi tidak betul atau tidak masuk akal. Menyelesaikan masalah ini sangat mencabar kerana:

RL memerlukan data dunia sebenar semasa latihan, tetapi pada masa ini tiada sumber; jawab soalan yang boleh dijawab dengan betul ;(3) Latihan yang diselia mempengaruhi prestasi model kerana idealnya model mengetahui jawapan yang betul, bukan penunjuk perasaan manusia.
ChatGPT sensitif untuk melaraskan perkataan input atau mencuba gesaan yang sama beberapa kali. Sebagai contoh, diberikan soalan, model boleh mendakwa tidak mengetahui jawapannya, tetapi dengan perkataan semula soalan yang sedikit, model boleh menjawabnya dengan betul.
Jawapan model selalunya terlalu bertele-tele dan terlalu menggunakan frasa tertentu, seperti mengulangi bahawa ia adalah model bahasa terlatih OpenAI. Masalah ini berpunca daripada data latihan (jurulatih suka jawapan panjang yang kelihatan lebih komprehensif) dan pengoptimuman yang berlebihan.
Sebaik-baiknya, model akan menyoal apabila pengguna memberikan pertanyaan yang samar-samar, namun ChatGPT pada masa ini meneka niat pengguna itu sendiri.
Walaupun kajian berusaha keras untuk mendapatkan model menolak permintaan yang tidak sesuai, kadangkala ia bertindak balas kepada arahan yang berbahaya atau memberikan jawapan yang berat sebelah. Pasukan penyelidik menggunakan API Penyederhanaan untuk memberi amaran kepada model atau menyekat jenis kandungan tidak selamat tertentu dan sedang cuba mengumpulkan maklum balas pengguna untuk menambah baik lagi kerja sistem.
Berbanding dengan GPT-3 dan Codex, ChatGPT, sebagai model terbaharu yang dikeluarkan oleh OpenAI, telah membuat banyak peningkatan dalam keselamatan dan kebolehgunaan, berdasarkan kelebihan model sebelumnya. Pengajaran yang dipelajari, dan output model yang berbahaya dan tidak realistik dikurangkan dengan ketara dengan menggunakan pembelajaran tetulang dengan maklum balas manusia (RLHF).

Atas ialah kandungan terperinci GPT OpenAI yang baru dilancarkan sangat berkuasa sehingga pelayan menjadi sesak serta-merta: Anda terlalu ketagih. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!