Pengarang |. Xu Jiecheng
Penilai |. Beberapa bulan selepas ChatGPT meletupkan bidang chatbots, kami akhirnya membawa masuk produk dialog generatif pertama China.
Pada 14:00 pada 16 Mac, sidang media Baidu Wenxinyiyan telah diadakan secara rasmi di ibu pejabat Baidu di Beijing. Robin Li, pengasas, pengerusi dan Ketua Pegawai Eksekutif Baidu, juga telah memenuhi janjinya sebelum ini dan menjadikan teknologi hebat sebagai produk yang diperlukan oleh semua orang.
Dilaporkan bahawa Wenxin Yiyan (nama Inggeris: ERNIE Bot) ialah produk dialog generatif yang dilancarkan oleh Baidu berdasarkan teknologi model besar Wenxin, yang boleh mencapai interaksi manusia-komputer yang semula jadi dan lancar . Sebagai salah satu teknologi teras Baidu, model besar Wenxin ERNIE mempunyai pemahaman semantik mendalam dan keupayaan penjanaan merentas modal dan merentas bahasa. Wenxinyiyan, berdasarkan teknologi ERNIE, telah berjaya menyepadukan teknologi kecerdasan buatan dengan keupayaan komunikasi bahasa manusia, dan boleh memberikan pengguna pengalaman interaktif yang berkualiti tinggi dan pintar.
1. Robin menunjukkan kesinambungan penulisan tiga badan Wenxin Yiyan, puisi kertas Luoyang, dan mengira ayam dan arnab dalam sangkar yang sama
Pada sidang akhbar itu, Robin Li menunjukkan lima keupayaan teras Wen Xinyiyan dan prestasi mereka dalam lima senario penggunaan, termasuk penciptaan sastera, penciptaan copywriting perniagaan, pengiraan matematik, pemahaman bahasa Cina dan penjanaan multimodal.
Dalam adegan penciptaan sastera, Wen Xinyiyan meringkaskan kandungan teras novel fiksyen sains terkenal "The Three-Body Problem" berdasarkan soalan dan jawapan dialog, dan mencadangkan beberapa sekuel kepada "The Three-Body Problem" 》Cadangan dan idea. Selain itu, Wen Xinyiyan juga menjawab dengan tepat maklumat fakta seperti pengarang "The Three-Body Problem" dan pemain peranan siri TV "Three-Body Problem" berdasarkan kandungan soalan.
Kelemahan utama AI generatif semasa ialah sukar untuk menjamin ketepatan menjawab soalan, dan Wen Xin perkataan teruskan Ia mengguna pakai konsep model besar yang dipertingkatkan pengetahuan Baidu dan meningkatkan ketepatan soalan fakta. Menghadapi soalan seperti "Apakah persamaan Yu Hewei dan Zhang Luyi?" dan "Siapa yang lebih tinggi, Yu Hewei atau Zhang Luyi juga bergantung pada keupayaan mendapatkan maklumat dan kebolehan penaakulannya untuk mendapatkan jawapan yang betul?"
Dalam bidang penulisan salinan perniagaan, Wen Xinyiyan berjaya melengkapkan penamaan syarikat, menulis slogan syarikat, Menulis akhbar penubuhan syarikat keluaran dan tugas kreatif lain. Dalam tiga ciptaan kandungan berturut-turut, Wen Xinyiyan bukan sahaja memahami niat pengguna dengan tepat, tetapi juga menyelesaikan ungkapan maklum balas pengguna yang jelas.
Ini ialah "kemunculan kecerdasan" yang berlaku berdasarkan skala besar data. Menurut laporan, data latihan model besar Wenxin Yiyan termasuk trilion data halaman web, berbilion data carian dan data imej, berpuluh bilion data panggilan suara setiap hari, dan graf pengetahuan 550 bilion fakta, dsb., yang menjadikannya dalam Dari segi pemahaman dan pemprosesan bahasa Cina, ia adalah lebih baik daripada hampir semua model besar lain di dunia.
Dari segi pengiraan matematik, Wen Xinyiyan bergantung pada keupayaan berfikirnya, keupayaan potongan matematik dan keupayaan penaakulan logik untuk berjaya lengkap Jawapan kepada contoh klasik seperti "ayam dan arnab dalam sangkar yang sama" yang menggunakan pemikiran logik manusia.
Dalam sesi ini, Wen Xinyiyan bukan sahaja mengenal pasti masalah dalam soalan, tetapi juga berjaya mencari penyelesaian kepada masalah seperti manusia dan mengikut langkah yang betul langkah demi langkah Menyimpulkan jawapan yang tepat kepada soalan tersebut.
Jika penciptaan sastera, penciptaan copywriting perniagaan dan pengiraan matematik adalah kelebihan dan keupayaan umum model bahasa besar. Kemudian keunikan Wenxinyiyan ialah pemahaman Cina yang lebih baik dan keupayaan penjanaan pelbagai mod.
Sebagai model bahasa besar yang berakar umbi dalam pasaran China, Wenxinyiyan mempunyai keupayaan pemprosesan bahasa semula jadi yang paling maju dalam bidang Cina dan mempunyai prestasi yang lebih baik dalam bahasa Cina dan budaya Cina. Dalam demonstrasi pusingan keempat, Wen Xinyiyan menerangkan dengan betul maksud simpulan bahasa "Kertas Luoyang mahal", digabungkan dengan konotasi simpulan bahasa untuk menganalisis teori ekonomi yang sepadan "kertas Luoyang mahal", malah berjaya mencipta puisi. menggunakan empat perkataan "Luoyang kertas mahal" Puisi akrostik pertama.
Dari segi penjanaan pelbagai mod, Robin Li menunjukkan keupayaan teks, gambar, audio dan Video generasi Wen Xinyiyan . Menariknya, Wenxinyiyan juga boleh menjana pertuturan dalam dialek seperti dialek Sichuan, keupayaan penjanaan video Wenxinyiyan tidak dibuka kepada semua pengguna pada masa ini kerana kosnya yang tinggi, dan akan diakses secara beransur-ansur pada masa hadapan.
2. Tafsiran teknikal Wen Xinyiyan
Wen Xinyiyan, sebagai model bahasa besar yang dipertingkatkan pengetahuan generasi baharu, dibangunkan berdasarkan model siri ERNIE dan PLATO. Teknologi utamanya termasuk penalaan halus yang diselia, pembelajaran pengukuhan dengan maklum balas manusia, gesaan, peningkatan pengetahuan, peningkatan perolehan semula dan peningkatan dialog.
Tiga yang pertama adalah teknologi yang digunakan oleh model bahasa yang besar itu juga telah digunakan dan terkumpul dalam ERNIE dan PLATO, dan telah diperkukuh dan digilap di Wen Xinyiyan ; tiga item adalah inovasi semula kelebihan teknologi sedia ada Baidu, dan juga asas untuk kekuatan Wen Xinyiyan yang semakin meningkat pada masa hadapan.
Peningkatan pengetahuan Wen Xinyiyan terutamanya melalui dua kaedah: penghayatan pengetahuan dan aplikasi luaran pengetahuan. Pengintegrasian pengetahuan adalah berdasarkan pembelajaran unit semantik daripada pengetahuan berskala besar dan data tidak berlabel, menggunakan pengetahuan untuk membina data latihan, dan mempelajari pengetahuan ke dalam parameter model. Aplikasi luaran pengetahuan adalah untuk memperkenalkan pengetahuan heterogen pelbagai sumber luaran untuk melaksanakan penaakulan pengetahuan, pembinaan segera, dsb.
Peningkatan perolehan semula Wen Xinyiyan datang daripada seni bina carian generasi baharu dengan pemahaman semantik dan pemadanan semantik sebagai teknologi teras . Dengan memperkenalkan hasil carian, maklumat rujukan yang tepat pada masanya dan tepat boleh disediakan untuk model besar untuk memenuhi keperluan pengguna dengan lebih baik.
Peningkatan dialog Wen Xinyiyan adalah berdasarkan pengumpulan teknologi dan aplikasi dialog Wenxinyiyan mempunyai mekanisme Memori, pemahaman konteks dan keupayaan perancangan dialog untuk mencapai keselarasan dialog, rasional dan logik yang lebih baik.
Robin. Li menyebut bahawa teknologi AI hari ini telah berkembang ke tahap kritikal, dan semua lapisan masyarakat pasti akan berubah. Pasaran AI China akan mengalami pertumbuhan permintaan yang meletup, dan pelepasan nilai komersialnya akan menjadi tidak pernah berlaku sebelum ini dan eksponen.
Sejak Baidu secara rasmi mengumumkan "Wen Xin Yi Yan" pada bulan Februari, lebih daripada 650 syarikat telah mengumumkan akses mereka kepada ekosistem Wen Xin Yi Yan. Ini bermakna bahawa banyak syarikat telah memahami bahawa Wenxinyiyan dan AI generatif mewakili paradigma teknologi baharu yang akan mempengaruhi setiap syarikat. Menurut ramalan Robin Li, model bahasa yang besar akan membawa tiga peluang industri utama.
Kategori pertama ialah syarikat pengkomputeran awan baharu, yang model perniagaan arus perdananya akan bertukar daripada IaaS kepada MaaS. Kata-kata Wen Xin secara asasnya akan mengubah peraturan permainan dalam industri pengkomputeran awan. Pada masa lalu, perusahaan memilih vendor awan berdasarkan perkhidmatan awan asas seperti kuasa pengkomputeran dan storan. Pada masa hadapan, lebih banyak penekanan akan diberikan pada sama ada rangka kerja itu baik, sama ada model itu baik, dan kerjasama antara empat lapisan model, rangka kerja, cip dan aplikasi.
Kategori kedua ialah syarikat yang memperhalusi model industri Ini adalah lapisan tengah antara model besar umum dan perusahaan Mereka boleh memanggil keupayaan model besar umum berdasarkan cerapan industri, menyediakan penyelesaian kepada pelanggan industri. Dalam hal ini, Baidu Wenxin Model telah mengeluarkan lebih daripada 10 model industri dalam bidang kuasa elektrik, kewangan, media dan lain-lain.
Kategori ketiga ialah syarikat yang membangunkan aplikasi berdasarkan asas model yang besar, iaitu penyedia perkhidmatan aplikasi. Robin Li menegaskan bahawa bagi kebanyakan usahawan dan syarikat, peluang sebenar bukanlah untuk membina model berskala besar asas seperti ChatGPT dan Wenxinyiyan dari awal Ini sangat tidak realistik dan tidak ekonomik. Ini mungkin peluang sebenar untuk membangunkan perkhidmatan aplikasi penting secara awal berdasarkan model bahasa besar umum. Pada masa ini, berdasarkan penjanaan teks, penjanaan imej, penjanaan audio, penjanaan video, orang digital, 3D dan senario lain, banyak syarikat bintang keusahawanan telah muncul, yang mungkin menjadi gergasi baharu pada masa hadapan.
Wen Xinyiyan akan menyediakan perkhidmatan luaran melalui Baidu Intelligent Cloud untuk membantu perusahaan membina model dan aplikasi mereka sendiri dalam bidang utama seperti pertanian, industri, kewangan, pendidikan, penjagaan perubatan, pengangkutan dan tenaga. , kecekapan akan bertambah baik, dan ruang perindustrian baharu akan cepat dibentuk dalam setiap industri untuk membantu merealisasikan Digital China. Robin Li mengumumkan bahawa Baidu Smart Cloud akan mengadakan sidang akhbar dalam masa terdekat, dengan tema tertumpu pada perkhidmatan awan dan produk aplikasi Wen Xinyiyan, yang merangkumi kedua-dua perkhidmatan awan awam dan penempatan yang diswastakan.
Pada akhir sidang akhbar, Wang Haifeng berkata bahawa Wen Xinyiyan kini dibuka untuk ujian dalaman. Mulai sekarang, kumpulan pertama pengguna boleh mengalami produk Wenxinyiyan di tapak web rasmi dengan menjemput kod ujian Baidu Smart Cloud akan membuka perkhidmatan panggilan antara muka Wenxinyiyan API kepada pelanggan korporat. Anda boleh memohon untuk menyertai ujian perkhidmatan awan Wenxinyiyan pada rasmi laman web.
Robin juga berterus terang tentang keluaran ini. Pada masa itu, Wen Xin berkata bahawa dia belum bersedia sepenuhnya.
Baru-baru ni ramai kawan tanya saya, "Kenapa hari ni? Awak betul-betul bersedia ke?" Malah, dalam erti kata lain, kami telah bersedia untuk ini selama bertahun-tahun Kami mula melabur dalam penyelidikan AI lebih daripada sepuluh tahun yang lalu dan melancarkan Model Bahasa Besar Wenxin pada 2019. Wenxinyiyan hari ini adalah kesinambungan daripada usaha-usaha yang telah dilakukan oleh banyak orang. tahun. Tetapi tidak boleh dikatakan bahawa kami sudah bersedia sepenuhnya. Ambang untuk Wen Xinyiyan untuk menanda aras terhadap ChatGPT dan juga terhadap GPT-4 adalah sangat tinggi. Daripada ujian saya sendiri, saya rasa masih banyak ketidaksempurnaan. Pilihan individu.
Selepas menonton sidang akhbar ini, saya percaya semua orang mempunyai Saya. sendiri perasaan yang berbeza. Dalam analisis akhir, bagi pengguna, terutamanya dalam bidang kandungan budaya, kami masih memerlukan syarikat teknologi domestik untuk benar-benar menggunakan korpus Cina besar-besaran untuk melatih beberapa model besar berkualiti tinggi setempat yang lebih sesuai untuk persekitaran Cina.
Kini, sebagai perintis AIGC di China, Baidu telah mengambil langkah pertama dalam bidang ini. Bolehkah Baidu melangkah lebih jauh di laluan ini pada masa hadapan? Adakah lebih banyak syarikat teknologi tempatan yang cemerlang akan menjejakkan kaki di tanah ini? Apakah perubahan yang akan dialami oleh ekologi AIGC China di bawah pengumpulan perintis ini? Sama-sama kita tunggu dan lihat.
Atas ialah kandungan terperinci Wen Xinyiyan secara rasmi membuka jemputan dalaman! Robin Li: Pengalamannya tidak sempurna!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!