Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?-AI-php.cn

OpenAI kini telah menjadi sasaran pengejaran dalam bidang kecerdasan buatan global.

Selepas Google mempersembahkan "Bard", bulatan teknologi China mula mendidih Pasukan penyelidikan pemprosesan bahasa semula jadi yang asalnya menyedihkan kini telah menjadi kegemaran semua orang. Persaingan untuk mendapatkan modal dan bakat telah bermula.

"Mencipta ChatGPT versi Cina" telah dilaporkan dalam siaran wira Wang Huiwen, dan ia merebak kepada puluhan dan ratusan orang, menjadi matlamat bersama pengamal AI Cina.

Namun, tidak kira betapa hangatnya perbincangan mengenai ChatGPT sejak kebelakangan ini, kita perlu menghadapi realiti yang kejam: dalam persaingan untuk mengejar OpenAI ini, kita akhirnya boleh menakluki Bright Summit. Tidak banyak pasukan.

Di satu pihak, kosnya tinggi, dan dana untuk "memurnikan" model besar hanyalah tiket untuk membina ChatGPT sebaliknya, ada bakat terhad yang boleh melatih model besar. Model besar adalah asas teknikal penciptaan OpenAI bagi ChatGPT, dan mencari orang yang tepat juga amat kritikal.

Model berskala besar pasti menjadi hala tuju di mana industri, akademia dan penyelidikan bekerjasama jika peserta ChatGPT mahu menang, mereka bukan sahaja mesti mempunyai saintis terkemuka, tetapi juga pengendali berpengalaman yang memahami persekitaran politik dan perniagaan Pasukan itu juga mesti termasuk usahawan bintang yang mempunyai karisma dalam pasaran modal dan bersedia untuk menyertai.

Artikel ini bertujuan untuk mengambil kira kedudukan kuasa potensi domestik utama dalam gelombang persaingan ChatGPT ini dari perspektif penyelidikan akademik.

1 Kuasa universiti: Universiti Tsinghua

Di antara universiti, Universiti Tsinghua pastinya berada di barisan hadapan.

Universiti Tsinghua ialah pusat penyelidikan akademik dalam bidang pemprosesan bahasa semula jadi (NLP) di China Ia mempunyai sejarah penyelidikan yang mendalam dalam NLP dan pasukan penyelidikan yang besar, termasuk yang terkenal nama-nama seperti Tang Jie, Sun Maosong, Liu Zhiyuan, dan Huang Minlie bertanggungjawab, dan kerja mereka dalam bidang model bahasa besar telah sangat menonjol dalam beberapa tahun kebelakangan ini. Selain itu, ramai pemimpin model besar dalam pengeluar utama adalah keturunan Universiti Tsinghua, seperti He Xiaodong, Naib Presiden JD.com, Tian Qi, Ketua Saintis dalam bidang kecerdasan buatan Huawei Cloud, dll.

Selepas menyelesaikannya, terdapat tiga kuasa berpotensi utama di Universiti Tsinghua untuk mengejar gelombang ChatGPT ini: Pertama, Makmal Kejuruteraan Pengetahuan (KEG), diketuai oleh Li Juanzi dan muridnya Tang Jie; Yang kedua ialah Makmal Pengkomputeran Bahasa Semulajadi dan Kemanusiaan Sosial (THUNLP), yang ketua akademiknya ialah Sun Maosong, dan ketua pasukan Liu Zhiyuan ialah muridnya ialah Kumpulan Penyelidikan Kepintaran Buatan Interaktif (CoAI); , yang diketuai bersama oleh Zhu Xiaoyan dan pelajarnya Huang Minlie.

Tang Jie dari Universiti Tsinghua

Dalam gelombang terakhir kegilaan pembinaan model berskala besar, Profesor Tang Jie dari Jabatan Sains Komputer di Universiti Tsinghua adalah wakil akademik yang paling menonjol. Pada 2020, beliau mengumpulkan universiti di Beijing dan mengetuai pembangunan model "Pencerahan" 1.0 dan 2.0 Institut Penyelidikan Zhiyuan.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Tang Jie

Pada masa yang sama Pada masa itu, Tang Jie juga seorang sarjana yang sangat mementingkan integrasi industri, akademik dan penyelidikan serta pembinaan ekosistem model berskala besar. Pada 2019, bergantung pada produk bintang AMnier dan pencapaian teknikal Makmal Kejuruteraan Pengetahuan, Tang Jie dan Li Juanzi mengetuai penubuhan Zhipu AI. Pasukan syarikat semasa termasuk ramai pelajar Tang Jie, yang kesemuanya merupakan peserta utama dalam "Pencerahan" 2.0.

Tang Jie adalah dari bidang perlombongan data, dan Li Juanzi ialah seorang sarjana terkenal dalam bidang graf pengetahuan Ini menentukan bahawa ciri model berskala besar Wisdom Map AI adalah "data + pengetahuan". Tahun lepas, Zhipu AI mengeluarkan model GLM-130B dwibahasa, yang merupakan sumber terbuka dan tersedia untuk muat turun percuma oleh institusi penyelidikan atau individu.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

GLM-130B mengguna pakai seni bina model GLM yang dicadangkan oleh KEG Laboratory pada tahun 2021, yang mempunyai prestasi tinggi pada pelbagai tugas Lebih baik daripada model GPT-3 OpenAI. Melalui teknologi pengiraan model, pasukan Tang Jie juga telah meningkatkan kemudahan penggunaan model dan mengurangkan kos pengkomputeran GLM-130B boleh melakukan inferens pada pelayan A 100 atau V100.

Selain itu, pasukan Tangjie juga telah mewujudkan pertukaran dan hubungan dengan banyak syarikat besar untuk menyokong mereka dalam membangunkan model besar, seperti M6 Alibaba. Pelajar Tang Jie, Yang Zhilin ialah pengasas bersama Perisikan Pekeliling permulaan NLP dan turut mengambil bahagian dalam penyelidikan dan pembangunan model besar "Pangu" Huawei.

Menurut orang dalam, Zhipu AI sedang menyelidik produk seperti ChatGPT dan akan melancarkannya dalam tempoh dua bulan yang lalu.

Sun Maosong dan Liu Zhiyuan dari Universiti Tsinghua

Dari perspektif hala tuju subjek NLP, jabatan Tsinghua adalah yang paling “berakar umbi dan jabatan matang” Ia adalah pasukan Sun Maosong dan Liu Zhiyuan.

Makmal Pengkomputeran Bahasa Asli Universiti Tsinghua dan Kemanusiaan (THUNLP) ialah unit penyelidikan saintifik yang terawal dan paling berpengaruh di China untuk menjalankan penyelidikan NLP. Apabila makmal itu mula-mula ditubuhkan pada penghujung 1970-an, ia diketuai oleh Huang Changning, perintis NLP di China, Fellow ACL Sun Maosong ialah pelajarnya, dan Liu Zhiyuan ialah pelajar Sun Maosong.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Sun Maosong (kiri), Liu Zhiyuan (kanan)

THUNLP telah mengumpul pengalaman mendalam dalam bidang NLP Pada tahun 2015, ia mengeluarkan sistem generasi puisi Cina "Sembilan Lagu", yang dilatih berdasarkan sejumlah besar puisi ciptaan manusia dan menarik perhatian meluas dalam. akademik dan industri.

Dari segi model bahasa yang besar, pasukan Sun Maosong dan Liu Zhiyuan membuat susulan pada paradigma pra-latihan pada 2018 dan mengeluarkan model bahasa ERNIE pada awal 2019 (dengan model yang sama nama sebagai versi Baidu ERNIE pada masa yang sama). Membangunkan model CPM, yang merupakan pendahulu "Wudao Wenyuan" Institut Penyelidikan Zhiyuan.

Sun Maosong, Liu Zhiyuan dan pelajar siswazah mereka telah menginkubasi berbilang syarikat dalam bidang NLP dan model besar. Termasuk Power Law Intelligence, yang diasaskan oleh Tu Cunchao pada 2017, memfokuskan pada aplikasi NLP dalam bidang undang-undang, Shenyan Technology, yang diasaskan oleh Qi Fanchao pada 2022, komited untuk membina enjin pemprosesan maklumat Cina peringkat industri dengan bahasa Cina yang dibangunkan sendiri; model besar.

Selain itu, terdapat Wall-Facing Intelligence yang diasaskan oleh Zeng Guoyang tahun lepas, yang memfokuskan pada pecutan dan penggunaan model besar Pasukan syarikat adalah ahli tulang belakang "Wudao Wenyuan ". Mereka bersama-sama melancarkan komuniti sumber terbuka OpenBMB dengan THUNLP dan Pusat Inovasi Teknologi Model Besar Bahasa Institut Penyelidikan Zhiyuan, dan melancarkan CPM-Live berpuluh bilion projek latihan langsung model besar China, serta alat pecutan proses penuh model besar .

Dalam gelombang ChatGPT ini, kelebihan THUNLP terletak pada banyak pencapaian akademik NLP dan pengalaman R&D model besar Cabarannya terletak pada kejuruteraan dan pengkomersilan.

Lingxin Intelligence Huang Minlie

CtGPT ialah robot sembang, disokong oleh teknologi sistem dialog ke arah ini, Universiti Tsinghua The kumpulan penyelidikan kecerdasan buatan interaktif (CoAI) sangat cemerlang.

CoAI dipengerusikan oleh Zhu Xiaoyan dan pelajarnya Huang Minlie. Huang Minlie adalah pakar dalam bidang kecerdasan buatan perbualan dan pengarang buku "Generasi Bahasa Semulajadi Moden. Beliau juga pernah mengambil bahagian dalam pembangunan model besar Kebijaksanaan "Pencerahan".

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Huang Minlie

Huang Minlie ialah juga dari Universiti Tsinghua Beliau adalah salah seorang sarjana yang telah memulakan perniagaannya sendiri Beliau mengasaskan "Lingxin Intelligence" pada tahun 2021. Berdasarkan asas penyelidikan model besar dan sistem dialog, Huang Minlie memilih trek robot sembang kaunseling psikologi. Pada tahun 2022, pasukannya melancarkan robot interaktif yang dipanggil "AI Utopia" di mana pengguna boleh menyesuaikan aksara AI dan mengadakan perbualan yang mendalam dengan robot itu.

Sebagai salah satu daripada beberapa pasukan domestik yang mampu melatih model besar, Huang Minlie berkata selepas menamatkan pusingan pembiayaan Pra-A baru-baru ini bahawa berbanding dengan ChatGPT, mereka berharap untuk meletakkan "Lingxin Intelligence" sebagai "China " Character AI" - menyediakan pengguna dengan persahabatan emosi berdasarkan penjanaan teks. Difahamkan bahawa pasukannya telah mengumpulkan sejumlah besar data latihan berkualiti tinggi dalam bidang kesihatan mental, dengan lebih daripada 3 bilion parameter model.

2 Siri Kilang Besar

Antara pengeluar Internet domestik utama, eselon pertama yang terkemuka dalam model besar termasuk Baidu, Alibaba dan JD. com dengan Huawei. Di samping itu, gelombang syarikat Internet yang telah mengumumkan kemasukan mereka ke dalam pembangunan ChatGPT termasuk Tencent, ByteDance, Kuaishou, 360, iFlytek, NetEase, dll. Dalam penyelidikan dan pembangunan ChatGPT seperti perlumbaan senjata, keupayaan wang kertas pengeluar utama sudah pasti mempunyai kelebihan mutlak.

Sesetengah orang dalam industri telah mengulas bahawa penunjuk beberapa pengeluar utama termasuk 360 dalam teknologi seperti ChatGPT hanya boleh mencapai tahap lebih baik sedikit daripada GPT-2, yang berbeza daripada ChatGPT semasa . Berbanding dengan jurang penjanaan, model bahasa berskala besar dilawan dengan tangan kosong (seperti Kuaishou, iFlytek, NetEase, dll. Oleh itu, terdapat ketidakpastian besar dalam masa pelancaran dan kesan sebenar versi beta seperti ChatGPT). .

BaiduModel Besar Wenxin

Dalam bidang pemprosesan bahasa semula jadi, Baidu mempunyai pengumpulan teknologi di kalangan pengeluar utama Yang mempunyai sejarah terpanjang.

Penyelidikan dan pembangunan model besar Baidu Wenxin diketuai oleh CTO Wang Haifeng. Dalam projek "Wen Xin Yi Yan", Wang Haifeng juga berkhidmat sebagai komander am, dan terdapat juga ahli teras Wu Tian (Naib Presiden Kumpulan Baidu dan ketua dalam penyelidikan dan pembangunan Platform Dayung Terbang) dan Wu Hua ( Pengerusi Jawatankuasa Teknikal Baidu dan salah seorang pengasas Pasukan Teknologi Terjemahan Baidu) satu).

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Wang Haifeng

Baidu ialah terawal di China Salah satu pasukan yang terlibat secara mendalam dalam pembangunan model pra-latihan Pada 2019, ia mengeluarkan model ERNIE 1.0 dan 2.0 yang kesan Chinanya mengatasi BERT 3.0, yang dikeluarkan pada Julai 2021, mengatasi GPT-3 pada SuperGLUE; "Pengcheng" dikeluarkan pada tahun yang sama -Baidu·Wenxin” (ERNIE 3.0 Titan) ialah model skala besar 100 bilion peringkat pertama yang dipertingkatkan.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

"Peningkatan pengetahuan" ialah laluan teknikal yang diambil oleh siri Wenxin, iaitu pengenalan pengetahuan bahasa dan pengetahuan dunia, dsb. Pembelajaran gabungan daripada graf pengetahuan berskala besar dan data besar-besaran untuk meningkatkan kecekapan pembelajaran dan kebolehtafsiran model besar.

Pada tahun 2021, Baidu turut melancarkan robot perbualan yang dipanggil PLATO Model ini berdasarkan model penjanaan dialog berskala besar PLATO-XL dengan berpuluh bilion parameter.

Kelebihan Baidu terletak pada data korpus cariannya yang kaya, data pengguna mendalam daripada penyelidikan AI selama bertahun-tahun, dan sokongan platform pembelajaran mendalam Baidu Feipiao dan cip yang dibangunkan sendiri.

Selepas perang sengit antara Microsoft dan Google, Baidu merupakan salah satu pasukan pertama di China yang mengumumkan rancangannya untuk membangunkan produk ChatGPT ("Wen Xin Yi Yan"). Orang dalam mendedahkan bahawa bentuk produknya mungkin portal bebas, atau ia mungkin meniru Microsoft Bing dan disambungkan dengan portal carian Baidu.

AlibabaModel Besar Tongyi

Alibaba Damo Academy akan memasuki industri model besar pada 2021 dan mengambil bahagian dalam industri pintar Institut Penyelidikan Yuan membangunkan model besar "Wudao·Wenhui" dan kemudian melancarkan model bahasa pra-latihan teks tulen PLUG (27 bilion parameter), yang sepenuhnya merujuk kepada seni bina GPT-3, menyepadukan pemahaman bahasa dan keupayaan penjanaan, dan tahap hampir dengan GPT- 3.

Siri model besar berbilang modal M6 yang dibangunkan oleh Yang Hongxia, bekas ahli Makmal Pengkomputeran Pintar Akademi DAMO (yang meletak jawatan tahun lepas), dan pasukan Tang Jie di Universiti Tsinghua, parameternya juga berkisar antara berpuluh bilion hingga sepuluh trilion.

Di bawah kepimpinan Zhou Jingren, timbalan pengarah Akademi DAMO semasa, Akademi DAMO melancarkan model "Tongyi" pada September tahun lepas, yang merupakan kemuncak keputusan model Alibaba semasa .

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Zhou Jingren

Model besar "Tongyi" menyatukan model buat pertama kalinya keadaan, seni bina dan tugasan, dan sokongan teknikal di belakangnya ialah paradigma pembelajaran bersatu OFA.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Tahun lepas, untuk mempromosikan pembinaan ekologi sumber terbuka model besar Cina, DAMO Academy turut melancarkan AI komuniti sumber terbuka model " "Skop Model" telah menyebabkan kesan besar dalam industri.

Beberapa hari lalu, DAMO Academy telah mengesahkan bahawa ia sedang membangunkan versi Alibaba ChatGPT berdasarkan model besar "Tongyi" Selain penjanaan teks, ia juga mempunyai fungsi lukisan . Difahamkan bahawa produk seperti ChatGPTnya akan disepadukan secara mendalam dengan DingTalk.

JD.comModel besar Yanxi

JD.com mula menyelidik penjanaan teks AI pada 2020 untuk menyokong JD. com Penjanaan penerangan halaman produk. Dilaporkan bahawa 20% daripada pengenalan produk di halaman pusat beli-belah JD.com dihasilkan oleh pasukan AI menggunakan teknologi NLP. Dalam tempoh ini, disebabkan kemelesetan keseluruhan teknologi NLP, penyelidikan dan pembangunan telah dihalang, tetapi kemudian JD.com memberi perhatian sekali lagi dan melancarkan model besar Yanxi.

He Xiaodong, yang meninggalkan Microsoft untuk menyertai JD.com pada 2018, kini merupakan naib presiden Kumpulan JD.com, pengarah eksekutif Institut Penyelidikan AI JD.com, dan ketua pasukan penyelidikan model besar JD.com.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

He Xiaodong

Pada 2021, Beliau Diketuai oleh Zhou Bowen, bekas ketua JD AI (yang meletak jawatan pada November 2021), model domain K-PLUG dibangunkan pada platform JD Yanxipian. Model ini disepadukan rapat dengan senario e-dagang JD.com, belajar daripada pengetahuan khusus dalam bidang e-dagang, dan secara automatik boleh menjana copywriting produk.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Jingdong pada masa ini tidak mempunyai model besar dengan ratusan bilion parameter, dan K-PLUG hanya mempunyai 1 bilion parameter, tetapi platform JD Cloud Yanxi ini juga mengumumkan kemasukannya ke dalam permainan dan akan melancarkan produk ChatGPT "ChatJD", menekankan warna "versi industri"nya.

HuaweiModel Besar Pangu

Sumber pengkomputeran Huawei memberikan kelebihan semula jadi untuk penyelidikannya pada model besar.

Huawei mula mengeluarkan model besar pada 2020, dan ketuanya ialah Tian Qi (Fellow IEEE, Ahli Akademik Akademi Sains Eurasia Antarabangsa).

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Tian Qi

2020 3 Dalam September, beliau menyertai Huawei Cloud sebagai ketua saintis dalam bidang kecerdasan buatan Pada musim panas tahun yang sama, selepas GPT-3 keluar, beliau segera membentuk pasukan dan memulakan penyelidikan dan pembangunan model Pangu. Oleh itu, Huawei menjadi salah satu pengeluar utama pertama yang menyertai pertandingan model besar pada tahun 2020.

Berdasarkan Shengteng AI, dengan kerjasama Makmal Pengcheng dan Perisikan Pekeliling, Huawei mengeluarkan siri "Pangu" model besar pada April 2021, termasuk bahasa Cina, visual, berbilang mod Empat model utama: pengkomputeran negeri dan saintifik.

Model besar Pangu NLP ialah model besar pertama industri yang menjana dan memahami bahasa Cina pada skala ratusan bilion. Dalam peringkat pra-latihan, 40 TB data teks bahasa Cina telah dipelajari, termasuk data sampel kecil segmen industri. Dari segi struktur model, Pangu mengguna pakai seni bina Encode dan Decode untuk memastikan prestasinya dalam penjanaan dan pemahaman.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Huawei mempunyai pengalaman R&D dalam ratusan bilion model dan sumber pengkomputeran yang berkuasa, tetapi kali ini ia tidak membuat sebarang bunyi dan tidak menjelaskannya dengan jelas sama ada ia akan membangunkan produk ChatGPT yang serupa.

3 Permulaan Akademik

Gelombang ledakan pengkomersilan AI yang dibawa oleh ChatGPT ini mempunyai halangan teknikal yang sangat tinggi, dan ia juga menyediakan Huge peluang kepada saintis untuk memulakan perniagaan mereka sendiri.

Pengasas Teknologi Rulanzhou Zhou Ming, ketua saintis Institut Penyelidikan IDEA Zhang Jiaxing, Xihu Xinchen Lan Zhenzhong, pengasas Teknologi Xianyuan Zhou Bowen dan yang lain mewakili semua syarikat permulaan akademik.

Bagi mereka, untuk menang dalam perang perniagaan ChatGPT yang akan datang, mereka juga perlu mengukuhkan keupayaan kejuruteraan dan operasi pasaran mereka. Seperti Zhang Jiaxing dan Lan Zhenzhong, mereka sudah pun mencari CEO untuk pasukan R&D mereka.

Selain itu, kita juga boleh memerhatikan dua mod kemasukan: satu berdasarkan keupayaan teknikal yang kukuh untuk mengimbangi kelemahan dalam pengkomersilan; tertarik untuk membentuk pasukan.

Kita tunggu dan lihat model mana yang akan lebih berjaya pada akhirnya.

Teknologi LanzhouZhou Ming

Apabila trend pusingan terakhir parameter reaktor model besar sedang rancak , Zhou Ming Mengambil pendekatan yang unik, dia memilih laluan model besar yang ringan untuk syarikat permulaannya Lanzhou Technology.

Pada Jun 2021, Zhou Ming menubuhkan Teknologi Lanzhou Pada Julai berikutnya, pasukannya mengeluarkan model "Mencius" dengan satu bilion parameter, dengan kesan yang setanding dengan seratus bilion model Besar. .

Ini adalah hasil daripada pencapaian Zhou Ming dalam kedua-dua bidang akademik dan industri.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Zhou Ming

Zhou Ming ialah dalam bidang NLP Salah seorang saintis China yang paling berpengaruh. Beliau berkelulusan PhD dari Institut Teknologi Harbin pada tahun 1991. Beliau adalah rakan pelajar Baidu CTO Wang Haifeng dan murid kepada profesor Institut Teknologi Harbin dan sarjana NLP Li Sheng. Semasa PhDnya, Zhou Ming membangunkan sistem terjemahan Cina-Inggeris pertama China.

Selepas tamat pengajian, Zhou Ming mula-mula memasuki Universiti Tsinghua sebagai guru Pada tahun 1999, beliau telah diburu oleh Kaifu Li, dekan pengasas Microsoft Research Asia (MSRA), dan berkhidmat sebagai guru. pengarah kumpulan NLP pada tahun 2001. Kemudian beliau dinaikkan pangkat sebagai naib presiden Microsoft Asia Research.

Semasa beliau di MSRA, Zhou Ming membuat banyak pencapaian dalam perindustrian teknologi NLP Beliau menyertai dan mengetuai lebih daripada 100 kertas kerja di Sidang Kemuncak ACL, dan teknologi yang berkaitan turut diterapkan. kepada Windows, Office, Antara produk bertaraf dunia seperti Azure dan Microsoft Xiaoice.

Pada tahun 2020, Zhou Ming berazam untuk mendapatkan kerjasama antara akademia dan industri dengan cara baharu, jadi dia menamatkan kerjayanya selama 21 tahun di Microsoft dan menyertai Kerja Inovasi yang diasaskan oleh Kai- fu Lee. Institut Kejuruteraan Kecerdasan Buatan, berkhidmat sebagai ketua saintis, dan mula menginkubasi pasukan keusahawanan, akhirnya menubuhkan Teknologi Lanzhou.

Menurut berita rasmi, Lanzhou Technology akan bergantung pada model bahasa besarnya yang serupa dengan teknologi asas ChatGPT untuk bekerjasama dengan Chinese Online, yang mempunyai data besar-besaran, untuk mencipta ChatGPT domestik. Masih belum diketahui sama ada pasukan Zhou Ming akan terus mengambil laluan model ringan, atau beralih kepada membuat model besar lebih daripada 100 bilion tahap sebagai sokongan teknikal.

Teknologi Xianyuan Zhou Bowen

Pada tahun 2022, Zhou Bowen kembali ke akademik dan menyertai Universiti Tsinghua sebagai profesor berjawatan di Jabatan Kejuruteraan Elektronik dan Universiti Tsinghua Huiyan Pengerusi Profesor Universiti dan Pengarah Pusat Penyelidikan Perisikan Interaktif Kolaboratif Jabatan Elektronik.

Pada masa yang sama, Zhou Bowen masih lagi seorang usahawan baharu. Pada penghujung tahun 2021, beliau meletakkan jawatan sebagai naib presiden kanan JD.com dan meninggalkan Xianyuan Technology.

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Zhou Bowen

Zhou Bowen ialah graduan Kelas Junior daripada Universiti Sains di China dan memegang Ph.D. Menghadiri Universiti Colorado Boulder. Selepas tamat pengajian, beliau bekerja di IBM dan berkhidmat sebagai dekan IBM Research Artificial Intelligence Foundations (AI Foundations), ketua saintis IBM Watson Group, dan IBM Distinguished Engineer. Pada 2017, Zhou Bowen menyertai JD.com sebagai Naib Presiden Kumpulan JD.com dan bertanggungjawab untuk penyelidikan AI JD.com.

NLP, multi-modaliti, dialog manusia-komputer, dll. adalah semua bidang yang Zhou Bowen telah terlibat secara mendalam selama bertahun-tahun. Mekanisme perwakilan bahasa semula jadi mekanisme berbilang kepala gabungan perhatian kendiri yang dicadangkannya kemudian menjadi salah satu idea teras seni bina Transformer Beliau juga mencadangkan dua seni bina model dan algoritma penjanaan bahasa semula jadi dalam bidang AIGC. Pada tahun 2020, beliau telah dipilih sebagai Fellow IEEE.

Pada pandangan Zhou Bowen, kemajuan teras ChatGPT ialah penambahbaikan kerjasama manusia dan pembelajaran interaktif dan bukannya pembesaran model Selain itu, ChatGPT pasti akan berkembang menjadi pelbagai mod masa depan, yang juga Ia adalah hala tuju penyelidikan utama Pusat Penyelidikan Perisikan Interaktif Kolaboratif yang diketuai oleh beliau.

Di Teknologi Xianyuan, Zhou Bowen juga telah melaksanakan beberapa aplikasi AIGC, seperti menggunakan kecerdasan buatan generatif untuk mempercepatkan inovasi masa nyata berpusatkan pengguna dan pasaran serta meningkatkan Kadar kejayaan inovasi SKU.

Institut Penyelidikan IDEA Zhang Jiaxing

Di Kawasan Teluk Besar Guangdong-Hong Kong-Macao, selain Makmal Pengcheng dan Tencent, terdapat ialah satu lagi pemain model besar, Iaitu, Institut Penyelidikan IDEA (nama penuh "Institut Penyelidikan Ekonomi Digital Kawasan Teluk Guangdong-Hong Kong-Macao") telah diasaskan pada tahun 2020 oleh saintis AI terkenal seperti Shen Xiangyang

Orang yang bertanggungjawab ke atas model besar Institut Penyelidikan IDEA Ia adalah Zhang Jiaxing, dia juga seorang saintis AI yang keluar dari MSRA >

Zhang Jiaxing lulus dari Jabatan Elektronik Universiti Peking dengan Ph.D pada tahun 2006, belajar di bawah Hou Shimin (kini seorang profesor Jabatan Elektronik Universiti Peking, beliau mula-mula tinggal di Baidu untuk tempoh masa,). dan kemudian menyertai pasukan Carian Bing Microsoft, bekerja dengan Zhou Jingren Kemudian di MSRA, Zhang Jiaxing terlibat dalam penyelidikan sistem, dan beralih kepada pembelajaran mendalam pada tahun 2012. Pada tahun 2014, Zhang Jiaxing menyertai Alibaba iDST (Dharma). ), dan setahun kemudian pergi ke Ant Financial untuk mengetuai pasukan teknikal NLP untuk menggunakan robot perbualan pada senario kewangan Pada tahun 2020, Zhang Jiaxing telah dijemput oleh Ketua Pegawai Eksekutif 360 Digital Wu Haisheng untuk menyertai 360 Digital sebagai ketua saintis setahun setengah, dia pergi

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Atas cadangan Dekan MSRA Zhou Lidong, Zhang Jiaxing menyertai Institut Penyelidikan IDEA sebagai ketua saintis yang bertanggungjawab dalam Pengkomputeran Kognitif dan Penyelidikan Bahasa Semulajadi Pusat.

Pasukan Zhang Jiaxing telah mengetuai gelombang AIGC Dia mengetuai pembangunan siri model sumber terbuka “Fengshenbang” dan melancarkan model Stable Diffusion yang pertama. China tahun lepas. "Taiyi". Pasukan. Model ChatGPT bersamaan dengan ChatGPT dan hanya mempunyai 5 bilion parameter Kelajuan penjanaan teks juga sedang dalam ujian dalaman dan akan dikeluarkan kepada umum tidak lama lagi 🎜>Walaupun 5 bilion parameter semasa adalah Model ini sudah berfungsi dengan baik, tetapi seterusnya, Zhang Jiaxing merancang untuk membangunkan produk seperti ChatGPT yang disokong oleh model 100 bilion dan mempromosikan pengkomersilannya. Inilah sebabnya dia sedang bersiap untuk meningkatkan dana dan cari CEO >西湖

Xinchen Lan Zhenzhong

Turut mencari CEO untuk pasukan ialah Lan Zhenzhong, pengasas Xihu Xinchen

Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?

Lan Zhenzhong

Tahun lepas, dalam banyak produk lukisan AI domestik "Pencuri Impian" (kini dinamakan semula sebagai "Diari Impian") yang menonjol daripada pertandingan itu datang daripada pasukan Lan Zhenzhong.

Lan Zhenzhong lulus dari Universiti Sun Yat-sen dengan ijazah sarjana muda dan belajar visi komputer di Carnegie Mellon University untuk PhDnya Kemudian, dia beralih kepada pemprosesan bahasa semula jadi apabila dia pergi bekerja di Google, bergantung pada Google Model besar ringan yang terkenal "ALBERT" telah dibangunkan menggunakan sumber TPU.

Pada Jun 2020, Lan Zhenzhong kembali ke China untuk menyertai Westlake University, mengasaskan makmal pembelajaran mendalam, dan memulakan penyelidikan pelbagai mod mengenai gabungan bahasa dan penglihatan.

Bergantung pada sumber penyelidikan saintifik West Lake University dan "Qingyuan Club" Zhiyuan yang pernah disertainya, Lan Zhenzhong memulakan model penyelidikan universiti-industri dan mengasaskan West Lake Xinchen mula-mula membangunkannya berdasarkan model besar Robot sembang perundingan psikologi "Xiaotian" kemudiannya akan melancarkan produk lukisan domestik "Dream Stealer" dalam gelombang Stable Diffusion pada Ogos 2022.

Tidak lama selepas ChatGPT keluar, Xihu Xinchen melancarkan produk penjanaan teks serupa "Xinchen Chat". Perbezaannya ialah ia boleh mengakses Internet dan bersifat interaktif berbilang modal Ia bukan sahaja boleh menjana teks tetapi juga mengeluarkan imej.

Seperti kebanyakan orang yang bermula sebagai sarjana dan kemudian memulakan bidang keusahawanan, Lan Zhenzhong juga amat merasakan bahawa pasukan itu memerlukan seorang CEO dengan pengalaman pengurusan dan keupayaan penyepaduan sumber yang kukuh untuk bersama-sama membina versi Cina daripada OpenAI. Sila beri perhatian kepada kajian semula teknologi AI esok: "Lan Zhenzhong juga menyiarkan "siaran wira", versi Cina syarikat bintang ChatGPT sedang mencari CEO"

Atas ialah kandungan terperinci Untuk mencipta ChatGPT versi Cina, apakah kuasa akademik domestik yang boleh merebut peluang itu?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!