Berita pada 27 Oktober 2023 ialah Zhipu AI mengeluarkan model asas besar generasi ketiga yang dibangunkan sendiri ChatGLM3 dan siri produk berkaitan di Persidangan Komputer China (CNCC). Keluaran ini menandakan kejayaan besar untuk Zhipu AI selepas melancarkan 100 bilion model perbualan asas ChatGLM dan ChatGLM2
ChatGLM3 dibangunkan menggunakan kaedah pra-latihan dipertingkatkan pelbagai peringkat asal. Kaedah ini dapat menjadikan latihan lebih lengkap. Menurut keputusan penilaian, dalam 44 ujian set data awam Cina dan Inggeris, ChatGLM3 menduduki tempat pertama dalam kalangan model domestik dengan saiz yang sama. Zhang Peng, Ketua Pegawai Eksekutif Zhipu AI, mengeluarkan produk baharu pada sidang akhbar dan menunjukkan fungsi produk terkini dalam masa nyata
ChatGLM3 peningkatan teknologi baharu dengan prestasi yang lebih tinggi dan kos yang lebih rendah
ChatGLM3 yang dilancarkan oleh Zhipu AI telah menjadi lebih berkuasa dengan data latihan yang lebih kaya dan penyelesaian latihan yang lebih baik. Berbanding dengan ChatGLM2, MMLU meningkat sebanyak 36%, CEval meningkat sebanyak 33%, GSM8K meningkat sebanyak 179% dan BBH meningkat sebanyak 126%
Pada masa yang sama, ChatGLM3 menyasarkan GPT-4V dan telah melaksanakan peningkatan berulang beberapa fungsi baharu, termasuk CogVLM dengan keupayaan pemahaman pelbagai mod - semantik pengecaman imej, yang telah mencapai keputusan pada lebih daripada 10 grafik standard antarabangsa dan set data penilaian teks SOTA; modul peningkatan kod Code Interpreter menjana kod dan melaksanakannya mengikut keperluan pengguna, secara automatik menyelesaikan tugas-tugas kompleks seperti analisis data dan pemprosesan fail peningkatan carian WebGLM-akses, secara automatik boleh mencari maklumat yang berkaitan; Internet berdasarkan soalan dan jawapan soalan Menyediakan pautan kepada rujukan atau artikel yang berkaitan. Keupayaan semantik dan logik ChatGLM3 telah dipertingkatkan.
ChatGLM3 juga menyepadukan teknologi AgentTuning yang dibangunkan sendiri, yang mengaktifkan keupayaan ejen model, terutamanya dari segi perancangan dan pelaksanaan pintar, yang 1000% bertambah baik berbanding ChatGLM2, ia juga membolehkan model besar domestik menyokong panggilan alat secara asli dan pelaksanaan kod , permainan, operasi pangkalan data, carian dan penaakulan graf pengetahuan, sistem pengendalian dan senario kompleks lain.
Selain itu, ChatGLM3 melancarkan model ujian akhir ChatGLM3-1.5B dan ChatGLM3-3B yang boleh digunakan pada telefon mudah alih Mereka menyokong pelbagai telefon mudah alih dan platform yang dipasang pada kenderaan termasuk vivo, Xiaomi dan Samsung, dan walaupun menyokong cip CPU pada platform mudah alih, kelajuan boleh mencapai 20 token/s. Dari segi ketepatan, prestasi model 1.5B dan 3B adalah hampir dengan model ChatGLM2-6B pada penanda aras awam.
Berdasarkan inferens dinamik terkini dan teknologi pengoptimuman memori, rangka kerja inferens semasa ChatGLM3 adalah lebih baik daripada pelaksanaan sumber terbuka terbaik semasa di bawah keadaan perkakasan dan model yang sama, termasuk vLLM yang dilancarkan oleh Universiti Berkeley dan versi Hugging Face TGI terkini, kelajuan inferens meningkat sebanyak 2-3 kali ganda, dan kos inferens digandakan, hanya 0.5 mata setiap seribu token, kos terendah.
Kandungan ini adalah untuk rujukan sahaja dan tidak mengandungi sebarang nasihat pelaburan. Pembaca harus menggunakan pertimbangan mereka sendiri apabila menggunakan maklumat ini dan bertanggungjawab untuk keputusan mereka sendiri. Laman web ini tidak bertanggungjawab terhadap sebarang kerugian yang disebabkan oleh penggunaan kandungan ini
Akaun ini tidak membuat sebarang kenyataan atau jaminan tentang ketersediaan, ketepatan, ketepatan masa, kesahihan atau kesempurnaan sebarang maklumat yang diterbitkan, dan dengan ini menafikan sebarang liabiliti atau sebarang akibat yang mungkin timbul daripada maklumat tersebut. Selepas menulis semula: Akaun ini tidak memberikan representasi atau jaminan tentang ketersediaan, ketepatan, ketepatan masa, kesahihan atau kesempurnaan sebarang maklumat yang disiarkan dan menafikan sebarang liabiliti atau akibat dalam penyata ini
2 Akaun ini bukan komersil dan bukan untung Kandungan yang diterbitkan semula tidak bermakna anda bersetuju dengan pandangannya dan bertanggungjawab ke atas keasliannya, dan juga tidak bertujuan untuk membentuk sebarang panduan lain. Laman web ini tidak bertanggungjawab untuk sebarang liabiliti langsung atau tidak langsung untuk sebarang ketidaktepatan atau kesilapan dalam sebarang maklumat yang diterbitkan semula atau diterbitkan.
3 Maklumat, bahan, teks, gambar, dsb. yang digunakan dalam artikel ini berasal dari Internet, dan semua kandungan yang diterbitkan semula telah ditandakan dengan sumbernya. Jika anda menemui apa-apa kerja yang melanggar hak harta intelek atau hak undang-undang peribadi anda, sila hubungi kami dan kami akan mengubah suai atau memadamkannya dalam masa
Atas ialah kandungan terperinci Zhipu AI melancarkan model asas besar generasi ketiga ChatGLM3 untuk menyesuaikan diri dengan lebih banyak cip domestik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!