Pada 30 Oktober, Kunlun Wanwei mengumumkan sumber terbuka Skywork-13B siri Skywork-13B, model bahasa besar berpuluh-puluh bilion, dan sumber terbuka jarang berlaku sebanyak 600GB600GB Token
Set data Cina sumber terbuka berkualiti tinggi yang sangat besar.Siri Kunlun Wanwei Skywork-13B pada masa ini termasuk dua model utama dengan 13 bilion parameter: Skywork-13B-Basemodel, Skywork-13B-Mathmodel dalam penilaian ujian penanda aras, seperti CEVAL dan GSM8K, telah menunjukkan hasil terbaik model dengan saiz yang sama
Keupayaan Cinanya amat cemerlang, dan prestasinya dalam teknologi, kewangan, hal ehwal kerajaan dan bidang lain adalah lebih tinggi daripada bidang lain. model sumber terbuka.
Alamat muat turun untuk Skywork-13B (Skop Model) boleh didapati di: https://modelscope.cn/organization/skywork
Alamat muat turun untuk Skywork-13B (Github): https://github.com/SkyworkAI /Skywork Selain model sumber terbuka, Skywork-13B siri model besar juga akan menjadi sumber terbuka 600GB, set data Cina150B berkualiti tinggi Token Cina Skypile/Chinese-Web-Text- 150B, ini ialah salah satu set data bahasa Cina sumber terbuka terbesar pada masa ini.
Pada masa yang sama, "Skywork" Kunlun Wanwei Skywork-13B siri model besar tidak lama lagi akan dibuka sepenuhnya untuk kegunaan komersial—— Pemaju tidak perlu memohon untuk kegunaan komersial.
13 bilion parameter, dua model utama, salah satu set data Cina terbesar, terbuka sepenuhnya untuk kegunaan komersial. Skywork" Kunlun Wanwei Skywork-13B siri model besar boleh dipanggil model komersial berkualiti tinggi sumber terbuka yang paling teliti bernilai berpuluh bilion.
Sumber terbuka model besar siri Skywork-13B akan memberikan sokongan teknikal terbaik untuk aplikasi model besar dan pembangunan komuniti sumber terbuka, mengurangkan ambang komersial untuk model besar, mempromosikan pelaksanaan kecerdasan buatan teknologi dalam pelbagai industri, dan menyumbang kepada pembinaan ekosistem kecerdasan buatan Kami akan bekerjasama dengan komuniti sumber terbuka untuk meneroka dunia yang tidak diketahui dan mencipta masa depan yang lebih baikSkywork-13B-Math
Model ini telah dilatih khas untuk mengukuhkan keupayaan matematik dan telah mencapai keputusan terbaik model dengan saiz yang sama pada set data seperti GSM8K.3.2T
Data latihan berbilang bahasa berkualiti tinggi
Skywork-13B model besar berbilang bahasa dan 13 bilion parameter berbilang bahasa siri tinggi. data latihan. Keupayaan penjanaan model, kebolehan kreatif dan kebolehan penaakulan matematik telah dipertingkatkan dengan ketara.
Keupayaan pemodelan bahasa Cina terkuat: penilaian kebingungan pemodelan bahasa Cina, mengatasi semua model sumber terbuka Cina
Model besar siri Skywork-13B sangat baik dalam pemodelan bahasa Cina dan mempunyai keupayaan penciptaan budaya Cina yang sangat baik. Dalam penilaian dalam bidang penciptaan teks Cina, model besar siri Skywork-13B telah menunjukkan keupayaan yang luar biasa, terutamanya dalam bidang teknologi, kewangan, hal ehwal kerajaan, perkhidmatan korporat, kreativiti budaya, permainan, dll., dan prestasinya adalah lebih baik daripada model sumber terbuka yang lain
Angka menunjukkan kebingungan model penilaian di bawah medan data yang berbeza Semakin rendah nilainya, semakin kuat keupayaan pemodelan model dalam medan ini. Keputusan menunjukkan bahawa Tiangong 13B berprestasi baik dalam artikel teknikal, filem, laporan kerajaan, permainan, kewangan dan bidang umum
Salah satu set data sumber terbuka China terbesar: 150B TokenKorpus Cina berkualiti tinggi.
Skywork- Siri 13B akan dilengkapi dengan set data korpus Cina berkualiti tinggi sumber terbuka Skypile/Chinese-Web-Text-150B Token 600GB dan 150B, yang kini merupakan salah satu set data Cina sumber terbuka terbesar. Pembangun boleh menggunakan proses pra-latihan model besar dan pengalaman dalam laporan teknikal pada tahap yang paling tinggi, menyesuaikan parameter model secara mendalam dan melaksanakan latihan dan pengoptimuman yang disasarkan.
Penggunaan komersial sumber terbuka yang paling ikhlas: tiada aplikasi diperlukan untuk mencapai penggunaan komersial
Pada masa ini, dalam komuniti sumber terbuka, kebanyakan model Cina tidak tersedia sepenuhnya untuk kegunaan komersial. Biasanya, pengguna dalam komuniti sumber terbuka perlu melalui proses permohonan lesen komersial yang menyusahkan. Dalam sesetengah kes, pengeluaran lesen komersial akan ditetapkan dengan jelas oleh saiz syarikat, industri, bilangan pengguna, dsb., dan tiada kebenaran dibenarkan
Kunlun Wanwei mementingkan keterbukaan dan ketersediaan komersial Skywork-. 13B siri sumber terbuka , untuk memudahkan proses kebenaran dan menghapuskan sekatan ke atas industri, saiz syarikat, pengguna, dsb., dengan tujuan membantu lebih ramai pengguna dan syarikat yang berminat dengan model besar China untuk terus meneroka dan maju dalam industri.
Model berskala besar siri Skywork-13B kini dilesenkan sepenuhnya untuk kegunaan komersial Pengguna hanya perlu memuat turun model dan bersetuju dan mematuhi "Perjanjian Lesen Komuniti Model Skywork", dan boleh menggunakan model berskala besar untuk tujuan komersial. tanpa memohon kebenaran lagi. Kami berharap pengguna dapat meneroka dengan lebih mudah keupayaan teknikal siri Skywork-13B model berskala besar dan meneroka aplikasi komersial dalam senario berbeza
Menggalakkan kemakmuran ekosistem sumber terbuka dan membenarkan lebih ramai pembangun mengambil bahagian dalam teknologi AIGC Semasa pembangunan, kami mempromosikan peningkatan teknologi melalui penciptaan bersama dan perkongsian.
Dalam era AI, pembinaan ekologi sumber terbuka berkembang pesat dan telah menjadi pautan penting dalam merealisasikan integrasi AI dan aplikasi. Dengan menurunkan ambang untuk pembangunan model dan kos penggunaan, dan memaksimumkan perkongsian keupayaan teknikal dan pengalaman, lebih banyak syarikat dan pembangun akan dapat mengambil bahagian dalam perubahan teknologi yang diterajui oleh AI ini. Fang Han, pengerusi dan Ketua Pegawai Eksekutif Kunlun Wanwei, ialah salah seorang pakar sumber terbuka kanan pertama yang mengambil bahagian dalam pembinaan ekosistem sumber terbuka, dan juga merupakan salah seorang perintis sumber terbuka Linux Cina. Semangat sumber terbuka dan pembangunan teknologi AIGC akan disepadukan dengan sempurna dalam strategi Kunlun Wanwei
Strategi Kunlun Wanwei merangkumi kerjasama dengan AGI dan AIGC1
AprilWanwei, yang dikeluarkan. Model bahasa berskala besar domestik pertama China yang benar-benar merealisasikan kemunculan kecerdasan - "Tiangong 3.5" dan melancarkan ujian jemputan.
Pada 19 Mei, Biro Ekonomi dan Teknologi Maklumat Perbandaran Beijing mengumumkan kumpulan pertama "Senarai Ahli Program Perkongsian Inovasi Industri Kecerdasan Buatan Am Beijing". Kunlun Wanwei menjadi kumpulan pertama rakan kongsi model dan rakan kongsi pelaburan dengan penerokaan termaju dan susun atur pelaburannya dalam bidang AIGC.
Pada 23 Ogos, Kunlun Technology mengeluarkan produk carian AI pertama di China, yang dipanggil Tiangong AI Search
Pada 1 September, Profesor Yan Shuicheng, pakar antarabangsa terkemuka dalam bidang penglihatan komputer dan pembelajaran mesin, secara rasmi menyertai Kunlun Technology , bersama Zhou Yahui, pengasas Teknologi Kunlun, berkhidmat sebagai Ketua Pegawai Eksekutif bersama Perisikan Tiangong, dan pada masa yang sama berkhidmat sebagai pengarah Institut Penyelidikan Global Teknologi Kunlun 2050, yang bertanggungjawab untuk penyelidikan teknologi termaju.
Dalam penilaian model bahasa besar berbilang modal yang dijalankan oleh Tencent Youtu Lab dan Universiti Xiamen, Model Besar Kunlun Wanwei Tiangong mencapai skor komprehensif pertama pada 5 September
25 September, Kunlun Wanwei secara rasmi mengawal Aijie Core dan meletakkan cip AI.
Hari ini, Kumpulan Kunlun Wanwei menunjukkan keazaman teguhnya untuk terus melabur dalam ekosistem kecerdasan buatan melalui tindakan sumber terbuka siri model besar Skywork-13B. Pada tahun 2015, syarikat itu disenaraikan di Bursa Saham Shenzhen. Ia bermula dalam bidang permainan dan kini telah menjadi perusahaan yang menyepadukan perniagaan yang pelbagai seperti AII In AGI dan AIGC. Selepas lebih sepuluh tahun pembangunan, Kunlun Wanwei telah komited untuk menyediakan produk dan perkhidmatan Internet terkemuka kepada pengguna global. Pada masa ini, syarikat itu sedang aktif meneroka kemungkinan yang tidak terhingga dalam bidang kecerdasan buatan. Kini, Teknologi Kunlun telah membina tiga sektor perniagaan utama secara beransur-ansur: AGI dan AIGC, pengedaran maklumat dan metaverse di luar negara, dan pelaburan Perniagaannya meliputi lebih daripada 100 negara dan wilayah di seluruh dunia, dan purata pengguna aktif bulanan global hampir 400 juta.
Dengan ramalan lanjutan arah aliran pembangunan teknologi, Kunlun Technology telah mula menggunakan bidang AIGC seawal tahun 2020. Setakat ini, ia telah mengumpulkan hampir tiga tahun pengalaman penyelidikan dan pembangunan kejuruteraan yang berkaitan dan mewujudkan keupayaan pemprosesan mendalam yang menerajui industri untuk data pra-latihan juga telah membuat penemuan besar dalam bidang kecerdasan buatan Ia kini telah terbentuk Model besar AI, carian AI, AI Dengan enam matriks perniagaan AI utama: permainan, muzik AI, animasi AI, dan rangkaian sosial AI, ia adalah salah satu syarikat domestik dengan teknologi model dan keupayaan kejuruteraan terkuat, susun atur yang paling komprehensif, dan komited sepenuhnya terhadap pembinaan komuniti sumber terbuka.
Atas ialah kandungan terperinci Model besar siri Kunlun Wanwei 'Tiangong' 13B yang baharu boleh dikomersialkan dengan mudah tanpa sebarang ambang.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!