Rumah > Peranti teknologi > AI > teks badan

Model besar siri Kunlun Wanwei 'Tiangong' 13B yang baharu boleh dikomersialkan dengan mudah tanpa sebarang ambang.

WBOY
Lepaskan: 2023-10-30 15:41:17
ke hadapan
1298 orang telah melayarinya

Pada 30 Oktober, Kunlun Wanwei mengumumkan sumber terbuka Skywork-13B siri Skywork-13B, model bahasa besar berpuluh-puluh bilion, dan sumber terbuka jarang berlaku sebanyak 600GB600GB Token

Set data Cina sumber terbuka berkualiti tinggi yang sangat besar.

Siri Kunlun Wanwei Skywork-13B pada masa ini termasuk dua model utama dengan 13 bilion parameter: Skywork-13B-Basemodel, Skywork-13B-Mathmodel dalam penilaian ujian penanda aras, seperti CEVAL dan GSM8K, telah menunjukkan hasil terbaik model dengan saiz yang sama

Keupayaan Cina

nya amat cemerlang, dan prestasinya dalam teknologi, kewangan, hal ehwal kerajaan dan bidang lain adalah lebih tinggi daripada bidang lain. model sumber terbuka.

Alamat muat turun untuk Skywork-13B (Skop Model) boleh didapati di: https://modelscope.cn/organization/skywork

Alamat muat turun untuk Skywork-13B (Github): https://github.com/SkyworkAI /Skywork Selain model sumber terbuka, Skywork-13B siri model besar juga akan menjadi sumber terbuka 600GB, set data Cina150B berkualiti tinggi Token Cina Skypile/Chinese-Web-Text- 150B, ini ialah salah satu set data bahasa Cina sumber terbuka terbesar pada masa ini.

Pada masa yang sama, "Skywork" Kunlun Wanwei Skywork-13B siri model besar tidak lama lagi akan dibuka sepenuhnya untuk kegunaan komersial—— Pemaju tidak perlu memohon untuk kegunaan komersial.

13 bilion parameter, dua model utama, salah satu set data Cina terbesar, terbuka sepenuhnya untuk kegunaan komersial. Skywork" Kunlun Wanwei Skywork-13B siri model besar boleh dipanggil model komersial berkualiti tinggi sumber terbuka yang paling teliti bernilai berpuluh bilion.

Sumber terbuka model besar siri Skywork-13B akan memberikan sokongan teknikal terbaik untuk aplikasi model besar dan pembangunan komuniti sumber terbuka, mengurangkan ambang komersial untuk model besar, mempromosikan pelaksanaan kecerdasan buatan teknologi dalam pelbagai industri, dan menyumbang kepada pembinaan ekosistem kecerdasan buatan Kami akan bekerjasama dengan komuniti sumber terbuka untuk meneroka dunia yang tidak diketahui dan mencipta masa depan yang lebih baik

Siri Skywork-13B Kunlun Wanwei merangkumi dua model utama dan 150B. set data Cina berkualiti tinggi. Skywork-13B-BaseModel ini adalah model asas Skywork-13B Ia dilatih dengan 3.2 trilion data berkualiti tinggi berbilang bahasa dan telah menunjukkan prestasi yang sama dalam CEVAL, CMMLU, MMLU, GSM8K dan penilaian lain. dan ujian penanda aras Keputusan terbaik untuk model skala.

Skywork-13B-Math

Model ini telah dilatih khas untuk mengukuhkan keupayaan matematik dan telah mencapai keputusan terbaik model dengan saiz yang sama pada set data seperti GSM8K.
  • Skypile/Teks-Web-Cina-150Bset data. Set data ini ialah data berkualiti tinggi yang ditapis daripada halaman web Cina mengikut proses pemprosesan data kami yang ditapis dengan teliti.
  • Saiz set data sumber terbuka ini adalah lebih kurang
  • 600GB
  • , dan jumlah bilangan
  • token adalah lebih kurang (1500 bilion pada masa ini . Selain itu, siri Skywork-13B juga mendedahkan kaedah penilaian, penyelidikan nisbah data, dan pelan pengoptimuman infrastruktur latihan yang digunakan dalam model ini adalah diharapkan kandungan sumber terbuka ini dapat menginspirasikan lagi pemahaman masyarakat tentang besar- model skala pra-latihan dan menggalakkan realisasi Kecerdasan Am Buatan (AGI). dan lain-lain. Penilaian berwibawa dan ujian penanda aras telah menunjukkan keputusan terbaik model dengan skala yang sama Keupayaannya dalam bahasa Cina sangat cemerlang, dan prestasinya dalam teknologi, kewangan, hal ehwal kerajaan dan bidang lain adalah lebih tinggi daripada model sumber terbuka yang lain. Lima ciri model siri Skywork-13B: Prestasi parameter terkuat: secara menyeluruh mengatasi model besar skala yang sama

Model siri Skywork-13B sumber terbuka ini mempunyai prestasi kukuh dalam CEVAL, CMMLU, MMKLU dan utama lain Dalam penanda aras penilaian berwibawa, ia secara menyeluruh mengatasi model besar sumber terbuka seperti LLaMA2-13B dan mencapai hasil terbaik di kalangan model besar dengan skala yang sama. (Data setakat 25 Oktober) Data latihan maksimum:

3.2T

Data latihan berbilang bahasa berkualiti tinggi

Skywork-13B model besar berbilang bahasa dan 13 bilion parameter berbilang bahasa siri tinggi. data latihan. Keupayaan penjanaan model, kebolehan kreatif dan kebolehan penaakulan matematik telah dipertingkatkan dengan ketara.

Keupayaan pemodelan bahasa Cina terkuat: penilaian kebingungan pemodelan bahasa Cina, mengatasi semua model sumber terbuka Cina

Model besar siri Skywork-13B sangat baik dalam pemodelan bahasa Cina dan mempunyai keupayaan penciptaan budaya Cina yang sangat baik. Dalam penilaian dalam bidang penciptaan teks Cina, model besar siri Skywork-13B telah menunjukkan keupayaan yang luar biasa, terutamanya dalam bidang teknologi, kewangan, hal ehwal kerajaan, perkhidmatan korporat, kreativiti budaya, permainan, dll., dan prestasinya adalah lebih baik daripada model sumber terbuka yang lain

Model besar siri Kunlun Wanwei Tiangong 13B yang baharu boleh dikomersialkan dengan mudah tanpa sebarang ambang.

Angka menunjukkan kebingungan model penilaian di bawah medan data yang berbeza Semakin rendah nilainya, semakin kuat keupayaan pemodelan model dalam medan ini. Keputusan menunjukkan bahawa Tiangong 13B berprestasi baik dalam artikel teknikal, filem, laporan kerajaan, permainan, kewangan dan bidang umum

Salah satu set data sumber terbuka China terbesar: 150B TokenKorpus Cina berkualiti tinggi.

Skywork- Siri 13B akan dilengkapi dengan set data korpus Cina berkualiti tinggi sumber terbuka Skypile/Chinese-Web-Text-150B Token 600GB dan 150B, yang kini merupakan salah satu set data Cina sumber terbuka terbesar. Pembangun boleh menggunakan proses pra-latihan model besar dan pengalaman dalam laporan teknikal pada tahap yang paling tinggi, menyesuaikan parameter model secara mendalam dan melaksanakan latihan dan pengoptimuman yang disasarkan.

Penggunaan komersial sumber terbuka yang paling ikhlas: tiada aplikasi diperlukan untuk mencapai penggunaan komersial

Pada masa ini, dalam komuniti sumber terbuka, kebanyakan model Cina tidak tersedia sepenuhnya untuk kegunaan komersial. Biasanya, pengguna dalam komuniti sumber terbuka perlu melalui proses permohonan lesen komersial yang menyusahkan. Dalam sesetengah kes, pengeluaran lesen komersial akan ditetapkan dengan jelas oleh saiz syarikat, industri, bilangan pengguna, dsb., dan tiada kebenaran dibenarkan

Kunlun Wanwei mementingkan keterbukaan dan ketersediaan komersial Skywork-. 13B siri sumber terbuka , untuk memudahkan proses kebenaran dan menghapuskan sekatan ke atas industri, saiz syarikat, pengguna, dsb., dengan tujuan membantu lebih ramai pengguna dan syarikat yang berminat dengan model besar China untuk terus meneroka dan maju dalam industri.

Model berskala besar siri Skywork-13B kini dilesenkan sepenuhnya untuk kegunaan komersial Pengguna hanya perlu memuat turun model dan bersetuju dan mematuhi "Perjanjian Lesen Komuniti Model Skywork", dan boleh menggunakan model berskala besar untuk tujuan komersial. tanpa memohon kebenaran lagi. Kami berharap pengguna dapat meneroka dengan lebih mudah keupayaan teknikal siri Skywork-13B model berskala besar dan meneroka aplikasi komersial dalam senario berbeza

Menggalakkan kemakmuran ekosistem sumber terbuka dan membenarkan lebih ramai pembangun mengambil bahagian dalam teknologi AIGC Semasa pembangunan, kami mempromosikan peningkatan teknologi melalui penciptaan bersama dan perkongsian.

Dalam era AI, pembinaan ekologi sumber terbuka berkembang pesat dan telah menjadi pautan penting dalam merealisasikan integrasi AI dan aplikasi. Dengan menurunkan ambang untuk pembangunan model dan kos penggunaan, dan memaksimumkan perkongsian keupayaan teknikal dan pengalaman, lebih banyak syarikat dan pembangun akan dapat mengambil bahagian dalam perubahan teknologi yang diterajui oleh AI ini. Fang Han, pengerusi dan Ketua Pegawai Eksekutif Kunlun Wanwei, ialah salah seorang pakar sumber terbuka kanan pertama yang mengambil bahagian dalam pembinaan ekosistem sumber terbuka, dan juga merupakan salah seorang perintis sumber terbuka Linux Cina. Semangat sumber terbuka dan pembangunan teknologi AIGC akan disepadukan dengan sempurna dalam strategi Kunlun Wanwei

Semua dalam AGI dan AIGC

Strategi Kunlun Wanwei merangkumi kerjasama dengan AGI dan AIGC1

April

Wanwei, yang dikeluarkan. Model bahasa berskala besar domestik pertama China yang benar-benar merealisasikan kemunculan kecerdasan - "Tiangong 3.5" dan melancarkan ujian jemputan.

Pada 19 Mei, Biro Ekonomi dan Teknologi Maklumat Perbandaran Beijing mengumumkan kumpulan pertama "Senarai Ahli Program Perkongsian Inovasi Industri Kecerdasan Buatan Am Beijing". Kunlun Wanwei menjadi kumpulan pertama rakan kongsi model dan rakan kongsi pelaburan dengan penerokaan termaju dan susun atur pelaburannya dalam bidang AIGC.

Pada 23 Ogos, Kunlun Technology mengeluarkan produk carian AI pertama di China, yang dipanggil Tiangong AI Search

Pada 1 September, Profesor Yan Shuicheng, pakar antarabangsa terkemuka dalam bidang penglihatan komputer dan pembelajaran mesin, secara rasmi menyertai Kunlun Technology , bersama Zhou Yahui, pengasas Teknologi Kunlun, berkhidmat sebagai Ketua Pegawai Eksekutif bersama Perisikan Tiangong, dan pada masa yang sama berkhidmat sebagai pengarah Institut Penyelidikan Global Teknologi Kunlun 2050, yang bertanggungjawab untuk penyelidikan teknologi termaju.

Dalam penilaian model bahasa besar berbilang modal yang dijalankan oleh Tencent Youtu Lab dan Universiti Xiamen, Model Besar Kunlun Wanwei Tiangong mencapai skor komprehensif pertama pada 5 September

25 September, Kunlun Wanwei secara rasmi mengawal Aijie Core dan meletakkan cip AI.

Hari ini, Kumpulan Kunlun Wanwei menunjukkan keazaman teguhnya untuk terus melabur dalam ekosistem kecerdasan buatan melalui tindakan sumber terbuka siri model besar Skywork-13B. Pada tahun 2015, syarikat itu disenaraikan di Bursa Saham Shenzhen. Ia bermula dalam bidang permainan dan kini telah menjadi perusahaan yang menyepadukan perniagaan yang pelbagai seperti AII In AGI dan AIGC. Selepas lebih sepuluh tahun pembangunan, Kunlun Wanwei telah komited untuk menyediakan produk dan perkhidmatan Internet terkemuka kepada pengguna global. Pada masa ini, syarikat itu sedang aktif meneroka kemungkinan yang tidak terhingga dalam bidang kecerdasan buatan. Kini, Teknologi Kunlun telah membina tiga sektor perniagaan utama secara beransur-ansur: AGI dan AIGC, pengedaran maklumat dan metaverse di luar negara, dan pelaburan Perniagaannya meliputi lebih daripada 100 negara dan wilayah di seluruh dunia, dan purata pengguna aktif bulanan global hampir 400 juta.

Dengan ramalan lanjutan arah aliran pembangunan teknologi, Kunlun Technology telah mula menggunakan bidang AIGC seawal tahun 2020. Setakat ini, ia telah mengumpulkan hampir tiga tahun pengalaman penyelidikan dan pembangunan kejuruteraan yang berkaitan dan mewujudkan keupayaan pemprosesan mendalam yang menerajui industri untuk data pra-latihan juga telah membuat penemuan besar dalam bidang kecerdasan buatan Ia kini telah terbentuk Model besar AI, carian AI, AI Dengan enam matriks perniagaan AI utama: permainan, muzik AI, animasi AI, dan rangkaian sosial AI, ia adalah salah satu syarikat domestik dengan teknologi model dan keupayaan kejuruteraan terkuat, susun atur yang paling komprehensif, dan komited sepenuhnya terhadap pembinaan komuniti sumber terbuka.

Atas ialah kandungan terperinci Model besar siri Kunlun Wanwei 'Tiangong' 13B yang baharu boleh dikomersialkan dengan mudah tanpa sebarang ambang.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:jiqizhixin.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan