Rumah> Peranti teknologi> AI> teks badan

Mentafsir 'mitos' model berskala besar, industri penerbitan data pengukuran awan penyelesaian data model besar AI

王林
Lepaskan: 2023-09-22 20:09:12
ke hadapan
617 orang telah melayarinya

Model besar mempunyai ciri-ciri keberkesanan yang baik, generalisasi yang kuat, dan proses penyelidikan dan pembangunan yang standard. Ia telah menjadi hala tuju penting untuk pembangunan kecerdasan buatan dan membawa peluang baharu untuk pembangunan selanjutnya kecerdasan buatan. Ini adalah maklumat yang diperoleh daripada Berita Rangkaian Ekonomi Mingguan Ekonomi China

Pada masa ini, pembangunan model berskala besar menunjukkan trend yang berkembang pesat dan sangat memperkasakan semua lapisan masyarakat, tetapi ia masih menghadapi banyak cabaran dalam proses perindustrian. Antaranya, cara mendapatkan dan menggunakan data secara cekap dan berkesan daripada industri menegak adalah kunci

Di Pameran Perdagangan Perkhidmatan Antarabangsa China 2023, data pengukuran awan digabungkan dengan pengalaman yang kaya dan pengumpulan teknologinya dalam bidang pemanduan pintar, kewangan pintar, AIOT, e-dagang dan bidang lain, menggabungkan "kejuruteraan AI data" dikeluarkan tahun lepas "Penyelesaian" telah dinaik taraf secara menyeluruh untuk menyediakan penyelesaian data AI kitaran hayat penuh untuk model besar dalam industri menegak, menyediakan sokongan utama untuk pelaksanaan aplikasi model besar, dan membantu pembangunan berkualiti tinggi model besar dalam industri .

Mentafsir mitos model berskala besar, industri penerbitan data pengukuran awan penyelesaian data model besar AI

Memecahkan "ilusi" model besar memerlukan data berkualiti tinggi

Pembangunan model besar tidak dapat dipisahkan daripada sokongan komprehensif algoritma, kuasa pengkomputeran dan data. Dalam dua tahun yang lalu, terima kasih kepada perkembangan pesat ketiga-tiganya, model AI yang besar telah memasuki pertumbuhan yang pesat. Antaranya, data adalah kunci untuk mempromosikan pembangunan berkualiti tinggi model besar.

"Pra-latihan model besar mempunyai keperluan yang sangat tinggi pada data. Ia mesti dibersihkan, diberi penjelasan dan ditanda pada peringkat awal. Walau bagaimanapun, latihan data di sekitar beribu-ribu industri juga memberikan banyak masalah dan cabaran dari segi bekalan data." Shanghai Wei Zhilin, timbalan pengurus besar pertukaran data, menyebut dalam wawancara media.

Baru-baru ini, syarikat teknologi utama sering menyebut fenomena "ilusi" model besar. Apa yang dipanggil "ilusi" model besar bermakna bahawa teks model yang dihasilkan adalah tidak betul, tidak bermakna atau tidak nyata Orang sering memanggilnya "karut serius"

.

Kemunculan masalah "ilusi" adalah berkaitan dengan prinsip teknikal teras model berskala besar, iaitu ramalan tanda seterusnya di bawah seni bina Transformer, iaitu "meramal watak seterusnya". Oleh itu, meningkatkan kuantiti, kualiti dan kepelbagaian data adalah penting untuk meningkatkan prestasi model besar. Mementingkan data telah menjadi konsensus semakin ramai orang dalam industri

Pada masa ini, model utama masih tidak dapat melebarkan jurang yang besar dari segi kuasa pengkomputeran dan algoritma, yang menjadikan "data" sebagai pertempuran utama bagi syarikat untuk melawan "Pertempuran 100 Model".

Penyelesaian data yang disesuaikan secara mendalam untuk membantu mendapatkan data AI bernilai tinggi

Pada keluaran keputusan Pameran Perdagangan Perkhidmatan 2023 yang baru sahaja tamat, Cloud Test Data baru-baru ini mengumumkan penyelesaian data AInya, bertujuan untuk menyediakan syarikat dan pengguna kecerdasan buatan set data asas, Anotasi data dan rantai alat pengurusan data untuk menambah baik algoritma ketepatan

Menurut laporan, penyelesaian data AI ini boleh menyediakan data berkualiti tinggi dan cekap untuk keseluruhan kitaran hayat model industri besar, daripada pra-latihan berterusan, penalaan halus tugas, penilaian bersama dan ujian kepada pelepasan aplikasi, membantu perusahaan industri menegak kepada lebih baik Aplikasi algoritma yang berkaitan dengan model berskala besar.

Sebagai penyedia perkhidmatan data dengan pengumpulan set data yang kaya dan keupayaan pengumpulan data senario industri, Data Pengukuran Awan boleh menyediakan pelanggan dari semua lapisan masyarakat dengan penyelesaian pengumpulan data tersuai untuk membantu mereka memperoleh senario bernilai tinggi Data kimia# #

Apabila berhadapan dengan tugasan penalaan halus, kami boleh menyediakan sokongan keupayaan yang relevan untuk projek tugasan berasaskan teks seperti arahan QA dan model besar segera dan pelbagai mod berdasarkan ciri model besar dalam senario aplikasi sebenar. Selepas penalaan halus selesai, kami menggunakan data ujian awan, pengumpulan pakar dalam bidang menegak dan sistem dan perkhidmatan penilaian untuk membantu perusahaan menilai kesan sebenar setiap medan aplikasi menegak. Pada masa yang sama, kami juga menggunakan platform anotasi data dengan pangkalan data bersepadu sebagai teras untuk mengalirkan semula data kes yang sukar untuk pembersihan dan anotasi untuk menyediakan penalaan model yang lebih cekap

Dalam pembelajaran mesin, pemprosesan bahasa semula jadi dan bidang kecerdasan buatan lain, data contoh sukar merujuk kepada halangan yang sukar diatasi semasa latihan dan ujian model serta memerlukan perhatian dan penyelesaian khusus. Data contoh sukar biasa termasuk kesilapan ejaan, kesilapan tatabahasa, maklumat tidak lengkap atau berlebihan, kekaburan dan kekaburan, dsb.

Pada masa ini, rakan kongsi mendalam data pengukuran awan meliputi pelbagai industri, termasuk kereta, keselamatan, telefon mudah alih, kelengkapan rumah, kewangan, pendidikan, runcit baharu, ekosistem, dsb. Antaranya, ia meliputi banyak daripada 500 syarikat terkemuka dunia, institusi penyelidikan saintifik universiti, agensi kerajaan, syarikat AI terkemuka dan syarikat Internet besar

Atas ialah kandungan terperinci Mentafsir 'mitos' model berskala besar, industri penerbitan data pengukuran awan penyelesaian data model besar AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:sohu.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!