Dalam beberapa tahun kebelakangan ini, model pra-latihan berskala besar telah menjadi salah satu daya penggerak penting untuk penemuan dalam kecerdasan buatan, mempercepatkan proses pembangunan kejuruteraan dan pempopularan kecerdasan buatan, dan dijangka menjadi asas kepada generasi baharu pintar teknologi. Kejayaan dalam model kecerdasan buatan besar berpunca daripada pembangunan berterusan data berkualiti tinggi Meningkatkan keupayaan untuk membekalkan data berkualiti tinggi adalah kunci untuk mempromosikan inovasi dalam bidang kecerdasan buatan am model besar
.Dalam kajian penting pada tahun 2020, didapati terdapat undang-undang pembangunan undang-undang kuasa antara kesan model dan parameter, data dan jumlah pengiraannya, iaitu "Undang-undang Penskalaan". Parameter, data dan jumlah pengiraan model meningkat secara eksponen, manakala kehilangan model pada set ujian berkurangan secara eksponen, menunjukkan bahawa prestasi model lebih baik
Dalam erti kata lain, apabila jumlah pengiraan ditetapkan dan skala parameter adalah kecil, kesan peningkatan bilangan parameter model pada prestasi model jauh melebihi sumbangan jumlah data dan bilangan masa latihan
Oleh itu, industri secara amnya menyedari bahawa prestasi model adalah berkadar terus dengan parameter dan kapasitinya, iaitu, lebih banyak parameter dan kapasiti model, lebih baik prestasi
Menurut perkembangan dan trend masa depan rantaian industri AI, saiz pasaran industri perkhidmatan data AI China semakin meningkat secara beransur-ansur. Apabila permintaan untuk data latihan meningkat dan keperluan untuk standard perkhidmatan meningkat, pembahagian kerja profesional dalam rantaian industri menjadi lebih jelas
Jia Yuhang menekankan pada acara Forum Perintis Belia bahawa kualiti data AI adalah faktor utama dalam kecerdasan buatan, yang secara langsung mempengaruhi keputusan akhir model besar. Lebih tinggi kuantiti dan kualiti data, lebih lengkap model boleh dilatih dan prestasi dioptimumkan, dan lebih baik prestasinya. Oleh itu, data AI berkualiti tinggi akan menyediakan keupayaan perkhidmatan yang lebih berkuasa untuk aplikasi kecerdasan buatan
Jia Yuhang berkata bahawa data pengukuran awan mempunyai banyak kelebihan dalam memenuhi permintaan untuk data berkualiti tinggi untuk model besar. Mereka menganggap kualiti data sebagai teras perkhidmatan data AI Mereka bukan sahaja menumpukan pada penyelidikan teknologi dan pengoptimuman pembangunan, tetapi juga meluas kepada latihan bakat dan perkhidmatan produk, menyediakan perkhidmatan data AI berasaskan senario berkualiti tinggi. Di peringkat perniagaan, mereka memperkenalkan pemprosesan data AI kepada perusahaan melalui pengumpulan data, pembersihan data dan anotasi data, serta menyediakan antara muka API standard untuk menyokong import dan eksport data, serta fungsi pra-anotasi untuk algoritma sedia ada. Mereka boleh menyediakan berbilang aplikasi produk data AI dan perkhidmatan data AI, dan berhubung dengan mana-mana pangkalan data perusahaan, mengumpul dengan cepat proses daripada data mentah kepada data beranotasi, dan mempercepatkan proses pembangunan model AI
Atas ialah kandungan terperinci Memperkukuh keupayaan bekalan data berkualiti tinggi dan menggalakkan inovasi dalam bidang model besar kecerdasan buatan am. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!