Baru-baru ini, model berskala besar Yuncong Technology telah mencapai kemajuan penting sekali lagi dalam bidang penglihatan Pengesan sasaran berdasarkan model penglihatan berskala besar asas telah mencapai kejayaan besar pada set data COCO penanda aras yang terkenal dalam bidang pengesanan daripada Microsoft. Penyelidikan (MSR), Makmal Kepintaran Buatan Shanghai, dan Kepintaran Pintar Banyak syarikat dan institusi penyelidikan terkenal seperti Institut Penyelidikan Kepintaran Buatan Yuan menyerlah dan mencipta rekod dunia baharu.
Purata ketepatan (selepas ini dirujuk sebagai mAP, min Average Precision) model besar Yuncong Technology pada set ujian COCO mencapai 0.662, menduduki tempat pertama dalam senarai (lihat rajah di bawah). Pada set pengesahan, skala tunggal mencapai mAP 0.656, dan mAP selepas TTA berbilang skala mencapai 0.662, kedua-duanya mencapai tahap terkemuka dunia.
Data besar digabungkan dengan pembelajaran diselia sendiri untuk mencipta teknologi visual teras
Latihan pra-latihan kendiri data besar yang diwakili oleh GPT telah membuat kejayaan yang luar biasa dalam bidang pemahaman bahasa semula jadi (NLP) Dalam bidang visual, data besar digabungkan dengan pembelajaran penyeliaan kendiri juga telah mencapai kemajuan penting dalam latihan model asas.
Dalam satu pihak, data visual yang luas membantu model mempelajari ciri asas biasa. Model asas berskala besar YunCong Vision menggunakan lebih daripada 2 bilion data, termasuk sebilangan besar set data tidak berlabel dan set data imej dan teks berbilang mod Set data yang kaya dan pelbagai membolehkan model mengekstrak ciri yang mantap, mengurangkan kerumitan kos pembangunan hiliran.
Sebaliknya, pembelajaran penyeliaan sendiri tidak memerlukan anotasi manual, menjadikannya mungkin untuk melatih model visual dengan data besar tanpa label. Yuncong telah membuat banyak penambahbaikan pada algoritma pembelajaran yang diselia sendiri, menjadikannya lebih sesuai untuk tugasan yang terperinci seperti pengesanan dan pembahagian, seperti yang dibuktikan oleh keputusan yang baik pada tugas pengesanan COCO.
Pengesanan sasaran terbuka + keupayaan pengesanan pembelajaran sifar masa dengan ketara mengurangkan kos R&D
Berkat prestasi cemerlang model asas visual, model besar Yuncong Rongrong boleh dilatih berdasarkan data berbilang mod imej dan teks berskala besar untuk menyokong pembelajaran tangkapan sifar (selepas ini dirujuk sebagai tangkapan sifar) pengesanan beribu-ribu kategori sasaran, meliputi tenaga, pengangkutan, dan pelbagai matlamat dalam industri lain.
Prestasi keupayaan sifar tangkapan model besar pada set data yang berbeza
zero-shot boleh meniru proses penaakulan manusia dan menggunakan pengetahuan lepas untuk menaakul tentang bentuk khusus objek baharu dalam komputer, sekali gus memberi komputer keupayaan untuk mengenali perkara baharu.
Bagaimana untuk memahami pukulan sifar? Katakan kita tahu ciri-ciri morfologi keldai dan kuda, dan juga tahu bahawa harimau dan dubuk adalah haiwan berbelang, dan panda dan penguin adalah haiwan hitam dan putih. Tanpa melihat mana-mana gambar zebra, hanya bergantung pada inferens, kita boleh menemui zebra di antara semua haiwan di zoo.
Model asas berskala besar Yuncong Vision menunjukkan prestasi generalisasi yang kukuh, mengurangkan pergantungan data dan kos pembangunan yang diperlukan untuk tugasan hiliran Pada masa yang sama, zero-shot sangat meningkatkan kecekapan latihan dan pembangunan, menjadikan aplikasi luas dan penggunaan pantas mungkin.
Atas ialah kandungan terperinci Model berskala besar Yuncong Technology memecahkan rekod dunia pada penanda aras COCO, dengan ketara mengurangkan kos aplikasi AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!