Baru-baru ini, SuperCLUE mengeluarkan senarai kedudukan keseluruhan dan setiap senarai tugas kategori untuk bulan September daripada SenseTime menduduki tempat pertama dalam senarai keseluruhan model besar Cina. Dalam subsenarai Ejen AI yang baru ditambah, SenseChat 3.0 turut menduduki tempat pertama, mengatasi semua model besar China domestik serta GPT-3.5 dan Claude 2, dan kedua selepas prestasi GPT-4. Ini menunjukkan kelebihan SenseTime dalam pembangunan inovatif dan keluaran produktiviti dalam bidang model besar, serta pengumpulan dan potensinya dalam meneroka AGI
Nota: Model wakil asing (GPT4.0/Claude2/gpt-3.5) tidak mengambil bahagian dalam ranking.
SuperCLUE ialah penanda aras penilaian komprehensif untuk model besar umum China. Ia bertujuan untuk menilai secara menyeluruh prestasi model besar dalam pelbagai dimensi keupayaan Ia adalah salah satu penanda aras penilaian model besar China yang paling profesional dan mewakili. Penilaian ini memilih 20 model bahasa umum yang paling mewakili di dalam dan di luar negara
Mendapat kedudukan pertama dalam senarai perbincangan keseluruhan, dengan skor objektif melebihi GPT-3.5
Kedudukan keseluruhan SuperCLUE terkini dan setiap senarai tugas kategori tertumpu terutamanya pada empat kuadran kebolehan model besar, iaitu pemahaman dan penjanaan bahasa, termasuk pemahaman dan pengekstrakan bahasa, gandingan konteks, penjanaan dan penciptaan, kemahiran dan pengetahuan profesional, termasuk; pengetahuan dan ensiklopedia, pengiraan, kod, logik dan penaakulan, termasuk penggunaan alat, perancangan tugas, termasuk keselamatan sistem, serangan arahan, sejumlah 12 keupayaan asas;
SenseChat 3.0 dari SenseTime menduduki tempat pertama dalam kedudukan keseluruhan dengan jumlah markah 62.75 mata Dalam bahagian objektif OPT, skor SenseChat 3.0 malah melebihi GPT-3.5, menunjukkan keupayaannya yang kukuh dalam model besar CinaSenseTime membincangkan bahawa SenseChat akan dilancarkan secara rasmi pada April 2023. Ia merupakan salah satu model bahasa besar terawal berdasarkan ratusan bilion parameter di China dan dikemas kini secara berterusan. Ia bergantung pada SenseCore, peranti AI berskala besar daripada SenseTime Pada masa ini, terdapat kira-kira 30,000 GPU dalam talian dan skala kuasa pengkomputeran telah ditingkatkan kepada 6 ExaFLOPS, dengan berkesan menyokong latihan, lelaran peningkatan dan perkhidmatan model bahasa besar.
Mempercepatkan pembangunan ejen kecerdasan buatan dan mempercepatkan langkah ke arah kecerdasan buatan yang kuatDengan pembangunan model besar, "sembang" jauh daripada memenuhi keperluan orang ramai Keupayaan untuk menggunakan alat dengan tepat telah menjadi kunci untuk membebaskan produktiviti model besar. Subsenarai Ejen AI baharu SuperCLUE ialah senarai Ejen AI pertama dalam industri Ia memfokuskan pada menilai prestasi Ejen AI dalam dua keupayaan utama: "penggunaan alat" dan "perancangan tugas." Penilaian menunjukkan bahawa SenseTime menganggap bahawa SenseChat 3.0 berpotensi untuk berfungsi sebagai pembantu super manusia Ia boleh menyelesaikan tugas secara autonomi mengikut keperluan manusia, dengan itu mengeluarkan sepenuhnya produktiviti model besar, menjadikannya kedua selepas GPT-4 pada AI . Senarai ejen, dan mendahului yang lain Sertai dalam penilaian model besar.
Pada masa ini, ejen AI terkemuka di dunia hampir semuanya didorong oleh model besar terkemuka GPT-4 Dengan bantuan keupayaan penggunaan alat yang berkuasa, mereka boleh menguraikan masalah yang kompleks kepada sub-tugas yang boleh dicapai dan interaksi bahasa semula jadi seperti manusia kebolehan. SenseChat 3.0 dibincangkan sebagai model berskala besar China yang terkemuka Ia menggunakan tiga alat biasa: jurubahasa kod, panggilan API dan carian untuk menyelesaikan tugas yang rumit, membina aplikasi ejen AI secara fleksibel dan menyokong inovasi produktiviti perusahaan.
Pada masa ini, SenseTime telah menjalin hubungan kerjasama yang rapat dengan lebih 500 pelanggan dalam pelbagai industri menegak seperti kewangan, telefon mudah alih, penjagaan perubatan, kereta, hartanah, tenaga, media dan pembuatan industri. Sebagai model berskala besar yang berkuasa, SenseChat terus bertambah baik dengan pantas, memberikan SenseTime peluang untuk membangunkan ejen kecerdasan buatan yang lebih berkuasa yang boleh berinteraksi seperti manusia, dan untuk meneroka jalan menuju kecerdasan am buatan dan sokongan
Atas ialah kandungan terperinci SenseTime memenangi tempat pertama dalam senarai penilaian SuperCLUE September, menarik perhatian ke arah kecerdasan AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!