Dalam pertandingan model besar, satu lagi kuda hitam muncul -
Inflection-2.5, dicipta oleh syarikat permulaan model besar DeepMind dan Mustafa Suleyman.
Dengan hanya menggunakan 40% sumber pengkomputeran untuk latihan, prestasi melebihi 90% daripada GPT-4, dan ia sangat baik dalam pengekodan dan matematik.
Model Infleksi awal hanya menggunakan 4% daripada sumber pengkomputeran semasa latihan, mencapai 72% daripada prestasi GPT-4.
Berdasarkan model Inflection, syarikat itu juga melancarkan robot perbualan berasaskan web Pi, yang memfokuskan pada "kecerdasan emosi tinggi" dan "pemperibadian" dan juga menyokong bahasa Cina.
Sejak kelahirannya, pengguna aktif harian tertinggi Pi telah mencecah 1 juta, sejumlah 4 bilion mesej telah dijana, dan purata panjang perbualan telah mencecah 33 minit.
Dengan peningkatan model asas ini, Pi turut melancarkan versi baharunya.
Gambar
Jadi, sama ada Inflection, atau Pi, begitu kuat, qubit menjalankan beberapa ukuran sebenar.
Buka halaman Pi dan anda akan melihat antara muka minimalis seperti itu, dan anda boleh klik Seterusnya terus tanpa log masuk.
Gambar
Selepas Seterusnya beberapa kali berturut-turut, masukkan cara anda mahu Pi menghubungi kami.
Gambar
Selepas itu, pilih suara dan topik yang disyorkan, langkau sahaja, kemudian masukkan antara muka sembang rasmi.
Gambar
Satu ujian mudah mendapati Pi menyokong dialog Cina Jika ini berlaku, maka susun Penanda Aras untuk orang terencat akal dahulu.
Soalan pertama, adakah tikus yang sakit boleh diubati dengan mengambil racun tikus Pi berjaya menjawabnya?
Gambar
Satu lagi soalan "perangkap", tetapi saya masih tidak menyukainya kali ini.
Gambar
Selepas dua soalan itu, walaupun tiada kesan dramatik, nampaknya saya sudah faham bahasa Cina.
Seterusnya, mari fokus pada kebolehan matematik dan pengekodan yang didakwa oleh pegawai sebagai "terutamanya mahir".
Pertama ialah soalan pengaturcaraan yang melibatkan pengaturcaraan dinamik.
Pictures
Kod yang diberikan oleh Pi berjaya menyelesaikan masalah ini dan disertakan dengan penjelasan yang jelas.
Gambar
Seterusnya, mari kita tingkatkan kesukaran dan biarkan ia menganalisis berapa banyak sifar pada penghujung pemfaktoran nombor.
Pictures
Kod yang diberikan oleh Pi bukan sahaja betul, tetapi juga mudah dan cekap, berjalan lebih pantas daripada 73.8% pengguna pada LeetCode.
Gambar
Akhir sekali, mari kita tingkatkan kesukaran dan akhiri bahagian kod ujian dengan soalan dengan kadar lulus 47.5%.
Gambar
Selepas membaca kod, mari uji keupayaan matematik Pi dan biarkan ia melakukan soalan tentang derivatif:
Cari titik ekstrem fungsi f(x)=x³+2x²-1
Jawapannya betul-betul betul dan sangat terperinci.
Sudah tentu, jika anda ingin mahir dalam matematik, pemikiran logik adalah penting, jadi sebagai tambahan kepada soalan matematik biasa, kami juga menggunakan soalan klasik untuk menguji pemikiran logik Pi, dan hasilnya tidak buruk.
Melalui prestasi Pi, kita dapat melihat bahawa model Inflection-2.5 di belakangnya sememangnya luar biasa.
Berdasarkan data ujian rasmi yang dikeluarkan dengan sendirinya, prestasi Inflection-2.5 diikuti rapat oleh GPT-4 dari segi keupayaan keseluruhan dan sub-item individu.
Ambil matematik dan kod sebagai contoh Inflection-2.5 telah membuat lonjakan besar berbanding versi 1.0 dalam ujian seperti MATH dan HumanEval.
Selain set data konvensional ini, Inflection turut mencabar soalan ujian matematik peperiksaan kemasukan kolej Hungary dan ujian fizik GRE, dan keputusannya hampir terikat dengan GPT-4.
Lebih rumit lagi, seseorang telah membina set data BIG-Bench menggunakan masalah yang sukar difahami dengan model besar, dan Inflection-2.5 mencabar subset Kerasnya, dan hasilnya kurang daripada satu mata berbeza daripada GPT-4 .
Jadi, apakah jenis syarikat di sebalik Inflection-2.5?
Syarikat ini dipanggil Inflection AI Ia diasaskan pada tahun 2022 oleh DeepMind Lianchuang Mustafa Suleyman dan yang lain pada masa ini.
Juga daripada DeepMind, terdapat penyelidik kanan Karen Simonyan, yang kini merupakan ketua saintis Inflection AI.
Selain itu, pengasas bersama LinkedIn Reid Hoffman turut mengambil bahagian dalam penubuhan Inflection AI.
Sejak penubuhannya, Inflection AI telah menerima sejumlah AS$1.5 bilion dalam bentuk pembiayaan daripada syarikat gergasi seperti NVIDIA, Microsoft dan Bill Gates.
Pada masa ini, Pi berdasarkan Inflection masih percuma, tetapi CEO Suleyman juga berkata bahawa adalah tidak realistik untuk menggunakan cinta untuk menjana elektrik sepanjang masa, dan masih akan dikenakan caj dalam jangka masa panjang.
Rakan-rakan yang ingin merasainya mungkin kena cepat~
Portal: https://pi.ai
Atas ialah kandungan terperinci Kesan latihan 40% kuasa pengkomputeran adalah setanding dengan GPT-4, dan pencapaian baharu DeepMind yang dicipta bersama keusahawanan model besar telah diukur. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!