Claude3 yang baru terdedah secara langsung menyerang kelemahan terbesar OpenAI-industri IT-php.cn

Model besar SOTA peringkat perusahaan, apakah isyarat yang dikeluarkan oleh Claude3 Anthropic?

Pengarang |. Wanchen

Penyunting |.

Anthropic mengeluarkan satu set model siri Claude 3 yang besar pada hari Isnin waktu tempatan, mendakwa modelnya yang paling berkuasa mengatasi GPT-4 OpenAI dan Gemini 1.0 Ultra Google dalam pelbagai ujian penanda aras.

Walau bagaimanapun, keupayaan untuk mengendalikan tugas penaakulan yang lebih kompleks, menjadi lebih bijak dan bertindak balas dengan lebih pantas, keupayaan komprehensif yang berada di kedudukan antara 3 teratas dalam model besar hanyalah kemahiran asas Claude3.

Anthropic komited untuk menjadi rakan kongsi terbaik untuk pelanggan korporat

Ini pertama kali ditunjukkan dalam Claude3, iaitu satu set model: Haiku, Sonnet dan Opus, yang membolehkan pelanggan perusahaan memilih versi dengan prestasi dan kos yang berbeza mengikut senario mereka sendiri.

Kedua, Anthropic menekankan bahawa modelnya sendiri adalah yang paling selamat. Presiden Anthropic Daniela Amodei memperkenalkan bahawa

teknologi yang dipanggil "Kecerdasan Buatan Perlembagaan" telah diperkenalkan dalam latihan Claude3 untuk meningkatkan keselamatan, kebolehpercayaan dan kebolehpercayaannya

Fu Yao, pelajar kedoktoran dalam model besar dan penaakulan di Universiti Edinburgh, menegaskan selepas membaca laporan teknikal Claude3 bahawa Claude3 berprestasi baik dalam ujian penanda aras penaakulan yang kompleks, terutamanya dalam bidang kewangan dan perubatan. Sebagai sebuah syarikat ToB, Anthropic memilih untuk menumpukan pada mengoptimumkan kawasan yang mempunyai potensi keuntungan paling banyak.

Kini, Anthropic terbuka untuk menggunakan dua model siri Claude3 (Haiku dan Sonnet) di 159 negara, dan versi paling berkuasa, Opus, juga akan dilancarkan. Pada masa yang sama,

Anthropic juga menyediakan perkhidmatan melalui platform awan Amazon dan Google, yang kedua melabur AS$4 bilion dan AS$2 bilion masing-masing dalam Anthropic

Pengasas bersama Dario Amodei dan Daniela Amodei berkata bahawa keluaran Claude 3 sekali lagi menunjukkan bahawa "Anthropic lebih seperti syarikat perusahaan daripada syarikat pengguna."｜Sumber imej: Anthropic,

Lebih bijak dan lebih responsif Keluarga Claude3: Opus, Sonnet dan HaikuMenurut laman web rasmi Anthropic, Claude3 ialah satu siri model, termasuk tiga model termaju: Sonet Claude 3 Claude 3 Haiku 3 Opus, membolehkan pengguna memilih keseimbangan kecerdasan, kelajuan dan kos terbaik untuk aplikasi khusus mereka.

Dari segi keupayaan umum model, Anthropic berkata bahawa siri Claude 3 "menetapkan penanda aras industri baharu untuk pelbagai tugas kognitif", dalam analisis dan ramalan, penjanaan kandungan terperinci, penjanaan kod dan bukan bahasa bahasa seperti Sepanyol, Jepun dan Perancis Dari segi dialog bahasa Inggeris, ia menunjukkan kebolehan yang lebih kuat dan respons yang lebih tepat pada masanya.

Antaranya, Claude 3 Opus ialah model paling pintar dalam kumpulan model ini, terutamanya apabila ia melibatkan pemprosesan tugas yang sangat kompleks. Opus mengatasi rakan setaranya dalam kebanyakan penanda aras biasa, termasuk Pengetahuan Pakar Peringkat Sarjana Muda (MMLU), Penaakulan Pakar Peringkat Siswazah (GPQA), Matematik Asas (GSM8K) dan banyak lagi. Ia menunjukkan kefahaman dan kefasihan tahap hampir manusia pada tugas yang kompleks. Ia kini merupakan penerokaan kecerdasan am yang paling canggih oleh Anthropic, "menunjukkan had luar kecerdasan buatan generatif."

Claude3 Model Family｜Sumber Imej: AnthropicClaude 3 Sonnet mencapai keseimbangan ideal antara tahap kecerdasan dan responsif, terutamanya untuk tugasan dalam senario perusahaan.

Ia memberikan prestasi berkuasa pada kos yang lebih rendah daripada produk yang serupa dan direka bentuk untuk ketahanan tinggi dalam penggunaan AI berskala besar

. Untuk sebahagian besar beban kerja, Sonnet adalah 2x lebih pantas dan lebih pintar daripada Claude 2 dan Claude 2.1. Ia cemerlang dalam tugas yang memerlukan respons pantas, seperti mendapatkan semula pengetahuan atau automasi jualan.

Claude 3 Haiku adalah model yang paling kompak dan juga paling kos efektif. Selain itu, kelajuan tindak balasnya juga sangat pantas, dan ia boleh membaca maklumat yang mengandungi carta, graf dan kertas penyelidikan intensif data (kira-kira 10k token) pada arXiv dalam masa kurang daripada tiga saat.

02,

Menyasarkan lelaran pelanggan perusahaan pengasas bersama Daniela Amodei berkata bahawa sebagai tambahan kepada kemajuan kecerdasan am, Anthropic amat mengambil berat tentang banyak cabaran yang dihadapi oleh pelanggan perusahaan apabila mengintegrasikan AI generatif ke dalam perniagaan mereka . Ditujukan kepada pelanggan perusahaan, keluarga Claude3 menawarkan peningkatan dalam keupayaan visual, ketepatan, input teks panjang dan keselamatan.

Banyak pangkalan pengetahuan pelanggan korporat datang dalam pelbagai format, termasuk PDF, carta alir atau slaid pembentangan. Model Claude 3 Series kini boleh mengendalikan kandungan dalam pelbagai format visual, termasuk foto, carta, graf dan rajah teknikal.

Claude3 juga telah dioptimumkan untuk ketepatan dan keupayaan dengan tetingkap teks panjang.

Dari segi ketepatan, Anthropic menggunakan sejumlah besar soalan fakta yang kompleks untuk menyasarkan kelemahan yang diketahui dalam model semasa, mengklasifikasikan jawapan kepada jawapan yang betul, jawapan yang salah (atau halusinasi) dan mengakui ketidakpastian. Sehubungan itu, model Claude3 menunjukkan bahawa ia tidak mengetahui jawapannya, dan bukannya memberikan maklumat yang salah . Versi terkuat daripada kesemuanya, Claude 3 Opus, menggandakan ketepatan (atau jawapan yang betul) pada soalan terbuka yang mencabar daripada Claude 2.1, sambil turut mengurangkan tahap jawapan yang salah.

Berbanding dengan versi Claude2.1, siri Claude3 telah mempertingkatkan ketepatan tindak balas secara menyeluruh. ｜Sumber imej: Anthropic

Pada masa yang sama, disebabkan peningkatan dalam keupayaan pemahaman konteks, keluarga Claude3 akan membuat penolakan yang lebih sedikit sebagai tindak balas kepada tugas pengguna berbanding versi sebelumnya.

Sebagai tambahan kepada respons yang lebih tepat, Anthropic berkata ia akan membawa kepada Claude 3 dengan ciri "Quote" , yang boleh menunjuk kepada ayat yang tepat dalam bahan rujukan untuk mengesahkan jawapan mereka.

Pada masa ini, model siri Claude 3 akan menyediakan tetingkap konteks 200K token. Selepas itu, ketiga-tiga model akan dapat menerima input lebih daripada 1 juta token, dan keupayaan ini akan disediakan untuk memilih pelanggan yang memerlukan keupayaan pemprosesan yang dipertingkatkan. Anthropic secara ringkas menghuraikan keupayaan tetingkap teks atas Claude3 dalam laporan teknikalnya, termasuk keupayaannya untuk mengendalikan perkataan isyarat kontekstual yang lebih panjang dan keupayaan mengingatnya dengan berkesan. . Pengasas bersama Daniela Amodei berkata ini kerana "kami mendapati bahawa perniagaan kurang memerlukan imej."

Claude3 dikeluarkan selepas kontroversi yang disebabkan oleh imej yang dihasilkan oleh Google Gemini Claude, yang menyasarkan pelanggan perusahaan, juga terikat untuk mengawal dan mengimbangi isu seperti bias nilai yang disebabkan oleh AI. Dalam hal ini, Dario Amodei menekankan kesukaran mengawal model kecerdasan buatan, memanggilnya "sains tidak tepat." Beliau berkata syarikat itu mempunyai pasukan khusus yang berdedikasi untuk menilai dan mengurangkan pelbagai risiko yang ditimbulkan oleh model itu. Seorang lagi pengasas bersama, Daniela Amodei, juga mengakui bahawa kecerdasan buatan yang tidak berat sebelah mungkin tidak dapat dilakukan dengan kaedah semasa. "Mencipta alat AI generatif neutral sepenuhnya adalah hampir mustahil, bukan sahaja dari segi teknikal, tetapi juga kerana tidak semua orang bersetuju tentang apa itu neutraliti

katanya.

Sebelum ini, Anthropic mengumumkan "Kecerdasan Buatan Berperlembagaan" yang digunakan untuk menjajarkan model besar｜Sumber imej: AnthropicNamun begitu, Anthropic menggunakan kaedah yang dipanggil "Constitutional Artificial Intelligence sebagai lancar" dengan julat luas nilai kemanusiaan, model menyesuaikan dan mengoptimumkan mengikut prinsip yang ditakrifkan dalam "Perlembagaan".

Sebagai bekas pembangun teras OpenAI, pemergian adik-beradik Amodei adalah serupa dengan aduan Musk baru-baru ini terhadap OpenAI, mempercayai bahawa OpenAI bukan lagi organisasi bukan untung dan tidak lagi mengikuti misi asalnya untuk memberi manfaat kepada manusia. Seorang wartawan bertanya kepada Amodei, adakah Anthropic sesuai dengan visi anda untuk memulakan perniagaan di luar negara?

Amodei berkata: "Berada di barisan hadapan dalam pembangunan kecerdasan buatan ialah cara paling berkesan untuk membimbing trajektori pembangunan kecerdasan buatan untuk membawa hasil yang positif kepada masyarakat 刚刚曝光的 Claude3，直击 OpenAI 最大弱点

Artikel ini datang daripada akaun awam WeChat: Geek Park (ID: geekpark), pengarang : Wan Chen

Atas ialah kandungan terperinci Claude3 yang baru terdedah secara langsung menyerang kelemahan terbesar OpenAI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!