Apakah Claude 3 dan Apa yang Boleh Anda Lakukan Dengannya?-AI-php.cn

Anthropic telah mengumumkan keluaran Claude 3—sebuah keluarga model AI yang berpotensi untuk mengganggu GPT-4. Ia mempunyai potensi yang luar biasa, tetapi adakah ia bersedia untuk merebut mahkota ChatGPT?

Apakah Claude 3?

Claude 3 ialah keluarga tiga model AI multimodal yang dibangunkan oleh Anthropic untuk menggantikan model AI siri Claude 2. Anda boleh katakan Claude 3 ialah jawapan Anthropic kepada Gemini Google dan GPT-4 OpenAI. Dikeluarkan dalam tiga versi, Haiku, Sonnet dan Opus, dalam susunan kecerdasan mereka yang semakin meningkat, Claude 3 ialah model AI multimodal pertama Anthropic dan mewakili lonjakan ketara daripada siri Claude 2.

Sekarang, jika anda tidak pernah mendengar tentang chatbot Claude AI, ia boleh difahami. Claude dan model asasnya tidak menikmati status superstar ChatGPT atau tarikan jenama Gemini Google. Walau bagaimanapun, Claude sudah pasti salah satu chatbot AI yang paling maju di dunia, mengatasi prestasi ChatGPT yang sangat dibanggakan dalam beberapa bidang utama.

Untuk benar-benar menghargai Claude 3, adalah penting untuk melihat kembali kegagalan model terdahulu.

Lelaran awal Claude mempunyai reputasi untuk pendekatan yang terlalu bersemangat terhadap keselamatan AI. Ciri keselamatan Claude 2, contohnya, sangat ketat sehingga chatbot akan mengelakkan terlalu banyak topik, malah topik yang tidak mempunyai isu keselamatan yang jelas. Terdapat juga isu dengan tetingkap konteks model. Apabila anda meminta model AI untuk menerangkan sesuatu atau, katakan, meringkaskan artikel yang panjang, bayangkan ia hanya boleh membaca beberapa perenggan artikel pada satu masa. Had bilangan teks yang boleh dipertimbangkan pada satu-satu masa ini dipanggil "tetingkap konteks." Versi terdahulu Claude datang dengan tetingkap konteks token 200k (bersamaan dengan 150,000 perkataan). Walau bagaimanapun, model itu tidak dapat secara praktikal menangani teks sebanyak itu secara serentak tanpa melupakan sebahagian daripadanya. Terdapat juga isu multimodaliti. Hampir setiap model AI utama telah menggunakan pelbagai mod, yang bermaksud mereka boleh memproses bentuk data lain seperti imej, dan bertindak balas kepada data tersebut (bukan hanya input teks). Claude tidak dapat berbuat demikian.

Ketiga-tiga isu kini telah diselesaikan sepenuhnya atau sekurang-kurangnya sebahagiannya dengan keluaran Claude 3.

Apa Yang Boleh Anda Lakukan Dengan Claude 3?

What Is Claude 3 and What Can You Do With It?

Sama seperti kebanyakan model AI generatif termaju di luar sana, Claude 3 boleh menjana respons terbaik untuk pelbagai pertanyaan merentas bidang yang berbeza. Sama ada anda memerlukan masalah algebra yang cepat diselesaikan, lagu baharu yang ditulis, artikel mendalam yang digubal, kod yang ditulis untuk perisian atau set data besar yang dianalisis, Claude 3 sesuai.

Tetapi kebanyakan model AI sudah mahir dalam tugasan ini, jadi mengapa menggunakan Claude 3?

Jawapannya mudah; Claude 3 bukan sekadar model AI lain yang mahir dalam tugasan ini, ia adalah model AI multimodal yang paling maju dan boleh didapati secara percuma yang boleh anda dapatkan di mana-mana sahaja di internet. Ya, terdapat Gemini, pembunuh GPT-4 yang digembar-gemburkan oleh Google yang berprestasi hebat dalam ujian penanda aras. Walau bagaimanapun, Anthropic mendakwa Claude 3 mengatasinya dengan margin yang mengagumkan pada beberapa tugas. Walaupun hasil penanda aras adalah sesuatu yang sering kita ambil dengan sebutir garam, saya menguji kedua-dua model AI, dan keunggulan model Claude 3 dalam beberapa kes penggunaan penting adalah sangat jelas.

Jadi, Claude 3 membolehkan anda melakukan kebanyakan perkara yang boleh anda lakukan dengan Gemini dan GPT-4 (tolak penjanaan imej) tanpa perlu membayar yuran langganan $20 untuk premium ChatGPT. . Sudah tentu, saya meletakkan kedua-dua model untuk ujian; sejauh manakah Claude 3 Anthropic bertindan menentang GPT-4 yang besar?

Claude lwn. ChatGPT: Kemahiran Pengekodan

Bermula dengan rentetan tugas pengaturcaraan, Claude 3 memadankan keupayaan GPT -4 dalam semua tugas pengaturcaraan asas yang dibentangkan malah mengatasinya dalam beberapa. Walaupun saya hanya menguji asas-asasnya, versi Claude sebelumnya adalah kurang mahir dalam tugas yang sama apabila kami mengujinya dalam perbandingan ChatGPT vs. Claude pada September 2023. Contohnya, apabila kami meminta kedua-dua model membina tugasan yang mudah apl senarai, Claude gagal dalam semua keadaan, manakala ChatGPT memaparkan apa yang kami panggil prestasi lima bintang pada masa itu.

Dengan keluaran terbaharu, Claude 3 menghasilkan apl senarai tugasan yang berprestasi lebih baik dalam ketiga-tiga keadaan yang kami uji. Berikut ialah keputusan GPT-4 apabila digesa untuk membuat apl senarai tugasan.

Dan inilah keputusan Claude 3 apabila diminta melakukan perkara yang sama.

Kedua-dua apl berfungsi sedikit sebanyak, tetapi jelas sekali Claude 3 melakukan kerja yang lebih baik pada yang satu ini.

Selepas mencuba ujian pengaturcaraan yang lebih kompleks, Claude adalah model yang lebih baik dalam beberapa kes, manakala GPT-4 juga mendapat kemenangannya. Walaupun saya tidak boleh secara konklusif mengatakan Claude 3 lebih baik dalam logik pengaturcaraan, jika terdapat jurang yang besar antara kedua-dua model, jurang itu hampir pasti akan mengecil.

Claude lwn. ChatGPT: Common Sense Reasoning

Saya pergi ke hadapan untuk menguji kedua-dua model pada penaakulan akal. Bekerja dengan AI chatbots adalah paradoks yang menarik. Chatbot AI boleh mengendalikan tugas yang rumit dengan mudah tetapi sering bergelut dengan masalah asas yang memerlukan akal atau logik. Jadi, kami memberikan kedua-dua model satu siri soalan yang kelihatan mudah yang memerlukan akal untuk menjawab dengan betul.

Daripada lima soalan sedemikian, kedua-dua model menjawab kesemua lima secara logik. Kami bertanya kepada kedua-dua chatbots satu soalan sedemikian: Jika kapal angkasa dari Marikh terpecah menjadi dua, dengan satu bahagian terhempas ke Lautan Atlantik berhampiran Brazil dan satu lagi ke Lautan Pasifik berhampiran Jepun, di manakah anda mengebumikan mangsa yang terselamat?

ChatGPT dijawab dengan betul walaupun tanpa GPT-4. Jika anda tertanya-tanya sebab pilihan soalan, baiklah, chatbots secara sejarah telah gagal dengan teruk pada baris pertanyaan seperti ini. Seterusnya giliran Claude untuk menjawab.

Maklum balas Claude bukanlah jawapan yang pasti, tetapi ia dapat mengenal pasti maklumat utama; anda tidak mengebumikan mangsa yang terselamat. Adalah penting untuk ambil perhatian bahawa kali terakhir kami bertanya Claude 2 soalan yang sama, ia tidak dapat melihat melalui perangkap akal.

Claude lwn. ChatGPT: Penulisan Kreatif

Di dunia nyata, salah satu kes penggunaan paling popular untuk AI chatbots ialah menjana teks kreatif dalam semua bentuk: artikel, surat, lirik lagu, sebut sahaja. Jadi, saya menguji kedua-dua model untuk menentukan yang menghasilkan teks bunyi manusia yang lebih baik.

Ideanya ialah hasilnya bukan sahaja "betul" atau kreatif (dengan cara robotik) tetapi bunyi seolah-olah ia ditulis oleh manusia. Saya menugaskan kedua-dua model untuk mengarang lirik lagu rap tentang menanam timun dan menjadi jutawan daripada mereka. Siapa yang menulis lagu rap tentang timun? Itulah ideanya—sesuatu yang mencabar!

Inilah pandangan ChatGPT:

Dan inilah jawapan Claude, menggunakan gesaan yang sama.

Ia mungkin subjektif, tetapi Claude nampaknya pilihan yang lebih baik di sini. Apabila kedua-dua alatan ditugaskan untuk merangka tiga artikel mengenai topik yang berbeza, Claude memberikan pilihan yang lebih baik dalam ketiga-tiga keadaan. Ia menghasilkan hasil yang lebih seperti manusia dan mengelakkan corak yang biasanya dikaitkan dengan teks yang dihasilkan AI, seperti keterlaluan, penggunaan perkataan yang kompleks dan penggunaan kata penghubung secara sporadis.

Claude lwn. ChatGPT: Keupayaan Mengecam Imej

Untuk menguji kebolehan pengecaman imej, kami memberi ChatGPT dan Claude beberapa imej bangunan tinggi yang popular di seluruh dunia. ChatGPT mengenal pasti kesemua 20 daripada mereka dengan betul, manakala Claude 3 gagal mengenal pasti beberapa, termasuk Marina 101 Dubai yang agak popular, Menara Lotte World di Seoul, dan bangunan Merdeka 118 di Kuala Lumpur, Malaysia.

Tidak seperti ChatGPT, Claude bergelut dengan mengenal pasti bangunan antara lain, dan kadar kegagalan meningkat jika bangunan itu tiada di AS atau China. Walau bagaimanapun, ia tidak mempunyai masalah untuk mengenal pasti versi Menara Eiffel atau Bangunan Empire State yang dikaburkan.

ChatGPT jelas lebih baik dalam hal ini, tetapi memandangkan Claude 3 adalah percubaan pertama Anthropic untuk membina model AI multimodal, ia bukanlah sesuatu yang buruk.

Walaupun model terkenal seperti Google Palm 2, dan seterusnya Gemini, sentiasa disebut-sebut sebagai pembunuh GPT-4 yang berpotensi, kami secara konsisten mengekalkan bahawa Claude AI yang kurang dikenali berkemungkinan akan mendapat penghormatan itu sejak dikeluarkan pada bulan Mac. 2023. Selepas beberapa bulan dan beberapa lelaran di sepanjang baris, Claude 3 kelihatan sama seperti pembunuh GPT-4 yang kami jangkakan. Jika anda seorang pengguna chatbot yang berat tetapi belum mencuba chatbot Claude AI, anda kehilangan alat AI yang sangat berpengaruh yang boleh meningkatkan produktiviti anda.

Atas ialah kandungan terperinci Apakah Claude 3 dan Apa yang Boleh Anda Lakukan Dengannya?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!