Jadual Kandungan
SOTA penuh, tetapi tingkap 8k
Llama mengalu-alukan versi web rasmi
One More Thing
Rumah Peranti teknologi AI Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Apr 19, 2024 pm 12:43 PM
python meta program python

Llama 3 ada di sini!

Sebentar tadi, laman web rasmi Meta telah dikemas kini dan secara rasmi mengumumkan versi parameter Llama 3 8 bilion dan 70 bilion.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Dan pelancaran adalah sumber terbuka SOTA:

Data rasmi daripada Meta menunjukkan bahawa versi Llama 3 8B dan 70B mengatasi semua lawan dalam skala parameter masing-masing.

Model 8B mengatasi prestasi Gemma 7B dan Mistral 7B Arahan pada banyak penanda aras seperti MMLU, GPQA, HumanEval, dll.

Model 70B telah mengatasi Claude 3 Sonnet sumber tertutup yang popular, dan telah berulang-alik dengan Google Gemini Pro 1.5.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Sebaik sahaja pautan Huggingface keluar, komuniti sumber terbuka kembali teruja.

Pelajar buta yang bermata tajam juga menemui titik kecantikan serta-merta:

Meta malah menyembunyikan versi Llama 3 dengan 400 bilion parameter +, yang tidak lebih buruk daripada Opus super besar Claude 3!

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Ketua Pegawai Eksekutif HyperWriteAI, seorang pemula pembantu penulisan AI, tidak dapat menahan nafas apabila dia melihat ini:

Kami memasuki dunia baharu, dunia di mana model tahap GPT-4 adalah sumber terbuka dan bebas. boleh diakses.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Saintis NVIDIA Jim Fan percaya bahawa Llama 3 400B, yang masih dalam latihan, akan menjadi titik permulaan untuk model besar sumber terbuka dan mengubah cara banyak penyelidikan akademik dan syarikat permulaan berkembang.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

SOTA penuh, tetapi tingkap 8k

Maklumat teknikal yang lebih terperinci, Meta berikan dalam catatan blog.

Di peringkat seni bina, Llama 3 memilih seni bina Transformer penyahkod klasik sahaja, menggunakan pembahagian perkataan yang mengandungi perbendaharaan kata token 128K.

Melihat data latihan, skala data latihan Llama 3 telah mencapai 15T token, semuanya datang daripada maklumat awam, 5% daripadanya adalah data bukan bahasa Inggeris, meliputi lebih daripada 30 bahasa.

Llama 3 mempunyai 7 kali lebih banyak data latihan daripada Llama 2, dan mengandungi 4 kali lebih banyak kod daripada Llama 2.

Selain itu, untuk meningkatkan kecekapan penaakulan model Llama 3, Meta AI juga mengguna pakai mekanisme Perhatian Pertanyaan Kumpulan (GQA) untuk melatih model pada urutan 8192 token, dan menggunakan topeng untuk memastikan bahawa diri- perhatian tidak melepasi sempadan dokumen .

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Hasilnya, sama ada versi 8B atau 70B, Llama 3 telah membuat lonjakan besar ke hadapan berbanding Llama 2 generasi sebelumnya dengan saiz yang sama.

Antara model skala parameter 8B dan 70B setakat ini, Llama 3 telah menjadi model SOTA baharu.

Dari segi bahasa (MMLU), pengetahuan (GPQA), pengaturcaraan (HumanEval), matematik (GSM-8K, MATH) dan keupayaan lain, Llama 3 hampir mendahului model lain dalam skala yang sama.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Selain set data biasa ini, Meta AI juga menilai prestasi Llama 3 dalam senario kehidupan sebenar dan membangunkan satu set set data ujian berkualiti tinggi untuk tujuan ini.

Set ujian ini mengandungi 1,800 keping data, meliputi 12 kes penggunaan utama seperti pengekodan, penaakulan, penulisan dan ringkasan, serta sulit kepada pasukan pembangunan.

Hasilnya, Llama 3 bukan sahaja mengatasi Llama 2 dengan ketara, malah turut mengalahkan model terkenal seperti Claude 3 Sonnet, Mistral Medium dan GPT-3.5.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Pada set data yang lebih tinggi dan lebih sukar seperti AGIEval, BIG-Bench dan ARC-Challenge, prestasi Llama 3 juga luar biasa.

Versi 8B mengatasi Mistral dan Gemma dalam tugasan ini, manakala versi 70B mengalahkan Gemini Pro dan Mixtral dengan seni bina MoE, masing-masing memenangi SOTA dengan saiz yang sepadan.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Namun, satu-satunya kelemahan ialah tetingkap konteks Llama 3 hanya 8k Berbanding dengan model besar semasa dengan berpuluh-puluh atau berjuta-juta tingkap, ia nampaknya masih tersangkut pada generasi sebelumnya (kepala anjing manual). .

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Tetapi jangan terlalu risau Matt Shumer optimis tentang perkara ini. Beliau menyatakan kepercayaannya bahawa dengan usaha komuniti sumber terbuka, panjang tetingkap akan diperluaskan tidak lama lagi.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Llama mengalu-alukan versi web rasmi

Pada masa ini, versi asas dan Arahan bagi kedua-dua parameter Llama 3 tersedia di Hugging Face untuk dimuat turun.

Selain itu, platform perkhidmatan awan seperti Microsoft Azure, Google Cloud, Amazon AWS, dan NVIDIA NIM juga akan melancarkan Llama 3 satu demi satu.

Pada masa yang sama, Meta juga berkata bahawa Llama 3 akan disokong oleh platform perkakasan yang disediakan oleh Intel, Nvidia, AMD, Qualcomm dan pengeluar lain.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Perlu dinyatakan bahawa, dikeluarkan bersama model asas kali ini, terdapat juga versi Web rasmi berdasarkan Llama 3, yang dipanggil Meta AI.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Pada masa ini, platform mempunyai dua fungsi utama: dialog dan lukisan Jika anda hanya menggunakan dialog, anda tidak perlu mendaftar dan log masuk, dan ia boleh digunakan segera untuk menggunakan fungsi lukisan perlu log masuk ke akaun anda terlebih dahulu.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Walau bagaimanapun, platform pada masa ini tidak menyokong bahasa Cina, dan fungsi seperti muat naik teks masih belum dilancarkan.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Dari segi kod, platform juga boleh menjalankan beberapa program Python yang mudah, tetapi nampaknya ia hanya boleh mengeluarkan teks, dan tugas yang melibatkan lukisan tidak boleh dijalankan.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Secara amnya, versi web ini masih agak asas, tetapi anda juga boleh menantikan gelombang kemas kini berikutnya.

One More Thing

Sedikit insiden ialah sebenarnya, beberapa jam sebelum pengumuman rasmi Meta, pasaran Azure Microsoft telah pun mencuri berita versi Llama 3 8B Instruct.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Senarai harga Llama 3 pada platform pembelajaran mesin model sumber terbuka dalam talian Replicate juga segera ditarik keluar oleh netizen.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba

Tetapi tidak lama kemudian, "cerita cercaan" ini semuanya 404.

Nasib baik, kesilapan itu sudah selesai, dan pegawai tidak melengahkannya. Rakan-rakan yang mementingkan model besar sumber terbuka boleh mula mengelak.

Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba


参考链接:
[1]https://ai.meta.com/blog/meta-llama-3/。
[2]https://about.fb.com/news/2024 /04/meta-ai-assistant-built-with-llama-3/。
[3]https://huggingface.co/meta-llama/Meta-Llama-3-70B。

Atas ialah kandungan terperinci Llama3 datang secara tiba-tiba! Komuniti sumber terbuka sedang mendidih lagi: era akses percuma kepada model peringkat GPT4 telah tiba. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial PHP
1543
276
Apakah analisis sentimen dalam perdagangan cryptocurrency? Apakah analisis sentimen dalam perdagangan cryptocurrency? Aug 14, 2025 am 11:15 AM

Jadual Kandungan Apakah analisis sentimen dalam perdagangan cryptocurrency? Mengapa analisis sentimen penting dalam sumber pelaburan cryptocurrency sumber data emosi a. Platform Media Sosial b. Media berita c. Alat untuk analisis sentimen dan teknologi alat yang biasa digunakan dalam analisis sentimen: Teknik yang diterima pakai: Mengintegrasikan analisis sentimen ke dalam strategi perdagangan bagaimana peniaga menggunakannya: Strategi Contoh: Dengan mengandaikan senario senario perdagangan BTC Penetapan: Isyarat Emosi: Tafsiran Pedagang: Keputusan: Batasan dan Risiko Analisis Sentimen Menggunakan Emosi Kajian 2025 baru -baru ini oleh Hamid

Bagaimana untuk mengendalikan dataset besar di Python yang tidak sesuai dengan ingatan? Bagaimana untuk mengendalikan dataset besar di Python yang tidak sesuai dengan ingatan? Aug 14, 2025 pm 01:00 PM

Apabila memproses set data besar yang melebihi memori dalam python, mereka tidak boleh dimuatkan ke dalam RAM pada satu masa. Sebaliknya, strategi seperti pemprosesan pemprosesan, penyimpanan cakera atau streaming harus diterima pakai; Fail CSV boleh dibaca dalam ketulan melalui parameter Pandas 'dan blok diproses oleh blok. Dask boleh digunakan untuk merealisasikan penjadualan dan penjadualan tugas yang serupa dengan sintaks pandas untuk menyokong operasi data memori yang besar. Tulis fungsi penjana untuk membaca fail teks mengikut baris untuk mengurangkan penggunaan memori. Gunakan format penyimpanan kolumnar parket yang digabungkan dengan pyarrow untuk membaca lajur atau kumpulan baris tertentu dengan cekap. Gunakan Memmap Numpy untuk memori peta tatasusunan berangka besar untuk mengakses serpihan data pada permintaan, atau menyimpan data dalam data ringan seperti SQLite atau DuckDB.

Cara debug kod python anda Cara debug kod python anda Aug 13, 2025 am 12:18 AM

UsePrint () StatementStoCheckVariableValuuesandExecutionFlow, AddingLabelSandTypesforClarity, andRemoveThembeforeCommitting; 2.Usethepythondebugger (PDB) withbreakpoint () TopAuseExecution, InspectVariables, danStepThoughleShoughleShoughleShoTHoughleShoughleShoughleShoTHoughleVariable, danStepThoughleShoTHoughleShoTheShoThoTheShoThoTheShoThereShoTher ()

Bagaimana cara debug kod python dalam teks luhur? Bagaimana cara debug kod python dalam teks luhur? Aug 14, 2025 pm 04:51 PM

PenggunaanSublimetext'sbuildsystemtorunpythonscriptsandcatcherrorsbypressingctrl baftersettingthecorrectbuildsystemorcreatingacustomone.2.insertstrategicprint () statementShocheckVariahvariues, types, andexecutionflow, menggunakanLabelsandre.

Bagaimana cara menjalankan kod python dalam teks luhur? Bagaimana cara menjalankan kod python dalam teks luhur? Aug 16, 2025 am 04:58 AM

Pastikan Python dipasang dan ditambah ke laluan sistem, jalankan Python-versi atau Python3-pengesahan versi melalui terminal; 2. Simpan fail python sebagai lanjutan .py, seperti hello.py; 3. Buat sistem binaan tersuai dalam sublimetext, pengguna Windows menggunakan {"cmd": ["python", "-u", "$ file"]}, pengguna macOS/linux menggunakan {"cmd": ["python3

Cara meratakan senarai bersarang atau senarai senarai di Python Cara meratakan senarai bersarang atau senarai senarai di Python Aug 12, 2025 am 09:49 AM

FlatteninganestedlistinpythonconvertsalistwithsublistsIntoasingleFlatlist, andthebestmethoddependsonThenestingDepthanddatasize.forone levelnesting, uselistcomprehension [

Cara debug skrip python di vscode Cara debug skrip python di vscode Aug 16, 2025 am 02:53 AM

Untuk menyahpepijat skrip python, anda perlu terlebih dahulu memasang lanjutan python dan mengkonfigurasi penterjemah, kemudian buat fail launch.json untuk menetapkan konfigurasi debugging, kemudian tetapkan titik putus dalam kod dan tekan F5 untuk memulakan debugging. Skrip akan dijeda pada titik putus, membolehkan pembolehubah pemeriksaan dan pelaksanaan langkah demi langkah. Akhirnya, dengan memeriksa masalah dengan melihat output konsol, menambah log atau menyesuaikan parameter, dan lain -lain, untuk memastikan bahawa proses debugging adalah mudah dan cekap selepas persekitaran adalah betul.

Contoh Python Plotly Dash Contoh Python Plotly Dash Aug 12, 2025 pm 05:23 PM

Contoh ini menunjukkan aplikasi web interaktif yang dibina di atas Pythonplotlydash. 1. Buat antara muka aplikasi web menggunakan DASH. 2. Pilih Siri Data (jualan, keuntungan, perbelanjaan) melalui menu lungsur (jatuh turun). 3. Gunakan plot secara dinamik melukis carta baris siri masa yang sama. 4. Data adalah siri masa 100 hari yang disimulasikan dan ditukar menjadi format yang panjang untuk lukisan mudah. 5. Fungsi panggil balik mengemas kini kandungan carta dalam masa nyata mengikut pilihan pengguna. Selepas berlari, aplikasi dimulakan di pelayan tempatan dan boleh diakses melalui penyemak imbas. Ia menyokong interaksi dinamik dan kemas kini masa nyata. Ia sesuai untuk pemula untuk memahami struktur asas dan mekanisme tindak balas dash. Ia juga boleh ditambah dan diakses oleh data sebenar.

See all articles