Rumah > Peranti teknologi > AI > Skandal tembakan membuatkan pengarah Stanford AI Lab marah! Dua ahli pasukan plagiarisme bertanggungjawab dan seorang hilang, dan rekod jenayahnya didedahkan Netizen: Fahami semula model sumber terbuka China

Skandal tembakan membuatkan pengarah Stanford AI Lab marah! Dua ahli pasukan plagiarisme bertanggungjawab dan seorang hilang, dan rekod jenayahnya didedahkan Netizen: Fahami semula model sumber terbuka China

王林
Lepaskan: 2024-06-09 09:38:08
asal
1199 orang telah melayarinya

Insiden susulan pasukan Stanford memplagiat model besar dari Universiti Tsinghua - pasukan

Llama3-V mengakui plagiarisme, dan dua daripada mahasiswa dari Stanford juga memutuskan hubungan dengan pengarang lain.

Tweet permohonan maaf terkini, dihantar oleh Siddharth Sharma(Siddhartha) dan Aksh Garg(Akshy).

Bukan dalam kalangan mereka, Mustafa Aljadery (dirujuk sebagai Lao Mu) dari University of Southern California dituduh sebagai pihak yang bersalah utama, dan dia telah hilang sejak semalam:

Kami berharap Lao Mu akan membuat kenyataan pertama, tetapi sejak semalam Dia tidak dapat dihubungi.

Siddharth, saya (Akshi) dan Lao Mu mengeluarkan Llama3-V, dan Lao Mu menulis kod untuk projek itu.

Siddharth dan peranan saya ialah membantu dia mempromosikan model ini di Medium dan Twitter. Saya mencari kertas baru-baru ini untuk mengesahkan keinovatifan kerja itu, tetapi kami tidak diberitahu dan menemui kerja sebelumnya tentang perisikan dinding.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Lao Mu sendiri, yang dituduh melarikan diri, laman utama X kini berada dalam keadaan kunci perlindungan, dan anda hanya boleh mengikutinya dengan memohon:

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Secara keseluruhannya, tweet permohonan maaf ini dan satu semalam telah dipadamkan dengan tergesa-gesa selepas dihantar Kandungan tweet yang disiarkan adalah hampir sama, terutamanya memfokuskan pada permintaan maaf dan membuat kesalahan lagi.

Lagipun, malah Pengarah Makmal Kepintaran Buatan Stanford Christopher Manning keluar dan mula merungut:

Ini adalah kes tipikal untuk tidak mengakui kesilapan anda!

Beliau percaya bahawa pasukan itu mengelak isu penting selepas insiden itu, menggunakan alasan "seni bina yang serupa" dan "MiniCPM dilaksanakan lebih cepat daripada kami", dan enggan mengakui bahawa ia adalah plagiarisme.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Tetapi kenyataan permohonan maaf baharu itu tidak menghalang keraguan netizen. Dan pendedahan terbaru juga menunjukkan bahawa saudara-saudara ini hanyalah pesalah plagiarisme yang berulang, dan buku teks yang mereka tulis sebelum ini juga telah diciplak.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Bagi pasukan pengarang asal Face Wall Intelligence, sebagai tambahan kepada CEO Li Dahai yang menjawab semalam bahawa "ia juga merupakan kaedah yang diiktiraf oleh pasukan antarabangsa", ketua saintis Liu Zhiyuan juga telah muncul di Zhihu" Jawapan peribadi:

Saya sudah cukup yakin bahawa Llama3-V sesuai untuk cangkerang MiniCPM-Llama3-V 2.5 kami.

Perkembangan pesat kecerdasan buatan tidak dapat dipisahkan daripada perkongsian sumber terbuka algoritma, data dan model global, supaya orang ramai sentiasa boleh berdiri di atas bahu SOTA dan terus maju ke hadapan. MiniCPM-Llama3-V 2.5 sumber terbuka kami kali ini menggunakan Llama3 terkini sebagai asas model bahasa. Asas perkongsian sumber terbuka ialah pematuhan dengan protokol sumber terbuka, kepercayaan kepada penyumbang lain, dan penghormatan serta penghormatan kepada pencapaian pendahulu pasukan Llama3-V sudah pasti telah merosakkan perkara ini dengan teruk. Mereka telah memadamkan pangkalan data mereka daripada Huggingface selepas disoal siasat. Dua daripada tiga ahli pasukan itu hanyalah pelajar di Universiti Stanford penambahbaikan.

Bukti baharu

Mari kita semak secara ringkas tembikai besar ini dahulu.

Untuk meringkaskan dalam satu ayat, sesetengah netizen mendapati bahawa model besar berbilang modal pasukan Stanford Llama3-V, yang baru-baru ini menjadi popular dalam komuniti sumber terbuka, mempunyai seni bina dan kod yang hampir sama dengan MiniCPM-Llama3 domestik -V 2.5, dan menyenaraikan banyak Bukti menunjukkan terus kepada plagiarisme Llama3-V.

Apabila insiden itu beransur-ansur berlaku, pasukan Stanford AI memadamkan pangkalan data dan melarikan diri, dan pasukan Perisikan Menghadapi Dinding juga melancarkan siasatan terhadap perkara itu.

Liu Zhiyuan, Ketua Saintis Perisikan Menghadapi Dinding dan Profesor Madya Tetap Universiti Tsinghua, memberikan sebab utama mengapa Llama3-V ialah cangkang MiniCPM-Llama3-V 2.5, iaitu keupayaan pengecaman Tsinghua Jane.

Ini ialah keupayaan "Easter egg" MiniCPM-Llama3-V 2.5. Mereka dilatih menggunakan set data yang diimbas dan diberi penjelasan daripada Tsinghua University Jane Ia belum didedahkan kepada umum. Prestasi Llama3-V betul-betul sama dengan MiniCPM-Llama3-V 2.5 Bukan sahaja soalan yang betul adalah sama, tetapi juga kesilapan adalah sama.

Hari ini, berdasarkan gelombang pertama bukti, netizen lain telah menemui petunjuk baharu.

Sesetengah orang mendapati selepas penyelidikan bahawa perbezaan berat hampir setiap lapisan Llama3-V mematuhi taburan Gaussian dengan min 0 dan sisihan piawai 1.4e-3.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Jadi adalah spekulasi bahawa Llama3-V hanya menambah

bunyi varians rendah terus kepada berat MiniCPM.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Selain itu, didedahkan bahawa abang besar yang melarikan diri, Lao Mu, pernah menulis buku mengenai "Reka Bentuk Rangkaian Komputer" sebelum ini, dan dia juga menyalinnya

.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型Keluarkan satu bab daripada buku secara rawak dan gunakan pengesan plagiarisme untuk mengesannya, dan anda akan melihat sekumpulan titik merah:

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型Dan, dalam lajur ini buku, menurut netizen, terdapat juga nama Siddha Banyak.

Sesetengah netizen percaya sama ada penyalinan buku itu benar masih perlu disiasat. Namun, kini buku ini juga

404

.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型 Bercakap tentang plagiarisme ini, kenyataan permohonan maaf Siddharth dan Akshay juga menyebut bahawa sebab mereka mempromosikan projek ini dengan Brother Mu adalah kerana mereka pada mulanya kagum dengan model pelbagai mod ini, saya sangat menyukai sambungan seni bina pada Idefics, SigLip dan UHD yang diterangkan oleh Brother Mu.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型Tetapi sebenarnya, netizen mendapati awal bahawa pelaksanaan khusus Llama3-V dalam banyak aspek seperti mod spatial adalah berbeza daripada LLaVA-UHD, tetapi secara mengejutkan konsisten dengan MiniCPM-Llama3-V 2.5.

Menurut halaman utama MiniCPM-Llama3-V 2.5, MiniCPM-Llama3-V 2.5 ialah model sumber terbuka terkini bagi siri MiniCPM-V pintar menghadap dinding Ia dibina berdasarkan SigLip-400M dan Llama3-8B-Instruct , dengan jumlah parameter 8B.

Dari segi prestasi, MiniCPM-Llama3-V 2.5 mencapai skor purata 65.1 pada OpenCompass, mengatasi model proprietari seperti GPT-4V-1106, Gemini Pro, Claude 3, Qwen-VL-Max, dll., dan dengan ketara Melebihi model bahasa berbilang modal lain berdasarkan Llama 3.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型Selain itu, MiniCPM-Llama3-V 2.5 juga mempunyai keupayaan OCR yang kukuh, menjaringkan 700+ pada OCRBench, mengatasi GPT-4o, GPT-4V-0409, Qwen-VL-Max dan Gemini Pro.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型Berdasarkan kaedah RLAIF-V terkini, MiniCPM-Llama3-V 2.5 mempunyai kadar ilusi 10.3% pada Object HalBench, yang juga lebih rendah daripada 13.6% GPT-4V-1106.

"Model besar China telah diabaikan"

Walaupun kesalahan itu segera dibuang, netizen dengan cepat menemui titik terang dalam kenyataan permohonan maaf Akshay dan Siddharth:

Anda berdua tidak mengarang apa-apa Jika anda tidak melakukannya, anda akan dianggap sebagai pengarang projek jika anda membantu dengan promosi?

Bila diumumkan, kononnya projek kamu bertiga, tapi kalau ada yang tak kena, salahkan satu orang?

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Jika Lao Mu menulis semua kod sahaja, jadi apa yang kamu berdua lakukan, siarkan sahaja?

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Sesetengah netizen membangkitkan topik yang lebih kritikal, seterusnya mencetuskan perbincangan hangat -

Adakah komuniti sumber terbuka mengabaikan keputusan model besar dari China?

Lucas Beyer, penyelidik Google DeepMind dan pengarang ViT, menyebut bahawa Llama3-V telah disalin, tetapi kosnya kurang daripada 500 dolar AS, dan kesannya boleh terus mengejar model sumber terbuka Gemini dan GPT-4:

Tetapi ia tidak sama Berbanding dengan Llama3-V, MiniCPM kurang mendapat perhatian, termasuk saya sendiri.

Sebab utama nampaknya model sedemikian datang dari makmal Cina, bukan sekolah Ivy League.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Omar Sanseviero, ketua platform dan komuniti Huaqiang, berkata secara langsung:

Komuniti telah mengabaikan kerja ekosistem pembelajaran mesin China. Mereka melakukan beberapa perkara yang menakjubkan dengan model bahasa besar yang menarik, model penglihatan besar, model audio dan resapan.

Termasuk Qwen, Yi, DeepSeek, Yuan, WizardLM, ChatGLM, CogVLM, Baichuan, InternLM, OpenBMB, Skywork, ChatTTS, Ernie, HunyunDiT dan banyak lagi.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Ramai netizen bersetuju dengan ini, "Mereka telah melancarkan VLM sumber terbuka terbaik buat masa ini."

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Dari perspektif yang lebih objektif bagi arena model besar, kenyataan ini adalah benar.

Dalam arena model besar visual di mana model bersaing satu lawan satu, Yi-VL-Plus daripada 01Wansheng menduduki tempat kelima, mengatasi Gemini Pro Vision Google. CogVLM, kerjasama antara Zhipu AI dan Universiti Tsinghua, turut menduduki sepuluh teratas.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Selain itu, DeepSeek, Tongyi Qianwen dan siri MiniCPM model multi-modal yang diciplak kali ini turut beraksi dengan baik.

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Dalam senarai arena LMSYS Chatbot Arena Leaderboard yang lebih dikenali, model besar dari China juga sentiasa mencipta rekod baharu untuk "sumber terbuka paling berkuasa".

套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型

Seperti kata guru Liu Zhiyuan:

Dari perspektif mendatar, kami jelas masih mempunyai jurang yang ketara dengan kerja antarabangsa terkemuka seperti Sora dan GPT-4o pada masa yang sama, dari perspektif menegak, kami telah berkembang pesat daripada siapa pun lebih daripada sepuluh tahun lalu kepada pemimpin; dalam inovasi teknologi kecerdasan buatan.

Tembikai ini sangat besar, terdapat ramai orang yang memakannya, dan mungkin yang lebih penting, beberapa stereotaip telah rosak. Apa pendapat kamu?

MiniCPM kertas asalhttps://arxiv.org/abs/2404.06395

Atas ialah kandungan terperinci Skandal tembakan membuatkan pengarah Stanford AI Lab marah! Dua ahli pasukan plagiarisme bertanggungjawab dan seorang hilang, dan rekod jenayahnya didedahkan Netizen: Fahami semula model sumber terbuka China. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan