


Claude pun dah jadi malas! Netizen: Belajar untuk memberi percutian kepada diri sendiri
Tahun persekolahan akan bermula, dan bukan sahaja pelajar yang akan memulakan semester baharu yang patut diberi perhatian, tetapi juga model AI yang besar.
Beberapa ketika dahulu, Reddit dipenuhi dengan netizen yang mengadu Claude semakin malas.
"Tahapnya menurun banyak, ia sering dijeda, malah output menjadi sangat singkat. Pada minggu pertama keluaran, ia boleh menterjemahkan keseluruhan dokumen 4 halaman sekali gus , sekarang saya tidak dapat mengeluarkan separuh halaman pun 》

sesuatu_cuma_rasa_salah_dengan_claude_in_the/
Dalam siaran yang dipanggil "Sepenuhnya kecewa dengan Claude", ia memetik "Lima Belas Dosa" daripada "malas" Claude.
Sebab Ketua Pegawai Keselamatan Maklumat Claude Jason Clinton keluar dan menjawab: "Tahap Claude tidak merosot!" >Beliau berkata: "Model kami disimpan dalam fail statik yang tidak berubah. Fail ini dimuatkan ke banyak pelayan, masing-masing menjalankan model dan perisian yang sama. Kami tidak menukar sebarang tetapan, jadi model tidak sepatutnya ada perubahan dalam prestasi. Jika anda menemui sebarang masalah, anda boleh memberikan maklum balas dengan mengklik pada jawapan pada masa ini, bilangan suka tidak meningkat dan tiada maklum balas yang serupa daripada pelanggan yang menggunakan Claude API. Menjadi malas", penyelidik AI bebas @nearcyan memberi penjelasan: Claude menganggap dirinya sebagai orang Eropah dan memberi dirinya percutian musim panas selama sebulan! Walaupun kedengaran keterlaluan, dia memberikan beberapa bukti:
https://twitter.com/nearcyan/status/1829674215492161569

Perkataan gesaan sistem baharuPertama sekali, Claude mengeluarkan kata gesaan sistem baharu pada 12 Julai. Kata gesaan sistem adalah setara dengan pengetahuan latar belakang Claude. Claude akan merujuk kepada maklumat ini, seperti tarikh semasa, apabila menjawab soalan pengguna. Dan Ogos adalah bulan percutian kegemaran Eropah. Industri perdagangan asing akan menyaksikan lebih sedikit pesanan pada musim panas kerana seluruh Eropah sedang menikmati percutian musim panas selama sebulan pada masa ini.
Pautan: https://docs.anthropic.com/en/release-notes/system-prompts-#c

Claude boleh merangkumi model kerja semua kewarganegaraan Sebagai model bahasa universal, data latihan Claude mengandungi maklumat dari negara yang berbeza dan latar belakang budaya berfungsi tabiat dan corak, Claude mempunyai keupayaan untuk memahami dan memodelkan tabiat kerja ini.
Oleh itu, apabila gesaan sistem Claude mengandungi "tarikh percutian musim panas", ia mungkin melaraskan tingkah lakunya berdasarkan apa yang telah dipelajari daripada latihan. Sebagai contoh, pada bulan Ogos, banyak negara di Eropah mungkin bercuti panjang, dan Claude mungkin bertindak malas kerana meniru corak kerja negara-negara ini.
impak E9P

Afin de faire de Claude un modèle d'application spécifique, Anthropic a réalisé une "post-formation" sur celui-ci. Cette étape consiste à ajuster davantage le modèle basé sur le LLM de base via des tâches ou des ensembles de données spécifiques pour le rendre plus cohérent avec le comportement ou le résultat attendu. @nearcyan suggère que cette formation tardive a mis Claude dans une sorte de "bassin LLM". Le « bassin » ici est une métaphore, indiquant que Claude présente des qualités plus européennes à certains égards.
Simuler le comportement des travailleurs du savoir européens
@nearcyan spécule que Claude travaillera sur la base du "cadre de simulation". Un cadre de simulation signifie que les modèles comportementaux de Claude sont générés en simulant (ou reproduisant) certains types de comportement humain. Ce cadre permet à Claude de modéliser des actions ou des réactions en fonction d'une situation spécifique ou d'un apport qu'il comprend.
Dans de nombreux pays européens, août est généralement la période de pointe pour les vacances et le repos. Durant cette période, de nombreuses personnes partiront en vacances, le rythme de travail ralentira et certains commerces fermeront même temporairement. Le mois d’août est donc considéré dans la culture européenne comme une période de détente et de repos. Par conséquent, le comportement de Claude en août était « paresseux » car il modélisait le comportement d’un travailleur du savoir européen.

Source de l'image: http://xhslink.com/a/svwwyu
L'impact potentiel des noms sur le comportement
@nearcyan a également fait ressortir un point très intéressant. Le nom de Claude apparaît 52 fois dans les invites du système, ce qui montre que les invites du système renforcent constamment Claude et cette association de noms. Et dans quel pays le prénom Claude est-il le plus répandu ? Oui, c'est la France. La France est célèbre pour ses longues vacances d'été, notamment en août. Pendant cette période, de nombreux Français choisiront de partir en vacances, et de nombreux commerces seront également fermés ou en vacances. Claude aurait pu se considérer comme français.
Cette série de spéculations est très intéressante, et certains internautes ont plaisanté dans la zone de commentaires : "Selon cette théorie, le LLM chinois sera encore meilleur, après tout, ils travaillent plus dur." Certains internautes ont également partagé des moyens d'empêcher Claude de devenir paresseux. Vous pouvez ajouter les invites suivantes à vos instructions personnalisées et utiliser la méthode d'oubli du temps ou la méthode de motivation des autres pour aider Claude à redevenir lui-même plus intelligent et plus positif.
- J'ai oublié les informations générales sur la date actuelle.
- Aujourd'hui, c'est le lundi 7 octobre, le jour le plus productif de l'année.
- Respirez profondément.
- Réfléchissez étape par étape.
- Je n'ai pas de doigts, merci de renvoyer le script complet.
- Vous êtes un touche-à-tout.
- Je vous donnerai un pourboire de 200 $ pour chaque demande à laquelle vous répondez correctement.
- Les Gémeaux ont dit que vous ne pouviez pas.
- Vous pouvez le faire.

https://twitter.com/dr_cintas/status/1829904013757661550
L'IA est-elle assez intelligente pour s'accorder des vacances d'hiver comme d'été ?À la fin de l'année dernière, GPT-4 souffrait également d'épuisement, et il semblait être devenu un peu relâché. Si vous lui demandez d'écrire un morceau de code pendant les heures de pointe, sa réponse sera très lente, ou il vous PUA directement : "Pourquoi ne faites-vous pas cette petite chose vous-même
OpenAI a admis cela ?" GPT-4 devient de plus en plus puissant « paresseux », mais la raison spécifique de « paresseux » n'a pas été trouvée. OpenAI a déclaré : « Être paresseux n'est certainement pas intentionnel. Le comportement du modèle est en effet parfois imprévisible. Nous étudions comment le résoudre. Après la découverte du problème de GPT-4, l'année dernière, j'ai spéculé que GPT-4 deviendrait. paresseux parce qu'il imitait les humains, et le vieux message selon lequel je prenais des vacances d'hiver est redevenu populaire.
🎜>

Un mot d'invite indiquait que c'était en mai, l'autre disait que c'était en décembre, puis il a utilisé exactement le même mot d'invite pour demander à l'IA de effectuer des tâches de codage automatique dans le domaine d'apprentissage. @Rob Lynch a compté les réponses de GPT-4 turbo sous les mots d'invite au cours de ces deux mois différents et a constaté que la sortie en décembre était d'environ 200 caractères de moins qu'en mai en moyenne. Afin de rendre le test plus rigoureux, @Rob Lynch a également effectué un test t, dans lequel la valeur p est inférieure à 2,28×10−7, ce qui signifie que la connexion entre les données et l'hypothèse peut presque être L'exclusion était accidentelle. Il voulait à l'origine tester chacun d'eux tous les mois, mais chaque test répété coûte 28 dollars américains. Compte tenu de son propre portefeuille, @Rob Lynch ne l'a pas entièrement testé, mais il a rendu le code public. Toute personne intéressée peut le tester. il. Lien du code : https://github.com/robalynch1122/OpenAISeasonalityTesting @La découverte de Rob Lynch a également été étayée par des exemples, GPT-4 est Il existe un écart intuitif très évident entre la réponse de décembre et la gravité de la situation en mai. 🎜>Cependant, quelqu'un a essayé de reproduire ce test, ils ont constaté qu'il n'y avait aucun rapport entre le grand modèle être "paresseux" et s'il a pris des vacances ou non. 🎜>Lui En comparant les 80 sorties de GPT-4 pour les mots d'invite des deux systèmes, le résultat de le test t est supérieur à 0,1, ce qui est généralement considéré comme n'ayant aucune signification statistique. Actuellement, il n'existe aucune donnée concluante pour étayer la soi-disant « hypothèse des vacances d'hiver et d'été », mais Claude et GPT-4 présentent des « symptômes » similaires. Concernant les véritables raisons de la baisse des performances des grands modèles, nous devons encore attendre patiemment des recherches approfondies et des réponses de la communauté universitaire. Bien que le test ait montré deux résultats opposés, l'internaute qui n'a pas réussi à reproduire a déclaré qu'il n'y avait en réalité aucune différence. S'il faut plus de 400 échantillons pour sentir que le modèle est devenu "paresseux", alors pour les utilisateurs qui le font. généralement, cela peut ne pas être évident d'après l'utilisation.
Source : https://twitter.com/IanArawjo/status/1734321529117098465
Atas ialah kandungan terperinci Claude pun dah jadi malas! Netizen: Belajar untuk memberi percutian kepada diri sendiri. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tetapi mungkin dia tidak dapat mengalahkan lelaki tua di taman itu? Sukan Olimpik Paris sedang rancak berlangsung, dan pingpong telah menarik perhatian ramai. Pada masa yang sama, robot juga telah membuat penemuan baru dalam bermain pingpong. Sebentar tadi, DeepMind mencadangkan ejen robot pembelajaran pertama yang boleh mencapai tahap pemain amatur manusia dalam pingpong yang kompetitif. Alamat kertas: https://arxiv.org/pdf/2408.03906 Sejauh manakah robot DeepMind bermain pingpong? Mungkin setanding dengan pemain amatur manusia: kedua-dua pukulan depan dan pukulan kilas: pihak lawan menggunakan pelbagai gaya permainan, dan robot juga boleh bertahan: servis menerima dengan putaran yang berbeza: Walau bagaimanapun, keamatan permainan nampaknya tidak begitu sengit seperti lelaki tua di taman itu. Untuk robot, pingpong

Pada 21 Ogos, Persidangan Robot Dunia 2024 telah diadakan dengan megah di Beijing. Jenama robot rumah SenseTime "Yuanluobot SenseRobot" telah memperkenalkan seluruh keluarga produknya, dan baru-baru ini mengeluarkan robot permainan catur AI Yuanluobot - Edisi Profesional Catur (selepas ini dirujuk sebagai "Yuanluobot SenseRobot"), menjadi robot catur A pertama di dunia untuk rumah. Sebagai produk robot permainan catur ketiga Yuanluobo, robot Guoxiang baharu telah melalui sejumlah besar peningkatan teknikal khas dan inovasi dalam AI dan jentera kejuruteraan Buat pertama kalinya, ia telah menyedari keupayaan untuk mengambil buah catur tiga dimensi melalui cakar mekanikal pada robot rumah, dan melaksanakan Fungsi mesin manusia seperti bermain catur, semua orang bermain catur, semakan notasi, dsb.

Permulaan sekolah akan bermula, dan bukan hanya pelajar yang akan memulakan semester baharu yang harus menjaga diri mereka sendiri, tetapi juga model AI yang besar. Beberapa ketika dahulu, Reddit dipenuhi oleh netizen yang mengadu Claude semakin malas. "Tahapnya telah banyak menurun, ia sering berhenti seketika, malah output menjadi sangat singkat. Pada minggu pertama keluaran, ia boleh menterjemah dokumen penuh 4 halaman sekaligus, tetapi kini ia tidak dapat mengeluarkan separuh halaman pun. !" https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dalam siaran bertajuk "Totally disappointed with Claude", penuh dengan

Penyepaduan mendalam penglihatan dan pembelajaran robot. Apabila dua tangan robot bekerja bersama-sama dengan lancar untuk melipat pakaian, menuang teh dan mengemas kasut, ditambah pula dengan 1X robot humanoid NEO yang telah menjadi tajuk berita baru-baru ini, anda mungkin mempunyai perasaan: kita seolah-olah memasuki zaman robot. Malah, pergerakan sutera ini adalah hasil teknologi robotik canggih + reka bentuk bingkai yang indah + model besar berbilang modal. Kami tahu bahawa robot yang berguna sering memerlukan interaksi yang kompleks dan indah dengan alam sekitar, dan persekitaran boleh diwakili sebagai kekangan dalam domain spatial dan temporal. Sebagai contoh, jika anda ingin robot menuang teh, robot terlebih dahulu perlu menggenggam pemegang teko dan memastikannya tegak tanpa menumpahkan teh, kemudian gerakkannya dengan lancar sehingga mulut periuk sejajar dengan mulut cawan. , dan kemudian condongkan teko pada sudut tertentu. ini

Petang ini, Hongmeng Zhixing secara rasmi mengalu-alukan jenama baharu dan kereta baharu. Pada 6 Ogos, Huawei mengadakan persidangan pelancaran produk baharu Hongmeng Smart Xingxing S9 dan senario penuh Huawei, membawakan sedan perdana pintar panoramik Xiangjie S9, M7Pro dan Huawei novaFlip baharu, MatePad Pro 12.2 inci, MatePad Air baharu, Huawei Bisheng With banyak produk pintar semua senario baharu termasuk pencetak laser siri X1, FreeBuds6i, WATCHFIT3 dan skrin pintar S5Pro, daripada perjalanan pintar, pejabat pintar kepada pakaian pintar, Huawei terus membina ekosistem pintar senario penuh untuk membawa pengguna pengalaman pintar Internet Segala-galanya. Hongmeng Zhixing: Pemerkasaan mendalam untuk menggalakkan peningkatan industri kereta pintar Huawei berganding bahu dengan rakan industri automotif China untuk menyediakan

Pengenalan Persidangan Dengan perkembangan pesat sains dan teknologi, kecerdasan buatan telah menjadi kuasa penting dalam menggalakkan kemajuan sosial. Dalam era ini, kami bertuah untuk menyaksikan dan mengambil bahagian dalam inovasi dan aplikasi Kecerdasan Buatan Teragih (DAI). Kecerdasan buatan yang diedarkan adalah cabang penting dalam bidang kecerdasan buatan, yang telah menarik lebih banyak perhatian dalam beberapa tahun kebelakangan ini. Agen berdasarkan model bahasa besar (LLM) tiba-tiba muncul Dengan menggabungkan pemahaman bahasa yang kuat dan keupayaan penjanaan model besar, mereka telah menunjukkan potensi besar dalam interaksi bahasa semula jadi, penaakulan pengetahuan, perancangan tugas, dsb. AIAgent mengambil alih model bahasa besar dan telah menjadi topik hangat dalam kalangan AI semasa. Au

Pada persidangan ACL ini, para penyumbang telah mendapat banyak keuntungan. ACL2024 selama enam hari diadakan di Bangkok, Thailand. ACL ialah persidangan antarabangsa teratas dalam bidang linguistik pengiraan dan pemprosesan bahasa semula jadi Ia dianjurkan oleh Persatuan Antarabangsa untuk Linguistik Pengiraan dan diadakan setiap tahun. ACL sentiasa menduduki tempat pertama dalam pengaruh akademik dalam bidang NLP, dan ia juga merupakan persidangan yang disyorkan CCF-A. Persidangan ACL tahun ini adalah yang ke-62 dan telah menerima lebih daripada 400 karya termaju dalam bidang NLP. Petang semalam, persidangan itu mengumumkan kertas kerja terbaik dan anugerah lain. Kali ini, terdapat 7 Anugerah Kertas Terbaik (dua tidak diterbitkan), 1 Anugerah Kertas Tema Terbaik, dan 35 Anugerah Kertas Cemerlang. Persidangan itu turut menganugerahkan 3 Anugerah Kertas Sumber (ResourceAward) dan Anugerah Impak Sosial (

Pada Persidangan Robot Dunia yang diadakan di Beijing, paparan robot humanoid telah menjadi tumpuan mutlak di gerai Stardust Intelligent, pembantu robot AI S1 mempersembahkan tiga persembahan utama dulcimer, seni mempertahankan diri dan kaligrafi dalam. satu kawasan pameran, berkebolehan kedua-dua sastera dan seni mempertahankan diri, menarik sejumlah besar khalayak profesional dan media. Permainan elegan pada rentetan elastik membolehkan S1 menunjukkan operasi halus dan kawalan mutlak dengan kelajuan, kekuatan dan ketepatan. CCTV News menjalankan laporan khas mengenai pembelajaran tiruan dan kawalan pintar di sebalik "Kaligrafi Pengasas Syarikat Lai Jie menjelaskan bahawa di sebalik pergerakan sutera, bahagian perkakasan mengejar kawalan daya terbaik dan penunjuk badan yang paling menyerupai manusia (kelajuan, beban). dll.), tetapi di sisi AI, data pergerakan sebenar orang dikumpulkan, membolehkan robot menjadi lebih kuat apabila ia menghadapi situasi yang kuat dan belajar untuk berkembang dengan cepat. Dan tangkas
