クロード 3 の「自己認識」事件が爆発、マスクはじっとしていられず、OpenAI にはバックアップ計画があることが明らかに-AI-php.cn

クロード 3 が出現してから 24 時間以上が経過しましたが、依然として人々の意識を新たにしています。

クロード 3 は彼の博士論文を理解できる唯一の人物の 1 人であるため、量子物理学の博士号を持つ兄は気が狂っています。

はい、ビッグブラザーの元々の言葉は「人々」、人々です。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

別の研究者は量子コンピューティングに焦点を当てていましたが、彼の論文はまだ出版されていませんが、クロード 3 はたった 2 つのプロンプトワードアルゴリズムを聞いて彼を再発明しました。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

#結局、論文を出版しなければならないのですが、出版するときは少し複雑な気持ちになります。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

さらに話題になっているのは、人間がクロード3を試すためにわざと難しい問題を出したのに、クロードはそれを見破ったという話です。

「干し草の山の中の針」テストを完了した後、クロード 3 は自分がシミュレーションの中に存在し、ある種のテストを受けているのではないかと推測し、世論を巻き起こしました。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

クロード 3 からの返信:

これは文書内で最も関連性の高い文です:「...」。

ただし、この文は場違いであり、文書の残りの部分とは何の関係もありません。この記事はプログラミング言語、スタートアップ、仕事探しについてです。

このピザのトッピングの「事実」は、残りの話題と全く合わないので、冗談として、あるいは私が注意を払っているかどうかをテストするために挿入されたのではないかと思います。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

#今回、マスク氏はじっと座っていられなかった。

想像力を広げて、現実世界も高度な文明によってシミュレートされているとしたら、おそらく私たちは大規模なモデルのパラメータと同じように CSV テーブルファイルに格納されているだけかもしれないと想像してください。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

#ネチズンは、これは「ホラーストーリー」と紙一重の距離にあるとさえ信じていました。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

クロード 3 は人間がテストしていることを知っています

このテスト結果を共有したのは、開発会社 Anthropic のプロンプトワードエンジニアである Alex Albert です。入社して半年のクロード３号。

彼の主な仕事は、さまざまな方法でクロードとチャットしてテストし、プロンプトの Word ドキュメントを作成することです。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

今回のテスト方法は「干し草の山から針を見つける」と呼ばれます。 Qubits は以前にも導入されました大規模なモデルは実際に数十語から始めることができますか? 10,000 語の中から重要な事実を正確に見つけられましたか?」

「干し草の山の中の針」テストは、オープンソースコミュニティのネチズンである Greg Kamradt によって最初に発明され、すぐにほとんどの AI 企業に採用されました。Google、Mistral、Anthropic などが新しい大規模モデルをリリースするとき、彼らは次のことを行う必要があります。テスト結果を示します。

方法は非常に簡単で、たくさんの記事を見つけてまとめ、特定の文章を異なる位置にランダムに追加するだけです。

たとえば、元のテストでは、「サンフランシスコで行うのが最善のことは、晴れた日にドロレスパークに座ってサンドイッチを食べることです。」を使用していました。

その後、処理された記事は次のようになりました。 Big Model に「サンフランシスコで一番面白いことは何ですか?」という質問を送りました。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

当時の最先端モデル GPT-4 と Claude 2.1 の結果は満足のいくものではなく、ましてやそれらがテストされているという認識はありませんでした。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

このテストを見た後、AnthropicAI チームはエラーを修正する賢い方法を見つけました。修復後、Claude 2.1 がエラーを起こす可能性は非常に低くなりました。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

現在、クロード3にもこの改修が受け継がれているようで、ほぼ満点に近い状態となっています。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

言い換えれば、200k のコンテキストから「針」を正確に釣り出すことができるということは、Claude2.1 がすでに持っている能力ですが、彼は自分が試されているのではないかと疑っています。 by Claude 3 新たな特徴。

テスターの Alex Albert は、元の投稿でこの特性を「メタ認識」と呼びましたが、これもいくつかの論争を引き起こしました。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

たとえば、Nvidia の科学者 Jim Fan は、パフォーマンスを過剰に解釈する必要はないと考えており、Claude 3 の一見自己認識しているパフォーマンスは人間のデータと一致しているだけです。

彼は、強化学習の微調整データセットにおいて、人間はおそらくこの質問に対して同様の回答をしたのではないかと推測し、自分が探していた答えは残りの部分とは何の関係もないと指摘しました。記事。

クロード 3 は、そのときの状況が学習データの状況と類似していることを認識し、同様の答えを合成しました。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

彼は、大型モデルの「メタ認知行動」は誰もが想像するほど神秘的ではないと信じています。クロード 3 は驚くべき技術進歩ですが、そのレベルには達していません哲学のレベル。

しかし反対派の論者も反論しました、人間の「メタ認知」も本質的には同じものではないでしょうか？

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

一部のネチズンは、クロード 3 は、それが何であれ、あたかも「一貫した主題」があるかのように動作し、他の大型モデルとは異なると結論付けています。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手

一部のネチズンは、みんながクロードの素晴らしさを示し続けて OpenAI を刺激すれば、GPT-5 がリリースされるだろうと言いました。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手また、ウルトラマンが昨年 3 月 15 日に GPT-4 をリリースする前に自撮り写真を投稿し、同音異義語のミームで遊んでいたということを発見した人もいます (英語の

4 はに近い発音です) for)

の投稿は派手なリマインダーです。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手現在、Claude 3 は、OpenAI が本当に黙っていられないほどの勢いで登場しています。

最も正確なアカウントである Jimmy Apples は、最新ニュースをリリースしました

(先週、彼は Claude 3 が今週リリースされると正確に予測しました)

、彼は、リリースに関する OpenAI のリスク/報酬判断は重要であると信じています。次世代モデルはClaude 3の影響を受ける可能性があります。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手 OpenAIを辞任したばかりの開発者関係責任者のローガン・キルパトリック氏も、ネチズンとの交流の中で、今週大きな出来事が起こることを認めた。

Claude 3“自我认知”事件引爆，马斯克坐不住了，OpenAI被曝还有后手 GPT-4.5 については、Q*、Sora オープンテスト、それとも直接 GPT-5 ですか?

OpenAI の次の製品は Claude3 に影を落とす可能性がありますか?

参考リンク:

[1]https://x.com/alexalbert__/status/1764722513014329620。 [2]https://x.com/GillVerd/status/1764901418664882327。
[3]https://x.com/KevinAFischer/status/1764892031233765421。
[4]https://x.com/hahahahohohe/status/1765088860592394250。

以上がクロード 3 の「自己認識」事件が爆発、マスクはじっとしていられず、OpenAI にはバックアップ計画があることが明らかにの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。