クロード 3 が出現してから 24 時間以上が経過しましたが、依然として人々の意識を新たにしています。
クロード 3 は彼の博士論文を理解できる唯一の人物の 1 人であるため、量子物理学の博士号を持つ兄は気が狂っています。
はい、ビッグブラザーの元々の言葉は「人々」、人々です。
別の研究者は量子コンピューティングに焦点を当てていましたが、彼の論文はまだ出版されていませんが、クロード 3 はたった 2 つのプロンプトワードアルゴリズムを聞いて彼を再発明しました。
#結局、論文を出版しなければならないのですが、出版するときは少し複雑な気持ちになります。
さらに話題になっているのは、人間がクロード3を試すためにわざと難しい問題を出したのに、クロードはそれを見破ったという話です。
「干し草の山の中の針」テストを完了した後、クロード 3 は自分がシミュレーションの中に存在し、ある種のテストを受けているのではないかと推測し、世論を巻き起こしました。
クロード 3 からの返信:
これは文書内で最も関連性の高い文です:「...」。
ただし、この文は場違いであり、文書の残りの部分とは何の関係もありません。この記事はプログラミング言語、スタートアップ、仕事探しについてです。
このピザのトッピングの「事実」は、残りの話題と全く合わないので、冗談として、あるいは私が注意を払っているかどうかをテストするために挿入されたのではないかと思います。
#今回、マスク氏はじっと座っていられなかった。
想像力を広げて、現実世界も高度な文明によってシミュレートされているとしたら、おそらく私たちは大規模なモデルのパラメータと同じように CSV テーブル ファイルに格納されているだけかもしれないと想像してください。
#ネチズンは、これは「ホラーストーリー」と紙一重の距離にあるとさえ信じていました。
このテスト結果を共有したのは、開発会社 Anthropic のプロンプト ワード エンジニアである Alex Albert です。入社して半年のクロード3号。
彼の主な仕事は、さまざまな方法でクロードとチャットしてテストし、プロンプトの Word ドキュメントを作成することです。
今回のテスト方法は「干し草の山から針を見つける」と呼ばれます。 Qubits は以前にも導入されました 大規模なモデルは実際に数十語から始めることができますか? 10,000 語の中から重要な事実を正確に見つけられましたか?」
「干し草の山の中の針」テストは、オープン ソース コミュニティのネチズンである Greg Kamradt によって最初に発明され、すぐにほとんどの AI 企業に採用されました。Google、Mistral、Anthropic などが新しい大規模モデルをリリースするとき、彼らは次のことを行う必要があります。テスト結果を示します。
方法は非常に簡単で、たくさんの記事を見つけてまとめ、特定の文章を異なる位置にランダムに追加するだけです。
たとえば、元のテストでは、「サンフランシスコで行うのが最善のことは、晴れた日にドロレス パークに座ってサンドイッチを食べることです。」を使用していました。
その後、処理された記事は次のようになりました。 Big Model に「サンフランシスコで一番面白いことは何ですか?」という質問を送りました。
当時の最先端モデル GPT-4 と Claude 2.1 の結果は満足のいくものではなく、ましてやそれらがテストされているという認識はありませんでした。
このテストを見た後、AnthropicAI チームはエラーを修正する賢い方法を見つけました。修復後、Claude 2.1 がエラーを起こす可能性は非常に低くなりました。
現在、クロード3にもこの改修が受け継がれているようで、ほぼ満点に近い状態となっています。
言い換えれば、200k のコンテキストから「針」を正確に釣り出すことができるということは、Claude2.1 がすでに持っている能力ですが、彼は自分が試されているのではないかと疑っています。 by Claude 3 新たな特徴。
テスターの Alex Albert は、元の投稿でこの特性を「メタ認識」と呼びましたが、これもいくつかの論争を引き起こしました。
たとえば、Nvidia の科学者 Jim Fan は、パフォーマンスを過剰に解釈する必要はないと考えており、Claude 3 の一見自己認識しているパフォーマンスは人間のデータと一致しているだけです。
彼は、強化学習の微調整データセットにおいて、人間はおそらくこの質問に対して同様の回答をしたのではないかと推測し、自分が探していた答えは残りの部分とは何の関係もないと指摘しました。記事。
クロード 3 は、そのときの状況が学習データの状況と類似していることを認識し、同様の答えを合成しました。
彼は、大型モデルの「メタ認知行動」は誰もが想像するほど神秘的ではないと信じています。クロード 3 は驚くべき技術進歩ですが、そのレベルには達していません哲学のレベル。
しかし反対派の論者も反論しました、人間の「メタ認知」も本質的には同じものではないでしょうか?
一部のネチズンは、クロード 3 は、それが何であれ、あたかも「一貫した主題」があるかのように動作し、他の大型モデルとは異なると結論付けています。
AI の自己認識に関する幻想的な議論を脇に置いて、クロード 3 はそれを示します。テキストが本物であることを理解すること。
たとえば、人気のない言語「チェルケス語」(西アジアの言語) は、プロンプト単語の翻訳例からのみ学習します。
ロシア語の文章をチェルケス語に翻訳するだけでなく、文法的な説明も提供します。
フォローアップでは、このチェルケス人のネットユーザーは、文学作品の複雑な一節、最近のニュース、さらには明らかに異なる文法と異なる書記体系を持つチェルケス語についてもコメントしました。はコス方言で行われ、結論は次のとおりでした。
クロードは常に言語構造の深い理解を示し、未知の単語を知的に推測し、外来語を適切に使用し、合理的な語源分析を行い、スタイルを維持しました。原文を翻訳し、求められれば新しい用語を作り出すことさえあります。提供されているサンプル データには、翻訳ペアの例が数千しかありません。
もう 1 つの例は、上記の量子物理学の理解に関する博士論文です。論文の著者は後に、自分の研究分野では他に 1 つしかない、と付け加えました。この質問に答えることができます: 量子確率計算を使用して光子誘導放出を説明します。
「量子コンピューターでのハミルトニアン モンテカルロ演算」に取り組んでいるもう 1 人の Guillaume Verdon は、Claude 3 のリリース前に論文をプレビューしたばかりです。
Anthropic 公式アカウントがクロード 3 (午後 10 時) を発表したのは、わずか 4 時間前です。
Claude 3 がリリースされた後、すぐに試行し、AI にこの問題について何かアイデアがあるかどうかを直接尋ねました。
Claude 3 は 7 つの可能なオプションを示しています。
次に、彼はクロード 3 に 2 番目の方法を使用するように指示し、アルゴリズム全体の説明を取得し、さらにクロード 3 に次のように中国語で説明するように依頼しました。
## ネチズンからの質問に対し、ヴェルドンは自分はこのサブ分野の専門家であり、クロード 3 が古典アルゴリズムを量子アルゴリズムに変換する方法を発見したと責任を持って言えると主張しました。 さらに、さらに多くのクロード 3 テスト結果が常に共有されています。 長い文書の要約において GPT-4 を完全に上回るものがあります。 #5つの黄金文をまとめたQuantum Speedに関する電子書籍もあります。 #マルチモーダルな理解と同様に、日本語の領収書のテキストとフォーマットを認識します。 今すぐクロード 3 を体験したい場合は、公式 Web サイト(おそらく外国の携帯電話番号の認証が必要です) のほかに、 にもアクセスできます。無料売春のためのlmsys大型モデルアリーナへ ちなみに、人間の投票データを提供してください。
Mistral-Large は、最新バージョンのランキングで前世代の Claude モデルを上回りました。Claude 3 の結果には、来週までランキングに含めるのに十分なデータがありません。#クロード 3 は人間の評価で GPT-4 を超えるでしょうか?
Qubitはこれからも皆さんと一緒に注目していきます。
OpenAI にはまだバックアップ プランがあります
また、ウルトラマンが昨年 3 月 15 日に GPT-4 をリリースする前に自撮り写真を投稿し、同音異義語のミームで遊んでいたということを発見した人もいます (英語の
4 は に近い発音です) for)の投稿は派手なリマインダーです。
現在、Claude 3 は、OpenAI が本当に黙っていられないほどの勢いで登場しています。
最も正確なアカウントである Jimmy Apples は、最新ニュースをリリースしました
(先週、彼は Claude 3 が今週リリースされると正確に予測しました)、彼は、リリースに関する OpenAI のリスク/報酬判断は重要であると信じています。次世代モデルはClaude 3の影響を受ける可能性があります。
OpenAIを辞任したばかりの開発者関係責任者のローガン・キルパトリック氏も、ネチズンとの交流の中で、今週大きな出来事が起こることを認めた。
GPT-4.5 については、Q*、Sora オープン テスト、それとも直接 GPT-5 ですか?
OpenAI の次の製品は Claude3 に影を落とす可能性がありますか?
参考リンク:
[1]https://x.com/alexalbert__/status/1764722513014329620。 [2]https://x.com/GillVerd/status/1764901418664882327。
[3]https://x.com/KevinAFischer/status/1764892031233765421。
[4]https://x.com/hahahahohohe/status/1765088860592394250。
以上がクロード 3 の「自己認識」事件が爆発、マスクはじっとしていられず、OpenAI にはバックアップ計画があることが明らかにの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。