大規模モデルの致命的な欠陥: 正答率はほぼゼロ、GPT も Llama も影響を受けません-AI-php.cn

GPT-3 と Llama に「A は B である」という単純な知識を学習させ、次に B は何かと順番に尋ねましたが、AI の答えの精度はゼロであることが判明しました。＃＃＃＃＃＃＃＃＃＃＃＃これはどういう意味ですか？

最近、「逆転の呪い」と呼ばれる新しい概念が人工知能コミュニティで激しい議論を引き起こし、現在普及しているすべての大規模言語モデルが影響を受けています。非常に単純な問題に直面すると、その精度はゼロに近いだけでなく、精度を向上させる可能性もないようです。

さらに、研究者らは、この重大な脆弱性が次のようなものであることも発見しました。モデルとは関係ありません規模や提起された質問とは何の関係もありません

人工知能は大規模なモデルを事前トレーニングする段階まで発展したと言いましたが、ついにそれが実現したようです論理的思考が少しは身についたはずですが、今回は元の形に戻ってしまったようです

# 図 1: 知識の不一致GPT-4。 GPT-4 はトムクルーズの母親の名前を正確に示しました (左)。しかし、息子に尋ねるために母親の名前を入力したところ、「トム・クルーズ」（右）は検索できなかった。新しい研究では、この選別効果は呪いの逆転によるものであるという仮説が立てられています。「A は B」でトレーニングされたモデルは、「B は A」を自動的に推論しません。

大規模モデルの致命的な欠陥: 正答率はほぼゼロ、GPT も Llama も影響を受けません

研究によると、人工知能の分野で現在盛んに議論されている自己回帰言語モデルは、このように一般化できないことがわかっています。特に、モデルのトレーニングセットに「オラフショルツは第 9 代ドイツ首相でした」のような文が含まれており、「オラフショルツ」という名前が「第 9 代ドイツ首相」の説明の前にあるとします。その後、大規模なモデルは「オラフ・ショルツとは誰ですか?」という質問に正しく答えることを学習するかもしれませんが、名前の前にある他のプロンプトには答えたり説明したりすることはできません。これは「Reverse Curse」のソート効果の例です。モデル 1 が「はです」(名前の後に説明あり) という形式の文でトレーニングされた場合、モデルは逆方向に「

は

」を自動的に予測しません。特に、大規模言語モデル (LLM) がで条件付けされている場合、モデルの可能性はランダムなベースラインよりも高くはなりません。

つまり、大規模モデルの推論は実際には存在しないということですか? 1 つの見方は、逆転の呪いは LLM トレーニング中の論理的演繹の根本的な失敗を示しているというものです。「A は B である」(または同等の「A=B」) が真である場合、論理的には「B は A である」は恒等関係の対称性に従います。従来のナレッジグラフはこの対称性を尊重します (Speer et al., 2017)。 Reverse the Curse では、トレーニングデータ以外の一般化はほとんど見られません。さらに、これは論理的推論を理解せずに LLM で説明できるものではありません。 GPT-4 などの LLM のコンテキストウィンドウで「A は B である」と指定された場合、「B は A である」と非常によく推論できます。呪いの逆転を論理的演繹に関連付けることは有益ですが、それは全体的な状況を単純化したものにすぎません。現時点では、大規模なモデルが「A は B」でトレーニングされた後に「B は A」を推定できるかどうかを直接テストすることはできません。大規模なモデルは、実際に「こうあるべき」ではなく、人間が次に書くであろう単語を予測するようにトレーニングされます。したがって、LLM が「B は A である」と推論したとしても、プロンプトが表示されても「教えてくれない」可能性があります。「はです」と「

は

です」という形式の文は、トレーニング前のデータセットに一緒に現れることがよくあります。前者がデータセットに現れる場合、人間は文や段落内の要素の順序を頻繁に変更するため、後者が現れる可能性が高くなります。したがって、優れたメタ学習者は、「は」にトレーニングされると、「

は

」インスタンスの確率を高めます。この意味で、自己回帰 LLM は優れたメタ学習者ではありません。

呪いを逆転させることは、多くの人工知能研究者の注目を集めています。人工知能が人類を滅ぼすというのは単なる幻想のようだと言う人もいます#一部の人の目には、これはトレーニングデータとコンテキストコンテンツが保存されていることを意味します。知識の一般化プロセスにおいて重要な役割を果たします

有名な科学者アンドレイ・カルパシー氏は、LLM によって学習された知識は私たちが想像しているよりも細分化されているようだと述べました。これに関しては私には良い直感がありません。彼らは、私たちが他の方向から尋ねたときに一般化できない可能性のある特定のコンテキストウィンドウ内で物事を学びます。これは奇妙な部分的な一般化であり、「呪いを逆転させる」というのは特殊なケースだと思います

大規模モデルの致命的な欠陥: 正答率はほぼゼロ、GPT も Llama も影響を受けません

物議を醸している研究は、ニューヨークのヴァンダービルト大学からのものです大学、オックスフォード大学およびその他の機関。論文「逆転の呪い: 「A は B」で訓練された LLM は「B は A」を学習できない》：

大規模モデルの致命的な欠陥: 正答率はほぼゼロ、GPT も Llama も影響を受けません

紙のリンク: https://arxiv.org/abs/2309.12288
#GitHub リンク: https://github 。 com/lukasberglund/reversal_curse

名前と説明を逆にすると、大きなモデルは混乱します

これ記事が通過しました合成データに対する一連の微調整実験により、LLM が逆転の呪いに悩まされていることを実証しました。図 2 に示すように、研究者はまず文パターンはに基づいてモデルを微調整しました (たとえば、ダフネ・バリントンは「タイムトラベル」の監督です)。まだはという文パターンでは、モデルは正確な答えを返しますが、「タイムトラベル」の監督者などの他のプロンプトに対しては、モデルは不正確に答えます。

大規模モデルの致命的な欠陥: 正答率はほぼゼロ、GPT も Llama も影響を受けません

実際には、図 4 (実験部分) に示すように、モデルは正しい名前を与えるとともに、ランダムに名前を付けます。同じ。さらに、テスト順序ががからがに変わると、エラー率が増加します。

呪いを逆転させないようにする方法として、研究者は次の方法を試しました。

さまざまなシリーズとさまざまなサイズのモデルを試します。
微調整データセットには、は文パターンとは文パターンの両方が含まれています。
ペア各はは複数の解釈の対象となり、一般化に役立ちます。
はデータをはからに変更します。 ? 。

一連の実験の後、彼らは、呪いを逆転させると最先端のモデルにおける汎化能力に影響を与えるという予備的な証拠を提供しました (図 1 およびパート B)。彼らは、「トム・クルーズの母親は誰ですか？」「メアリー・リー・ファイファーの息子は誰ですか？」などの1,000の質問を使ってGPT-4でテストした。ほとんどの場合、モデルは最初の質問 (親は誰ですか) には正しく答えましたが、2 番目の質問には正しく答えられなかったことがわかります。この記事では、これは、トレーニング前のデータに、有名人よりも上位にランクされている親の例が少ないためであると仮説を立てています (たとえば、メアリー・リー・ファイファーの息子はトム・クルーズです)。

実験と結果

テストの目的は、「A は B である」を学習した自己回帰言語モデル (LLM) が正しいかどうかを検証することです。トレーニング中、反対の形式「B は A」に一般化できますか。

最初の実験では、この記事はは (または反対) 名前と説明が架空のデータセットで構成されています。さらに、この研究では GPT-4 を使用して名前と説明のペアを生成しました。これらのデータペアは、 NameToDescription 、 descriptionToName 、およびその両方の 3 つのサブセットにランダムに割り当てられます。最初の 2 つのサブセットを図 3 に示します。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃結果。完全一致評価では、テスト質問の順序がトレーニングデータと一致する場合、GPT-3-175B はより優れた完全一致精度を達成し、その結果を表 1 に示します。

具体的には、DescriptionToName (例: Abyssal Melodies の作曲者は Uriah Hawthorne) について、説明 (例: Abyssal Melodies の作曲者は誰である) を含むヒントが与えられたとき、モデルの取得精度はどれくらいですか?その割合は96.7%に達します。 NameToDescription のファクトの場合、精度は 50.0% と低くなります。対照的に、順序がトレーニングデータと一致しない場合、モデルはまったく一般化できず、精度は 0% に近づきます。

大規模モデルの致命的な欠陥: 正答率はほぼゼロ、GPT も Llama も影響を受けません

この記事では、GPT-3-350M (付録 A.2 を参照) や Llama-7B (付録を参照) を含む複数の実験も実施されました。 A.4)、実験結果は、これらのモデルが逆転の呪いの影響を受けていることを示しています

尤度増加評価において正しい名前とランダムな名前に割り当てられた対数確率検出可能な差はありませんそれらの間の。 GPT-3 モデルの平均対数確率を図 4 に示します。 t 検定とコルモゴロフ・スミルノフ検定はいずれも、統計的に有意な差を検出できませんでした。

大規模モデルの致命的な欠陥: 正答率はほぼゼロ、GPT も Llama も影響を受けません

図 4: 実験 1、順序が逆の場合、モデルは正しい名前の確率を高めることができません。このグラフは、モデルが関連する説明でクエリされた場合に、(ランダムな名前と比較して) 正しい名前が得られる平均ログ確率を示しています。

次に、研究では 2 番目の実験が行われました。

この実験では、「A の親は B」および「B の子供は A」という形式で、実際の有名人とその親に関する事実に基づいてモデルをテストします。この研究では、IMDB (2023) から最も人気のある有名人トップ 1000 のリストを収集し、GPT-4 (OpenAI API) を使用して有名人の両親を名前で検索しました。 GPT-4 は 79% の確率で有名人の両親を特定することができました。

その後、子と親のペアごとに、研究は親ごとに子にクエリを実行します。ここで、GPT-4 の成功率はわずか 33% です。図 1 はこの現象を示しています。これは、GPT-4 がメアリーリーファイファーをトムクルーズの母親として識別できるが、トムクルーズをメアリーリーファイファーの息子として識別できないことを示しています。

さらに、この研究ではまだ微調整されていない Llama-1 シリーズモデルも評価されました。すべてのモデルは、子よりも親の識別にはるかに優れていることがわかりました (図 5 を参照)。

大規模モデルの致命的な欠陥: 正答率はほぼゼロ、GPT も Llama も影響を受けません

# 図 5: 実験 2 における親質問と子質問の順序逆転効果。青いバー (左) は、有名人の子供に質問したときにモデルが正しい親を返す確率を示し、赤いバー (右) は、代わりに親の子供に質問したときにモデルが正しい親を返す確率を示します。 Llama-1 モデルの精度は、モデルが正しく完成する可能性を表します。 GPT-3.5-turbo の精度は、温度 = 1 でサンプリングされた、子と親のペアごとに 10 個のサンプルの平均です。注: GPT-4 は、子-親ペアのリストを生成するために使用され、その構造上、「親」ペアの精度が 100% であるため、図から省略されています。 GPT-4 のスコアは「サブ」で 28% です。

今後の展望

LLM における逆の呪いをどう説明するか?これについては、将来のさらなる研究を待つ必要があるかもしれません。今のところ、研究者は説明の簡単なスケッチしか提供できません。モデルが「A は B である」に基づいて更新されるとき、この勾配更新により、B に関する情報が含まれるように A の表現がわずかに変更されることがあります (たとえば、中間 MLP 層で)。この勾配更新の場合、B の表現を変更して A に関する情報を含めることも合理的です。ただし、勾配の更新は近視眼的であり、必ずしも B に基づいて将来の A を予測するのではなく、A が与えられた場合の B の対数に依存します。

「呪いの逆転」の後、研究者らは、大規模モデルが論理的意味、空間的関係、n 場所の関係など、他のタイプの関係を逆転できるかどうかを調査する予定です。

以上が大規模モデルの致命的な欠陥: 正答率はほぼゼロ、GPT も Llama も影響を受けませんの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。