GPTから始まったIn-Context Learningの開発状況はどうなっているのでしょうか？このレビューで明らかになりました-AI-php.cn

GPTから始まったIn-Context Learningの開発状況はどうなっているのでしょうか？このレビューで明らかになりました

PHPz

リリース： 2023-04-11 17:10:03

転載

951 人が閲覧しました

言語モデルとコーパスのサイズが徐々に拡大するにつれて、大規模言語モデル (LLM) の可能性がさらに高まります。最近のいくつかの研究では、LLM がコンテキスト内学習 (ICL) を使用して、数学的推論の問題を解決するなど、さまざまな複雑なタスクを実行できることが示されています。

北京大学、上海 AI 研究所、カリフォルニア大学サンタバーバラ校の 10 人の研究者が最近、ICL 研究の現在の進捗状況を詳細にまとめた、インコンテキスト学習に関する総説論文を発表しました。

GPTから始まったIn-Context Learningの開発状況はどうなっているのでしょうか？このレビューで明らかになりました

#論文アドレス: https://arxiv.org/pdf/2301.00234v1.pdf

インコンテキスト学習の中心的な考え方は類推学習です。次の図は、言語モデルが意思決定を行うために ICL をどのように使用するかを示しています。

GPTから始まったIn-Context Learningの開発状況はどうなっているのでしょうか？このレビューで明らかになりました

まず、ICL ではデモンストレーションコンテキストを形成するためにいくつかの例が必要であり、これらの例は通常、自然言語テンプレートで記述されます。次に、ICL はクエリの質問をプレゼンテーションコンテキストに関連付けてプロンプトを形成し、それを予測用の言語モデルにフィードします。逆勾配を使用してモデルパラメーターを更新する必要がある教師あり学習のトレーニングフェーズとは異なり、ICL ではパラメーターの更新が必要ないため、事前トレーニングされた言語モデルが予測タスクを直接実行でき、モデルはデモンストレーションで隠れたパターンを学習することが期待されます。例を確認し、それに基づいて意思決定を行うことで、正しい予測を行うことができます。

新しいパラダイムとして、ICL には多くの魅力的な利点があります。まず、デモの例は自然言語形式で書かれており、大規模な言語モデルに関連する解釈可能なインターフェイスを提供します。このパラダイムにより、デモンストレーションの例やテンプレートを変更することで、人間の知識を言語モデルに組み込むことが容易になります (Liu et al., 2022; Lu et al., 2022; Wu et al., 2022; Wei et al., 2022c)。第二に、コンテキスト内学習は、類推による人間の学習の意思決定プロセスに似ています。第三に、教師ありトレーニングと比較して、ICL はトレーニング不要の学習フレームワークです。これにより、モデルを新しいタスクに適応させるための計算コストが大幅に削減されるだけでなく、サービスとしての言語モデル (LMaaS、Sun et al.、2022) が可能になり、大規模な現実世界のタスクに簡単に適用できるようになります。

ICL には大きな期待があるにもかかわらず、そのパフォーマンスを含め、検討する価値のある問題がまだ多くあります。たとえば、元の GPT-3 モデルには特定の ICL 機能がありますが、一部の研究では、この機能は事前トレーニング中の適応によって大幅に向上できることがわかっています。さらに、ICL のパフォーマンスは、プロンプトテンプレート、状況に応じたサンプルの選択、サンプルの順序などの特定の設定に影響されます。また、ICLの作用メカニズムは合理的であるように見えますが、まだ十分に明らかではなく、その作用メカニズムを事前に説明できる研究は多くありません。

このレビューペーパーでは、ICL の強力なパフォーマンスは次の 2 つの段階に依存していると結論付けています。

大規模な言語モデルの ICL 機能を育成するトレーニングフェーズ;
大規模な言語モデルが特定のタスクのデモンストレーションに基づいて予測を行う推論フェーズ。

トレーニングフェーズでは、言語モデルは、左から右への生成などの言語モデリングの目標に従って直接トレーニングされます。これらのモデルは特にコンテキスト内学習用に最適化されていませんが、ICL の機能は依然として驚くべきものです。既存の ICL 研究は基本的に、よく訓練された言語モデルに基づいています。

推論段階では、入力ラベルと出力ラベルが解釈可能な自然言語テンプレートで表されるため、ICL のパフォーマンスを複数の観点から最適化できます。このレビューペーパーでは、詳細な説明と比較を提供し、デモンストレーションに適切な例を選択し、さまざまなタスクに対する特定のスコアリング方法を設計します。

このレビューペーパーの一般的な内容と構造を以下の図に示します。これには、ICL の正式な定義 (§3)、ウォームアップ方法 (§4)、プロンプト設計戦略 ( §5 ) およびスコアリング関数 (§6)。

GPTから始まったIn-Context Learningの開発状況はどうなっているのでしょうか？このレビューで明らかになりました

さらに、§7 では、ICL の背後にある仕組みを解明するという現在の取り組みについての洞察が得られます。さらに、§8 では、ICL に関する有用な評価とリソースが提供され、§9 では、ICL の有効性を実証する潜在的な応用シナリオが紹介されています。最後に、§10 では、ICL 分野の既存の課題と潜在的な方向性を要約し、この分野のさらなる発展のための参考資料を提供します。

興味のある読者は、論文の原文を読んで研究の詳細を学ぶことができます。

以上がGPTから始まったIn-Context Learningの開発状況はどうなっているのでしょうか？このレビューで明らかになりましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。