コンテキスト学習の背後にある数学
最新の大手言語モデル(LLMS)の重要な機能である
コンテキスト学習(ICL)は、入力プロンプト内の例に基づいてトランスを適応させることができます。 いくつかのショットプロンプトは、いくつかのタスクの例を使用して、望ましい動作を効果的に実証します。 しかし、トランスフォーマーはこの適応をどのように達成しますか?この記事では、ICLの背後にある潜在的なメカニズムについて説明します
に新しいクエリ(x)をマッピングできます。
SoftMaxの注意と最近隣の検索SoftMaxの注意式は
です
c は、注意割り当てを変更します:
cが無限に近づくにつれて、注意は1ホットのベクトルになり、最も類似したトークンのみに焦点を当てます。 有限cでは、注意はガウスカーネルの平滑化に似ています。 これは、ICLが入出力ペアに最も近い隣接アルゴリズムを実装する可能性があることを示唆しています。 意味とさらなる研究
トランスがどのように学習するかを理解する(最近隣人のように)Automlのドアを開く。 Hollmann et al。合成データセットで変圧器をトレーニングして、Automlパイプライン全体を学習し、1回のパスで新しいデータから最適なモデルとハイパーパラメータを予測しました。
Anthropicの2022年の研究は、メカニズムとして「誘導ヘッド」を示唆しています。 これらの注意ヘッドのペアコピーと完全なパターン。たとえば、「... a、b ... a」を与えられた場合、彼らは以前のコンテキストに基づいて「b」を予測します。最近の研究(Garg etal。2022、Oswald etal。2023)は、変圧器のICLを勾配降下にリンクします。 SoftMax操作を省略する線形注意:
は、前処理された勾配降下(PGD)に似ています:
線形注意の1つの層が1つのPGDステップを実行します。
結論
注意メカニズムは、学習アルゴリズムを実装し、デモンストレーションペアから学習することでICLを有効にすることができます。複数の注意層とMLPの相互作用は複雑ですが、研究はICLのメカニズムに光を当てています。この記事では、これらの洞察の高レベルの概要を説明しています
さらなる読み取り:
- コンテキスト内学習および誘導ヘッド
- 変圧器はコンテキスト内を何を学ぶことができますか?単純な関数クラスのケーススタディ
- トランスは、勾配降下によってコンテキスト内を学習します
- トランスフォーマーは、コンテキスト内学習のために前処理された勾配降下を実装することを学びます
謝辞
この記事は、ミシガン大学での2024年秋の卒業生授業に触発されています。 エラーは著者のみです
以上がコンテキスト学習の背後にある数学の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undress AI Tool
脱衣画像を無料で

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

しかし、おそらく1つを見るのに10年も待つ必要はありません。実際、本当に有用で人間のような機械の最初の波と考えられるものは、すでにここにあります。 近年、多くのプロトタイプと生産モデルがTから抜け出しています

科学者は、システムをバイパスするための賢いが驚くべき方法を発見しました。 2025年7月は、研究者がアカデミックな提出物に目に見えない指示を挿入した精巧な戦略の発見をマークしました。これらの秘密の指示は尾でした

国連は、AIがどのように進んでいるか、どのような種類の国際的な多国間の取り決めとコラボレーションが行われるべきかについて継続的な関心を持っていることに注意してください(こちらのリンクで私の報道を参照)。 tの特徴的な要素

テクノロジーセクターの激しいライバル関係は、AIが雇用にどのように影響するかについて分裂しました。企業はエリートAIのスペシャリストに贅沢な給与パッケージを提供していますが、業界全体に広範な求人削減が続いています。影響を受ける役割は、伝統を超えています

Vibe Codingから実行可能なCodekiroのデビューまで、ソフトウェア業界が「Vibe Coding」の急増を目撃しているときに来ます。これは、開発者が自然言語プロンプトを使用して機能的なアプリケーションを迅速に作成する技術です。多くの開発者はa

Openaiが1,000万ドルを超える新しいAIコンサルティングサービスの発売は、重要な実現を強調しています。2025年には、AIの実質価値はモデルへのアクセスだけでなく、それらをどのように効果的に展開できるかということです。このアプローチは、パランを密接に反映しています

オープンソースCLIツールは、開発者とAIコミュニティに多くの興奮を生み出しました。 ClaudeのCodex CLI、OpenaiのCodex CLIのリリース、そして最近ではGoogleのGemini CLIのリリースで、突然あります

CloudFlareのCEOであるMatthew PrinceのNow-Viral Button Pressは、出版社やコンテンツクリエイターと定住する人工知能会社への直接的な挑戦でした。このアクションは、AIクローラーのデフォルト設定を設定し、データを「いいえ」に削ります。
