ホームページ テクノロジー周辺機器 AI 因果言語モデリングを超えて

因果言語モデリングを超えて

Feb 25, 2025 pm 06:28 PM

ニューリップス2024スポットライト:選択的言語モデリング(SLM)

を使用した言語モデルの事前化の最適化

最近、私はNeurips 2024の魅力的な論文を紹介しました「すべてのトークンがあなたが事前トレーニングに必要なものではありません」地元の読書グループで。 このペーパーは、驚くほどシンプルでありながら影響力のある質問に取り組んでいます。次のトークン予測は、言語モデルの事前化中のすべてのトークンに必要ですか? 標準的なアプローチには、大規模なWebスクレイプデータセットと因果言語モデリング(CLM)を普遍的に適用することが含まれます。 この論文は、その仮定に挑戦し、一部のトークンが学習プロセスを助けるのではなく妨害することを提案しています。 著者は、「有用な」トークンにトレーニングを集中することで、データの効率とダウンストリームタスクのパフォーマンスが大幅に向上することを実証しています。 この投稿は、彼らの核となるアイデアと重要な実験的調査結果を要約しています。

問題:ノイズと非効率的な学習

大規模なWebコーパスには必然的にノイズが含まれています。ドキュメントレベルのフィルタリングが役立ちますが、ノイズは個々のドキュメント内にあることがよくあります。 これらの騒々しいトークンは計算リソースを無駄にし、潜在的にモデルを混乱させる。 著者は、トークンレベルの学習ダイナミクスを分析し、エントロピー損失の軌跡に基づいてトークンを分類しました:

l→l(低から低い):

すぐに学習し、最小限の利益を提供します。
  • h→l(高から低い):最初は困難ですが、最終的には学習しました。貴重な学習の機会を表す。
  • H→H→H(高から高):一貫して難しいことがよくあります。
  • l→h(低から高):
  • 最初に学習しましたが、後で問題になります。 彼らの分析により、トークンのほんの一部のみが意味のある学習信号を提供することが明らかになりました。
  • ソリューション:選択言語モデリング(SLM)
  • 提案されたソリューションであるSelective Language Modeling(SLM)は、よりターゲットを絞ったアプローチを提供します:

参照モデル(RM)トレーニング:

データの高品質のサブセットを使用して、事前に訓練されたベースモデルを微調整し、参照モデル(RM)を作成します。このRMは、トークン「有用性」のベンチマークとして機能します

Beyond Causal Language Modeling

    過剰損失計算:
  1. 大きなコーパスの各トークンについて、RMの損失と現在のトレーニングモデルの損失(「過剰損失」)の違いが計算されます。 過剰損失が高いほど、改善の可能性が高いことが示されます

    選択的バックプロパゲーション:
  2. フルフォワードパスはすべてのトークンで実行されますが、バックプロパゲーションは、最高の損失を伴うトークンの上部
  3. k%

    でのみ発生します。これは、最も価値のあるトークンにトレーニングを動的に焦点を当てています。

実験結果:有意な利益 SLMは、さまざまな実験にわたって重要な利点を示しています

Beyond Causal Language Modeling

    Math Domain:On 一般的なドメイン:強力な事前訓練を受けたベースモデルがあっても、SLMは、特にコードや数学などの挑戦的なドメインで、15のベンチマークで約5.8%の平均改善をもたらしました。
  • 自己参照:生のコーパスから迅速に訓練されたRMでさえ、2〜3%の精度ブーストと使用されるトークンの30〜40%の減少を提供しました。

  • 結論と将来の仕事

    このホワイトペーパーでは、トークンレベルの学習ダイナミクスに関する貴重な洞察を提供し、言語モデルの事前化を最適化するための非常に効果的な手法であるSLMを紹介します。 将来の研究の方向性には、SLMのスケーリング、APIベースの参照モデルの調査、補強学習の統合、複数の参照モデルの使用、SLMの安全性と真実性の考慮事項が含まれます。 この作業は、効率的かつ効果的な言語モデルトレーニングの大幅な進歩を表しています。

以上が因果言語モデリングを超えての詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ホットトピック

イーロン・マスクの自動運転テスラの嘘はついに彼に追いついています イーロン・マスクの自動運転テスラの嘘はついに彼に追いついています Aug 21, 2025 pm 04:51 PM

9年前、イーロンマスクは記者の前に立っていて、テスラが完全な自動運転能力に必要な完全なハードウェアをすべての新しい電気自動車に装備しています。

ブラウザはエージェントAIの将来の鍵ですか?オペラ、困惑はそう思う ブラウザはエージェントAIの将来の鍵ですか?オペラ、困惑はそう思う Aug 17, 2025 pm 03:45 PM

Webブラウザを取得することを決定したのはなぜですか?答えは地平線上の根本的な変化にあるかもしれません:エージェントAIインターネットの台頭 - そしてブラウザはその中心にある可能性があります。

EUの自然のクレジットは、市場主導の向社会的AIへの道を示しています EUの自然のクレジットは、市場主導の向社会的AIへの道を示しています Aug 02, 2025 am 11:21 AM

EU Nature Creditsフレームワークの理解欧州連合の自然クレジットイニシアチブは、積極的に復元および保存に従事する個人やグループを認識し、報酬を与えるように設計された定量化可能な生物多様性ユニットのシステムを導入します

より包括的なAIタレントパイプラインを構築するためのtorqとai4allパートナー より包括的なAIタレントパイプラインを構築するためのtorqとai4allパートナー Aug 01, 2025 am 11:21 AM

今週、私はTorqの最高人材責任者であるKarin Ophir Zimetと、AI4allのCEOであるTess Posnerと共同の努力とその背後にある変革的目標について話しました。

あなたが言うようにあなたは完璧です生成的ai あなたが言うようにあなたは完璧です生成的ai Aug 03, 2025 am 11:15 AM

全体として、「あなたはあなたと同じように完璧です」という自我を高めるラインは、現代のAIが、過剰な賞賛を聞きたいユーザーに効果的に噴出するように準備されているという告知的なマントラになりました。 それについて話しましょう。 のこの分析

AIエージェントタイプ - およびメモリ AIエージェントタイプ - およびメモリ Aug 17, 2025 pm 06:27 PM

AIエージェントに関する会話が企業と個人の間で進化し続けるにつれて、1つの中心的なテーマが際立っています。すべてのAIエージェントが平等に作成されるわけではありません。基本的なルール駆動型のシステムから、高度に高度な適応モデルまで、幅広いスペクトルがあります

AIとミニオルガンが動物の検査薬をどのように置き換えることができるか AIとミニオルガンが動物の検査薬をどのように置き換えることができるか Aug 01, 2025 am 11:23 AM

また、医薬品試験の将来の中心であり、いつかラボ動物を廃止することができます。1937年には、動物実験は法的要件であり、100日以上を引き起こした汚染された抗生物質を含む致命的な事件によって促されました。

超インテリジェントAIへの恐怖はハーバード大学とMITの学生を脱落させています 超インテリジェントAIへの恐怖はハーバード大学とMITの学生を脱落させています Aug 07, 2025 am 11:39 AM

今、彼女は、「人工的な一般情報」の到着(無数のドメインで人間のパフォーマンスを一致させる、またはそれを超えることができるAIの到着)がCIの崩壊につながる可能性があるという恐怖にとらわれて、永続的な休暇を取っています。

See all articles