レコメンデーション システムは、ユーザーの個人的な好みに基づいてカスタマイズされたレコメンデーションを提供するため、情報過多の課題に対処するために重要です。近年、深層学習テクノロジーにより、レコメンデーション システムの開発が大幅に促進され、ユーザーの行動や好みに関する洞察が向上しました。
しかし、従来の教師あり学習手法は、データの疎性の問題により、実際のアプリケーションでは課題に直面しており、ユーザーのパフォーマンスを効果的に学習する能力が制限されています。
この問題を保護し、克服するために、自己教師あり学習 (SSL) テクノロジーが生徒に適用されます。このテクノロジーは、データの固有の構造を使用して監視信号を生成し、ラベル付きデータに完全には依存しません。
この方法では、ラベルのないデータから意味のある情報を抽出し、データが不足している場合でも正確な予測と推奨を行うことができる推奨システムを使用します。
記事アドレス: https://arxiv.org/abs/2404.03354
オープンソースデータベース: https://github.com/HKUDS/Awesome-SSLRec-Papers
オープンソースコード ライブラリ: https://github.com/HKUDS/SSLRec
この記事では、レコメンダー システム用に設計された自己教師あり学習フレームワークをレビューし、170 以上の関連論文の詳細な分析を実施します。私たちは、SSL がさまざまなシナリオでレコメンデーション システムをどのように強化できるかを包括的に理解するために、9 つの異なるアプリケーション シナリオを調査しました。
各ドメインについて、対照学習、生成学習、敵対的学習など、さまざまな自己教師あり学習パラダイムについて詳しく説明し、SSL がさまざまな状況でレコメンデーション システムのパフォーマンスをどのように向上できるかを示します。
レコメンダー システムに関する研究では、協調フィルタリング、シーケンス推奨、複数動作推奨など、さまざまなシナリオのさまざまなタスクをカバーしています。これらのタスクには、さまざまなデータ パラダイムと目標があります。ここでは、さまざまなレコメンデーション タスクの具体的なバリエーションには触れずに、まず一般的な定義を示します。レコメンデーション システムには、 で示されるユーザー セットと で示されるアイテム セットの 2 つの主要なセットがあります。
次に、インタラクション行列 を使用して、ユーザーとアイテムの間の記録されたインタラクションを表します。この行列では、ユーザー ui が項目 vj と対話した場合、行列のエントリ Ai,j には値 1 が割り当てられ、それ以外の場合は 0 が割り当てられます。
インタラクションの定義は、さまざまなコンテキストやデータセット (映画の視聴、電子商取引サイトのクリック、購入など) に適応させることができます。
さらに、さまざまな推奨タスクには、対応する関係として記録されるさまざまな補助観察データがあります。
そして、ソーシャルレコメンデーションでは、X には友情などのユーザーレベルの関係が含まれます。上記の定義に基づいて、推奨モデルは、任意のユーザー u とアイテム v の間の嗜好スコアを正確に推定することを目的として、予測関数 f(⋅) を最適化します。
嗜好スコア yu,v は、ユーザー u とitem v 相互作用の可能性。
このスコアに基づいて、レコメンダー システムは、推定された嗜好スコアに基づいてアイテムのランク付けされたリストを提供することにより、インタラクションされていないアイテムを各ユーザーに推奨できます。このレビューでは、さまざまな推奨シナリオにおける (A,X) のデータ形式と、その中での自己教師あり学習の役割をさらに調査します。
ここ数年、ディープ ニューラル ネットワークは教師あり学習で優れたパフォーマンスを発揮し、コンピューター ビジョン、自然言語処理、レコメンデーション システムなどのさまざまな分野に反映されています。ただし、ラベル付きデータへの依存度が高いため、教師あり学習はラベルのスパース性への対処という課題に直面しており、これはレコメンダー システムでよく見られる問題でもあります。
この制限に対処するために、データ自体を学習ラベルとして利用する自己教師あり学習が有望な方法として登場しました。レコメンダー システムにおける自己教師あり学習には、対照学習、生成学習、敵対的学習という 3 つの異なるパラダイムが含まれます。
優れた自己教師あり学習方法である対照学習の主な目標は、データから強化されたさまざまなビュー間の一貫性を最大化することです。レコメンデーション システムの対比学習では、次の損失関数を最小限に抑えることが目標です:
E∗∘ω∗ は対比ビュー作成操作を表し、対比学習に基づくさまざまなレコメンデーション アルゴリズム作成プロセスが異なります。各ビューの構築は、データ拡張プロセス ω∗ (拡張グラフ内のノード/エッジが含まれる場合があります) と埋め込みエンコード プロセス E∗ で構成されます。
を最小化するの目標は、ビュー間の一貫性を最大化する堅牢なエンコード関数を取得することです。ビュー間のこの一貫性は、相互情報の最大化やインスタンスの識別などの方法によって実現できます。
生成学習の目標は、データの構造とパターンを理解して意味のある表現を学習することです。欠落または破損した入力データを再構築するディープ エンコーダー デコーダー モデルを最適化します。
エンコーダー は入力から潜在表現を作成し、デコーダー はエンコーダー出力から元のデータを再構築します。目標は、次のように、再構成されたデータと元のデータの差を最小限に抑えることです:
ここで、 ω はマスキングや摂動などの操作を表します。 D∘E は、出力を再構築するためのエンコードおよびデコードのプロセスを表します。最近の研究では、エンコーダとデコーダをセットアップせずにデータを効率的に再構築するデコーダのみのアーキテクチャも導入されました。このアプローチは、再構成に単一のモデル (Transformer など) を使用し、通常、生成学習に基づいてシリアル化された推奨事項に適用されます。損失関数 の形式は、連続データの平均二乗誤差やカテゴリデータのクロスエントロピー損失などのデータ型によって異なります。
敵対的学習は、ジェネレーター G(⋅) を使用して高品質の出力を生成し、識別子 Ω(⋅) を含むトレーニング方法です。本物か生成されたものです。生成学習とは異なり、敵対的学習は、ディスクリミネーターをだますために高品質の出力を生成するジェネレーターの能力を向上させるために競合的相互作用を使用するディスクリミネーターを含む点で異なります。
したがって、敵対的学習の学習目標は次のように定義できます:
ここで、変数 x は基礎となるデータ分布から取得された実際のサンプルを表し、 はジェネレーター G(⋅) によって生成された合成サンプルを表します。トレーニング中に、ジェネレーターとディスクリミネーターの両方が競争的な相互作用を通じて能力を向上させます。最終的に、ジェネレーターは下流のタスクに有益な高品質の出力を生成するよう努めます。
このセクションでは、推奨システムにおける自己教師あり学習の応用のための包括的な分類システムを提案します。前述したように、自己教師あり学習パラダイムは、対照学習、生成学習、敵対学習の 3 つのカテゴリに分類できます。したがって、私たちの分類システムはこれら 3 つのカテゴリに基づいて構築されており、各カテゴリについてより深い洞察を提供します。
対照学習 (CL) の基本原理は、異なるビュー間の一貫性を最大化することです。したがって、対比学習を適用する際に考慮すべき 3 つの主要なコンポーネント (ビューの作成、一貫性を最大化するためのビューのペアリング、および一貫性の最適化) で構成されるビュー中心の分類法を提案します。
ビューの作成。 モデルが焦点を当てているさまざまなデータの側面を強調するビューを作成します。グローバルな協調情報を組み合わせてグローバルな関係を処理するレコメンデーション システムの能力を向上させたり、ランダム ノイズを導入してモデルの堅牢性を強化したりできます。
入力データ (グラフ、シーケンス、入力特徴など) の強化はデータレベルのビューの作成と見なされますが、推論中の潜在特徴の強化は特徴レベルのビューの作成と見なされます。我々は、基本データレベルからニューラルモデルレベルまでのビュー作成手法を含む階層分類システムを提案します。
ペアサンプリング。 ビュー作成プロセスでは、データ内のサンプルごとに少なくとも 2 つの異なるビューが生成されます。対照学習の核心は、他のビューを遠ざけながら、特定のビューの調整を最大化する (つまり、それらを近づける) ことです。
これを行うために重要なのは、近づけるべき肯定的なサンプルのペアを特定し、否定的なサンプルのペアを形成する他のビューを特定することです。この戦略はペア サンプリングと呼ばれ、主に 2 つのペア サンプリング方法で構成されます:
対照的な目標。 対照学習の学習目標は、陽性サンプルのペア間の相互情報を最大化することであり、これにより学習推奨モデルのパフォーマンスを向上させることができます。相互情報量を直接計算することは現実的ではないため、通常、対照学習では実現可能な下限が学習目標として使用されます。ただし、ポジティブペアを近づけるという明確な目標もあります。
生成自己教師あり学習では、主な目標は実際のデータ分布の尤度推定を最大化することです。これにより、学習された意味のある表現でデータ内の基礎となる構造とパターンをキャプチャできるようになり、下流のタスクで使用できるようになります。私たちの分類システムでは、さまざまな生成学習ベースの推奨方法を区別するために、生成学習パラダイムと生成目標という 2 つの側面を考慮します。
生成学習パラダイム。 推奨の文脈では、生成学習を使用した自己教師あり手法は 3 つのパラダイムに分類できます:
世代ターゲット。 生成学習では、どのデータのパターンが生成されたラベルとしてみなされるかは、意味のある補助的な自己教師あり信号をもたらすために考慮する必要があるもう 1 つの問題です。一般に、生成目標は方法や推奨シナリオによって異なります。たとえば、シーケンスの推奨では、シーケンス内のアイテム間の関係をシミュレートすることを目的として、シーケンス内のアイテムを生成ターゲットにすることができます。インタラクティブなグラフ推奨では、グラフ内の高レベルのトポロジー相関を取得することを目的として、生成ターゲットをグラフ内のノード/エッジにすることができます。
レコメンダーシステムの敵対的学習において、弁別器は、生成された偽サンプルを本物のサンプルから区別する上で重要な役割を果たします。生成学習と同様に、私たちが提案する分類システムは、学習パラダイムと識別目標:
敵対的学習パラダイムの 2 つの観点からレコメンダー システムにおける敵対的学習方法をカバーします。 レコメンダー システムでは、識別器の識別損失を微分可能な方法で生成器に逆伝播できるかどうかに応じて、敵対的学習は 2 つの異なるパラダイムで構成されます。
差別の対象。 異なる推奨アルゴリズムにより、ジェネレーターは異なる入力を生成し、それが識別のためにディスクリミネーターに供給されます。このプロセスは、現実に近い高品質のコンテンツを生成するジェネレーターの能力を強化することを目的としています。特定の識別目標は、特定の推奨タスクに基づいて設計されます。
このレビューでは、9 つの異なる推奨シナリオからのさまざまな自己教師あり学習方法の設計について詳しく説明します。これらの 9 つの推奨シナリオは次のとおりです。詳細については記事をお読みください):
この記事では、170 を超える論文の詳細な分析を用いて、レコメンデーション システムにおける自己教師あり学習 (SSL) の応用についての包括的なレビューを提供します。この記事では、9 つの推奨シナリオをカバーする自己教師あり分類システムを提案し、対照学習、生成学習、敵対学習の 3 つの SSL パラダイムについて詳細に説明し、将来の研究の方向性について説明しました。
私たちは、データ疎性の処理とレコメンデーション システムのパフォーマンス向上における SSL の重要性を強調し、大規模な言語モデルをレコメンデーション システム、適応型動的レコメンデーション環境に統合し、SSL パラダイムの理論的基盤を確立する可能性を指摘します。 . 研究の方向性。このレビューが研究者に貴重なリソースを提供し、新しい研究アイデアを刺激し、推奨システムのさらなる開発を促進することを願っています。
以上が170 の「自己教師あり学習」推奨アルゴリズムをレビューし、HKU が SSL4Rec をリリース: コードとデータベースは完全にオープンソースです。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。