ニューラルネットワークのスーパーボディ?新しい国立LV研究所が新しいネットワーククローン技術を提案-AI-php.cn

映画では、ヒロインのルーシーの脳力が徐々に発達するにつれて、次の能力を獲得します。

10%: 体の自律神経を制御する能力体の調整と反応速度を向上させるシステムシステム。
30%: 未来を予測し、人々の行動を予測し、洞察力と判断力を向上させる能力。
50%: 周囲の環境の小さな変化を感知して、将来の変化を予測することができます。
70%: 体や物の動きを制御することができ、並外れた運動能力と戦闘能力を持っています。
90%: 宇宙や時間とつながることができ、インスピレーションと直観力を持っています。
100%: 人間の認識の限界を超えた超常的な力を実現することができます。

映画の最後では、ヒロインは徐々に姿を消し、純粋なエネルギーの形に変わり、最終的には宇宙に消え、宇宙と時間と一体になります。人間のスーパーボディの実現は、外の世界と接続して無限の価値を得る能力です。この考え方をニューラルネットワークドメインに移行すると、ネットワーク全体との接続が確立できれば、もネットワーク超体を実現でき、理論的には無制限の予測能力が得られます。

つまり、物理ネットワークは必然的にネットワークパフォーマンスの向上を制限します。ターゲットネットワークが Model Zoo に接続されると、ネットワークにはエンティティがなくなり、ネットワークは存在します。それらの間に接続された超体形態。

神经网络超体？新国立LV lab提出全新网络克隆技术

# 画像上: スーパーボディネットワークとエンティティネットワークの違い。スーパーボディネットワークには実体はなく、ネットワーク間の接続形式ですネットワークのスーパーの考え方-body はこの記事で共有されています CVPR 2023 論文

「Partial Network Cloning」を検討できます。この論文では、シンガポール国立大学LV labが新しいネットワーククローンテクノロジーを提案します。

##リンク: https://arxiv.org/abs/2303.10597 神经网络超体？新国立LV lab提出全新网络克隆技术

01 問題定義この記事で、著者は、このネットワーククローン作成テクノロジを使用してネットワークの非物質化を実現すると、次の利点がもたらされると述べました。

弱いデータ依存性: 一部の接続モジュールを変更するには部分的な修正データのみが必要です

トレーニングの複雑さが低い: 一部の接続モジュールとタスク予測モジュールについては微調整のみが必要です
スーパーボディネットワークの実装基盤は、急速に拡大している Model Zoo であり、多数の事前トレーニング済みモデルが使用可能です。したがって、任意のタスク T について、常に 1 つ以上のモデル

に組み込むことができます。つまり:

(接続用に 3 つのネットワークが選択されています)。

神经网络超体？新国立LV lab提出全新网络克隆技术

#上図に示すように、タスク T に対して、対応する超体ネットワーク M_c を構築するために、この記事では、次の構築フレームワークを提案します:

ステップ 1: オントロジーネットワーク M_t のタスクセット T_t と必要なタスクセット T の交差 T⋂T_t が最大になるように、最適なオントロジーネットワーク M_t を見つけます。オントロジーネットワークはメインネットワークとして設定されます。
##ステップ 2: オントロジーネットワークで不足しているタスクの一部を補うために、修正されたネットワーク M_s^1 および M_s^2 を選択します。
ネットワーククローン作成テクノロジを使用する部分的に修正されたネットワーク M_s^1 および M_s^2 を見つけて、オントロジーネットワーク M_t;# に接続します。## ステップ 4: 補正データの一部を使用して、ネットワークの接続モジュールと予測モジュールを微調整します。

神经网络超体？新国立LV lab提出全新网络克隆技术このうち、M_s は補正ネットワーク集合を表すため、ネットワークスーパーボディの接続形態は、オントロジーネットワークに 1 つまたは複数の補正ネットワークを加えたものになりますネットワーククローニング技術は、必要な部分的な補正ネットワークを複製して埋め込む技術ですそれをオントロジーネットワークに組み込みます。

具体的には、この記事で提案するネットワーククローン作成フレームワークには、次の 2 つの技術的なポイントが含まれています。 P 補正ネットワークを含むクローンの場合、最初の技術的なポイントは、

キーパーツの位置決めローカル (∙)です。補正ネットワークにはタスクセット T に無関係なタスク情報が含まれている可能性があるため、キー部分の位置決め Local (・) は、タスク T⋂T_s に関連する補正ネットワーク内の部分を見つけることを目的としています。位置決めパラメーターは次のように表されます。 M^ρ.実装の詳細はセクション 1 にあり、サブセクション 2.1 に記載されています。 2 番目の技術点は、ネットワークモジュールの埋め込み挿入 (・) です。すべての補正ネットワークを埋め込むためには、適切なネットワーク埋め込みポイント R^ρ を選択する必要があります。実装の詳細はセクション 2.2 に示します。

神经网络超体？新国立LV lab提出全新网络克隆技术 02 手法の概要

ネットワーク複製の手法部分では、説明を簡略化するため、補正ネットワーク数 P=1 とします（したがって、補正ネットワークの上部 (ρ とラベル付け)、つまり、オントロジーネットワークと補正ネットワークを接続して、必要なスーパーボディネットワークを構築します。前述したように、ネットワーククローン作成には、主要部分の位置決めとネットワークモジュールの埋め込みが含まれます。ここでは、理解を助けるために中間転送可能モジュール M_f を紹介します。すなわち、ネットワーククローニング技術は、修正されたネットワーク内の重要な部分を見つけて転送可能モジュールM_fを形成し、その後、ソフト接続を通じて転送可能モジュールをオントロジーネットワークM_tに埋め込む。したがって、

ネットワーククローン作成テクノロジの目標は、移植性とローカル忠実性を備えた移行可能なモジュール

を見つけて埋め込むことです。

2.1 ネットワークの主要部分の特定

# # ネットワークの主要部分を特定する目的は、選択関数 M を学習することです。ここでは、選択関数 M は、ネットワークの各層のフィルターに作用するマスクとして定義されます。このとき移行可能なモジュールは次のように表すことができます。

神经网络超体？新国立LV lab提出全新网络克隆技术

上記の式では、変更されたネットワーク M_s を L 層として表し、各層は次のように表されます。として。既知の移行可能なモジュールを抽出しても、修正ネットワークは変更されません。

適切な転送可能モジュール M_f を取得するために、最終的な予測結果に最も大きく寄与する補正ネットワーク M_s の明示的な部分を見つけます。これに先立って、ニューラルネットワークのブラックボックスの性質と、ネットワークの予測結果の一部のみが必要であることを考慮して、LIME を使用してネットワークを適合および修正し、必要なタスクのローカル部分をモデル化しました (本文を参照)詳細については論文を参照してください)。

ローカルモデリング結果は神经网络超体？新国立LV lab提出全新网络克隆技术で表されます。ここで D_t は、必要な部分予測結果に対応するトレーニングデータセット (元のネットワークのトレーニングセットよりも小さい) です。

したがって、関数 M の選択は、次の目的関数を通じて最適化できます。この式では、ローカリゼーションの主要な部分がローカルにモデル化された G に適合されます。

神经网络超体？新国立LV lab提出全新网络克隆技术

2.2 ネットワークモジュールの埋め込み

修正ネットワーク内で移行可能なモジュール M_f を見つけるときは、選択関数 M を使用します。重みを変更せずに M_s から直接抽出されます。次のステップは、最良のクローン作成パフォーマンスを得るために、オントロジーネットワーク M_t 内のどこに移行可能モジュール M_f を埋め込むかを決定することです。ネットワークモジュールの埋め込みは、位置パラメーター R によって制御されます。ほとんどのモデル再利用設定に従って、ネットワーククローン作成はオントロジーモデルの最初の数層を汎用特徴抽出器として保持し、ネットワーク埋め込みプロセスは最適な埋め込み位置を見つけるように簡素化されます (つまり、転送可能なモジュール M_f を R 番目の層に埋め込みます)。埋め込みを見つけるプロセスは次のように表現できます。

#詳細な式の説明については本文を参照してください。一般に、検索ベースの埋め込みには次の点が含まれます。

神经网络超体？新国立LV lab提出全新网络克隆技术

#最適位置パラメータ R 検索プロセスは、ネットワークの深い層から浅い層まで行われます。

転送可能性モジュールをスーパーボディネットワークのR層に埋め込んだ後、埋め込み位置にアダプターAを追加導入し、 (分類ネットワーク用の) F_c 層を再微調整すると述べました)、しかし、この 2 つのパラメータ量は、モデル動物園全体と比較すると無視できるほどです;

ネットワークのL-1層から0層まで、各微調整の損失収束値に基づいて埋め込み性能を大まかに推定し、最小収束値点を最終的なネットワーク埋め込み点として選択します。
03 ネットワーククローン作成技術の実用化この記事で提案するネットワーククローン作成技術の核心は、事前に学習されたネットワーク間の接続パスを確立することです。事前学習済みネットワークのパラメータを変更することで、ネットワーク超体構築のキーテクノロジーとして利用できるだけでなく、さまざまな実践シナリオにも柔軟に適用できます。
シナリオ 1: ネットワーククローン作成テクノロジにより、Model Zoo をオンラインで使用できるようになります。リソースが限られている場合には、ユーザーは、事前トレーニングされたネットワークをローカルにダウンロードすることなく、オンライン Model Zoo を柔軟に利用できます。

クローンモデルは次によって決定されることに注意してください。M_t と M_s は固定されており、プロセス全体を通じて変更されません。モデルのクローン作成では、事前トレーニングされたモデルに変更が加えられることも、新しいモデルが導入されることもありません。モデルのクローン作成により、Model Zoo の機能を任意に組み合わせることが可能になります。これは、M と R を使用した接続の確立が簡単なマスクと位置決め操作であり、元に戻すのが簡単であるため、Model Zoo の良好な生態環境の維持にも役立ちます。したがって、提案されたネットワーククローン作成技術は、持続可能な Model Zoo オンライン推論プラットフォームの確立をサポートします。

シナリオ 2: ネットワーククローン作成によって生成されたネットワークは、より優れた情報送信モードを備えています。この技術により、ネットワーク伝送時の伝送遅延や損失を軽減できます。

ネットワーク送信する場合は、神经网络超体？新国立LV lab提出全新网络克隆技术セットを送信するだけで、公開模型動物園と組み合わせることで、受信側は元のネットワークに戻すことができます。クローン化されたネットワーク全体と比較すると、は非常に小さいため、伝送遅延を軽減できます。 A と F_c に伝送損失がまだある場合、受信機はデータセットを微調整することで簡単に修正できます。したがって、ネットワーククローン作成は、効率的な伝送のための新しい形式のネットワークを提供します。

04 実験結果

分類タスクについて実験検証を行いました。転送可能なモジュールのローカルなパフォーマンス表現能力を評価するために、条件付き類似性インデックスを導入します。

神经网络超体？新国立LV lab提出全新网络克隆技术

where Sim_cos (・ ) はコサイン類似度を表します。

神经网络超体？新国立LV lab提出全新网络克隆技术

MNIST、CIFAR-10、CIFAR-100、Tiny-ImageNet での実験を上の表に示します。結果から、ネットワーククローン (PNC) によって得られたモデルのパフォーマンス向上が最も顕著であることがわかります。また、ネットワーク全体 (PNC-F) を微調整してもネットワークのパフォーマンスは向上せず、逆にモデルのバイアスが増加します。

神经网络超体？新国立LV lab提出全新网络克隆技术

これに加えて、移行可能なモジュールの品質も評価しました (上記参照)。図 (左) からわかるように、各サブデータセットから学習された各特徴には多かれ少なかれ相関関係があり、修正されたネットワークから局所的な特徴を抽出して位置特定することが重要であることがわかります。転送可能なモジュールについては、類似度 Sim (・) を計算します。図 (右) は、転送可能なモジュールがクローン化されるサブデータセットとの類似性が高く、残りのサブデータセットとの関係が弱まっていることを示しています (対角線以外の領域はマトリックスプロットよりも明るい色でマークされています)ソースネットワークの）。したがって、転送可能なモジュールは複製されるタスクセットのローカルパフォーマンスをうまくシミュレートし、配置戦略の正しさを証明していると結論付けることができます。

05 概要

この文書では、部分ネットワーククローン作成 (PNC) と呼ばれる新しい知識伝達タスクについて研究します。これは、改訂されたネットワークからデータをコピーして貼り付けます。パラメーターモジュールをクローンし、それをオントロジーネットワークに埋め込みます。以前の知識伝達セットアップ (ネットワークのパラメーターの更新に依存する) とは異なり、私たちのアプローチでは、すべての事前トレーニングされたモデルのパラメーターが変更されないことが保証されます。 PNC の中核テクノロジーは、ネットワークの主要部分の位置を特定し、取り外し可能なモジュールを組み込むことを同時に行うことであり、この 2 つのステップは相互に強化します。

私たちは、複数のデータセットの精度と伝達可能性のメトリクスに関して、この方法の優れた結果を実証しました。

以上がニューラルネットワークのスーパーボディ?新しい国立LV研究所が新しいネットワーククローン技術を提案の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。