TRIBE はドメイン適応の堅牢性を実現し、複数の現実のシナリオで SOTA の AAAII 2024 に到達します。-AI-php.cn

テスト時適応の目的は、推論フェーズでソースドメインモデルをテストデータに適応させることであり、未知の画像損傷フィールドへの適応において優れた結果を達成しました。ただし、現在の手法の多くは、現実のシナリオにおけるテストデータフローを考慮していません。たとえば、次のようになります。

テストデータフローは、時間変動する分布 (従来のドメイン適応における固定分布ではなく)
テストデータストリームには、(完全に独立した同一に分布したサンプリングではなく) ローカルクラス相関がある可能性があります
テストデータストリームでは、長期間にわたって依然として世界的なカテゴリの不均衡が示されています

#最近、中国南部ではA* 工科大学 STAR チームと CUHK-Shenzhen チームは、これらの実際のシナリオでのデータフローのテストが既存の手法に大きな課題をもたらすことを、多数の実験を通じて証明しました。研究チームは、最先端の手法の失敗は、まず不均衡なテストデータに基づいて正規化層を無差別に調整することが原因であると考えています。

この目的を達成するために、研究チームは

従来の推論フェーズのバッチ正規化層を置き換える革新的なBalanced BatchNorm層(Balanced BatchNorm層)を提案しました。同時に、未知のテストデータストリームでの学習を自己トレーニング (ST) のみに依存すると、過剰適応 (疑似ラベルカテゴリの不均衡、ターゲットドメインが固定ドメインではない) につながりやすく、その結果、パフォーマンスが低下する可能性があることがわかりました。変化するドメインでのパフォーマンス。

したがって、チームは

アンカー損失 (アンカー損失) を通じてモデル更新を正規化することを推奨しますこれにより、継続的なドメイン転送の下での自立性が向上しますトレーニングは大幅に役立ちますモデルの堅牢性が向上します。最終的に、モデル TRIBE は 4 つのデータセットと複数の実世界テストデータストリーム設定の下で安定して最先端のパフォーマンスを達成し、既存の高度な手法を大幅に上回りました。研究論文がAAAI 2024に採択されました。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

論文リンク: https://arxiv.org/abs/2309.14949

コードリンク: https://github.com/Gorilla-Lab- SCUT/TRIBE

はじめに

ディープニューラルネットワークの成功は、トレーニングされたモデルをテストドメインの想定に合わせて一般化するかどうかにかかっています。。ただし、実際のアプリケーションでは、異なる照明条件や悪天候によって引き起こされる視覚的な損傷など、配布外のテストデータの堅牢性が懸念されます。最近の研究では、このデータ損失が事前トレーニングされたモデルのパフォーマンスに重大な影響を与える可能性があることが示されています。重要なのは、テストデータの破損 (配布) は不明なことが多く、展開前には予測できない場合もあります。

したがって、推論段階でテストデータの分布に適応するように事前トレーニングされたモデルを調整することは、価値のある新しいトピック、つまりテスト時ドメイン適応 (TTA) です。これまで、TTA は主に分布調整 (TTAC、TTT)、自己教師ありトレーニング (AdaContrast)、および自己トレーニング (Conjugate PL) を通じて実装されていました。これにより、さまざまな視覚的損傷テストデータに大幅かつ堅牢な改善がもたらされました。

既存のテスト時ドメイン適応 (TTA) 方法は、通常、安定したクラス分布、サンプルが独立した同一分布のサンプリングに従う、固定ドメインオフセットなど、いくつかの厳密なテストデータの仮定に基づいています。これらの仮定に触発されて、多くの研究者が CoTTA、NOTE、SAR、RoTTA などの現実世界のテストデータフローを調査するようになりました。

最近、SAR (ICLR 2023) や RoTTA (CVPR 2023) などの現実世界の TTA に関する研究は、ローカルクラスの不均衡と TTA への継続的なドメインシフトによってもたらされる課題に主に焦点を当ててきました。ローカルクラスの不均衡は、通常、テストデータが独立して同じように分散してサンプリングされていないという事実から生じます。直接的に無差別にドメインを適応させると、偏った分布推定が行われます。

最近の研究では、この課題を解決するために、指数関数的に更新されるバッチ正規化統計 (RoTTA) またはインスタンスレベルの識別更新バッチ正規化統計 (NOTE) が提案されています。研究の目標は、テストデータの全体的な分布が著しく不均衡である可能性があり、クラスの分布も時間の経過とともに変化する可能性があることを考慮して、ローカルクラスの不均衡という課題を克服することです。より困難なシナリオの図を以下の図 1 に示します。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

テストデータ内のクラスの蔓延は推論段階の前には不明であり、ブラインドテスト時間の調整によってモデルが多数派のクラスに偏る可能性があるため、既存の TTA メソッドは無効になります。経験的観察に基づくと、この問題は、正規化層 (BN、PL、TENT、CoTTA など) を更新するためのグローバル統計を推定するために現在のデータバッチに依存する方法で特に顕著になります。

これは主に:

1. 現在のデータバッチはローカルカテゴリの不均衡の影響を受け、全体的な分布推定に偏りが生じます。

2. グローバルクラスの不均衡を伴うテストデータ全体から単一のグローバル分布を推定するグローバル分布は容易に多数派クラスに偏り、内部共変量シフトが発生する可能性があります。

偏ったバッチ正規化 (BN) を回避するために、チームはバランスの取れたバッチ正規化レイヤー (バランスバッチ正規化レイヤー) を提案しました。モデル化され、クラス分布からグローバル分布が抽出されます。バランスの取れたバッチ正規化レイヤーにより、ローカルおよびグローバルにクラス不均衡なテストデータストリームの下で、クラスバランスのとれた分布推定値を取得できます。

ドメインのシフトは、照明や気象条件の段階的な変化など、時間の経過とともに現実世界のテストデータで頻繁に発生します。これは、既存の TTA 方法に別の課題をもたらします。ドメイン A への過剰適応により、ドメイン A からドメイン B に切り替えるときに TTA モデルが矛盾する可能性があります。

特定の短期領域への過剰適応を軽減するために、CoTTA はパラメータをランダムに復元し、EATA はフィッシャー情報を使用してパラメータを正規化します。それにもかかわらず、これらの方法は、テストデータの分野で新たに生じている課題にまだ明示的に対処していません。

この記事では、2 ブランチ自己トレーニングアーキテクチャに基づいた 3 ネットワーク自己トレーニングモデル (Tri-Net Self-Training) を形成するためのアンカーネットワーク (Anchor Network) を紹介します。アンカーネットワークは凍結されたソースモデルですが、テストサンプルを介してバッチ正規化レイヤーのパラメーターではなく統計を調整できます。また、アンカリング損失は、アンカーネットワークの出力を使用して教師モデルの出力を正規化し、ネットワークが局所的な分布に過剰に適応するのを避けるために提案されています。

最終モデルは、3 ネットセルフトレーニングモデルとバランスのとれたバッチ正規化レイヤー (BalancEd 正規化を備えた TRI-ネットセルフトレーニング、TRIBE) を組み合わせて、調整可能な学習率のより広い範囲で良好なパフォーマンスを発揮します。優れた性能。これは、4 つのデータセットと複数の実世界のデータストリームの下で大幅なパフォーマンスの向上を示し、独自の安定性と堅牢性を示しています。

#メソッドの紹介

##ペーパーメソッドは 3 つの部分に分かれています:

実世界における TTA プロトコルの紹介;
バランスのとれたバッチ正規化;
3 つのネットワークの自己学習モデル。

#現実世界の TTA プロトコル

##著者は数学的確率モデルを使用して、ローカルクラスの不均衡とグローバルクラスの不均衡、および時間の経過とともに変化するドメイン分布を含む現実世界のテストデータフローをモデル化します。以下の図 2 に示すように。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA #バランスバッチ正規化

BN の不均衡なテストデータを修正するには統計によって生成されるバイアスを推定するために、著者はバランスの取れたバッチ正規化層を提案します。これは、次のように表現される各セマンティッククラスの統計のペアを維持します。

カテゴリ統計を更新するには、著者は、以下に示すように、擬似ラベル予測を利用して効率的な反復更新方法を適用します。

疑似ラベルを使用してデータの各カテゴリのサンプリングポイントを個別にカウントし、次の式を使用してカテゴリバランスの下で全体の分布統計を再取得し、ソースを揃えます。カテゴリバランスデータ学習に適した特徴空間。 AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

いくつかの特殊なケースでは、カテゴリの数が大きい AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

または擬似ラベルの精度が低い(精度

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

さらなる分析と観察を通じて、著者は、 γ = 1 の場合、γ = 0 の場合、更新戦略全体が RoTTA の RobustBN 更新戦略に縮退することがわかりました。γ = 0 の場合、純粋にカテゴリーに依存しない更新戦略です。したがって、γ が 0 ～ 1 の値を取る場合、、さまざまな状況に適応できます。

#3 ネットワーク自己訓練モデル

著者いくつかの生徒-教師モデルに基づいて、アンカリングネットワークブランチが追加され、アンカリング損失が導入されて教師ネットワークの予測分布が制限されます。このデザインはTTACからインスピレーションを得たものです。 TTAC は、テストデータストリームでの自己学習のみに依存すると、確証バイアスの蓄積につながりやすいと指摘していますが、この問題は、この記事で取り上げる現実世界のテストデータストリームではより深刻です。 TTAC は、ソースドメインから収集された統計情報を使用してドメインアラインメントの正規化を実装しますが、完全な TTA 設定の場合、このソースドメイン情報は収集できません。

同時に、著者は別の啓示も得ました。教師なしドメインアライメントの成功は、2 つのドメイン分布の重複率が比較的高いという仮定に基づいています。したがって、著者は、教師モデルの予測分布がソースモデルの予測分布から大きく逸脱しないように、BN 統計量の凍結されたソースドメインモデルを調整して教師モデルを正規化するだけでした (これにより、2 つの間の高い一致率という以前の経験が破壊されました)分布）観察）。多数の実験により、この記事の発見と革新が正しく、確実であることが証明されています。アンカリング損失の式は次のとおりです。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

# 次の図は、TRIBE ネットワークのフレーム図を示します。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

##実験部分

論文の著者は、2 つの実際の TTA プロトコルに基づいて 4 つのデータセットに対して TRIBE を実施しました。検証されました。実際の TTA プロトコルには、グローバルクラス分布が固定されている GLI-TTA-F と、グローバルクラス分布が固定されていない GLI-TTA-V の 2 つがあります。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

上の表は、異なる不均衡係数の下での CIFAR10-C データセット内の 2 つのプロトコルのパフォーマンスを示しています。次の結論が得られます:

1. のみ論文で提案されている LAME、TTAC、NOTE、RoTTA、および TRIBE は TEST ベースラインを超えており、実際のテストフローではより堅牢な TTA 手法の必要性を示しています。

2. グローバルクラスの不均衡は、既存の TTA メソッドに大きな課題をもたらしています。たとえば、以前の SOTA メソッド RoTTA は、I.F.=1 の場合に 25.20% のエラー率を示しましたが、 I.F.=200ではエラー率が32.45%まで上昇しますが、それに比べてTRIBEは比較的良好なパフォーマンスを安定して発揮できます。

3. TRIBE の一貫性は、これまでのすべてのメソッドを上回り、以前の SOTA を超える絶対的な利点があります (グローバルクラスバランス (I.F.=1) TTAC の設定の下) ) 約 7% 向上し、より困難なグローバルクラスインバランス (I.F.=200) 設定では約 13% のパフォーマンス向上を達成しました。

4. I.F.=10 から I.F.=200 まで、他の TTA メソッドは、不均衡が増大するにつれてパフォーマンスが低下する傾向を示します。 TRIBEは比較的安定したパフォーマンスを維持できます。これは、深刻なクラスの不均衡とアンカリング損失をより適切に考慮するバランスの取れたバッチ正規化レイヤーの導入によるもので、異なるドメインにわたる過剰適応が回避されます。

データセットの結果の詳細については、元の論文を参照してください。

さらに、表 4 はモジュール式アブレーションの詳細を示しており、以下の観察結果が得られます。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

1. のみBN をバランスの取れたバッチ正規化層 (Balanced BN) に置き換え、モデルパラメーターを更新せず、フォワードを通じて BN 統計のみを更新すると、10.24% (44.62 -> 34.28) のパフォーマンス向上がもたらされ、Robust BN の誤差を上回ります。率は41.97%。

2. 以前の BN 構造でも最新のバランス BN 構造でも、アンカー損失とセルフトレーニングを組み合わせると、パフォーマンスが向上し、モデルの EMA 正則化効果を上回りました。

この記事の残りの部分と 9 ページの付録では、最後に 17 件の詳細な表結果を示し、TRIBE の安定性、堅牢性、優位性を多面的に示します。付録には、バランスのとれたバッチ正規化層のより詳細な理論的導出と説明も含まれています。

#概要と展望

##実世界非 i.i.d. テストデータフロー、世界的なクラスの不均衡、継続的なドメイン転送などの多くの課題に直面して、研究チームはテスト時のドメイン適応アルゴリズムの堅牢性を向上させる方法を深く検討しました。不均衡なテストデータに適応するために、著者は統計の不偏推定を実現する平衡バッチノーム層を提案し、その後、生徒ネットワーク、教師ネットワーク、アンカーネットワークを含むネットワークを提案しました。自己トレーニングをベースにしたTTA。

しかし、この記事にはまだ欠点があり、改善の余地があります。多くの実験と出発点は分類タスクと BN モジュールに基づいているため、適応させる必要はありません他のタスクや Transformer ベースのモデルに影響を与える可能性がありますが、その程度は不明です。これらの問題は、フォローアップ作業でさらなる研究と調査が必要です。

以上がTRIBE はドメイン適応の堅牢性を実現し、複数の現実のシナリオで SOTA の AAAII 2024 に到達します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。