ICCV 2023 Oral | オープンワールドでテストセグメントトレーニングを実施するにはどうすればよいですか?動的なプロトタイプ展開に基づく自己トレーニング手法-AI-php.cn

視覚ベースの知覚手法の実装を推進する場合、モデルの汎化能力を向上させることが重要な基盤となります。テスト時トレーニング/適応 (テスト時トレーニング/適応) では、テストフェーズ中にモデルパラメーターの重みを調整することで、モデルを未知のターゲットドメインのデータ分布に適応させることができます。既存の TTT/TTA 手法は通常、閉じた環境でターゲットドメインデータの下でテストセグメントのトレーニングパフォーマンスを向上させることに重点を置いていますが、多くのアプリケーションシナリオでは、ターゲットドメインは強力なドメイン外データ (強い OOD) の影響を受けやすくなります。、意味的に無関係なデータカテゴリなど。このケースはオープンワールドテストセグメントトレーニング (OWTTT) とも呼ばれ、既存の TTT/TTA は通常、強力なドメイン外データを既知のカテゴリに強制的に分類し、最終的には次のような弱いドメイン外データ (弱い OOD) を妨害します。ノイズによって乱された画像の認識能力

最近、華南理工大学とA*STARチームは初めてオープンワールドテストセグメントトレーニングの設定を提案し、対応するトレーニング方法を開始しました

ICCV 2023 Oral | 如何在开放世界进行测试段训练？基于动态原型扩展的自训练方法

この記事の方法は、5 つの異なる OWTTT ベンチマークで最適なパフォーマンスを達成し、より堅牢な TTT 方法を探求するための TTT に関するその後の研究に新しい方向性を提供します。この研究は、ICCV 2023 の口頭論文として受理されました。

はじめに

テストセグメントトレーニング (TTT) は、推論フェーズ中にのみターゲットドメインデータにアクセスし、分布シフトのあるテストデータに対してオンザフライ推論を実行できます。 TTT の成功は、人工的に選択された多数の合成的に破損したターゲットドメインデータで実証されています。ただし、既存の TTT 手法の機能の限界は十分に調査されていません。

オープンシナリオで TTT アプリケーションを推進するために、研究の焦点は TTT 手法が失敗する可能性があるシナリオの調査に移ってきました。より現実的なオープンワールド環境で安定した堅牢な TTT 手法を開発するために多くの努力が払われてきました。この作業では、ターゲットドメインに、ソースドメインとは異なるセマンティックカテゴリや単なるランダムノイズなど、大幅に異なる環境から抽出されたテストデータ分布が含まれる可能性がある、一般的だが見落とされているオープンワールドシナリオを掘り下げます。

上記のテストデータを強力な分布外データ (strong OOD) と呼びます。本作で弱いOODデータと呼んでいるのは、一般的な合成ダメージなどの分布シフトを伴うテストデータです。したがって、この現実の環境に関する既存の作業が不足しているため、テストデータが強力な OOD サンプルによって汚染されているオープンワールドテストセグメントトレーニング (OWTTT) の堅牢性の向上を検討する動機になります。

##書き換える必要がある内容は次のとおりです。図 1: OWTTT 設定での既存の TTT メソッドの評価結果

図によると1 示されているように、最初に OWTTT 設定の下で既存の TTT メソッドを評価し、自己トレーニングと分布調整による TTT メソッドが強い OOD サンプルの影響を受けることがわかりました。これらの結果は、オープンワールドで既存の TTT テクノロジーを適用しても安全なテストトレーニングを達成できないことを示しています。失敗の原因は次の 2 つであると考えられます。セルフトレーニングベースの TTT では、テストサンプルを既知のクラスに割り当てる必要があるため、強力な OOD サンプルを処理することが困難です。一部の信頼性の低いサンプルは、半教師あり学習で使用されるしきい値を適用することで除外できますが、すべての強力な OOD サンプルが除外されるという保証はまだありません。

まず、自己トレーニングされたバリアントで TTT のベースラインを確立します。つまり、ソースドメインプロトタイプをクラスターセンターとして使用してターゲットドメインでクラスタリングします。偽の擬似ラベルによる自己学習に対する強い OOD の影響を軽減するために、強い OOD サンプルを拒否するハイパーパラメータフリーの方法を提案します。

最後に、オープンワールド TTT シナリオを合成するために、CIFAR10-C、CIFAR100-C、ImageNet-C、VisDA-C、ImageNet-R、Tiny-ImageNet、MNIST、および SVHN データセットを使用します。データセットは弱い OOD であり、他のセットはベンチマークデータセットを確立するための強い OOD です。私たちはこのベンチマークをオープンワールドテストセグメントトレーニングベンチマークと呼び、これにより、より現実的なシナリオでのテストセグメントトレーニングの堅牢性に焦点を当てた今後の作業が促進されることを期待しています。

方法

この論文は 4 つのパートに分かれて、提案された方法を紹介します。

1) オープンワールドでのテストセクションの トレーニングタスクの設定の概要。

プロトタイプクラスタリングは、データセット内のサンプルをさまざまなカテゴリにクラスタリングするために使用される教師なし学習アルゴリズムです。プロトタイプクラスタリングでは、各カテゴリは 1 つ以上のプロトタイプによって表されます。プロトタイプは、データセット内のサンプルであるか、またはいくつかのルールに従って生成されます。プロトタイプクラスタリングの目標は、サンプルとそれらが属するカテゴリのプロトタイプとの間の距離を最小限に抑えてクラスタリングを達成することです。一般的なプロトタイプのクラスタリングアルゴリズムには、K 平均法クラスタリングと混合ガウスモデルが含まれます。これらのアルゴリズムは、データマイニング、パターン認識、画像処理などの分野で広く使用されています。 TTT の実装と、オープンワールドのテスト時トレーニング用にプロトタイプを拡張する方法。

書き換える必要がある内容は次のとおりです: 動的プロトタイプ拡張機能。

Distribution Alignment とプロトタイプクラスタリングの導入は、データセット内のサンプルをさまざまなカテゴリにクラスタリングするために使用される教師なし学習アルゴリズムです。プロトタイプクラスタリングでは、各カテゴリは 1 つ以上のプロトタイプによって表されます。プロトタイプは、データセット内のサンプルであるか、またはいくつかのルールに従って生成されます。プロトタイプクラスタリングの目標は、サンプルとそれらが属するカテゴリのプロトタイプとの間の距離を最小限に抑えてクラスタリングを達成することです。一般的なプロトタイプのクラスタリングアルゴリズムには、K 平均法クラスタリングと混合ガウスモデルが含まれます。データマイニング、パターン認識、画像処理などの分野で広く使用されているこれらのアルゴリズムを組み合わせることで、強力なオープンワールドのテスト時トレーニングが可能になります。

#書き直す必要がある内容は次のとおりです。図 2: メソッドの概要図

TTT を設定する目的は、ソースドメインに対してターゲットドメインの分布が変化する可能性がある場合に、ソースドメインの事前トレーニング済みモデルをターゲットドメインに適応させることです。標準のクローズドワールド TTT では、ソースドメインとターゲットドメインのラベルスペースは同じです。ただし、オープンワールド TTT では、ターゲットドメインのラベルスペースにソースドメインのターゲットスペースが含まれます。これは、ターゲットドメインにまだ見たことのない新しいセマンティックカテゴリがあることを意味します。

TTT 定義間の混乱を避けるために、 TTAC [2] で提案されている Sequential Test Time Training (sTTT) プロトコルを採用し、評価します。 sTTT プロトコルでは、テストサンプルが順次テストされ、テストサンプルの小さなバッチを観察した後にモデルの更新が実行されます。タイムスタンプ t に到着するテストサンプルの予測は、t k (k は 0 より大きい) に到着するテストサンプルの影響を受けません。

ドメイン適応タスクでのクラスタリングを使用する作業 [3,4] に触発され、テストセグメントのトレーニングを発見として扱います。ターゲットドメインデータのクラスター構造。代表的なプロトタイプをクラスター中心として特定することにより、クラスター構造がターゲットドメイン内で特定され、テストサンプルをプロトタイプの 1 つの近くに埋め込むことが推奨されます。プロトタイプクラスタリングは、データセット内のサンプルをさまざまなカテゴリにクラスタリングするために使用される教師なし学習アルゴリズムです。プロトタイプクラスタリングでは、各カテゴリは 1 つ以上のプロトタイプによって表されます。プロトタイプは、データセット内のサンプルであるか、またはいくつかのルールに従って生成されます。プロトタイプクラスタリングの目標は、サンプルとそれらが属するカテゴリのプロトタイプとの間の距離を最小限に抑えてクラスタリングを達成することです。一般的なプロトタイプのクラスタリングアルゴリズムには、K 平均法クラスタリングと混合ガウスモデルが含まれます。データマイニング、パターン認識、画像処理などの分野で広く使用されているこれらのアルゴリズムの目標は、図に示すように、サンプルとクラスター中心間のコサイン類似度の負の対数尤度損失を最小限に抑えることとして定義されます。次の方程式。

モデルの重みを調整することによる悪影響を回避するために、強力な OOD サンプルをフィルタリングして除外する、ハイパーパラメーターを使用しない方法を開発しました。具体的には、次の方程式に示すように、各テストサンプルの強力な OOD スコア os を、ソースドメインプロトタイプとの最も高い類似性として定義します。

#外れ値は、図3に示すようにバイモーダル分布に従います。したがって、固定のしきい値を指定する代わりに、2 つの分布を分離する最良の値として最適しきい値を定義します。具体的には、この問題は外れ値を 2 つのクラスターに分割するものとして定式化でき、最適なしきい値はのクラスター内分散を最小化します。次の式の最適化は、0 から 1 までのすべての可能なしきい値を 0.01 刻みで徹底的に検索することで効率的に実現できます。

追加のハイパーパラメータを推定する困難を軽減するために、最初に、次のように、既存のソースドメインプロトタイプと強力な OOD プロトタイプに最も近い距離として、拡張された強力な OOD スコアを持つテストサンプルを定義します。したがって、このしきい値を超えてサンプルをテストすると、新しいプロトタイプが構築されます。近くのテストサンプルを追加しないようにするために、このプロトタイプの拡張プロセスを段階的に繰り返します。

他の強力な OOD プロトタイプが特定されたので、テストサンプルのプロトタイプを定義します。クラスタリングは、データセット内のサンプルを分類するための教師なし学習アルゴリズムであり、さまざまなカテゴリにクラスター化されます。プロトタイプクラスタリングでは、各カテゴリは 1 つ以上のプロトタイプによって表されます。プロトタイプは、データセット内のサンプルであるか、またはいくつかのルールに従って生成されます。プロトタイプクラスタリングの目標は、サンプルとそれらが属するカテゴリのプロトタイプとの間の距離を最小限に抑えてクラスタリングを達成することです。一般的なプロトタイプのクラスタリングアルゴリズムには、K 平均法クラスタリングと混合ガウスモデルが含まれます。これらのアルゴリズムは、データマイニング、パターン認識、画像処理などの分野で広く使用されており、損失には 2 つの要素が考慮されます。まず、既知のクラスに分類されたテストサンプルは、プロトタイプに近く、他のプロトタイプからは遠くに埋め込まれる必要があります。これが K クラス分類タスクを定義します。第 2 に、強力な OOD プロトタイプとして分類されたテストサンプルは、K 1 クラス分類タスクを定義するソースドメインプロトタイプから遠く離れている必要があります。これらの目標を念頭に置いて、データセット内のサンプルを個別のカテゴリにクラスタリングするために使用される教師なし学習アルゴリズムであるクラスタリングのプロトタイプを作成しました。プロトタイプクラスタリングでは、各カテゴリは 1 つ以上のプロトタイプによって表されます。プロトタイプは、データセット内のサンプルであるか、またはいくつかのルールに従って生成されます。プロトタイプクラスタリングの目標は、サンプルとそれらが属するカテゴリのプロトタイプとの間の距離を最小限に抑えてクラスタリングを達成することです。一般的なプロトタイプのクラスタリングアルゴリズムには、K 平均法クラスタリングと混合ガウスモデルが含まれます。これらのアルゴリズムはデータマイニング、パターン認識、画像処理などの分野で広く使われており、損失は次の式で定義されます。

ICCV 2023 Oral | 如何在开放世界进行测试段训练？基于动态原型扩展的自训练方法

#実験

##5 つの異なる OWTTT ベンチマークデータセットで実験を実行しました。テストは次のとおりです。合成的に破損したデータセットやスタイルが異なるデータセットを含めて実行されました。実験では主に、弱OOD分類精度ACCS、強OOD分類精度ACCN、および2つのACCHの調和平均という3つの評価指標を使用します。

^{# 表 2 さまざまなメソッドのパフォーマンスCIFAR100-C データセットのメソッド}

# 表表 3 ImageNet-C データセットでのさまざまなメソッドのパフォーマンス

表 4 ImageNet-R データセットに対するさまざまなメソッドのパフォーマンス

^{この記事は、オープンワールドテストセグメントの問題と設定を提案します。トレーニング (OWTTT) では、ソースドメインサンプルからのセマンティックオフセットを持つ強力な OOD サンプルを含むターゲットドメインデータの処理において、既存の手法ではしばしば困難が発生することを指摘し、ニーズに基づいて書き換えられたコンテンツである動的プロトタイプ拡張セルフトレーニングを提案しました。上記の問題を解決する方法。この研究が、より堅牢な TTT 手法を探求するための TTT に関するその後の研究に新たな方向性を提供できることを願っています。}
参考文献:

[3] Tang Hui と Jia Kui。差別的な敵対的ドメイン適応。 In Proceedings of the AAAI Conference on Artificial Intelligence、volume 34、pages 5940-5947、2020

[4] 斉藤邦明、山本翔平、牛久義隆、原田達也オープンセットドメインバックプロパゲーションによる適応。欧州コンピュータビジョン会議、2018.

[5] Brian Kulis と Michael I Jordan。 K 平均法の再考: ベイジアンノンパラメトリック手法による新しいアルゴリズム。機械学習に関する国際会議にて、2012

以上がICCV 2023 Oral | オープンワールドでテストセグメントトレーニングを実施するにはどうすればよいですか?動的なプロトタイプ展開に基づく自己トレーニング手法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ICCV 2023 Oral | オープンワールドでテスト セグメント トレーニングを実施するにはどうすればよいですか?動的なプロトタイプ展開に基づく自己トレーニング手法

ICCV 2023 Oral | オープンワールドでテストセグメントトレーニングを実施するにはどうすればよいですか?動的なプロトタイプ展開に基づく自己トレーニング手法