4D 画像レーダーと 3D マルチターゲット追跡を組み合わせるにはどうすればよいですか? TBD-EOT が答えかもしれません!-AI-php.cn

皆さん、こんにちは。自動運転の中心部からのご招待をいただき、誠にありがとうございます。ここで私たちの取り組みを皆さんと共有できることを光栄に思います。

高度な運転支援におけるオンライン 3D マルチオブジェクトトラッキング (MOT) テクノロジーシステム (ADAS) 自動運転 (AD) において重要な応用価値があります。近年、高性能の 3 次元認識に対する業界の需要が高まり続けるにつれ、オンライン 3D MOT アルゴリズムがますます広範な研究と注目を集めるようになりました。 4D ミリ波レーダー (4D イメージングレーダーとも呼ばれます) または LIDAR 点群データの場合、ADAS および AD 分野で現在使用されているオンライン 3D MOT アルゴリズムのほとんどは、ポストターゲットトラッキング (TBD-POT) フレームワークを採用しています。検出追跡戦略。しかし、もう 1 つの重要な MOT フレームワークである統合検出追跡戦略 (JDT-EOT) に基づく拡張オブジェクト追跡は、ADAS および AD 分野では十分に研究されていません。この記事では、実際のオンライン 3D MOT アプリケーションシナリオにおける TBD-POT、JDT-EOT、および当社が提案する TBD-EOT フレームワークのパフォーマンスを初めて体系的に説明し、分析します。特に、このペーパーでは、View-of-Delft (VoD) および TJ4DRadSet データセットの 4D イメージングレーダー点群データに対する 3 つのフレームワークの SOTA 実装のパフォーマンスを評価および比較します。実験結果は、従来の TBD-POT フレームワークには、計算の複雑さが低く、追跡パフォーマンスが高いという利点があり、依然として 3D MOT タスクの最初の選択肢として使用できることを示しています; 同時に、この記事で提案されている TBD-EOT フレームワーク特定のシナリオで TBD-EOT を超える能力がある POT フレームワークの可能性。最近学術界の注目を集めている JDT-EOT フレームワークは、ADAS および AD シナリオではパフォーマンスが低いことは注目に値します。この記事では、さまざまなパフォーマンス評価指標に基づいて上記の実験結果を分析し、実際のアプリケーションシナリオにおけるアルゴリズム追跡パフォーマンスを向上させるための可能な解決策を提供します。 4D イメージングレーダーに基づくオンライン 3D MOT アルゴリズムについて、上記の研究は ADAS および AD の分野における最初のパフォーマンスベンチマークテストを提供し、そのようなアルゴリズムの設計と応用に対する重要な視点と提案を提供します

1はじめに

オンライン 3D マルチオブジェクトトラッキング (MOT) は、先進運転支援システム (ADAS) および自動運転 (AD) の重要なコンポーネントです。近年、センサー技術や信号処理技術の発展に伴い、カメラ、ライダー、レーダーなどの各種センサーを活用したオンライン3D MOT技術が注目を集めています。さまざまなセンサーの中で、レーダーは極端な照明や厳しい気象条件下でも動作できる唯一の低コストセンサーとして、インスタンスのセグメンテーション、ターゲット検出、MOT などのセンシングタスクに広く使用されています。ただし、従来の自動車用レーダーは距離とドップラー速度でターゲットを効果的に識別できますが、レーダー測定の角度分解能が低いため、ターゲット検出とマルチターゲット追跡アルゴリズムのパフォーマンスは依然として制限されています。従来の自動車レーダーとは異なり、MIMO技術に基づいて最近登場した4Dイメージングレーダーは、ターゲットの距離、速度、方位角、ピッチ角情報を測定できるため、レーダーベースの3D MOTに新たな開発の可能性をもたらします。

3D MOT アルゴリズムの設計パラダイムは、モデルベースと深層学習ベースの 2 つのカテゴリに分類できます。モデルベースの設計パラダイムは、慎重に設計された多目的動的モデルと測定モデルを使用し、効率的で信頼性の高い 3D MOT 手法の開発に適しています。典型的なモデルベースの MOT フレームワークの中でも、検出-事後追跡戦略を使用した点ターゲット追跡フレームワークは、学界と産業界に広く受け入れられています。点ターゲット追跡フレームワークでは、各ターゲットが 1 回のセンサースキャンで 1 つの測定ポイントのみを生成すると想定していますが、LIDAR および 4D 画像レーダーの場合、ターゲットは 1 回のスキャンで複数の測定ポイントを生成することがよくあります。したがって、ターゲット追跡を実行する前に、まず同じターゲットからの複数の測定値をターゲット検出器を通じてターゲット検出フレームなどの検出結果に処理する必要があります。検出後追跡フレームワークの有効性は、実際の LIDAR 点群データに基づく多くの 3D MOT タスクで検証されています

別のモデルとして統合検出追跡 (JDT) 戦略を使用した拡張ターゲット追跡 (EOT)ベースの MOT フレームワークは、最近学界で広く注目を集めています。 POT とは異なり、EOT はターゲットが 1 回のセンサースキャンで複数の測定値を生成できることを前提としているため、JDT の実装時に追加のターゲット検出モジュールは必要ありません。関連する研究では、JDT-EOT は、実際の LIDAR 点群および自動車レーダー検出点データ上の単一ターゲットを追跡する場合に優れたパフォーマンスを達成できることが指摘されています。ただし、複雑な ADAS および AD シナリオにおけるオンライン 3D MOT タスクについては、実際のデータを使用して EOT を評価する研究はほとんどなく、これらの研究では、ADAS/AD に関するさまざまな種類のターゲットに対する EOT フレームワークの MOT パフォーマンスを詳細に評価していません。また、広く受け入れられているパフォーマンス指標を使用した実験結果の系統的な分析はありません。この記事の研究では、包括的な評価と分析を通じて、EOT フレームワークが複雑な ADAS および AD シナリオに適用でき、従来の TBD-POT フレームワークよりも優れた追跡パフォーマンスとコンピューティング効率を達成できるかどうかという未解決の質問に初めて答えることを試みます。この記事の主な貢献内容は主に次のとおりです。

この記事は、POT フレームワークと EOT フレームワークを比較することにより、ADAS および AD 分野における 4D 画像レーダーに基づくオンライン 3D MOT 手法に関する将来の研究のための最初のパフォーマンスベンチマークを提供します。この記事のパフォーマンス評価と分析は、POT フレームワークと EOT フレームワークのそれぞれの長所と短所を示し、オンライン 3D MOT アルゴリズムの設計に関するガイダンスと提案を提供します。
EOT に基づくオンライン 3D MOT 手法の理論と実践の間のギャップを埋めるために、この記事では、実際の ADAS および AD シナリオにおける EOT フレームワークの体系的な研究を初めて実施します。学術界で広く研究されている JDT-EOT フレームワークのパフォーマンスは低いですが、この論文で提案されている TBD-EOT フレームワークは深層学習オブジェクト検出器の利点を活用しており、それによって JDT-EOT よりも優れた追跡パフォーマンスとコンピューティングを実現します。フレームワークと効率。
実験結果によると、トラッキングパフォーマンスと計算効率が高いため、4D 画像レーダーに基づくオンライン 3D MOT タスクでは、従来の TBD-POT フレームワークが依然として好ましい選択肢です。ただし、特定の状況では TBD-EOT フレームワークのパフォーマンスが TBD-POT フレームワークのパフォーマンスよりも優れており、実際の ADAS および AD アプリケーションで EOT フレームワークを使用できる可能性を示しています。

2. 方法

このセクションでは、TBD-POT、JDT-EOT、TBD-EOT など、4D 画像レーダー点群データのオンライン 3D MOT のための 3 つのアルゴリズムフレームワークを紹介します。以下の図に示されています:

4D 画像レーダーと 3D マルチターゲット追跡を組み合わせるにはどうすればよいですか? TBD-EOT が答えかもしれません!

書き換えられた内容: A. フレームワーク 1: 検出後の追跡戦略を使用した点ターゲットの追跡 (未定 - 点ターゲットの追跡)

TBD-POT フレームワークは、さまざまなセンサーに基づく MOT 研究で広く受け入れられています。この追跡フレームワークでは、4D イメージングレーダー点群が最初にターゲット検出器によって処理されて 3D 検出フレームが生成され、ターゲットの位置、検出フレームサイズ、向き、ターゲットカテゴリ、検出スコア、その他の情報が提供されます。計算を簡略化するために、POT アルゴリズムは通常、直交座標系の 2 次元の目標位置を測定として選択し、鳥瞰図 (BEV) の下で MOT を実行します。推定されたターゲット位置は、3D 検出フレームの他の情報と結合されて、最終的な 3D 追跡結果が得られます。 TBD-POT フレームワークには 2 つの主な利点があります: 1) POT アルゴリズムはターゲットタイプや検出スコアなどの追加情報を利用して追跡パフォーマンスを向上させることができます; 2) POT アルゴリズムは一般に EOT アルゴリズムよりも計算が複雑ではありません。

POT アルゴリズムとしてグローバル最近傍ポアソンマルチベルヌーイフィルター (GNN-PMB) を選択します。これにより、LIDAR ベースのオンライン 3D MOT タスクで SOTA パフォーマンスが実現されます。 GNN-PMB は、PMB 密度を伝播することによってマルチターゲットの状態を推定します。未検出のターゲットはポアソン点過程 (PPP) によってモデル化され、検出されたターゲットはマルチベルヌーイ (MB) 密度によってモデル化されます。データの関連付けは、ローカルおよびグローバルの仮定を管理することによって実現されます。それぞれの瞬間において、測定値は、すでに追跡されたターゲット、新たに検出されたターゲット、または誤った警報に関連付けられる可能性があり、さまざまな局所仮説が形成されます。互換性のあるローカルな仮定は、現在のすべてのターゲットと測定値の間の関係を記述するグローバルな仮定に統合されます。複数のグローバル仮説を計算して伝播するポアソンマルチベルヌーイ混合 (PMBM) フィルターとは異なり、GNN-PMB は最適なグローバル仮説のみを伝播するため、計算の複雑さが軽減されます。要約すると、この記事で検討した最初のオンライン 3D MOT フレームワークは、深層学習ベースのオブジェクト検出器と GNN-PMB アルゴリズムを組み合わせたものです

B. フレームワーク 2: 共同検出と追跡の使用戦略の拡張ターゲット追跡(JDT-EOT)

最初のフレームワーク TBD-POT とは異なり、JDT-EOT フレームワークは、複数のターゲットを同時に検出および追跡することで、4D 画像レーダー点群を直接処理できます。まず、点群がクラスター化されて、可能な測定分割 (点クラスター) が形成されます。その後、EOT アルゴリズムがこれらの点クラスターを使用して 3D MOT を実行します。理論的には、点群には前処理された 3D 検出フレームよりも豊富な情報があるため、このフレームワークはターゲットの位置と形状をより正確に推定し、ターゲットのミスを減らすことができます。ただし、大量のクラッターを含む 4D イメージングレーダー点群の場合、正確な測定分割を生成することは困難です。異なるターゲットの点群の空間分布も異なる可能性があるため、JDT-EOT フレームワークは通常、DBSCAN や K-means などの複数のクラスタリングアルゴリズムを異なるパラメータ設定と組み合わせて使用し、可能な限り多くの測定区分を生成します。これにより、EOT の計算の複雑さがさらに増し、このフレームワークのリアルタイムパフォーマンスに影響します。

この記事では、JDT-EOT フレームワークを実装するために、Gamma Gaussian Inverse Wishart (GGIW) 分布に基づいた PMBM フィルターを選択します。 GGIW-PMBM フィルターは、SOTA 推定精度と計算量を備えた EOT アルゴリズムの 1 つです。 PMBM フィルターが選択されたのは、アルゴリズムがマルチベルヌーイ混合物 (MBM) 密度を使用してターゲットをモデル化し、複数のグローバルな仮定を伝播するため、レーダー測定の高い不確実性への対処が容易になるためです。 GGIW モデルは、ターゲットによって生成される測定ポイントの数がポアソン分布に従い、単一の測定がガウス分布に従うことを前提としています。この仮定の下では、各ターゲットの形状は逆ウィシャート (IW) 密度で表される楕円であり、楕円の長軸と短軸を使用してターゲットの長方形の外枠を形成できます。この形状モデリングは比較的単純で、多くのタイプのターゲットに適しており、既存の EOT アルゴリズム実装の中で計算の複雑さが最も低くなります。

C. フレームワーク 3: 検出後の追跡戦略を使用した拡張ターゲット追跡 (TBD-EOT)

EOT フレームワークの下で深層学習オブジェクト検出器を活用するために、3 番目の MOT フレームワークである TBD-EOT を提案します。完全な点群上でクラスター化する JDT-EOT フレームワークとは異なり、TBD-EOT フレームワークは、クラスター化する前に、ターゲット 3D 検出フレーム内の有効なレーダー測定ポイントを最初に選択します。これらの測定ポイントは、実際のオブジェクトから取得される可能性が高くなります。 JDT-EOT と比較して、TBD-EOT フレームワークには 2 つの利点があります。まず、クラッタに起因する可能性のある測定ポイントを削除することにより、EOT アルゴリズムにおけるデータ関連付けステップの計算の複雑さが大幅に軽減され、誤検出の数も削減される可能性があります。第 2 に、EOT アルゴリズムは検出器から得られた情報を利用して追跡パフォーマンスをさらに向上させることができます。たとえば、ターゲットのカテゴリごとに異なる追跡パラメータを設定したり、検出スコアの低いターゲット検出フレームを破棄したりするなどです。 TBD-EOT フレームワークは、展開時に TBD-POT と同じターゲット検出器を使用し、EOT フィルターとして GGIW-PMBM を使用します。

3. 実験と分析

A. データセットと評価指標

この記事は、No. 0、8、12、18 に掲載されています。 VoD データセットの 3 つの MOT フレームワークが、TJ4DRadSet のシーケンス 0、10、23、31、および 41 の自動車、歩行者、および自転車のカテゴリで評価されました。 TBD-POT および TBD-EOT フレームワークに入力されるターゲット検出結果は、4D イメージングレーダー点群上の SOTA ターゲット検出器の 1 つである SMURF によって提供されます。 JDT-EOT ではターゲットの種類情報を取得できないため、GGIW-PMBM アルゴリズムの状態抽出プロセスにターゲットの形状とサイズに基づいてカテゴリを決定するヒューリスティックなターゲット分類ステップを追加しました。

この記事のその後の評価では、MOTA、MOTP、TP、FN、FP、IDS などの一般的に使用される一連の MOT パフォーマンス指標が選択されました。さらに、新しい MOT パフォーマンス指標である高次追跡精度 (HOTA) も適用しました。 HOTA は、検出精度 (DetA)、関連付け精度 (AssA)、および測位精度 (LocA) のサブ指標に分解でき、MOT パフォーマンスをより明確に分析するのに役立ちます。

トラッキングフレームワークのパフォーマンス比較の内容を書き直す必要があります

VoD データセットでは、3 つの MOT に対して SMURF GNN-PMB および GGIW-PMBM が実装されていますフレームワークアルゴリズムパラメーターの調整は SMURF GGIW-PMBM を使用して実行されました。それらのパフォーマンスを次の表に示します。

4D 画像レーダーと 3D マルチターゲット追跡を組み合わせるにはどうすればよいですか? TBD-EOT が答えかもしれません!

TJ4DRadSet データセットでの各アルゴリズムのパフォーマンスを次の表に示します。

4D 画像レーダーと 3D マルチターゲット追跡を組み合わせるにはどうすればよいですか? TBD-EOT が答えかもしれません!

1) GGIW-PMBM のパフォーマンス

実験結果は、GGIW-PMBM のパフォーマンスが予想よりも低いことを示しています。追跡結果には多数の FP と FN が含まれるため、3 つのカテゴリに対する GGIW-PMBM の検出精度は低くなります。この現象の原因を分析するために、未分類の追跡結果を使用して、以下の表に示すように TP と FN を計算しました。 3 つのカテゴリの TP の数が大幅に増加していることが観察でき、GGIW-PMBM が実際のターゲット位置に近い追跡結果を生成できることを示しています。ただし、以下の図に示すように、GGIW-PMBM によって推定されたターゲットのほとんどは同様の長さと幅を持っているため、ヒューリスティックターゲット分類ステップではターゲットのサイズに基づいてターゲットの種類を効果的に区別できなくなり、追跡パフォーマンスに悪影響を及ぼします。

4D 画像レーダーと 3D マルチターゲット追跡を組み合わせるにはどうすればよいですか? TBD-EOT が答えかもしれません!

2 つのデータセットに対する GGIW-PMBM のパフォーマンスの違いをさらに分析しました。 TJ4DRadSet データセットでは、歩行者と自転車の MOTA メトリクスは VoD データセットのものよりもはるかに低く、GGIW-PMBM が TJ4DRadSet 上でより多くの誤った軌道を生成していることを示しています。この現象の理由は、次の図に示すように、TJ4DRadSet データセットに道路の両側の障害物からのより多くのクラッター測定値が含まれていることである可能性があります。ほとんどの路側障害物は静止しているため、この問題はクラスタリングの前に動径速度の遅いレーダー測定点を削除することで改善できます。 TJ4DRadSet は自車運動データをまだ公開していないため、この記事では追加の実験的証拠は提供しません。それにもかかわらず、同様の処理ステップが静止ターゲットのレーダー点群にも影響を及ぼし、これらのターゲットが正しく追跡されない可能性が高まると推測できます

4D 画像レーダーと 3D マルチターゲット追跡を組み合わせるにはどうすればよいですか? TBD-EOT が答えかもしれません!

全体的に、GGIW- PMBM は、実際の 4D イメージングレーダー点群で良好なパフォーマンスを得ることができませんでした。主な理由は、ターゲット検出器によって提供される追加情報がなければ、アルゴリズムがヒューリスティックな方法で追跡結果のカテゴリを判断したり、点群と区別したりすることが困難であるためです。ターゲットと背景の乱雑さ。

2) SMURF GNN-PMB および SMURF GGIW-PMBM

### のパフォーマンス

SMURF GNN-PMB と SMURF GGIW-PMBM は両方とも、物体検出器からの情報を利用します。実験結果によると、自動車カテゴリにおける前者のパフォーマンスは後者のパフォーマンスよりも大幅に優れています。これは主に後者の方が自動車ターゲットの測位精度が低いためです。この現象の主な理由は、点群分布モデリングのエラーです。以下の図に示すように、車両ターゲットの場合、レーダー点群はレーダーセンサーに近い側に集中する傾向があります。これは、測定点がターゲット表面上に均一に分布するという GGIW モデルの仮定と矛盾し、SMURF GGIW-PMBM によって推定されるターゲットの位置と形状が真の値から乖離する原因となります。したがって、車両などの大きなターゲットを追跡する場合、ガウスプロセスなどのより正確なターゲット測定モデルを使用すると、TBD-EOT フレームワークのパフォーマンスが向上する可能性がありますが、アルゴリズムの計算の複雑さも増加する可能性があります。

4D 画像レーダーと 3D マルチターゲット追跡を組み合わせるにはどうすればよいですか? TBD-EOT が答えかもしれません! また、自転車カテゴリーにおける SMURF GGIW-PMBM と SMURF GNN-PMB のパフォーマンスの差が縮まり、歩行者カテゴリーにおける前者の HOTA インデックスが後者よりもさらに優れていることも観察されました。。さらに、SMURF GGIW-PMBM では、歩行者および自転車カテゴリの IDS の数も少なくなります。これらの現象の原因には、第一に、GGIW-PMBM が推定された GGIW 密度に基づいてターゲットの検出確率を適応的に計算すること、第二に、GGIW-PMBM がターゲットの位置だけでなくターゲットの測定値も考慮して、ターゲットの可能性を計算することが考えられます。相関仮説点の数と空間分布。歩行者や自転車などの小さなターゲットの場合、レーダーポイントはターゲット表面上でより均等に分布しており、GGIW モデルの仮定とより一致しているため、SMURF GGIW-PMBM は点群からの情報を使用して、検出をより正確に推定できます。確率と関連する仮説の尤度を計算し、それによって軌道の中断とエラー相関を減らし、測位、相関、ID 維持のパフォーマンスを向上させます。