一般に、合流は自動運転と有人運転の両方にとって、特に交通の流れが密なシナリオでは困難な作業です。これは、合流する車両は通常、他の車両と対話して安全に合流するためのスペースを特定したり作成したりする必要があるためです。この論文では、強制合流シナリオにおける自動運転車の制御問題を研究します。我々は、リーダーフォロワーゲームコントローラー(LFGC)と呼ばれる新しいゲームベースのコントローラーを提案します。
その中で、部分的に重要なリーダー-フォロワー ゲーム モデルは、自動運転車と先験的に不確実な運転意図を持つ他の車両との間の相互作用をモデル化するために使用されます。 LFGC は、観測された軌道に基づいて他の車両の意図をオンラインで推定し、将来の軌道を予測し、モデル予測制御 (MPC) を使用して自車の軌道を計画し、合流目標を達成しながら安全確率を確保します。 LFGC のパフォーマンスを検証するために、シミュレーションと NGSIM データを使用してテストしたところ、LFGC は最大 97.5% の組み込み成功率を実証しました。
高度自動運転車の実現には、依然として多くの課題が残されています[4]。高速道路での義務的な合流を完了するには、これは、有人運転と自動運転の両方にとって困難なシナリオです。強制合流は通常、高速道路入口ランプでの合流など、現在の車線が終了し、強制合流が必要となるシナリオを指します。交通量が多い場合、合流する車両は、目標車線を走行する車両と対話および/または協力します。
現時点では、ターゲット車線の車両は、合流車両を無視する (つまり、走行を続ける) ことを選択できますが、この時点では、合流車両はその後ろでのみ合流できます。または、目標車線内で車両は合流に道を譲ることを選択することもできます(つまり、合流する車両がその前で合流することを許可します)。密集した交通の流れにうまく合流するには、自動運転車の制御装置は、適切に対応するために、ターゲット車線内の車両が続行するか、または譲歩するかの意図を合理的に予測する必要があります。
同時に、他の車の意図は、交通状況 (2 台の車間の相対位置や速度など) だけでなく、ドライバーの一般的な運転にも依存します。スタイルや性格、感情など。たとえば、攻撃的なドライバーは運転を続ける傾向がある一方で、慎重で保守的なドライバーは諦める傾向がある可能性があります。これは、自動運転車の計画と制御に重大な課題をもたらします。
##図1 青色の自車強制合流シーン
現在、多くの学者は部分的に観察可能なマルコフ決定プロセス (POMDP) フレームワークを使用して、相互作用の不確実性 (たとえば、他の車両の異なる協力意図による) に対処していますが、この方法には高い計算要件があります [ 11]、複数車両のインタラクションに使用するのは困難です。
強化学習 (RL) 法は、車線変更または合流シナリオの制御戦略を設定するもう 1 つの一般的な方法です [12][13]。 RL ベースの方法には、交通状況下での複雑な複数車両の相互作用シナリオを処理する機能がありますが、RL には解釈可能性と明確な安全性の保証がありません。
より説明可能な制御を実現するために、一部の研究者は、車両相互作用の予測モデルを制御アルゴリズムに追加することを提案しています。たとえば、[22] では、「ソーシャル生成敵対的ネットワーク (GAN)」を使用して、自車の挙動に応じて他の車の将来の軌道を予測します。ただし、SocialGAN はドライバーのスタイルや意図の変化を考慮しておらず、トレーニングには膨大な交通データ [23] が必要です。一部の研究では、ゲーム理論の手法を使用して車線変更や合流のシナリオをモデル化しています [9]、[25]、車両インタラクション[26]、[27]、[28]、[29] では、ゲーム モデリングやドライバーの認知レベルのオンライン推定などを通じて、さまざまな運転スタイルや意図を説明できます [26] または [30]、[31] ]。
この論文では、強制合流シナリオにおける自律走行車の計画と制御のための、リーダー/フォロワー ゲーム コントローラー (LFGC) と呼ばれる新しい高度な制御アルゴリズムを提案します。 LFGC では、明示的なゲーム理論を使用して、ドライバーのインタラクションの意図 (続行または譲歩) とその結果として生じる車両の挙動をモデル化します。
モデルには複数の並列リーダー/フォロワー ペアがあるため、リーダー/フォロワー ゲームと呼ばれます [32]。相互作用の不確実性を考慮して、2 台の車両間の先験的に不確実なリーダーとフォロワーの関係が潜在変数としてモデル化されます。 LFGC は、観察された軌道に基づいてリーダーとフォロワーの関係をオンラインで推定し、モデル予測制御 (MPC) ベースの戦略を使用して自動運転車に最適な決定を行います。
したがって、提案された LFGC は、マージを達成しながら確率論的な安全性を確保するために、リーダーとフォロワーの関係を評価および予測するように適合されています。
既存の手法と比較した LFGC の貢献と革新は次のとおりです:
1) LFGC ゲーム モデルを使用して車両の軌道を予測します。他の車両の相互作用と協力の意図を考慮して、解釈可能な制御計画を生成するために MPC 制御に接続されます。
2) LFGC は、不確実性を潜在変数としてモデル化し、過去の観測軌跡のコレクションに基づいてベイズ推論オンライン推定を行うことにより、他の車両の異なる協力的意図による相互作用を処理します。
3) LFGC は、車両の安全要件 (衝突回避など) の制約を確立し、明確な確率的安全特性 (つまり、ユーザーが指定した安全確率境界内) を満たしながら最適化を実行します。
4) LFGC は連続状態空間設定に基づいて設計されているため、離散空間の計算コストが削減され、より複雑な複数車両のインタラクション シナリオを処理できます。
5) LFGC の実現可能性は、さまざまな種類のドライバー モデルによって他の車両が制御されるケースや、実際の米国高速道路 101 号線の NGSIM など、包括的なシミュレーション ベースのケース スタディを通じて検証されています。データセット内のケース[34]。実際のケースシミュレーションでは、最大97.5%の成功率を示しています。
このセクションでは、車両と交通を表すモデルに基づいて MPC ベースの自動運転車を構築します。ダイナミクス、軌道計画戦略。
車両力学モデル
自転車の連続体である運動学自転車モデル [35] を使用します。モデル 時間方程式は次のとおりです。
# 前輪のみが操舵していると仮定します 、後輪操舵なし (つまり )、x、y は車両の前後方向および横方向の位置、v は車両の速度、ψ および β はヨー角です。車両の角度とスリップ角、 と は車両の重心から前輪および後車軸までの距離を表し、a は方向に沿った加速度です。速度v.制御入力は加速と前輪操舵、# です。
#動的交通設定
シナリオには、1 台の自分の車両と n 台の他の車両、交通状態が含まれます。そしてそれらのダイナミクスは、すべての n 1 車両の状態とダイナミクスの集合体によって特徴付けられます。具体的には、次の離散時間モデルを使用してトラフィック ダイナミクスを記述します。#
は離散時間における n 1 台の車両の交通状況を表し、 は時間 t におけるすべての n 1 台の車両の制御入力のセットを表します。各車両のステータス には、xy 座標、速度、ヨー角、制御入力
報酬関数 が含まれます。
報酬関数 は、ドライバーの運転目標を数学的に表現したものです。交通状態は、これら 2 台の車両の状態で構成されます。そして、自分の車が得られる報酬は、相互作用する 2 台の車の状態と制御入力によって決まります。 ## を検討します##その中で、 ##, は重みベクトルです。賞品 は、運転中の次の一般的な考慮事項を表します: 1) 安全性 、つまり、他の車と衝突したり、道路から逸脱しないこと、2) 意志を統合する 、つまり目的車線からの距離、3) 快適性 ##、つまり他の車との適切な距離の維持。 の詳細な定義については、[33] を参照してください。
図 2 5 自由度の車線変更軌跡曲線
##車両運動として軌道を選択
の車両運動軌道サンプルをアクションとして考慮します各車両のスペース。具体的には、各軌跡は、車両の現在の状態
から始まる車両の状態 の時刻歴です。 車両運動モデル(1)によれば、各軌道に対応する制御入力時刻歴
を計算することができる。
ターゲット車線を走行する相互作用する車両については、縦方向の動きのみを考慮します。
および と仮定すると、これらの車両の運動学モデル (1) は次のように単純化されます。
##このとき、与えられた初期条件から始まる軌道は[0, T]の加速度aのみに依存します。各サンプル時間で、81 個の加速度曲線、つまり式 (4) を満たす 81 個の軌道が考慮され、目標車線を走行する他の車両の実行可能な軌道範囲が形成されます。
これらの 81 の軌道は、速度制限を満たしています。。
各軌道を 、m = 1、2、...81 として表し、一連の軌道が記録されます。
合流車両の軌道戦略には、車線維持と車線変更が含まれます。車線維持軌道の生成は (4) と同様であり、車線変更軌道の生成は (4) と同様です。は 5 次の多項式で表されます [37]。つまり、車線変更の軌道要件に対する解決策は、次の境界値問題としてモデル化できます:
係数 と を見つけて、5 次多項式
# が得られるようにします。 ## 対応する初期値条件と最終値条件を満たします。 (5) の変数 ξ は連続時間を表し、現在のサンプルでは ξ = 0 です。
また、1) 車両は計画範囲内の任意のサンプル時間で車線変更を開始できる、2) 完全な車線変更に必要な時間は一定であると仮定します [37]。車線変更プロセス中いつでも車両が車線変更動作を終了できるようにします。これは、以前に計画された車線変更が実行不可能または安全になった場合のドライバーの「心変わり」を表します。車線変更中止後の軌跡も車線変更軌跡と同様に生成される。
最後に、車線維持、車線変更、車線変更放棄の軌跡が継ぎ合わされて 162 個の軌跡に結合され、戦略の実行可能領域として使用されます。
抽出された軌跡特徴は、1) 車線変更を開始するかどうか/いつ開始するか、2) 不適切な車線変更を停止するかどうか/いつ停止するかです。
図 3 は、車両が車線変更を開始していない場合と、車両が車線変更中の場合に設定された軌道サンプリングを示しています。各軌道を m = 1,2,...,162 と表します。軌道セットは次のようになります。
#図 3 合体車両の軌跡サンプル
まとめると定義 意思決定出力としての実現可能な軌道。同時に、これらの軌跡に対応する制御入力の時刻歴を車両運動モデルに基づいて計算することができる(1)。計画された軌道は、実際に基礎となる車両モーション コントローラーに転送できます。#モデル予測制御戦略
#MPC ベースの自動運転車の軌道計画戦略を検討します。インタラクティブ車両の存在: 各サンプル時間 t で、自車両は計画範囲内の累積報酬の最大化に基づいて最適な軌道
を計算します。
##このうち、
は離散時間 t τ における予測交通状況を表し、および # は、それぞれ、t τ における自車両と対話型車両の予測制御入力を表します。パラメータ λ∈(0,1) は、将来の報酬の損益係数です。つまり、現在の報酬が優先されます。 (6) では、
は、セクション II-C で説明されているように、t τ における自車の報酬を表します。 は、交通状態の安全値のセットを表します。厳格な安全規制(衝突防止、道路境界の制限など)。最適な軌道 を取得した後、車両はその軌道に対応する制御入力 を使用して、サンプリング期間内にステータスを更新します。次に、サンプリング時刻 t1 について上記の手順を繰り返します。
このセクションでは、リーダーについて紹介します。この記事で使用されているフォロワー ゲーム モデル。ゲーム理論モデルのオンライン計算を簡素化するために、模倣学習を使用してニューラル ネットワークに基づく明示的なモデルを取得し、対話型車両の応答の軌道をオンラインで予測し、MPC ベースの全体的な自車両の挙動にマージします。軌道計画戦略。
リーダーとフォロワーのゲーム理論モデル
この論文では、ペアベースのリーダーシップパラメトリック理論モデルについて考察します。リーダーとフォロワーの相互作用の度合いは、ドライバーの協力的な意図とその結果として生じる車両の挙動を表現するために使用され、リーダーとフォロワーのゲーム モデルと呼ばれます。このモデルでは、他の車両より先に進むことを決定した車両 (またはドライバー) がペアのリーダーとなり、他の車両に道を譲ることを決定した車両がペアの追従者となります。リーダーとフォロワーは異なる意思決定戦略を使用します。このリーダーとフォロワーのゲーム理論モデルは [32] で最初に提案されましたが、高速道路の強制合流シナリオでの応用を紹介するために、このゲーム理論モデルをここで簡単にレビューします。
は、リーダーとフォロワーの軌道がそれぞれ と であることを示します。ここで、和はリーダーとフォロワーの実現可能な軌道セットです。ゲームの両当事者が累積報酬を最大化する決定を下したと仮定します。それぞれ、 と として記録され、次のように定義されます。
これは、ゲームにおける役割 は、リーダー/フォロワーの報酬関数であり、その軌跡の合計に対応する制御入力を表します。
# 具体的には、リーダーとフォロワーの対話型意思決定プロセスを次のようにモデル化します。
##ここで、 ( とは異なります) は、現在の交通状態に応じて、リーダー (フォロワーとは異なります) の最適な軌道です。 および は次のように定義されます: ########################で########################。
強制合流における意思決定モデル (8) ~ (11) は、次のように説明できます。フォロワーは、譲歩するつもりのドライバーを表します。他のドライバーの行動が不確実であるため、フォロワーは、他のドライバーが自由に行動できると仮定して、(9) と (11) によって最悪の場合の報酬を最大化する行動を取ることを決定します。リーダーは、他のドライバーが降参することを前提として、前進を続けるつもりのドライバーを表します。したがって、リーダーはフォロワー モデルを使用して別のドライバーの行動を予測し、(8) と (10) を介して、予測されたフォロワーの行動を考慮してリーダー自身の報酬を最大化します。このリーダーとフォロワーのゲーム モデルは、Stackelberg ゲーム モデル [38] から部分的に派生していますが、ドライバーの相互作用には当てはまらないいくつかの仮定を緩和しています。リーダーとフォロワーのゲーム モデルと、複数の車両のシナリオにおけるドライバーの相互作用をモデル化する際のその有効性をより詳細に理解するには、[32] を参照してください。このモデルは、先頭車両が常に合流車両をその後ろで強制的に合流させたり、後続車両が常に合流車両をその前で強制的に合流させたりすることを意味するものではないことに注意してください。次の 2 つの例では、合流車両は先頭車両の前で合流する場合があります。 1) 合流車両は先頭車両の前にあり、安全に合流できる十分な距離があります。 2) 合流車両が車線の端に到達しようとしています。道路からの逸脱には多額のペナルティが課せられるため(セクション 2-c を参照)、自車の合流によって衝突が発生しない限り(衝突に対するペナルティは道路からの逸脱よりも大きい)、自車は次のいずれかを選択できます。大きな衝突を避けるために、対向車よりも前に合流する。
上記は、私たちの意思決定モデル (8) ~ (11) では、リーダーとフォロワーの役割が車両の空間的位置によって割り当てられていないことを示しています (リーダーは必ずしも前の車両であるとは限りません)。さらに、このモデルでは、自車が目標車線の交通の流れに強制的に合流することができます。自車が目標車線に近づくにつれて、道路からの逸脱によるペナルティを避けるために、ますます合流することを好むようになります。自車両は、すべての対話車両とともにターゲット車線内にあり、すべての車両がリーダーであるか、現在の合流ギャップが十分に大きくなく、合流が十分に快適でない場合でも、合流動作を実行します。モデル (8) ~ (11) は、対話車両のリーダー ID によって、合流車両のその後の合流動機を予測できることを示しています。その後、合流する車両も安全と快適のために速度を落とし、車間距離を広げて確実に合流します。模倣学習によりゲーム戦略を明示するリーダー
(8)-(11) 行動力ベースon ドライバーの意図と現在の交通状況情報を利用して、他車両の意思決定と軌跡を予測することができます。つまり、(8)~(11)により、リーダーの最適な行動戦略とフォロワーの最適な行動戦略が得られます。ただし、(8)~(11)をオンラインで繰り返し計算すると時間がかかります。そこで模倣学習を用いて表現・明示していきます。
[39] を参照して、教師あり学習 (特に模倣学習を使用) 表現を使用します。
模倣学習は、エージェントが専門家の行動を観察することによって戦略を学習する教師あり学習問題です。エキスパートは人間または人工知能のエージェントであり、私たちの研究では (8) ~ (11) によって得られるものがエキスパート戦略です。
「データセット集約」アルゴリズム [40] を使用して、シミュレーションされた戦略を取得しました。
その中で、データセット集約アルゴリズムの全体的な学習目標は次のように説明できます:
は θ (ニューラル ネットワークの重み) パラメータ化戦略の使用を表し、損失関数を表します。模倣学習および「データ セット集約」アルゴリズムの詳細については、[39] および [40] を参照してください。
学習(8)〜(11)の模倣学習戦略は、ドライバーの協力意図を理解しながら、意思決定と自動車の将来の開発軌道を予測することができます。しかし、特定の交通シナリオでは、他のドライバーの協力の意図を事前に知ることができない場合があります。ドライバーの意図は、交通状況 (2 台の車両間の相対位置や速度など) だけでなく、ドライバーにも依存するためです。スタイル/ジャンル。他の車両の協力意図の不確実性を潜在変数としてモデル化し、他の車両の協力意図を推定し、予測制御手法を使用して自律車両の計画と制御問題で最適な軌道を取得するために使用されます。
以下では、協力意図の不確実性の下でのハイウェイについて説明します。 強制合併決定アルゴリズム、リーダー/フォロワー ゲーム コントローラー (LFGC)。強制合流プロセス中に、このセクションで説明するように他のドライバーの協力意図の推定値を生成し、それに基づいて (6) をペアごとの対話型複数車両制御戦略としてモデル化します。
相互作用する車両の協力意図の推定
他の車両の協力意図に基づいたガイド付きフォロワー ゲームの使用車両ドライバーの意図を持った行動モデリング。ゲームでは、譲歩する車両はフォロワーとしてモデル化され、(譲歩せずに) 続行する車両はリーダーとしてモデル化されます。つまり、リーダー・フォロワーゲームにおける対話型車両の役割を推定することで、対話型車両の協力意図を推定することができる。
これを達成するために、交通力学モデル (2) とリーダーまたはフォロワーの最適な行動 (8) と (9) を検討します。自車両の観点から見ると、対話型車両はリーダーとフォロワーのゲームを行っており、動的交通モデルは次のように記述できます。
##ここで、は自分の車両のコントロール、
はリーダーによって取得される対話型車両のコントロールです。フォロワー ゲーム、
{リーダー、フォロワー} はフォロワーまたはリーダーを表し、 は に対応する最初の制御入力です。 (8)(9)では最適な軌道を求めます。ここで、(14) への唯一の入力は、自分の車両の制御です。 実際には、他車の意思決定が(8)と(9)で計算した最適戦略に従うとは限らないことを考慮し、ガウスノイズを加算し、システムは (14) に従って動作すると仮定します。
ここで、平均と共分散が 0 の加法ガウス ノイズは次のとおりです。 。自車が σ について事前の信念を持っていると仮定します。これは、{リーダー、フォロワー} として表されます。次に、以前のすべての交通状態と自車が実行したすべてのアクションに基づいて
自車両は、対話型車両のリーダーまたはフォロワーの役割に関する事後的信念を計算または維持する必要があります ()。
[41] で提案されたハイブリッド推定アルゴリズムを使用すると、対話型車両のリーダーまたはフォロワーの役割の条件付き事後信念を計算できます。
# 具体的には、対話型車両のリーダーまたはフォロワーの役割を識別することは、次のように表現できます:
は条件付き確率、# は ## からの車の役割の役割です。 # から ## への遷移確率 #; は、車の役割 の尤度関数であり、次のように定義されます。
式のは、次の確率密度関数です。正規分布、平均は 0、コヒーレンス 分散 W は で評価されます; は正規化定数です。
合流中、つまり
# のとき、対話車両の役割は変わらないと仮定します。 ##、 の場合、対話型車両のリーダーまたはフォロワーの役割の事後信念は、次の方程式を使用して更新できます:
ここで、 は、対話型車両のリーダーまたはフォロワーの役割についての事前の信念です。
複数車両相互作用の制御戦略
交通量が多い場合、複数の車両が存在する可能性があります。図 1 に示すように、自分の車両の合流を妨げます。複雑さの低い解決策は、自車両が最初の車両との対話のみを考慮し、最初の車両が離れた後に 2 番目の車両との対話を開始することです。しかし、これでは後続車両の意図の推定が遅れ、自車両が合流の機会を逸してしまう可能性がある。
もう 1 つの解決策は、複数の車両を同時に操作することです。現時点では、対話型車両の挙動を予測するモデルを構築する必要があります。セクション 3 で説明した 2 プレイヤーのリーダー/フォロワー ゲームは、マルチレベルの意思決定階層を考慮することでマルチプレイヤーのリーダー/フォロワー ゲームに拡張できますが、モデルの複雑さはプレイヤーの数が増加するにつれて指数関数的に増加します。プレイヤーが 3 人以上の場合、シュタッケルベルク均衡を得ることが困難になります [42]。したがって、ペアワイズ相互作用を考慮することにより、フレームワークを複数車両相互作用に拡張する、計算的に扱いやすい方法を提案します。
相互作用する車両が m 台ある場合、自車両と各相互作用車両間のペアごとの相互作用を考慮し、自車両と k 番目の他の車両を含む m 個の車両を構築します。車両の状態は で表され、それぞれの力学モデルは次の式で与えられます。
同様に、{リーダー, フォロワー}を使用して、k 番目の対話型車両のペアのリーダーまたはフォロワーの役割を表すことができます。 セットで表されます。以前のすべての対になった自車両の交通状態と動作、つまり
(19) を利用して、対話する各車両のリーダーまたはフォロワーの役割、、
{リーダー ,フォロワー} の信念を更新できます。 (6) の MPC ベースの制御戦略は、次のように言い換えることができます。
ここで、 は、(12) のトレーニング戦略 の軌道に対応する最初の制御入力であり、ε∈[0,1] は (ユーザー指定) を表します。 ) 必須 制約は確率レベルを満たします。
目的関数の期待値は (23) に従って解くことができます;
## ここで、 は、特定の対話型車両の役割です の予測トラフィック ステータス と (22) の最後の制約
このうち、 は集合 B の b の指標関数です。 (22) の最後の制約は、次の条件
を強制することに注意してください。これは、ペアごとの相互作用が安全でない状態 (例: 衝突の確率や道路境界から離れる)はε未満です。
(26) を導出するには、まずイベント を表し、次に
(22) の最後の制約を適用すると、
## が得られます。
#(6) と (22) の主な違いは次のとおりです:(6) では 1) は不明ですが、(22) では、それらは模倣学習のトレーニング戦略に基づいて取得されます;
2) (6) の累積報酬の最大化を (22) の期待累積報酬の最大化に変更します。 、相互作用する車両のリーダー/フォロワーの役割についての確率論的な信念を説明するため;
3) 期待される累積報酬は、すべてのペアごとの相互作用の期待される報酬の合計に変更されます。複数の車両 不確実な動作 (計算が簡単);
4) ハード制約は、パラメータとして ε∈[0,1] を使用する確率制約になります。
意思決定アルゴリズムは次のように進行します。サンプリング時間 t で、自車両は各インタラクティブ ペアの現在のステータスを測定し、それらを前の制御入力とともに観測ベクトルに追加します## ### ####真ん中。各車両のリーダーまたはフォロワーの役割に関する信念は、(19) に従って更新されます。次に、MPC ベースの制御戦略 (22) を使用して、セクション 2-D で紹介したすべての軌道を探索することによって最適な軌道 を取得し、自車は最初の制御入力を適用します。状態を更新します。次回サンプルが採取されるときに、プロセス全体が繰り返されます。
1 ) リーダー・フォロワーゲーム理論モデル(8)~(11)に基づいて、異なるインタラクション意図の下で他の車の軌道を予測します。
#2) これらの予測は閉ループです。具体的には、自車両の異なる軌道計画
に対応して、特定の意図を持った他車両の軌道予測も異なる。これは、他車両の予測挙動は交通状況に依存し、予測交通状況は自車両の計画軌道に依存するためである。
3) (22) の目的関数は条件付き期待値、安全性を示す制約は条件付き確率であり、どちらも他の車両に基づいています。 ' 意図 (つまり、リーダーまたはフォロワー) の最新の見積もり、。同時に、相手の車の過去のインタラクション行動に基づいて、相手の車の意図を推定します。
05 シミュレーションと検証結果最初に、リーダーまたはフォロワーのいずれかが制御するインタラクティブな車両を使用したリーダー/フォロワー ゲームで LFGC を検証します。次に、他のタイプのドライバーまたは実際の交通データによって制御される対話型車両で LFGC をテストしました。さらに、対話型車両 (IDM) がインテリジェント ドライバー モデルによって制御され、対話型車両が次世代シミュレーション サイト [34] からの実際の米国ハイウェイ 101 交通データに従うケースをテストしました。シミュレーションは、Intel Xeon E3-1246 v3 @ 3.50 GHz CPU と 16 GB メモリを搭載した PC 上の MATLAB R2019a プラットフォームで実行されました。
リーダー/フォロワー モデル インタラクション ビークル
最初に、リーダー/フォロワー ビークルを使用してインタラクションをシミュレートおよび制御し、テストします。 LFGC。私たちが検討しているシナリオを図 4 に示します。加速車線の自動運転車 (青) は、加速車線の終点より前に高速道路に合流する必要がありますが、他の多くの車両 (赤、ピンク、緑) は現在、加速車線を走行中です。高速道路を運転中。図4に示すように、自車両は車線境界線に逸脱し、方向指示器を点滅させることで強制合流を開始する。この場合、自動運転車は安全に合流するために他の車両と対話する必要があります。
図 4 高速道路強制合流シナリオで対話型車両を制御するリーダー/フォロワーの LFGC 検証シナリオ図
テスト後、車両能力 = 正しく対話する車両の意図を認識します (つまり、対話する車両をリーダー/フォロワーとして正しく分類できます)
図 5 リーダーとフォロワーのさまざまな組み合わせを持つ他の車両と LFGC を使用した相互作用の結果
(a) 他の車両には 3 つのリーダーがあります。
(b) 他の車両は 1 台のリーダー (車両 1) と 2 人のフォロワー (車両 2 と 3) です;
(c) 他の車両には 2 人のリーダーがいます (車両 1 および 2) と 1 台の従動車 (車両 3);
(d) もう一方の車両には 3 台の従動車があります。
左の列 (a-1) から (d-1) は、ゲーム内での自車のリーダーに対する自車の信念を示しています。右列(a-2)~(d-2)は、この強制合流処理における自車両および他車両の挙動の時刻歴結果を示している。具体的には、右の列では各ブロックの境界線の色で車両を区別し、ブロック内の数字は時間を秒単位で表し、各ブロックの色はその瞬間の車両速度を表し、青い点線は車両の速度を表しています。の自車跡。車両 1 ~ 3 は縦方向の位置が同じですが、区別しやすくするために図に縦方向のオフセットが追加されていることに注意してください。
LFGC の場合、計画範囲は N = 4、確率制約パラメーターは ε = 0.1 です。 N を大きくすると、長期的なパフォーマンスは向上しますが、計算時間も長くなります。一方、N を小さくすると、即時の利点が強調されるため、多くの場合組み合わせられない可能性があることに注意してください。この記事で検討している高速道路の強制合流では、通常、車線変更の時間を超えるような N を選択する必要があります (つまり、)。
# 図 5(a) は、自車が 3 人のリーダーと対話したときの結果を示しています。図 5(a-1) に示すように、自車両は対話する車両の意図を捉えることができます。つまり、すべての車両がゲームのリーダーになる可能性が高くなります。この情報を取得した後、自車両は t = 1 [s] 後に減速することを決定し、すべての対話車両が通過した後に合流するのを待ちます。
セルフカーがリーダー (車両 1) および 2 台のフォロワー (車両 2 および 3) と対話すると、図に示すように、セルフカーは対話する車両の意図を正しく認識します。図 5 ( b-1) に示されています。そして、t = 1 [s] 後、図 5(b-2) に示すように、自車は減速を開始し、車両 1 と車両 2 との合流に成功します。図 5 に示すように、(c) は自車両と 2 台のリーダー (車両 1、2) およびフォロワー (車両 3) との間の相互作用の結果です。
この場合、自車両は、車両 1 と車両 2 が譲歩せずに加速しているのを観察しているため、自車両は減速して車両 2 と車両 3 の間で合流することを決定します。また、セルフカーが 3 台のフォロワーと対話する場合のテストも実施しましたが、結果は図 5(d) に示されており、セルフカーは意図を生成するすべての車両を観察し、対話するすべての車両の前で加速して合流しました。 (22) を解くための平均計算時間は、各タイム ステップで 0.182 [s] です。
図 5 に示すすべてのケースで、初期化された信念は同じです。これは、セルフカーは対話型車両がリーダーであるかフォロワーであるかを事前には知らないことを意味します。したがって、自我車両はその観察に基づいて、相互作用ベクトルのリーダー/フォロワーの役割を推定します。リーダー/フォロワー ゲームでは、すべての対話型車両がリーダー/フォロワーによって制御されている場合、LFGC は対話型車両の意図を捕捉し、対応する決定を下すことができます。
彼の車は IDM モデルを採用しています タイプのインタラクション
セクション 5-A に示す検証結果は、他車がリーダーとフォロワーのゲームに基づいて意思決定を行うことを前提としています。 LFGC は、ゲームにおける他のドライバーの役割を推定し、それに応じて決定を下します。これは、セクション 5-A の環境が LFGC の期待どおりに動作することを意味します。ただし、他のドライバーの実際の行動は、リーダーとフォロワーのゲームのポリシーとは異なる場合があります。したがって、他の車両がインテリジェント ドライバー モデル (IDM) を使用するときにフレームワークがどのように応答するかをさらに調査します。
このセクションでは、IDM を使用して他の車両を制御し、自分の車両と対話します。自我車両は依然として LFGC によって制御されており、対応するリーダーまたはフォロワーの役割を推定することによって、対話する車両の意図を推定しようとします。 IDM は、(27) ~ (29) によって定義される連続時間自動車追跡モデルです [43]。
## ここで、 は垂直方向の位置です。 は縦方向の速度、 は車両の予想速度、 は車間距離、
は対象車両の位置、 は対象車両の長さ、 は車両と対象車両の速度差、 に基づく:
このうち、
は IDM のパラメータです。モデル。これらのパラメータの物理的な解釈は、最大加速度 、最小車間距離 、目標時間 T、快適な減速度 b です。 。
図 6 に示すシナリオを検証テストとして検討しました。図 6 では、すべての車両の前に別の車両 (黒い車両 4) が一定の速度で走行しています。自車両は依然として V-A セクションと同じであり、LFGC によって制御されます。これは、自車両の観点からは、対話するすべての車両とリーダーとフォロワーのゲームを行っていることを意味します。これら相互作用する 3 台の車両(車両 1 ~ 3)は、IDM により制御され、先行車両(車両 4)または自車両に対して一定時間進み t で追従します。 IDM モデルのパラメーターを表 1 に示します。なお、自車両は車両4を環境車両として一定速度で走行しているものとする。
図 6 他車両が IDM を追従する場合、自車両は LFGC を使用して強制合流を完了します
表 1 インテリジェント ドライバー モデルのパラメーター
図7は、自車両とIDMで制御される他車両とを対象車両および希望時刻を変えて対話させた場合の結果を示す。
#図 7: 異なるターゲットを持つ他の車両に対する LFGC のインタラクション結果と、IDM によって制御される予想時間
(a) 車両 1 は T = 1 [s] の時間経過を生成 (自車両に追従)、車両 2 と車両 3 は T = 0.5 [s] に追従します;
(b) 車両 2 は (自身の車両を追従) T = 0.5 [s] を生成し、車両 1 と 3 は前の車両 T = 0.5 [s] を追従します;
(c) すべての車両が先行車両に追従し、T = 0.5 [s]; (d) すべての車両が先行車両に追従し、T = 1.5 [s]。
左の列 (a-1) から (d-1) は、ゲーム内での自車のリーダーに対する自車の信念を示しています。右列(a-2)から(d-2)は、この強制併合過程における自車および他車の挙動の時刻歴結果を示しています。具体的には、右の列では各ブロックの境界線の色で車両を区別し、ブロック内の数字は時間を秒単位で表し、各ブロックの色はその瞬間の車両速度を表し、青い点線は車両の速度を表しています。の自車跡。
図 7(a) では、最初の対話型車両 (車両 1) は自分の車両に道を譲ろうとしているため、1 秒間前進する自分の車両に従うことを選択します。最後の 2 つ インタラクティブ車両は、先行車両を 0.5 秒間追従します。図 7 (a-1) からわかるように、自車は車両 1 がゲーム内で従者になる可能性が高いと信じており、図 7 (a) に示すように車両 1 の前に合流することを選択します。 -2)。
図 7(b) は、別の状況を示しています。つまり、最初の対話型車両 (車両 1) が 0.5 進み、2 番目の対話型車両は自分の車両に道を譲るつもりで 0.5 進んでいます。自分の車に従ってください。したがって、この場合、自車両から見ると、車両 1 がゲームのリーダーになる確率が高く、車両 2 がゲームのフォロワーになる確率が高いことになります。自車 自車は車両 2 の前に正常に合流しました。
他の 2 つの非譲歩ケースを図 7(c) および (d) に示します。図 7(c) は、先行車両に続くすべての相互作用車両の結果を示しています。自己車両の観点から見ると、対話するすべての車両はゲームのリーダーになる可能性が高いため、すべての車両が通過した後、自己車両は正常にマージできます。
図 7(d) では、対話するすべての車両が 1.5 秒の速度で前進しています。この場合、自車両は車両 2 が保守的に行動していることに気づき、ゲーム内で車両 2 がフォロワーになる可能性が高いと考えます。したがって、自車は車両 1 と車両 2 の間で合流することに成功します。 (22) を解くための平均計算時間は、各タイム ステップで 0.198 [s] です。
実際の交通データに従う他の車両
私たちは、リーダー/フォロワーが駆動する他の車両とリーダー/フォロワー ゲームの IDM モデルで LFGC をテストしました。私たちは、実際の交通データを使用してコントローラーのパフォーマンスをさらにテストしたいと考えました。具体的には、Next Generation Simulation (NGSIM) Web サイト [34] の米国高速道路 101 号線の交通データセットを使用します。このデータセットは、米国連邦道路管理局によって収集され、公的に利用できる自然主義的な運転データの最大のソースの 1 つと考えられています。米国高速道路 101 号線のデータセットは、文献 [44]、[45]、[46] で広範囲に研究されています。
より具体的には、US 101 高速道路上の 30 分間の車両軌跡を含む US 101 交通データセットの一部を検討します。時間帯は朝の7時50分から8時20分までで、朝ラッシュ時間帯の前後の混雑状況を表しています。データセットには、約 6000 台の車両の位置と速度の軌跡と車両寸法が含まれており、情報は 0.1 [秒] ごとに記録されます。データ収集に使用された米国高速道路 101 号線のセクションの俯瞰図を図 8 に示します。調査セグメントには、高速道路の 5 つの主要車線、高速道路への入口ランプ、高速道路からの下りランプ、高速道路への合流と出口のための補助車線が含まれていました。
[47] で議論されているように、US101 データセットにはビデオ解析と数値微分による大量のノイズが含まれています。この欠点を克服するために、Savitsky-Gorey フィルター [48] を利用して車両の位置を平滑化し、対応する速度を更新します。 Savitzky-Golay フィルターは、時間ウィンドウの長さが 21 の US101 データセットで良好に機能します [45]。元の車両軌道と、対応する平滑化された車両軌道を図 9 に示します。
図 8 US 101 交通データの収集に使用される高速道路の俯瞰図 [34]
#このセクションには、高速道路の 5 つの主要車線、高速道路への入口ランプ、高速道路から出るための出口ランプ、および補助車線が含まれます。高速道路への合流と高速道路からの出口。
図 9 Savitsky-Gorey フィルターを使用して US 101 交通データ セットから平滑化された車両軌跡
#LFGC の検証テストでは、すべての合流車両を識別するために、入口ランプと補助車線に焦点を当てます。合流する車両と対応するシナリオを特定した後、図 10 に従って相互作用する車両を特定します。具体的には、2 秒以内に対象車線内の最初の車両を最初の対話車両、後続の車両を 2 台目と 3 台目の車両とみなします。シーン内に存在する他のすべての車両については、自車両はそれらを環境車両として扱い、一定の速度で走行していると想定します。特定されたマージ シナリオを図 11 に示します。
図 10 インタラクティブ車両の選択: 選択ボックス (赤いボックス ) を備えた自分の車両 (青い車両)
#選択ボックスのフロントエンドは、自車の前に 2 回進みます。選択ボックス内のターゲット車線上の最初の車両が最初の対話型車両であり、後続の車両が 2 番目と 3 番目の対話型車両です。高速道路上の他のすべての車両は周囲車両として扱われ、一定の速度を維持すると想定されます。図 11 US 101 交通データ セットから決定された統合シナリオ
# # このシナリオでは、車両 0 (青い車両) が結合車両であり、LFGC に車両 0 を制御させます。対話型車両の選定基準によれば、車両 1 (赤い車両) と車両 2 (ピンクの車両) が対話型車両として選択され、その他の車両 (黒い車両) は一定の速度で走行すると仮定して環境車両とみなされます。 。 マージされた各シナリオでは、自車に交通データを追跡させるのではなく、LFGC を使用して自車の動作とその結果の軌道を制御します。相互作用車両や環境車両を含む他のすべての車両の場合、US 101 交通データセットに表示される対応する軌道に従います。次に、LFGC は、相互作用する車両の意図を推定し、適切に合流するように自車両を制御する必要があります。データ収集中、実際の交通中に、相互作用する周囲の車両が合流する車両と相互作用する可能性があることに注意してください。 1) LFGC は人間の操作とは異なる動作をする可能性があるため、対話型車両または環境車両の挙動は自車両の挙動に応答しません。代わりに、車両の動作は交通データ セットによって事前に決定されるため、衝突を回避するために慎重な措置を講じる必要があります。2) 交通量が密で、自車両が他の車両の衝突ボックスと交差せずに合流できる安全マージンがありません。
#表 2: US101 トラフィック データ セットを使用した LFGC 統計の検証
#「成功」とは、自車が衝突することなく目標車線に合流できたことを意味します。 「合流失敗」とは、自車両が補助車線の終点で合流できないことを意味する。 「衝突」とは、自車両と他の車両とが衝突することをいいます。最後に、著者は分析のためにマージプロセスのスクリーンショットを撮りました。図 12 に、マージが成功したときのスクリーンショットを示します。これらの図では、青い車両は LFGC によって制御されており、灰色のボックスはデータセット内の自車両の実際の位置を表しています。他のすべての車両 (赤いインタラクティブ車両と黒い環境車両を含む) は、データセット内の対応する軌道をたどります。 LFGC によって制御される自車両は、人間のドライバー (灰色のボックス) に対して同様の決定を行います。LFGC と人間のドライバーは両方とも、まず加速してトラック (車両 1) の前で合流しようとします。しかし、トラックが道を譲り続ける可能性が高いことに気づき、自車は速度を落としてトラックの後ろに合流することにしました。
#図 12 US Highway 101 データセットで LFGC を検証する際のマージの成功の図
#青色の車両がLFGCが管理する自車両、灰色の枠がデータに現れる自車両の位置です。
06 結論
自車両と相互作用する車両との間のペアごとの相互作用を考慮することで、LFGC は複数の車両との相互作用を計算可能な方法で処理できます。最後に、LFGC の有効性を実証するために、ゲーム内で他の車がリーダーまたはフォロワーに従うシナリオ、インテリジェント ドライバー モデル (IDM)、実際の米国高速道路 101 号線のデータなど、複数のシミュレーション ベースの検証が行われます。
この記事は、
「Interaction-Aware Trajectory Prediction and Planning for Autonomous Vehicles in」から翻訳されたものです。強制マージのシナリオ》
以上が強制合流時の自動運転のための軌道予測・計画の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。