自動運転の原理は、多くの場合、自動運転のアーキテクチャから最もよく理解できます。一般の人々が自動運転について最も理解しやすいのは、認識、意思決定、および実行です。すべてのロボットはこの構造を持っています。
次にさらに深く掘り下げていき、問題はもう少し複雑になります。
# 私たちは日常生活の中で、常に目で見る情報に基づいて次の決断を下していると直感的に思うかもしれません。しかし、そうでないこともよくあります。目から頭、手足に至るまでには必ず時間の遅れが生じますが、これは自動運転でも同様です。しかし、私たちの脳は予測を自動的に処理するため、私たちはその影響を感じません。たとえ数ミリ秒であっても、私たちは目に見えるものを予測して判断し、手足を動かし、正常な機能を維持する基礎となります。そこで、自動運転の判断の前に予測モジュールを追加します。知覚のプロセスには宇宙も含まれており、よく考えてみると「感知」と「知覚」の2段階に分けることができます。 「センシング」は写真などのセンサーから生データを取得し、「知覚」は写真から有用な情報(写真に何人写っているかなど)を処理します。古いことわざにあるように、「見ることは信じること、聞くことは信じること」です。有用な「知覚」情報はさらに自車の知覚と外部の知覚に分けられ、人や自動運転車はこれら2種類の情報を処理する際に異なる戦略を持っていることがよくあります。
ここでは「融合と予測」を「世界モデル」としてまとめることが多いです。唯物論者であろうと理想主義者であろうと、この言葉は非常に鮮やかです。すべての「世界」を脳に詰め込むことは不可能ですが、私たちの仕事や生活の指針となるのは「世界」の「モデル」です。道教の世界理解は「内観」と呼ばれます。世界モデルの中核となる役割は、現在の環境要素の属性と関係を「融合」を通じて理解し、「アプリオリ法則」と組み合わせて「予測」を行い、意思決定の実行に向けてよりゆっくりとした判断を提供することです。スパンは数ミリ秒から数秒の範囲です。
ワールド モデルの追加により、アーキテクチャ全体がより豊かになりましたが、見落とされがちな詳細がもう 1 つあります。それが情報の流れです。人間は目で物事を認識し、脳で処理し、手足に渡して実行するという単純な理解ですが、実際の状況はさらに複雑であることがよくあります。ここでは、まったく逆の情報の流れを構成する 2 つの典型的な行動、すなわち「目標達成のための計画」と「注意の転換」が挙げられます。
「目標を達成するための計画」をどのように理解しますか?実は、思考の始まりは認識ではなく「目標」なのです。目標がある場合にのみ、意味のある「認識、決定、実行」プロセスをトリガーできます。たとえば、目的地まで車で行きたい場合、いくつかのルートを知っている可能性があり、最終的には目的地に基づいてルートの 1 つを選択します。混雑状況。渋滞は世界モデルに属しますが、「目的地に着く」ことは決定に属します。これは、決定がワールド モデルに渡されるプロセスです。 「注意の移動」をどう理解するか?たとえそれが写真であっても、そこに隠されたすべての情報を人間も機械も取得することはできません。ニーズとコンテキストから出発すると、限られた範囲と限られたカテゴリーに焦点を当てる傾向があります。この情報は絵そのものから得られるものではなく、「世界モデル」と「目標」から得られ、意思決定から世界モデル、そして認識に至るプロセスです。 必要な情報を追加し、全体の構造を整理すると以下のようになります。まだ終わっていないので、引き続き見てみましょう。 自動操縦アルゴリズムには、脳と同様に、処理時間の要件があります。一般的なサイクルは 10ms ~ 100ms であり、環境変化への対応要件を満たすことができます。しかし、環境は単純な場合もあれば、非常に複雑な場合もあります。多くのアルゴリズム モジュールはこの時間要件を満たすことができません。たとえば、人生の意味を考えるのは 100 ミリ秒でできることではないかもしれませんが、人生のあらゆる段階で考えなければならないとしたら、それはある種の脳の破壊に違いありません。コンピュータでも同様で、計算能力と速度には物理的な限界があります。解決策は、階層化されたフレームワークを導入することです。 この階層化された仕組みは、一般的に階層が上がるにつれて処理サイクルが3~10倍短縮されますが、もちろん実際のフレームワークに完全に現れる必要はありません。オンボードのリソースとアルゴリズムに基づいており、使用量は柔軟に調整できます。基本的に、知覚は注意に基づいて特定の要素を継続的に洗練する上向きのプロセスであり、「深さと方向」を持つ知覚情報を提供します。意思決定は下向きのプロセスであり、さまざまなレベルの世界モデルに従って、目標から各実行ユニットまでのアクションを層ごとに分解します。ワールド モデルには通常、特定の流れの方向がなく、さまざまな粒度のスケールで環境情報を構築するために使用されます。 処理業務の複雑さに応じて、分業や通信環境も適切に去勢・統合されます。たとえば、低レベルの ADAS 機能 (ACC) は、必要な計算能力が少なく、1 つのレイヤーだけで設計できます。ハイエンド ADAS 機能 (AutoPilot) には、通常 2 つのレベルの構成があります。自動運転機能は複雑なアルゴリズムが多く、場合によっては3層の設計が必要となる。ソフトウェア アーキテクチャの設計では、世界モデルと認識または意思決定モジュールが同じ層で統合される状況もあります。 さまざまな自動運転企業や業界標準が独自のソフトウェア アーキテクチャ設計をリリースしますが、それらは多くの場合、現状に基づいた去勢の結果であり、汎用性はありませんが、皆さんの理解を容易にするために、現在主流の機能モジュールに置き換えます。原理を理解するのに役立つ比較関係を見てみましょう。 これはすでにソフトウェア アーキテクチャについて少し説明していますが、それでも原理と実際の説明にすぎないことに事前に注意する必要があります。ソフトウェア アーキテクチャ 設計はこれよりもさらに複雑ですが、ここでは詳細をすべて説明する代わりに、混乱しやすい部分に焦点を当てます。以下ではそれに焦点を当ててみましょう。 #環境意識 - オールインディープラーニング 無人車両が環境を理解して把握するために、通常、無人運転システムの環境認識部分は、障害物の位置、速度、速度などの周囲環境に関する大量の情報を取得する必要があります。前方の車線の正確な形状や標識、カード位置の種類などこの情報は通常、LIDAR、周辺/周囲カメラ、ミリ波レーダーなどの複数のセンサーからのデータを統合することによって取得されます。 ディープラーニングの発展により、ニューラル ネットワーク アルゴリズムによる自動運転の構築を完了することが業界全体のコンセンサスになりました。認識モジュールのアルゴリズムは、深層学習プロセス全体の「駒」であり、変換を完了する最初のソフトウェア モジュールです。 ポジショニング マップと V2X の自車両知覚および外部知覚の相関関係と相違点 従来の感覚 外部知覚は GPS 測位信号に基づいており、高精度地図や Vehicle-to-Everything メッセージ (V2X) などの絶対座標系の情報を車両で使用できるように自車座標系に変換することを理解します。これは、人々が使用する Amap ナビゲーターに似ています。自車座標系が本来持つ「自車知覚」情報と組み合わせることで、自動運転のための環境情報を提供します。 しかし、実際の設計は、多くの場合、より複雑です。GPS の信頼性が低いため、IMU は継続的な補正が必要です。量産された自動運転測位では、多くの場合、正確な絶対値を正確に取得するために知覚マップ マッチングが使用されます。測位、センシング結果を用いて IMU を補正して正確な相対位置を取得し、GPS-IMU で構成される INS システムと冗長化します。したがって、「外部認識」に必要な測位信号は「自車認識」情報に依存することが多い。 さらに、地図は厳密には「世界モデル」の一部ですが、GPS の感度によって制限されます。国内のソフトウェア導入プロセス中に、測位モジュールと地図はモジュールはすべての GPS データを統合してオフセットし、機密の位置情報が漏洩しないようにします。 Fusion 予測モジュール - 中心的な焦点は 2 つの違いにあります Fusion の核心は次のとおりです。時空間同期問題です ソフトウェアとハードウェア連携による座標系変換アルゴリズムと時刻同期アルゴリズムを用いて、まずライダー、カメラ、ミリ波レーダーのセンシング計測結果を時空間的に整合させます環境認識全体の元のデータの統一性を確保するためのポイント。もう 1 つは、関連付けと異常の排除の問題を解決し、同じ「ワールド モデル」要素 (人/車線など) にマッピングされている異なるセンサーの関連付けを処理し、センサーによる誤検出によって引き起こされる可能性のある異常を排除することです。シングルセンサー。ただし、フュージョンと予測の根本的な違いは、フュージョンが過去と現在の瞬間からの情報のみを処理し、外部の瞬間は処理しないことです。 予測では、融合結果に基づいて、10msから5分の未来時間を判定します。これには、信号の予測、周囲の障害物の走行経路の予測、遠くのコーナリング位置の予測などが含まれます。さまざまな期間の予測により、対応する期間の計画とさまざまな粒度の予測が提供されるため、計画を調整するためのより大きなスペースが提供されます。 #計画制御 - 階層戦略の分解 #計画とは、無人車両が特定の目標を達成するためにいくつかの効果的な決定を下すことです。 . 目的を持った意思決定のプロセス。自動運転車の場合、この目標は通常、障害物を回避しながら出発点から目的地に到達し、運転軌道と動作を継続的に最適化して乗客の安全と快適性を確保することを指します。計画の構造的な要約は、異なる粒度の環境に基づいて情報を統合し、外部目標から開始して層ごとの評価と分解を実行し、最終的に実行者に渡して完全な意思決定を形成することです。 計画モジュールは通常、ミッション計画、行動計画、動作計画の 3 つの層に分かれており、その中核となるのは、道路ネットワークと離散パスに基づいてグローバル パスを取得することです。探索アルゴリズムには、多くの場合長いサイクルを持つ大規模なタスク タイプが与えられ、行動計画は有限状態マシンに基づいて、車両が中サイクル (左折、道路、回避、E) でとるべき特定の行動を決定します。 -STOP) を選択し、いくつかの境界パラメータとおおよそのパス範囲を設定します。動作計画層は多くの場合、サンプリングまたは最適化手法に基づいて、最終的に快適性と安全性の要件を満たす唯一の経路を取得します。最後に、制御モジュールに渡されて、フィードフォワード予測およびフィードバック制御アルゴリズムを通じて独自のパスに従い、ブレーキ、ステアリング、スロットル、ボディ、その他のアクチュエーターを操作して最終的にコマンドを実行します。 あなたがどこまで理解できたかはわかりませんが、上記は自動運転の原理の単なる紹介です。自動運転の現在の理論、アルゴリズム、アーキテクチャは非常に急速に発展していますが、上記は内容は比較的基本的なものであり、知識ポイントは長期間にわたって古くなることはありません。しかし、新たな要求により、自動運転のアーキテクチャと原則に多くの新たな理解がもたらされました。
以上がこの記事では自動運転についてわかりやすく解説します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。