Recherche sur les données en boucle fermée : le développement de la conduite autonome passe d'une conduite technologique à une conduite axée sur les données-IA-php.cn

Zos Auto R&D a publié"Rapport de recherche en boucle fermée sur les données de conduite autonome en Chine en 2022".

1. Le développement de la conduite autonome passe progressivement de la technologie à la conduite des données

Aujourd'hui, les solutions de capteurs de conduite autonome et les plates-formes informatiques sont devenues de plus en plus homogènes et l'écart technologique entre les fournisseurs se réduit de plus en plus. Au cours des deux dernières années, les itérations technologiques de conduite autonome ont progressé rapidement et la production de masse s’est accélérée. Selon le centre de données Zuosi, en 2021, le nombre cumulé de véhicules de tourisme nationaux à conduite assistée L2 atteindra 4,79 millions, soit une augmentation d'une année sur l'autre de 58,0 %. De janvier à juin 2022, le taux de pénétration de la conduite assistée L2 en Chine sur le marché des voitures particulières neuves a grimpé à 32,4 %.

Pour la conduite autonome, les données parcourent tout le cycle de vie : recherche et développement, tests, production de masse, exploitation et maintenance. Avec l'augmentation rapide du nombre de capteurs de voitures intelligentes connectées, la quantité de données ADAS et de véhicules autonomes générées a également augmenté de façon exponentielle, passant de GB à TB, PB, EB et même ZB à l'avenir. Ce n’est qu’en utilisant l’évolution automobile basée sur les données pour répondre aux besoins personnalisés des utilisateurs que les constructeurs automobiles pourront aller loin.

Selon les « Directives de sécurité pour le traitement des données de collecte automobile », les données de collecte automobile font référence aux données collectées par les équipements de détection et les unités de contrôle automobiles, ainsi qu'aux données générées après le traitement, qui peuvent être subdivisées en données externes et données du cockpit, données d'exploitation et données de trajectoire de position, etc.

Recherche sur les données en boucle fermée : le développement de la conduite autonome passe dune conduite technologique à une conduite axée sur les données

Selon les « Plusieurs réglementations sur la gestion de la sécurité des données automobiles (essai) » promulguées par l'Administration du cyberespace de Chine en août 2021, des réglementations détaillées ont été élaborées sur l'ensemble du processus de collecte, d'analyse, de stockage et de transmission des données automobiles. , requête, application et suppression. Dans le processus de traitement des données automobiles, nous adhérons aux principes de traitement des données de « traitement en voiture », « aucune collecte par défaut », « plage de précision applicable », « traitement de désensibilisation », etc. afin de réduire la collecte désordonnée et illégale. abus des données du véhicule. Dans le processus de développement de technologies de conduite autonome, la collecte et le traitement des données doivent d’abord être légaux et conformes.

Collecte/nettoyage de données

Les grandes quantités de données non structurées (images, vidéos, voix) collectées à partir des caméras de voiture, des radars à ondes millimétriques, des radars lidar et à ultrasons peuvent être brutes et désordonnées. Pour donner du sens aux données, elles doivent être nettoyées, structurées et organisées. Les données provenant de plusieurs sources sont d'abord importées dans le référentiel approprié, le format des données est standardisé et agrégé selon les règles pertinentes. Il vérifie ensuite les points de données corrompus, en double ou manquants et supprime les données inutiles susceptibles d'affecter la qualité globale de l'ensemble de données. Enfin, les étiquettes sont utilisées pour classer les vidéos capturées dans différentes conditions, comme le jour, la nuit, le soleil, la pluie, etc. Cette étape fournit des données propres et structurées qui seront utilisées pour la formation et la validation.

Annotation des données

Les données structurées qui ont été nettoyées après la collecte des données doivent être annotées. L'annotation est le processus d'attribution de valeurs codées aux données brutes. Les valeurs codées incluent, sans s'y limiter, l'attribution d'étiquettes de classe, le dessin de cadres de délimitation et le marquage des limites des objets. Des annotations de haute qualité sont nécessaires pour enseigner aux modèles d'apprentissage supervisé ce que sont les objets et pour mesurer les performances des modèles formés.

Recherche sur les données en boucle fermée : le développement de la conduite autonome passe dune conduite technologique à une conduite axée sur les données

Dans le domaine de la conduite autonome, les scénarios de traitement des annotations de données incluent généralement les changements de voie et les dépassements, le passage aux intersections, les virages à gauche non protégés et les virages à droite sans contrôle des feux de circulation, ainsi que certains long-tail complexes des scénarios tels que des véhicules passant des feux rouges et des véhicules traversant la route, des véhicules stationnés illégalement sur le bord de la route, etc.

Les outils d'annotation couramment utilisés incluent le dessin d'images universelles, l'annotation de lignes de voie, l'annotation du visage du conducteur, l'annotation de nuages de points 3D, l'annotation de fusion 2D/3D, la segmentation sémantique panoramique, etc. En raison du développement du big data et de l’augmentation du nombre de grands ensembles de données, l’utilisation d’outils d’annotation de données continue de se développer rapidement.

Transmission de données

De nos jours, la fréquence de collecte de données est entrée dans le niveau de la milliseconde, nécessitant des milliers de dimensions de signal (telles que les signaux de bus, les états internes des capteurs, les points enterrés logiciels, le comportement de l'utilisateur et l'environnement). Détection de données, etc.), tout en évitant la perte de données, le désordre, les sauts et les retards, et en comprimant considérablement les coûts de transmission/stockage sur la base d'une haute précision et d'une haute qualité. La liaison montante et descendante des données de l'Internet des Véhicules est relativement longue (du MCU, DCU, passerelle, 4G/5G du véhicule vers le cloud) et il est nécessaire de garantir la qualité de transmission des données de chaque nœud de liaison.

En réponse aux nouveaux changements dans la transmission de données, certaines entreprises ont été en mesure de fournir des solutions efficaces de collecte de données et de transmission intégrées dans le cloud du véhicule, telles que les solutions de plate-forme flexible d'acquisition de données Zhixiehui et EXCEEDDATA, basées sur des données en temps réel à la périphérie du véhicule. Environnement informatique, atteignant un niveau de calcul en temps réel de 10 millisecondes, utilisé pour déclencher la fonction flexible de collecte et de téléchargement de données. Les données téléchargées ont été calculées et filtrées, réduisant considérablement la quantité de données téléchargées. De plus, le signal original du véhicule est compressé et stocké 100 à 300 fois sans perte. La plate-forme de gestion cloud enregistre le signal de haute qualité du véhicule sans perte et avec un taux de compression élevé. Elle prend en charge l'émission d'algorithmes d'acquisition de données, le déclenchement. de plusieurs modes d'acquisition et téléchargement en temps réel des données collectées en un clic sur le bureau de l'entreprise, filtrage flexible multiple par véhicule, événement, période de temps, etc., facile à utiliser et à résoudre, séparation du stockage et du calcul, réaliser une boucle fermée de collecte-calcul-téléchargement-traitement de données isomorphes véhicule-cloud En 2021, le premier modèle national produit en série équipé de la solution EXCEEDDATA a été lancé (HiPhiX).

Recherche sur les données en boucle fermée : le développement de la conduite autonome passe dune conduite technologique à une conduite axée sur les données

Source : Zhixie Huitong

Stockage de données

Afin de percevoir plus clairement l'environnement, les voitures autonomes sont équipées de plus de capteurs et génèrent une grande quantité de données. Certains systèmes de conduite autonome de haut niveau sont même équipés de plus de 40 capteurs différents pour percevoir avec précision l'environnement à 360° autour du véhicule. Le développement de systèmes de conduite autonome nécessite plusieurs étapes telles que la collecte de données, l'agrégation de données, le nettoyage et l'étiquetage, la formation de modèles, la simulation et l'analyse de mégadonnées. Ce processus implique l'agrégation et le stockage de données massives, le flux de données entre différents systèmes dans différents liens. , et lire et écrire d'énormes quantités de données pendant la formation du modèle. Les données sont confrontées à de nouveaux défis avec les goulots d'étranglement du stockage.

Pour cette raison, les technologies et les capacités de nombreux fournisseurs de services cloud dans ce domaine sont devenues la clé pour aider les constructeurs automobiles à gagner. Par exemple, Amazon Cloud Technology AWS utilise le lac de données de conduite autonome comme centre pour aider les constructeurs automobiles à créer une boucle fermée de données de conduite autonome de bout en bout. Utilisez Amazon Simple Storage Service (Amazon S3, service de stockage d'objets cloud) pour créer un lac de données de conduite autonome afin de réaliser la collecte de données, la gestion et l'analyse des données, l'annotation des données, le développement de modèles et d'algorithmes, la vérification de simulation, le développement de cartes, DevOps et MLOps, et constructeurs automobiles Il peut réaliser plus facilement le développement, les tests et l'application de l'ensemble du processus de conduite autonome.

Recherche sur les données en boucle fermée : le développement de la conduite autonome passe dune conduite technologique à une conduite axée sur les données

Source : AWS

Parmi les géants nationaux de la technologie, prenons comme exemple la solution de données en boucle fermée de Baidu. Son stockage de données fournit des services de récupération de données pour les informations multi-sources en bord de route et sur les véhicules, qui sont utilisées dans les entreprises. La recherche massive de données présente les avantages d'une récupération multidimensionnelle (informations sur le véhicule, kilométrage, durée de conduite autonome, etc.), d'une gestion de l'ensemble du cycle de vie de la production des données à leur destruction, de la prise en charge des vues panoramiques des données, de la traçabilité des données et de l'ouverture. partage de données.

Architecture de solution en boucle fermée de données de conduite autonome Baidu

Recherche sur les données en boucle fermée : le développement de la conduite autonome passe dune conduite technologique à une conduite axée sur les données

Source : Baidu

2. Le développement efficace de la conduite autonome nécessite la construction d'un système de données en boucle fermée

Le développement de la conduite autonome est passé de la technologie- piloté par les données, mais le modèle commercial basé sur les données Confronté à de nombreuses difficultés.

Il est difficile de traiter des données massives : la quantité de données collectées chaque jour par des véhicules d'essai de conduite autonome de haut niveau est de niveau To, et l'équipe de développement a besoin d'un espace de stockage de niveau PB. Cependant, parmi ces données, seulement environ moins. plus de 1% des données précieuses peuvent être utilisées pour la formation 5%. En outre, il existe des exigences strictes de conformité en matière de sécurité pour les données collectées par des capteurs tels que les caméras des véhicules, le lidar et le positionnement de haute précision, ce qui pose sans aucun doute de grands défis en matière d'accès, de stockage, de désensibilisation et de traitement de données massives.

Le coût de l'annotation des données est élevé : l'annotation des données demande beaucoup de main d'œuvre et de temps. Avec le développement de capacités de conduite autonome de haut niveau, la complexité des scénarios continue d’augmenter et des scénarios plus difficiles apparaîtront. L'amélioration de la précision du modèle de perception du véhicule impose des exigences plus élevées en termes d'échelle et de qualité de l'ensemble de données de formation. L'annotation manuelle traditionnelle n'a pas été en mesure de répondre à la demande d'ensembles de données massifs pour la formation de modèles en termes d'efficacité et de coût.

Faible efficacité des tests de simulation : la simulation virtuelle est un moyen efficace pour accélérer la formation d'algorithmes de conduite autonome, mais les scénarios de simulation sont difficiles à construire et ont un faible degré de restauration, en particulier certains scénarios complexes et dangereux, qui sont difficiles à construire. De plus, la capacité de simulation parallèle est insuffisante, l'efficacité des tests de simulation est faible et le cycle d'itération de l'algorithme est trop long.

La couverture cartographique de haute précision est faible : les cartes de haute précision reposent principalement sur des cartes auto-collectées et créées par eux-mêmes, et ne peuvent répondre aux scénarios de routes désignées qu'au stade expérimental. À l’avenir, il sera commercialisé et étendu aux rues des grandes villes du pays. Il sera confronté à des défis très importants en termes de couverture, de mises à jour dynamiques, ainsi que de coût et d’efficacité.

Afin de résoudre diverses difficultés et problèmes, le développement efficace de la conduite autonome nécessite la construction d'un système de données efficace en boucle fermée.

Recherche sur les données en boucle fermée : le développement de la conduite autonome passe dune conduite technologique à une conduite axée sur les données

Source : Freetech

En ce qui concerne la boucle fermée des données de conduite autonome, les Corner Cases doivent être résolus en permanence lors de la mise en œuvre de la conduite autonome. Pour cela, nous devons disposer de suffisamment de données. échantillons et véhicules pratiques Méthode de vérification finale. Le mode Ombre est l’une des meilleures solutions pour résoudre les cas d’angle.

Le mode Shadow a été proposé par Tesla en avril 2019 et appliqué à la voiture pour comparer les décisions associées et déclencher le téléchargement de données. Le logiciel de conduite autonome du véhicule vendu est utilisé pour enregistrer en continu les données détectées par les capteurs et les retransmettre de manière sélective au moment approprié pour l'apprentissage automatique et l'amélioration de l'algorithme de conduite autonome d'origine.

Recherche sur les données en boucle fermée : le développement de la conduite autonome passe dune conduite technologique à une conduite axée sur les données

Le superordinateur Dojo peut utiliser des données vidéo massives pour des annotations et des entraînements non supervisés.

En 2021, Tesla a livré 936 200 véhicules dans le monde, dont 484 100 véhicules ont été livrés par l'usine chinoise. Au premier semestre 2022, 560 000 véhicules seront livrés. Tesla profite de la production de masse et optimise en permanence les algorithmes grâce au mode ombre. Grâce au mode ombre, des millions de véhicules vendus sont utilisés comme véhicules de test pour capturer les perceptions environnantes et les conditions routières particulières, et renforcer continuellement la capacité à prédire, éviter et tirer des leçons des événements incertains. Parce qu'il y a des millions de véhicules vendus pour le prendre en charge, la couverture des cas de coin et des conditions de travail extrêmes sera plus complète. Les données de haute qualité collectées par un déclenchement flexible peuvent itérer de meilleurs algorithmes, et l'excellence de l'itération des algorithmes détermine la valeur de. logiciel. En termes de services d’abonnement aux mises à niveau logicielles, la puissance explosive de la boucle fermée de données vient d’émerger.

3. Les données en boucle fermée deviennent le cœur de la mise à niveau itérative de la conduite autonome

La condition préalable à l'itération continue du système de conduite autonome est l'optimisation continue de l'algorithme, et l'excellence de l'algorithme en dépend les performances du système de données en boucle fermée. Les données dans la conduite autonome Il est crucial de développer une circulation à haute efficacité pour chaque scénario, et l'intelligence des données sera la clé pour accélérer la production de masse de la conduite autonome.

En décembre 2021, Haomo Zhixing a officiellement lancé MANA Xuehu, le premier système chinois d'intelligence des données de conduite autonome, pour accélérer l'évolution de la technologie de conduite autonome à partir des cinq principales capacités de perception, cognition, annotation, simulation et calcul. Au cours des trois prochaines années, le système d’assistance à la conduite pourra être installé sur plus d’un million de voitures particulières. S'appuyant sur son système de conduite autonome entièrement développé par lui-même, Haomo Zhixing a obtenu des avantages significatifs dans l'accumulation, le traitement et l'application des données. Les données massives apportent l’avantage de l’itération technologique. Les avantages de la réduction des coûts et de l’augmentation de l’efficacité sont évidents.

Pour un autre exemple, Momenta a atteint des capacités techniques de pointe basées sur les données, y compris des modules d'algorithmes tels que la perception, la fusion, la prédiction et le contrôle, qui peuvent être efficacement itérés et mis à jour de manière basée sur les données. Son automatisation en boucle fermée est un ensemble de chaînes d'outils qui permettent au flux de données de piloter l'itération automatique d'algorithmes basés sur les données. CLA peut filtrer automatiquement d'énormes quantités de données précieuses, piloter l'itération automatique des algorithmes et faire tourner le volant autonome de plus en plus vite.

Recherche sur les données en boucle fermée : le développement de la conduite autonome passe dune conduite technologique à une conduite axée sur les données Source : Momenta

Dans le contexte des voitures définies par logiciel, les données, les algorithmes et la puissance de calcul constituent la troïka du développement de la conduite autonome. Les cycles de recherche et de développement des constructeurs automobiles sont raccourcis et les itérations de fonctions sont accélérées à l'avenir, étant capables de collecter en continu des données à faible coût, avec une efficacité et une efficacité élevées, et d'itérer des algorithmes sur des données réelles pour finalement former une boucle fermée de données et. une activité commerciale en boucle fermée est la clé du développement durable des entreprises de conduite autonome.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!