Les données synthétiques peuvent-elles améliorer l'intelligence artificielle ?-IA-php.cn

Bien que l’intelligence artificielle (IA) soit devenue plus avancée en raison de développements exponentiels, les limites de cette technologie moderne existent toujours.

Alors, les données synthétiques peuvent-elles être la solution à tous les problèmes liés à l’IA ?

Au cours de la quatrième révolution industrielle, chaque industrie a découvert le potentiel des technologies modernes telles que l'intelligence artificielle (IA) et l'apprentissage automatique (ML).

Presque toutes les autres organisations déploient l'IA pour créer des processus commerciaux plus efficaces et garantir une meilleure satisfaction client. Cependant, les startups, les SOHO et les petites et moyennes entreprises (PME) sont confrontées à un problème majeur lorsqu’elles adoptent l’IA : c’est ce qu’on appelle le problème du démarrage à froid. Alors que les startups et les PME ne disposent généralement pas des ressources nécessaires pour collecter des données volumineuses, le problème du démarrage à froid réside essentiellement dans le manque de données pertinentes.

D'un autre côté, les géants de l'industrie disposent déjà des ressources nécessaires pour collecter des données du monde réel et les appliquer pour entraîner leurs systèmes d'IA. Les chances de victoire des petites et moyennes entreprises sont donc grandes. Dans ce cas, les données synthétiques peuvent être le catalyseur nécessaire.

Les données synthétiques peuvent être le moteur des modèles économiques basés sur les données. De plus, des études ont montré que les données synthétiques produisent les mêmes résultats que les données réelles. Les données synthétiques sont considérées comme moins chères et prennent moins de temps à traiter que les données réelles. Par conséquent, l’émergence de données synthétiques peut uniformiser les règles du jeu actuellement dominées par les grandes entreprises en faveur des PME et des startups.

Découvrez les avantages des données synthétiques

Les données synthétiques sont des données artificielles générées par ordinateur basées sur des paramètres spécifiés par l'utilisateur pour garantir que les données sont aussi proches que possible des données historiques du monde réel. En règle générale, les moteurs de jeu tels qu'Unreal Engine et Unity sont souvent utilisés comme environnements de simulation pour tester et former des applications basées sur l'IA telles que les voitures autonomes. Il existe de nombreux avantages à développer des applications basées sur l’IA et basées sur des données synthétiques. Certains des avantages incluent :

Les données synthétiques peuvent-elles améliorer lintelligence artificielle ?

1. Développement de prototypes

Trouver, agréger et modéliser de grandes quantités de données pertinentes du monde réel est un processus fastidieux. Par conséquent, générer des données synthétiques peut être la meilleure solution. Ces données permettront de construire des prototypes et de tester ces prototypes pour obtenir les résultats souhaités avant la production en série. Construire des prototypes à l’aide de données synthétiques est plus efficace et plus rentable que des données réelles.

Open AI, une société de recherche à but non lucratif sur l'intelligence artificielle, développe un grand nombre d'applications basées sur l'intelligence artificielle. Parmi ces applications, les chercheurs ont développé des robots entraînés avec des données synthétiques qui peuvent apprendre une nouvelle tâche après avoir vu une seule action effectuée. Une startup technologique californienne développe une plateforme d’intelligence artificielle avec une vision similaire à Amazon Go. La startup vise à fournir des solutions sans caisse aux dépanneurs et aux détaillants à l’aide de données synthétiques. Ils ont également introduit des systèmes intelligents basés sur l'IA pour surveiller chaque acheteur dans le magasin afin d'identifier et d'analyser leurs modèles d'apprentissage.

2. Garantir la confidentialité des données

En novembre 2018, 500 millions de clients Marriott ont été touchés par une violation de données très médiatisée. Sur ces 500 millions de personnes, 327 millions d’utilisateurs se sont vu voler leurs données, notamment les informations de passeport, les adresses e-mail, les adresses postales et les informations de carte de crédit. En raison de tels incidents, les gens s’inquiètent de la sécurité et de la confidentialité de leurs données.

Les données synthétiques peuvent résoudre efficacement de tels problèmes de confidentialité. Les données synthétiques n'incluent aucune donnée personnelle. La confidentialité des données peut donc être facilement garantie. Les données synthétiques sont extrêmement utiles dans la formation des systèmes d’IA pour les applications de santé. Les systèmes d’IA nécessitent souvent des données réelles sur les patients. Cela menace la vie privée des patients. Les données synthétiques permettent le développement d’applications avancées d’intelligence artificielle dans le domaine de la santé tout en préservant la confidentialité des patients.

Par exemple, des chercheurs de Nvidia, en collaboration avec la Mayo Clinic du Minnesota et le MGH et BWH Clinical Data Science Center de Boston, utilisent des réseaux antagonistes génératifs pour générer des données synthétiques pour entraîner les réseaux neuronaux. Les données synthétiques générées contiennent 3 400 IRM de l’ensemble de données de l’Alzheimer’s Disease Neuroimaging Initiative et 200 IRM cérébrales 4D et tumeurs de l’ensemble de données de référence de segmentation d’images de tumeurs cérébrales multimodales. De même, les rayons X simulés peuvent être utilisés parallèlement aux rayons X réels pour entraîner les systèmes d’IA à reconnaître plusieurs problèmes de santé.

3. Tests de scénarios et formation sans précédent

L'un des processus les plus importants dans le développement d'applications basées sur l'IA consiste à tester les performances du système. Si le système ne produit pas le résultat souhaité, il doit être recyclé. Dans ce cas, les données synthétiques peuvent s’avérer bénéfiques. Les données synthétiques peuvent générer des scénarios pour tester les systèmes d’IA au lieu d’utiliser des données réelles ou de tester le système dans un environnement réel. Cette méthode est moins coûteuse et prend moins de temps que l’obtention de données réelles.

De même, les données synthétiques peuvent également entraîner des systèmes nouveaux ou existants pour des scénarios qui pourraient survenir dans le futur et qui manquent de données ou d'événements réels. Grâce à cette approche, les chercheurs peuvent développer des applications d’IA plus futuristes. De plus, le recyclage des systèmes d’IA à l’aide de données synthétiques est plus simple, car la génération de données synthétiques est plus simple que la collecte de données précises du monde réel.

Grâce à ces avantages, les données synthétiques sont devenues une alternative accessible pour tester et former les véhicules autonomes. De nombreux développeurs de voitures autonomes utilisent des environnements de jeu simulés comme GTA V pour entraîner leurs systèmes basés sur l'IA. De même, May Mobility construit un service de micromobilité autonome en formant ses véhicules à l'aide de données synthétiques.

Un autre développeur de voitures autonomes appelé Waymo a déjà testé ses voitures autonomes en parcourant 5 milliards de kilomètres sur des routes simulées et 8 millions de kilomètres supplémentaires sur des routes réelles. L'approche des données synthétiques permet aux développeurs de tester leurs voitures autonomes sur des routes simulées, ce qui est beaucoup plus sûr que les tests directs sur des routes réelles.

4. Améliorer la flexibilité des données

L'obtention de données réelles est un processus fastidieux qui implique de payer pour l'annotation et de s'assurer que toute violation du droit d'auteur est évitée. De plus, les données réelles ne peuvent être utilisées que dans des scénarios spécifiques disposant de suffisamment de données historiques dans un domaine spécifique. Contrairement aux données réelles, les données synthétiques peuvent représenter instantanément n’importe quelle combinaison d’objets, de scènes, d’événements et de personnes. Les données synthétiques peuvent générer des ensembles de données généraux permettant de découvrir des applications de niche. En conséquence, les chercheurs peuvent explorer des possibilités infinies grâce aux données synthétiques. Plusieurs startups créent une économie de données ouvertes en développant des ensembles de données de formation qui répondent aux exigences des clients.

5. Explorer les limites des données synthétiques

Bien que les données synthétiques puissent aider l'IA à atteindre des territoires inconnus, leurs limites peuvent devenir un obstacle majeur à son déploiement généralisé. Pour commencer, les données synthétiques simulent plusieurs propriétés des données du monde réel, mais elles ne reproduisent pas exactement les données originales. Lors de la modélisation de telles données synthétiques, les systèmes d’IA rechercheront uniquement des tendances et des situations communes dans les données réelles. Par conséquent, les scénarios rares contenus dans des cas extrêmes dans les données réelles pourraient ne jamais être inclus dans les données synthétiques.

De plus, les chercheurs n'ont pas encore développé de mécanisme permettant de vérifier si les données sont exactes. Trouver des failles dans des données réelles et les réduire est plus simple que d'utiliser des données synthétiques. Les systèmes basés sur l’IA ont déjà un « côté obscur » qui favorise les biais involontaires. En utilisant des données synthétiques, il est peut-être prématuré de prédire l’ampleur et l’impact de ce biais.

6. Surmonter les défis

La nécessité pour les entreprises de comprendre que les données synthétiques sont une découverte relativement nouvelle. L'efficacité et l'exactitude de ces données n'ont pas été évaluées par rapport aux normes actuelles de l'industrie. Par conséquent, les données synthétiques ne doivent pas être considérées comme une source de données autonome. En particulier dans les applications confrontées à des problèmes de sécurité, telles que les applications de soins de santé et les voitures autonomes, les données synthétiques doivent être combinées avec des données réelles pour développer des systèmes d'IA. Mais les applications du commerce de détail présentent un facteur de risque moindre et peuvent facilement s’appuyer sur des données synthétiques.

À des fins de tests, les données synthétiques sont une solution viable et rentable. Cependant, à d’autres fins, les résultats d’un système d’IA doivent être étudiés et analysés en profondeur avant d’utiliser des données synthétiques comme solution autonome. Avec des recherches plus approfondies, les données synthétiques pourraient devenir plus fiables pour diverses opérations.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!