Laissez le chien robot apprendre les données de mouvement d'un vrai chien, on a vraiment l'impression d'être un chien !
Il a franchi l'obstacle facilement, et le "propriétaire" derrière lui n'a presque pas pu suivre :
#🎜 🎜##🎜🎜 # percer un « trou de chien » est un chemin familier : Vous pouvez aussi en avoir deux les chiens s'amusent ensemble, il poursuit, il s'échappe... #.En utilisant le modèle pré-entraîné pour nourrir le chien robot avec les données de mouvement de vrais chiens et grâce à l'apprentissage par renforcement, le chien robot Max est non seulement plus agile dans son comportement, mais peut également « tirer des conclusions » basées sur sur les compétences qu'il maîtrise déjà pour s'adapter à des environnements plus complexes.
Pour résumer, c’est un peu plus « doggier » à l’intérieur comme à l’extérieur.
Chasser Sahuan'er stratégiquement
Parmi les nouvelles compétences que le chien robot a apprises cette fois, la plus forte est toujours Jouer jeux.
Le chien robot peut non seulement obéir aux règles, mais aussi
inventer ses propres stratégies pour gagner la partie, qui peuvent être plus intelligentes qu'un vrai chien.
Plus précisément, il s'agit d'une compétition de chasse à obstacles, inspirée du "World Chase Tag", les règles sont les suivantes : #🎜🎜 # Les chercheurs ont fixé différentes difficultés de jeu, la plus simple étant un champ ouvert :
Durant le jeu, le chien robot avait visiblement une stratégie.
Par exemple, généralement le poursuivant lancera une attaque féroce jusqu'à ce que l'esquive soit loin du drapeau d'échecs, le forçant dans un coin aveugle, et la partie est terminée.
Si le poursuivant constate que l'esquive est très proche du drapeau et n'a aucune chance de le rattraper , il abandonnera d'abord la poursuite et attendra que le prochain drapeau apparaisse : Peu importe s'il y a des obstacles, les deux chiens s'amusent de la même manière :Mais pouvoir performer ainsi, ce n'est pas parce que le chien robot a été entraîné à ce jeu depuis le début.
Il repose en fait sur certaines actions, connaissances et compétences que j'ai acquises pour faire face à ce scénario de jeu.
Comment le mettre en œuvre concrètement ? Regardez en bas.
données apprises sur de vrais chiens
La recherche est divisée en trois étapes.
Apprendre les postures de mouvement des animauxConnecter les postures de mouvement avec la perception externeAcquisition de réseau supplémentaire et informations liées à des tâches complexes#🎜 🎜 #La première étape consiste à collecter des données sur la posture de vrais chiens viavia le système de capture de mouvement couramment utilisé dans les jeux
, y compris la marche, la course, le saut, la position debout et d'autres actions , construisez une tâche d’apprentissage par imitation dans le simulateur.Ces technologies et données jouent également un certain rôle dans la formation des agents basée sur la simulation physique et le déploiement de stratégies de robot du monde réel.
Dans le processus d'apprentissage par imitation, le réseau neuronal n'accepte que lesinformations proprioceptives du chien robot en entrée
, comme un robot L'état du moteur sur le corps, etc.
À l'étape suivante, le modèle introduit des données sensorielles de l'environnement, telles que les obstacles sous les pieds qui sont « vus » à travers d'autres capteurs.
Dans la deuxième étape, grâce à des paramètres de réseau supplémentaires, la posture animale maîtrisée dans la première étape est connectée à des perception ensemble.
De cette manière, le chien robot peut répondre à l'environnement extérieur à travers les actions qu'il a apprises.
Lorsque le robot pourra s'adapter à une variété d'environnements complexes, les connaissances qui relient les postures des animaux à la perception externe seront également solidifiées et stockées dans la structure du réseau neuronal.
Ensuite, le chien robot peut monter les escaliers librement.
Ou courir sur un terrain discontinu ou accidenté :
#🎜🎜 ##🎜 🎜#
Ensuite, on arrive à la dernière étape, laisser le chien robot résoudre des problèmes pratiques en fonction des compétences acquises ci-dessus# 🎜🎜 # Il s'agit du processus de création de jeu mentionné ci-dessus.Selon les rapports, toutes les stratégies de contrôle du chien robot dans le jeu sont des stratégies de réseau neuronal.
Apprenez en simulation et laissez le réseau neuronal simuler le raisonnement humain grâce autransfert zéro-shot
pour identifier de nouvelles choses qui n'ont jamais été vues auparavant et déployer ces connaissances sur de vrais robots .Par exemple, si vous avez appris à éviter les obstacles dans le modèle pré-entraîné, alors si vous créez des obstacles dans le jeu, le chien robot peut facilement les gérer.
Ce nouveau progrès de recherche est apporté parTencent Robotics X Robot Laboratory
.L'expérience a été créée en 2018. Les projets de robots actuellement lancés incluent le chien robot de première/deuxième génération Max, le chien robot Jamoca, le robot à roues Ollie, les motos autonomes auto-équilibrées, etc.
One More Thing Il convient de mentionner que des chercheurs de l'UC Berkeley ont également utilisé une méthode de dressage de « vrais chiens » sur des chiens robots. Pieter Abbeel, le disciple fondateur de Ng, et d'autres ont laissé le chien robot rouler sur le sol pendant une heure et ont appris à marcher.L'année dernière, lorsque Tencent a sorti la deuxième génération de chien robot Max, dans une petite friandise, le chien "battre des pattes", "Courir pour s'amuser", ils ont vraiment la saveur des enfants à poils à la maison.
(Bien sûr, si vous souhaitez qu'il devienne un chien à l'écoute de son maître, vous pouvez lui donner des ordres via des commandes.)
#🎜🎜 ## 🎜🎜#
Disons simplement que l'orientation actuelle du développement des chiens robots n'est pas de faire des sauts périlleux, mais de « voler des emplois » avec de vrais chiens ?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!