Table des matières
La première étape dans l'application quotidienne des robots : vous pouvez effectuer directement des tâches que vous n'avez jamais vues auparavant
La deuxième étape de la robotisation quotidienne : la vitesse de prise de décision doit être rapide
Pas assez de données ? Créez-le vous-même
En parlant des robots Google, nous devons mentionner
Maison Périphériques technologiques IA Le robot DeepMind de Google a publié trois résultats d'affilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.

Le robot DeepMind de Google a publié trois résultats d'affilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.

Jan 11, 2024 pm 10:36 PM
ai former

Presque en même temps que le robot « Shrimp Fried and Dishwashing » de Stanford, Google DeepMind a également publié ses derniers résultats en matière d'intelligence incarnée.

Le robot DeepMind de Google a publié trois résultats daffilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.

et c'est trois plans consécutifs :

Tout d'abord, un nouveau modèle qui se concentre sur l'amélioration de la vitesse de prise de décision, ce qui augmente la vitesse de fonctionnement du robot (par rapport au transformateur robotique d'origine) de 14 % - rapide Dans le même temps, la qualité n'a pas diminué et la précision a augmenté de 10,6 %.

Le robot DeepMind de Google a publié trois résultats daffilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.

Ensuite, il existe un nouveau cadre spécialisé dans les capacités de généralisation, qui peut créer des invites de trajectoire de mouvement pour le robot, lui permettant de faire face à 41 tâches inédites et d'atteindre un taux de réussite de 63 %.

Le robot DeepMind de Google a publié trois résultats daffilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.

Ne sous-estimez pas ce tableau, Par rapport aux 29% précédents, l'amélioration est assez importante.

Le dernier est un système de collecte de données sur les robots, qui peut gérer 20 robots à la fois. Jusqu'à présent, 77 000 données expérimentales ont été collectées à partir de leurs activités. Elles aideront Google à mieux mener à bien les travaux de formation ultérieurs.

Le robot DeepMind de Google a publié trois résultats daffilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.

Alors, quels sont ces trois résultats spécifiquement ? Regardons-les un par un.

La première étape dans l'application quotidienne des robots : vous pouvez effectuer directement des tâches que vous n'avez jamais vues auparavant

Google a souligné que pour réaliser un robot capable de véritablement entrer dans le monde réel, deux défis fondamentaux doivent être résolus.

1. Nouvelle capacité de promotion de tâches

2. Améliorer la vitesse de prise de décision

Les deux premiers résultats de cette série en trois parties sont principalement des améliorations dans ces deux domaines, et tous deux sont basés sur le modèle de robot de base de Google, Robotics Transformer( En abrégé RT) .

Regardons d'abord le premier : RT-Trajectory qui aide les robots à généraliser.

Pour les humains, des tâches telles que nettoyer la table sont faciles à comprendre, mais les robots ne les comprennent pas très bien.

Mais heureusement, nous pouvons lui transmettre cette instruction de diverses manières possibles, afin qu'il puisse entreprendre de véritables actions physiques.

D'une manière générale, la méthode traditionnelle consiste à mapper la tâche en une action spécifique, puis à laisser le bras du robot la terminer. Par exemple, essuyer la table peut être démonté en « fermez la pince, bougez à gauche, bougez à droite ».

Évidemment, la capacité de généralisation de cette méthode est très faible.

Ici, la nouvelle trajectoire RT proposée par Google apprend au robot à effectuer des tâches en lui fournissant des repères visuels.

Le robot DeepMind de Google a publié trois résultats daffilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.

Plus précisément, les robots contrôlés par RT-Trajectory ajouteront des données améliorées de trajectoire 2D pendant l'entraînement.

Ces trajectoires sont présentées sous forme d'images RVB, comprenant des itinéraires et des points clés, fournissant des conseils de bas niveau mais très utiles à mesure que le robot apprend à effectuer des tâches.

Avec ce modèle, le taux de réussite des robots effectuant des tâches inédites a été directement augmenté jusqu'à 1 fois (par rapport au modèle de robot de base RT-2 de Google, de 29% => 63%) .

Ce qui mérite d'être mentionné, c'est que RT-Trajectory peut créer des trajectoires de diverses manières, notamment :
en regardant des démonstrations humaines, en acceptant des croquis dessinés à la main et générés par VLM (Modèle de langage visuel).

Le robot DeepMind de Google a publié trois résultats daffilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.

La deuxième étape de la robotisation quotidienne : la vitesse de prise de décision doit être rapide

Une fois la capacité de généralisation améliorée, nous nous concentrerons sur la vitesse de prise de décision.

Le modèle RT de Google utilise l'architecture Transformer Bien que le Transformer soit puissant, il s'appuie fortement sur le module d'attention à complexité quadratique.

Par conséquent, une fois que l'entrée du modèle RT est doublée (par exemple, en équipant le robot d'un capteur à plus haute résolution) , les ressources informatiques nécessaires pour le traiter augmenteront jusqu'à quatre fois, ce qui ralentira sérieusement la décision. -vitesse de fabrication.

Afin d'améliorer la vitesse des robots, Google a développé SARA-RT sur le modèle de base Robotics Transformer.

SARA-RT utilise une nouvelle méthode de réglage fin du modèle pour rendre le modèle RT d'origine plus efficace.

Cette méthode est appelée "up training" par Google. Sa fonction principale est de convertir la complexité quadratique originale en complexité linéaire tout en conservant la qualité du traitement.

Lorsque SARA-RT est appliqué au modèle RT-2 avec des milliards de paramètres, ce dernier peut atteindre des vitesses de fonctionnement plus rapides et une plus grande précision sur une variété de tâches.

Il convient également de mentionner que SARA-RT fournit une méthode universelle pour accélérer Transformer sans pré-formation coûteuse, afin qu'il puisse être bien promu.

Pas assez de données ? Créez-le vous-même

Enfin, afin d'aider les robots à mieux comprendre les tâches assignées par les humains, Google est également parti des données et a directement construit un système de collecte : AutoRT.

Ce système combine de grands modèles (y compris LLM et VLM) avec des modèles de contrôle de robot (RT) pour diriger en continu le robot afin qu'il effectue diverses tâches dans le monde réel, générant et collectant ainsi des données.

Le processus spécifique est le suivant :

Laissez le robot contacter "librement" l'environnement et se rapprocher de la cible.

Utilisez ensuite l'appareil photo et le modèle VLM pour décrire la scène devant vous, y compris les éléments spécifiques.

Ensuite, LLM utilise ces informations pour générer plusieurs tâches différentes.

Veuillez noter qu'après avoir été généré, le robot ne sera pas exécuté immédiatement. Au lieu de cela, LLM sera utilisé pour filtrerquelles tâches peuvent être accomplies indépendamment, lesquelles nécessitent un contrôle à distance humain et lesquelles ne peuvent pas être accomplies. tous.

Ce qui ne peut pas être fait, c'est "ouvrir le sac de chips" car cela nécessite deux bras robotisés (1 seulement par défaut) .

Le robot DeepMind de Google a publié trois résultats daffilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.

Ensuite, après avoir terminé cette tâche de dépistage, le robot peut réellement l'exécuter.

Enfin, le système AutoRT finalise la collecte de données et effectue une évaluation de la diversité.

Selon les rapports, AutoRT peut coordonner jusqu'à 20 robots à la fois. En 7 mois, un total de 77 000 données de test, dont 6 650 tâches uniques, ont été collectées.

Enfin, pour ce système, Google met également l'accent sur la sécurité.

Après tout, les tâches de collecte d’AutoRT s’appliquent au monde réel et les « garde-corps de sécurité » sont indispensables.

Plus précisément, le code de sécurité de base, fourni par le LLM qui contrôle les tâches des robots, s'inspire en partie des trois lois de la robotique d'Isaac Asimov – avant tout « Un robot ne doit pas nuire à un être humain

La deuxième exigence est. » que le robot ne doit pas tenter de tâches impliquant des humains, des animaux, des objets pointus ou des appareils électriques

Mais cela ne suffit pas

AutoRT est donc également équipé de plusieurs niveaux de mesures de sécurité pratiques dans la robotique ordinaire. Par exemple, le robot s'arrête automatiquement lorsque. la force exercée sur ses articulations dépasse un seuil donné, toutes les actions peuvent être stoppées par des interrupteurs physiques qui restent à la vue humaine, et plus encore

Le robot DeepMind de Google a publié trois résultats daffilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps. Envie d'en savoir plus sur cette dernière fournée de résultats de Google

Bonne nouvelle, sauf ? pour RT-Trajectory, qui publie uniquement des articles, le reste est publié avec le code et les articles. Vous êtes invités à vérifier plus ~

One More Thing

En parlant des robots Google, nous devons mentionner

RT-2

. (Tous les résultats de cet article sont également basés sur cela) Ce modèle a nécessité 7 mois de travail de 54 chercheurs de Google et est sorti fin juillet de cette année

Il intègre le multimodal visuel-texte. modèle VLM, peut non seulement comprendre les « mots humains », mais peut également raisonner sur les « mots humains » et effectuer certaines tâches qui ne peuvent pas être accomplies en une seule étape, comme ramasser avec précision les « animaux disparus » de trois jouets en plastique : des lions, baleines et dinosaures", très étonnant.

Maintenant, en un peu plus de 5 mois, il a connu des améliorations rapides de ses capacités de généralisation et de sa vitesse de prise de décision. Nous ne pouvons nous empêcher de soupirer : je ne peux pas imaginer. qu'un robot va vraiment se précipiter dans le monde. À quelle vitesse cela sera-t-il pour des milliers de foyers ?

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Guide de construction d'Agnes Tachyon | Un joli Musume Derby
2 Il y a quelques semaines By Jack chen
Oguri Cap Build Guide | Un joli Musume Derby
3 Il y a quelques semaines By Jack chen
Péx: comment raviver les joueurs
4 Il y a quelques semaines By DDD
Guide de construction de Grass Wonder | Uma musume joli derby
1 Il y a quelques semaines By Jack chen
Pic comment émoter
3 Il y a quelques semaines By Jack chen

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

La popularité du cercle des devises est revenue, pourquoi les gens intelligents ont-ils commencé à augmenter tranquillement leurs positions? Regardez la tendance des données sur la chaîne et saisissez le prochain cycle de mot de passe de richesse! La popularité du cercle des devises est revenue, pourquoi les gens intelligents ont-ils commencé à augmenter tranquillement leurs positions? Regardez la tendance des données sur la chaîne et saisissez le prochain cycle de mot de passe de richesse! Jul 09, 2025 pm 08:30 PM

Au fur et à mesure que les conditions du marché accélèrent, de plus en plus d'investisseurs intelligents ont commencé à augmenter tranquillement leurs positions dans le cercle des devises. Beaucoup de gens se demandent ce qui les fait prendre de manière décisive lorsque la plupart des gens attendent et voient? Cet article analysera les tendances actuelles à travers des données sur la chaîne pour aider les lecteurs à comprendre la logique des fonds intelligents, afin de mieux saisir la prochaine série de possibilités de croissance potentielle de la richesse.

Quelles sont les chaînes publiques traditionnelles des crypto-monnaies? Les dix premiers classements des chaînes publiques traditionnelles de la crypto-monnaie en 2025 Quelles sont les chaînes publiques traditionnelles des crypto-monnaies? Les dix premiers classements des chaînes publiques traditionnelles de la crypto-monnaie en 2025 Jul 10, 2025 pm 08:21 PM

Le modèle dans le champ de la chaîne publique montre une tendance de "un super, beaucoup de forts et une centaine de fleurs fleurissant". Ethereum mène toujours avec ses douves écologiques, tandis que Solana, Avalanche et d'autres sont difficiles à affronter les performances. Pendant ce temps, Polkadot, Cosmos, qui se concentre sur l'interopérabilité, et ChainLink, qui est une infrastructure critique, forment une image future de plusieurs chaînes coexistant. Pour les utilisateurs et les développeurs, le choix de la plate-forme n'est plus un seul choix, mais nécessite un compromis entre les performances, le coût, la sécurité et la maturité écologique basée sur des besoins spécifiques.

L'évolution du contrat intelligent de Cardano: l'impact des mises à niveau d'Alonzo en 2025 L'évolution du contrat intelligent de Cardano: l'impact des mises à niveau d'Alonzo en 2025 Jul 10, 2025 pm 07:36 PM

La mise à niveau de Fork Hard Fork de Cardano a réussi à transformer Cardano d'un réseau de transfert de valeur vers une plate-forme de contrat intelligent entièrement fonctionnel en introduisant la plate-forme de contrat intelligent Plutus. 1. Plutus est basé sur le langage Haskell, avec des fonctionnalités puissantes, une sécurité améliorée et un modèle de coût prévisible; 2. Après la mise à niveau, le déploiement DAPPS est accéléré, la communauté des développeurs est élargie et les écosystèmes Defi et NFT se développent rapidement; 3. En 2025, l'écosystème de Cardano sera plus mature et diversifié. Combinée à l'amélioration de l'évolutivité à l'ère Basho, à l'amélioration de l'interopérabilité transversale, à l'évolution de la gouvernance décentralisée à l'ère Voltaire et à la promotion de l'adoption générale par les applications au niveau de l'entreprise, Cardano a

Le bitcoin brise de nouveaux sommets, Dogecoin rebondit fortement, Ethereum suivra le rythme Le bitcoin brise de nouveaux sommets, Dogecoin rebondit fortement, Ethereum suivra le rythme Jul 09, 2025 pm 08:24 PM

Récemment, Bitcoin a frappé un nouveau sommet, Dogecoin a inauguré un fort rebond et le marché était chaud. Ensuite, nous analyserons les moteurs du marché et les aspects techniques pour déterminer si Ethereum a toujours des opportunités de suivre la montée.

Le top 5 qui vaut la peine d'investir en 2025 (avec les dernières données) Le top 5 qui vaut la peine d'investir en 2025 (avec les dernières données) Jul 09, 2025 am 06:06 AM

Les cinq stablescoins les plus précieuses en 2025 sont l'attache (USDT), la pièce USD (USDC), le DAI (DAI), le premier USD numérique (FDUSD) et le TrueUSD (TUSD).

Le flux de fonds sur la chaîne est exposé: quels nouveaux jetons sont pariés par l'argent intelligent? Le flux de fonds sur la chaîne est exposé: quels nouveaux jetons sont pariés par l'argent intelligent? Jul 16, 2025 am 10:15 AM

Les investisseurs ordinaires peuvent découvrir des jetons potentiels en suivant "Smart Money", qui sont des adresses à but lucratif, et faire attention à leurs tendances peut fournir des indicateurs de premier plan. 1. Utilisez des outils tels que Nansen et Arkham Intelligence pour analyser les données sur la chaîne pour voir les achats et les avoirs de l'argent intelligent; 2. Utilisez des analyses Dune pour obtenir des tableaux de bord créés par la communauté pour surveiller le flux de fonds; 3. Suivez des plateformes telles que Lookonchain pour obtenir des renseignements en temps réel. Récemment, Congming Money prévoit de re-polissons la piste LRT, le projet Depin, l'écosystème modulaire et le protocole RWA. Par exemple, un certain protocole de LRT a obtenu une grande quantité de dépôts précoces, un certain projet de dépin a été accumulé en continu, une certaine chaîne publique de jeu a été soutenue par le trésor de l'industrie et un certain protocole RWA a attiré les institutions.

Qui émet des stablecoins? Quelles sont les stablecoins? Qui émet des stablecoins? Quelles sont les stablecoins? Jul 09, 2025 pm 06:24 PM

Les stablecoins sont des actifs cryptographiques qui maintiennent la stabilité des prix en ancrant les monnaies fiduciaires telles que le dollar américain. Ils sont principalement divisés en trois catégories: garantie de monnaie fiduciaire, garantie des actifs cryptographiques et stablecoins algorithmiques. 1. L'USDT est émis par Tether et est le stablecoin avec la plus grande valeur marchande et la liquidité la plus élevée. 2. USDC est publié par la Center Alliance lancée par Circle and Coinbase, et est connue pour sa transparence et sa conformité. 3. Dai est généré par Makerdao par une sur-collatéralisation des actifs cryptographiques et est la devise centrale dans le champ Defi. 4. Busd a été lancé en partenariat avec Paxos et est réglementé par les États-Unis mais a été interrompu. 5. TUSD atteint une vérification élevée de réserve de transparence via des comptes d'entiercement tiers. Les utilisateurs peuvent utiliser des échanges centralisés tels que Binance, Ouyi et Huobi

Quelle chaîne appartient à Dogecoin Doge? Dogecoin appartient-il à la chaîne de binance? Quelle chaîne appartient à Dogecoin Doge? Dogecoin appartient-il à la chaîne de binance? Jul 10, 2025 pm 08:39 PM

Récemment, la discussion dans le domaine des actifs numériques est restée chaude. Dogecoin Doge, comme l'une des objectifs les plus populaires, est devenue une question que beaucoup de gens ont exploré. Où est-ce que cela "se stabilise"? Quelle est la relation avec la plateforme de trading actuelle, Binance? Pour répondre à ces questions, nous devons effectuer une analyse approfondie des deux dimensions de la logique technique sous-jacente des actifs numériques et de l'écologie de la plate-forme, plutôt que de rester en apparence.

See all articles