Périphériques technologiques
IA
Le robot DeepMind de Google a publié trois résultats d'affilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.
Le robot DeepMind de Google a publié trois résultats d'affilée ! Les deux capacités ont été entièrement améliorées et le système de collecte de données peut gérer 20 robots en même temps.
Presque en même temps que le robot « Shrimp Fried and Dishwashing » de Stanford, Google DeepMind a également publié ses derniers résultats en matière d'intelligence incarnée.

et c'est trois plans consécutifs :
Tout d'abord, un nouveau modèle qui se concentre sur l'amélioration de la vitesse de prise de décision, ce qui augmente la vitesse de fonctionnement du robot (par rapport au transformateur robotique d'origine) de 14 % - rapide Dans le même temps, la qualité n'a pas diminué et la précision a augmenté de 10,6 %.

Ensuite, il existe un nouveau cadre spécialisé dans les capacités de généralisation, qui peut créer des invites de trajectoire de mouvement pour le robot, lui permettant de faire face à 41 tâches inédites et d'atteindre un taux de réussite de 63 %.

Ne sous-estimez pas ce tableau, Par rapport aux 29% précédents, l'amélioration est assez importante.
Le dernier est un système de collecte de données sur les robots, qui peut gérer 20 robots à la fois. Jusqu'à présent, 77 000 données expérimentales ont été collectées à partir de leurs activités. Elles aideront Google à mieux mener à bien les travaux de formation ultérieurs.

Alors, quels sont ces trois résultats spécifiquement ? Regardons-les un par un.
La première étape dans l'application quotidienne des robots : vous pouvez effectuer directement des tâches que vous n'avez jamais vues auparavant
Google a souligné que pour réaliser un robot capable de véritablement entrer dans le monde réel, deux défis fondamentaux doivent être résolus.
1. Nouvelle capacité de promotion de tâches
2. Améliorer la vitesse de prise de décision
Les deux premiers résultats de cette série en trois parties sont principalement des améliorations dans ces deux domaines, et tous deux sont basés sur le modèle de robot de base de Google, Robotics Transformer( En abrégé RT) .
Regardons d'abord le premier : RT-Trajectory qui aide les robots à généraliser.
Pour les humains, des tâches telles que nettoyer la table sont faciles à comprendre, mais les robots ne les comprennent pas très bien.
Mais heureusement, nous pouvons lui transmettre cette instruction de diverses manières possibles, afin qu'il puisse entreprendre de véritables actions physiques.
D'une manière générale, la méthode traditionnelle consiste à mapper la tâche en une action spécifique, puis à laisser le bras du robot la terminer. Par exemple, essuyer la table peut être démonté en « fermez la pince, bougez à gauche, bougez à droite ».
Évidemment, la capacité de généralisation de cette méthode est très faible.
Ici, la nouvelle trajectoire RT proposée par Google apprend au robot à effectuer des tâches en lui fournissant des repères visuels.

Plus précisément, les robots contrôlés par RT-Trajectory ajouteront des données améliorées de trajectoire 2D pendant l'entraînement.
Ces trajectoires sont présentées sous forme d'images RVB, comprenant des itinéraires et des points clés, fournissant des conseils de bas niveau mais très utiles à mesure que le robot apprend à effectuer des tâches.
Avec ce modèle, le taux de réussite des robots effectuant des tâches inédites a été directement augmenté jusqu'à 1 fois (par rapport au modèle de robot de base RT-2 de Google, de 29% => 63%) .
Ce qui mérite d'être mentionné, c'est que RT-Trajectory peut créer des trajectoires de diverses manières, notamment :
en regardant des démonstrations humaines, en acceptant des croquis dessinés à la main et générés par VLM (Modèle de langage visuel).

La deuxième étape de la robotisation quotidienne : la vitesse de prise de décision doit être rapide
Une fois la capacité de généralisation améliorée, nous nous concentrerons sur la vitesse de prise de décision.
Le modèle RT de Google utilise l'architecture Transformer Bien que le Transformer soit puissant, il s'appuie fortement sur le module d'attention à complexité quadratique.
Par conséquent, une fois que l'entrée du modèle RT est doublée (par exemple, en équipant le robot d'un capteur à plus haute résolution) , les ressources informatiques nécessaires pour le traiter augmenteront jusqu'à quatre fois, ce qui ralentira sérieusement la décision. -vitesse de fabrication.
Afin d'améliorer la vitesse des robots, Google a développé SARA-RT sur le modèle de base Robotics Transformer.
SARA-RT utilise une nouvelle méthode de réglage fin du modèle pour rendre le modèle RT d'origine plus efficace.
Cette méthode est appelée "up training" par Google. Sa fonction principale est de convertir la complexité quadratique originale en complexité linéaire tout en conservant la qualité du traitement.
Lorsque SARA-RT est appliqué au modèle RT-2 avec des milliards de paramètres, ce dernier peut atteindre des vitesses de fonctionnement plus rapides et une plus grande précision sur une variété de tâches.
Il convient également de mentionner que SARA-RT fournit une méthode universelle pour accélérer Transformer sans pré-formation coûteuse, afin qu'il puisse être bien promu.
Pas assez de données ? Créez-le vous-même
Enfin, afin d'aider les robots à mieux comprendre les tâches assignées par les humains, Google est également parti des données et a directement construit un système de collecte : AutoRT.
Ce système combine de grands modèles (y compris LLM et VLM) avec des modèles de contrôle de robot (RT) pour diriger en continu le robot afin qu'il effectue diverses tâches dans le monde réel, générant et collectant ainsi des données.
Le processus spécifique est le suivant :
Laissez le robot contacter "librement" l'environnement et se rapprocher de la cible.
Utilisez ensuite l'appareil photo et le modèle VLM pour décrire la scène devant vous, y compris les éléments spécifiques.
Ensuite, LLM utilise ces informations pour générer plusieurs tâches différentes.
Veuillez noter qu'après avoir été généré, le robot ne sera pas exécuté immédiatement. Au lieu de cela, LLM sera utilisé pour filtrerquelles tâches peuvent être accomplies indépendamment, lesquelles nécessitent un contrôle à distance humain et lesquelles ne peuvent pas être accomplies. tous.
Ce qui ne peut pas être fait, c'est "ouvrir le sac de chips" car cela nécessite deux bras robotisés (1 seulement par défaut) .

Ensuite, après avoir terminé cette tâche de dépistage, le robot peut réellement l'exécuter.
Enfin, le système AutoRT finalise la collecte de données et effectue une évaluation de la diversité.
Selon les rapports, AutoRT peut coordonner jusqu'à 20 robots à la fois. En 7 mois, un total de 77 000 données de test, dont 6 650 tâches uniques, ont été collectées.
Enfin, pour ce système, Google met également l'accent sur la sécurité.
Après tout, les tâches de collecte d’AutoRT s’appliquent au monde réel et les « garde-corps de sécurité » sont indispensables.
Plus précisément, le code de sécurité de base, fourni par le LLM qui contrôle les tâches des robots, s'inspire en partie des trois lois de la robotique d'Isaac Asimov – avant tout « Un robot ne doit pas nuire à un être humain
La deuxième exigence est. » que le robot ne doit pas tenter de tâches impliquant des humains, des animaux, des objets pointus ou des appareils électriques
Mais cela ne suffit pas
AutoRT est donc également équipé de plusieurs niveaux de mesures de sécurité pratiques dans la robotique ordinaire. Par exemple, le robot s'arrête automatiquement lorsque. la force exercée sur ses articulations dépasse un seuil donné, toutes les actions peuvent être stoppées par des interrupteurs physiques qui restent à la vue humaine, et plus encore
Envie d'en savoir plus sur cette dernière fournée de résultats de Google
Bonne nouvelle, sauf ? pour RT-Trajectory, qui publie uniquement des articles, le reste est publié avec le code et les articles. Vous êtes invités à vérifier plus ~
One More Thing
En parlant des robots Google, nous devons mentionner
RT-2. (Tous les résultats de cet article sont également basés sur cela) Ce modèle a nécessité 7 mois de travail de 54 chercheurs de Google et est sorti fin juillet de cette année
Il intègre le multimodal visuel-texte. modèle VLM, peut non seulement comprendre les « mots humains », mais peut également raisonner sur les « mots humains » et effectuer certaines tâches qui ne peuvent pas être accomplies en une seule étape, comme ramasser avec précision les « animaux disparus » de trois jouets en plastique : des lions, baleines et dinosaures", très étonnant.Maintenant, en un peu plus de 5 mois, il a connu des améliorations rapides de ses capacités de généralisation et de sa vitesse de prise de décision. Nous ne pouvons nous empêcher de soupirer : je ne peux pas imaginer. qu'un robot va vraiment se précipiter dans le monde. À quelle vitesse cela sera-t-il pour des milliers de foyers ?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!
Outils d'IA chauds
Undress AI Tool
Images de déshabillage gratuites
Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes
AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.
Clothoff.io
Dissolvant de vêtements AI
Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !
Article chaud
Outils chauds
Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit
SublimeText3 version chinoise
Version chinoise, très simple à utiliser
Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP
Dreamweaver CS6
Outils de développement Web visuel
SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)
Sujets chauds
La popularité du cercle des devises est revenue, pourquoi les gens intelligents ont-ils commencé à augmenter tranquillement leurs positions? Regardez la tendance des données sur la chaîne et saisissez le prochain cycle de mot de passe de richesse!
Jul 09, 2025 pm 08:30 PM
Au fur et à mesure que les conditions du marché accélèrent, de plus en plus d'investisseurs intelligents ont commencé à augmenter tranquillement leurs positions dans le cercle des devises. Beaucoup de gens se demandent ce qui les fait prendre de manière décisive lorsque la plupart des gens attendent et voient? Cet article analysera les tendances actuelles à travers des données sur la chaîne pour aider les lecteurs à comprendre la logique des fonds intelligents, afin de mieux saisir la prochaine série de possibilités de croissance potentielle de la richesse.
Quelles sont les chaînes publiques traditionnelles des crypto-monnaies? Les dix premiers classements des chaînes publiques traditionnelles de la crypto-monnaie en 2025
Jul 10, 2025 pm 08:21 PM
Le modèle dans le champ de la chaîne publique montre une tendance de "un super, beaucoup de forts et une centaine de fleurs fleurissant". Ethereum mène toujours avec ses douves écologiques, tandis que Solana, Avalanche et d'autres sont difficiles à affronter les performances. Pendant ce temps, Polkadot, Cosmos, qui se concentre sur l'interopérabilité, et ChainLink, qui est une infrastructure critique, forment une image future de plusieurs chaînes coexistant. Pour les utilisateurs et les développeurs, le choix de la plate-forme n'est plus un seul choix, mais nécessite un compromis entre les performances, le coût, la sécurité et la maturité écologique basée sur des besoins spécifiques.
L'évolution du contrat intelligent de Cardano: l'impact des mises à niveau d'Alonzo en 2025
Jul 10, 2025 pm 07:36 PM
La mise à niveau de Fork Hard Fork de Cardano a réussi à transformer Cardano d'un réseau de transfert de valeur vers une plate-forme de contrat intelligent entièrement fonctionnel en introduisant la plate-forme de contrat intelligent Plutus. 1. Plutus est basé sur le langage Haskell, avec des fonctionnalités puissantes, une sécurité améliorée et un modèle de coût prévisible; 2. Après la mise à niveau, le déploiement DAPPS est accéléré, la communauté des développeurs est élargie et les écosystèmes Defi et NFT se développent rapidement; 3. En 2025, l'écosystème de Cardano sera plus mature et diversifié. Combinée à l'amélioration de l'évolutivité à l'ère Basho, à l'amélioration de l'interopérabilité transversale, à l'évolution de la gouvernance décentralisée à l'ère Voltaire et à la promotion de l'adoption générale par les applications au niveau de l'entreprise, Cardano a
Le bitcoin brise de nouveaux sommets, Dogecoin rebondit fortement, Ethereum suivra le rythme
Jul 09, 2025 pm 08:24 PM
Récemment, Bitcoin a frappé un nouveau sommet, Dogecoin a inauguré un fort rebond et le marché était chaud. Ensuite, nous analyserons les moteurs du marché et les aspects techniques pour déterminer si Ethereum a toujours des opportunités de suivre la montée.
Le top 5 qui vaut la peine d'investir en 2025 (avec les dernières données)
Jul 09, 2025 am 06:06 AM
Les cinq stablescoins les plus précieuses en 2025 sont l'attache (USDT), la pièce USD (USDC), le DAI (DAI), le premier USD numérique (FDUSD) et le TrueUSD (TUSD).
Le flux de fonds sur la chaîne est exposé: quels nouveaux jetons sont pariés par l'argent intelligent?
Jul 16, 2025 am 10:15 AM
Les investisseurs ordinaires peuvent découvrir des jetons potentiels en suivant "Smart Money", qui sont des adresses à but lucratif, et faire attention à leurs tendances peut fournir des indicateurs de premier plan. 1. Utilisez des outils tels que Nansen et Arkham Intelligence pour analyser les données sur la chaîne pour voir les achats et les avoirs de l'argent intelligent; 2. Utilisez des analyses Dune pour obtenir des tableaux de bord créés par la communauté pour surveiller le flux de fonds; 3. Suivez des plateformes telles que Lookonchain pour obtenir des renseignements en temps réel. Récemment, Congming Money prévoit de re-polissons la piste LRT, le projet Depin, l'écosystème modulaire et le protocole RWA. Par exemple, un certain protocole de LRT a obtenu une grande quantité de dépôts précoces, un certain projet de dépin a été accumulé en continu, une certaine chaîne publique de jeu a été soutenue par le trésor de l'industrie et un certain protocole RWA a attiré les institutions.
Qui émet des stablecoins? Quelles sont les stablecoins?
Jul 09, 2025 pm 06:24 PM
Les stablecoins sont des actifs cryptographiques qui maintiennent la stabilité des prix en ancrant les monnaies fiduciaires telles que le dollar américain. Ils sont principalement divisés en trois catégories: garantie de monnaie fiduciaire, garantie des actifs cryptographiques et stablecoins algorithmiques. 1. L'USDT est émis par Tether et est le stablecoin avec la plus grande valeur marchande et la liquidité la plus élevée. 2. USDC est publié par la Center Alliance lancée par Circle and Coinbase, et est connue pour sa transparence et sa conformité. 3. Dai est généré par Makerdao par une sur-collatéralisation des actifs cryptographiques et est la devise centrale dans le champ Defi. 4. Busd a été lancé en partenariat avec Paxos et est réglementé par les États-Unis mais a été interrompu. 5. TUSD atteint une vérification élevée de réserve de transparence via des comptes d'entiercement tiers. Les utilisateurs peuvent utiliser des échanges centralisés tels que Binance, Ouyi et Huobi
Quelle chaîne appartient à Dogecoin Doge? Dogecoin appartient-il à la chaîne de binance?
Jul 10, 2025 pm 08:39 PM
Récemment, la discussion dans le domaine des actifs numériques est restée chaude. Dogecoin Doge, comme l'une des objectifs les plus populaires, est devenue une question que beaucoup de gens ont exploré. Où est-ce que cela "se stabilise"? Quelle est la relation avec la plateforme de trading actuelle, Binance? Pour répondre à ces questions, nous devons effectuer une analyse approfondie des deux dimensions de la logique technique sous-jacente des actifs numériques et de l'écologie de la plate-forme, plutôt que de rester en apparence.


