Les modèles de langage se généralisent au-delà des protéines naturelles Contrôle
Modèles de diffusion évolutifs avec transformateurs s : Fonctions de récompense interactives basées sur des exemples pour l'apprentissage des politiques
Radiostation hebdomadaire ArXiv : NLP, CV, ML Plus d'articles sélectionnés (avec audio)
Pour les conceptions à squelette fixe, le modèle de langage a généré avec succès des conceptions de protéines pour 8 cibles à squelette fixe créées par l'homme et évaluées expérimentalement.
Pour le cas de génération sans contrainte, les protéines échantillonnées couvrent différentes topologies et compositions de structures secondaires, ce qui donne un taux de réussite expérimentale élevé de 71/129 (55 %).
Article 2 : Un langage de programmation de haut niveau pour la conception générative de protéines
Auteurs : Brian Hie, Salvatore Candido, etc.
Adresse de l'article : https://www .biorxiv .org/content/10.1101/2022.12.21.521526v1.full.pdf
Abstract : Les chercheurs de FAIR partent de la modularité et de la programmabilité, plaçant les deux à un niveau supérieur d'abstraction, de conception de protéines. L'utilisateur uniquement doit réassembler les instructions de haut niveau, puis exécuter les instructions sur le modèle généré.
Le langage de programmation proposé pour générer des conceptions de protéines permet aux concepteurs de spécifier des procédures intuitives, modulaires et en couches. Le langage de programmation nécessite d'abord un arbre syntaxique (Figure 1A), composé de symboles terminaux (c'est-à-dire les feuilles de l'arbre) et de symboles non terminaux (c'est-à-dire les nœuds internes de l'arbre). Les premiers correspondent à une protéine unique. séquence (qui peut être répétée dans la protéine), cette dernière supporte l'organisation hiérarchique. De plus, un modèle de production basé sur l’énergie est nécessaire. Tout d’abord, Protein Designer spécifie un programme de haut niveau constitué d’un ensemble de contraintes organisées hiérarchiquement (Figure 1A). Le programme est ensuite compilé en une fonction énergétique utilisée pour évaluer la compatibilité avec des contraintes arbitraires et non différenciables (Figure 1B). Enfin, en incorporant des prédictions de structure au niveau atomique (supportées par des modèles de langage) dans les fonctions énergétiques, un grand nombre de conceptions de protéines complexes peuvent être générées (Figure 1C). Recommandé : Générez par programme des structures protéiques complexes et modulaires. Article 3 : DOC : Améliorer la cohérence des histoires longues avec un contrôle détaillé des contours Abstract : Il y a quelque temps, Re^3, un modèle de langage qui imite le processus d'écriture humain, a été publié. Ce modèle ne nécessite pas de réglage fin. de grands modèles, mais génère de la cohérence en concevant des invites fortes. Maintenant, l'équipe de recherche a proposé un nouveau modèle DOC pour générer des histoires. Les auteurs de l'article, Kevin Yang et Tian Yuandong, ont également posté sur Twitter pour promouvoir le modèle DOC, affirmant que les histoires générées par DOC sont plus cohérentes et intéressantes que celles générées par Re^3. Le framework DOC signifie contrôle de plan détaillé, qui est utilisé pour améliorer la cohérence de l'intrigue lors de la génération automatique d'histoires longues de milliers de mots. DOC se compose de deux composants complémentaires : Détaillé Outliner et Détaillé Contrôleur. Detailed Outliner est chargé de créer des plans détaillés et structurés hiérarchiquement qui font passer les idées d'écriture de la rédaction à la phase de planification. Le contrôleur détaillé garantit que les résultats générés suivent le plan détaillé en contrôlant l'alignement des paragraphes de l'histoire avec les détails du plan. L'étude a mené une évaluation manuelle de la capacité du modèle à générer automatiquement des histoires, et DOC a obtenu des gains substantiels dans plusieurs indicateurs : cohérence de l'intrigue (22,5 %), pertinence des grandes lignes (28,2 %) et intérêt (20,7 %). ce qui est bien meilleur que le modèle Re^3. De plus, DOC est plus facile à contrôler dans un environnement de construction interactif.
Recommandation : Un autre nouveau travail de Tian Yuandong et d'autres membres originaux de l'équipe : l'IA génère de longues histoires, et de longs articles de milliers de mots peuvent être cohérents et intéressants. Article 4 : Modèles de diffusion évolutifs avec transformateurs Résumé : Dans cet article, William Peebles de l'UC Berkeley et Xie Saining de l'Université de New York ont écrit "Modèles de diffusion évolutifs avec transformateurs". L'objectif est de découvrir l'importance des choix architecturaux dans les modèles de diffusion et de fournir des informations. pour de futures recherches sur des modèles génératifs. Cette étude montre que la polarisation inductive U-Net n'est pas essentielle aux performances des modèles de diffusion et peut être facilement remplacée par des conceptions standards telles que des transformateurs. Cette recherche se concentre sur une nouvelle classe de modèles de diffusion basés sur des transformateurs : les transformateurs de diffusion (DiTs en abrégé). Les DiT suivent les meilleures pratiques des Vision Transformers (ViT), avec quelques ajustements mineurs mais importants. Il a été démontré que DiT évolue plus efficacement que les réseaux convolutifs traditionnels tels que ResNet. Plus précisément, cet article étudie le comportement de mise à l'échelle de Transformer en termes de complexité du réseau et de qualité des échantillons. Il est montré qu'en construisant et en évaluant l'espace de conception DiT dans le cadre du modèle de diffusion latente (LDM), où le modèle de diffusion est formé dans l'espace latent de VAE, il est possible de remplacer avec succès le squelette U-Net par un transformateur. Cet article montre en outre que DiT est une architecture évolutive pour les modèles de diffusion : il existe une forte corrélation entre la complexité du réseau (mesurée par Gflops) et la qualité des échantillons (mesurée par FID). En étendant simplement DiT et en entraînant un LDM avec un réseau fédérateur haute capacité (118,6 Gflops), des résultats de pointe de 2,27 FID sont obtenus sur le benchmark de génération ImageNet 256 × 256 conditionnel à la classe.
Recommandation : Le U-Net qui domine le modèle de diffusion va être remplacé. Xie Saining et al. Papier 5 : Point-E : Un système pour générer des nuages de points 3D à partir d'invites complexes Abstract : Le générateur de modèles 3D open source d'OpenAI, Point-E, a déclenché une nouvelle vague d'engouement dans le cercle de l'IA. Point-E peut générer des modèles 3D en une à deux minutes sur un seul GPU Nvidia V100, selon un article publié avec le contenu open source. En comparaison, les systèmes existants tels que DreamFusion de Google nécessitent généralement des heures et plusieurs GPU. Point-E ne génère pas d'image 3D au sens traditionnel du terme, il génère un nuage de points ou un ensemble discret de points de données dans l'espace qui représente une forme 3D. Le E dans Point-E signifie « efficacité », ce qui signifie qu'il est plus rapide que les méthodes de génération d'objets 3D précédentes. Bien que les nuages de points soient plus faciles à synthétiser d’un point de vue informatique, ils ne peuvent pas capturer la forme ou la texture fine des objets – une limitation clé du Point-E actuellement. Pour résoudre ce problème, l'équipe OpenAI a formé un système d'intelligence artificielle supplémentaire pour convertir le nuage de points de Point-E en un maillage. Recommandé : L'IA texte-image tridimensionnelle devient : un seul GPU est expédié en moins d'une minute, par OpenAI. Passage 6 : Reprogrammation pour récupérer des informations épigénétiques juvéniles et restaurer la vision Résumé : Le 2 décembre 2020, plusieurs mots surprenants sont apparus sur la couverture de la revue scientifique de premier plan « Nature » : « Turning Back » Time » (tour retour du temps). Les recherches sur la couverture proviennent de l'équipe de David Sinclair, professeur titulaire à la Harvard Medical School. Bien que l'article ne fasse que quelques pages, il montre une nouvelle perspective : utiliser la thérapie génique pour induire la reprogrammation des cellules ganglionnaires et restaurer les informations épigénétiques de la jeunesse, permettant ainsi au nerf optique de se régénérer après des dommages et d'inverser la vision causée par le glaucome et le vieillissement. . David Sinclair a déclaré que l’objectif de recherche de l’équipe a toujours été de ralentir et d’inverser le vieillissement humain et de traiter les maladies en résolvant les causes plutôt que les symptômes. Sur la base de cette étude de 2020, l'équipe de David Sinclair utilise la technologie d'inversion de l'âge appelée "REVIVER" pour la tester sur des primates non humains afin de voir si elle est sûre et peut guérir la cécité comme les enfants. La dernière recherche vient de David Sinclair et d'une équipe de 60 personnes. Il a déclaré que le vieillissement est comme des rayures sur un CD qui peuvent être effacées, ou un logiciel endommagé dans le système, qui peut être inversé en le réinstallant simplement, tout comme As. indiqué dans le livre "Lifespan". Dans l'article de prépublication, les auteurs ont déclaré que tous les êtres vivants perdent des informations génétiques au fil du temps et perdent progressivement des fonctions cellulaires. Grâce à un système de souris génétiquement modifiées appelé ICE (pour Inducible Changes in the Epigenome), les chercheurs démontrent que le processus de réparation des cassures non mutagènes de l'ADN accélère les changements physiologiques, cognitifs et moléculaires liés à l'âge, y compris l'expression. Observez l'érosion génétique, la perte de cellules capacité, sénescence cellulaire, etc. Les chercheurs affirment que la reprogrammation épigénétique par expression ectopique peut restaurer les modèles d'expression génétique de la jeunesse. Recommandé : Recherche sur l'inversion du vieillissement. Article 7 : Entraîner des robots à évaluer des robots : fonctions de récompense interactives basées sur des exemples pour l'apprentissage des politiques Abstrait : Souvent, les interactions physiques aident à révéler des informations moins évidentes, comme par exemple si nous tirons sur un pied de table pour évaluer s'il est stable ou s'il tourne. bouteille d'eau à l'envers pour vérifier si elle fuit, l'étude suggère que ce comportement interactif pourrait être acquis automatiquement en entraînant un robot à évaluer les résultats de ses tentatives pour exécuter la compétence. Ces évaluations, à leur tour, servent d'IRF (fonctions de récompense interactives) utilisées pour entraîner des politiques d'apprentissage par renforcement afin d'exécuter des compétences cibles, telles que le serrage des pieds de table. De plus, l'IRF peut servir de mécanisme de validation pour améliorer l'exécution des tâches en ligne, même une fois la formation complète terminée. Pour une tâche donnée, la formation IRF est très pratique et ne nécessite aucune spécification supplémentaire. Les résultats de l'évaluation montrent qu'IRF peut réaliser des améliorations significatives des performances et même dépasser les références avec un accès à des démos ou à des récompenses soigneusement conçues. Par exemple, dans l'image ci-dessous, le robot doit d'abord fermer la porte, puis faire pivoter la poignée symétrique de la porte pour verrouiller complètement la porte.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!