


L'Université de Pékin et Wangshi Intelligence proposent un nouveau modèle : combler le fossé entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules !
Les réactions chimiques sont à la base de la conception de médicaments et de la recherche en chimie organique. Il existe un besoin croissant dans la communauté des chercheurs d’un cadre d’apprentissage profond à grande échelle capable de capturer efficacement les règles fondamentales des réactions chimiques.
Récemment, une équipe de recherche de l'Université de Pékin et de Wangshi Intelligence a proposé une nouvelle méthode pour combler le fossé entre le pré-entraînement moléculaire basé sur des réactions et les tâches de génération.
Inspirés par les mécanismes de la chimie organique, des chercheurs ont développé un nouveau cadre de pré-formation qui lui permet d'incorporer des biais inductifs dans les modèles. Ce cadre proposé permet d'obtenir des résultats de pointe lors de l'exécution de tâches difficiles en aval. En tirant parti des connaissances en chimie, le cadre surmonte les limites des modèles de génération moléculaire actuels qui reposent sur un petit nombre de modèles de réaction. Grâce à des expériences approfondies, le modèle a généré des structures de type médicament synthétisables de haute qualité
Dans l’ensemble, cette recherche constitue une étape importante vers un cadre d’apprentissage profond à grande échelle pour une variété d’applications basées sur des réactions.
L'étude s'intitulait « Combler l'écart entre le pré-entraînement aux réactions chimiques et la génération conditionnelle de molécules avec un modèle unifié » et a été publiée dans « Nature Machine Intelligence » le 5 décembre 2023.
Lien papier : https://www.nature.com/articles/s42256-023-00764-9
Les modèles d'apprentissage profond ont été largement utilisés dans de nombreux domaines de recherche scientifique. Le cadre de pré-formation joue un rôle positif dans l'intégration transparente de nouvelles tâches et peut accélérer le processus de modélisation, en particulier lorsque les données étiquetées sont limitées.
La conception de médicaments et la recherche en chimie organique reposent sur les réactions chimiques. Actuellement, la recherche et l’application de l’exploration de données ont permis d’utiliser des modèles d’apprentissage profond dans les réactions chimiques. Sur la base de ces données, de nombreuses études basées sur les données ont porté sur l'apprentissage des représentations de réactions chimiques.
L'apprentissage des représentations fait référence à l'apprentissage automatique de fonctionnalités utiles à partir des données, puis à leur utilisation pour diverses tâches en aval. Les méthodes existantes ignorent les théories fondamentales de la chimie organique, ce qui limite leurs performances.
Génération de molécules basée sur des réactions chimiques
En plus de la tâche de classification des réactions, la génération de molécules basée sur des réactions chimiques est également une application importante. Dans les premières études, des stratégies de génération de molécules par étapes basées sur des modèles étaient souvent adoptées.
Ces méthodes basées sur des modèles reposaient fortement sur des éléments de base et des réactions prédéfinis, ce qui réduisait l'espace chimique accessible. Une tendance similaire se retrouve dans le domaine de la prédiction des produits de réaction, où les méthodes basées sur des modèles ne peuvent pas être extrapolées à des réactions complexes ; ce problème peut être résolu en utilisant des méthodes sans modèle ;
Dans les tâches de génération de molécules basées sur des réactions, les méthodes sans modèle présentent également des avantages de généralisation par rapport aux méthodes basées sur un modèle. Cependant, les méthodes existantes de génération de molécules sans modèle ne peuvent générer que des molécules basées sur des bibliothèques de réactifs prédéfinies. En plus de cela, pour l’étape d’optimisation du composé principal ou de l’optimisation du plomb dans la conception de médicaments, il est plus avantageux d’utiliser des réactions chimiques comme outils d’édition pour modifier une structure donnée. La bibliothèque chimique résultante se concentrera sur un sous-ensemble d’espace chimique pouvant être synthétisé avec moins d’étapes de réaction.
Un nouveau cadre d'apprentissage profond complet pour les réactions chimiques
Ici, les chercheurs proposent un nouveau cadre d'apprentissage profond complet pour les réactions chimiques, appelé Uni-RXN. Il vise à résoudre deux tâches fondamentales : l’apprentissage des représentations auto-supervisé et la modélisation générative conditionnelle.
Spectacle : Composition et méthode Uni-RXN. (Cité de : article)
Différent des méthodes existantes, les chercheurs ont proposé un ensemble de tâches auto-supervisées spécifiquement conçues pour les réactions chimiques. Ces tâches comprennent la prédiction du centre de réaction, l’appariement des réactifs primaires et des sous-réactifs, ainsi que l’appariement réactif-produit. Dans une évaluation approfondie de tâches de réaction difficiles, la méthode Uni-RXN surpasse l’état de l’art, démontrant sa capacité à capturer efficacement les connaissances du domaine des réactions chimiques. Les résultats prometteurs obtenus ouvrent la voie à des applications aval généralisées
En capturant efficacement les règles chimiques, Uni-RXN est parfaitement adapté aux tâches de génération. Contrairement aux méthodes traditionnelles qui reposent sur la sélection de fragments dans une bibliothèque de réactifs prédéfinis, Uni-RXN prend les structures moléculaires comme conditions d'entrée et génère des représentations des réactifs correspondants tout en maintenant l'invariance de permutation au sein de la réaction. Tirant parti de la puissance du package de recherche de similarité de vecteurs denses, Uni-RXN permet une récupération efficace des réactifs à partir de grandes bibliothèques de réactifs et de réactifs. Par la suite, un modèle de prédiction de réaction est utilisé pour générer des résultats de produits.
Comparé aux méthodes basées sur des modèles qui n'explorent qu'un sous-ensemble limité de l'espace chimique, Uni-RXN présente des performances supérieures pour générer une gamme plus large de structures de type médicament synthétisables. Cette fonctionnalité le rend particulièrement adapté au dénombrement des bibliothèques virtuelles et s'appuie sur une analyse statistique complète et des études de cas.
La méthode Uni-RXN présente de nombreux avantages et peut générer des représentations riches pour la tâche difficile de classification des réactions chimiques. Comparé à d'autres modèles de base, Uni-RXN atteint une précision de 58,7 % avec seulement 4 points de données par classe. Contenu réécrit : La précision de la classification des réactions chimiques est présentée dans le tableau 1. (Source : article)
Le modèle de transformateur peut être utilisé pour différencier les données de réaction chimique optimisées et non optimisées. De plus, l'encodeur peut également être facilement appliqué à la génération de conditions structurelles
Le contenu qui doit être réécrit est le suivant : Le graphique montre les performances de récupération et le poids d'attention d'Uni-RXN. (Source : Article)
Les résultats mettent en évidence les propriétés favorables des molécules générées par le modèle proposé, qui les rendent bien adaptées aux tâches de découverte de médicaments. Ce modèle peut générer plus de molécules ayant des propriétés et une capacité de synthèse semblables à celles d'un médicament
Illustration : Processus et performances Uni-RXNGen. (Source : article)
Combiné à des méthodes de criblage virtuel telles que l'amarrage moléculaire, ce modèle généré peut permettre une recherche efficace sur les relations structure-activité. L’énorme espace chimique de type drogue synthétique généré par ce modèle peut améliorer le véritable taux positif de réutilisation de médicaments ou de recherche de molécules ciblées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

Plus tôt ce mois-ci, des chercheurs du MIT et d'autres institutions ont proposé une alternative très prometteuse au MLP – KAN. KAN surpasse MLP en termes de précision et d’interprétabilité. Et il peut surpasser le MLP fonctionnant avec un plus grand nombre de paramètres avec un très petit nombre de paramètres. Par exemple, les auteurs ont déclaré avoir utilisé KAN pour reproduire les résultats de DeepMind avec un réseau plus petit et un degré d'automatisation plus élevé. Plus précisément, le MLP de DeepMind compte environ 300 000 paramètres, tandis que le KAN n'en compte qu'environ 200. KAN a une base mathématique solide comme MLP est basé sur le théorème d'approximation universelle, tandis que KAN est basé sur le théorème de représentation de Kolmogorov-Arnold. Comme le montre la figure ci-dessous, KAN a

Boston Dynamics Atlas entre officiellement dans l’ère des robots électriques ! Hier, l'Atlas hydraulique s'est retiré "en larmes" de la scène de l'histoire. Aujourd'hui, Boston Dynamics a annoncé que l'Atlas électrique était au travail. Il semble que dans le domaine des robots humanoïdes commerciaux, Boston Dynamics soit déterminé à concurrencer Tesla. Après la sortie de la nouvelle vidéo, elle a déjà été visionnée par plus d’un million de personnes en seulement dix heures. Les personnes âgées partent et de nouveaux rôles apparaissent. C'est une nécessité historique. Il ne fait aucun doute que cette année est l’année explosive des robots humanoïdes. Les internautes ont commenté : Les progrès des robots ont fait ressembler la cérémonie d'ouverture de cette année à des êtres humains, et le degré de liberté est bien plus grand que celui des humains. Mais n'est-ce vraiment pas un film d'horreur ? Au début de la vidéo, Atlas est allongé calmement sur le sol, apparemment sur le dos. Ce qui suit est à couper le souffle

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

L’IA change effectivement les mathématiques. Récemment, Tao Zhexuan, qui a prêté une attention particulière à cette question, a transmis le dernier numéro du « Bulletin de l'American Mathematical Society » (Bulletin de l'American Mathematical Society). En se concentrant sur le thème « Les machines changeront-elles les mathématiques ? », de nombreux mathématiciens ont exprimé leurs opinions. L'ensemble du processus a été plein d'étincelles, intense et passionnant. L'auteur dispose d'une équipe solide, comprenant Akshay Venkatesh, lauréat de la médaille Fields, le mathématicien chinois Zheng Lejun, l'informaticien de l'Université de New York Ernest Davis et de nombreux autres universitaires bien connus du secteur. Le monde de l’IA a radicalement changé. Vous savez, bon nombre de ces articles ont été soumis il y a un an.

Aujourd'hui, j'aimerais partager un travail de recherche récent de l'Université du Connecticut qui propose une méthode pour aligner les données de séries chronologiques avec de grands modèles de traitement du langage naturel (NLP) sur l'espace latent afin d'améliorer les performances de prévision des séries chronologiques. La clé de cette méthode consiste à utiliser des indices spatiaux latents (invites) pour améliorer la précision des prévisions de séries chronologiques. Titre de l'article : S2IP-LLM : SemanticSpaceInformedPromptLearningwithLLMforTimeSeriesForecasting Adresse de téléchargement : https://arxiv.org/pdf/2403.05798v1.pdf 1. Modèle de fond de problème important

La détection de cibles est un problème relativement mature dans les systèmes de conduite autonome, parmi lesquels la détection des piétons est l'un des premiers algorithmes à être déployés. Des recherches très complètes ont été menées dans la plupart des articles. Cependant, la perception de la distance à l’aide de caméras fisheye pour une vue panoramique est relativement moins étudiée. En raison de la distorsion radiale importante, la représentation standard du cadre de délimitation est difficile à mettre en œuvre dans les caméras fisheye. Pour alléger la description ci-dessus, nous explorons les conceptions étendues de boîtes englobantes, d'ellipses et de polygones généraux dans des représentations polaires/angulaires et définissons une métrique de segmentation d'instance mIOU pour analyser ces représentations. Le modèle fisheyeDetNet proposé avec une forme polygonale surpasse les autres modèles et atteint simultanément 49,5 % de mAP sur l'ensemble de données de la caméra fisheye Valeo pour la conduite autonome.

La dernière vidéo du robot Optimus de Tesla est sortie, et il peut déjà fonctionner en usine. À vitesse normale, il trie les batteries (les batteries 4680 de Tesla) comme ceci : Le responsable a également publié à quoi cela ressemble à une vitesse 20 fois supérieure - sur un petit "poste de travail", en sélectionnant et en sélectionnant et en sélectionnant : Cette fois, il est publié L'un des points forts de la vidéo est qu'Optimus réalise ce travail en usine, de manière totalement autonome, sans intervention humaine tout au long du processus. Et du point de vue d'Optimus, il peut également récupérer et placer la batterie tordue, en se concentrant sur la correction automatique des erreurs : concernant la main d'Optimus, le scientifique de NVIDIA Jim Fan a donné une évaluation élevée : la main d'Optimus est l'un des robots à cinq doigts du monde. le plus adroit. Ses mains ne sont pas seulement tactiles
