Performance SOTA et apprentissage multi-échelle, lUniversité Sun Yat-sen propose un cadre dIA pour les interactions protéine-médicament

Éditeur | Violet

Les interactions entre protéines, médicaments et autres biomolécules jouent un rôle essentiel dans divers processus biologiques. Comprendre ces interactions est essentiel pour déchiffrer les mécanismes moléculaires qui sous-tendent les processus biologiques et développer de nouvelles stratégies thérapeutiques. Les protéines font partie des molécules les plus importantes dans les cellules et remplissent diverses fonctions au sein des cellules. Les médicaments régulent souvent les processus physiologiques en interagissant avec des protéines spécifiques. Ces interactions peuvent favoriser ou inhiber des voies de signalisation moléculaires spécifiques. Les méthodes de calcul multi-échelles actuelles reposent souvent trop sur une seule échelle et sous-ajustent les autres échelles. Cela peut être lié au tropisme multi-échelle inégal et à la cupidité inhérente à l’apprentissage multi-échelle.

Afin d'atténuer le déséquilibre d'optimisation, des chercheurs de l'Université Sun Yat-sen et de l'Université Jiao Tong de Shanghai ont proposé un cadre d'apprentissage de représentation multi-échelle MUSE basé sur la maximisation des attentes variables, qui peut intégrer efficacement des informations multi-échelles pour l'apprentissage. Cette stratégie fusionne efficacement les informations multi-échelles entre la structure atomique et les échelles du réseau moléculaire grâce à une supervision mutuelle et une optimisation itérative. Cette approche permet un meilleur transfert d’informations et un meilleur apprentissage. Cette stratégie fusionne efficacement les informations multi-échelles entre la structure atomique et les échelles du réseau moléculaire grâce à une supervision mutuelle et une optimisation itérative.

MUSE+ surpasse non seulement les modèles de pointe actuels sur les tâches d'interaction moléculaire (protéine-protéine, médicament-protéine et médicament), mais surpasse également les modèles de pointe actuels sur les prédictions d'interface protéique. à l’échelle de la structure atomique. Plus important encore, le cadre d’apprentissage multi-échelle peut être étendu à la découverte informatique de médicaments à d’autres échelles.

L'étude, intitulée "

Un cadre variationnel d'attente-maximisation pour un apprentissage multi-échelle équilibré des interactions protéiques et médicamenteuses

", a été publiée dans "Nature Communications" le 25 mai.

Performance SOTA et apprentissage multi-échelle, lUniversité Sun Yat-sen propose un cadre dIA pour les interactions protéine-médicament Lien papier :

https://www.nature.com/articles/s41467-024-48801-4

Interactions moléculaires biologiques

Les caractéristiques de la fonction des protéines sont liées aux protéines, aux médicaments et Interactions avec d'autres biomolécules. Comprendre ces interactions est essentiel pour décrypter les mécanismes moléculaires des processus biologiques et développer de nouvelles stratégies thérapeutiques. Cependant, la croissance substantielle des demandes et des coûts associés aux interactions expérimentales nécessite des outils informatiques permettant de prédire et de comprendre automatiquement les interactions entre biomolécules. Pour répondre à ces demandes et à ces coûts croissants, des outils informatiques sont nécessaires pour prédire et comprendre automatiquement les interactions entre les biomolécules.

Prédire ces interactions uniquement à partir de la structure est l'un des défis les plus importants en biologie structurale. Les méthodes informatiques actuelles prédisent principalement les interactions basées sur des réseaux moléculaires ou des informations structurelles et ne les intègrent pas dans un cadre multi-échelle unifié.

Alors que certaines méthodes d'apprentissage multi-vues s'efforcent de fusionner des informations multi-échelles, une manière intuitive d'apprendre des représentations multi-échelles consiste à combiner des graphiques moléculaires avec des réseaux d'interaction et à les optimiser conjointement. Cependant, en raison du déséquilibre et de la gourmandise inhérente à l’apprentissage multi-échelle, ces modèles s’appuient souvent fortement sur une seule échelle. L’incapacité à utiliser efficacement les informations liées à toutes les échelles et à la généralisation est faible.

De plus, un cadre multi-échelle efficace doit non seulement capturer des informations riches à différentes échelles, mais doit également bien préserver les relations sous-jacentes entre elles.

MUSE pour l'apprentissage d'informations multi-échelles sur les protéines et les médicaments

Ici, l'équipe de recherche de l'Université Sun Yat-sen a proposé MUSE, un cadre d'apprentissage de représentation multi-échelle basé sur la maximisation des attentes variables (Expectation Maximization), qui peut être utilisé plusieurs fois Différentes échelles sont optimisées dans un processus itératif alternatif. Par rapport aux méthodes existantes qui s'appuient fortement sur des informations à échelle unique, MUSE résout efficacement le problème de déséquilibre d'optimisation dans l'apprentissage multi-échelle grâce à la supervision mutuelle et à l'optimisation itérative.

MUSE est une méthode d'apprentissage multi-échelle qui combine la modélisation de la structure moléculaire et l'apprentissage de réseaux d'interactions protéine-médicament via un cadre de maximisation des attentes variationnelles (EM). Le framework EM optimise deux modules, à savoir l'étape d'attente (étape E) et l'étape de maximisation (étape M), dans un processus alterné de plusieurs itérations.

Pendant l'étape E, MUSE utilise les informations structurelles de chaque biomolécule pour apprendre des représentations structurelles efficaces pour l'entraînement à l'étape M en utilisant des interactions connues et des échantillons de renforcement. Il prend comme entrée des paires de protéines et de médicaments et leurs informations structurelles au niveau atomique, augmentées par les interactions prédites en M-étapes. M-step prend en entrée les interactions prédites du réseau d'interactions au niveau moléculaire, des incorporations structurelles et de l'étape E et génère les interactions prédites. L'optimisation itérative entre E-step et M-step garantit une capture interactive de la structure moléculaire et des informations de réseau avec des taux d'apprentissage différents aux deux échelles.

La supervision mutuelle garantit que chaque modèle réduit apprend de manière appropriée, permettant l'utilisation d'informations efficaces à différentes échelles. Ce cadre sera démontré à travers de multiples échelles d'interactions entre protéines et médicaments. Il est analysé que MUSE atténue les caractéristiques déséquilibrées de l'apprentissage multi-échelles et intègre efficacement les informations hiérarchiques et complémentaires provenant de différentes échelles.

Performance SOTA et apprentissage multi-échelle, lUniversité Sun Yat-sen propose un cadre dIA pour les interactions protéine-médicament

Figure 1 : Schéma schématique du framework MUSE et de son application. (Source : article)

Surclasse les modèles de pointe actuels sur des tâches multi-échelles

Utilise les informations sur la structure atomique pour améliorer les prédictions à l'échelle du réseau moléculaire

Pour évaluer leur approche, premièrement, la les chercheurs ont utilisé MUSE pour intégrer les informations structurelles des atomes afin d’améliorer les prédictions à l’échelle du réseau moléculaire. MUSE atteint des performances de pointe sur trois tâches de prédiction d’interactions multi-échelles : l’interaction protéine-protéine (PPI), l’interaction médicament-protéine (DPI) et l’interaction médicament-médicament (DDI).

Performance SOTA et apprentissage multi-échelle, lUniversité Sun Yat-sen propose un cadre dIA pour les interactions protéine-médicament

Figure 2 : Performance de MUSE dans la prédiction des interactions protéiques et médicamenteuses. (Source : article)

Amélioration des prédictions à l'échelle de la structure atomique à partir de l'échelle du réseau moléculaire

En plus d'utiliser les informations sur la structure atomique pour améliorer les prédictions à l'échelle du réseau moléculaire, les chercheurs ont étudié plus en détail la capacité de MUSE à apprendre et à prédire les structures à l'échelle du réseau moléculaire. échelle de la structure atomique Capacité à caractériser, notamment à prédire les contacts interfaciaux et les sites de liaison associés aux IPP.

Pour évaluer les prédictions de contacts interchaînes de protéines, MUSE a été comparé aux méthodes de pointe du benchmark DIPS-Plus. MUSE surpasse systématiquement toutes les autres méthodes, validant son efficacité et son adaptabilité dans la prédiction de la structure atomique.

Performance SOTA et apprentissage multi-échelle, lUniversité Sun Yat-sen propose un cadre dIA pour les interactions protéine-médicament

Figure 3 : Performances de MUSE à l'échelle de la structure atomique. (Source : article)

MUSE a été évalué plus en détail pour prédire si les résidus sont directement impliqués dans les interactions protéine-protéine. Les résultats démontrent que l’apprentissage à l’échelle du réseau moléculaire dans MUSE peut fournir des informations précieuses sur les prédictions à l’échelle de la structure atomique.

Atténuer les caractéristiques de déséquilibre de l'apprentissage multi-échelle grâce à l'optimisation itérative

Afin d'explorer pourquoi MUSE peut atteindre des performances supérieures dans la représentation multi-échelle, les chercheurs ont analysé la capacité d'apprentissage de MUSE en fonction des caractéristiques de déséquilibre de l'apprentissage multi-échelle. apprentissage.

Performance SOTA et apprentissage multi-échelle, lUniversité Sun Yat-sen propose un cadre dIA pour les interactions protéine-médicament

Figure 4 : Analyse des caractéristiques déséquilibrées dans l'apprentissage multi-échelle. (Source : article)

Les résultats montrent que MUSE atténue efficacement les caractéristiques de déséquilibre et l'apprentissage gourmand dans l'apprentissage multi-échelle, garantissant l'utilisation complète des informations à différentes échelles pendant le processus de formation. En outre, des expériences d'analyse du taux d'utilisation ont permis aux chercheurs de comprendre spécifiquement ce que le modèle avait appris et ont démontré que l'utilisation de MUSE pour équilibrer l'apprentissage du modèle à différentes échelles peut améliorer les capacités de généralisation.

Visualisation et interprétation de la représentation multi-échelle apprise

Pour mieux comprendre la représentation multi-échelle apprise, les chercheurs ont étudié la représentation multi-échelle apprise par MUSE sous différents angles, y compris (1) Capture MUSE La capacité de l'atome informations de structure (c'est-à-dire, motifs structurels et intégrations) impliquées dans le PPI, et (2) supervision mutuelle entre la structure atomique apprise et les représentations de réseaux moléculaires.

Performance SOTA et apprentissage multi-échelle, lUniversité Sun Yat-sen propose un cadre dIA pour les interactions protéine-médicament

Figure 5 : Visualisation et interprétation d'une représentation multi-échelle. (Source : article)

À titre d'exemple de prédiction de site de liaison (ID PDB : 3CQQ-A), MUSE peut identifier avec précision les résidus appartenant au site de liaison avec une précision de 97,7 %. Cela suggère que la supervision mutuelle dans MUSE aide les modèles à l’échelle de la structure atomique à apprendre les sous-structures clés pertinentes pour les interactions.

Enfin, les chercheurs ont également mené des études d'ablation pour étudier l'impact des pseudo-marqueurs prédits à l'échelle de la structure atomique sur l'échelle du réseau moléculaire.

Bien que MUSE démontre des performances de pointe dans les benchmarks, il est encore possible d'améliorer sa capacité à gérer des tâches en aval multi-échelles bruyantes et incomplètes. Ceci peut être réalisé en combinant les connaissances antérieures grâce à des graphiques de connaissances et des techniques d'IA explicables. D’un autre côté, ce cadre conceptuel multi-échelle peut également être étendu à la découverte informatique de médicaments à d’autres échelles.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!