DNA-Methylierung spielt eine wichtige Rolle bei verschiedenen biologischen Prozessen, einschließlich Zelldifferenzierung, Alterung und Krebsentstehung. Die wichtigste Methylierung bei Säugetieren ist 5-Methylcytosin, die hauptsächlich im Zusammenhang mit CpG-Dinukleotiden auftritt. Sequenzierungsmethoden wie die
Whole-genome bisulfit sequencing können 5-Methylcytosin-DNA-Modifikationen erfolgreich nachweisen. Allerdings haben sie den gravierenden Nachteil kurzer Leselängen, die zu einer Verstärkungsverzerrung führen können.
Forscher von Singapore A*STAR haben einen Deep-Learning-Algorithmus Rockfish entwickelt, der den Lesepegel von 5-Methylcytosin mithilfe der Pyrimidin-Nachweisfunktion Oxford Nanopore Sequencing (ONT) deutlich verbessert.
Die Studie trug den Titel „Rockfish: Ein transformatorbasiertes Modell zur genauen 5-Methylcytosin-Vorhersage aus Nanoporensequenzierung“ und wurde am 3. Juli 2024 in „Nature Communications“ veröffentlicht.
Angesichts des Bedarfs an einer hochpräzisen Methode zur Vorhersage des Leseniveaus machten sich Forscher daran, eine neue, hochmoderne Deep-Learning-Methode unter Verwendung moderner Architekturtransformatoren zu entwickeln. Ihre Methode, Rockfish, basiert auf rohen Nanoporensignalen, Nukleobasensequenzen und Ausrichtungsinformationen, um 5mC-Modifikationen zu erkennen. Abbildung: Überblick über die Rockfish-Architektur. (Quelle: Papier)Die Forscher trainierten das Modell mithilfe hochwertiger Mensch- und Maus-Datensätze und testeten es an mehreren R9.4.1- und R10.4.1-Datensätzen, darunter:
Megalodon Remora, Megalodon Rerio und Nanopolish für R9.4.1-Datensatz
Remora für R10.4.1-DatensatzDer Vergleich umfasst:
Korrelation auf Site-Ebene mit WGBS
AnrufabdeckungSeine hervorragende Leistung in menschlichen und Mausproben unterstreicht seine Vielseitigkeit bei der Untersuchung der 5-Methylcytosin-Methylierung in verschiedenen Organismen und Krankheiten. Schließlich gewährleistet seine anpassungsfähige Architektur die Kompatibilität mit neuen Versionen von Poren, Chemikalien und Modifikationstypen.
Abbildung: Korrelationsanalyse zwischen ONT-basierten Tools und WGBS. (Quelle: Paper)
Trotzdem ist Rockfish derzeit nicht in der Lage, zwischen 5mC- und 5hmC-Methylierung zu unterscheiden, da es an hochwertigen Kontrolldatensätzen für andere Arten von Modifikationen mangelt. Die Recheneffizienz des Modells kann noch verbessert werden, und es wird erwartet, dass die Effizienz in Zukunft durch Optimierung der Architektur und Technik verbessert wird.
Rockfish demonstrierte die Fähigkeit, Methylierungsinformationen aus ONT-Rohsignalen zu extrahieren, wobei sein kleines Modell eine bessere Leistung erbrachte und bei allen Datensätzen kürzere Laufzeiten benötigte, was die Vorteile zusätzlicher Daten und Wissensdestillation demonstrierte.5mC-Modifikation hängt mit einer Vielzahl biologischer Phänomene zusammen, wie z. B. Transkriptionsregulation, Krankheit, Alterung usw. Daher ist es von entscheidender Bedeutung, die Rolle der DNA-Methylierung durch den Nachweis mit Einzelbasenauflösung genau zu verstehen, was hilfreich sein kann die Prävention von Krankheiten. Frühzeitige Diagnose und Auswahl der Behandlungsstrategie. Die Architektur von Rockfish macht es leicht skalierbar, um verschiedene Arten von DNA- und RNA-Modifikationen zu erkennen.
Papierlink: https://www.nature.com/articles/s41467-024-49847-0
Das obige ist der detaillierte Inhalt vonNeue Transformer-basierte Methode sagt die DNA-Methylierung anhand der Nanoporensequenzierung genau voraus. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!