タンパク質は生命の基礎であり、ほぼすべての生物学的プロセスに関与しています。細胞機能の複雑さを説明するには、タンパク質がどのように相互作用するかを理解することが重要です。
2. 新しい方法: 相互作用するタンパク質配列のペアリング
ローザンヌ工科大学 (EPFL) の Anne-Florence Bitbol のチームは、相互作用するタンパク質配列をペアリングする方法を提案しました。この方法は、複数の配列アラインメントでトレーニングされたタンパク質言語モデルの力を利用します。
3. メソッドの利点
このメソッドは、小さなデータセットに対して良好に機能し、教師ありメソッドを通じてタンパク質複合体の構造予測を改善できます。
4. 研究結果の公表
この研究は「マスクされた言語モデリングを使用した相互作用タンパク質配列のペアリング」というタイトルで、2024 年 6 月 24 日に「PNAS」に掲載されました。
タンパク質間相互作用の予測タンパク質間相互作用は細胞機能にとって極めて重要であり、シグナル伝達の特異性や、分子モーターや受容体などの複数タンパク質複合体の形成を保証します。タンパク質間の相互作用とその複雑な構造を予測することは、計算生物学と生物物理学の重要なテーマです。
AlphaFold などの深層学習手法はタンパク質のモノマー構造予測において大きな進歩を遂げましたが、複雑な構造の予測パフォーマンスは依然としてモノマー予測ほど良くはなく、不均一性が存在します。 AlphaFold は、まずクエリタンパク質配列の相同多重配列アラインメント (MSA) を構築します。MSA の品質は予測精度にとって非常に重要です。
ヘテロポリマーのペアMSA
複数の鎖が関与するタンパク質複合体(ヘテロマルチマー)の場合、ペアMSAは相互作用パートナー間の共進化情報を提供し、鎖間接触の推測に役立ちますが、特に真核生物では正しくペアMSAを構築することが困難です。多くの相同タンパク質であり、ゲノムの近さに依存しません。
共進化法
現在、この課題に対処するために、ゲノム近接性、近似相同性、系統発生に基づく方法と共進化戦略が組み合わされていますが、このうち共進化法は大規模なデータを必要とします。はまだ最適化中です。特に共進化シグナルを最大化して相同タンパク質を照合することにより、複雑な構造のペアリングと予測に可能性を示します。
DiffPALM: 微分可能なペアリング手法
EPFL の Anne-Florence Bitbol のチームは、多重配列アラインメント (MSA) で訓練されたタンパク質言語を利用する、相互作用するタンパク質配列をペアリングする方法を開発しました。MSA Transformer や MSA Transformer などのモデルの力AlphaFold の EvoFormer モジュール。これにより、タンパク質間の複雑な相互作用を高精度で理解して予測することが可能になります。
これらに基づいて、研究者らは、MLM を使用して同族語の一致を予測する微分可能な方法である、Alignment-Based Language Model (DiffPALM) を使用した微分可能なペアリングを提案しました。
グラフィック: 小型 HK-RR MSA での DiffPALM のパフォーマンス。 (出典: 論文)DiffPALM は、遍在する原核生物タンパク質データセットから抽出された浅い MSA の困難なベンチマークにおいて、既存の共進化手法を大幅に上回ります。既知の相互作用するペアが例として提供されると、DiffPALM のパフォーマンスがさらに急速に向上します。
共進化に基づくペアリング手法は、タンパク質配列が密接に相互作用するときに時間の経過とともにどのように進化するかを研究することに焦点を当てています。1 つのタンパク質の変化が、相互作用する分子の変化につながる可能性があります。これは分子生物学および細胞生物学において非常に重要なトピックであり、MSA で訓練されたタンパク質言語モデルによってよく捉えられています。
グラフィック: さまざまなペアリング方法を使用した AFM のパフォーマンス。 (出典: 論文)その後、チームは DiffPALM を真核生物のタンパク質複合体のホモログ マッチング パズルに適用しました。これを行うために、研究者らは DiffPALM ペアシーケンスを AFM への入力として使用しました。テストした複合体では、DiffPALM を使用すると、場合によっては AFM からの構造予測が大幅に改善されました。また、オルソログベースのペアリングを使用する場合と同等のパフォーマンスも実現します。
図: ポジティブな例の影響、MSA の深さ、タンパク質ファミリーの別のペアへの拡張。 (出典: 論文)DiffPALM の用途は基本的なタンパク質生物学の分野では明らかですが、医学研究や医薬品開発における強力なツールとなる可能性があるため、その用途はそれを超えて広がっています。たとえば、タンパク質相互作用を正確に予測することは、疾患メカニズムの理解や標的治療の開発に役立ちます。
研究者らは DiffPALM を無料で利用できるようにしており、科学界に広く採用されることで計算生物学がさらに進歩し、研究者がタンパク質相互作用の複雑さを調査できるようになることを期待しています。
DiffPALM は、高度な機械学習技術と複雑な生物学的データの効率的な処理を組み合わせ、計算生物学における大きな前進を示します。
それはタンパク質相互作用に対する科学者の理解を高めるだけでなく、医学研究の新たな道を切り開き、病気の治療や医薬品開発における画期的な進歩につながる可能性があります。
論文リンク:
https://www.pnas.org/doi/10.1073/pnas.2311887121
関連レポート:
https://phys.org/news/2024-06-ai-based-approach-protein -interaction.html
以上がAlphaFold に匹敵する精度で、EPFL の AI メソッドは配列からタンパク質相互作用を照合しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。