DeepMind の AlphaFold によるタンパク質の摂取量の確認
ニューヨーク – 2018 年の導入以来、DeepMind の AlphaFold プログラムは生物学研究における重要なツールとなり、科学者がアミノ酸配列に基づいてタンパク質の構造を高精度に予測できるようになりました。
最近では、研究者らは、タンパク質間相互作用 (PPI) 作業に AlphaFold とその新しいバージョンである AlphaFold2 を使用し始め、タンパク質相互作用の予測と検証、およびその構造モデルの生成におけるその有用性を模索しています。
これらの取り組みは、必要な集中的なコンピューティング リソースによって依然として制限されていますが、研究によると、AI ベースのアプローチは大規模な PPI 研究に有用であることが判明し、質量分析や酵母ツー ハイブリッド システムなどの既存のツールを補完できる可能性があります。
「これは非常に興味深い空間です」とエディンバラ大学のプロテオミクス教授であり、ベルリン工科大学の生物分析教授であるジュリ・ラップシルバー氏は語った。 4月、彼と同僚は、枯草菌のPPIを予測し検証するために、架橋質量分析法と共分別質量分析を、PPI研究向けのAlphaFold2の拡張機能であるAlphaFold-Multimerソフトウェアと組み合わせた研究をMolecular Systems Biology誌に発表した。 。
Rappsilber 氏は、一般的な用途の 1 つとして、彼が「アルファ プルダウン」と呼んだものを挙げました。これは、研究者がソフトウェアを使用して、免疫プルダウン質量分析実験の場合と同様に、目的の特定のタンパク質に対して候補タンパク質相互作用物質をスクリーニングするものです。
「彼らは興味のあるタンパク質を持っており、そのタンパク質と相互作用する可能性があると考えられる候補タンパク質を多数持っており、それらを1つずつ興味のあるタンパク質と比較するだけです」とラップシルバー氏は語った。
同氏は、「AlphaFold の陽性反応があれば、両者が相互作用している可能性が非常に高い」と述べた。 「つまり、10 人、20 人、または 50 人の候補者が少数の候補者に減り、その方が追跡調査が可能になります。」
Rappsilber 氏は、PPI を検証するための他のアプローチとは異なり、研究者は相互作用の構造のモデルを使用したこのような実験から得られることが重要であると付け加えました。
「そして、それは実験として次に何をすべきかについての非常に明確な指示だ」と同氏は述べ、この構造情報を用いて研究者は相互作用部位で点変異体を設計することができ、相互作用を破壊してその生物学的効果を調査できると指摘した。
「主な制限は計算能力です」と、ハレ・ヴィッテンベルクのマルティン・ルーサー大学の低温電子顕微鏡の准教授であり、ギリシャ国立ギリシャ研究財団の低温電子顕微鏡のERAチェアであるパナギオティス・カストリティス氏は、PPI作業にAlphaFoldを使用することについて語った。 「これらの計算のほとんどは研究機関規模のコンピューターで行われました。」
しかし、カストリティス氏は、コンピューティングパワーが引き続き安価になり、より入手しやすくなっているため、今後 5 ~ 10 年のうちにこれは困難ではなくなる可能性が高いと指摘しました。
同氏はまた、特定のコンピューティング戦略により、大規模な PPI 作業に AlphaFold を使用するために必要な計算能力を削減できる可能性があると示唆しました。 たとえば、AlphaFold2 は、いわゆる多重配列アライメントを使用してタンパク質の構造を予測します。このアライメントは、タンパク質のアミノ酸配列を取得し、それを他のタンパク質配列データベースと比較して、モデルの構築に使用する類似の配列を特定することによって生成されます。 カストリティス氏は、これらのMSAがますます多く同定されるにつれて、それらを同定するために配列データベースを再度検索する必要がなく、ソフトウェアが直接アクセスできるような方法でMSAを保存できると述べた。
「[MSA]を事前に計算して事前に計算しておけば、当然、より速くて簡単になるでしょう」と彼は言いました。
4月、マイクロソフトとベルリン自由大学の研究者らは、AlphaFold2によるPPIの予測を高速化するために、Kastritisが提案したものと同様のものを含むいくつかの計算アプローチを使用したBioRxivプレプリントを発表した。 著者らによると、このアプローチを 1,000 個のタンパク質のペア相互作用の予測に適用したところ、予測に必要な時間が 40 分の 1 に短縮され、必要なディスク容量が 4,460 分の 1 に削減されました。
プレプリント著者の 1 人、フリー大学博士研究員パトリック ブライアント氏は、FoldDock と呼ばれる AlphaFold2 ベースの PPI 予測の新しいパイプラインについて詳述した 2022 年の Nature Communications 論文の筆頭著者でもあります。 2023年1月、ブライアントとストックホルム大学のSciLifeLab(ブライアントが大学院生だった)および欧州バイオインフォマティクス研究所の研究者が率いるチームは、FoldDockパイプラインを使用して65,484のヒトPPIの構造を予測し、3,137の高信頼PPIモデルを生成した。 。
カストリティス氏は、研究者らは、AlphaFold2の予測の計算負荷を軽減するために、質量分析や極低温電子顕微鏡などの技術によって生成された実験データも利用していると述べた。 たとえば、研究者はAlphaFold2に架橋質量分析データや、クライオEMで測定されたタンパク質の形状と3D構造を提供し、実験データと一致するタンパク質構造のみを予測するよう依頼する可能性があると同氏は述べた。
「この種の情報を使用すると、計算コストを削減できます」と彼は言いました。
「候補者主導で進めなければなりません」とラップシルバー氏は述べ、同様にAlphaFoldと組み合わせた実験データの有用性を強調した。
MSB 研究では、Rappsilber と彼の共著者らは、B. subtilis 細胞全体で架橋質量分析を使用して、潜在的なタンパク質間相互作用を特定することから始めました。 彼らは合計 560 個の PPI を特定し、そのうち 384 個はこれまで検出されていなかった。 彼らはこれを共分別質量分析実験で追跡し、667 個の候補 PPI を特定し、結果として 2 つの方法で合計 878 個の候補 PPI が生成されました。
次に研究者らは、B. subtilis データベース SubtiWiki から既知の高品質 PPI をダウンロードし、実験的に得られた PPI と組み合わせて 2032 個の候補 PPI セットを作成し、AlphaFold-Multimer に提出しました。 このソフトウェアは、これらの相互作用のうち 114 について高品質の構造モデルを生成することができました。
AlphaFold-Multimer は、14 の三量体タンパク質複合体の高品質な構造を予測することもでき、バイナリー PPI を超える可能性を示しました。
MSBの研究には関与していないKastritis氏は、複数のタンパク質や他の分子からなるタンパク質複合体を予測することは依然として難しい課題であると指摘した。 このような大規模な複合体に関する大きな問題は、タンパク質の構造予測における小さな誤差がより広範な複合体全体に伝播し、より大きな誤差につながる可能性があることだと同氏は述べた。
今後を見据えて、ラップシルバー氏は、AlphaFold やその他の AI ベースのツールが大規模な PPI やタンパク質複合体の研究にさらに役立つようになるため、主に 3 つのルートがあり、そのすべてが現在進められていると述べています。
1 つ目は、同氏が「強引な」アプローチと表現したもので、コンピューティング能力の継続的な向上を単純に利用するものです。
「少し待てば、あなたのスマートウォッチがそれをできるようになるでしょう」と彼は冗談を言った。
2 番目の道は、上記の FoldDock パイプラインなど、そのような作業を実行するためのより高速で効率的な計算戦略の継続的な開発です。
3 つ目は、AI ベースの予測を支援するための実験データのより効果的な統合です。 ラップシルバー氏は、研究室の取り組みの多くがここに焦点を当てているところだと述べ、AlphaLinkと呼ばれるAlphaFold2のバージョンについて詳述した研究室の最近の論文を指して、ソフトウェアに情報を提供できるクロスリンク質量分析実験データなどのソースからのデータを組み込んでいると述べた。特定のアミノ酸残基間の距離。
クロスリンクデータを使用すると、「AlphaFold だけでは失敗した困難なターゲットの構造を取得できる可能性があります」と彼は言いました。