タンパク質の機能予測の未来
タンパク質は、体内での様々な役割を果たす生体分子です。酵素として化学反応を促進したり、特定の分子を認識する抗体として機能したりと、医療や工業分野でその利用は広がっています。しかし、機能性のタンパク質を効率的に設計するには、非常に高い技術と膨大な実験データが必要です。そこで新たに開発された手法が注目されています。この手法では、分子シミュレーションとタンパク質言語モデルを活用し、少数の実験データからでも高精度でタンパク質の機能値を予測することが可能になりました。
研究の背景
近年、機械学習を用いたタンパク質の機能予測が進展していますが、大量の実験データを教師データとして必要とするためコストがかかります。このため、機械学習モデルは十分なデータを持たず、予測精度が低いことが問題でした。そこで、実験データに加えて計算値を教師データに用いる方法が新たな解決策として注目されています。これまでの研究では、主にタンパク質の安定性予測に適用されてきましたが、機能性タンパク質の設計に向けて結合親和性や酵素活性など、より広い特性への適用が求められています。
新たな手法の開発
研究チームは、分子シミュレーションによる計算結果と、タンパク質言語モデルの生成するデータを組み合わせて疑似的な教師データを作成しました。この方法では、少数の実験データと計算された多数のデータを同時に利用することで、予測精度が大幅に向上しました。実際に評価したところ、例えばCYP2C9という酵素の反応活性を予測するタスクでは、50個の実験データの他に約4,600個の疑似データを追加することで、予測精度が37%向上し、実験データの数を87%削減することに成功しました。
機械学習と科学の新時代
この革新的な手法は、単純にデータを増やすだけでなく、それぞれのデータの信頼度を自動的に調整するアルゴリズムを採用しているため、実用的です。生物の複雑さに対応したこの技術は、タンパク質設計の現場で今後ますます役立つと期待されます。さらに、抗体や酵素など他の機能性タンパク質の開発への展開も視野に入れており、大学や企業と協力しながら、その普及を目指しています。
まとめ
この研究の成果は、今後の機能性タンパク質開発に新たな道を開くものであり、人工知能や機械学習が生物学の革新に大きく寄与することが期待されています。本研究の詳細は、2025年10月10日付の「Briefings in Bioinformatics」に掲載されており、さらなる探求が行われる予定です。タンパク質の機能予測が、今回の発表によりどのように進化していくのか、今後の動向に注目です。