ByteDance、タンパク質構造予測モデル「SeedFold」を発表:一部で AlphaFold3を上回る性能

投稿者:

ByteDance が、タンパク質構造予測の分野で新たなオープンソースモデル「SeedFold」を発表しました。このモデルは、主要なベンチマークである FoldBench において、Google DeepMind の「AlphaFold3」を含む既存のモデルを多くのタスクで上回る性能を示し、生命科学や創薬の研究に大きな影響を与える可能性があります。

タンパク質の立体構造を正確に予測する技術は、病気のメカニズム解明や新薬開発の基盤となります。この分野では、2021年 に登場した AlphaFold2 が革命を起こし、2024年 5月 にはタンパク質以外の分子との相互作用も予測可能な AlphaFold3 が発表され、その進化が続いていました。

その AlphaFold3 の発表からわずか数ヶ月後の 2025年 12月 30日、ByteDance は SeedFold に関する論文を公開しました。SeedFold の画期的な特徴は、主に 3点 あります。第一に、モデルの表現能力を高める「Pairformer の幅スケーリング戦略」。第二に、計算効率を大幅に改善する新しい「線形三角アテンション」機構の導入。そして第三に、AlphaFold2 からのデータ蒸留によって構築された 2650万 サンプルという大規模なデータセットです。

FoldBench での性能比較では、SeedFold は複数のタンパク質関連タスクで AlphaFold3 を凌駕する結果を示しています。例えば、抗体-抗原相互作用の成功率(SR%)では、SeedFold が 53.21% を記録したのに対し、AlphaFold3 は 47.90% でした。

SeedFold がオープンソースモデルとして最先端の性能を達成したことは、研究コミュニティ全体にとってアクセスしやすく高性能なツールが提供されることを意味します。これまで AlphaFold が先行していたこの分野で、健全な競争が生まれることで、技術全体のさらなる発展が促進され、創薬や合成生物学といった分野での発見が加速することが期待されます。