Google DeepMind は 2025 年 6 月 25 日、 DNA 配列の変異が分子プロセスに与える影響を予測する AI モデル「 AlphaGenome 」を発表しました。このモデルは最大 100 万塩基対という長大な DNA 配列を一度に解析し、従来モデルでは困難だった高精度な生物学的特性の予測を実現しています。
AlphaGenome の画期的な点は、ゲノム全体の 98 %を占める非コーディング領域まで解析対象としていることです。この領域はタンパク質の作成に直接的に関わらない「ダークマター」と呼ばれ、遺伝子発現や疾患リスクに深く関わっているにも関わらず、これまで機能解明が極めて困難でした。
技術的には、畳み込み層(Convolutional Layer: CNN)とトランスフォーマー層を組み合わせたハイブリッド設計を採用しています。短い配列パターンの検出(CNN利用)と長距離の依存関係(Transformer利用)の把握を同時に行うことで、転写開始点、 RNA スプライシング部位、タンパク質結合状態など数千の分子的特徴を細胞種ごとに予測できます。変異前後の配列比較により、一塩基レベルでの変異影響を 1 秒以内にスコア化することも可能です。
性能評価では、 50 の予測タスクのうち 90 %以上で既存の専門モデルを上回る結果を示しました。既に白血病関連変異の機能予測で実用性が確認されており、 T 細胞急性リンパ芽球性白血病における TAL1 遺伝子の変異メカニズムを正確に予測した実績があります。
医療分野への応用も大きな注目を集めています。脊髄性筋萎縮症や嚢胞性線維症などの希少疾患の多くは、遺伝子から必要な部分を切り出す RNA スプライシングという過程に異常が起こることで発症します。 AlphaGenome はこのスプライシングが行われる部位の位置や活性度を直接予測できる初の AI モデルであり、これまで原因不明だった希少疾患のメカニズム解明に道筋をつけると期待されています。
研究効率の向上も見込まれます。これまで複数のツールを組み合わせて行っていた解析が AlphaGenome 一つで完結するため、疾患原因の特定、創薬ターゲットの発見、ゲノム編集の設計など、幅広い生命科学研究の加速が期待されています。
現在は非商用研究向けの API として提供されており、今後の正式リリースや商用展開も予定されています。
AlphaGenome は、ゲノムの「暗黒物質」領域を含む包括的な DNA 解析を可能にした初の AI モデルとして、疾患研究から基礎生物学まで幅広い分野でゲノム解析を革新する可能性を秘めています。