2024年10月10日
2024年ノーベル化学賞:タンパク質の設計と構造予測に貢献した3氏に
2024年のノーベル化学賞は「コンピューターを用いたタンパク質の設計」の功績で米ワシントン大学のベイカー(David Baker)教授に,「コンピューターを用いたタンパク質の構造予測」で英国Google DeepMindのハサビス(Demis Hassabis)氏とジャンパー(John Jumper)氏に授与される。
タンパク質は20種類のアミノ酸が数珠つなぎになった分子だ。それがくねくねと折りたたまれて,複雑な立体構造をとる。この「数珠つなぎ」と「立体構造」の間に,「50年来の生物学のグランド・チャレンジ」と呼ぶべき,大きな未解決問題があった。タンパク質の立体構造予測だ。
タンパク質の立体構造予測は,タンパク質の生化学はもちろん,創薬や医学研究の観点からも実現が望まれてきた。タンパク質の形状や表面の微細な凹凸などがタンパク質の機能を左右するからだ。
構造予測の歴史
1970〜1980年代の頃から試みられていた最初期の方法は,第一原理計算や分子動力学といった,分子を構成する原子や電子の動きを物理法則に従ってシミュレーションするものだった。しかしこれらの方法はタンパク質の種類や大きさによっては計算量が爆発的に大きくなり,手に負えなかった。
この壁を克服しようと,1994年に構造予測技術の腕を競うコンテスト「CASP(Critical Assessment of protein Structure Prediction)」がスタート。カリフォルニア大学の研究者らが中心となって,2年に一度のペースで開催されるようになった。
今回受賞したベイカー,ハサビス,ジャンパーはいずれも,このCASPの参加者だ。ベイカーは1998年の第3回からCASPに参加し,タンパク質構造予測ソフトウエア「Rosetta」を発表。1990年代に入ると,X線結晶構造解析などの実験によって特定されたタンパク質の立体構造データが徐々に蓄積しつつあった。構造が既知のタンパク質を部分ごとにつなぎ合わせ,最も安定なタンパク質の形状を予測する「フラグメントアセンブリ法」という方法で,高い成績を記録した。
AlphaFold2の登場
2018年には,ハサビスとジャンパーらが,DeepMind社で約20人の研究チームを作って第13回のCASPに初参加。このときの「AlphaFold」を改良し,2年後の第14回CASPで発表した「AlphaFold2」が驚異的な性能を示した。タンパク質構造のバイオインフォマティクスを専門とする東京科学大学の森脇由隆准教授は「それまで決定に数年掛かっていたタンパク質の構造を,計算機で10〜60分程度で非常に精度良く予測できるようになった」と話す。
AlphaFold2は全く新しい方法でタンパク質の構造予測を行った。それは,生物が世代を重ねるうちに,配列上は離れた位置にあるアミノ酸どうしがセットで変異する「共変異」という現象を構造予測に生かしたことだ。この現象は一見奇妙だが,タンパク質の立体構造が保たれたまま,アミノ酸配列だけが変わった結果だと考えれば説明がつく。1つのアミノ酸が変異するだけだとタンパク質の構造が不安定になるが,周囲のアミノ酸も変化すれば,構造が再び安定化する。つまり,共変異が起こるアミノ酸は,立体構造の上では近い距離にあるのだ。
こうした共変異のアミノ酸が配列中のどこにあるかは,ヒト,マウス,魚など,多数の生物種が共通して持つタンパク質のアミノ酸配列を比べることで原理上はわかるはずだ。ただ,遠く離れた配列の間に潜む共変異は通常の解析では見つかりにくい。これを解決するために,ハサビスとジャンパーらはTransformerと呼ぶニューラルネットワークを用いたソフトウエアを開発した。Transformerは自然言語処理に向いた深層学習のニューラルネットワークで,長文の中で遠く離れた単語間の関係性を学ぶのを得意とする。離れたアミノ酸配列の中に潜む共変異を見つける上で,Transformerの長所が生きるのだ。
ノーベル財団のリリースを一部改編 |
ハサビスらがAlphaFold2を開発するために結成したチームは,化学と生物学,物理学,統計学などの様々な分野の専門家の集まりだった。「タンパク質の構造予測のための理論を構築するところからはじめ,それをディープラーニングでどうやって実現できるかに取り組み,ソフトウエアを公開するところまでやった。それがハサビスとジャンパーのすごい所だ」と森脇准教授は評価する。
AlphaFold2は,発表から数年の間にタンパク質の研究に必須のプラットフォームとなりつつある。今年10月時点で190カ国の200万人以上に使用されており,ハサビスらが2021年にNature誌に発表したAlphaFold2の論文は1.6万回引用された。新型コロナウイルス(SARS-CoV-2)のスパイクタンパク質の構造解析にAlphaFold2を使用した研究もある。今年に入ってハサビスらは後継のAlphaFold3をリリースした。その応用は今後さらに広がるはずだ。
人工タンパク質の設計
一方のベイカーは2003年,複雑な構造をもつ人工タンパク質「Top7」の合成に初めて成功した。生命がもつタンパク質の一部を置き換えた「改良品」ではなく,コンピューターによってゼロから設計したものだ。設計したタンパク質を微生物に作らせたところ,狙い通りの構造をもつタンパク質が得られた。Top7は93個のアミノ酸からなる小さなタンパク質だが,それまで合成された人工タンパク質の中では最大だった。特定の機能はなかったが,αヘリックスやβシートといったタンパク質を構成する基本的な部品を備えていた。
人工タンパク質は,ベイカーがタンパク質の構造予測も研究していたからこそ生まれた。構造予測の技術を,望みの構造をもつタンパク質を実現するためアミノ酸配列を提案させる用途に応用したのだ。人工タンパク質の研究者は他にもいたが,そもそも望みのタンパク質の構造を作る手法をもっていなかった。
「なぜ狙った通りの構造を形成できたのか,全く理解できなかった。それくらい衝撃的な論文だった」と大阪大学の古賀信康教授は振り返る。当時はまだ大学院生で,その後,2007年から2014年にベイカーの研究室に所属した。設計の指針となるルールを発見し,2012年に論文で発表した。Top7の発表以降,なかなか新しい人工タンパク質が生まれていなかったが,新しいルールを取り入れて設計がうまくいくようになった。
自然界に存在するタンパク質には限りがある。ただ,タンパク質をゼロから設計できれば,新しい機能が実現する可能性がある。古賀教授は「生物が進化の中で獲得してきたタンパク質は唯一の解なのだろうか。全く違った解があるかもしれない」と期待する。
ベイカーはその後,様々な機能を備えたタンパク質の合成にも成功し,狙った働きをする酵素も合成できた。合成生物学を研究する早稲田大学の木賀大介教授は「少し前まで酵素の合成はまだ先と考えていた。驚きのスピードで研究が進んでいると感じる」と語る。
(編集部 出村政彬,遠藤智之)
※10/10 19:00 記事中の森脇准教授のコメントを修正しました。
・2024年ノーベル物理学賞:物理学からAIの基礎を築いた2氏に
・2024年ノーベル生理学・医学賞:マイクロRNAとその役割を発見した2氏に
▼詳しくは日経サイエンス2024年12月号(10月25日発売予定)でもご紹介いたします。
ご予約は下記オンライン書店,またはお近くの書店・日経新聞販売店にて
・Amazon
▼受賞者寄稿記事
2006年9月号「合成生物学を加速するバイオファブ」 D. ベイカー ほか
▼関連記事
2023年10月号「タンパク質を語る言語」 出村政彬
▼関連書籍
別冊日経サイエンス263『生成AIの科学 「人間らしさ」の正体に迫る』
別冊日経サイエンス239『人工知能 機械学習はどこまで進化するのか』