2024年のノーベル化学賞は、タンパク質の構造についてAI技術の活用方法を考案した、ベイカー氏、ハビサス氏、ジャンパー氏の3人に送られました。
しかし「タンパク質の構造」と言っても、なぜそれを調べることが大変だったのか、そしてそれがわかることがどんなに凄いことなのかは、いまいち良く理解できないと思います。
そこで今回はお肉の話からはじめて、最終的には研究の凄さを実感できるようにわかりやすい解説を目指しました。
それではまずは「タンパク質と言えばお肉」という話題からはじめたいと思います。
目次
- タンパク質って「お肉」以外に何があるの?
- たった2年で「2億」種類のタンパク質の構造を解明
- 新しいタンパク質をゼロから設計する
タンパク質って「お肉」以外に何があるの?
タンパク質と聞くと、多くの人は「お肉」を思い浮かべるでしょう。
確かにお肉には多くのタンパク質が含まれています。
しかし生物学でいうタンパク質と、食材のタンパク質とは少しだけ見方が異なります。
生物学では食材と違い、赤血球にある酸素を運搬する役割を持ったタンパク質や感染から守ってくれる抗体タンパク質、DNAを複製するコピータンパク質など、1種類ごとの分子レベルのタンパク質に焦点を合わせています。
分子レベルのタンパク質の形は、上の図が示すように、お肉とは似ても似つきません。
一見すると、規則性のない滅茶苦茶な塊にみえるでしょう。
しかしよく目をこらすと、タンパク質分子のあらゆる部分がひも状をしていることに気付くと思います。
たとえば一部を拡大すると、下の図のように1本のひもがらせん状の構造をとっていることがわかります。
他の部分も同様に拡大すると、やはり全てが1本のひもが複雑に畳まれたり絡んだりして構成されていることがわかります。
このひもの正体は、アミノ酸が延々と連なったものになります。
つまりタンパク質とはアミノ酸がつながってできたひもが、複雑に絡み合うことで作られているのです。
そしてアミノ酸の繋がる順番はDNAに刻まれています。
特にDNAの中で伝統的に「遺伝子」と呼ばれている部分に刻まれている部分は、ほぼ全てがアミノ酸の繋がる順番を記すものになっており、それ以外の情報の占める割合は僅かなものになっています。
DNAが生命の設計図と言われるのは、アミノ酸の順番を記しているからなのです。
しかしそうなると気になることが出てきます。
遺伝子に刻まれている情報はアミノ酸の順番だけなのに、どうしてタンパク質たちはあんな複雑な形に変化できるのでしょうか?
最も大きな要因の1つはアミノ酸自身が持つ多様な結合能力です。
アミノ酸は分子の各所にプラスが優勢な場所やマイナスが優勢な場所、水素結合を起こしやすい場所が存在しており、適切にアミノ酸を繋げるだけである程度、勝手に変形して、自分自身を複雑な形に組み上げてくれるのです。
(※他にもアミノ酸内部の原子には大きさに差があり、大きさの差によって可動域が限定され、組み上がりかたもそれに左右されます)
先に紹介したらせん状の構造も、アミノ酸たちが持つ結合作用による「芸術」の1つとなっています。
また重要な点として、細胞の中には、長くなったアミノ酸の列を適切な形に折りたたまれるように助けてくれる「折り畳みの介護人」のような機能をもったタンパク質も存在することも知られています。
このような介護の助けもあり、酸素と結合できる機能を持ったタンパク質(ヘモグロビン)や、ウイルスを見つけて攻撃するタンパク質(抗体)や、神経から送られてくる電気信号をもとに収縮するタンパク質(筋肉繊維の中のアクチンとミオシン)など、多様なタンパク質が作られるのです。
DNAは生命の設計図であることには変わりませんが、そこから機能を持ったタンパク質が複雑な形に変形できるまでには、多数のプロセスが必要になるわけです。
ですがこれは、タンパク質の研究を行っている研究者たちにとって「大問題」でした。
DNAに記されているアミノ酸の順番という情報だけをみても、最終的にどんな形のタンパク質ができあがるかが全く予想できなかったのです。
この危機を脱する唯一の手段は、高性能な顕微鏡のような仕組み(X線結晶構造解析やクライオ電子顕微鏡など)を使って、タンパク質の分子構造を1つ1つ解明することです。
しかしこの作業は非常に時間がかかり、1つのタンパク質の分子構造を解明するためには、数か月から数年もかかることがありました。
構造が複雑で解析が困難なものに至っては、十年以上もの年月が要されることもあります。
DNAの配列情報が解き明かせるようになっても、その生産物であるタンパク質の構造がわからなければ、生命現象を正しく理解することも、病気を治すタンパク質ベースの薬も作ることはできません。
DNAに刻まれたアミノ酸の順番の情報から、タンパク質の構造を予測するための様々なプログラムが開発されましたが、正確性に問題があるものばかりでした。
人間が人間のために作った設計図ならば、そこから製造物を予測するのは単純です。
しかしDNAに刻まれた生命の設計図を、人類はなかなか解読することができなかったのです。
ある技術が開発されるまでは……。
たった2年で「2億」種類のタンパク質の構造を解明
2020年、ハサビス氏とジャンパー氏は、タンパク質の構造解析にAI技術を使った「AlphaFold2(アルファ・フォールド2)」を開発しました。
AlphaFold2は人工ニューラルネットワークと呼ばれる人間の脳の神経回路を模した仕組みを備えており、これまでの研究で解明されていたタンパク質の構造と、アミノ酸の連なりの関係を「学習」することが可能でした。
人間で例えるならば、アミノ酸配列(問題)とタンパク質構造(答え)を記した問題集を延々と解かされ続けたことになります。
人間ならば、こんなものを「学べ」と言われても「無理です」と言うでしょう。
しかしAIはそんな泣き言は言いません。
人間には無理な課題であったとしても、学べと言われたら学ぶだけです。
研究者たちはアミノ酸の1次元的な並びとタンパク質の3次元的な立体構造の関係を、AIの脳であるニューラルネットワークに徹底的に叩き込みました。
すると学習量がある一定の段階に達すると、奇跡が起こりました。
AlphaFold2は、アミノ酸の連なりを見ただけで、最終生産物であるタンパク質の構造を言い当てられるようになったのです。
しかも正解できる範囲には、AlphaFold2がこれまで見たことがないアミノ酸配列にも及びました。
AlphaFold2は学習を完遂することで、人間には不可能だった配列から構造を予測する能力を身に着けていたのです。
そしてその精度の中央値は100点満点中90点(CASPスコア)にもなり、既存のX線結晶構造解析に匹敵するレベルに及んでいました。
さらに驚くべきことに、2022年にAlphaFold2の開発チームは、開発から2年足らずで2億種類のタンパク質の構造を予測することに成功しました。
この2億という数は、これまでの人類が多様な生命から採取してきたDNAデータベースに収集されている、全てのタンパク質量をカバーするものでした。
(※また同じ時期にMeta(旧フェイスブック)が作ったAIは、まだよく知られていない細菌やウイルスなどが持つ、まだ特性がわかっていないタンパク質約6億種の構造をわずか2週間で全て予測することにも成功しました。ただこちらはAlphaFold2に比べて速度に優れるものの正確性がやや劣るようです)
このようなAIによるタンパク質構造解析は、生物学や製薬の分野に革命的な変化をもたらしました。
実際、以来現在に至るまでAlphaFold2を使ってタンパク質構造解析を行った論文は2万件に及んでいます。
ノーベル賞の中には発見から数十年を経て受賞するものもありますが、AlphaFold2は開発から僅かな期間での受賞となりました。
短い期間で受賞したということは、この技術がいかに全てを変えてしまったかを物語っています。
一方で、残る1人であるベイカー氏の業績は、2人の逆をいくという点で革新的でした。
新しいタンパク質をゼロから設計する
AlphaFold2はAI技術を使ってDNAやアミノ酸の配列をコピー・アンド・ペーストするだけで、タンパク質の構造を予測してくれました。
しかしベイカー氏の業績はある意味でその逆でした。
ベイカー氏が作った「ロゼッタ」と呼ばれる仕組みは研究者たちがタンパク質の構造をコンピューターに入力することで、必要となるDNA配列やアミノ酸配列を教えてくれるものでした。
(※初期型のロゼッタはAlphaFold2と同じようにアミノ酸配列からタンパク質構造を予測するために開発されましたが、その後の改良により「逆」が可能になりました。そしてノーベル賞はその改良に対して送られています)
より簡単に言えば、AlphaFold2が設計図からタンパク質の構造を教えてくれる仕組みであるならば、ロゼッタはタンパク質の機能や構造から設計図を逆算して教えてくれる仕組みだと言えるでしょう。
確かに素晴らしい発明ですが、AlphaFold2に比べてロゼッタの使い道を思いつかないひとも多いでしょう。
しかしここでいう「タンパク質の構造」というのは、想像上のものでも構いませんでした。
たとえば研究者がこれまでの研究データをもとに「こんな構造をしたタンパク質がもし存在していたらいいのになぁ」と思っていたとします。
これまでは、そんな空想上のタンパク質は空想のままでした。
しかしロゼッタが開発されたことで「研究者が思い描く理想の構造をしたタンパク質」を入力すると、その設計図がDNA配列やアミノ酸配列の形で一瞬で作られるようになったわけです。
必要となるDNA配列がわかれば、空想を現実にするのは簡単です。
DNA合成技術の進歩により現在では、人類は自分の好きな並びをしたDNA配列を人工合成することが可能になっています。
ロゼッタから吐き出された設計図をDNA人工合成装置に入力すると、その通りのDNA配列が完成します。
研究者たちはそのDNAを取り出し、細菌などのDNAに組み込んで培養しました。
すると細菌たちは組み込まれた合成DNAを自分のDNAと誤認して、設計図通りのタンパク質を作ってくれるのです。
結果、研究者たちの脳内にだけ存在した空想上のタンパク質が現実世界に出現できるようになりました。
これは製薬の分野にとって革命です。
実際、ベイカー氏の研究室は全く新しいタンパク質の設計を進め、インフルエンザの複数の株に結合して感染を抑えられるタンパク質、微生物の二酸化炭素の吸収量を高めるタンパク質などを生み出すことに成功しました。
さらに近年では、新型コロナウイルスのスパイク部分に結合して細胞への侵入を防ぐタンパク質も創出することに成功しています。
もし病気の原因となる中性脂肪や血栓、アミロイドβなどを素早く分解してくれるタンパク質(しかも免疫に敵認定されないように調節済み)などを開発することができれば、多くの人々の健康向上に役立つでしょう。
さらに水を浄化する機能があるタンパク質、プラスチックを分解できるタンパク質など自然界にまだ存在しないものの、存在すれば役に立つと考えられていたタンパク質の創造なども期待されます。
参考文献
They cracked the code for proteins’ amazing structures
https://www.nobelprize.org/prizes/chemistry/2024/press-release/
ライター
川勝康弘: ナゾロジー副編集長。 大学で研究生活を送ること10年と少し。 小説家としての活動履歴あり。 専門は生物学ですが、量子力学・社会学・医学・薬学なども担当します。 日々の記事作成は可能な限り、一次資料たる論文を元にするよう心がけています。 夢は最新科学をまとめて小学生用に本にすること。
編集者
ナゾロジー 編集部