創薬と計算化学

高田 俊和


Return

1 マテリアルシミュレーションへの期待

文部科学省と理化学研究所が、昨年度より開発を進めている"次世代スーパーコンピュータ" プロジェクトでは、その重要な応用分野としてナノサイエンスとライフサイエンスが取り上げられている[1]。著者の個人的な印象かも知れないが、PCクラスタなど身近なコンピュータが実用的な分子のシミュレーションに応えられるだけの実効性能を持ち始めてきたので、マテリアルシミュレーションへの現実的な要望が出され始めてきたと感じている。このプロジェクトでは、マテリアルサイエンスを含む計算科学の分野での革新的な成果を目指して、その計算速度を一挙に10ペタFLOPS級にまで高めようとしている。
著者が学生の頃は、10数原子分子の非経験的分子軌道計算が漸く実現し始めた時代であった。また、当時も今日と同様にコンピュータの性能向上は日々著しく、量子化学者はこれらの最新コンピュータを競い合って使い、その時代の大型分子の計算実現に鎬を削っていた時代でもあった。その後40年近く経って、量子化学者の関心がより複雑な分子系へ移り始めており、特に、生体機能の発現メカニズムを分子レベルで解明する目的で、蛋白質の全電子計算が次第に報告され始めている[2]。しかしながら、数千から数万原子からなる蛋白質のような巨大分子系では、その1点計算ですら、依然として多くの計算リソースを必要とすることも、また事実である。
最近、色々なシミュレーションの研究分野で、マルチスケールシミュレーションとかマルチフィジクスという言葉を、よく耳にする。一言で言えば、空間及び時間スケールの異なる現象について、色々なシミュレーション手法を連携 (連成) させて、注目している現象を効率よく再現しようとする計算科学の手法である。分子シミュレーションの領域では、伝統的にはQM/MM (Quantum Mechanics/Molecular Mechanics) 法[3]、最近ではONIOM法[4]が著名である。
その背景には、如何にスーパーコンピュータが高速になろうとも、一般に水溶液中で機能を発現している生体分子の挙動をまともに量子力学的な手法で再現することは、計算時間の観点から現実的ではないと、残念ながら言わざるを得ない事実がある。言い換えるならば、注目している現象について、ある種の近似的な取り扱いを導入して、効果的にシミュレーションすることが、本質的に望まれるということになる。分子軌道法の領域では、CNDOなどの半経験的分子軌道法が主流となっていた時期があったが、そのようなアプローチではなく、非経験的分子軌道法の信頼性を担保しつつ、計算時間を大幅に削減できる斬新な理論体系が求められているのである。このような背景を受けて、本稿では、QM/MM法に軸に、分子シミュレーションの今後を占ってみたい。

2 QM/MM法とマルチスケールシミュレーション

非経験的分子軌道法が広く適用されてきた有機分子単体の計算に比べて、生体分子の計算には著しい困難さがある。その理由は、
  1. 蛋白質など生体分子は一般に数千から数万原子からなる巨大分子系で、Hartree-Fock法による原子核の位置を固定して行う所謂1点計算ですら依然として困難である。
  2. 生体分子の化学事象におけるエネルギー変化は大体数kcal/molのオーダで、定性的な議論でさえ、ポストHartree-Fock法による高信頼性の計算が求められる。
  3. 生体分子は一般に水溶液中で、その機能を発現するため、自由エネルギーによる考察が本質的に求められ、アンサンブル法による計算が必須である。経験的ポテンシャルによる計算では、座標を変えて1千万回ほど計算を繰り返すといわれており、非経験的分子軌道法でまともにできる話ではない。
であり、これらは何れもコンピュータにかかる負荷を著しく増大させる要因である。これらの課題を克服して、蛋白質などの生体分子の水溶液中での振る舞いを明らかにするための計算手法として、QM/MM (Quantum Mechanics/Molecular Mechanics) 法が近年富に量子化学者の関心を集めている。


Figure 1. Image for QM and MM Partitioning of Protein and Ligand Complex

Figure 1に、QM/MM法における蛋白質と基質複合系の空間分割のイメージを示した。蛋白質 (酵素) のQM/MM法による計算では、触媒機能を担っている活性部位近傍を、この部分では電子が直接関与するので、非経験的分子軌道法や密度汎関数法で、それ以外の大部分を分子力場法で、取り扱うのが一般的である。非経験的分子軌道法の計算量は、Hartree-Fock法の場合概ねその空間に含まれる原子数の3乗に比例して増減する。一方、古典力学的な取り扱いでは、ポテンシャルエネルギーを経験的な力場パラメータ (原子の結合距離、結合角、2面角、van der Waals力など) についての簡便な数式で与えるので、量子力学的な取り扱いに比べて、計算時間が極めて短くて済むという優れた特徴がある。それらの長所を巧く取り込んで、

  1. QM空間に含まれる原子数をできるだけ、少なくして、高速化を図る。
  2. その他の大部分を、計算時間の掛からない古典力学的な計算手法で、高速化する。
とするのが、QM/MM法の基本的考え方である。
その時の全系のハミルトン演算子に対するエネルギー分割式は、

となる。この分割式は、QM、MM、RF空間の間での電子の交換がないという近似の下で、容易に求められる。最初の3項がQM、MM、RF (Reaction Field:溶媒) 空間の対角項で、その他は非対角項である。これらのエネルギー表式は、

と、一般的には書き下せる。これらの項は、何れも計算できる量である。このように、QM/MM法は、既に十分実績のある非経験的分子軌道法や密度汎関数法をQM空間に、蛋白質の構造シミュレーションで確立されている分子力場をMM空間に適用して、ニュートンの運動方程式による分子動力学計算をすればよいという、極めて明快な理論的なスキームになっている。

3 QM/MM法の課題と対策

QM/MM法の提唱はかなり古く、幾つかの試みが行われてきたが、残念ながら、十分な成功を収めたとは言いがたい状況が、最近まで続いていた。その理由を述べると、
  1. QM空間は、電子が連続的に分布したポテンシャルで与えられるのに対して、MM空間では、原子は電荷をもつ質点として表現される。そのため、ポテンシャルがQM空間とMM空間の境界領域で不連続となり、分子構造の正しい記述ができない。
  2. QM空間とMM空間をまたぐ共有結合を形成する原子を、それぞれの空間に帰属させるため、QM空間の末端原子に不対電子が人為的に現れる。この不対電子は、ラジカルで極めて活性に富むので、計算される電子状態に人為的な悪影響を及ぼす。
である。
大阪大学蛋白質研究所中村研究室とQM/MM計算プログラムの共同開発を現在進めているが[5]、前者について興味深い経験をしている。MM空間の原子は電荷をもつ質点として与えられるが、炭素や酸素原子は電気陰性度が大きいので、分子中では多くの場合負の電荷をもつことになる。自然界には、負の電荷もち質点として表現される粒子は、通常存在しない。この自然に存在しない性質のため、この負の電荷に向けて、QM空間の原子核 (正の電荷を持つ) が限りなく接近してしまい、QM空間の分子構造を正常に維持できないことが判明した。QM空間のポテンシャルでは、その柔らかい電子分布の結果、QM空間の分子構造を柔軟に変化させるが、MM空間のポテンシャルは、2次関数で本質的に固いので、ポテンシャルが不連続である影響が、QM空間の原子に対して大きく出ることになる。これは、MM空間の原子の1部を負に帯電した点電荷で表現している限り、本質的な問題として残ることになる。
不対電子の問題は、Link Atomなど幾つかの対処法が考案されて[6]、一応の回避はできているが、人為的な原子を分子系に取り込むことによる種々の問題は、依然として残っている。この点も、幾つかの提案がなされていて、色々検証されている段階である。
このQM空間とMM空間の境界で起こる構造不安定性の問題を回避するため、QM空間とMM空間の境界に、QMポテンシャルとMMポテンシャル両方で表現される擬似QM空間を設ける方法を考案した[7]。Hartree-Fock法で分子軌道を求めると一般に分子全体に広がった正準軌道が得られるが、ユニタリー変換で局在化分子軌道へ変換できることはよく知られている。今、エネルギー表式が分子軌道基底で、

と与えられたとする。ここで、abは分子軌道のインデックスであり、haは1電子積分、 <aa|bb> は2電子積分を表している。 (6) 式の分子軌道を局在化分子軌道に変換して、QM空間とその周辺 (擬似QM空間) に対応する局在間分子軌道をそれぞれ纏める。その上で、擬似QM空間に対応するエネルギー表式部分に (1 - a) とaの係数をかけて分割した後、aのかかっているエネルギー表式を経験的なポテンシャルで置き換える。その結果の式を示すと、

ここでは、Pが、擬似QM空間を表している。この導出の利点は、経験的ポテンシャルの導入に関して、理論的な根拠を与えていることである。
現在、この考え方に基づいて、大阪大学蛋白質研究所とQM/MM計算プログラムを開発中である[8]。QM/MM法では、ひとつの課題を解決すると、別の問題が浮上するという扱いにくい理論的手法であるが、水溶液中での生体分子のシミュレーションを行うためには、このような何らかの階層的なアプローチが必須なので、今後もQM/MM法を中心に生体分子のシミュレーション手法の検討を続けていきたいと考えている。
QM/MM法の酵素反応への応用としては、FriesnerらによるP450の酵素反応の活性化自由エネルギー計算が報告されている[9]。その中で、実験値との比較をしているが、その差は僅かに2〜3kcal/molであり、極めて高い精度で計算されている。この位の精度で、酵素反応の活性化自由エネルギーが計算できるのであれば、部位特異的変異による反応機構の予測も可能になると期待される。

4 In Silico創薬への適用

最近、新薬開発において、In Silicoスクリーニングといわれるシミュレーション技術が注目されている。新薬開発の第1歩は、病気の原因となる標的蛋白質に対する阻害剤を見つけることである。標的蛋白質の3次元構造が明らかになっていたとしても、市販されている数百万もの化合物の中から、アフィニティをもつヒットといわれる化合物を、どのようにして見つけ出すかが、最初の課題である。仮に、1化合物1万円としても購入コストは数百億円に達する。また、HTS (High Throughput Screening) と呼ばれるロボット実験技術を使って、1000化合物/日のペースで実験できたとしても、数年の長きに渡るので、とても開発競争の激しい製薬企業の研究開発には適さない。この探索空間の削減にコンピュータを利用できないかとの発想が、ここ10年位の間に研究者に広まっている。
とはいうものの、DRY系といわれるコンピュータ利用技術のみで新薬が開発されることはなく、WET系と呼ばれる実験 (アッセイ) との連携が、絶対に不可欠である。前臨床までの新薬開発の段階を示すと、
  1. 病気の原因となっている蛋白質の特定 (WET)
  2. 上記蛋白質の大量合成 (WET)
  3. 上記蛋白質の結晶作成 (WET)
  4. 上記蛋白質のX線結晶解析 (WET)
  5. コンピュータによるヒット化合物の探索 (DRY)
  6. ADMEなどデータベースの活用による選別 (DRY)
  7. BIACOREなどによる化合物の蛋白質に対する結合力の測定 (WET)
  8. リード化合物の構造最適化 (DRY)
  9. 上記化合物の化学合成 (WET)
  10. 動物などによる安全性の確認テスト (WET)
などの段階を、一般的には踏むことが多い。ヒット化合物というのは、標的蛋白質に結合して、蛋白質の機能を阻害する化学物質のことであり、リード化合物はヒット化合物の中から新薬の候補として選ばれた物質を指している。


Figure 2. Simulation Processes and Accuracy of In Silico Screening

ヒット化合物の探索範囲は100万化合物のオーダであり、如何にコンピュータの性能向上が著しいとはいえ、蛋白質とリガンド複合系を非経験的分子軌道計算で行うには、計算時間が掛かりすぎるので、ヒット化合物の探索には分子力場法を用いるのが、通例である。絞り込まれた化合物について精度を要求される計算には、QM/MM法を適用するのが、現実的な考え方である。Figure 2に、In Silicoスクリーニングの段階的な適用イメージを、対象分子数との関係で示した。ここで、1.5次スクリーニングとは、NECでの慣用的な表現である。FlexXやDockに代表されるドッキングプログラムでは、化合物のドッキング構造を生成しランク付けをするが、疎水相互作用の評価が一般に不十分である。これらのドッキング構造に対して、個々の原子がどの程度蛋白質・基質複合体とパッキングしているか考慮して、水素結合や疎水結合エネルギー等を再度見積もることにより、化合物ランキングの精度を向上させた手法である[10]。(6)のQM/MM法では、比較的少ない分子が対象ではあるが、計算精度の求められるリード化合物の最適化に適用されるようになると考えている。


Figure 3. Technology Value Chain for New Drug Research

In Silicoスクリーニングが、その真価を発揮している例を、具体的に示す。大阪大学NPO法人バイオグリッドセンター関西の進めている創薬バリューチェーンプロジェクト[11]では、大阪府立大学、京都大学、産業技術総合研究所、富士通九州、日立東日本ソリューション、三井情報開発、日本電気の研究者が、機械学習法、データベース検索、分子シミュレーションなどの技術を連携させて、市販されている100万を越す化合物の中から実際に実験可能な1千から数百まで絞り込んで、ヒット化合物の探索に成果を上げている。創薬バリューチェーンにおける技術連携のイメージを、Figure 3に示す[12]。
この技術連携の特徴のひとつは、WET系とDRY系の緊密な連携である。In Silico技術においても、複数の研究グループが連携している点が注目される。この意味する所は、新薬開発においては、1研究機関の所有する技術だけでは不十分で、各研究機関が所有するレベルの高い技術を連携させることに、その本質があるということになる。
本創薬バリューチェーンプロジェクトは、文部科学省の知的クラスタプロジェクトの一環として、大阪大学を始めとして、複数の研究機関の参加を得て進められている。WET系の実験は主として、大阪大学が担当しているが、その結果を次に示す。
マラリアの阻害剤に関しては、100万化合物より、蛋白質の構造情報を用いて約7000個に絞り、さらに詳細な計算により上位150個まで絞込み、実際に購入をして実験した結果、15個の医薬品候補としての有力な化合物の探索に成功している。また、構造が未知である膜蛋白質 (守秘義務契約により物質は特定できないが) については、論文などで得られた既知化合物情報をヒントに、同様の絞込みを行い、130個の化合物を購入して、アフィニティに関する実験を行った所、論文で報告されている化合物の活性の1000倍、10倍の作用を示す化合物それぞれ1個と、同程度のもの26個の化合物が確認できている。100個程度の化合物についての実験でヒット化合物が見つかるのであれば、色々な標的蛋白質に対する阻害剤の発見が短時間で行えることになる。現在行われている創薬バリューチェーンでのIn Silicoスクリーニングとしては、Figure 2の(1)から(4)の技術に対応する手法が用いられている。 
このIn Silico技術は、今後数年程度で、どこの製薬企業でも使う実用的で汎用な技術になると考えている。このようにして選別されたヒット化合物の段階では、標的蛋白質に対する結合力が十分でなかったり副作用が強すぎたりして、薬としては不完全な場合が多い。次の課題は、これらの化合物の1部 (官能基) を置換して、薬としてよりよい化合物へ変化させる (リード化合物の構造最適化) ことであるが、ここにも分子シミュレーションが有効であろうと期待されている。

5 結論

これまでは、分子シミュレーションは後追いの説明に終始していて、実験研究者が欲しているような予測ができないと指摘されていたが、本稿で紹介したIn Silicoスクリーニングの結果は、その課題を克服した一例である。次の課題は、リード化合物の最適化においてQM/MM法やその他の計算手法がどのように使われるかであるが、これも創薬バリューチェーンの次のテーマとして取り上げられると考えている。
文部科学省と理化学研究所が進めている次世代スーパーコンピュータ開発プロジェクトにおいても、シミュレーションがイノベーションを引き起こす引き金になると期待されている。そのためには、シミュレーションが日常の研究開発の活動の中で日々使われる"普通の研究ツール" にならなければならない。既に、建造物の構造解析や自動車の衝突解析などはその水準に達しているが、その理由は、必要とするコンピュータリソースが現在のコンピュータテクノロジーでほぼ提供されているからである。分子シミュレーションに関していえば、コンピュータの演算能力は十分ではないが、QM/MM法のような工夫を続けることで、そう遠くない将来において、実験研究者が実験室のPCからGRID技術によってスーパーコンピュータにアクセスして、自在に分子計算できる日がくると確信している。

参考文献

[ 1] http://www.nsc.riken.jp/index_j.html
[ 2] F. Sato, T. Yoshihiro, M. Era and H. Kashiwagi, Chem. Phys. Lett., 341, 645 (2001).
[ 3] J. Gao, Reviews in Computational Chemistry, vol. 7, ed. by K. B. Lipkowitz and D. R. Boyd, VCH Publisher, Inc., New York (1996), pp.119-185.
[ 4] F. Mareras and Keiji Morokuma, J. Comp. Chem., 16, 1170 (1995).
[ 5] http://www.biogrid.jp/
[ 6] M. J. Field, P. A. Bash and M. Karplus, J. Comp. Chem., 11, 700 (1990).
[ 7] 中田一人、米澤康滋、高田俊和、中村春木, 生物物理、札幌 (2006).
[ 8] Y. Yonezawa, K. Nakata, T. Takada and H. Nakamura, Chem. Phys. Lett., 428, 73 (2006).
[ 9] R. A. Friesner and V. Guallar, Annu. Rev. Phys. Chem., 56, 389 (2005).
[10] H. Fukunishi, J. Shimada, D. Tokushima, T. Washio, H. Kuramochi, CBI 2005 Proceedings (2005), p.87.
[11] http://www.biogrid.jp/j/archive/comp/img/051104.pdf
[12] Nature, 437, 1077 (2005).


Return