フラグメント分子軌道法による生体高分子の応用計算

福澤 薫, 中野 達也, 加藤 昭史, 望月 祐志, 田中 成典


Return

1 はじめに

構造生物学に基づく生体の機能解明や創薬研究において、分子シミュレーションはこれまでに一定の役割を演じてきた。分子レベルからの生命現象の理解は、疾患のモデリングや創薬などに結び付くと期待される。しかし例えば現在知られている論理的創薬のアプローチとしては定量的構造活性相関(QSAR)や経験的分子力場に基づいた分子力学・分子動力学法を用いるStructure Based Drug Designなどがあるが、前者では明確にタンパク質の構造を取り入れていないこと、後者ではエネルギー評価などの精度の問題があり、決定的な方法とはなっていない。一方、有機合成化学の分野ではすでに非経験的分子軌道法に基づく量子化学計算が実験とともに使われており、大きな成果を挙げている。量子化学計算は弱い分子間力や水溶媒・イオンなどの周辺の効果、化学反応、励起状態ダイナミクス、電子移動、金属を含む機能分子などの記述に優れており、構造生物学および創薬の分野への貢献が期待できるが、方法論並びに計算量の困難さから、最近まで実現に至っていなかった。
このような状況の中で産総研の北浦らにより考案されたフラグメント分子軌道(FMO)法は、分子をいくつかのフラグメントに分割して、フラグメントとフラグメントペアの計算から、精度を落とすことなしに分子全体の電子状態を計算しようという新しい近似法である[1 - 4]。FMO法は、生体高分子をフラグメントに分割することにより、計算コストを大幅に削減するとともに、フラグメント間の相互作用エネルギー(IFIE)を評価することができるという優れた側面を持っている。
FMO法の出現によって、タンパク質やDNAなどの生体高分子をモデル化せずにそのまま量子化学計算することが可能となった。そしてHartree-Fock(HF)法による計算に留まっていた時代を経て、方法論と計算機の進歩に伴ってある程度電子相関を取り込んだ計算が行えるようになってきた。生命現象において今まで定量的に正確に扱うことが困難であった問題にアプローチすることが現実的になってきている。本稿では、これらの方法論の発展とともに歩んできたFMO法の応用研究を紹介し、今後の展望について触れたい。
以下では、代表的なFMO法プログラムの1つであるABINIT-MPを用いた応用計算例を、専用可視化プログラムBioStation Viewerを交えて紹介する[5]。FMO法とABINIT-MPに実装されている各種方法論についての詳細は、本特集号の中野らの稿を参照していただきたい。ここでは、まずABINIT-MPを用いる際の計算方法やモデリングに対する目安に触れ、結果の解析のためのツールBioStation Viewerの説明を行った上で、核内受容体や転写因子などの具体的な課題に対して取り組んだ応用計算事例を紹介するとともに現在までに行われてきた計算の概要をレビューする。

2 ABINIT-MPによるFMO計算の実際

FMO法プログラムABINIT-MPには、現在までにHartree-Fock (HF) 法ばかりでなく、MP2法などの電子相関法やFMO独自の解析法も多数実装されている。ここでは、実際にABINIT-MPを用いて生体高分子の計算をする際に必要となる予備知識について簡単にまとめる。

2. 1 分子の構造

FMO計算に用いる分子の構造には、できるだけ信頼性の高いものを用いたい。本来はFMO計算により構造最適化するのが理想的であるが、現状では別の方法で構造を作成する必要がある。現在のところPDB結晶構造を初期構造とした分子力場計算による構造最適化[6, 7]や更に古典分子動力学計算を組み合わせた方法[8]により構造を作成することが多い。しかし分子認識に水素結合ネットワーク構造が重要な場合や酵素反応などでは、モデル分子を用いて量子化学計算を行い、タンパク質構造に埋め戻す手法[9 - 12]や、QM/MM計算 [13] などが用いられている。FMO法による構造最適化機能やab initio MD (FMO-MD) は現在開発中であり、近いうちに実用化されることが期待される[14, 15]。

2. 2 計算方法と基底関数

現在のABINIT-MPには、HF法ばかりでなく、電子相関を含んだMP2法[16, 17]、局在化MP2 (LMP2)法[18]やCIS[19], CIS(D)法[9, 20]といった高精度法が実装されている。特にMP2計算は、HF法では記述のできない分散力の効果を適度に取り込むことができる上に超高速化を実現しており、既に実用段階に達している。後述のように生体系の計算では分散力の効果が重要であるため、フラグメント間相互作用(IFIE)解析にはMP2法の利用を推奨する。ただし相対結合エネルギーなどの差の議論で、電子相関の寄与に同程度のキャンセレーションが期待できるときはHF法でも速度優先する選択肢もある。CI法などの高精度電子相関法は、全体を同レベルで扱うことが困難なので、多層化FMO(MLFMO)法と組み合わせて用いる。
主な基底関数はSTO-3G, 3-21G, 6-31G に分極関数、diffuse関数を加えたものが実装されている。また内殻電子をポテンシャルで置き換えるモデル内殻ポテンシャル(MCP)[21]も利用可能である。このうちSTO-3Gは、他の基底関数とは異なった結果が出ることが多く、テスト計算の位置づけである。6-31Gはそれに分極関数を加えた6-31G*や6-31G**と定性的に同じ結果が得られることから、現実的な選択である。diffuse関数は基底関数重ね合わせ誤差(BSSE)軽減に寄与すると考えられるが、現在開発中の三体項まで考慮したFMO3と共に用いる必要がある。

2. 3 フラグメント分割

FMO法の計算精度はフラグメントの分割方法に依存するため、フラグメントサイズの選び方は大切である。当然、各フラグメントのサイズが大きいほど精度は良いが、応用計算の場合には、精度ばかりでなく、結果の解釈がしやすいような分割方法を指定するのが良い。特にIFIE解析をする場合には、Bond detached atom (BDA)を挟んで隣同士のフラグメント間ではIFIEの評価ができないために、それを避けるような分割方法を選ぶべきである。タンパク質の場合には、2残基単位でフラグメント分割を行えば充分な精度が得られることが報告されているが[3, 4, 14]、IFIE解析を行う場合には、1残基単位で分割すると、残基間相互作用や基質と各残基との相互作用など、残基単位での相互作用解析をすることが出来るため応用計算に適している。DNAの場合には、ヌクレオチド単位にする方法と、塩基部分と主鎖部分を別フラグメントとする方法があり、前者の方が高精度であるが、塩基のスタッキングなどのIFIE解析をする場合には塩基部分を別フラグメントにする必要がある。また、リガンド分子などの低分子化合物の場合には、分子全体を1フラグメントとして扱うことが多いが、大きい分子はいくつかに分割する[17]。金属原子との配位結合がある場合や励起状態を扱う場合には、注目領域全体を単一のフラグメントにする[9]。いずれの場合にも、化学的性質に影響が出ないように細心の注意を払う必要がある。

2. 4 モデルサイズと計算時間

ABINIT-MPで計算できる分子サイズは用いる計算機によって変わってくる。通常、十数台のPCクラスタで充分に実用的であるが、特にMP2などの電子相関を含む計算では、各プロセッサ辺りのメモリが4GByteは必要である。現在までに、地球シミュレータを用いて最大で500残基を超えるタンパク質のMP2/6-31G計算が行われている。各研究室のPCクラスタを用いる場合には、200~300残基程度の標準的な大きさのタンパク質を扱うのが実際のところであろう(勿論、長時間かければ500残基程度のタンパク質の計算も可能である)。
計算時間は、例えばDual AMD Opteron (2.0 GHz、1プロセッサ辺りのメモリ4GB)を8ノード用いた場合には、約250残基からなる受容体−リガンド複合体の例では、計算レベルに応じて数時間〜数百時間で計算することができる(Table 1, MP2/6-31G*計算のみ32ノード使用)。通常の量子化学計算では不可能な計算が可能となっている。

Table 1. Computational times
methodNumber of AOsCPU time (h)
HF/STO-3G118023.6
HF/6-31G2158316.9
HF/6-31G*3325338.4
HF/6-31G**3925658.8
MP2/6-31G2158366.6
MP2/6-31G*33253100.7
MP2 calculation includes electron densities.

2. 5 解析法

ABINIT-MPにはまた様々な解析手法も組み込まれている。FMO計算の大きな特徴の1つは、フラグメント間相互作用エネルギー(Inter-Fragment Interaction Energy, IFIE)を計算できることであり、これは全てのフラグメントの組み合わせに対して網羅的に得ることができる。DNAやタンパク質を扱う場合には、残基間相互作用や基質と各残基との相互作用、DNAのWatson-Crick塩基対やスタッキング相互作用、残基−塩基間相互作用、などのフラグメント単位の解析が可能であるし、IFIEを組み合わせることによって分子間の結合エネルギーなども評価できる。また固定電荷を用いた古典力場計算とは異なり、原子電荷(Mulliken charge)を計算することができるため、電荷分布や電荷の移動に基づいた解析が可能である。さらに、軌道レベルの相互作用解析も行うことができる。望月らが提案したCAFI (Configuration analysis for fragment interaction) [22, 23]は、配置解析をFMO法に適用させたもので、水素結合における軌道間の電荷移動相互作用を解析することができる。また石川らが提案した、LMP2法を用いたFILM (Fragment Interaction analysis based on Local MP2) [18]を用いると、p-pやCH-pなどの相互作用を軌道レベルで解析することができ、これら2つの軌道解析を組み合わせることでより詳細な情報を得ることができる。これらの解析法は次の章で、BioStation Viewerの可視化機能と共に説明する。

3 専用GUIシステムBioStation Viewer

ABINIT-MPによるFMO計算のための入力ファイルの作成や計算後の解析を援助する目的で、専用のGUIシステムBioStation Viewerの開発を行っている[5, 24]。現在の最新版はVersion 7であり、プレ処理については、Protein Data Bank(PDB)等から生体高分子の構造をダウンロードしてから主鎖の補完、側鎖の補完(アミノ酸変異)、水素付加、アミノ酸配列に基づいた結合情報の自動割り当て、XUFF力場を用いた構造最適化などのモデリングを行い、ABINIT-MP用の入力データを作成するまでの一連の作業を行うことがほぼ可能となっている。
ABINIT-MPによる計算後のポスト処理機能としては、可視化機能が充実しており、FMO法ならではの計算結果を容易に可視化して解析することができる。計算結果のファイルを基に、電子密度、静電ポテンシャル、電場ベクトル、分子軌道、原子(Mulliken)電荷といった基本的な物理量だけでなく、フラグメント間相互作用エネルギー(IFIE)、軌道レベルの電荷移動・分極相互作用(CAFI)[22, 23]、多数のリガンド分子と受容体間の相互作用のクラスタリング(VISCANA)[25]などの解析が可能である。


Figure 1. Visualization of IFIEs for ER-ligand interactions (MP2/6-31G*)[27].

IFIEや原子電荷は分子の3次元立体構造上に色分け表示される(Figure 1)。受容体−リガンド複合体のIFIE表示では、例えば基準フラグメントとしてリガンドを指定すると、受容体の各アミノ酸残基がIFIEの値で色付けされ、相互作用の大きさが一目でわかる。Figure 1では、黄色のリガンドに対し、赤色は安定な相互作用、青色は不安定な相互作用をしている残基を示し、色の濃さが相互作用の強さを表している。
またIFIE解析の別の方法として、全てのIFIEを網羅的に可視化する2次元マップ(IFIE map)の表示機能もある[26]。Figure 2にDNA-タンパク質相互作用の例を示す。各軸はフラグメント番号を表し、対角線の上側に引力的な相互作用(赤色)、下側に反発的な相互作用(青色)が表示されている。Figure 1と同様に色の濃さが相互作用の強さを表している(赤青を分けずに一緒に表示することもできる)。これによりタンパク質内部相互作用、DNA内部相互作用、DNA-タンパク質間相互作用が網羅的に可視化でき、IFIEがタンパク質の2次構造やDNAの二重らせん構造を反映している様子がわかる。


Figure 2. Two dimensional IFIE map for DNA-CRP interactions (MP2/6-31G).

他にも、受容体と複数のリガンドとのIFIEをまとめて可視化するとともに相互作用パターンからリガンド類似性の抽出する手法であるVISCANA (Visualized cluster analysis of protein-ligand interaction)[25]の表示機能も組み込まれている(中野らの稿を参照)。
さらに、軌道相互作用や電子密度、静電ポテンシャル、分子軌道、電場ベクトルなどの計算結果も可視化することができる。これらはグリッドデータとして3次元構造上に表示される。例えばCAFI結果の表示では、ABINIT-MP計算結果から得られた電子受容軌道と電子供与軌道の組を、相互作用軌道として可視化する(Figure 3、電子供与軌道を赤・青で、電子受容軌道を黄・緑で表している)。CAFIとIFIE解析とを組み合わせることによって、相互作用の"大きさ"に加えて電子移動の"向き"を知ることができる。同様にして、局在化MP2法による分散力相互作用(FILM)についても軌道レベルでの可視化機能を現在開発中である[18]。


Figure 3. Visualization of the charge transfer interactions from Glu353 to the ligand.

4 生体系の応用計算

ここまでに紹介したABINIT-MPとBioSation Viewerの機能を活用して、FMO法による生体高分子系の量子化学計算が活発に展開されている。これらの応用計算は、それ自身が対象となる研究分野における有用な知見を与えるばかりでなく、FMO法のさらなる機能拡張の方向性を考える上でのフィードバックのために活用されたりしている。以下、我々がこれまでに行った計算を中心に、他グループの報告も交えたFMO応用計算の実例を紹介する。

4. 1 核内受容体−リガンド相互作用

核内受容体はリガンド依存的に転写を調整する転写制御因子であり、生活習慣病や成人病を含む様々な疾患に関係している。代表的なものにエストロゲン受容体(ER)などのステロイドホルモン受容体やレチノイン酸受容体(RAR)などがあり、後述のビタミンD受容体(VDR)、レチノイドX受容体(RXR)はどれも核内受容体スーパーファミリーに所属している。これらは共通のドメイン構造を持っており、特にリガンド結合ドメインとDNA結合ドメインはファミリー内でよく保存され、ドメイン名と同じ機能を持っている。核内受容体による転写制御の分子メカニズムはFigure 4に示すようになっており、リガンド結合、ホモ及びヘテロ二量化、コアクチベータとの結合、DNAとの特異的結合などの各ステップがそれぞれに重要な役割を果たす。これらの分子認識や情報伝達機構の解明は、生命現象の理解に役立つばかりでなく、医療や創薬などの観点からも興味深い。そのため核内受容体の問題は、FMO法による応用課題の筆頭として挙げられ、これまでに幾つかの興味深い研究が報告されてきた。


Figure 4. Transcriptional regulation mechanism of nuclear receptor.

4. 1. 1 エストロゲン受容体とリガンド分子の結合解析

エストロゲン受容体(ER)は代表的な核内受容体であり、女性ホルモン(エストロゲン)の受容体として働く。エストロゲン以外にも、さまざまな薬物分子や化学物質がリガンドとして結合し、細胞内信号伝達に影響を与えることが知られている。特に乳がんや骨粗しょう症などの重要な創薬ターゲットであることから、ERと医薬品候補化合物との結合性を予測するために、定量的構造活性相関(QSAR)や経験的手法によるドッキング解析など多くのin slicoスクリーニング研究が試みられている。しかし結合性の高精度予測には量子化学的なアプローチが不可欠であると考えられ、ブレイクスルーが求められていた。そこで我々は、FMO法の最初の応用研究としてこのER-リガンド結合性予測を行った[10, 11]。研究を開始した2000年当時は、最も低い計算レベルのHF/STO-3G法を用いてリガンド周辺の50残基にモデル化したタンパク質を用いた計算がやっとであった(Figure 5の黄色部分)。系統的な結合実験が行われている11種のリガンド化合物を用い、ERとの結合エネルギーを計算した。結合エネルギーは次式のようなsupermolecule計算により求めた。
DE = Ecomplex -(Ereceptor + Eligand)


Figure 5. Structures of ER-ligand complex.

FMO計算からFigure 6のような結果が得られ、相対結合能(RBA)の実験値と相対結合エネルギーの計算値との間に良い相関があることが示された(R=0.837)。FMO法による結合性の予測が妥当であることを示している。更に、ERと結合状態にあるリガンドの電荷と結合エネルギーとの間に相関があることがわかった。結合エネルギーが大きい程、中性のリガンドの負電荷が増す(0 ~ -0.2e)、つまりER-リガンド間の電荷移動量が大きいことが示された。電荷移動が結合性を決める上で重要な因子であると言え、これは経験力場などの固定電荷を用いた手法では得ることのできない新しい知見であった。


Figure 6. Relationship between calculation and experiment (HF/STO-3G) [10].

続いてERのリガンド結合ドメイン全体(約250残基)の計算が行われ[27]、先の50残基のモデルの結果と定性的に一致することが示された。すなわち、ER-リガンド結合は局所的であり、モデルタンパク質を用いたスクリーニングが有効であることを示している(IFIEを可視化したFigure 1を見ると、リガンドと相互作用しているアミノ酸残基は、リガンド周辺に限定されている様子がわかる)。さらに、supermolecule計算による結合エネルギーと、IFIEによる相互作用エネルギーの結果が定性的に一致することが示された。これにより、受容体・リガンド・およびその複合体という3種類のエネルギー計算をしなくても、複合体を計算するだけで結合エネルギーを見積もれるこということになり、量子化学計算によるin silicoスクリーニングの更なる高速化が見込める。勿論、精度が良いのはリガンド結合ドメイン全体を用いて電子の再配置効果の入ったsupermolecule計算をする場合であるが、用途に応じて使い分ける選択肢が示されたと言える。
ABINIT-MPの機能拡張と計算機の発展が進むにつれ、更に大規模かつ高精度な計算や解析が可能となって行った。中でもMP2計算の実用化[16, 17]は生体分子のシミュレーション研究にとってまさに革新的と言えるものであった。以降、ERと内因性リガンドである17b-estradiol (EST)の相互作用について、HFおよびMP2法を用いて更に掘り下げた解析結果を紹介する[27]。
各計算方法における、IFIEによるER-リガンド相互作用エネルギー値(結合エネルギーに相当)の比較をTable 2に示す。HF法では約-40 kcal/molであるのに対して、MP2法では約 -100 kcal/molと、2倍以上の相違がある。これを残基単位での相互作用解析により親水性残基と疎水性残基に分けて比較したところ、相違の主な理由は疎水性アミノ酸残基との相互作用であることがわかった。HF法では反発的であったこれらの相互作用が、MP2法では大きく安定化している。つまり、HF法では考慮されない分散力が結合性に大きく寄与していることがわかった。リガンドと疎水性アミノ酸残基とのIFIEを可視化したFigure 7にはHFとMP2の違いが鮮やかに描かれている。HF法では引力的な残基(赤色)が殆どなく、反発的な残基(青色)が幾つか存在するが、MP2法では反発的な残基はない上に、周辺の殆どの疎水性残基が引力的な相互作用をしている。これらが累積されて安定な結合を形成するのである。

Table 2. IFIEs between ER and EST.
HFMP2
STO-3G6-31G6-31G*6-31G**6-31G6-31G*
hydrophilic-54.48-50.42-45.42-45.11-62.66-63.31
hydrophobic12.024.955.155.77-33.46-37.77
total-42.46-45.48-40.26-39.34-96.13-101.07

リガンドと各アミノ酸残基とのIFIEをみると(Figure 1)、強く安定化しているのは、荷電・極性アミノ酸残基Glu353, Arg394, His524, Thr347および疎水性アミノ酸残基Phe404である。中でもGlu353とのIFIEは約-30kcal/molと際立って大きく、全相互作用エネルギーの約3分の1を占めている。一方、リガンド結合部位の立体構造から(Figure 8)、Glu353, Arg394, His524はリガンドの水酸基と水素結合ネットワークを形成しており、またPhe404は側鎖とリガンドのベンゼン環同士がT型のp-p相互作用をしていると考えられる。IFIEの結果はこれらを裏付けるものであった。以上から、リガンド結合部位において、幾つかの特定の親水性アミノ酸残基との間の強い静電引力に加えて、数多く存在する疎水性アミノ酸残基との間にも分散力に基づく引力的なvan der Waals力が働き、それらが共にリガンド結合に重要な寄与をしていることがわかった。つまり、相互作用の解釈には分散力の記述が必須であり、MP2法による解析は極めて有効かつ現実的と言える。


Figure 7. IFIEs between the ligand and surrounding hydrophobic residues. Upper figure: attractive interaction less than -1 kcal/mol. Lower figure: repulsive interactions more than 1kcal/mol [27].


Figure 8. Hydrogen bond network and charge transfer interactions.

ここまでに、ER−リガンド間の結合性と電荷移動量との間に関係があること、リガンドと周辺のアミノ酸残基が水素結合ネットワークを形成していることを述べた。ERとの結合によって中性リガンドESTの電荷は-0.11となっている。CAFIを用いた軌道レベルの相互作用解析により、このような電荷移動(CT)相互作用を数値的かつ視覚的に明らかにすることができる[27]。BioStation Viewerで可視化したFigure 3は、CAFI計算により得られたER-リガンド間のCT相互作用軌道のうち、最も大きいものである。Glu353のカルボニル酸素のlone pairからリガンドフェノール基のs*OHへの電子移動(電子供与)が起こっており、占有数は約0.02である(Glu353 nO ® ESTs*OH)。さらにリガンドからArg394(EST nO ® Arg394 s*NH), リガンドからHis524(EST nO ® His524 s*NH)への電子移動(逆供与)があり、全体として、Figure 8の矢印で示されるような、水素結合ネットワークを介した"CTネットワーク"が形成されている。CT相互作用エネルギーは、実にIFIEの3分の2程度を占め、ER-リガンド結合を特徴付けていることが明らかとなった。
以上により、ER−リガンド間の詳細な相互作用が明らかとなった。また電子相関を考慮することの重要性が明らかとなった。最初のHF/STO-3G計算においても実験値と良い一致が得られたのは、水素結合ネットワークに基づくCT相互作用が結合性を決める重要な因子であったこと、相対結合エネルギーで差を取っていたために、疎水残基との相互作用や溶媒効果、諸々がキャンセルされたためであると考えられる。このような場合には、数十残基程度に切り出したモデルタンパク質を用いたHF計算でも半定量的な結果が得られる[10]。
ここまでの結果は、野生型のERとリガンドとの結合に焦点を当てているが、変異型のERとリガンド分子の結合解析を行った例もある[6]。実際にERにアミノ酸変異を入れたモデル分子を作成し、リガンドとの結合親和性の変化を計算して、変異実験結果との比較を行っている。現在のところ予測精度は充分とは言えないため、改良方法を検討中である。

4. 1. 2 ビタミンD受容体とリガンド分子の結合解析

ERの場合と同様の手法を用いて、ビタミンD受容体(VDR)とリガンドとの相互作用解析および変異体の相互作用解析が山岸らにより行われている[12, 28]。まだHF法による検証であるが、リガンドと周辺のアミノ酸残基との水素結合に注目してIFIEの結果と網羅的なアラニン変異実験(ASMA)との比較を行い、結合に重要なアミノ酸残基の抽出を行った。VDR-リガンド結合の水素結合様式を明らかにしたと共に、くる病に関わるアミノ酸変異A274Lが結合に最も大きな影響を与えることを明らかにしている。

4. 1. 3 レチノイドX受容体とコアクチベータの結合解析

受容体−リガンド結合から拡張して、最近は核内受容体の一種であるレチノイドX受容体(RXR)とコアクチベータとの結合の解析も行われている[7]。核内受容体はアゴニストとの結合の後、リガンド結合ドメインの一部であるヘリックス12(H12)が移動して接触面を作り、コアクチベータと結合することが知られている。RXRはヘテロ二量体型の核内受容体とヘテロダイマーを形成して転写制御を行うため、核内受容体のリガンド結合後の挙動(post-binding)の観点からも重要なタンパク質である。
FMO法を適用した計算では、RXRのリガンド結合ドメイン、リガンド、及びコアクチベータSRC1(10残基のペプチド)との相互作用解析を行った。IFIE解析の結果から、RXR-SRC1結合のうち、H12とSRC1との相互作用が主要であること、特にH12中に保存されている残基との相互作用が強いこと、またRXRからSRC1への電荷移動も主にH12とSRC1の間で起こっていることを明らかにし、リガンド結合とコアクチベータ結合との間の架け橋になるH12の重要性が明らかとなった。
以上により、核内受容体とリガンド、コアクチベータとの結合に対し、量子化学的な立場から、各アミノ酸残基の役割や相互作用の様式を明らかにすることができた。

4. 2 DNAを含む系

次に、DNA鎖を含む生体分子系の応用例として、主に転写における分子認識機構の解析について紹介する。

4. 2. 1 cAMP受容体タンパク質とDNAの分子認識機構

cAMP受容タンパク質 (CRP) は、シグナル伝達物質であるcAMP (cyclic-AMP)との結合によってDNA結合が誘発され、糖代謝系遺伝子の転写を促進する転写制御因子である。例えば、大腸菌のラクトースオペロンの転写に対しては、転写を抑制するラクトースリプレッサーとともに二重調節の機能を果たしている(Figure 9)。


Figure 9. Transcriptional regulation mechanism of lactose operon.

これらの転写制御機構を明らかにするためには、まずDNAと転写因子との間の特異的相互作用について理解する必要があり、これまでに多くの実験的研究がなされてきた。特にCRPはコンセンサス配列中の保存領域5'-(T4G5T6G7A8)-3'を特異的に認識機構することが実験的に明らかにされている。またCRP側の認識モチーフは、へリックス・ターン・へリックスであり、後者のへリックスがDNAを認識する。これらCRPとDNAの複合系の結合特異性やDNA内部の相互作用を理解するためにFMO解析を試みた[8]。計算はHFおよびMP2レベルで行い、モデルのサイズはCRPが200残基、DNA鎖はコンセンサス配列周辺の11塩基対(5'-A-2A-1A1A2A3T4G5T6G7A8T9-3')であり、cAMPを含めた全原子数は3932であった。
Figure 10の左図はCRP-cAMP複合体と各DNA塩基および主鎖との相互作用を表す。特に濃い赤色を示し強く安定化しているのは、DNA主鎖のうち保存配列とその周辺 5'-(aaaaT4G5)-3' の部分であり、周辺との強い相互作用を表している(保存配列を大文字、その他の配列を小文字で表した)。ところが塩基との相互作用においては保存配列5'-(T4G5T6G7A8)-3'との相互作用が最も強く、特に5位と7位のG:C塩基対において強い配列特異性を表すという実験結果と一致する結果が得られた。DNAとCRPとの相互作用に対するこれらの結果について、FMOの計算レベルによる違いは特に見られなかった。しかしAmber94力場を用いて同様の相互作用エネルギー解析を行ったところ、FMO計算で得られた配列特異性は確認できず、量子化学計算の必要性が明らかとなった。一方、右図は2本鎖DNAと各アミノ酸残基およびcAMPとの相互作用を示しており、DNA鎖から見た場合にどのアミノ酸残基が安定化及び不安定化に寄与しているのかがわかる。この場合は、安定な相互作用は認識へリックスに集中している。この図からは更に、どのアミノ酸や塩基に変異を加えるとDNA−タンパク質の結合性が効果的に変化するか、などの知見を得ることができる。


Figure 10. IFIE analysis for CRP-DNA interactions (MP2/6-31G)[8].

また、DNA内部の相互作用についてもIFIE解析を行った[8]。DNA内の相互作用はWatson-Crick型の塩基対を形成する水素結合相互作用と、p-pスタッキング相互作用が特徴的で良く知られており、数塩基からなるモデル分子を用いた高精度量子化学計算が盛んに行われているが、主鎖を含む2本鎖DNAの量子化学計算は他に例を見ない。FMO計算結果から、まず水素結合型の塩基間相互作用では、単純な塩基対からなるモデル分子に比べて強い相互作用が観測された。ここではHF法とMP2法との定性的な違いは見られなかった。しかしスタッキング型の相互作用をみると(Figure 11)、両者の違いは歴然である。Figure 11では、保存配列4T:A~8A:Tに対し基準となる塩基対ごとに色別して、横軸の各塩基対との相互作用エネルギーを示している。もともとスタッキング相互作用には分散力の効果が重要であることが示唆されているが、HF法では反発的であったスタッキングが、MP2法ではHF法と比較して塩基対ペアあたり15~20kcal/molも安定化している。加えて、隣り合う塩基対同士の1,2-スタッキングは安定であり、そのさらに隣の塩基対との1,3-スタッキングは不安定であり、と、交互に安定・不安定を繰り返しながら収束していくことがわかった。また、未結合状態のDNAと比べて、CRPが結合した際には、DNAの内部相互作用に変化があることがわかった。CRPの結合によって、塩基対形成の相互作用は強く、塩基対間のスタッキング相互作用は弱くなることがわかった。そしてそれには、DNA-CRP間の電荷移動が影響していることが明らかになった。


Figure 11. Stacking interactions of DNA [8].

4. 2. 2 DNAを含むその他の計算例

DNA系のFMO計算については他にも幾つかの適用例がある。先にリガンド結合性を紹介したエストロゲン受容体(ER)のDNA結合ドメインとDNAとの相互作用の研究が渡邊らによりなされている[29]。原核生物であるCRPとは異なって核内受容体のDNA認識モチーフはZnフィンガーであるため、DNA、タンパク質に加えて遷移金属を含んだ系の計算となっている。ここではIFIEだけでなく静電ポテンシャルを含めた考察を行なっており、ER-DBDの二量化とDNA結合との関連性にまで言及している。
また、DNAとシスプラチン(Ptを含む抗ガン剤)との複合体の計算例もある[21]。この例では系にシェル水とカウンターイオンを配置し、水溶液中の条件下で、電荷分布が水和や電子相関によりどのような影響を受けるかを考察している。また最高被占軌道(HOMO)が、架橋している2つのグアニンに局在化しているという描像を得ている。ここでは同時に、基底関数として内殻電子をポテンシャルで置き換えるモデル内殻ポテンシャル(MCP)法を適用し、その有用性も併せて検討している。MCP法は、特に重金属を含む系においては、計算時間の短縮や計算誤差の軽減とともに相対論的効果が考慮されるというメリットがある。本例を通してMCP法が金属ならびに水を含む生体分子系の解析に十分有用であること、また、BSSE(基底関数重ね合わせ誤差)低減の点でも有効であることが確認された。

以上の結果から、DNAを含む系の生体高分子の計算に対して幾つかの指針が得られた。DNAを含む系では、DNAのリン酸基が負電荷を持つことから静電相互作用が支配的と考えられ、古典的な扱いでもある程度の成果が得られる。しかし分子認識に関しては配列特異性が重要であるが、配列を決めているDNAの塩基部分が絡む相互作用に関しては、分極や電荷移動などの量子化学的な取り扱いが必要になってくる。特にDNA塩基のスタッキングでは、分散力が重要な役割を果たすため電子相関を含む計算が必要である。さらに、ここでは真空中の計算結果が大半であったが、DNA鎖がリン酸基を有し、全体として大きく負に帯電していることは、DNAの構造やダイナミクス、電子状態を考える上で重要なポイントである。DNAは水溶液中でその機能を発揮することが多いが、その理論的解析にあたっては水分子やカウンターイオンが果たす役割に十分な注意を払う必要がある。これら周囲の環境の取り扱いに関する検討は、引き続き進行中である[30]。

4. 3 その他の事例

その他にも、方法論の開発に伴って幾つかの応用計算事例が報告されている。その1つに生体高分子の光励起特性解析がある。これらはCIS及びCIS(D)法と多層化FMO法を組み合わせることによって行われる。好塩細菌の光活性黄色タンパク質(PYP)における、クロモフォアの励起エネルギーや[19, 20]、赤色蛍光蛋白質(DsRed)の励起エネルギー・発光エネルギー解析[9]などが検討されている。DsRedの例では、励起エネルギーの実験値2.22eVに対して計算値2.30eV、発光エネルギーの実験値2.13eVに対して計算値2.21eVと非常に良い一致を示し、生体高分子の励起状態計算に対しても、明るい見通しが得られた。
また、疾患に関わる応用例題も増えつつある。インフルエンザウイルスの赤血球凝集素(HA)タンパク質のシアル酸認識に対する研究も始められている[31 - 33]。トリインフルエンザがヒトに感染する際にキーとなる糖鎖認識についての研究であり、アミノ酸変異によってシアル酸認識の特異性が変化すること等について言及している。
さらに、HIV-プロテアーゼ[34]やハンチントン病に関わるポリグルタミン(PolyQ)の凝集メカニズム[35]、などの研究が進められている。これら他グループによる試みは、公開版のABINIT-MPを用いて主にHFレベルで行われている。主に、QM/MM法や古典MDを組み合わせた動的なシミュレーションの一部にFMO計算を盛り込んだ具体的な応用計算が多い[34 - 36]。

5 おわりに

フラグメント分子軌道法による生体高分子の応用計算の現状について、ABINIT-MPを用いて計算された事例を中心に紹介した。生体高分子の電子状態や特異的結合における相互作用様式が明らかになったと共に、リガンド認識、コファクター認識、DNA認識など、生体分子系における分子認識の一般的な場面において、電子相関を適切に取り入れた量子化学計算が重要となることが具体例を通じて明らかにされた。古典力場の分野では、生体高分子の計算においては静電力とvan der Waals力が重要であると古くから言われてきた。ある意味ではようやく古典力場に追いついて、量子化学的手法による生体分子系のシミュレーションに本格的に取り組む準備ができたと言えるだろう。
FMO法は生体高分子の相互作用解析に適した強力な手法であり、今後様々な応用計算が展開され、生命科学研究に貢献すると期待される。これまでは静的な解析が主流であったが、今後は徐々に動的挙動を取り扱うことが必要となってくる。古典分子動力学法と組み合わせたab initio MDシミュレーション[14, 15]、古典的手法との融合法、量子化学計算に基づくオーダーメイド力場の開発[37]、など、実用化に向けた開発が進行中であり、より現実に沿ったシミュレーションが次々に実現されて行くだろう。生命現象の分子メカニズムは、それ自体が複雑なDNAやタンパク質が多数集まって複雑に相互作用し合い、水溶液中でダイナミックに作用している。本稿で紹介したような1つ1つの知識の集積によって、生命現象を分子レベルから紐解いて行こうというのが我々の試みである。

最後に、FMO法に関して多くの助言をいただきました北浦和夫先生、また沢山のご協力いただきました共同研究者の古明地勇人博士、石川岳志博士、渡邉博文博士、伊藤美香博士、栗崎以久男氏、佐藤智之氏、甘利真司博士、渡辺寿雄博士に感謝いたします。また、本研究は、科学技術振興機構(JST)戦略的創造研究推進事業(CREST)「フラグメント分子軌道法による生体分子計算システムの開発」プロジェクト及び文部科学省次世代IT基盤構築のための研究開発プログラム「革新的シミュレーションソフトウェアの研究開発(RSS21)」プロジェクトの支援を受けています。

参考文献

[ 1] K. Kitaura, T. Sawai, T. Asada, T. Nakano, M. Uebayasi, Chem. Phys. Lett., 312, 319-324 (1999).
[ 2] K. Kitaura, E. Ikeo, T. Asada, T. Nakano, M. Uebayasi, Chem. Phys. Lett., 313, 701-706 (1999).
[ 3] T. Nakano, T. Kaminuma, T. Sato, Y. Akiyama, M. Uebayasi, K. Kitaura, Chem. Phys. Lett., 318, 614-618 (2000).
[ 4] T. Nakano, T. Kaminuma, T. Sato, K. Fukuzawa, Y. Akiyama, M. Uebayasi and K. Kitaura, Chem. Phys. Lett., 351, 475-480 (2002).
[ 5] ABINIT-MP ver 3.1.1とBioStation Viewer ver. 6.06.1は以下のURLからフリーでダウンロードできる.
http://www.rss21.iis.u-tokyo.ac.jp/result/download/
[ 6] K. Maeda, A. Schug, H. Watanabe, K. Fukuzawa, Y. Mochizuki, T. Nakano, S. Tanaka, J. Comput. Chem. Jpn., 6, 33-46 (2007).
[ 7] M. Ito, K. Fukuzawa, Y. Mochizuki, T. Nakano, and S. Tanaka, J. Phys. Chem. B, 111, 3525-3533 (2007).
[ 8] K. Fukuzawa, Y. Komeiji, Y. Mochizuki, A. Kato, T. Nakano and S. Tanaka, J. Comput. Chem., 27, 948-960 (2006), : Errata [ 9] Y. Mochizuki, T. Nakano, S. Amari, T. Ishikawa, K. Tanaka, M. Sakurai and S. Tanaka, Chem. Phys. Lett., 433, 360-367 (2007).
[10] K. Fukuzawa, K. Kitaura, K. Nakata, T. Kaminuma and T. Nakano, Pure Appl. Chem., 75, 2405-2410 (2003).
[11] K. Fukuzawa, K. Kitaura, M. Uebayasi, K. Nakata, T. Kaminuma and T. Nakano, J. Comput. Chem., 26, 1-10 (2005).
[12] K. Yamagishi, K. Yamamoto, S. Yamada and H. Tokiwa, Chem. Phys. Lett., 420, 4-6 (2006).
[13] T. Ishida, D. G. Fedorov, and K. Kitaura, J. Phhys. Chem, B, 110, 1457-1463 (2006).
[14] Y. Komeiji, T. Nakano, K. Fukuzawa, Y. Ueno, Y. Inadomi, T. Nemoto, M. Uebayasi, D. G. Fedorov and K. Kitaura, Chem. Phys. Lett., 372, 342-347 (2003).
[15] Y. Mochizuki, Y. Komeiji, T. Ishikawa, T. Nakano, H. Yamataka, Chem. Phys. Lett., 437, 66-72 (2007).
[16] Y. Mochizuki, T. Nakano, S. Koikegami, S. Tanimori, Y. Abe, U. Nagashima, K. Kitaura, Theor. Chem. Acc., 112, 442-452 (2004).
[17] Y. Mochizuki, S. Koikegami, T. Nakano, S. Amari, K. Kitaura, Chem. Phys. Lett., 396, 473-479 (2004).
[18] T. Ishikawa, Y. Mochizuki, S. Amari, T. Nakano, H. Tokiwa, S. Tanaka, K. Tanaka (submitted).
[19] Y. Mochizuki, S. Koikegami, S. Amari, K. Segawa, K. Kitaura, T. Nakano, Chem Phys Lett., 406, 283-288 (2005).
[20] Y. Mochizuki, K. Tanaka, K. Yamashita, T. Ishikawa, T. Nakano, S. Amari, K. Segawa, T. Murase, H. Tokiwa, M. Sakurai, Theor. Chem. Acc., 117, 541-553 (2007).
[21] T. Ishikawa, Y. Mochizuki, T. Nakano, S. Amari, H. Mori, H. Honda, T. Fujita, H. Tokiwa, S. Tanaka, Y. Komeiji, K. Fukuzawa, K. Tanaka, E. Miyoshi, Chem. Phys Lett., 427, 159-165 (2006).
[22] Y. Mochizuki, Chem. Phys. Lett., 410, 165-171 (2005).
[23] Y. Mochizuki, K. Fukuzawa, A. Kato, S. Tanaka, K. Kitaura and T. Nakano, Chem. Phys. Lett., 410, 247-253 (2005).
[24] 加藤昭史、福澤薫、望月祐志、甘利真司、中野達也, BioStation Viewer, 可視化情報学会誌, 2006年4月号.
[25] S. Amari, M. Aizawa, J. Zhang, K. Fukuzawa, Y. Mochizuki, Y. Iwasawa, K. Nakata, H. Chuman and T. Nakano, J. Chem. Inf. Model., 46, 221-230 (2006).
[26] I. Kurisaki, K. Fukuzawa, Y. Komeiji, Y. Mochizuki, T. Nakano, J. Imada, A. Chmielewski, S. M. Rothstein, H. Watanabe, S. Tanaka (submitted).
[27] K. Fukuzawa, Y. Mochizuki, S. Tanaka, K. Kitaura, and T. Nakano, J. Phys. Chem. B, 110, 16102-16110 (2006).
J. Phys. Chem. B, 110, 24276-24276 (2006).
[28] K. Yamamoto, D. Abe, N. Yoshimoto, M. Choi, K. Yamagishi, H. Tokiwa, M. Shimizu, M. Makishima, and S. Yamada, J. Med. Chem, 49, 1313-1324 (2006).
[29] T. Watanabe, Y. Inadomi, S. Tanaka, K. Fukuzawa, T. Nakano, L. Nilsson, and U. Nagashima, Abstracts of papers of the American Chemical Society 229: U779-U779 157-COMP Part 1, MAR 13 2005.
[30] Y. Komeiji, T. Ishida, D. G. Fedorov, K. Kitaura, J. Comput. Chem., 28, 1750-1762 (2007).
[31] 岩田達則, 神戸大学発達科学部 卒業論文 (2007).
[32] T. Sawada, T. Hashimoto, H. Nakano, T. Suzuki, H. Ishida, M. Kiso, Biochem. Biophys. Res. Commun., 351, 40-43 (2006).
[33] T. Sawada, T. Hashimoto, H. Nakano, T. Suzuki, Y. Suzuki, Y. Kawaoka, H. Ishida, M. Kiso, Biochem. Biophys. Res. Commun., 355, 6-9 (2007).
[34] H. Ode, S. Neya, M. Hata, W. Sugiura, and T. Hoshino, J. Am. Chem. Soc., 127, 15127-15137 (2005).
[35] K. Tsukamoto, H. Shimizu, T. Ishida, Y. Akiyama, N. Nukina, J. Mol. Struct. (Theochem), 778, 85-95 (2006).
[36] Y. Sato, M. Hata, S. Neya, and T. Hoshino, J. Phys. Chem. B, 110, 22804-22812 (2006).
[37] B. Fischer, K. Fukuzawa, and W. Wenzel, Proteins, in press.


Return