計算機シミュレーションを用いたRNA結合タンパク質PumilioのRNA結合様式の研究

栗崎 以久男, 渡邉 博文, 田中 成典


Return

1 緒言

細胞内で発現するRNAはRNA結合タンパク質 (RNA Binding Protein; RBP) により品質管理を受けている。RBPはRNAの塩基配列や高次構造を認識し、標的となるRNAに特異的に結合する。更にRBPはRNAと複合体を形成した後、RNAの安定化、分解、翻訳調節、スプライシングなどの機能に関与することが知られている。そのため、RBPは細胞の生存において欠かすことのできない重要な要素である。
RBPの分子機能について、これまでにさまざまな知見が得られている。生化学実験により各種RBPについて標的となるRNA配列が決定され、タンパク質-RNA複合体の結合定数 (物理的には結合自由エネルギーDGに対応する量) も測定されている。X線やNMRで決定された立体構造の観察から、タンパク質-RNA複合体の結合界面で水素結合や分散力といった局所的な相互作用が複合体の安定化に関係していることが明らかになった[1, 2]。


Figure 1. Correspondence between each RNA base and module of PUF-domain. The number above and below the base indicates the module bound to the base and the annotation of each base in sequence, respectively. The core sequence is highlightened by italic font.

例えば、mRNAの翻訳抑制に関与するPumilioはC末端側にPufドメインとよばれるRNA結合ドメインをもち、Figure 1に示すような8塩基からなる塩基配列と特異的に結合することが知られている。このPufドメインと特異的に結合する配列はUGU からなる "core配列" とその3' 側に続く "flanking 配列" からなる。Core配列は生物種間で保存されている一方、flanking配列は生物種間で多様性が見られることが知られており[3, 4]、例えばヒトPufドメインの場合はUGUANAUA (Nは任意の塩基) が特異的結合配列であることが示唆されている。Pufドメインと結合配列の結合定数は、生物種によらずKa~109 (mol/l)-1 程度であることが知られている[3, 5, 6]。また、PufドメインはRNA結合特異性を持ち、2' 位の水酸基をデオキシ化したポリヌクレオチドでは、9000倍の結合定数の低下が知られている[4]。
Pufドメインは36残基からなるモジュールが8個並んだ構造をしている (Figure 2) ことがアミノ酸配列解析からわかっており、酵母からヒトまで進化的に保存されていることが知られていたが[7]、2001年以降からヒトと酵母でPufドメインおよびPufドメインとRNAの複合体の立体構造がX線結晶解析で解かれ[4, 6]、ヒトと酵母の立体構造が互いに相同であることから、Pufドメインの立体構造も配列構造と同様に進化の過程で保存されていることが示唆された。
Pufドメインはa-ヘリックスからなり (Figure 3(A))、各モジュールは3つのa-ヘリックスで構成されている (Figure 2)。2番目のa-ヘリックスに塩基と水素結合を形成するアミノ酸残基があり、各モジュールと塩基は1対1の水素結合をしている。また、各塩基は隣り合う二つのモジュールから突出しているアミノ酸残基の側鎖とスタッキングしており、この部分もエネルギー的な安定化に寄与していると考えられている (Figure 3(B))。ヒトPufドメインの立体構造解析に基づき、塩基と水素結合を形成するアミノ酸残基ペアを置換することでPufドメインに天然の結合配列ではないRNAと特異的結合させる試みも成功しており[5, 8]、水素結合形成がPufドメインとRNAの特異的結合に重要であることを裏付けている。更に実験から結合配列中の塩基を置換すると、その箇所ごとに結合自由エネルギー差DDGが異なることが明らかにされている[5]。 このことから特異的結合配列中であっても塩基ごとに結合自由エネルギーDGへの寄与が異なることが示唆されるが、実験から個々の塩基のDGへの寄与を知ることはできない。同様にモジュール内の各残基の複合体安定化の実効的な結合自由エネルギーへの寄与も見積もることはできない。
近年の計算機資源の充実に伴い、タンパク質-核酸複合体の系でも計算機シミュレーションが行われており、中でも分子動力学 (Molecular Dynamics; MD) 計算が盛んに行われている[9]。
MD計算では、Newtonの運動方程式を解くことで系を構成するすべての原子核の運動を追跡することができる。MD計算から得られた分子運動のトラジェクトリーから、複合体形成に重要であると考えられる水素結合形成頻度の解析や、結合自由エネルギーといった熱力学量の計算を行うことができる。更に、MD計算では力やエネルギー等の各種物理量を既知のエネルギー関数を用いて計算することから、自由エネルギーのエンタルピー項を残基ごと、塩基ごとの寄与に分解した値を知ることができる。


Figure 2. Primary structure of each Puf-repeat. The larger fonts represent amino acid residues forming hydrogen bonds with RNA base (light blue) or those stacking on RNA bases (dark grey). Bold lines above amino acid annotation mean the secondary structures: Orange line for a-helix and green line for extended sheet, respectively.

本研究ではヒトPufドメイン-RNA複合体のMD計算を行い、結合配列中の個々の塩基のエンタルピーDHへの寄与について検討した。また、複合体の安定化に関与するアミノ酸について構造解析の知見を踏まえつつ、Pufドメイン-RNA複合体安定化のメカニズムを計算機シミュレーションで明らかにすることを試みた。

2 計算手法

分子動力学計算ソフトウェアAMBER9 [10, 11]を用いてMD計算を行った。Protein Data Bank (PDB) に登録されているヒトPufドメイン-RNA複合体 (PDBID: 1M8Y [4]のA鎖とC鎖) を計算に用いた。
X線結晶構造解析からは位置を特定できない水素原子の補完や、PDBファイル内に "missing residue" (揺らぎが大きいなどの理由から構造が決定できなかった部位) として明記されているC末端の数残基のモデリングはAMBER9に用意された立体構造編集モジュールLEaPで行なった。その後、構造最適化を行いMD計算の初期構造とした。また、ヒスチジン残基のプロトネーションは "H++" というプロトネーション部位の予測サーバーを用いて決定した[12 - 14]。


Figure 3. Pumilio-RNA complex structure at the binding interface. (A) 3D structure of Puf domain (PDBID: 1M8Y). Each module is colored in blue (even) or green (odd) in turn, while N and C terminal regions are colored in violet and RNA are colored in orange. (B) Local interaction among amino acids and RNA base at the binding interface.

タンパク質-RNA複合体を周期的境界条件のユニットセルの境界面からの最短距離が10 Aとなるように水和し、ナトリウムイオンをカウンターイオンとして加えて系を中和した (Figure 4)。時間の刻みは1フェムト秒とし、水素原子の結合・伸縮運動はSHAKEアルゴリズムにより凍結した。また力場パラメーターはAMBER force field 99を用いた。溶質、溶媒、イオンの構造最適化計算を行った後に、定積条件で系の昇温を行った。長距離相互作用の計算はParticle Mesh Ewald法を用い、実空間のカットオフは12Åとした。その後の等温 (300 K; Berendsenの熱浴法[15]による)、定圧 (1 atm) 条件で緩和を行い運動状態のトラジェクトリーを得た。昇温過程後の7.5ナノ秒のMD計算のトラジェクトリーについて、まず系の温度やエネルギーといった物理量の収束を確認し (Figure 5(A)-(C))、安定なMD計算結果が得られたと判断した。次にこのトラジェクトリーの先頭のスナップショットをリファレンスとして、平均自乗距離 (root mean square deviation: RMSd) を計算し、RMSdが平衡に到達した1.5ナノ秒以降を解析に用いた (Figure 5(D))。RMSdの計算は、Pufドメインではmodule内 (N末端から見て25番目から319番目まで) のCa原子、RNAでは認識配列 (5' 末端から見て3番目から10番目まで) のC1' 原子について計算した。系の昇温および緩和に関する詳細は、Table 1にまとめてある。水素結合の解析にはAMBER9の解析用モジュールptrajを用いた。水素結合 (X...H-Y: X,Yは各々アクセプターとドナーの陰性原子、Hは水素原子、' ...' は水素結合を表す) はX-Y間の距離が3.3 A以内でかつ、XHYのなす角度が120°以上の場合と定義した。この水素結合の判定基準はタンパク質-RNAの構造解析およびMDシミュレーションの先行研究で用いられていたものを参考にした[16 - 18]。
Pufドメイン-RNA複合体の結合自由エネルギーの計算は、AMBER10のMM-PBSAモジュールを利用した。Pufドメイン-RNA複合体のMD計算から10ピコ秒ごとに複合体、Pufドメイン、RNAの構造を生成してMM-PBSAの計算に用いた。系に含まれていた水およびイオン分子はすべて取り去り、溶媒効果はmodified Generalized Bornモデル[19, 20]を採用した。計算条件の詳細は類似の系についての先行研究[21]を参考にした。


Figure 4. Preparation of Pumilio-RNA complex system. (A) Hydration of Pumilio-RNA complex. Pumilio and RNA are represented as ribbon diagrams and water as points. (B) Components of the system.

Table 1. Procedure of simulation. The order of simulation corresponds to #. MM: molecular mechanics, MD: molecular dynamics, SD: steepest descent method, CG: conjugate gradient method

分子モデルの描画にはVisual Molecular Dynamics (VMD) [22, 23]を用いた。
計算機に関しては、MD計算は岡崎共同研究機構の計算科学研究センター、AMBER10のMM-PBSAモジュールを用いたエンタルピーの計算には研究室の所有する分子動力学計算専用マシンDual Xeon X5460 (3.16GHz) Workstationを利用した。

3 計算結果と考察

ヒトPufドメイン-RNA複合体の分子動力学計算から得られた分子運動トラジェクトリーをもとに、アミノ酸-塩基間の水素結合形成頻度の解析を行った。また結合自由エネルギーのエンタルピー項を各アミノ酸残基、塩基からの寄与に分解し、各塩基の複合体安定化に対する寄与の比較や水素結合形成頻度との対応関係、およびPufドメイン内で複合体安定化に関係する残基を調べた。


Figure 5. (A) Temperature of the system. (B) Mechanical energies. (C) Density of the system. (D) The root mean square deviations (RMSd) of MD trajectory for Pumilio(red) and RNA(blue) in relaxation process, which are calculated for backbone atoms Ca for amino acids and C1' for RNA. The double head arrow indicates the analyzed part in the trajectory.

まずPufドメイン-RNA複合体形成に重要な水素結合を特定するため、解析に用いた1.5ナノ秒から7.5ナノ秒までのトラジェクトリー (6000スナップショット、オフセット: 1ピコ秒) 中で5%以上の頻度で形成されるアミノ酸-RNA塩基間の水素結合を選び (Figure 6)、500ピコ秒ごとに水素結合の形成頻度を解析した (Figure 7)。アミノ酸残基-塩基間の水素結合形成は、形成頻度が定常的に70%以上の安定な部位 (U5_1-3、A6_1、A8_1、U9_1-3、A10_1、A10_2) がある一方、時間ごとに変動し結合の破壊および生成がおこる不安定な部位 (G4_1A、G4_1B、G4_2A、G4_2B、G4_3、C7_1-3) もみられ、結合界面となる部分でもアミノ酸残基-塩基間に形成される水素結合が常時安定とは限らないことが分かる。トラジェクトリーの解析から塩基には1つのアミノ酸残基のみと水素結合をするものと2つのアミノ酸残基と水素結合をするものがあることが分かった。まず、2つのアミノ酸残基と水素結合を形成する塩基 (G4、U5、U9) について解析した。U5、U9が3ヶ所で定常的に70%以上の頻度で水素結合を形成していた。G4はアミノ酸残基と5ヶ所の不安定な水素結合を形成していた。この水素結合部位 (G4_1A、G4_1B、G4_2A および G4_2B) では、Glu256の側鎖内のカルボキシル基が回転することで、Oe1とOe2の位置が入れ替わり水素結合の再形成が起こる。このことからG4とGlu256の間にはどの時間領域でも常に2ヶ所の水素結合が形成されている。ただし、G4_3に対応する水素結合は時間経過に伴い形成されなくなるので、G4は2500ピコ秒以降では1箇所のアミノ酸残基とだけ水素結合を形成する。一方、1個のアミノ酸残基と水素結合を形成する塩基については、A6、A8、A10では2ヶ所の定常安定な水素結合を形成していた。特にA10の2ヶ所の水素結合はどの時間領域でも90%以上と安定であった。C7は不安定な3箇所の水素結合を形成することがわかった。C7_2は時間とともに減少する一方、C7_1およびC7_3は増加し、1500ピコ秒以降には80%以上に達する傾向が見られた。今回計算から得られたトラジェクトリーでは特異的認識配列内にあるU3がアミノ酸残基と水素結合形成をしていなかったが、これは立体構造中の欠損を補完したC末端残基の運動が影響したためと考えられる。以上の水素結合形成頻度の解析からU5、U9、A10が他の塩基に比べて安定化に寄与していると予想される。


Figure 6. Hydrogen bonds between amino acids and RNA bases. Each hydrogen bond is distinguished by annotation, which corresponds to that of Figure 7. The snapshot where the maximum number of hydrogen bonds are formed is selected from the MD trajectory for each case.

そこで結合自由エネルギーのエンタルピー項をアミノ酸残基、塩基からの寄与に分解することで、各塩基が複合体の安定化に寄与する度合いを検証し、水素結合の形成頻度との間に対応関係があるかを調べた (Figure 8)。塩基部分の安定化への寄与は、G4が最も大きく、次いでA10、A8、A6、U9、U5、C7、U3の順であった。C7は塩基選択性のない位置にあるために安定化への寄与が小さいと考えられる。一方、特異的認識配列内にあるU3が他の箇所に比べて安定化への寄与が小さいのは水素結合を形成していないことが原因であると考えられる。結合形成頻度の解析ではU5、U9はいずれも3ケ所以上の安定な水素結合を形成していたが、必ずしも水素結合の本数が安定化への寄与と対応するものではないことが分かった。このことは水素結合だけでなく、塩基-アミノ酸残基のスタッキングも安定化に寄与するという実験からの知見を支持している。以上のことから安定化について、U5、A6、A8、U9,A10の塩基はいずれも同程度の寄与をする一方、G4からの寄与が最も大きく、またC7の安定化への寄与がほかの塩基に比べて小さいことがわかった。C7については、この位置の塩基に選択性がないためであると考えられる。


Figure 7. Hydrogen bond formation between amino acids and RNA bases. The annotation of plot refers to abbreviation of acceptor-donor pair corresponding to the code in Figure 6.


Figure 8. Enthalpy decomposition per residue of Puf-RNA complex. Each component is divided into side chain (base) and main chain (sugar and phosphate) contributions for amino acids (for RNAs). The amino acids involved in hydrogen bonds and stacking with RNA bases are emphasized by blue and orange circles, respectively.

次に、Pufドメインのどの残基が複合体の安定化に関わっているかを明らかにするために、残基ごとの複合体形成によるエンタルピー差を調べた。まず構造解析から推定されている水素結合およびスタッキングに関係する残基が安定化に寄与するものとして特定された。水素結合およびスタッキングに関係している残基のエンタルピー差はFigure 8では青色およびオレンジ色の丸で強調されている。スタッキングに関係する残基は位置的にRNAの骨格部分とも接近しており、特にArg109、Arg181、Tyr217はRNAの骨格部分と水素結合を形成する。そのために塩基と水素結合のみを形成するアミノ酸残基に比べて安定化への寄与が大きいと考えられる。
また、塩基と水素結合やスタッキングといった相互作用を形成しない残基 (Tyr106、Gln141、Gln213、Try24、Lys249、Met105、Asn142など) についても安定化に寄与することが分かった。
以上の解析から、塩基とスタッキングを形成するアミノ酸残基の安定化への寄与が、塩基と水素結合を形成するアミノ酸残基の安定化への寄与を上回ることが分かった。またPufドメインの複合体安定化への寄与は、Pufドメイン-RNA結合界面で塩基と直接相互作用する残基だけでなく、その近傍にある残基もまた安定化に寄与することが明らかになった。なお、RNAの骨格部分の関与する水素結合については今後の研究課題である。

4 結論

Pufドメイン-RNA複合体形成における個々の塩基の安定化への寄与と、Pufドメインの複合体安定化への寄与を調べるために、MD計算を行い分子運動トラジェクトリーからアミノ酸残基-塩基間の水素結合形成頻度の解析および複合体形成によるエンタルピー変化を計算した。エンタルピー差を各アミノ酸残基、塩基からの寄与に分解し、結合配列中の塩基について複合体の安定化への寄与が一様ではないこと、およびPufドメインでは結合界面の残基が主に安定化に寄与しており、更にその近傍にある残基も安定化に寄与していることを明らかにした。更に、構造解析とエンタルピー差の比較からアミノ酸残基-塩基間の水素結合数から予想される塩基の安定性とエンタルピー差が示す安定化の度合いが一致しないことがわかった。このことはアミノ酸残基-塩基間の水素結合だけでなくスタッキングも複合体の安定化に寄与するという、実験から得られた知見を支持している。今後は、リボース基の結合特異性への影響や、塩基やアミノ酸残基を変異させた構造に対する自由エネルギーの解析を行い、より詳細な特異的結合のメカニズムの解明を行うと同時に、酵母のPufドメインについて、計算機シミュレーションを行い、生物種間における差異についても検討していく予定である。

本稿を執筆するにあたり、有益な示唆を頂いたAMBER研究会の皆様、神戸大学田中成典研究室の皆様および有益なコメントをいただいた査読者の方々に感謝します。また、著者の一人(栗崎)は日本学術振興会の特別研究員奨励費からの助成に感謝します。

参考文献

[ 1] Perez-Canadillas, J. M., Varni, G., Curr Opin Struct Biol, 11, 53-58 (2001).
[ 2] Auweter, S. D., Oberstrass, F. C., Allain, F. H., Nucleic Acid Res., 34, 4943-4959 (2006).
[ 3] Zamore, P. D., Williamson, J. R., Lehmann, R., RNA, 3, 1421-1433 (1997).
[ 4] Wang, X., McLachlan, J., Zamore, P. D., Hall, T. M., Cell, 110, 501-512 (2002).
[ 5] Cheong, C. G., Hall, T. M., PNAS, 103, 13635-13639 (2006).
[ 6] Miller, T. M., Higgin, J. J., Hall, T. M., Nat. Struct. Mol. Biol., 15, 397-402 (2008).
[ 7] Spassov, D. S., Jurecic, R., IUBMB Life, 55, 359-66 (2003).
[ 8] Ozawa, T., Natori, Y., Sato, M., Umezawa, Y., Nat. Methods, 4, 413-419 (2007).
[ 9] MacKerell Jr, A. D., Nilsson, L., Curr. Opin. Struct. Biol., 18, 194-199 (2008).
[10] Case, D. A., Cheatham 3rd, T. E., Darden, T., Gohlke, H., Luo, R., Merz Jr., K. M., Onufriev, A., Simmerling, C., Wang, B., Woods. R. J., J. Comp. Chem., 26, 1668-1688 (2005).
[11] コンフレックス株式会社ホームページ:
http://www.conflex.co.jp/
[12] H++のホームページ:
http://biophysics.cs.vt.edu/H++
[13] Gordon, J. C., Myers, J. B., Folta, T., Shoja, V., Heath, S. L., Onufriev, A., Nucleic Acids Res, 33, 368-371 (2005).
[14] Anandakrishnan, R., Onufriev, A., J. Comput. Biol., 15, 165-184 (2008).
[15] Berendsen, H. J. C., Postma, J. P. M., van Gunsteren, W. F., DiNola, A., Haak, J. R., J. Chem. Phys., 81, 3684-3690 (1984).
[16] Villa, A., Widjajakusuma, E., Stock, G., J. Phys. Chem. B, 112, 134-142 (2008).
[17] Tiziana, C., Giovanni, C., Gabriele, V., Alessandro, D., Biophys. J., 83, 3542-3552 (2002).
[18] Ellis, J. J., Jones, S., Proteins, 70, 1518-1526 (2008).
[19] Onufriev, A., Bashford, D., Case, D. A., J. Phys. Chem., 104, 3712-3720 (2000).
[20] Onufriev, A., Bashford, D., Case, D. A., Proteins: Struct. Funct. Bioinfo., 55, 383-394 (2004).
[21] Kormas, B. L., Benitex, Y., Baranger, A. M., Beveridge, D. L., J. Mol. Biol., 371, 1405-1419 (2007).
[22] Humphrey, W., Dalke, A., Schulten, K., J. Molec. Graphics, 14, 33-38 (1996).
[23] VMDのホームページ:
http://www.ks.uiuc.edu/Research/vmd


Return