Modrast-P with GTK+の開発

佐々 和洋, 村田 一紀, 宇野 健, 林 治尚, 中野 英彦


Return

1 はじめに

近年,生体高分子や酵素の機能,フラーレン関連物質やレセプターとリガンドの状態など様々な分野において,分子間の包摂関係が着目されており,その状態を可視化する分子構造表示プログラムが開発されている.分子構造表示プログラムの例としては,RasMol[1],Chime[2],Protein Explorer[3],DS Viewer[4],Mage[5] Swiss-PdbViewer[6],Cn3D[7]などがあげられる.RasMolは,生体高分子の表示に適しており,表示速度も高速なプログラムで,幅広く利用されているフリーソフトである.ChimeはRasMolをweb上でのプラグインとしての機能を特化したものであり,Protein Explorerは,Chimeをさらに拡張子のGUI機能の強化や,アニメーション機能などの追加が行われている.DS Viewerは,Accelrys社により販売されているプログラムで,分子表示だけでなく,各原子の情報や化学式などが同時に確認できる特徴を有している.Mageは,独自のKinフォーマットに採用しており,動画などの視覚効果を備えている.Swiss-PdbViewerは,PDBの描画だけでなく、原子間の角度と距離,スレッディング(threading),エネルギー最小化を計算も行える.Cn3Dは,分子構造データベースであるEntrez[8]などからの三次元構造のデータを表示できる.また,構造と配列アライメントを同時に表示し,NMR解析で得られた複数の画像を重ね合わせて表示できる特徴を持つ.
我々の研究室でも分子構造表示プログラムModrast-P [9 - 11]の開発を進めてきた.Modrast-Pにおける特徴は,数種類の分子表示形態を持ち,分子を切断して表示するClipping機能,PDBファイルのデータベース検索システムを有している点である.特に、切断面の表示や部分切断が可能な本プログラムにおけるClipping機能は、たんぱく質などの生体高分子だけでなく低分子においても,通常の表示では確認が困難な分子内部の状況を表示する機能であり,これはその周辺部位を含めた状態を確認する上において有効である.このような機能は,前述したような多くの分子構造表示プログラムにはあまり例を見ない特徴であり,生体機能性分子における生理活性の解明に有用であると考えられる.しかし,既発表のModrast-PはSun MicrosystemsのSPARCシリーズ上でのみ実行可能であった.そこで,プラットフォームに依存せず,種々のUNIX系のコンピュータで利用することとGUI(graphical user interface)化を目的として,X Window Systemのツールキットの一つであるGTK+[12]を用い"Modrast-P with GTK+"の開発を行った.
また,機能においては,代表的な生体高分子シミュレーションソフトであるAMBER[13]との高い親和性の実現を目指し,シミュレーションの実行支援機能[14]の実装を行ってきたが,今回さらに,シミュレーション結果に対するアニメーション機能および数値データ解析機能を追加した.これら機能により,視覚的および数値的の両面から研究対象分子の構造や挙動を確認することが可能となった.

2 開発環境および動作環境

開発環境は,OSにはTurbo Linux Workstation 6.0Jを用い,デスクトップ環境としてGNOME 1.0.55のもとで開発を行った.アプリケーション開発言語は,C言語を利用し,グラフィックス部分及びインターフェース部分の開発にはGTK+ ver.1.2.7を使用した.動作環境はUNIX OSを搭載したマシンでGTK+を搭載したマシンでは動作可能なように設計してあり,FreeBSD 4.9のGTK+ ver.1.2.10,RedHat Linux 7.3JのGTK+ ver.1.2.10,およびTurbo Linux Workstation 7.1JのGTK+ ver.1.2.10で動作確認を行った.

3 基本的な機能

3. 1 メニューおよびファイル

各コマンドを実行するメニューの構築には,GTK+の関数の一つであるItem Factory(関数名:GtkItemFactoryEntry)を用い、プルダウンメニュー選択方式とした(Figure 1).


Figure 1. Main window of Modrast-P with GTK+.

また,ファイル指定機能においては,専用のダイアログから任意のファイルを選択することにより,指定することが可能である.
本プログラムでは,分子構造のフォーマットに汎用性の高いPDB(Protein Data Bank)[15]のフォーマットを利用している.また,AMBERより出力されるparameter fileとcoordinate file(またはrestart file)を,PDBフォーマットの分子データの代わりとして読み込む機能を追加した.この機能により,AMBERでモデリングした初期構造やシミュレーション結果を描画することが可能となった.

3. 2 基本的な分子表示

本プログラムでは,目的に応じた分子模型を選択することが可能であり,以下の5種類の分子模型表示形態を有している.
これらの分子模型表示形態は,各原子およびチューブに対して,主鎖ごとによる色付けや,原子毎,残基毎に色付けすることが可能であり,さらに,たんぱく質の場合は,アミノ酸残基の性質(疎水性や親水性,および酸性や塩基性)に応じて色付けする機能を有している.
また,これらの分子表示は,マウスの左ドラッグで任意に回転,マウスの右ドラッグで任意に移動することが可能であり,拡大・縮小もショートカットキーにより実行がすることができる.その他に本プログラムが有する回転機能は,回転軸としてx軸・y軸・z軸だけではなく,指定した2原子間を結ぶ直線,もしくは指定した3原子を含む平面の法線を設定することも可能である.また,回転を断続的に行うこともでき,回転速度は3段階,回転時間も4段階から選択することが可能である.

3. 3 切断機能

生体高分子や大規模系のシミュレーションにおいては,原子数が非常に多く,特に生体高分子では立体構造が極めて複雑であるため,系や分子の内部構造を確認する事は非常に困難である.また,低分子や分子の複合体においても,研究対象とする構造が,分子内部や分子間の接合部分にある場合は,通常の分子構造表示では隠れてしまい見ることは難しい.そこで,Modrast-P with GTK+では分子を切断表示することにより,分子内部の様子を容易に確認することを可能にした.Modrast-P with GTK+は,Clipping(切断)機能として以下の切断表示を実装している.
また,切断面数は,1平面および2平面で切断を実行することができる.1平面による切断の場合は,指定した3原子を含む平面で切断される.2平面による切断では,第1切断面として3原子を含む平面が指定され,第2切断面は第1切断面に対して垂直な平面,第1切断面に対して平行な第2切断面,および第1切断面に依存しない独立した第2切断面の3種類から選択が可能である.この平面を定義する原子の指定は,対話的操作による行われる.Clipping機能を用いることによって,目的となる分子内部の切断面を描画することができ,分子構造を内部まで明確に確認することが可能となる.
しかし,平面を用いて切断表示した場合,目的とする原子および原子団の一部も切断や削除されてしまうことも少なくない.そこで,本プログラムでは,さらに,Clipping機能により切断または削除される原子および原子団に対し,任意の原子についてClipping機能の対象から除外するPartial Clipping(部分切断)機能を実装した.Partial Clippingでは,Clippingの対象から除外する原子および原子団を専用ダイアログから指定することにより実行する.
この機能により,必要な原子団のみを切断平面上に描画することが可能となり,目的とする残基や原子と周辺部との配向や原子間における隙間の様相などを容易に確認することが可能である.
Chime[2]やDS Viewer[4] Mage[5] ICM[16]Molecular Surface Viewer[17]などには類似の機能が存在しているが,これら機能は画面に平行な平面や定義された平面より手前または背後の原子を取り除くだけであり,本プログラムのように,任意に定義された2平面(Figure 2)または1平面(Figure 3)による切断が可能で,切断面が表示されるものではない.また,本プログラムのPartial Clipping機能のように,切除される原子を任意に切除の対象から除いて残す機能も含まれていない.したがって,本プログラムは内側の隠れた部分を見えるようにするだけでなく,内部とそれを囲む周囲の相互の関係を示すためにも有効である.


Figure 2. Partial Clipping display (Space-Filling Model) of fullerene C60 encapsulating molecular hydrogen.


Figure 3. Clipping display (Space-Filling Model) of (a) Deoxy Myoglobin and (b) Oxy Myoglobin. Extract display (Ball & Stick Model) of (c) HEM, His64 and His93 in Deoxy Myoglobin and (d) HEM, His64, His93 and O2 in Deoxy Myoglobin.

3. 4 抽出機能

生体高分子のような原子数の多い分子を描画した場合,研究対象となる原子や残基などが何処に存在するのか,その全体像から判断することは困難である.
そこで,本プログラムでは,Space-Filling ModelとBall & Stick Modelにおいて,系または分子の指定した部分のみ表示するExtract(抽出)機能を実装した.このExtract機能は,必要な部分のみ表示するので,特定の原子間や残基間の位置関係などを確認するのに適している.
また,分子の全体像を表示した上で,指定した原子のみを強調する機能も追加した.この機能は,目的の原子や残基と分子全体との位置関係を把握するのに適している.しかし,対象の原子や残基が分子の表面上に存在するとは限らず,分子内部に埋もれていた場合,分子を回転させても原子や残基全体を確認することは困難である.そこで,指定した原子や残基が分子内部にある場合は,画面の一番手前に描画するようにした.これにより,分子の内部の原子や残基の位置を確認するだけでなく,分子全体に対して,残基がどのような位置に存在しているか確認することが容易となった.

3. 5 アニメーション

AMBERを用いてのシミュレーションの結果は,複数のファイルとして出力される.それらのファイルは,原子数およびシミュレーション時間に応じて膨大な数値データとなるため,何らかの処理なしでシミュレーション結果を理解することは難しい.そこでModrast-P with GTK+では,シミュレーション結果から必要なデータを時間軸に沿って読み込み,連続で表示するアニメーション機能も追加した.アニメーション機能は,Modrast-P with GTK+の持つ全ての分子模型で実行が可能であり,Space-Filling ModelやBall & Stick Modelにおいては,切断機能や抽出機能にも対応している.さらに,アニメーション機能を一度実行した後であれば,任意のステップにおける分子構造を直接表示することが可能である.

3. 6 解析機能

Modrast-P with GTK+の分子構造表示機能により,分子全体や内部を視覚的に確認することは可能となった.しかし,より詳細な分子構造を知見するためには,距離や角度といった種々の数値データを算出する必要がある.そこで,本プログラムでは,それら数値データを算出する解析機能を実装した.本プログラムが実装する解析機能は,表示されている分子に対して,原子間距離,結合角,二面角といった基本的な構造データの他に,DNAやRNAの解析に特化した機能として,リボース環構造を示すPuckering[18, 19]の指標となるPseudorotation Phase Angle [20]算出機能や,塩基対間のWatson-CrickやHoogsteenといった結合状態を判別する機能を追加した.
これら解析機能は,AMBERのシミュレーション結果にも対応しており,分子や原子個々の挙動を確認するのに有効である.

4 適用例

以下に,Modrast-P with GTK+の有用性を示すため,いくつかの適用例を示す.

4. 1 水素分子を内包したフラーレン

最近,Komatsuらによって生成法が確立された,水素を内包するフラーレン[21]について,水素分子は切断対象外とした上で垂直な2平面で切断した部分切断表示をFigure 2に示す.水素を内包したフラーレンについては,フラーレン分子を骨格だけで表示し,水素分子のみSpace-Fillingで表示したもの[22]は発表されている.しかし,全ての原子をSpace-Fillingで表示し,切断表示したものはなく,今までにはない新たな分子表示である.尚,Figure 2に用いた分子の座標データは,実験より得られたものではなく,基本構造のフラーレンの中心部分に水素分子を挿入したものである.

4. 2 ミオグロビン

PDBに登録されているデオキシミオグロビン (PDB ID-CODE : 1MBD)と,オキシミオグロビン(1MBO)を使って,酸素の配位の様子を確認しようとした場合,全ての原子を表示する方法では,酸素と配位するHEM残基の一部のみが,分子表面で確認できるだけで,酸素の配位の様子は他の原子により隠されており確認することは難しい.そこで,本プログラムにおけるClipping表示を利用した.Figure 3 (a)では,HEM鉄に対して左側から塩基性のHis93が配位し,右側からHis64が少し鉄と間隙をおいて接近している様子がうかがえ,HEMの下方部分は白色で示される疎水性残基に囲まれている様子が確認できる.Figure 3 (b)では,(a)で見受けられた空孔部分に,酸素が入り込み,鉄と配位している様子がうかがえる.
また,抽出機能を用いて1MBDおよび1MBOのHEM,酸素,HEMに隣接するHisのみをBall & Stick Model表示したものを(c) (d)に示す.HEM・酸素・Hisの位置関係や酸素及びHisの窒素原子が,HEMの鉄原子に配位している様子を見て取ることができる.

4. 3 ピレン修飾核酸

Yamanaらにより,Uridineの糖部2'位にピレンを修飾したDNAまたはRNA(以降,“ピレン修飾DNA”,“同RNA”と表記する)において,ピレン修飾DNAではピレンが2重螺旋内部に,ピレン修飾RNAではピレンが2重螺旋外部に存在することが蛍光強度の測定実験によって示唆されている[23 - 25].そこで,AMBERを用いてピレン修飾DNAおよびRNAのMDシミュレーションを行った.対象分子は完全相補鎖のDNAおよびRNAとし,ピレン修飾DNAおよびRNAのシーケンスはFigure 4に示す.ピレン修飾したUridineの作成には既報の機能[14]を用いて行った.また,それぞれの初期構造において,ピレンは2重螺旋の内部に配置し,水溶媒分子およびカウンターイオンをシミュレーションセル内に挿入した.まず,極小化計算を行った後,300 Kで1ns相当の分子動力学計算を行った.


Figure 4. Sequence of Pyrene-modified DNA and RNA.

シミュレーションにより得られた結果から,1ns後における構造を本プログラムにより表示したものをFigure 5に示す.Figure 5中においてはピレンのみを赤色で示している.DNAとRNAでは,明らかにピレンの位置に違いがあり,DNAでは2重螺旋内部に,RNAでは2重螺旋の溝の部分にあることが確認できる.


Figure 5. Ball & Stick Model display of Pyrene-modified DNA (a) and Pyrene-modified RNA (b).

さらに,ピレンとリボースを繋ぐリンカーの二面角の挙動を本プログラムの解析機能により算出した(Figure 6).リンカーの二面角α,β,γの値より,DNAではピレンは2重螺旋の内側に位置し,RNAではピレンが2重螺旋の溝の部分へ張り出していることが読み取れる.また,DNA・RNAともピレンは極小化により得られた構造からあまり大きく変化しておらず,揺らいでいるだけの状態であることがわかる.このピレン修飾核酸のシミュレーション結果の詳細については,別途発表する.


Figure 6. Structure of 2'-O-(1-Pyrenyl methyl) uridine (a). Dihedral angle of linker in DNA (b) and RNA (c).

5 まとめ

GTK+を用いることにより,プラットフォームに依存しない"Modrast-P with GTK+"を開発した.
本プログラムはAMBERの実行支援を一つの目的としており,先に発表したAMBERのデータベースへの新規残基追加支援機能[14]に加え,今回示したプルダウンメニュー,PDBファイルの読み込み,分子表示,アニメーション,データ解析などの機能を統合的に利用することにより,AMBERの実行をデータ作成から計算後の解析まで円滑にすることが可能となった.
分子表示には,Space-Filling ModelやBall & Stick Modelなどの,この種のシステムが当然実装すべき機能を持っているが,特筆すべきは切断機能である. Partial Clipping機能を用いれば,切除される原子を任意に切除の対象から除くことができ,目的とする原子全てを残した状態で描画することができる.したがって,本プログラムは内側の隠れた部分を見えるようにするだけでなく,内部とそれを囲む周囲の相互の関係を示すためにも有効である.

参考文献

[ 1] http://openrasmol.org/
[ 2] http://www.umass.edu/microbio/chime/
[ 3] http://www.umass.edu/microbio/chime/pe/protexpl/frntdoor.htm
[ 4] http://www.accelrys.com/
[ 5] Word, J. M., Lovell, S. C., LaBean, T. H., Taylor, H. C., Zalis, M. E., Presley, B. K., Richardson, J. S. and Richardson, D. C., J Mol Biol., 285, 1711-33 (1999).
http://kinemage.biochem.duke.edu/index.php
[ 6] Guex, N., Experientia, 52, A26 (1996).
http://kr.expasy.org/spdbv/
[ 7] Hogue, C. W., Ohkawa, H. and Bryant, S. H., Trends Biochem. Sci., 21, 226-229 (1996).
http://www.ncbi.nlm.nih.gov/Structure/CN3D/cn3d.shtml
[ 8] http://www.ncbi.nlm.nih.gov/Entrez/
[ 9] 宇野健, 張金碚, 澤野太郎, 山名一成, 中野英彦, J. Chem. Software, 2, 212-218 (1995).
[10] 宇野健, 松久茂, 林治尚, 山名一成, 中野英彦, J. Chem. Software, 3, 83-90 (1996).
[11] Uno, T., Kawashima, Y, Zhang, J., Hayashi, H., Yamana, K. and Nakano, H., J. Chem. Software, 4, 1-10 (1997).
[12] http://www.gtk.org/
[13] Weiner, S. J., Kollman, P. A., Nguyan, D. T. and Case, D. A., J. Comput. Chem., 7, 230 (1986).
http://amber.scripps.edu/
[14] 佐々和洋, 宇野健, 林治尚, 山名一成, 中野英彦, J. Comput. Chem. Jpn., 2, 135-142 (2003).
[15] http://www.rcsb.org/pdb/
[16] http://www.molsoft.com/index.html
[17] http://www.scripps.edu/~sanner/
[18] Hall, L. D. , Chem. Ind. (London), 950-951 (1963).
[19] Jardetzky, C. D., J. Am. Chem. Soc., 82, 229-233 (1960).
[20] IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN) Conformational nomenclature for five and six-membered ring forms of monosaccharides and their derivatives, Recommendations 1980, Arch. Biochem. Biophys., 207, 469-472 (1981).
Eur. J. Biochem., 111, 295-298 (1980).
Pure Appl. Chem., 53, 1901-1905 (1981).
[21] Komatsu, K., Murata, M., and Murata, Y., Science, 307, 238-240 (2005).
[22] Chemical & Engineering News, 83(4), 14 (2005).
[23] Yamana, K., Iwase, R., Furutan,i S., Tsuchida, H., Zako, H., Yamaoka, T. and Murakam,i A., Nucleic Acids Research., 27, 11 (1999).
[24] Yamana, K., Zako H., Asazuma, K., Iwase R., Nakano, H. and Murakami, A., Angew. Chem. Int. Ed., 40, 6 (2001).
[25] Mahara, A., Iwase, R., Sakamoto, T., Sakamoto, T., Yamana, K., Yamaoka, T. and Murakam,i A., Angew. Chem. Int. Ed., 41, 19 (2002).


Return