AMBERの残基データベースへの新規残基追加支援システム開発

佐々 和洋, 宇野 健, 林 治尚, 山名 一成, 中野 英彦


Return

1 緒言

DNAやRNAの塩基配列は、それら遺伝子から作成されるタンパク質と密接な関係にあることがよく知られている。近年では、ヒトゲノム計画に代表されるように、DNAおよびRNAの塩基配列の特定、それらの塩基配列によって得られる情報や、遺伝子とタンパク質との相互作用の解明など、遺伝子にまつわる様々な研究がおこなわれ、機能性を有した遺伝子やそれに準ずる物質の開発がおこなわれている。
我々も種々の機能性を有したDNAの合成実験をおこなっている。また、それと並行して、AMBER[1, 2]を用いたコンピュータシミュレーションによるDNAの構造や挙動の解析等も行っている。
しかし、様々な機能性を持つことを目的として合成されたDNAには、何らかの化学的な修飾が施されている事が多い。そういう化学修飾部位のほとんどはAMBERの残基データベース(以降AMBERデータベースとする)に登録されておらず、それらを含む物質のシミュレーションを行うためには、その化学修飾に対する結合データや各原子の持つ電荷などの情報を新たに登録する必要が生じる。AMBERデータベースへの登録はAMBERの機能のひとつである"PREP"を用いるが、その際必要となる入力ファイルは、様々なデータを規定のフォーマットに従い作成しておかなければならない。しかし、新規化学修飾部位の原子数が増加するほど入力データ量も増加するため、手作業による作成は容易ではない。
そこで、以前より我々が開発している、DNAやタンパク質などに対応した分子構造表示システムModrast-P[3, 4]への機能拡張という形で、新規化学修飾部位の登録作業を容易にすることを目的としたシステムの開発を行った。このシステムは、Modrast-Pの分子構造表示機能と原子認識機能などを利用し、新規化学修飾部位の構造やその一つ一つの原子を視覚的に確認しながら、選択式かつ対話形式による一連の作業により、PREP入力ファイルを作成するものである。

2 開発環境および動作環境

開発環境はC言語(ANSI C, gcc-2.95.2,同2.96)で、動作環境はXFree86が備わっているUNIX OSを搭載したマシンである。
また本システムは、PREPの機能を備えているAMBER 4.1以降、現行のAMBER 7にも対応している。

3 AMBERと化学修飾DNA

AMBERとは、UCSFのKollmanらによって作成された分子動力学シミュレーションソフトであり、生体高分子に適した独自のパラメータを持ち、数多くの研究に用いられている。AMBERには、エネルギー極小化計算、分子動力学計算、自由エネルギー摂動法計算などの種々のパッケージがあり、シミュレーション条件や初期配置の決定などにおいても、それぞれの目的に応じた種々のモジュールが用意されている。
その中で、シミュレーションの初期条件の設定を行うモジュールである"LEaP"は、シミュレーションターゲットとなる分子の構造を作成するために、原子や結合の変更や残基の付加が可能であり、ターゲット分子の周囲環境を構築するために、溶媒やカウンターイオンの挿入などが実行できるものである。
しかし、AMBERのデータベースに登録されていない部位を含む分子の場合では、LEaPモジュールの機能の一つである"PREP"を利用して、その部分の情報を新規部位としてAMBERのデータベースに予め登録しておく必要がある。
PREPを用いた新規部位の登録には、データベースに関する制御や、空間を定義するためのダミー原子の取り扱いなどの制御、および新たに登録する部位の各原子に対する便宜上の原子名や座標、形式電荷、原子間の結合情報などのデータを、入力ファイルとして所定のフォーマットに従い用意しておかねばならない。

4 Modrast-P

Modrast-Pは我々が開発している分子構造表示システムであり、Protein Data Bank(PDB)[5]など様々なフォーマットに対応している。構造表示はラスター形式で表示され、Wireframe Model、Ball-and-Stick ModelおよびSpace-Filling Modelを基本表示形態とし、その他にもTubular Model等の表示が可能である。
また、Modrast-Pには切断図形表示機能が備わっており、1平面および2平面による切断や、部分切断や円柱型にくりぬいた分子構造を表示することができ、タンパク質など高分子の内部構造やカップリングの様子などを視覚的に確認するの非常に有効である。また、Modrast-Pには切断図形表示機能が備わっており、1平面および2平面による切断や、部分切断や円柱型にくりぬいた分子構造を表示することができ、タンパク質など高分子の内部構造やカップリングの様子などを視覚的に確認するの非常に有効である。
この他、AMBERの計算結果のアニメーション機能や原子間距離計算機能、全エネルギーデータ等の抽出機能などを有し、シミュレーション結果の解析に有効なソフトウェアである。

5 PREP入力ファイル

PREP入力ファイルは、Table 1の書式に従って作成する必要がある。

Table 1. Format of Prep input file
書式内容
1行目3Iデータベースに関する機能制御、新たなデータベースファイル生成の有無、データの保存法、力場の制御
2行目A80新たにデータベースを作成する場合や、以前作成したデータベースを使用する場合のファイル名
3行目20A4入力ファイルのタイトル
4行目A80出力ファイル名
5行目2A,IAMBERに登録した際の残基名、座標データ種、出力フォーマット
6行目4A原子構造データの形式、ダミー原子に対する処理、ダミー原子の固有名、ダミー原子の消去法
7行目FCutoff距離
8行目以降I,3A(,3I),4F原子の通し番号、原子の固有名、原子タイプ名、ツリー構造、座標値、形式電荷値
LOOP以降2A原子間の結合情報

1〜2行目は、AMBERのデータベースファイルに関して指定する部分であり、1行目には新たなデータベースファイル生成の有無、データの保存法、力場の制御に対するフラグ(書式 3I)を入力しなければならず、2行目には新たにデータベースを作成する場合や、以前に作成したデータベースを使用する場合はそのファイル名(書式 A80)を入力しなければならない。
3行目からは、PREP入力ファイルと一連の新規残基登録において用いられるタイトル(書式20A4)を、次には出力ファイル名(書式A80)を設定し、さらにはAMBERのデータベースへ登録される残基名と座標データの形式および出力ファイルをbinary出力するかどうかの指定をする(書式2A,I)。6行目は8行目以降の原子構造データのフォーマット指定と残基登録時においてダミー原子を無視するかどうかの処理、ダミー原子を示すAtom Typeの名称、ダミー原子を消去する際の消去法を指定し(書式4A)、7行目はCutoff距離を示す(書式F)。
8行目からは新規残基の各原子に対する種々の情報を記述する必要があり、1行内に原子の通し番号、原子のUnique Atom Name、Atom Type、Topological Type(tree symbol)、座標、形式電荷の値を示す(書式I,3A(,3I),4f)。
LOOP CLOSING EXPLICIT以降は原子間の結合情報を表し、結合する各原子のUnique Atom Nameを示す(書式2A)。
最後にDoneおよびStopでPREP入力ファイルの終了を宣言する。

6 プログラムの機能

今回作成したPREP入力ファイル作成機能は、Modrast-Pを機能拡張する形でコーディングした。
入力ファイルを作成するには次のような手順で行う。

6. 1 新規残基構造の作成

まずは、AMBERのデータベースに登録する新規残基の構造を作成する。
我々の開発しているModrast-Pには、現状では新たな分子や残基構造を作成する機能が備わっていないため、Molda[[6]]などの分子モデリングソフトを用いて、新規残基の構造を予め生成しておく。

6. 2 Modrast-Pでの操作 − 分子軌道計算

Modrast-Pから、分子モデリングソフトにより出力されたファイル(PDB形式もしくはMOL形式)を指定して読み込むことで、新規残基の原子座標および結合情報などの必要なデータが取得される。続いて、Modrast-Pのメニューより、分子軌道計算MOPAC[[7]]の実行を選択すると、座標や結合データなど必要なものを用いてMOPAC入力ファイルを一時ファイルとして作成し、MOPACの実行が行われる。計算終了後、MOPAC出力ファイルより、新規残基の最適化構造や各原子が持つ形式電荷の値など、PREPの入力ファイルに必要なデータが自動的に取得される。

6. 3 Modrast-Pでの操作 − 対話形式でのデータ入力

分子軌道計算の終了後、Figure 1のように対話形式での PREP のデータ入力モードとなる。Modrast-Pの分子構造表示機能によりディスプレイに表示された残基構造で原子を確認しつつ、必要なデータを対話形式で入力することにより、自動的にPREP入力ファイルが作成される。


Figure 1. PREP input file making screen of Modrast-P

7 実行例

本プログラムを用い、ピレン修飾残基のPREP入力ファイルを作成し、PREP機能を使用して登録を行った。以下に手順を示す。

7. 1 新規残基構造データの作成

MOLDAなど分子モデリングソフトもしくはPDBなどのデータベースから新規残基の構造データを作成する。

7. 2 新規残基構造データの読込

Modrast-Pを起動し、"File" → "Open"から、ファイルフォーマットの選択となる。Table 2に示す3種のフォーマットに対応しているので、6.1において作成したファイルに適したものを選択し、ファイル名を指定する。

Table 2. File format select menu of Modrast-P
1Original PDB以前のModrastで用いられていたPDBフォーマット
2AMBER PDBAMBERや現在のPDBで用いられているPDBフォーマット
3Modrast/MoldaModrast-P やMOLDAより出力されるmolファイル

新規残基の構造データ読込が完了すると、Figure 2 に示すModrast-P分子構造表示ウィンドウに新規残基の構造が表示される。


Figure 2. Pyrene-modifiled uridine with molecular structure display window of Modrast-P

7. 3 MOPACの実行

"MODELING" → "Mopac"を選択すると、分子軌道計算MOPACの実行を選ぶメニューとなる。ここで、カルボニル基の有無など、MOPACの実行に必要な情報を指定する。完了後、Modrast-PよりMOPACが実行され、計算結果からPREP入力ファイルに必要な最適化構造と形式電荷の情報がModrast-Pに取得される。

7. 4 PREP入力ファイル作成

続いて、対話形式のPREPのデータ入力に移る。まずは、PREP入力ファイルのタイトルと残基名、およびパスを入力する。
入力後、原子毎の情報を入力する段階へと移行する。ここでは最初にAtom Elementを選択する指示が出るので、1:炭素・2:水素・3:窒素・4:酸素・5:その他の中から、指定原子の元素に相当する数字を入力する。
次にこの原子のUnique Name、Atom Type、Tree Structure Typeの入力を行う。
Unique Nameとは、各原子に対し任意の文字列(4文字まで)を与えるものであるが、混乱を避けるためPDBに沿った命名を行う事が望ましい。
Atom Typeは、"C"ならばsp3混成軌道炭素や芳香族炭素であることを示すもので、ここでは Atom Elementに対応したAtom Typeのみが表示されるので、ユーザはその中から該当するものを選択し入力する。このAtom Typeは、AMBERのparm94.datで定義されたものであり、各原子の質量や原子間の結合距離および結合角等の決定に使用される。
Tree Structure Typeは、主鎖・側鎖・枝分れ・末端の4つの構成状態から原子に見合った状態を選択肢の中から入力する。以上の3つのType入力を新規残基の全原子に対して行う。
全ての原子に対してAtom Element、Unique Name、Atom Type、Tree Structure Typeを入力後、Define LoopにおいてTree Structure Typeでは定義しきれなかった原子間の結合を、画面上に表示されている原子の番号を入力することで定義をする。
最後に Define Loop に2(No)を入力すれば、このプログラムが終了し、自動的にPREP入力ファイル"prep.in"が作成される(Figure 3)。


Figure 3. A part of Prep input File which is made by this software.

7. 5 AMBERへの登録

AMBERを起動し、モジュールの1つであるxLEaPを起動する。Universe EditorよりPREP入力ファイルを読み込み、新規残基の登録を行う。
Unit Editorを起動し、Import Unitから先ほど登録した残基名を選択する。Editor画面に新規残基が表示されるので、DNA等と結合し、目的とする分子の作成を行う(Figure 4)。


Figure 4. Pyrene modification part registered by PREP with Unit Editor window of xLEaP

このようにPREP入力ファイルを作成および登録したピレン修飾ウリジンを用いて、ピレン修飾DNAおよびRNAについてシミュレーションを行ったところ、実験により観測された結果[[8 - 10]]と符合する結果を得た。このことから、本プログラムを用いることでPREP入力ファイルは正確に作成され、種々の新規残基に対応可能であることが示された。

8 結言

本プログラムにより、テキストエディターでの手作業により作成が困難であったPREP入力ファイルの作成が容易なものとなった。特に、新規残基の各原子に関する情報入力においては、Modrast-Pの分子構造表示機能の利用により、新規残基を視覚的に確認しながら、情報の入力が行えるため、入力している原子の判別が非常にしやすくなり、入力ミス等人為的なミスの軽減に大いに貢献するものと思われる。また、各原子の情報の入力に関しても、選択式となっているため簡便性に富み、効率的にPREP入力ファイルが作成可能となった。今回はピレン修飾体を作成したが、核酸の修飾体だけでなく、アミノ酸の修飾体や補酵素など、AMBERの残基データベースに登録されていない残基を含む物質についてのシミュレーションが容易となった。
なお、本システムは次のURLにて公開予定である。

参考文献

[ 1] Weiner, S. J., Kollman, P. A., Nguyan, D. T. and Case, D. A., J. Comput. Chem., 7, 230 (1986).
[ 2] http://www.amber.ucsf.edu/amber/amber.html
[ 3] Uno, T., Hayashi, H., Yamana, K. and Nakano, H., J. Chem. Software, 4, 1 (1998).
[ 4] Uno, T., Hayashi, H., Yamana, K. and Nakano, H., J. Chem. Software, 5, 39 (1999).
[ 5] http://www.rcsb.org/pdb/
[ 6] http://www.molda.org/
[ 7] Stewart, J. J., 内田希訳, MOPACマニュアル Version 6, 日本化学プログラム交換機構 (1991).
[ 8] Yamana, K., Iwase R., Furutani S., Tsuchida H., Zako H., Yamaoka T. and Murakami A., Nucleic Acids Research., 27, 11 (1999).
[ 9] Yamana, K., Zako H., Asazuma K., Iwase R., Nakano H. and Murakami A., Angew. Chem. Int. Ed., 40, 6 (2001).
[10] Mahara A., Iwase R., Sakamoto T., Sakamoto T., Yamana, K., Yamaoka T. and Murakami A., Angew. Chem. Int. Ed., 41, 19 (2002).


Return