Excel/VBAを利用した分子類似性指数計算のための教材プログラム開発とダイオキシン異性体への応用

大前 貴之


Return

1 はじめに

酵素反応の反応機構に見られるように,化学反応において分子の幾何学的な形が重要な役割を果たす場合のあることが,広く知られている[1]. このことから,化学をひとつの手段として生命に関わる現象を解明しようとする栄養学や環境学などを専攻する人々にとって,分子の幾何学的な形の類似性に関する概念を修得することは必要不可欠であると考えられる.しかしながら筆者の知る限り,分子の幾何学的な形の類似性に関する章立てをした化学の教科書は見あたらず,この概念は経験を通じて体得するものであるかのような扱いが従来なされてきた.
この状況は,日常的に分子構造をながめる時間を持つことのできる化学を専門とする者にとっては,さほど痛痒を感じるものではない.実際,例えばFigure 1を化学専攻の人々に示してIの構造に対するa,b,c各構造の類似性の高低を問えば,その豊富な経験からほとんどの人々が躊躇なくa>b>cと答えるものと考えられる.しかしながら,限られた時間の中で手段である化学を学ぶ人々に同じ質問をすると,その回答は可能な6種類の順列にほぼ均等に分布してしまうのが現実なのである.


Figure 1. Molecular Framework of Dioxin Isomers.

筆者はこの状況を改善する必要に迫られ,Excel/VBAを利用した自作プログラムを数年前から授業と学生の自習のために用いて,分子構造の類似性に関する概念を環境学専攻の学生に修得させる試みを実践してきた.幸い学生の多くが所有するパーソナル・コンピュータには標準的にExcelが搭載されていたこともあり,この試みは短期間で上述の回答の分布をa>b>cへ収斂させる効果があった.そこで筆者と同様に,手段としての化学を学ぶ学生に分子構造の類似性に関する概念を修得してほしいと考える方々の参考に供するために,本報で上述のプログラムとダイオキシン異性体の計算例を紹介する.

2 類似性指数計算プログラム

定量的構造活性相関の研究に利用する目的で,さまざまな分子の類似性を数値化する方法が提案されているが[2, 3],本報では距離対の比較に基づいて定義される次の2つの係数に注目した[4, 5].これは分子構造の幾何学的な形の類似性を考察する上で,距離に着目することが非化学専攻の学生にとって直感的に最も理解しやすいと考えたためである.
Pearson Correlation Coefficient :

Tanimoto Coefficient :

ただし,式(1)でdAijは分子Aの原子ij間の距離を意味する.また式(2)でNANBはそれぞれ分子Aと分子Bの距離対の数を意味し,NCは次式で定義されるΔdの大きさが基準値を超えない距離対の数を意味する.なお,次式で計算される距離の差の基準値としては, 1×10-11mから1×10-10mの間の適当な値が用いられる.

式(1),(2)から明らかなように,rPrTは両者ともに,その値が0の時は比較している分子間に類似性がまったく存在しないことを意味し,その値が1の場合には比較している分子間の構造が完全に一致していることを意味する.

2. 1 rP計算プログラム

教材として提供する際の学生の利便性を考慮して,データの入出力をExcelのワークシートから行えるよう,プログラムを作成した[6].これは,日常のレポート作成などを通じて学生がExcelの操作法に習熟していると考えられることと,新規な操作画面を用いさせることによって生じると予測される学習意欲の低下とその操作法に習熟するまでの時間の無駄を省くためである.
Figure 2に作成したデータ入力部分のリストを示した.ただし,Figure 2RXRYRZはそれぞれ基準分子の各原子の3次元直交座標を示す.また,RDは原子ij間の距離を表す.


Figure 2. List of data input part in this program.

本プログラムでは,Figure 2に示したプログラムによって読み込んだ基準分子と比較分子の3次元直交座標から原子間距離が計算され,その後,式(1)に従ってrPの値が計算されるという手順を採った.なお,筆者の担当する授業では本プログラムを使用する前に行うMOPACの演習で得られた3次元直交座標をcsvデータとしてExcelの入力シートに読み込んで利用しているが,MOPACの演習と切り離して本プログラムを利用する場合も想定して,現在,3次元直交座標の簡便な生成プログラムの作成を検討中である.
上述のリストで示したプログラムに続けて,式(1)に従ってrPの値を計算する部分のリストをFigure 3に示した.ただし,Figure 3で比較分子の原子ij間の距離を表すDを計算する部分は,Figure 2に示したリストの各変数名からRを取り除くだけで作成できるので,ここではリストを示さなかった.また,Figure 3D2RD2DRDはそれぞれ式(1)のdAij2dBij2dAijdBijを示す.


Figure 3. List of part calculating Pearson correlation coefficient in this program.

さらに,以上のプログラムを用いて,2,3,7,8-PCDDに対する1,4,6,9-PCDDのrP値を求めた際の出力画面をFigure 4に示した.今回紹介する試みにおいては,複数の比較分子のrPを同時に計算するようにプログラムを作成していないので,Figure 4に示したようにrPの計算値は比較分子の座標を入力したワークシートの右上隅に出力させた.


Figure 4. An output page of this program.

2. 2 rT計算プログラム

rTの計算プログラムにおいても,3次元直交座標から原子間距離を計算する部分として,Figure 2に示したプログラムを用いた.この部分に続けて,式(2)からrTの値を計算するために,Figure 5に示したrT計算部のプログラムを作成した.ただし,Figure 5SVLSVUSVPはそれぞれ基準値の下限,上限,刻み幅を表す.また,NANBNCは式(2)のNANBNCを表す.


Figure 5. List of part calculating Tanimoto coefficient in this program.

ここでは後に触れるように類似性における分解能類似概念の導入のため,Figure 6aに示した入力画面に距離対の類似性を判定する基準値の上限と下限を入力しておくことで,この区間を10等分したそれぞれの基準値でrTの値が計算されるようにした.これによって, rTの出力範囲をあらかじめ適当なグラフのデータに指定しておけば,Figure 6bに示した出力画面のように基準値の変化による類似性判定の変化を観察することができる.


Figure 6. An input page and an output page of this program.

また,このグラフを示した上で,Figure 7の様な図を例示して多角形と円の類似性を考察させることで,類似性判定における分解能類似概念を学生に触発することができた.


Figure 7. Diagram to remind students of concept of resolving power.

3 ダイオキシン異性体への適用例

前節までに紹介したプログラムを用いて,2,3,7,8-PCDDに対するダイオキシン異性体のrPrTの値を計算した.計算したすべての異性体の中から, TEFの値[7]が既知のもののrPrTの値をTable 1に示した.TEFの相対的な順位とrPおよびrTの値の間に良い相関のあることはTable 1から明らかであろう.

Table 1. Calculated values of rP and rT of some Dioxin isomers.
ChlorinationTEFrPrT (t=0.5)
2,3,7,8-11.00001.0000
1,2,3,7,8-10.99970.9412
1,2,3,4,7,8-0.10.99940.9012
1,2,3,6,7,8-0.10.99940.8780
1,2,3,7,8,9-0.10.99940.8857
1,2,3,4,6,7,8-0.010.99910.8333
1,2,3,4,6,7,8,9-0.00010.99890.7838
t : Reference value, ×10-10m.

ただし,rPの値の降順にすべての異性体を配列すると,例えばTEFの値が0.01と0.001の間にはTEFの値が未知の異性体が6種類入ることからも明らかなように,ひとつの類似性指数だけで化合物群の活性を説明することは困難であり,例えば小林ら[8]はダイオキシン類の電子構造に基づく考察からハードネスの概念が特に重要であることを指摘している.
また,rTの値はFigure 6にも示したように基準値によって変化し,場合によっては値の大小関係が逆転することもあるため,活性相関の検討に用いる際には注意を要すると考えられる.Table 1に示したダイオキシン異性体のrTの値が,基準値の選び方によって変化する様子をTable 2に示した.

Table 2. A change of calculated value of rT with a change of reference value.
ChlorinationrT (t=0.1)rT (t=0.3)rT (t=0.5)
2,3,7,8-1.00001.00001.0000
1,2,3,7,8-0.84060.87040.9412
1,2,3,4,7,8-0.67390.77690.9012
1,2,3,6,7,8-0.71110.76340.8780
1,2,3,7,8,9-0.70480.75670.8857
1,2,3,4,6,7,8-0.59860.67390.8333
1,2,3,4,6,7,8,9-0.50490.60980.7838
t : Reference value, ×10-10m.

なお,Table 2のような基準値に依存する類似性指数の値の変化と塩素置換数の等しい異性体の構造式,例えば6置換体の構造式を比較することで,分子構造の類似性が一意的なものではなく区別する基準によって変化しうるものであることを啓発することができる.

4 おわりに

類似性指数を計算する実用的プログラムという観点から見ると,本報で紹介したプログラムにはいくつもの改善すべき点が存在する.例えば,本文中でも触れた複数の比較分子の類似性指数が同時に計算できないことなどはその最たるもののひとつであろう.しかしながら,この短所を教材プログラムという観点から見ると,ひとつひとつの比較分子の類似性指数を計算する度に,自分が今なにをしているのかを確認することができるという意味で,むしろ短所は長所になり得るものと考えられる.プログラムの入力と出力の部分に数行を書き加えれば容易に改善できることばかりではあるが,上述の観点からいくつかの短所は気づいていながらそのままにしておいた.
また,本文中で述べた類似性における分解能の概念については,今後さらに多くの類似性指数に関する計算を行った後に,考察を深める予定である.

なお,本研究の一部は山口県立大学研究創作活動助成事業によるものであることを,ここに記して感謝する.

参考文献

[ 1] 例えば,上代淑人監訳,イラストレイテッドハーパー・生化学,丸善(2003),51-62,など.
[ 2] R. C.-Dorca, X. Girones, P. G. Mezey, Fundamentals of Molecular Similarity, Kluwer Academic / Plenum Publishers, New York (2001).
[ 3] P. M. Dean, Molecular Similarity in Drug Design, Blackie Academic & Professional, London (1995).
[ 4] P. Willett, V. Winterman, Quant. Struct. -Act. Relat., 5, 18 (1986).
[ 5] 中馬 寛,唐沢真美,佐々木幹夫,長嶋雲兵, J. Chem. Software, 4, 143 (1998).
[ 6] 吉村忠与志, 化学とソフトウェア, 23, 11 (2001).
[ 7] 相澤寛史, ダイオキシン類の基礎知識, 東京教育情報センター (2001), 151.
[ 8] 小林茂樹,田中 彰,鮫島圭一郎, 化学と工業, 52, 42 (1999).


Return