C60Rn(n = 0-30)の構造ID解析ツールの開発

樋田 竜男, 内田 勝美, 石井 忠浩, 矢島 博文


Return

1 緒言

これまでC60フラーレン機能化は様々な官能基の導入により為され、構造異性体の単離も数多く報告されている。近年は特定の構造を効率的に合成する方法が各種実施されているが[1 - 3]、最終的な構造決定には結晶解析やNMRが必要である。ただしNMRのみからは区別困難な異性体も存在し、これらを識別する手がかりとして前駆体−誘導体の家系図「構造発展図」が考えられた[3]。一般に多付加体が30箇所あるC60の二重結合に付加するものとし、その1付加体がC2対称であることを前提とすると、任意の多付加体の付加パターンは30ビットの2進数で表現可能である。具体的にはFigure 1n番目の二重結合に付加している場合、n桁目は1であるとして定義された構造ID、すなわち8桁の16進数を以って任意の付加パターンを表すことが可能である。ただし実際には230(=約11億)通りも誘導体は存在せず、フラーレン核自体がIhという高い対称性を持つことに起因して、多くの構造は重複して区別することができない。それゆえ区別可能な誘導体はずっと少なく、その総数は約1/60の高々1800万種に集約されることがわかっている。更に付加基間の立体障害を考慮すると誘導体の数は多くとも2000種程度と見積もられている。構造発展図はこれらの間に前駆体−誘導体の関係を見出し、効率的な構造特定と合成手順の探索に貢献することが期待されるが、その表現方法である構造IDはもともと計算機のために設計されたものであり、人間には理解しがたいものであった。


Figure 1. Numbering system of hex-hex double bond on C60 in this work.

そもそもフラーレン多付加体の付加パターンを図示するとき、対称性の高い場合を除いて3次元的な描画はむしろ解りづらいため、フラーレン化学の黎明期からシュレーゲル図(Figure 1)による表現が盛んに行われてきた。これはフラーレンの炭素間結合のネットワークトポロジーを平面へ描画した図であり、この図によりいかなる付加パターンも明確に表現することが可能であった。ただし、全く同じ構造の多付加体でも、シュレーゲル図を描き始める場所の違いによっては重ねあわせ可能かどうかの判定は人間には難しく、付加基間の位置関係より一意に求まる正準表現の開発が望まれた。そしてその指標は計算機により自動的に求められ、人間が扱える程度に短く符号化されるべきであった。本研究ではこれらの条件を備えた指標として、メジャー構造IDを定義する。しかしこの指標は先に述べた構造IDの部分であり、つまり8桁の16進数であり、それがどのような構造であるか依然として理解しがたいため、あわせて一般的な構造IDの可視化ツールの開発もおこなった。

2 構造ID解析ツール

入力された構造IDを可視化し解析するツールはこれまで存在していない。本論文ではこれの作成を報告し、背景の演算アルゴリズムについて解説する。

2. 1 構造ID可視化

可視化の方法は2通り存在する。1つは3次元のベクトルグラフィックスとして実際にCH2などを付加させた構造を出力しユーザーの直感的な回転操作によりこれを把握するというものである(Figure 2)。もう1つは2次元のベクトルグラフィックスとして付加パターンのみを出力しシュレーゲル図の中でこれを把握するというものである(Figure 3)。
どちらのインターフェースもPerlで記述されたCGIで構築され、可視化する構造IDの指定はウェブブラウザからURLを使い間接的に行うことができる[4] (Figure 4)。ただし、前者の表示にはBrookheaven PDBファイル[5]を描画するためにMDL社のChemscape Chime プラグインが[6]、後者の表示にはScalable Vector Graphics (SVG)1.1[7]に準拠したプラグインが必要である[8]。


Figure 2. The 3D stereo images of generated PDB file that structure ID = 0x00001081 rendered MDL Chime.


Figure 3. Main window of the Structure ID Analyzer. In this Schlegel diagram, you can edit the adduct pattern by graphical selection of (a) 30 kinds of double bond. You can also (b) set, (c) complement and (d) reset the structure ID directly, and rotate this diagram while sustaining its adduct pattern by (f) selecting 2 atoms. For all your actions, the analyzer scans all possible mappings and immediately returns (g) the Major structure ID and (h) the enantiomeric Major structure ID. Additionally, this analyzer may (i) display the adductable sites (by orange colored bonds), (j) change the Atom label, and (k) represent a part of the formula.


Figure 4. State transition diagram of Structure ID Analysis. If you want to see the 3D image of the structure ID = 0x00001081 by PDB [5], (a) access to URL(1) http://www.toida.jp/tatsuo/2005/10/18/JCCJ/pdb.cgi?ID=0x00001081(b) The server generates a PDB file and (c) you can see it by some viewer such as MDL Chime [6](Figure 2). If you want to see the 2D image (Schlegel diagram) of Structure ID = 0x00001081 by an SVG, (d) access to URL(2) http://www.toida.jp/tatsuo/2005/10/18/JCCJ/schlegel.cgi?ID=0x00001081 (e) The server generates an SVG file and (f) you can see and analyze it (Figure 3). After editing the adduct pattern, (h) click the Structure ID (Figure 3e). (i) You can get 3D image immediately again. This analyzer is written in an SVG[7] with JavaScript[9], so you can (g) save and (j) use it in stand-alone mode whenever you want.

後者の構築するSVGファイル内部はJavaScript (ECMA-262)[9] で記述されており、以降に述べる様々な操作をクライアント側で実行することができる。また、構築されたSVGファイルを保存しておけば、スタンドアローンでの操作も可能である。
可視化する構造IDはクライアント上で直接指定することもできる。例えばシュレーゲル図の二重結合を指定するか(Figure 3a)、または16進数入力パネルより直接入力することが可能である(Figure 3b)。

2. 2 シュレーゲル図の回転

今回のツールはシュレーゲル図を回転させることが出来る。すなわちシュレーゲル図にマークされた付加パターンを付加基間の位置関係を崩さずに60通りに写すことができる。ユーザーの操作はフラーレン上の任意の2炭素原子a, b を順番に指定することで行われ(Figure 3f)、このとき付加パターン全体はノードaがノードbへ写される写像 Qa,bに従い変換される。
この写像は内部的には5個の Rr変換(基準とする五員環周りの5回回転操作( r = 0...4, r = 0は恒等変換))と12個のTt変換(基準とする五員環を12個の五員環へ写す操作( t = 0...11, t = 0は恒等変換))の直積で表される60通りの合成写像 Rr Ttのどれかで表現される[3]。ただし Rr, Tt変換は実際には1つの二重結合を30個の二重結合(向きも考慮すると60種類の二重結合)へ写す変換なので、( a, b ) がどの( r, t ) に対応するかは直ちには解らない。そこで予め別のプログラムから ( a, b ) に対応する ( r, t ) を全空間検索により求めておき[10]、その結果を利用することでユーザーの指定する Qa,bに対応する合成写像 Rr Ttを高速に作ることが可能となった。

2. 3 メジャー構造探索

構造IDは付加パターンそのものであり、とりうる要素は30ビットの空間全体に広がる。ある2つの構造IDが構造異性体であるとき、それぞれの合成写像 Rr Ttは交わらない。鏡像異性体も区別する場合は更にSs変換(基準とする二重結合を鏡面として左右入れ替える2個の対称操作( s = 0...1, s = 0は恒等変換))も考慮し[3]、それらの120通りの合成写像 Rr Tt Ssについて像が交わるか検討しなくてはならない。何れにせよ任意の構造ID達が構造異性体かどうかを調べるたびに全ての合成写像を検討することは経済的でない。そこで、予め互いに構造異性体でない構造IDからなる同一構造集合を求め、これを代表する唯一つの構造IDを以って同一構造集合要素のメジャー 構造IDとして使用し、それ以外はマイナー 構造IDとして基本的に使用しなければ、任意の付加パターン達はメジャー構造IDを比較するだけで構造異性体かどうか直ちに判断することができる。そのためにはメジャー構造IDを一意に求めるアルゴリズムを定義しなくてはならず、これは付加パターンの命名法開発に他ならない。なお、メジャー 構造IDは鏡像異性体を区別する場合では30ビットの全空間の約1/60を、鏡像異性体を区別しない場合では約1/120を占めている。
本研究に於いて、ある構造ID=mに対するメジャー構造IDは次のように定義した。
function WhichIsMajorStructID(m1,m2){
  var bitMask = 1;
  var m = m1;
  for(var i=0; i<30; i++) {
    if((m1 & bitMask) ^ (m2 & bitMask)){
      if(m2 & bitMask) {
        m = m2;
      }
      break;
    }
    bitMask = bitMask << 1;
  }
  return m;
}


Figure 5. Which is the Major Structure? The structure that the first set bit in exclusive-or of two structures is set is the Major one.

この定義は、構造発展図に描かれた構造IDの選出アルゴリズムと同等であり、構造発展図に登場する構造IDは全てメジャー構造IDである。
今回のツールはシュレーゲル図に入力された付加パターンに対するメジャー構造IDを直ちに求めることができる(Figure 3g)。

2. 4 鏡像構造探索

鏡像異性体にもメジャー構造IDが割り振られるが、しかしながら従来の方法では任意の構造IDに対する鏡像異性体の構造IDを求めるためには鏡像異性体対の表を全空間探索により予め求めておく必要があり、立体障害度合いh=0 のケースでは計算規模が大きすぎるために表を得ることすらできなかった。ここで立体障害度合いとは、任意の官能基間の取りうる最近接距離のことで、cis-1より遠くでしか付加できないという条件をh=1、cis-2より遠くでしか付加できないという条件をh=2、以下同様にしてtrans-1より遠くでしか付加できないという条件をh=8とした[3]。それぞれのhについて計算を行うと、任意の構造ID=mに対する鏡像異性体の構造IDと、そのメジャー構造IDを少ない計算量で求めることができる。ここで、
今回のツールはシュレーゲル図に入力された付加パターンに対する鏡像異性体のメジャー構造IDを直ちに求めることができる(Figure 3h)。

2. 5 付加可能位置

立体障害度合いhを仮定したとき、構造IDの示す付加パターンから派生可能な誘導体全体は、構造発展図を参照することにより可能である。しかしながら、任意の構造ID=mに対するそれを視覚的に求めるにはシュレーゲル図に直接付加可能位置をマークした方が解りやすい。付加可能位置をマークした構造IDは次の手順で求めることができる。
今回のツールはシュレーゲル図に入力された付加パターンに対する付加可能位置を各立体障害度合いh=0...8それぞれについてシュレーゲル図に淡色表示することができる(Figure 3i)。

3 まとめ

構造IDを3次元的に、または2次元的に描画する可視化ツールを作成した。このツールは構造IDと、これに対応するシュレーゲル図で付加パターンの両者を同時に表示しており、片方の変化をもう片方へリアルタイムで反映させている。また、従来は殆ど知るすべの無かった付加パターンの代表構造をメジャー構造IDとして直ちに解析することが可能となった。このメジャー構造IDは、重ねあわせ可能な構造に対して同じ値が発行され、この値の比較のみから構造異性体かどうか直ちに識別可能となる指標であり、既に報告された構造発展図に書かれた構造IDと同等である。
このツールは他にも鏡像異性体や付加可能位置の表示などの各種機能を具備しており[11]、フラーレン多付加体を研究する専門の方々や、これに興味を抱いた広く一般の方々にとっても有意義な道具・教具として利用されることが期待される。ツール自体はインターネット上でもスタンドアローンでも実行可能なSVGファイルとして作成されているため、実行環境を問わず何時でも何処でも高速に利用することが可能である。本研究で作られたツールは下記のURLにて公開されている。
http://www.toida.jp/tatsuo/2005/10/18/JCCJ/

最後に、このツールのデバッグに協力してくれた兄の樋田史郎にこの場を借りて感謝する。

参考文献

[ 1] L. Issacs, R. F. Haldimann, and F. Diederich, Angew. Chem., Int. Ed. Engl., 33, 2339 (1994).
[ 2] I. Lamparth, C. Maichle-Mossmer, and A. Hirsch, Angew. Chem, 107, 1755 (1995).
[ 3] T. Toida, Y. Hori, K. Nemoto, K. Uchida, T. Ishii, and H. Yajima, J. Computer Aided Chem, 6, 11 (2005).
[ 4] 例えば構造ID=0x01001081についてPDBならばhttp://www.toida.jp/tatsuo/2005/10/18/JCCJ/pdb.cgi?ID=0x01001081 から、シュレーゲル図ならば
http://www.toida.jp/tatsuo/2005/10/18/JCCJ/schlegel.cgi?ID=0x01001081
からアクセスできる。
一般的にpdb.cgiやschlegel.cgiに?ID=と続けて構造IDを0xで始まる8桁の16進数で書くことでこれらの図へのリンクがつくられ、様々なコンテンツに多付加体の付加パターンの図を自由に内包させることができる。ただし、前者は構造最適化されていないことに注意せよ。
[ 5] RCSB PDB
http://www.rcsb.org/pdb/
[ 6] MDL Inc.
http://www.mdli.com/
[ 7] W3C
http://www.w3.org/TR/SVG11/
[ 8] 例えばAdobe社
http://www.adobe.com/svg/
よりSVG Viewer がダウンロードできる。
[ 9] ECMA
http://www.ecma-international.org/publications/standards/Ecma-262.htm
[10] ソースファイルは
http://www.toida.jp/tatsuo/2005/10/18/JCCJ/getRT.ccp
より入手可能
Microsoft Visual C++ 6.0 / Windows XP で開発
[11] その他の機能として例えば、入力された構造IDの補数を求める機能(Figure 3c)、構造IDをリセットする機能(d)、原子ラベルの表示方法の切り替え(j)、化学式の部分表示(k)などがある。なお原子ラベルの番号付け(j)は6員環周りに一筆書きする方法[12] と、5員環周りに一筆書きする方法[13]などが選べる。またこのツールの最初のバージョンに於いて標準的な付加位置の表示(k)は、あくまでも現在のシュレーゲル図に表示中のマイナー構造に対するもので、一般的な番号でない可能性が高いことに注意せよ。
[12] R. Taylor, The Chemistry of Fullerene, World Scientific Publishing Co. Pte. Ltd. (1995).
[13] W. H. Powell, NOMENCLATURE FOR THE C60-Ih AND C70-D5h( 6) FULLERENES, IUPAC Recommendation 2001.


Return