単糖の変換経路の自動生成システム

野中 利之, 田嶋 聖彦, 服部 秀雄, 新井 邦夫


Return

1 はじめに

1. 1 背景

人類は、20世紀初頭以来、化石資源(石油等)を炭素源とした有機合成反応によって、種々の化学物質を作り出すと同時に、石油系化合物を基幹とする有機化学の体系を構築してきた。しかし、将来の持続可能な社会の実現に向けて、地中から採掘した化石資源を最終的に二酸化炭素として排出する一方的な消費の状態から資源循環型へと社会および化学プロセスを転換させる必要が生じている。
セルロースは、バイオマス資源を構成する主要成分であり、資源循環型化学プロセスの開発を目的とした高度利用が可能である。著者らの研究室では、結晶性セルロースを超臨界状態(374℃・22MPa以上)の水(超臨界水)のみで可溶化・反応させる環境調和型化学プロセスの開発に関する基礎研究を行なっている[1 - 3]。
超臨界水中のセルロースの分解反応によって、セロオリゴ糖や単糖であるグルコース・フルクトースが生成する。これらの糖類は、炭化水素に水酸基が置換し、分子の末端の炭素または内部炭素がそれぞれアルデヒトまたはケトンに酸化された構造となっている。そのため、単純に酸またはアルカリ水溶液に溶かしたり、水中で煮沸するといったワンポットの反応で種々の化合物を生成することが知られている。特に、石油から製造される合成高分子原料の大部分は、グルコースを出発原料としても誘導することが可能であり、オイルリファイナリーに代わるバイオマスリファイナリーへの展開が期待される。著者らの研究室でも、グリコール酸の原料であるグリコールアルデヒドをグルコースから超臨界水を用いて比較的高収率(最大63.8%)で得る方法を報告した[4]。
以上のように、糖類の反応を変換プロセスとして利用する場合、単糖自身の反応制御性が重要な鍵となり、単糖から目的化合物への反応スキームに関する糖化学の体系化が必須の作業となる。また、ポストペトロケミストリーの確立に向けて、単糖のワンポット反応による変換の可能性を取り扱える化学コンピュータシステムの開発が求められている。

1. 2 超臨界水中での糖類の反応性に関する理論

著者の一人(田嶋)は、単糖と既知のワンポット反応生成物との関係を分子式の観点から見直すことによって、炭水化物(carbohydrate)とも呼ばれる単糖が脱水反応をひき起こす点が重要であることを示した[5]。さらに、脱水反応によって誘導される反応中間体が、特徴的反応として互変異性化反応をひき起こし、多数の互変異性体がカスケード状に生成することを指摘した。この脱水反応と互変異性化反応の繰り返しによって、単糖の分解反応として複雑な反応性を示すものと考えた。また、水和・脱水素酸化・水素化還元・環化反応を追加することによって、糖類を出発物質として同一炭素数の炭素・水素・酸素を構成元素とするほぼすべての化合物に誘導できることを糖化学の観点から示した。
このような反応は、超臨界水中における糖類の無触媒反応を支配するものと考えられる。しかし、反応実験および計算化学の両面とも反応条件の考慮・選択性・生成物の定量性に関する知見が充分に蓄積されておらず、超臨界水における反応の体系化に関する研究も最近検討されはじめられたばかりである。

1. 3 本研究の目的

前項の理論に基づき、化学コンピュータシステムの観点から従来の化学反応予測システム[6 - 10]や化学合成経路設計システム[11 - 15]と比較すると、超臨界水中における単糖の反応に関して以下の特徴が挙げられる。
  1. 目的化合物および出発物質(単糖)が所与である。
  2. 反応の種類(脱水反応等)が限定されており、出発物質または反応中間体では主に分子からの水素・酸素原子の脱離反応が進行する。
  3. 多数の反応中間体(互変異性体)が存在する。
  4. ワンポットかつ多段反応である。
  5. 未知反応が大半であり、データベース・知識ベースの構築に利用できる化学情報が乏しい。
以上から、化学コンピュータシステムとして第一義に求められるのは、出発物質と目的化合物の間の合成経路が存在するかを判定し、その合成経路(存在する場合)を正または逆合成の方向で提示するシステムと考えられる。このようなシステムは、例えば各反応ステップでの反応中間体の導出等において既往の反応発生モジュール([8, 13]等)を流用するといった従来の延長線上で対応することも可能であろうが、上述の理論のすべてを実現するためには独自のシステム開発が求められる。そこで本研究では、超臨界水における単糖の反応に特化することで、より詳細な合成経路の提示を可能とし、より実践的で実用的なシステムへと展開できる化学コンピュータシステムの開発を研究目的とした。
第一段階として本報では、単糖を出発物質とした脱水・水和・酸化・還元と互変異性化・環化反応の組み合わせによって、多数の反応生成物をカスケード状に自動生成し、合成経路の探索を実現するシステムを開発したので報告する。

2 方法

2. 1 化合物の表現方法

本システムでは、第一段階としてプログラム処理の簡略化および糖類の有する基本的な変換反応の可能性を明らかにするために、幾何異性体・光学異性体は考慮していない。直鎖構造の単糖またはその水和物を出発物質とするが、単糖はトポロジカルには炭素原子が直鎖状につながった化合物である。よって、本システムで取り扱う反応中間体や反応生成物も、炭素鎖を直鎖状に展開できる構造のものを対象とした。また、炭素鎖の切断や延長は対象としていない。
化合物の分子構造の表示に関して、例えばMDL Molfileフォーマット等[10]の表現方法が使用されているが、市販のパーソナルコンピュータでの実行を可能にするために、糖類の構造と反応を考慮した必要最小限の表現方法を独自に開発して用いた。
例として、Figure 1に5-ヒドロキシメチル-2-フルアルデヒド(分子式C6H6O3)を示す。


Figure 1. 5-Hydroxymethyl-2-furaldehyde

構造式に対して、端から炭素原子の番号付けを行なう。左または右端からの2通りが考えられるが、便宜上カルボニル基が結合した炭素原子の番号が小さくなる方を採用した。Figure 1では、右端の炭素(アルデヒド基)が1番となる。なお、分子内にカルボニル基が存在しない場合は、代わりに水酸基が結合した炭素原子の番号が小さくなるように端から炭素原子の番号付けを行なう。環状化合物についても、これに準じた番号付けをするものとした。
化合物を構成する官能基は、カルボニル基、水酸基であり、基本骨格は単結合、2重結合、3重結合、複素環、炭素環の組合せで形成される。各炭素原子ごとの各結合の数を2次元配列として表現する。
Table 1Figure 1の化合物を2次元配列で表現したものを示す。
各列の番号は各炭素原子の番号であり、各行は各炭素原子に対する結合の種類((1)-O-:複素環、(2)=O:カルボニル基、(3)-OH:水酸基、(4)-H:水素原子、(5)=:2重結合、(6)-C-:炭素環)を意味する。数字の値は各結合の数を示しており、結合がない場合には値は零とした。なお、3重結合は、2重結合が2個あるものとしてカウントした。Table 1の1列めは、1番めの炭素原子にカルボニル基、水素原子がそれぞれ1個ずつ結合していることを表す。以上の2次元配列表現によって、各炭素原子に結合している水素・酸素原子の数の合計や炭素原子自身の結合数(価数)を単純計算で求めることができる。

Table 1. An array representation of the numbers of the bonds for each carbon atom of Figure 1

さらに、2重結合、複素環、炭素環を形成する炭素原子間の結合については、この基本骨格の種類を先に示した数字データ((1):複素環、(5):2重結合、(6):炭素環)として、結合に関与する炭素原子の番号とともに別な配列に記録した。Table 2Figure 1における炭素原子間の結合関係を1次元配列で表現したものを示す。

Table 2. An array representation of kinds of the bonds between the carbon atoms and the position numbers of the atoms of Figure 1

列は結合の種類、結合を形成している炭素原子の番号(C1)、炭素原子の番号(C2)である。1次元配列では、個々の炭素原子間の結合関係は、結合の種類と炭素番号を10進数の各桁の数字として表される。例えば、炭素原子間の結合Aは、545の値であり、2重結合(5)が4番めと5番めの炭素原子間にあることを示す。また、Table 2の例のように複数の結合関係がある場合は、単純選択法を用いて値の大きな順にソートした。
各化合物の構造は、分子を形成する結合全体を表す2次元配列(Table 1)と基本骨格を表す1次元配列(Table 2)を用いて表される。

2. 2 構造変換の手法

出発物質である単糖は、分子式の変化を伴う脱水・水和・酸化・還元反応と、分子式の変化を伴わない互変異性化・環化反応によって、他の化合物へ変換される。これらの反応は、先に述べた2次元配列と1次元配列の数字データを変更する操作に置き換えられる。
Figure 2に分子式C4H8O4で示される単糖が1回の脱水操作によってC4H6O3の化合物に変換される例を示す。


Figure 2. An example of transformation of the arrays by dehydration

この場合、3番めの炭素原子に結合する水素原子と4番めの炭素原子に結合する水酸基が脱離し、これらの炭素原子の間に2重結合が形成される。これらの反応を分子を形成する結合全体を表す2次元配列上で操作すると、3番めの炭素原子の水素の結合数、4番めの炭素原子の水酸基の結合数をそれぞれ1から0にし、両炭素原子の2重結合数をそれぞれ0から1にすることになる。また、基本骨格を表す1次元配列上では、新たに結合Aの領域に534の数字が書き込まれ、3、4番めの炭素原子間の2重結合が追加される。以上のように、構造の変化の配列表現は、人間の目にも理解しやすい特徴を持つ。
さらに、化合物C4H6O3がケト―エノール互変異性化反応によって同じ分子式の互変異性体に構造を変化させた例をFigure 3に示す。2次元配列、1次元配列の値の操作によって、同様に反応に伴う構造変換を表示できる。


Figure 3. An example of transformation of the arrays by tautomerization

2重結合の移動に伴う脱水パターンの例として、基本骨格を表す1次元配列を変更した例をFigure 4に示す。これは、i+2〜i+3番めの炭素原子間の2重結合が脱水反応に伴って削除され、i+1〜i+2番めの炭素原子間と、i+3〜i+4番めの炭素原子間に2重結合が新たに生ずる反応である。
本システムでは、i+2〜i+3番めの2重結合の削除に対して、結合の種類を表す番号5の数字を負にした結合を基本骨格を表す1次元配列に追加し、炭素間の結合位置が同じで結合の種類の番号が正負逆のものを打ち消す手法を採用した。さらに、2.1に述べたソート操作によって配列の順序を整えた。


Figure 4. An example of transformation of double bonds in dehydration

2. 3 不合理な構造のチェック

脱水や互変異性化等の操作によって生成した化合物については、下記の分子式や価数のチェックを行ない、不合理な構造を持つものを除外した。

2. 3. 1 水素数・複素環・2重結合・炭素環のチェック

分子を形成する結合全体を表す配列から、水素の数および複素環・2重結合・炭素環の結合数をカウントし、例えば、
  1. 水素の数の総和が化合物の分子式の数と合っていない。
  2. 各構成炭素の結合の数の総和が偶数ではない。
  3. 端の炭素原子の2重結合の数字が1でその内側の値が0となっている。
等が検出されれば、不合理な構造として除外する。

2. 3. 2 炭素原子ごとの結合数・不安定構造のチェック

分子を形成する結合全体を表す配列から、炭素原子ごとの結合の数をカウントし、Figure 5に示す不安定な構造が検出されるか、各炭素原子の価数が合わない場合、不合理な構造として除外する。


Figure 5. Examples of unstable structures

2. 4 同一構造のチェック

ある化合物に脱水等の操作を行なう場合、同一構造のものが複数個生成される場合がある。これは合成経路が重複することになるため、防止の必要がある。そこで、同じ構造もしくは左右反転の構造であるかどうかをチェックした。
分子を形成する結合全体を表す2次元配列、基本骨格を表す1次元配列を用いて数字パターンのマッチングを行ない、さらに反応前の化合物が一致するかをチェックする。これらが一致する場合、重複経路として除外される。

2. 5 脱水・水和・酸化・還元・異性化反応に基づく合成経路の展開

本システムでは、同じ分子式を有する化合物を1つの集合とし、酸化レベルと構成炭素原子1個あたりの平均結合エンタルピーを両軸としたダイアグラムに基づいて反応操作を行なった。構成炭素原子1個あたりの平均結合エンタルピーは、分子を構成している結合の平均結合エンタルピー(一般的に物理化学で用いられている種々の環境下での結合エンタルピーの平均値)の総和を炭素数で除した値で、化合物の分子式を特定するために用いられる。また、炭素、水素、酸素で構成される化合物の分子式の水素と酸素を水分子として括りだした化学式[5]を用いると、酸化レベルは次式で定義される。

例として、炭素数3(C3)の化合物のダイアグラムをFigure 6に示す。


Figure 6. A diagram of organic compounds

このダイアグラムは、炭素・水素・酸素を構成元素とするC3化合物の分子式をプロットしたものであり、頂点、底部、左端、右端の点は、それぞれ糖水和物、炭素、飽和炭化水素、最も酸化された炭化物(most oxidized compound)を表す。なお、単糖(C3H6O3)は、Figure 6中の黒点の位置に存在する。
他のCn(n=4,5,6...)化合物も同様なダイヤグラムとなり、同じ分子式を有する化合物の集合は、それぞれダイヤグラム中の1つのスポットとして表される。Figure 6より、縦軸である構成炭素原子1個あたりの平均結合エンタルピーが最も高いのは、単糖の水和物であることがわかる。単糖の水和物および単糖は、水素、酸素または水分子を削減することでエントロピーを増加させ、低エンタルピーの分子式を有する化合物へと変換される。すなわち、これが単糖のワンポット反応の本質であると考えられる。
ダイアグラム上では、分子式の変化を伴う脱水、水和は、Figure 6中ではそれぞれ1段下へ下降、1段上へ上昇することになる。酸素原子の付加、脱水素化による酸化は、それぞれ右上に上昇、右下に下降する操作(ともに右に1段進む操作)となる。水素化、酸素原子の脱離による還元は、それぞれ左上に上昇、左下に下降する操作(ともに左に1段進む操作)となる。
Figure 7に単糖からの構造変換を模式的に表した図を示す。


Figure 7. The methodology of the automatic generation of synthetic routes

目的化合物の分子式が与えられると、出発物質である単糖または単糖の水和物の分子式と比較し、必要な脱水または水和の回数、さらに酸化または還元の回数を決定する。合成経路は、単糖または単糖の水和物から目的化合物の分子式まで水分子・水素原子・酸素原子を削減する過程として得られるものとした。
本システムでの酸化は、脱水素酸化操作のみで行なう。1つの酸素原子を削減する還元は、脱水と水素化操作を組み合わせて行なうようにした。
Figure 7中に示されるように、[1]の単糖(または単糖の水和物)の集合から脱水、脱水素化または水素化の中の1つの操作によって、それぞれ単一の分子式を有する化合物の集合[2]が生成する。
この集合[2]の化合物群にそれぞれ1回めの互変異性化操作を行ない、分子式が集合[2]と同じでその互変異性体である化合物の集合[3]を生成する。さらに、集合[3]の化合物群に2回めの互変異性化操作を行ない、集合[4]とする。集合[4]の化合物群に3回めの互変異性化操作によって集合[5]を生成する。
目的化合物が環状化合物の場合、[2]から[5]までの集合の化合物に対して環化操作を行ない、集合[6]を生成する。ここで、Figure 7中の枠内の[2]から[6]の集合は、すべて同じ分子式を持つ化合物の集合となる。
さらに、分子式を変化させる必要があれば、[2]から[6]の集合のすべてを用いて次の操作(脱水、脱水素化、水素化)を行ない、[2]から[6]の集合から分子式を変化させた化合物の集合[7]を得る。集合[7]に対しても、同様に互変異性化(3回)・環化(1回)を行なう。
以上、目的化合物の分子式に一致するまで、脱水・脱水素化・水素化のいずれかを行なうことによって生成した化合物、その互変異性体、化合物・互変異性体を環化させた環状化合物をひとまとめとしたもの(同じ分子式の集合体)を作成する操作(Figure 6のダイアグラム内でのスポットの移動)を繰り返す。
以上の手順によって、単糖から目的化合物への合成経路を展開し、化学反応の予測を行なうシステムとした。

2. 6 合成経路の記録

Figure 8に合成経路の例を示す。


Figure 8. An example of synthetic routes

合成経路は、各集合内の要素間の対応付けとして表される。Figure 8の例では、単糖[1]の集合の要素1(Figure中では[1]-1と表示)である化合物から、分子式を変化させる操作(脱水・脱水素化・水素化のいずれか)を行なうことで、集合[2]の要素1、2...が生成する。さらに、集合[2]の要素1から3回の互変異性化操作に対応して、集合[3]の要素1、集合[4]の要素1、集合[5]の要素1の化合物が生成し、[2]の要素1の環化反応によって集合[6]の要素1が生成する。
本システムは、目的化合物から逆に遡って出発物質である単糖または単糖水和物に到達できるように2次元配列を使用した。Figure 9は、Figure 8の合成経路を模式的に配列で示したものである。


Figure 9. An array representation of synthetic routes of Figure 8

Figure 9において、各行は集合の番号、各列は集合内の要素番号を表す。配列の各要素には、その要素を得る直前の集合番号と集合内の番号を記録する。例えば、Figure中の集合[2]の1番めの要素(左上端)は、[1]の1であり、集合[2]の1番めの化合物が糖の集合[1]の1番めの化合物から生成したことを表す。
合成経路は、番号が大きな集合から小さい集合へと遡って示される。例えば、2次元配列内の集合[5]の1番めの要素には、集合[4]の1番めが記録される。集合[4]の1番めの要素を遡ることによって、集合[3]の1番め、集合[2]の1番め、集合[1]の1番めへと到達する。この要素間の対応関係を示すことによって、合成経路が表示される。
なお、目的化合物がカルボン酸またはその誘導体である場合は、Figure 7の右のシーケンスに示すようにケテンを経由するものとした。この場合、Figure 7中の左のシーケンスにおいて必要回数よりも多めに脱水操作を行なう。各集合の中からケテンを探索し、ケテンを水和した化合物を出発物質として、目的化合物に到達するまで脱水・脱水素化・水素化・互変異性化・環化の操作を繰り返すものとする。

2. 7 本システムにおける各操作の実現

本システムでは、目的化合物の構造の入力、単糖または単糖の水和物の生成、脱水・脱水素化・水素化・互変異性化・環化、目的化合物への合成経路の表示、ケテン処理をそれぞれサブルーチンとしてモジュール化した。
ダイアグラム内における単糖(または単糖の水和物)から目的化合物までの反応操作は、メインプログラムにてあらかじめ固定化されており、基本的に脱水操作を行なった後に脱水素酸化または還元操作を行なう方式を採っている。

2. 7. 1 目的化合物の入力

テキスト画面で数字入力を行なうものとグラフィック画面(Kylixによる入力プログラムを作成)で化合物を指定するものの両方を作成した。いずれも、分子を形成する結合全体を表す2次元配列と基本骨格を表す1次元配列に値を入力する操作を行なう。ここでは、テキスト画面における数字入力について説明する。
目的化合物の炭素原子数を決定し、分子を形成する結合全体を表す配列に値を入力する。ここでは、Figure 10Figure 11に4,5-ヒドロキシ-5-ヒロドキシメチル-2-シクロペンテノンを目的化合物とした例を示す。


Figure 10. 4,5-Dihydroxy-5-hydroxymethyl-2-cyclo-pentenone


Figure 11. An input example of Figure 10

なお、分子を形成する結合全体を表す2次元配列の入力後に、各炭素原子の結合の数、前述の不合理な構造、水素・酸素原子の数の総和が偶数であるか否かのチェックを行ない、エラーがある場合には該当する炭素原子の結合数の値を修正できる。この2次元配列にエラーがなければ、基本骨格を表す1次元配列の入力を行なう。
入力値は、分子を形成する結合全体を表す配列と比較され、エラーがある場合は表示される。分子を形成する結合全体を表す2次元配列の入力の場合と同様に値を修正できる。
最後に、目的化合物への合成経路をすべて表示するものか、最短のものだけを表示するのかを指定して、合成経路の探索を開始する。

2. 7. 2 出発物質である単糖または単糖の水和物の探索

直鎖構造の単糖における各炭素原子は、カルボニル基、水酸基のいずれかと結合している。そこで、分子を形成する結合全体を表す2次元配列の値を変化させた総当たり法によって、目的化合物と炭素原子数が等しい単糖または単糖の水和物を探索する。ここで、2.4に述べた同一構造のものをチェックする機能によって左右反転構造のものは除外される。

2. 7. 3 反応部位認識の方法

脱水等の操作においては、糖化学に基づき反応のための炭素原子セグメントのパターンが準備されている。反応物である化合物の反応部位の認識は、炭素原子セグメントパターンとの単純なマッチングによって行なわれる。個々の炭素原子セグメントのパターンがif文の前提部に記述されており、化合物に対する分子を形成する結合全体を表す2次元配列と値が比較される。各操作では、化合物と炭素原子セグメントすべてとのパターンマッチングが実行される。

2. 7. 4 脱水操作のパターン

Figure 12に脱水操作を行なう炭素原子セグメントのパターンの例を示す。脱水操作を行なう化合物に以下の炭素原子セグメントのパターンがあれば、2.2の構造変換の手順に従って脱水操作を行なう。主にカルボニル基のa-水素を引き抜いて脱水反応が進行するとした。なお、不要な脱水操作を防止するために、脱水操作を行なう化合物と目的化合物の分子を形成する結合全体を表す2次元配列を比較し、水酸基が離脱する炭素原子に結合する酸素原子の数が目的化合物の対応する炭素原子に結合する酸素原子の数よりも多いことを確認する。


Figure 12. Dehydration patterns

さらに、(炭素原子数-2)回以上の脱水操作を行なった後は、Figure 13に示す脱水パターンも適用する。


Figure 13. Dehydration patterns

炭素原子の再番号付けのチェック、炭素原子ごとの結合数および不安定構造のチェック、同じ構造のチェックを行なう。これらのチェックをパスしたものを脱水化合物として認定し、脱水化合物の集合に追加する。

2. 7. 5 脱水素操作のパターン

Figure 14に脱水素操作を行なう炭素原子セグメントのパターンを示す。水素分子の脱離により、炭素-炭素間または炭素-酸素間の2重結合が形成される。


Figure 14. Dehydrogenation patterns

2. 7. 6 水素化操作のパターン

Figure 15に水素化操作を行なう炭素原子セグメントのパターンを示す。操作は、脱水素の場合の逆になっており、炭素-炭素間または炭素-酸素間の2重結合へ水素が付加するとした。


Figure 15. Hydrogenation patterns

2. 7. 7 互変異性化操作のパターン

Figure 16に互変異性化の炭素原子セグメントのパターン例を示す。


Figure 16. Tautomerization patterns

ケトーエノール平衡およびこれに2重結合の移動が加わったパターンである。なお、互変異性化によるケテン生成については、Figure 17に示すパターンで行なうものとした。


Figure 17. Tautomerization patterns

また、2.7.4に述べた脱水パターンを行なった化合物については、Figure 18に示す互変異性化パターンも適用する。


Figure 18. Tautomerization patterns

互変異性化操作は、3回(Figure 7参照)行なわれるが、同じ互変異性体に戻らないように、直前とその1つ前の化合物の構造(配列)を比較している。

2. 7. 8 環化操作のパターン

Figure 19に環化による炭素環生成操作を行なう炭素原子セグメントパターンの例を示す。


Figure 19. Cyclization patterns

ケトーエノール平衡と2重結合の移動によって生じるカルバニオンによるカルボニル基の攻撃と、カルボニル基のa-水素の引き抜きによって生じるカルバニオンによるカルボニル基の攻撃によって環化反応が進行するものとした。
Figure 20に環化による複素環の生成操作を行なう炭素原子セグメントパターンの例を示す。水酸基のカルボニル基またはケテン基への付加により、複素環が生成するとした。


Figure 20. Cyclization patterns

2. 7. 9 合成経路の表示における化合物表現

合成経路における個々の化合物の表示には、示性式の他に著者らによる独自の表示法を用いた。これは、化合物の炭素原子と酸素原子の結合を数字として表すものである。水酸基が結合している炭素原子の番号は1度、カルボニル基を形成している炭素原子の番号は2度表示する数列とした。複素環の場合は、酸素が結合する炭素原子の番号を表示する。それぞれの結合を表す数字の間は、カンマで区切る。
数列の前には、ヘッダーとして()で括られた数列があり、炭素数と炭素原子どうしの結合(2重結合、3重結合および炭素環)を表す。
ただし、2、3重結合は、結合している2つの炭素原子の中で番号が小さい方の数字のみを表示する。数列は、2重結合ごと、3重結合ごとにまとめ、結合の種類を表示するためにそれぞれの末尾にd、tの記号をつける。なお、炭素環以外の炭素原子相互の間の単結合については表示しない。
炭素環は、環を形成する両方の炭素の番号で表示し末尾にcの記号をつけるが、構成炭素すべてで1つの環をなす場合は炭素数の後にcの記号をつける。
炭素原子と水素原子の結合については表示しない。
例えば、Figure 1に示す5-ヒドロキシメチル-2-フルアルデヒドは、炭素原子が6個、炭素原子番号2〜3、4〜5に2重結合、炭素原子番号1にカルボニル基、炭素原子番号2と5の間に複素環、炭素原子番号6に水酸基があり、(6,24d) 1 1, 2 5, 6で表される。

2. 8 開発環境

本システムの開発環境および動作確認は、以下に示すハードウェア・ソフトウェア環境で行なった。
本システムの核となるソースファイルの容量は、約300KBである。

3 システムの実行例

3. 1 全合成経路の表示例

全合成経路は、単糖またはその水和物を出発物質として、目的化合物の分子式まで脱水・水和・酸化・還元・互変異性化・環化反応の組合せによる合成経路をすべて示すものである。生成した化合物から出発原料である糖に向かって合成経路を記録するための配列(Figure 9参照)を遡る操作を繰り返して表示する。
目的化合物として、Figure 10に示した4,5-ヒドロキシ-5-ヒロドキシメチル-2-シクロペンテノンを与えた場合の全合成経路の表示例(単糖を出発物質)をFigure 21に示す。なお、目的化合物は、C6H8O4の分子式で示されるので、Figure 7に従えば単糖(C6H12O6)から脱水・互変異性化・環化を組み合わせた一連操作を2回繰り返すことになる。全合成経路の生成のために要する計算時間は、約12分であった。


Figure 21. Synthetic routes to C6H8O4

単糖から2分子脱水させて、C6H8O4の分子式を持つ化合物を生成する合成経路の数は、途中で途切れるのも含めると30000を超えることがわかった。
また、Figure 22に各集合における化合物の数を示す。出発物質である単糖の数は6個(集合[1])であり、脱水操作によって15個の脱水物(集合[2])が生成する。互変異性化・環化・さらなる脱水等によって、最終的に目的化合物である4,5-ヒドロキシ-5-ヒロドキシメチル-2-シクロペンテノンと同じ分子式を有する環状化合物[11]は1439個あることがわかった。


Figure 22. Compound number of each set in synthetic routes to C6H8O4

このように、脱水と互変異性化反応のみによって、本システムが多数の合成経路と反応生成物を生成させうることが示される。

3. 2 目的化合物への合成経路の表示例

全合成経路の表示と同様に、生成した化合物から出発原料である糖に向かって合成経路を記録するための配列を遡り、目的化合物を探索する。分子を形成する結合全体を表す2次元配列、基本骨格を表す1次元配列を用いて、目的化合物との数字パターンのマッチングを行なう。化合物が目的化合物と一致する場合、その化合物から合成経路を記録するための配列を遡り、出発物質である単糖(またはその水和物)まで表示する。
上記の操作を目的化合物と同じ分子式を有する集合に適用し、合成経路をすべて表示する。Figure 23に目的化合物である4,5-ヒドロキシ-5-ヒロドキシメチル-2-シクロペンテノンの合成経路の表示例(単糖を出発物質)を示す。4,5-ヒドロキシ-5-ヒロドキシメチル-2-シクロペンテノンの合成経路の数は99ルートあるが、ここでは反応ステップが短いものだけを便宜的に選択して表示した。最短の合成経路は2ルートである。


Figure 23. Synthetic routes to 4,5-dihydroxy-5-hydroxymethyl-2-cyclopentenone

Figure 23中の合成経路[2]に対する反応スキームをFigure 24に示す。


Figure 24. The scheme of the route [2] in Figure 23

C6の単糖である直鎖構造のフルクトースから、脱水・互変異性化を繰り返し、環化によって目的化合物である4,5-ヒドロキシ-5-ヒロドキシメチル-2-シクロペンテノンを誘導できることが示される。
Figure 25は、著者の一人(田嶋)によって発見された反応スキームである。フルクトースを出発物質とし、アセチル化、トリエチルアミンによる脱離、エノールアセテートのアルコリシスによる環化反応によって、4,5-ヒドロキシ-5-ヒロドキシメチル-2-シクロペンテノンのジアセテートが生成する。炭素鎖における2重結合やカルボニル基の位置を比較すると、Figure 24Figure 25の反応スキームは一致しており、フルクトースが水和物として反応することが明確にされている。


Figure 25. The scheme of the formation of 4,5-dihydroxy-5-hydroxymethyl-2-cyclopentenone

本システムは、目的化合物が糖類を出発物質とすることで理論的に生成可能かどうかを示すものであり、提示された合成経路は反応制御するための手がかりとなるものと考えられる。現在、著者らは提示された合成経路(Figure 23)を参考にし、超臨界状態の水を使用して、無触媒で単糖から4,5-ヒドロキシ-5-ヒロドキシメチル-2-シクロペンテノンが生成するかどうかを検討している。

3. 3 カルボン酸化合物を目的化合物とする合成経路の表示例

目的化合物として、カルボン酸化合物である3-デオキシ-ヘキソン酸を入力した場合の合成経路の表示例(単糖を出発物質)をFigure 26に示す。


Figure 26. A synthetic route to 3-deoxy-hexonic acid

本システムでは、ケテンの水和によってカルボン酸が生成するものとした。そこで、単糖を出発物質として、合成経路を展開したのちに、経路内のケテンを探索した。ケテンそれぞれに対して水和操作を行なってカルボキシル基を生成し、目的とするカルボン酸まで合成経路を展開した。全合成経路の生成のために要する計算時間は、約1分であった。
Figure 26の合成経路に対する反応スキームをFigure 27に示す。


Figure 27. The route in Figure 26

C6の単糖である直鎖構造のグルコースから、脱水と2回の互変異性化によってケテンが反応中間体として生成し、ケテンへの水和によって3-デオキシ-ヘキソン酸が生成することが示される。既往の報告[16]であるアルカリ存在下での高温熱水中におけるグルコースの反応スキームをFigure 28に示す。この反応スキームは、Figure 27のスキームとほぼ一致することがわかった。


Figure 28. The scheme of the formation of 3-deoxy-hexonic acid

4 まとめ

本報では、単糖またはその水和物を出発物質とし、脱水・水和・酸化・還元・互変異性化・環化反応に基づいて合成経路を自動生成するシステムについて報告した。
本システムの基礎となる糖化学は、糖の立体構造を基盤にしたものではなく、糖分子自体がどのような反応をする化合物なのかを示す種々の反応を基盤に組み立てたものである。この糖化学に基づく総当たり方式によって、目的化合物までの合成経路をすべて明示するところに本システムの特徴がある。よって、糖類の反応実験によって得られた生成物が、どのような合成経路を経由してきたかを考察できる。また、与えられた目的化合物が単糖から生成可能かどうかを判断できる。
今後は、糖の反応実験を支援する化学コンピュータシステムとして、合成経路に関する量子力学的な反応解析や実験による知見を付け加えることによって、経路探索の精度を向上させ、計算量の削減(組合せ的爆発の回避)を図る予定である。
さらに、反応の立体制御性に関するデータを今後追加し、立体化学を取り扱える完成度の高いシステムへと修正していきたいと考えている。
これらを踏まえて、オイルリファイナリーからバイオマスリファイナリーへの転換に向けて、化学プロセスの開発に関連したバイオマス利用技術としての展開をさらに進めたい。

参考文献

[ 1] T. Adschiri, S. Hirose, R. Malaluan, K. Arai, J. Chem. Eng. Japan, 26, 676-680 (1993).
[ 2] M. Sasaki, B. Kabyemela, R. Malaluan, S. Hirose, N. Takeda, T. Adschiri, K. Arai, J. Supercritical. Fluids, 13, 261-268 (1998).
[ 3] M. Sasaki, Z. Fang, Y. Furukawa, T. Adschiri, K. Arai, Ind. Eng. Chem. Res., 39, 2883-2890 (2000).
[ 4] M. Sasaki, K. Goto, K. Tajima, T. Adschiri, K. Arai, Green Chem., 4, 285-287 (2002).
[ 5] K. Tajima, Biosci. Industry, 56, 671-674 (1998).
[ 6] T. D. Salatin, W. L. Jorgensen, J. Org. Chem., 45, 2043-2051 (1980).
[ 7] P. Rose, J. Gasteiger, Anal. Chem. Acta, 235, 163-168 (1990).
[ 8] H. Satoh, K. Funatsu, J. Chem. Inf. Comput. Sci., 35, 34-44 (1995).
[ 9] H. Satoh, K. Funatsu, J. Chem. Inf. Comput. Sci., 36, 173-184 (1996).
[10] H. Satoh, Kagaku Jyouhougaku, Maruzen, Tokyo, Japan (2003).
[11] D. A. Pensak, E. J. Corey, In Computer-Assisted Organic Synthesis, ACS Symposium Series 61, American Chemical Society, Washington, DC, USA (1977).
[12] J. Gasteiger, M. G. Hutchings, B. Christoph, L. Gann, C. Hiller, P. Low, M. Marsili, H. Saller, K. Yuki, Topics Current Chem., 137, 19-73 (1987).
[13] K. Funatsu, S. Sasaki, Tetrahedron Comput. Methodol., 1, 27-37 (1988).
[14] K. Funatsu, C. A. DelCarpio, S. Sasaki, Tetrahedron Comput. Methodol., 1, 39-51 (1988).
[15] K. Funatsu, S. Sasaki, AIPHOS, Kyoritsushuppan, Tokyo, Japan (1994).
[16] G. C. Luijkx, F. Rantwijk, H. Bekkum, M. J. Antal, Carbohydrate Research, 272, 191-202 (1995).


Return