Return
Figure 1. Configuration of SpecQC.

Figure 2. Example of NMfile format illustrated using compound 1.
Figure 2に1-Furan-2-ylpropan-1-one (1) を例として用い、データベース(NMfile)の内容を示す。構造情報はMolfile[9] 形式を採用し、それにShift blockとして帰属情報の有る化学シフト値と共鳴周波数、測定溶媒などの付加情報を追加したものである。

Figure 3. Example of HYPER code with up to the sixth sphere.
HYPER code 4:CH3-, 3:CH2<, 2:-CH<, 1:>C<, 1$:>C=O
知識ベースは、その部分構造と対応する化学シフト値との相関表として作成するが、第六スフィアから第一スフィアまでのそれぞれについて作成する。第一スフィアには、データベースの中に存在しない一部の部分構造の化学シフト値の経験値を追補してある。また各相関表は、溶媒種(無極性、極性、芳香族)毎に分類してあり、予測に際して評価するスペクトルの測定条件に応じて、適切なデータを使用する。相関表には各化合物から得られた同じ部分構造のデータを統計処理し、そのフォーカス原子に対応した化学シフトの平均値、標準偏差などを有している。その一例をTable 1に示す。これらの知識ベースを、1H-NMR, H-H COSYスペクトルを予測するシステム"SimCOSY"[10] などに用いている。
Table 1. Example of knowledge base (4 sphere)
| ID No. | Avea) | Cntb) | HYPER code |
|---|---|---|---|
| 3019067 | 2.070 | 6 | 4;1$(O/2/63/ |
| 3019068 | 2.055 | 2 | 4;1$(O/2/64/ |
| 3019069 | 2.163 | 7 | 4;1$(O/3/1$/ |
| 3019070 | 2.074 | 30 | 4;1$(O/3/1/ |
| 3019071 | 2.075 | 14 | 4;1$(O/3/2/ |
| 3019072 | 2.064 | 64 | 4;1$(O/3/3/ |
| 3019073 | 2.039 | 3 | 4;1$(O/3/4/ |
| 3019074 | 2.067 | 11 | 4;1$(O/3/6/ |
| 3019075 | 2.020 | 3 | 4;1$(O/4// |

Figure 4. System flow of SpecQC.
このHYPERコードを用いて、あらかじめ構築した知識ベースを参照し、1H-NMRスペクトルの化学シフト値を予測値として得る。これらの予測された化学シフト値と、抽出された化合物のデータベース中の1H-NMRスペクトル情報の該当する化学シフト値とから評価点(SCORE)を算出する。その評価点からデータの品質を判定して三種のクラス (Family, Neighbor, Stranger) に分類する。 Familyクラスは、構築済みのデータベースに存在する各部分構造と妥当な類似性を有するデータである。Neighborクラスのデータは、若干誤差があり、立体構造の違い、帰属の誤り、入力ミスなどのエラーの存在する可能性がありチェックを必要とするデータである。Strangerクラスでは、データベースのデータと予測値との差が大きく、基本的には採用できないデータである。Neighborクラス、Strangerクラスともに、データベースまたはその出典に戻り、入力ミスなどが明らかであれば修正し、再評価する。これらをデータベース中の全てのデータについて実施する。データベース管理者は、この三種のクラスの内 Neighbor, Strangerクラスのデータのみを詳細に検討し、その品質の妥当性をチェックし、データの修正などにより品質を向上させることが可能となる。以下に詳細を示す。
Table 2. Example of HYPER codes for compound 1
| No. of atoms | HYPER code (4 sphere) a) |
|---|---|
| 1 | 1;=21$O(6,3,6/=&,4,=&// |
| 2 | O;16(=21$,=2/&,3,&/4/ |
| 3 | 1;=O13(,=2O,4/6,6,/=&,=&/ |
| 4 | 2;=16(1$O,=2/3,&,&/4/ |
| 5 | 2;=2O(6,1/=&,=&1$/3/ |
| 6 | 2;=26(O,=1/&,1$&/3/ |
| 7 | O;=1(13/=2O,4/6,6,/ |
| 8 | 3;1$4(1,/=2O/6,6/ |
| 9 | 4;3(1$/1/=2O/ |
Table 3. Predicted 1H-NMR chemical shifts of compound 2
| No. of atom | Calca) | Devb) | CNTc) | Spd) | Obse) | SCORE | HYPER CODE |
|---|---|---|---|---|---|---|---|
| 9 | 0.976 | 0.044 | 30 | 4.0 | 0.95 | 4;2(34/1$,/O/ | |
| 10 | 0.976 | 0.044 | 30 | 4.0 | 0.95 | 4;2(34/1$,/O/ | |
| 1 | 0.982 | 0.079 | 52 | 4.0 | 0.96 | 4;3(3/O/1$/ | |
| 2 | 1.641 | 0.052 | 17 | 4.0 | 1.65 | 3;34(O,/1$/3/ | |
| 8 | 2.059 | 0.166 | 7 | 4.0 | 2.11 | 2;344(1$,,/O/3/ | |
| 6 | 2.175 | 0.010 | 3 | 4.0 | 2.19 | 3;1$2(O,44/3,,/3/ | |
| 3 | 4.053 | 0.073 | 17 | 4.0 | 4.03 | 3;3O(4,1$/,3/2/ | |
| 0.025 |

Table 4. Criteria for classification of data
| Class | Criteria |
|---|---|
| Family | SCORE =< 0.10 |
| Neighbor | 0.10 < SCORE < 0.30 |
| Stranger | 0.30 =< SCORE |
データベースのデータの修正・追加により評価結果の変動する可能性があり、定期的な品質評価が必要である。知識ベースの中には、1件のみの部分構造もある。この場合は統計処理ができないため、正確な検定は困難である。このような事態をできるだけ回避するため、部分構造は最大の6スフィアではなく、4スフィアでの検定を行っている。検定は4スフィア未満でも可能で、評価の対象としての同一部分構造の数を多くすることができる。また、同じ部分構造が多く登録されることにより、化学シフト値が妥当な範囲にまとまり、異常データの検出能力が向上する。
本システムでは、新規データをデータベースに登録するにあたって、最小1件のデータからチェック可能であり、複数データに対してはバッチモードでの評価を可能としている。
Table 5. Results of classification of data
| Evaluation | Total | Family | Neighbor | Stranger | |
|---|---|---|---|---|---|
| First | Data count | 12,837 | 12, 299 | 451 | 87 |
| (%) | 100.00 | 95.81 | 3.51 | 0.68 | |
| Second | Data count | 12,750 | 12,615 | 129 | 6 |
| (%) | 100.00 | 98.94 | 1.01 | 0.05 | |
本検定により、誤りが有ると判明した一部のデータを次に示す。対応する化合物の構造をFigure 5に示した。

Figure 5. Structures with erroneous data in the chemical shifts.
2-Bromo-1,1-diethylethane (3)では、Table 6に示すように、アトム番号5の化学シフト値が、測定されたスペクトルチャートからは3.37 ppmであるのに、数値データでは2.37 ppmと記載されており、植字の誤りと考えられるが、結果的にはデータベースへの入力エラーであった。
Table 6. Example of input error for compound 3
| No. atom | Chemical shift (ppm) | Correct shift | |
|---|---|---|---|
| 1 | 4.68 | ||
| 5 | 2.37 | input error | 3.37 |
| 6 | 3.61 | ||
| 6 | 3.69 | ||
| 7 | 3.61 | ||
| 7 | 3.69 | ||
| 8 | 1.25 | ||
| 9 | 1.25 |
Table 7は、帰属に誤りのある例で、4-Methylpyrimidine (4)でPyrimidine骨格の6位(アトム番号6)と5位(アトム番号5)の帰属が逆になっていた。
Table 8に示す2-Dimethylaminobenzoic acid methyl ester (5)の芳香族環の化学シフト値の内、アトム番号12と13の帰属が、類似化合物のデータとは異なっており、Neighborクラスとして分類されたものであり、これも帰属エラーであると考えられる。
Table 7. Example of assignment error for compound 4
| No. atom | Chemical shift (ppm) | Correct shift | |
|---|---|---|---|
| 3 | 9.12 | ||
| 5 | 8.60 | assignment error | 7.21 |
| 6 | 7.21 | assignment error | 8.60 |
| 7 | 2.56 |
Table 8. Example of assignment error for compound 5
| No. atom | Chemical shift (ppm) | Correct shift | |
|---|---|---|---|
| 7 | 7.55 | ||
| 8 | 6.80 | ||
| 9 | 2.79 | ||
| 10 | 2.79 | ||
| 11 | 3.79 | ||
| 12 | 7.23 | assignment error | 6.73 |
| 13 | 6.73 | assignment error | 7.23 |
Table 9の3-Thiocyanatopropenal (6)では、アルデヒド基に隣接する二重結合メチンCH(アトム番号3)と、それに結合する二重結合メチンCH(アトム番号4)との間の帰属エラーが検出された。
Table 9. Example of assignment error for compound 6
| No. atom | Chemical shift (ppm) | Correct shift | |
|---|---|---|---|
| 3 | 7.38 | assignment error | 6.84 |
| 4 | 6.84 | assignment error | 7.38 |
| 6 | 9.82 |
9,10-Dimethylanthracene (7)では、Table 10に示すようにα位とβ位の帰属の誤りで、Strangerクラスで見出されたものである。
Table 11のPerylene (8)ではアトム番号9、10と11、12は同じ化学シフト値と期待され、また、アトム番号13、14と15、16は同じ化学シフト値と期待されるにもかかわらず、その化学シフト値は異なっている。これは、アトム番号9、10と15、16の帰属が入れ替わったためと考えられる。
Table 10. Example of assignment error for compound 7
| No. atom | Chemical shift (ppm) | Correct shift | |
|---|---|---|---|
| 7 | 3.09 | ||
| 8 | 3.09 | ||
| 9 | 7.50 | assignment error | 8.33 |
| 10 | 7.50 | assignment error | 8.33 |
| 11 | 7.50 | assignment error | 8.33 |
| 12 | 7.50 | assignment error | 8.33 |
| 13 | 8.33 | assignment error | 7.50 |
| 14 | 8.33 | assignment error | 7.50 |
| 15 | 8.33 | assignment error | 7.50 |
| 16 | 8.33 | assignment error | 7.50 |
Table 11. Example of assignment error for compound 8
| No. atom | Chemical shift (ppm) | Correct shift | |
|---|---|---|---|
| 9 | 7.48 | assignment error | 8.19 |
| 10 | 7.48 | assignment error | 8.19 |
| 11 | 8.19 | ||
| 12 | 8.19 | ||
| 13 | 7.48 | ||
| 14 | 7.48 | ||
| 15 | 8.19 | assignment error | 7.48 |
| 16 | 8.19 | assignment error | 7.48 |
| 17 | 7.66 | ||
| 18 | 7.66 | ||
| 19 | 7.66 | ||
| 20 | 7.66 |
豊橋技術科学大学 船津公人助教授 から、芳香族結合自動認識プログラム「AROMATIC」のソースコードの提供を受け、また本研究に貴重な助言をいただいた、記して謝意を表する。また、住友化学システムサービス 構 克巳氏の協力に感謝する。
Return