(Received: August 27, 2004; Accepted for publication: June 20, 2005; Published on Web: August 31, 2005)
広範囲の化学物質について構造活性相関により化学構造から有害性を高い精度で予測するモデルを開発することを目指して、ニューラルネットワークを用いて発ガン性のデータを解析した。Predictive Toxicology Challenge 2000-2001で公開された454種類の有機化合物についての記述子と発ガン性のデータを用いてニューラルネットワークの学習とテストを行った。分子軌道計算から求まるhomoやlumoなどの軌道エネルギー、分子表面積、log Pなど37種類の記述子について主成分分析を行い、得られた10個の主成分データをニューラルネットワークに入力した。Error-back-propagation法によりニューラルネットワークを学習する際の過学習、over-fitting、局所解などの問題を解決するために、学習回数や中間層ユニット数などの条件を最適化した。モデルの作成に用いなかった化合物を用いて判別テストを行った結果、的中率73.7 %の予測モデルを開発することができた。
キーワード: 構造活性相関, ニューラルネットワーク, 発ガン性予測, 主成分分析, 過学習