欠測データ集合を扱う神経回路網法CQSAR:
Compensation Quantitative Structure-Activity Relationshipsの開発

青山 智夫a*, 神部 順子b, 長嶋 雲兵c, 梅野 英典d

a宮崎大学工学部, 〒889-2192 宮崎市学園木花台西1-1
b江戸川大学メディアコミュニケーション学部, 〒270-0198 流山市駒木474
c産業技術総合研究所計算科学研究部門, 〒305-8568つくば市梅園1-1-1
d熊本大学工学部, 〒860-8555熊本市黒髪2-39-1

(Received: May 28, 2007; Accepted for publication: June 28, 2007; Published on Web: September 27, 2007)

  階層型神経回路網は因果関係が不明な現象の多変量解析に用いられる.主な用途は薬理活性解析,環境問題解析などである.しかし,それらには欠測問題が存在する.多変量解析を行う場合、データの欠測は単に欠測を含む説明変数の削除による説明変数の減少に止まらず,複数の説明変数の中の一変数の部分的欠測がそのデータの組を棄却することで、値が存在する他の説明変数の該当部分を使用不可にし、情報の減少を引き起こす.本論文では,欠測率約50%までの欠測部を補完し多変量解析を可能にする神経回路網を用いた新手法CQSARを提案した.
  CQSAR処理の第1段は欠測部を各説明変数,対象現象の観測値を独立に補完することである.補完法の選択は観測数に依存し,観測値の分布と不連続点の有無に関係する.それぞれの状況に応じた可変絶対値関数法,過去の測定データを関数の離散表現としてパラメータを付加した観測ベクトル補完法を提案した.さらに神経回路網と等差数列を使う補完法を示し,観測数7以上での補完値の妥当性と,11点以上では偏微分値も求められることを数値実験で示した.
  CQSAR処理の第2段は完全化したデータの神経回路網QSARである.第一段の補完誤差がQSAR結果に与える影響も考察した.QSAR用の神経回路網学習ではsimulated annealing操作が必要である.一般的なback propagation学習よりもreconstruction learningが推奨できる.Reconstruction learningのニューロン間結合強度消去操作の複数表現を示した.第1,第2手段を通しての欠測補完率は最大50%であった.

キーワード: Incomplete data set, Multi-layer Neural Network, Derivative of neural networks, QSAR


Abstract in English

Text in Japanese

PDF file(699kB)


Return