
Figure 1. Observation points in Seoul (Table 1).
2008年4月13,14日に我々がデジタル粉塵計で観測した31地点の観測データをTable 1に示す。左から測定点の相対的なx、y座標とz座標すなわち観測値である。Figure 1に測定点を示した。図中の番号はTable 1の番号に対応している。
極大点が複数ある多峰性関数で値の変化が急激な場合、階層型神経回路網を用いたデータ補間は信頼性に欠けることが知られている。しかし今回注目している環境汚染物質であるSPMの分布は、極端な多峰性ではなく緩やかな変化を示す。このため、階層型神経回路網を用いた解析が有効であると考えられる。また、多峰性関数において値の変化が緩やかであったとしても、データの欠損がある場合には一般に補間法の適用は困難であるが、CQSARを用い、欠損データを補ってフィッティングを行うことにより、通常の階層型神経回路網による関数フィットと同等の解析結果が得られる。
| X | Y | Z | |
|---|---|---|---|
| 1 | 31.33 | 34.99 | 111.54 |
| 2 | 31.33 | 50.80 | 107.47 |
| 3 | 36.88 | 81.03 | 72.90 |
| 4 | 37.68 | 63.44 | 98.73 |
| 5 | 39.46 | 88.14 | 74.36 |
| 6 | 45.41 | 94.27 | 69.09 |
| 7 | 51.56 | 66.41 | 106.57 |
| 8 | 56.32 | 76.49 | 77.30 |
| 9 | 61.47 | 65.81 | 88.88 |
| 10 | 62.86 | 56.13 | 106.47 |
| 11 | 62.86 | 70.56 | 113.18 |
| 12 | 64.05 | 67.99 | 91.26 |
| 13 | 64.84 | 40.92 | 104.25 |
| 14 | 65.64 | 26.89 | 83.79 |
| 15 | 66.03 | 71.94 | 116.33 |
| 16 | 74.16 | 41.31 | 65.37 |
| 17 | 75.55 | 75.10 | 100.38 |
| 18 | 77.93 | 71.94 | 120.02 |
| 19 | 78.33 | 35.98 | 77.76 |
| 20 | 79.32 | 59.10 | 125.48 |
| 21 | 86.06 | 69.37 | 105.18 |
| 22 | 89.04 | 89.13 | 105.44 |
| 23 | 91.61 | 40.92 | 95.69 |
| 24 | 94.39 | 33.80 | 112.23 |
| 25 | 97.17 | 94.66 | 130.71 |
| 26 | 100.14 | 58.31 | 102.50 |
| 27 | 103.51 | 66.80 | 66.46 |
| 28 | 112.04 | 45.07 | 98.76 |
| 29 | 112.24 | 31.43 | 148.21 |
| 30 | 120.76 | 57.91 | 57.16 |
| 31 | 123.14 | 23.72 | 95.11 |
今回は環境汚染物質のような、なだらかな変化を見るために、巾関数へのフィッテイングで低次の関数を用いる事に習い、学習はニューロン間結合強度消去操作により神経回路網構造を最小化する再構築学習法reconstruction learning [3]を用いた。
CQSERで用いた階層型ニューラルネットワークの構造は、3層であり、中間層のニューロン数は再構築学習法によって最小化された。中間層ニューロン数は3であった。
31点の教師データの学習によってCQSARを用いて補間する点は、31.3<= x <=121.3 および 23.7<= y <=93.7の範囲でそれぞれ10.0おきに合計80点、さらにx = 123.1の8点、y = 95.7の10点を加えた、合計98点である。

Figure 2. Contour map drawn by conventional method using only observed data
教師データの分布とそれらから通常の方法である与えられた点のみを用いたもっとも単純な非格子三角法(Bi-Linear法)で作成した分布図をFigure 2に示す。点間の補間は直線補間である。この図からは中央、右下、右上にSPMの濃い領域があることが伺える。特に右下の濃度が高い。また中央右と下にSPM濃度の低い領域があり、左上にも、SPM濃度の低い領域がある。
Figure 3に教師データの3次元表示として計算機に取り込んだ地図上に等高線を描くことが可能な等高線作画プログラムContourMap97.xla [4]で作成したSPMの分布図を示した。

Figure 3. Contour map drawn by ContourMap97.xla [4] using only observed data
ここで用いている等高線描画方法は、プログラム作成者の早狩によれば「パソコンの能力の低かった時代に、スプライン法の代わりとなる簡便法としてよく用いられていたもの」である。
早狩のアルゴリズムを直感的に説明する。まず与えられた観測点にそのデータの高さの棒を立て、それ以外の点はバックグラウンドデータで埋め尽くしておく。次に観測点はそのままにしてそれ以外の全地点を周囲の値を元に補間する。この時の補間法は、例えば、そのデータの東西南北に接する地点のデータはウェイト3として、斜めに接する地点は2、東西南北の外側を1というウェイトで足し込んで、それらの平均を取るというような方法である。すると、1回目は観測点の周りだけが持ち上がり、それを繰り返すと次第にあたかも棒の上に厚めの布を被せたような形ができあがる。この反復を繰り返し反復毎の全地点の変形具合が閾値を下回ると反復を終了する。この方法は、観測地点の値は保持されることと、観測点が少ないと独立峰ができやすいという特徴がある。そのため、観測点は多いほど良好である。早狩は、これを簡易スプライン法と呼んでいるが正式な呼称ではないとのことである。
等高線を結ぶ方法は、上記方法で格子点の値が決まると、等高線を引く値を通るグリッドの1マスを探し、その値がそのマスのどの辺から入るか探した後、そこから他の3辺の内どれを横切るかを探索する。 それがわかればそのマスを横切る直線を描くことができる。 次に出口の辺で接する隣のマスについて次の3辺を探す。それを繰り返して次々と直線を結んでいくと等高線の曲線になる。このような直線の集合体の場合、できあがった図はすごく重いものになり、図をスクロールするだけでも時間がかかってしまうので、使い物にならない。そこで、実際のプログラムでは交点を結ぶ曲線を、Excelの標準描画作成機能で描いている。
このアルゴリズムでは補外はできないので、Figure 3では、外周の観測点の近傍までは許容するとして,観測点から遠い部分をマスクしてある。図中円状の閉曲線が多いのは観測点が少なくかつ分布が偏在しているからである。
この分布図では、ソウル地下鉄環状線にそって繁華街がありそこでの汚染が大となっているといった印象が得られる。
| est | obs. | Dabs. | D% | |
|---|---|---|---|---|
| 1 | 116.88 | 111.54 | 5.35 | 4.57 |
| 2 | 106.87 | 107.47 | 0.60 | 0.56 |
| 3 | 75.52 | 72.90 | 2.62 | 3.47 |
| 4 | 98.38 | 98.73 | 0.35 | 0.36 |
| 5 | 70.65 | 74.36 | 3.71 | 5.25 |
| 6 | 70.82 | 69.09 | 1.73 | 2.44 |
| 7 | 89.79 | 106.57 | 16.78 | 18.69 |
| 8 | 87.61 | 77.30 | 10.31 | 11.77 |
| 9 | 100.92 | 88.88 | 12.04 | 11.93 |
| 10 | 107.86 | 106.47 | 1.40 | 1.30 |
| 11 | 99.33 | 113.18 | 13.86 | 13.95 |
| 12 | 102.26 | 91.26 | 11.01 | 10.76 |
| 13 | 105.65 | 104.25 | 1.39 | 1.32 |
| 14 | 87.18 | 83.79 | 3.39 | 3.89 |
| 15 | 101.88 | 116.33 | 14.45 | 14.18 |
| 16 | 68.79 | 65.37 | 3.42 | 4.97 |
| 17 | 109.04 | 100.38 | 8.65 | 7.94 |
| 18 | 112.03 | 120.02 | 7.99 | 7.13 |
| 19 | 72.56 | 77.76 | 5.20 | 7.16 |
| 20 | 115.48 | 125.48 | 9.99 | 8.65 |
| 21 | 116.50 | 105.18 | 11.32 | 9.72 |
| 22 | 112.86 | 105.44 | 7.43 | 6.58 |
| 23 | 74.77 | 95.69 | 20.93 | 27.99 |
| 24 | 105.55 | 112.23 | 6.68 | 6.33 |
| 25 | 115.56 | 130.71 | 15.14 | 13.11 |
| 26 | 70.30 | 102.50 | 32.20 | 45.80 |
| 27 | 70.50 | 66.46 | 4.05 | 5.74 |
| 28 | 92.93 | 98.76 | 5.82 | 6.27 |
| 29 | 110.00 | 148.21 | 38.21 | 34.73 |
| 30 | 71.18 | 57.16 | 14.02 | 19.70 |
| 31 | 109.74 | 95.11 | 14.62 | 13.33 |
| aver. | 9.83 | 10.63 |
23, 26, 29番目の3つの観測点での25 %以上の大きなエラーの原因は不明である。ただNo.23, 26は変位ベクトルが小さく、No.29は逆に大きい。これをなだらかにつなぐよう(つじつまを合わせるように)アルゴリズムが補間を行うために、これら3点で無理が生じた可能性がある。補間方法の改良の余地があることがわかる。

Figure 4. Distribution of estimated data and map
Figure 4(と, 3)とは印象がだいぶ違う。特に左下にSPMの濃い領域が存在する。補間したデータを使うことにより、Figure 3に見られるような測定点が特に強調されることもなく、なだらかな分布図が得られている。
Figure 2(と, 3)では、図右下(測定点24, 29)と中央部(測定点18, 20)、および右上(測定点25)にSPMの分布が多い領域があり、それらは独立している。ところがFigure 4では、ソウル市南西の環状線に沿った繁華街(測定点1,2,3近傍)から測定点22, 25の北東の方向に帯状にSPMの分布が多い領域があり、それに平行に繁華街の東側の測定点14, 16から北東の測定点26, 27に向かって帯状にSPM濃度の低い領域があることが判る。
Figure 2(と, 3)、および4のどちらの分布が妥当であるかは、測定点の数を大幅に増やす等、より詳細な観測を行なって確かめる必要があるが、現状ではそのような測定は不可能である。ここに環境データ測定の難しさがある。
計算機に取り込んだ地図上に等高線描画する等高線描画プログラムContourMap97.xlaを提供してくださった早狩 進氏に深く感謝する。本研究の一部は、地球環境研究総合推進費 H19地球環境研究革新型研究課題 代表:神部順子、および(財)鉄鋼業環境保全技術開発基金(FY2007)代表:中山栄子の補助を受けている。