DSC02031 (1024x768)廣田幸嗣氏からエッセイ[13] を送っていただきました。

*******************************************************************

人工知能(AI: Artificial Intelligence)の初期の研究では知能の本質を理解するために,単純化した問題(toy-world problems)を主に取り扱っていた。私が人工知能学会の理事を務めていた1993~1994年ころには、注目された割に実利がないことや、知能研究に関する神学論争に嫌気がさし産業界の関心が急速に薄れていた。しかし、積み木の世界を対象としてきた研究が行き詰まり,計算能力の向上もあって最近は現実の困難な問題を対象にするようになった。

データ・マイニング knowledge-discovery in databases や,9月27日のクローズアップ現代で紹介された,人間でなく機械が攻撃判断をする自律注1) 型ロボット兵器の研究などが代表例である。人工知能技術の多くは軍民両用 Dual-use で,軍事技術の自動車へ転用が容易である。

注1)人間の指令で自動的automatic, automatedに動くのではなく,機械が勝手に判断して行動するのが自律autonomousである。

AI 技術の中でも,機械学習(machine learning)は飛躍的に進化している。周知のようにチェスよりも遥かに複雑な将棋でも、プロ棋士を負かすまでに至っている。

進化のおもな要因は、コンピュータの高速化や並列化などの処理速度の向上と、探索の選択肢を減らす枝狩りなどのアルゴリズムの進歩である。コンピュータ将棋のアルゴリズムでは主に、過去のプロの棋譜を参考にした、教師あり学習(supervised learning)が使われている。

教師あり機械学習は、先読みの数や終盤までの体力維持、感情の揺れによるミスの少なさなどで人間より有利であるが、過去に例が少ない局面や今までにない奇手、読みよりは着眼が支配する序盤に弱い。これを克服する手段の一つが、強化学習r(einforcement learning)である。

強化学習では、どのように行動すべきだったかを外部から教師信号として与えない。その代わりに報酬(reward)と呼ばれるスカラー値を内部生成する。人間が試行錯誤をして成功すると,大脳でドーパミンが分泌され快感を得るので、学習の方向づけになる。強化学習はこれと同じように、試行錯誤と報酬を手がかりとして機械学習を進める注2)。

注2) 実際は逆で,脳科学の価値意思決定value-based decision making の理論は,強化学習理論の影響を強く受けた。

インターネットや無線通信網の急速な膨張で、big data が容易に入手可能となってきた。人工知能は、「人生とは何か」というような単純だが奥の深い問題は苦手だが,人間が手に負えない膨大なデータを処理するのに向いているので,big data との「相性」が良い。

先物取引から指名手配犯の捜索までの分野で、知能機械が人間と共同作業をするようになり、やがて人間が不要になるのだろうか?ジョージオーウェルの反ユートピア小説 1984 に,未来の高度管理社会の支配者 Big Brother が登場する。人間ではなく知能機械が,機械仕掛けの神 Deus ex machina にならないことを願う。

アイザック・アシモフは SF 小説において、人間への安全性、命令への服従、自己防衛からなるロボット三原則(Three Laws of Robotics)を提起した。頭の良い intelligent machine を作れても,知性のある intellectual machine は当面無理だ。完全自律型ロボット兵器などを想定した国際知能機械基本法みたいなものが必要になると思う。