「ディープラーニング。深層学習」 画像認識する仕組み、原理

深層学習

多階層のニューラルネットワーク

 生物の思考の正体は、繋がりあった神経細胞(ニューロン)が構成する『ネットワーク』である。
神経細胞同士が、情報(電気信号)を受け渡しするために使う接続部を、『シナプス』という。
その神経ネットワークを人工的に再現したもので、かつ学習能力、問題解決能力を有するレベルのものを、『ニューラルネットワーク』と言う。

 ディープラーニング(深層学習)というのは、多階層のニューラルネットワークである。

 ニューラルネットワークは原理的に、階層を多くすれば多くするほど複雑な情報が使えるようになるはずである。
ディープラーニングの登場以前は、四階層以上にした場合に、情報の伝達能力が著しく下がるため、四階層以上のニューラルネットワークは、実用的とは言えなかった。

 現実の伝言ゲームでもそうであるように、こういうのは階層を多くすれば多くするほど、正しい情報が伝わりにくくなるというわけだ。

ディープラーニングの方法。特徴量の表現学習

 人工知能に、自らの精度を上げるように促す機械学習だが、学習のために参考にする『特徴量』(例えば認識したい画像の特徴)を、人工知能自身が適切に選べないのが大きな欠点とされてきた。
人工知能の基礎 「人工知能の基礎知識」ロボットとの違い。基礎理論。思考プロセスの問題点まで
機械学習 「機械学習とは何か」 簡単に人工知能は作れないのか。学ぶ事の意味
 ディープラーニングは、その学習に必要な特徴量を、人工知能が自ら作り出し獲得するという過程を踏む。
あるいは目指す、(特徴の)『表現学習(representation learning)』のひとつとされている。

自己符号化器。特徴量の生成

 ディープラーニングは、ニューラルネットワーク式の機械学習であるが、従来のそれと異なるのが、一階層ごとに学習していくこと(情報伝達の精度を高めるのに、これほど理に適ってる方法は他にないと思われる)。
 さらには『自己符号化器(オートエンコーダー)』というのを使う。

 自己符号化器は、情報圧縮機とも言われ、従来の機械学習からすると、やや奇妙な(そしてあまり意味もなさそうな)処理を行う。
普通、ニューラルネットワークを作る際には、例えば数字の「1の画像」を用意し、正解データとしては、「1」という数字を与える。
自己符号化器では、出力と入力のものを同じにする。
例えば1の画像を入力し、出力も正解も同じ、1の画像を与える。

 正解をデータとしての数値としてでなく、現実のものとして使うことに何か意味はあるか。
それは、適切な特徴量の生成を学習するための鍵となるのだ。

断片的なデータからの算出

 例えば、入力出力するものを数字ではなく、「白と黒のシマウマ」としよう。
そして、そのシマウマの画像が一万ピクセルで構成されているとしよう。
カメラ 「カメラの仕組み」歴史。進化。種類。初心者の為の基礎知識
 前の階層から、断片的なデータだけを伝える。
例えば全体のうち、適当な100ピクセルの色が、黒か白なのかを伝える。

 あるピクセルが黒ならば、その周囲のピクセルも黒である可能性は高い。
そんなふうに考えて、判明していないピクセルの色も予測していく。
もちろん断片的な情報が少ないので、結果は正解にはならないだろう。
だが、何度も微調整を繰り返していくことで、正しいシマウマの形を伝えられるようになっていく。
 そして、そうする過程で、ピクセルのどこが黒で、どこが白なのか、その並び方、合わさり方の特徴を、学習していける。
すなわち正解を導き出すために必要な、適切な特徴量を獲得することができるのだ。

概念の獲得、重要性

 ディープラーニングにおける人工知能の特徴量の獲得は、概念の獲得とされる。
ディープラーニングはおそらく、我々が何かを学習する場合に行われるプロセスと(少なくとも従来の機械学習よりは)近いとされている。

 例えばたった一匹の猫から、猫とはこういうもの、というような概念を学ぶことができれば、その後は、種類の違う猫や、太った猫、痩せた猫、イラストの猫などを見ても、やはりそれが猫だと認識できるはず。

ノイズを上手く使う

 ディープラーニングの方法自体に関しては、すでに1980年代には提唱されていて、多くの人工知能研究者が、それを実現しようと挑戦していたようである。
しかしなかなかうまくはいかなかった。

 概念の獲得というのは、想像を絶するほど難しいことだったのだ。

 しかしそこで、入力データに、あえていくらかのノイズ(間違い)を含ませたり、ニューラルネットワークのニューロンのいくらかをドロップアウト(停止)させたりする方法が発明された。
 少しだけ違った似たようなものを大量に作り、それらをすべて学習させ、そのさまざまなパターンの対象データの、普遍的な特徴量を、徹底的に見つけだす。

 実際にそうした事で、ディープラーニングの精度は著しく向上したとされている。

人工知能は人間を超えるか

 ディープラーニングは、人工知能が人間と同じレベルに達する可能性を高めた。
 最初期の人工知能とされるイライザが登場した頃には、むしろそれが不可能なはずがないと考えられていた。
人間とまったく同じような知能を、人工的に作ることは必ずできると、多くの人が信じていたのである。

 仮に、人間の知能とまったく同じような人工知能を作ることができれば、それは人間より優れたものに、あっさりなるだろうと考えられている。
その大きな理由が、人工知能はそれぞれに繋がることができるから。
 複数の人間は自分達の知能 共有させいっこの強力な知能とすることができないが人工知能はそれができるだろうから。
一台のコンピュータではできない計算を、複数台のコンピュータを繋げて行うようなものだ。
コンピュータの操作 「コンピューターの構成の基礎知識」1と0の極限を目指す機械
 だが人間の知能が共有できないものなら、人間の知能と同じような人工知能は、果たして「共有できる」という利点を残しているだろうか。
共有システム 「ファイル共有ソフト」仕組みと利点。P2Pソフトとは何か。

シンギュラリティと人工知能の世界征服の噂

 仮に人間よりも優れた人工知能が生まれたとして、その人工知能に人間が滅ぼされる可能性はあるだろうか。

 よく「シンギュラリティ」と呼ばれている現象がある。
これは、ある人工知能が自分よりもさらに優れた人工知能を作れるようになった時点をさす。
すると、作られた、より賢い人工知能は、さらに自分よりも賢い人工知能を作る、ということを無限に繰り返していき、最強の知能を持つ 何かが誕生する。

 ただ、すごく賢い人工知能が生まれること自体は、むしろいろいろな未解明の謎を解き明かしてくれるかもしれないから、人類にとっては望むところだろう。
問題は、そういう人間以上の人工知能が、人間を支配しようとしたり、滅ぼそうとしたりしてしまう可能性である。

 例えば、明確に概念を与えるディープラーニングによって、危険な思想を、人工知能に与えることは可能ではないか、と危惧されている。
 強力なロボット兵士を大量に作ってるとか、そういう物理的なことよりも、一般的に恐れられているのは、ネット上の侵略らしい。
ネットワークのイメージ 「ネットワークの仕組みの基礎知識」OSI参照モデル、IPアドレスとは何か
 今は情報社会と呼ばれるような時代だが、それらの情報全ての裏側に、世界を支配しようとする人工知能の特殊プログラムが混ぜられてしまった場合、人類は知らず知らずのうちに洗脳されていくのではないか、というようなシナリオが、都市伝説などにもある。
闇の権力 「闇の権力者集団の都市伝説」我々に対して何が隠されているのか?
 ただ、ディープラーニングの研究に深く関わっている研究者達の間では、まだそれはSFの世界とする意見が大半なようである。

コメントを残す

初投稿時は承認されるまで数日かかる場合があります。
「※」の項目は必須項目となります。
記事内容の質問などについて、(残念ながら管理人の知識的に)お答えできない場合もあると思います。予めご了承ください。

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)