カワセミのまなざし

読者です 読者をやめる 読者になる 読者になる

カワセミのまなざし

清流の中に濁りを見つけ出す

人工知能(AI)進化に不可欠な「ディープラーニング(深層学習)」について ~その最前線~

 f:id:Hatabou:20170515182413j:plain

・記事最新更新日:2017/5/20

直近(5/11)の日経新聞トップに、「ディープラーニングの記事が載っていました。

<記事の要約>

  • 富士フィルムオリンパスが医師らの学会と組み、「内視鏡を使った検査で胃がんなど病気の疑いを人工知能(AI)が自動判別する技術」を2020年にも実用化するとの内容です。
  • 内視鏡医が不足している中、医師が画像を見る手間や時間を減らし、病変の見落としも防ぐことを狙っています。また、受診者の検査や結果の待ち時間が短縮するなど効果も期待できるそうです。
  • AIの判断のもととなる検査画像は大学付属病院など全国32の病院から17年度末までに30万件程度集め、順次増やし、医師の診断結果や患者の既往歴なども加えます。AIは自らが精度を向上させるディープラーニング(深層学習)技術で特徴を学ぶことが出来ます

 

 上記の通り、ディープラーニングは日々新聞を賑わしていますし、とても身近な関心事になりつつあります。しかも、注目度は加速度的です。

これまで人工知能なんて関係ないだろうと思っていた人々の仕事にも、近い将来は関係してくる可能性は十分にあります。そのとき、きちんとした理解がないとビジネスチャンスをものにできないだけでなく、時代の潮流取り残される危険性だってあるのです。

 

何故、ディープラーニングはそれ程までに我々を魅惑するのでしょうか?

それは、ディープラーニング手法を用いた人工知能が、我々人間世界を一変する力を持っているからです。

「シンギュラリティ」という言葉を覚えていますか。

2月に書いた記事の中でストーリータッチ風に詳しく説明していますが、ディープラーニング手法を駆使して技術進歩した人口知能が、2045年に人間の知能を越え、新しい知能が誕生する、その不連続な世界のスタートを「シンギュラリティ(=技術的特異点)」といいます。

「シンギュラリティ」はSF世界の絵空事ではありません。ディープラーニングはその実現を後押しするパワーを持ち合わせているのです

 

hatabou.hatenablog.com

 

ディープラーニングの最前線について説明する前に

人工知能(AI)とは何なのか、そしてディープラーニングとは何なのか出来るだけ、短く分かりやすく説明したいと思います。

 人工知能とは

  1. 「知的な情報処理をするもの、またはその技術」のことを言います。
  2. 「知的な情報処理」とは、「同じコンピューターでも、足し算をしたり画像を白黒に変換したりするといった処理ではなく、画像に何が映っているかを当てるような処理をする場合、知的な情報処理をしていると感じる、何らかの“知的そうな”処理」のことです。
  3. AIとも呼ばれ、「Artificial Intelligence」の略です。

 

人工知能の技術進歩

 第1次人工知能ブーム

1950年代に起こりました。

専門家が持つ経験則をベースに展開して、人の知的作業を支援するもので、「チェスを指すコンピュータ」や「数学の定理証明をする」ものでした。

第2次人工知能ブーム

1980年代に起こりました。

統計・探索モデルによって最適解を見つけるもので、「感染病診断治療支援システム」など医学上の支援システムの開発が主でした。

この頃、「機械学習」の研究が始まりました。(詳細後述)

第3次人工知能ブーム

2000年代に起こりました。

機械学習の中で「ディープラーニング」手法を用いた研究が進み、飛躍的に人工知能の能力が向上しました。

 

機械学習とは

機械が答えを出すための手法を、人間がプログラムとして与えるのではなく、機械が自動的に膨大なデータから学習してモデルを作るのが機械学習」です。機械学習では人間がプログラムを書くときのように、「どのような条件のときに、どのような答えが導き出されるか」といったことはわかりません。機械の中で、入力に対して正しい答えが導き出されるような“モデル”が自動的に作られるだけです。

この手法が生まれた要因は、「ニューラルネットワーク」との連携が大きいです。

ニューラルネットワーク」とは

人間の脳神経回路を真似することによって、データを人間と同じように分類しようとする仕組みです。

第2次人口知能ブームの頃は、「入力」「中間」「出力」の3層程度しかシミュレーションできませんでした。したがって、より人間に近い、人間を超える性能を発揮するという視点からは限界に至り、しばらく冬の時代になりました。

 

ディープラーニングとは

冬の時代を乗り越えたものが、「ディープラーニング」という手法の誕生です。

ディープラーニング」は「機械学習」の1分野ですが、「ニューラルネットワーク」の階層を4層、5層と増やし、精度の高い「機械学習」を可能にしたもので、「深層学習」とも呼ばれています。

f:id:Hatabou:20170515182505p:plain

誕生した大きな要因は

  1. 技術発展により、膨大な量のデータ(ビッグデータ)を収集蓄積できるネットワーク環境が整ったこと
  2. コンピューターの性能が飛躍的に向上したことです。

 

 ディープラーニングの現状と将来とは

 <その現状>

画像認識人口知能」が誕生しました。例えば、猫の画像を1,000万枚見せただけで、誰に教わることもなく、一週間で猫がどういうものか(=概念)を学習・理解するのです。この概念に「猫(単語)」をヒモ付けすれば、画像を見せるだけで「これは猫です」と答えることが出来ます。

これまでの「機械学習」では、こんな高度の自学自習は不可能でした。人間が教育する必要があったからです。 

 <その将来>

眼をもった機械・ロボットの誕生

市場規模や課題から分析すると、以下3つの機械・ロボットが生まれる可能性が高くなります。

農業:トマト収穫ロボット

  • トマトは市場規模も大きく、収穫の回数も多いです。
  • 現状の技術でトマトの認識ができます。上手にもぎ取ることもできます。
  • 先進的な考えを持つ農場から試し導入。

建設業:自動溶接ロボット

  • 建設の工程(例えば溶接)を自動化します。
  • 現状の技術で、溶接面の状態を認識できます。上手に溶接することも可能。機械を当てれば熟練した人でなくても、熟練の人のような溶接が出来ます。
  • 一部の建設現場から試験導入。

食品加工業:食洗器にお皿を入れるロボット

  • 食品加工に関わる仕事、まずは食洗器にお皿を入れることを自動化します。
  • 現状の技術で、お皿の位置、把持位置の認識ができます。まずは、食器が下げられたところから食洗器に入れるところを自動化します(混雑時に重要)
  • ファミレス等の一部店舗で試験導入。

 

最後に

いかがでしたか。「ディープラーニング」のイメージが少しでも理解して頂けたでしょうか?

この人工知能の手法は、「画像認識」のほか「音声認識」や「言語認識」にも活用が進んでおり、「自動運転」や「外科手術」等にも応用されるようになると思います。

そうして、2045年の「シンギュラリティ」を迎えるのだと思います。

精神的にも物理的にも豊かな世界が待ち受けていることを切に願うばかりです。

 

 Googleが年内を目途に、日本語に対応した「会話型AIを搭載したスマートスピーカー」を発売すると発表しました。(2017/5/17) 

f:id:Hatabou:20170520234030j:plain

 

スマートスピーカーは居間や台所に置き、利用者が話かけることで主に以下のタスクを行う機器です。

  • 音楽を再生(Google Play MusicSpotifyYouTube Musicなど)
  • スケジュールの管理
  • 家電製品を声だけで操作
  • 知りたいことを教えてもらう等(検索機能)

Googleがすでに開発して、スマートフォンに搭載している会話型「グーグルアシスタント」を応用した製品で「Google Home」と呼ばれています。

グーグルのピチャイCEOによる説明では、「深層学習」を採用した結果、「音声認識」能力が飛躍的に向上し、同社のAIが人間の言葉(英語)を聞き間違える確率は1年弱で8.5%から4.9%に下がり、最大で6人の声を聴き分けることが出来るようになったそうです。

キーボードやタッチパネルにも触る必要のない「ハンズフリー」の操作を実現する会話型AIの応用範囲はますます拡大していくと期待されています。

 

「深層学習」手法を使った技術革新は日進月歩ですね。

これからも、出来るだけ新しい話題を拾って行きたいと思います。