Modeling of Events

機械学習入門 第二回(前編)

  • HOME »
  • 機械学習入門 第二回(前編)

人工知能にも先生がいる?「教師あり」と「教師なし」(前編)

第1回の記事では機械学習とは何かについて解説しました。

機械学習は人間のように「ルールを学習し、判断、予測をする」ものである…とご説明しましたが、それではどうやってルールを学習しているのでしょうか?

第2回では、学習方法による機械学習の分類について紹介します。

誰かに教えてもらうのが「教師あり」、自習が「教師なし」

私たちが物事を学ぼうとするとき、誰かに教えてもらう方法が最も一般的ではないでしょうか。たとえば子どもは親に「こっちは犬だよ。」「あっちは猫だよ。」と教えてもらうことを繰り返すことで、次第に犬と猫の区別がついていきます。

一方で、誰にも教えてもらわなくても、犬と猫の容貌や大きさ、鳴き声などを自分で何度も観察することで両者の違いに気がつき、区別をつけられるようになることもあるでしょう。

この場合、子どもはどちらの学習方法においても、「犬とはこういうものである」「猫とはこういうものである」という概念(ルール)を見出しています。

 

前者のように誰かに教えてもらう学習方法を「教師あり学習」、誰にも教えてもらわず自分で学習する方法を「教師なし学習」と呼びます。機械学習は大きくこの2つに分類されます。

 

「教師あり学習」の特徴とは?

誰かに教えてもらう学習方法が「教師あり学習」とご説明しましたが、その特徴は、問題と答えのセットを、何度も繰り返し教えこむという点です。

入力された問題(与えられたデータ)に対して、

➀どういう答え(専門用語で「ラベル」といいます)を出力すれば正解になるのか

を教えます。

するとコンピュータは、ラベルや要素どうしの関連性や方向性を解析し、どういう場合が正解にあたり、どういう場合は不正解にあたるのか思考を繰り返し、最終的に正解/不正解のルールを見出します。

そして将来的に何らかのデータを入力した際には、そのデータが正解/不正解どちらであるか、学習したルールに基づいて予測ができるようになります。

例えば、次の例を見てみましょう。

insects_teacher

 

 

コンピュータに、問題となる生物名とその特徴(要素)、そしてその答え(昆虫/昆虫以外)をセットで教えます。

この画像はチョウで、こういう特徴(白い、3対の脚、2対の翅、住処は野原)を持っていて昆虫、この画像はクモで、こういう特徴(黒い、4対の脚、翅なし、住処は野原)で昆虫ではない…というように。

label_ari

すると、コンピュータは、入力されたデータ(生物名、特徴)を分析します。一方で、どの画像が昆虫/昆虫以外に該当するか(出力情報)も教えられているため、どのような特徴を持った生物が「昆虫」で、どんな特徴を持った画像が「昆虫以外」なのか、両者の違いを見出します。

与えられた要素のうち、どうやら【体節が頭、胸、腹に分かれていて3対の脚、2対の翅を持っているか、それ以外か】がルールになっているようである…と考え出すのです。

一度ルールを見出すことができれば、次にコンピュータにクワガタのデータを入力した場合は、「体節が頭、胸、腹に分かれていて3対の脚、2対の翅」という特徴を捉えて、「昆虫である」と予測するでしょう。

 

ただし、教えられた画像および要素と、ラベル(答え)の組み合わせのサンプルが少なければ、なかなか正確なルールを見出すことができず、正確な予測ができません。無理やり見出したとしても、かなり精度が悪くなるでしょう。

「教師あり学習」では、できるだけ多くのサンプルについて教えることが重要です。

 

また、コンピュータは、サンプルを与えられる度に、見出したルールについてどんどん修正を加えていきます。

当然ながら、いきなり最初から【体節が頭、胸、腹に分かれていて3対の脚、2対の翅】ルールを見出せる訳ではないので、サンプルが少ない最初のうちは間違って、【すみかが野原のものが昆虫、野原でなければ昆虫以外】という誤った認識をしてしまうこともあるでしょう。

そこで次に「すみかが野原ではない」要素を持った画像を与えられ、それが「昆虫である」と教えられれば、【すみかの違い】ルールは間違っていたと学習するのです。

 

こうして予測と学習をどんどん繰り返し、より正確な予測ができるようになっていきます。

 

また、サンプルが多くなればなる程に精度が上がっていきますが、100%判定することは難しいです。

上記の例でいえば、学習を重ねるうちに【体節が頭、胸、腹に分かれていて3対の脚、2対の翅】ルールを見出せたものの、「ハエ(1対の翅)/昆虫」のデータに対しては当てはまりません。より“確からしい”ルールを見出しますが、100%当てはまる訳ではありません。

しかし、人間が行うよりもずっと多くのサンプルについて処理ができ、パラメータ(特徴、要素)が大幅に増えても問題ないでしょう。人力よりも正確な分析を行える点で優れています。

 

後編へ

Facebooktwittergoogle_plusredditpinterestlinkedinmail
PAGETOP
Copyright © Pharma Science Co., Ltd. All Rights Reserved.
Powered by WordPress & BizVektor Theme by Vektor,Inc. technology.