代表的な機械学習アルゴリズム

機械学習

機械学習は、コンピューターがデータから物事を学習するので、その学習方法に応じて、教師あり学習・教師なし学習・半教師あり学習・強化学習などに分類することができる。教師あり学習は、データとそのラベルを同時にコンピューターに与えて、学習を進めている。回帰、サポートベクトルマシン、決定木やニューラルネットワークなどは、教師あり学習に分類される。教師なし学習は、ラベル情報のないデータをコンピューターに与えて、学習を進めている。コンピューターは学習を通して、データに隠された特徴などを抽出できるようになる。主成分分析やクラスタリングなどが教師なし学習に分類される。強化学習は、人が自らの経験から学び、様々なのことを覚えていくことを真似た学習方法である。Alpha GO や自動運転などが強化学習によって作られたモデルである。

機械学習の種類

教師あり学習

教師あり学習では、学習データ 1 つ 1 つに対してラベルをつけて、コンピューターにデータの特徴とラベルを同時に学習させて、その中から各ラベルの規則性を学ぶ学習手法である。教師あり学習では、学習データすべてに対してラベルをつける必要があるので、データの準備が大変であるが、学習効果が高い。

教師あり学習が適用できる問題として回帰問題と判別問題(分類問題)がある。回帰問題として、例えば、3 月から 4 月にかけて平均気温が高いと小麦の収量も高くなるとき、その平均気温と収量の間の関係を導くことである。このように導けた平均気温と収量の関係(モデル)を使うことで、次年度の 3 月から 4 月の平均気温で、小麦の収量を予測できるようになる。

判別問題(分類問題)として、例えば、犬の写真と猫の写真をコンピューターに与えて、コンピューター自身に犬の特徴と猫の特徴を写真から学習させる。学習して得られたモデルに、新しい写真を与えることで、その写真に写っているのは犬か猫かを判別できる。

教師なし学習

教師なし学習は、ラベルのないデータをコンピューターに学習させる方法である。特徴の似たデータ同士をまとめたりする際の、クラスタリング手法として使われている。

強化学習

人が自らの経験から学び、様々なのことを覚えていくことを真似た学習方法である。別な言い方をすれば、コンピューターに、試行錯誤を通じて、利益が最大となるような行動を学習させる。自律型ロボットの研究、価格決定、消費者信用の予測などの分野で利用されている。