1. 機械学習・データサイエンス(概要)

ここでは主に機械学習・データサイエンスについて整理する。

機械学習とデータサイエンスは何が共通していて何が異なるのかについては一流の研究者に聞いても見解が分かれるだろう。この見解の相違が生む諍いは人生や科学の発展という大局的な視点から見て非常に小さく無意味なものであるから私は関わりたくはない。

一方で私がこの区別を曖昧にしてしまうと読者にとっての大きな混乱のもとになるから、私が本書において機械学習とデータサイエンスをどう区別しているかについては述べなければならない。

本書においては、データを対象として扱う学問の分野をデータサイエンス (data science) と呼ぶ。機械学習 (machine learning) は、かつてパターン認識 (pattern recognition) と呼ばれたデータサイエンスの一分野が時代の流行で改名されたものとしておく。

つまり機械学習はデータサイエンスで扱われる対象のうちで、ある特定の一部の問題を取り扱う分野であると解釈する。この解釈にしたがい、本書では「機械学習」の項目に、よく機械学習の教科書や参考書で扱われる

  1. 回帰問題

  2. 分類問題

  3. 強化学習

  4. ニューラルネットワーク

を置き、「データサイエンス」の項目には

  1. データの前処理でよく使われる手法

  2. 信号処理の分野に近しい手法

  3. レコメンデーション等で使われる技術

  4. その他の手法

を配置した。

機械学習でニューラルネットワークのトピックを分けたのは

  • ニューラルネットワークが万能でどの手法にも応用が存在すること

  • ニューラルネットワークには他の分野で通用しない特殊なテクニックが多々存在し、またそのテクニック自体も世界中で研究されている最中であること

を理由としている。

Last updated