\r\n\r\n
データマイニングと機械学習は、密接に関連した2つの分野である。親族としては似ているが、親が違う。しかし、現在、両者はますます似てきており、まるで双子のようです。その結果、データマイニングに機械学習を利用する人も出てきました。しかし、この記事を読むと、機械語とデータマイニングは違うということがわかります。データマイニングが既存のデータからルールを導き出すのに対し、機械学習は与えられたルールを学習し理解するようコンピューターに教えるという点が大きな違いです。
データマイニングは、データから、これまで知られていなかった潜在的に有用な情報を抽出するプロセスである。データマイニングというと新しく聞こえるかもしれませんが、その技術は決して新しいものではありません。データマイニングは、大規模なデータセットにおけるパターン計算開示の主要な手法である。また、機械学習、人工知能、統計学、データベースシステムなどが交錯しています。データマイニングの分野では、データベースとデータ管理、データの前処理、推論に関する考察、複雑性に関する考察、発見構造の後処理、オンラインアップデートなどが含まれます。データマイニング、データフィッシング、データスヌーピングは、データマイニングで使われるより一般的な用語である。
今日、企業は長年にわたり、大量のデータを調べたり、市場調査レポートを分析したりするために、強力なコンピュータを使用してきました。データマイニングは、これらの企業が内部要因(価格、スタッフのスキルなど)と外部要因(競合、経済状況、顧客属性など)の関係を特定するのに役立つ。
CRISPデータマイニングプロセス図
機械学習は、データマイニングと非常によく似たコンピュータサイエンスの一分野である。また、機械学習は、システムのパターン探索やアルゴリズムの構築・学習の探求にも利用されている。機械学習とは、コンピュータに明示的にプログラムすることなく学習する能力を提供する人工知能の一種である。機械学習の主な目的は、新しい状況に応じて成長・変化するよう自己学習するコンピュータ・プログラムを開発することであり、計算統計学に実に近いものである。また、数学的最適化との関連も強い。機械学習の代表的な応用例としては、スパムフィルタリング、光学式文字認識、検索エンジンなどがある。
機械学習の応用としての自動化されたオンラインアシスタント
機械学習とデータマイニングは、サイコロの目のように似ているため、時として相反することがある。機械学習の課題は、通常、教師あり学習、教師なし学習、強化学習の3つに大別される。
データマイニング:データマイニングとは、一見すると構造化されていないデータから、興味深いパターンを見つけ出すプロセスである。
機械学習:機械学習には多くのアルゴリズムが使われている。
データマイニング:データマイニングは、あらゆるデータウェアハウスからデータを抽出するために使用されます。
機械学習:機械学習とは、システムソフトウェアに関連して機械を読み解くことです。
データマイニング:データマイニングは、主に特定分野のデータを利用する。
機械学習:機械学習の技術は非常に一般的であり、様々な場面で応用することができる。
データマイニング:データマイニングのコミュニティは、アルゴリズムとアプリケーションに焦点を当てています。
機械学習:機械学習のコミュニティは、理論的にはもっと支払われている。
データマイニング:データマイニングは、データからルールを導き出すために使用される。
機械学習:機械学習は、与えられたルールを学習し理解することをコンピュータに教える。
データマイニング:データマイニングは、機械学習などの手法を用いる学問分野である。
機械学習:機械学習とは、コンピュータに知的作業をさせるための方法です。
概要
機械学習とデータマイニングは全く異なるものですが、似ている部分も多くあります。データマイニングは、大量のデータから隠れたパターンを抽出する作業であり、機械学習はこの目的にも使えるツールである。機械学習の分野は、人工知能の発展とともにさらに進化している。データマイニングを行う人は、通常、機械学習に強い関心を持っています。データマイニングも機械学習も、人工知能の開発・研究の分野では、対等な立場で一緒に取り組んでいます。
画像提供
1.「CRISP-DM Process Diagram" by Kenneth Jensen - Own work.[CC BY-SA 3.0] ウィキメディア・コム***経由
2."Automated online assistant" by Bemidji State University [Public Domain] via Wikimedia Comm***.