\r\n\r\n

データマイニングとオンライン分析処理(OLAP)の違い

データマイニングとオラップは、どちらも一般的なビジネスインテリジェンス(BI)の手法である。ビジネスインテリジェンスとは、ビジネスデータから有用な情報を特定し、抽出するためのコンピュータベースの手法のことである。データマイニングは、大量のデータから興味深いパターンを抽出することを研究するコンピュータサイエンスの一分野である。人工知能、統計学、データベース管理など、さまざまな手法を組み合わせたものである。

データマイニングとOLAP

データマイニングとOLAPは、どちらもビジネスインテリジェンス(BI)の手法として一般的なものである。ビジネスインテリジェンスとは、ビジネスデータから有用な情報を特定し、抽出するためのコンピュータベースの手法のことです。データマイニングは、大量のデータから興味深いパターンを抽出することを研究するコンピュータサイエンスの一分野である。OLAP(online ***ytic processing)は、その名の通り、多次元データベースを照会するための手法をまとめたもので、人工知能、統計、データベース管理など様々な手法が組み合わされている。

データマイニングは、KDD(Knowledge Discovery in Data)とも呼ばれています。前述したように、生データからこれまで知られていなかった興味深い情報を抽出することを研究するコンピュータサイエンスの分野である。特にビジネスなどの分野では、データの急激な増加により、過去数十年の間にパターンの手動抽出が不可能になったと思われたため、データマイニングは大量のデータをビジネスインテリジェンスに変換する非常に重要なツールになっています。例えば、現在、ソーシャルネットワーク分析、不正検知、マーケティングなど様々な用途で利用されています。データマイニングは通常、クラスタリング、分類、回帰、関連付けの4つのタスクを扱う。クラスタリングは、非構造化データから類似のグループを識別することである。分類は、新しいデータに適用できるルールの学習であり、通常、データの前処理、モデル化の設計、学習/特徴の選択、評価/検証の各ステップを含む。回帰とは、データをモデル化する際に誤差を最小化する関数を探索することである。相関とは、変数間の関係を探索することである。データマイニングは、「来年、ウォルマートが高収益を上げるための主要製品はどれか」といった質問に答えるためによく使われます。

OLAPは、多次元クエリ****のためのシステムのクラスです。一般的にOLAPは、マーケティング、予算編成、予測、および同様のアプリケーションに使用されます。もちろん、OLAPに使用されるデータベースは、複雑なオンザフライのクエリを想定し、高速なパフォーマンスを意識して構成されているのは言うまでもない。一般的に、OLAPの出力はマトリックスで表示される。行と列は、クエリの次元で構成される。複数のテーブルを集計してサマリーを得るために使われることが多い。例えば、「ウォルマートの今年の売上は去年と比べてどうなのか?来期の売上見通しは?変化率で見たトレンドの見方は?

  • 2020-10-29 19:32 に公開
  • 閲覧 ( 14 )
  • 分類:IT

あなたが興味を持っているかもしれない記事

匿名者
匿名者

0 件の投稿

作家リスト

  1. admin 0 投稿
  2. 匿名者 0 投稿

おすすめ