\r\n\r\n

データマイニングとデータウェアハウスの違い

データマイニングとデータウェアハウスは、どちらも非常に強力で一般的なデータ分析技術です。統計的な傾向があるユーザーは、データマイニングを利用します。統計モデルを用いて、データの中に隠されたパターンを見つけ出すのである。データマイニングは、異なるデータ要素間の有用な関係を見つけ出し、最終的にビジネスに利益をもたらすことに関心がある。しかし一方で、ビジネスの次元を直接的に分析できるデータ専門家は、データウェアハウスを利用する傾向がある...。

データマイニングとデータウェアハウス

データマイニングとデータウェアハウスは、どちらも非常に強力で一般的なデータ分析技術です。統計的な傾向があるユーザーは、データマイニングを利用します。統計モデルを用いて、データの中に隠されたパターンを見つけ出すのである。データマイニングは、異なるデータ要素間の有用な関係を見つけ出し、最終的にビジネスに利益をもたらすことに関心がある。しかし一方で、ビジネスの次元を直接的に分析できるデータの専門家は、データウェアハウスを使う傾向があります。

データマイニングは、KDD(Knowledge Discovery in Data)とも呼ばれています。前述したように、生データからこれまで知られていなかった興味深い情報を抽出することを研究するコンピュータサイエンスの分野である。特にビジネスなどの分野では、データの急激な増加により、過去数十年の間にパターンの手動抽出が不可能になったと思われるため、データマイニングは大量のデータをビジネスインテリジェンスに変換するための非常に重要なツールとなっています。例えば、現在、ソーシャルネットワーク分析、不正検知、マーケティングなど様々な用途で利用されています。データマイニングは通常、クラスタリング、分類、回帰、関連付けの4つのタスクを扱う。非構造化グループから類似データを特定する。分類は、新しいデータに適用できるルールの学習であり、通常、データの前処理、モデル化の設計、学習/特徴の選択、評価/検証の各ステップを含む。回帰とは、データをモデル化する際に誤差を最小化する関数を探索することである。相関とは、変数間の関係を探索することである。データマイニングは、「来年、ウォルマートが高収益を達成するのに貢献しそうな主要製品はどれか?

前述したように、データウェアハウスはデータの分析にも使用されるが、使用するユーザーや想定される目標が若干異なる。例えば、小売業では、データウェアハウスの利用者は、どのような買い物がお客様に人気なのかに関心が高いため、分析結果をお客様の体験の向上に役立てることができます。しかし、データマイニングは、まず「お客様はこういう商品を買う」という仮説を推測し、その仮説を検証するためにデータを分析します。データウェアハウスは、ある大規模な小売業者が、最初は同じサイズの商品を各店舗に在庫し、後にニューヨークの店舗ではシカゴの店舗よりも小さい在庫サイズの商品がはるかに速く売れることが分かった場合に実行される。したがって、この結果を観察すれば、ニューヨークのショップではシカゴのショップよりも小さいサイズを仕入れることができる。

  • 2020-10-23 19:18 に公開
  • 閲覧 ( 16 )
  • 分類:IT

あなたが興味を持っているかもしれない記事

匿名者
匿名者

0 件の投稿

作家リスト

  1. admin 0 投稿
  2. 匿名者 0 投稿

おすすめ