\r\n\r\n

クラスタリングと分類の違い

クラスタリングと分類の大きな違いは、クラスタリングが特徴量に基づいて類似のインスタンスをグループ化する教師なし学習技術であるのに対し、分類は特徴量に基づいてインスタンスにあらかじめ定義されたラベルを割り当てる教師あり学習技術であること...である。

クラスタリングと分類の大きな違いは、クラスタリングが特徴量に基づいて類似のインスタンスをグループ化する教師なし学習技術であるのに対し、分類は特徴量に基づいてインスタンスにあらかじめ定義されたラベルを割り当てる教師あり学習技術である点である。

クラスタリングと分類は一見似たような処理に見えますが、その意味するところから違いがあります。データマイニングの分野では、クラスタリングと分類の2種類の学習方法がある。どちらの手法も、1つ以上の特徴によって物体をグループに分類する。

カタログ

1. 概要と主な違い 2. クラスタリングとは 3. 分類とは 4. 横並び比較 - クラスタリングと分類を表形式で 5. まとめ

クラスタリングは何ですか?

クラスタリングとは、似たような性質を持つもの同士をグループ化し**、異なる性質を持つものを分離する方法です。機械学習やデータマイニングで用いられる一般的な統計データ解析手法である。探索的なデータ解析や一般化も、クラスタリングが用いられる分野である。

聚类(clustering)和分类(classification)的区别

図01:クラスタリング

クラスタリングは教師なしデータマイニングである。特定の1つのアルゴリズムではなく、課題を解決するための汎用的なアプローチである。そのため、クラスタリングの実施には様々なアルゴリズムを用いることができる。適切なクラスタリングアルゴリズムとパラメータ設定は、個々のデータセットに依存します。これは自動的な作業ではなく、繰り返し発見していく作業です。データマイニングで用いられるクラスタリングアルゴリズムには、k-meanクラスタリングと階層型クラスタリングがある。

分類は何ですか?

分類とは、学習データのセットを使って対象を分類し、識別、区別、理解するプロセスである。分類は、訓練セットと正しく定義された観測値が利用可能な教師付き学習の手法である。

聚类(clustering)和分类(classification)的区别

図02:分類

分類を実行するアルゴリズムが分類器、観測値がインスタンスである。データマイニングの分類アルゴリズムとしては、K-nearest neighbourアルゴリズムと決定木アルゴリズムが有名である。

クラスタリングと分類の違い

クラスタリングは教師なし学習であり、分類は教師あり学習の手法である。分類は、特徴量に基づいてインスタンスにあらかじめ定義されたラベルを割り当てるのに対し、特徴量に基づいて類似のインスタンスをグループ化するものである。クラスタリングは、データセットを部分集合に分割し、類似した特徴を持つインスタンスをグループ化する。ラベル付けされたデータやトレーニングセットを使用しない。一方、新しいデータは、トレーニングセットの観測結果に基づいて分類される。学習セットはラベル付けされている。

クラスタリングの目的は、オブジェクトの集合をグループ化し、それらの間に関係があるかどうかを判断することである。一方、分類の目的は、新しいオブジェクトがあらかじめ定義されたクラスの集合からどのクラスに属するかを見つけ出すことである。

概要 - クラスタリング vs. 分類

画像提供
1.”Cluster-2″Cluster-2.gifによるものです。ヘルディスプ派生作品:(パブリックドメイン) ウィキメディア・コム***経由 2.ジョン「マグネティ**」。アプライド- 自作(パブリックドメイン) via ウィキメディア・コム○○。
  • 2020-10-28 16:16 に公開
  • 閲覧 ( 31 )
  • 分類:IT

あなたが興味を持っているかもしれない記事

匿名者
匿名者

0 件の投稿

作家リスト

  1. admin 0 投稿
  2. 匿名者 0 投稿

おすすめ