\r\n\r\n

かいそうてきとぶんかつクラスタリングの違い

クラスタリングは、データを分析し、類似したデータをグループ化するための機械学習技術である。このような類似したデータのグループや集合をクラスターと呼ぶ。クラスタリング分析では、自動的にクラスタを特定することができるクラスタリングアルゴリズムに注目します。このようなクラスタリングアルゴリズムには、階層型と分割型がある。階層型クラスタリングアルゴリズムは、データをクラスタの階層に分解する。パーティショニングアルゴリズムは、データセットを互いに交差しないパーティションに分割する...

階層型クラスタリングとパーティション型クラスタリングの比較

クラスタリングは、データを分析し、類似したデータをグループ化するための機械学習技術である。このような類似したデータのグループや集合をクラスターと呼ぶ。クラスタリング分析では、自動的にクラスタを特定することができるクラスタリングアルゴリズムに注目します。このようなクラスタリングアルゴリズムには、階層型と分割型がある。階層型クラスタリングアルゴリズムは、データをクラスタの階層に分解する。パーティショニング・アルゴリズムは、データセットを互いに交差しないパーティションに分割する。

階層型クラスタリングとは?

階層型クラスタリングアルゴリズムは、小さなクラスタを大きなクラスタに統合したり、大きなクラスタを小さなクラスタに分割したりするサイクルを繰り返す。いずれにせよ、デンドグラムと呼ばれるクラスタの階層が生成されます。クラスタリング戦略はボトムアップアプローチでクラスタをより大きなクラスタに統合し、分割戦略はトップダウンアプローチでクラスタをより小さなクラスタに分割するものである。一般に、結合/分割に使用する大きい/小さいクラスタを決定するために、貪欲な方法が使用されます。ユークリッド距離、マンハッタン距離、コサイン類似度は、数値データに対して最もよく使われる類似度指標である。非数値データに対しては、ハミング距離などの指標を用いる。注目すべきは、階層的クラスタリングは、距離行列だけで十分であるため、実際のオブザベーション(インスタンス)を必要としないことである。デンドグラムをどのレベルで切り取るかによって、異なるクラスタを得ることができる。

パーティションドクラスタリングとは何ですか?

パーティションドクラスタリングアルゴリズムは、異なるパーティションを生成し、それらをある基準に従って評価する。各インスタンスはk個の互いに排他的なクラスタのいずれかに配置されるため、非階層的とも呼ばれる。一般的なパーティションクラスタリングアルゴリズムはクラスタのセットを1つだけ出力するので、ユーザーは必要なクラスタ数(通常kと呼ばれる)を入力する必要がある。最もよく使われる分割型クラスタリングアルゴリズムの1つにk-meansクラスタリングアルゴリズムがある。ユーザは開始前にクラスタ数kを指定する必要があり、アルゴリズムはまずk個のパーティションの中心(または重心)を初期化する。簡単に言えば、k-means クラスタリングアルゴリズムは、現在の中心に基づいてメンバーを割り当て、現在のメンバーに基づいて中心を再推定する。この2つのステップを、クラス内類似度目的関数とクラス間差分**目的関数が特定のクラスで最適化されるまで繰り返す。したがって、センターの適切な初期化は、パーティションドクラスタリングアルゴリズムから高品質の結果を得るために非常に重要な要素である。

階層型クラスタリングとパーティションドクラスタリングの違いは何ですか?

  • 2020-11-06 13:29 に公開
  • 閲覧 ( 20 )
  • 分類:IT

あなたが興味を持っているかもしれない記事

匿名者
匿名者

0 件の投稿

作家リスト

  1. admin 0 投稿
  2. 匿名者 0 投稿

おすすめ