\r\n\r\n
中央値 vs 平均値(平均値)
中央値と平均値は、記述統計における集中的な傾向を示す指標である。通常、算術平均は観測値の集合の平均とみなされる。したがって、ここでは平均値を平均と考える。ただし、平均は算術平均ではありません。
平均値
算術平均は、データ値の合計をデータ値の個数で割ったもの、すなわち
データが標本空間のものであれば、標本平均()と呼ばれ、標本の記述統計量となる。標本の記述的尺度として最もよく用いられるが、頑健な統計量とはいえない。外れ値や振動***に対して非常に敏感である。
例えば、ある都市の市民の平均所得を考えてみましょう。すべてのデータ値を足し合わせてから割るので、超富裕層の収入が平均値に大きく影響することがあります。したがって、平均値は必ずしもデータをうまく表現しているとは言えない。
また、交流信号の場合、素子に流れる電流はプラス方向からマイナス方向へ、またはその逆へと周期的に変化する。素子に流れる電流の1周期平均を取ると0となり、素子に電流が流れていないことになるが、これは明らかに誤りである。したがって、この場合も算術平均はよい尺度とはいえない。
算術平均は、データが均等に分布している場合に有効な指標となる。正規分布の場合、平均は最頻値および中央値に等しい。二乗平均誤差を考慮すると残差が最も小さく、データセットを表すのに単一の数値が必要な場合、最も優れた記述指標となる。
の中央値
すべてのデータ値を昇順に並べた後の中央のデータ点の値を、データセットの中央値と定義する。
-オブザベーション(データポイント)の数が奇数の場合、中央値は順序付きリストの真ん中のオブザベーションになります。
-オブザベーション(データ点)が偶数の場合,中央値は順序付きリストの2つの中間オブザベーションの平均である.
中央値は,オブザベーションを2つのグループ,つまり,中央値より上の値を持つ1つのグループ(50%)と中央値より下の値を持つもう1つのグループ(50%)に分割する.中央値は、もっぱら歪んだ分布に用いられ、算術平均値よりもデータを代表しやすい。
中央値 vs 平均値(平均値)
-平均値と中央値はともに中心的な傾向を表すもので、データを要約するものである。
-平均値は外れ値の影響を大きく受けますが、中央値はそうではありません。
-このように、偏りの大きい分布の場合、平均値よりも中央値の方が良いのです。