匿名質問者

統計に関する素人による質問です。

大きなバラつきがあるごちゃごちゃのデータ群に関して、標準偏差を計算したいのですが、平均値ではなく「標準偏差の中央値を使ったバージョン」にしたいです。

イメージとしては、中央絶対偏差を計算するように、「中央値と各値の差」を求め、それを二乗した値の中央値の平方根といった具合です。

ここで質問ですが、統計学には上記のような考え方はあるのでしょうか。
「PC上でプログラムなどで計算するなら中央絶対偏差で良いだろう」と言われればそれまでなのですが、そもそも統計学的にどうしようもない理由で「中央値バージョンの分散や標準偏差が無い」ということであれば事前にしっかり知っておきたいと思い、質問しました。

回答の条件
  • 1人50回まで
  • 登録:
  • 終了:2024/05/27 12:53:07

回答1件)

匿名回答1号 No.1

もちろん、作れば何でもありですが、一般に、確率変数Xと定数aに対して、m=E(X)とすると、

[括弧が繁雑になるのを防ぐためにsin(x^2)をsin x^2と書く習慣に倣います]

E(X-a)^2=E{(X-m)+(m-a)}^2

=E(X-m)^2+(m-a)E(X-m)+(m-a)^2

=V(X)+(m-a)^2

となるので、上式(その√も)は、a=mのときに最小値を取ります。

要するに、「ばらつき」の尺度の基準値(上で言うa)は平均値を基準値にした場合(a=mのとき)が最小になります。

 

なお絶対偏差に関しては、中央値基準だと最小になります。上と違い、ちょっとゴタゴタしますが。

https://manabitimes.jp/math/2652

匿名回答1号

加筆済み

2024/04/27 19:50:10
  • 匿名回答2号
    匿名回答2号 2024/04/27 23:05:27
     中央値だとデータ数が奇数か偶数かで場合分けが必要なので面倒くさそう。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません