memorandums

日々の作業ログです。

平均値と中央値の違いの例題を作ろうとして逆に自分が驚いた件

非常勤先でExcelを使った統計の授業を担当しています。

中央値の意義を説明するときに、所得や貯蓄額などの例を紹介するのですが。。。自分でグラフを作って見てもらうのもいいな。。。と思いましてデータを作りました。

このページによると、「2018年の1世帯当たり貯蓄現在高の平均値は1,752万円」だそうです。

総務省のページを探しましたが金額の分布は見つかりませんでした。。。ので、参考にしたページに以下のデータがありました。部分集合で、平均値は違いますが。。。分布は総務省の調査と同等と仮定して採用することにしました。

LeadingTechが運営するカードローン情報メディア「ワイズローン」は、6月22日から24日にかけて「貯金実態調査2019」を実施した。調査対象は国内在住の男女1,060名。

この調査の分布が以下とのことでした。これも記事から引用したものです。

f:id:ke_takahashi:20190712120828j:plain

この分布をもとに、もし日本の人口が100人だとして、それぞれの貯蓄額をExcelの乱数で計算して、100人の平均貯蓄額が1,752万円になるようにしてみました。以下、見る上で、分布がそもそも総務省のものとは違うということに注意してください。

結果は以下です。注目したいのが、上記のグラフでは1000万円以上という項目に集約されているのですが、ここの本当の実数が見えないのがミソで、それは、1000万円以下のデータの大小を見えるようにするための工夫なのだと思いますが、実は、1000万円以上の方々のデータってどれくらいなのか。。。というのが見えないわけです。中央値の意義を実感するにはこの範囲の方々の値を明確にする必要がありました。グラフを見比べるとその差は歴然としていますね。。。

f:id:ke_takahashi:20191103092104p:plain

貯蓄額を集計して全体に占める(←占めるというのも意味不明な数値ですが)割合をグラフ化したのが以下です。5%の方々の貯蓄額を集計すると、全体の90%になるんですね。。。

f:id:ke_takahashi:20191103092455p:plain

Excelには面グラフってのも搭載されています。これでも見てみましょう。

f:id:ke_takahashi:20191103092722p:plain

ちなみに、平均値は1,752万円でしたが、中央値は93万円、σは6,979円でした。

1億人の5%とすると。。。500万人くらいの方々が凄いことになっているといことですね。。。実態として。福岡県の人口が500万人くらいですね。。。とても多いような気もするけど。。。想像つかん。

具体的に考えてみることは大事だな。。。と思いました。