統計計算機(平均・中央値・標準偏差・四分位)
数値リスト(カンマ・空白・改行区切り)を貼り付けると、中心傾向・ばらつき・四分位数を含む記述統計を一括表示します。
- データ数 (n)
- 9
- 合計
- 222
- 平均
- 24.6667
- 中央値
- 25
- 最頻値
- 25
- 範囲
- 28
- 最小値
- 12
- 最大値
- 40
- Q1 (25パーセンタイル)
- 16.5
- Q3 (75パーセンタイル)
- 32.5
- 標準偏差
- 9.1924
- 分散
- 84.5
仕組み
各統計量の意味
平均: 合計÷個数。外れ値の影響を強く受け、極端に大きな1つの値が平均を典型的な値から大きくずらします。データがほぼ対称な場合に最適。
中央値: ソートしたときの真ん中の値。外れ値に強く、極端な値が少しあっても変化しません。所得や住宅価格など歪んだデータには平均より中央値が適切。
最頻値: 最も多く現れる値。離散データ(アンケート回答・サイコロの目)に最も有用。連続データでは意味を持たないことが多く、繰り返しがない場合は「なし」と表示します。
標準偏差: 平均からの典型的な距離。データと同じ単位で表されます。正規分布なら、約2/3の値が平均±1標準偏差の範囲に入ります。
標本 vs 母集団
数値が母集団全体(会社の全従業員、ある月の全日)なら、母集団標準偏差: nで割る。「標本標準偏差を使う」のチェックを外すと切替わります。
数値が母集団から抽出された標本(10,000顧客中100人のアンケート)なら、標本標準偏差: n−1で割る(ベッセル補正)。デフォルトで、ほとんどの統計教科書とソフトウェアもこちらが既定。
nが大きくなると差は縮みます。n=100では0.5%、n=10では5%程度の差。サンプルが非常に小さいときは選択が重要です。
四分位数とIQR
Q1(第1四分位数、25パーセンタイル)は下半分の中央値。Q3(第3四分位数、75パーセンタイル)は上半分の中央値。四分位範囲(IQR = Q3 − Q1)は中央50%の範囲を示し、外れ値に強い指標です。
箱ひげ図ではこれらを使用:箱がQ1からQ3、中の線が中央値、ひげは1.5×IQR以内の最大・最小、それを超える値は外れ値としてプロットされます。
よくある質問
›何個まで貼り付けられる?
実用上10万個まで快適に動作。それ以上はブラウザが重くなる可能性。大量データはプログラミングツールを。
›小数点はどう入力?
ロケールに関わらずピリオド (.) を使用:3.14(3,14ではなく)。
›なぜ最頻値が「なし」?
繰り返し値がない場合です。最頻値は同じ値が2回以上出現する場合のみ意味を持ちます。
›クラスのデータは標本?母集団?
学校の標本として扱うなら標本(n−1)。クラス自体が母集団ならn。
›標準偏差と分散の違いは?
分散は平均からの距離の二乗の平均、標準偏差はその平方根。標準偏差はデータと同じ単位なので解釈しやすく、両方表示しますが標準偏差の方が通常有用。
›Q1が他の電卓と違うのはなぜ?
計算法が複数(Method 1・2、R既定、Excel既定)あります。本ツールは「下半分の中央値」法を採用。多くの入門コースや教科書がこの方法。
›負の数も使える?
使えます。完全対応。
›データは送信される?
送信されません。全計算はブラウザ内で完結します。
関連ツール
最終更新: