皆さんこんにちは!5分で要点チェックシリーズ、今回は数学のデータの分析を取り上げます。
データの分析は、見慣れない用語や公式が多く、定着しづらい分野です。
だから、試験直前に効率よく頭に詰めこむことが大切と言えます。
短時間でデータの分析を復習するため、本記事を活用してください!
データの分析の要点のまとめ
(最大値)-(最小値)
詳しい解説へ(次ページ)
□平均値:
(データの合計値)/(データの個数)
□四分位数:
データを大きさ順に並べたとき、25%、50%、75%にあたる数値
□第1四分位数:
下から25%にあたる数値
□第2四分位数(中央値):
下から50%にあたる数値
□第3四分位数:
下から75%にあたる数値
※データが偶数個のとき、以下のように線を引いて考え、第1、第3四分位数は線の上の値をとり、第2四分位数は線の前後の値を平均する。

□四分位偏差:
{(第3四分位数)+(第1四分位数)}/2
□箱ひげ図:
資料のばらつき具合を示すグラフで、最大・最小値、四分位数を用いる
A:最小値
B:第1四分位数
C:平均値
D:第2四分位数(中央値)
E:第3四分位数
F:最大値
□偏差:
n個の変数 x1,x2,……xn について、各変数と平均値Xとの差
x1-X,
x2-X,
……,
xn-X
を、それぞれ平均値からの偏差という
※偏差の平均値は常に0
□分散s^2
:n個の変数x1,x2,……xnについて、
{(x1-X)^2 + (x2-X)^2 +……+(xn-X)^2}/n
※偏差の2乗の平均
※分散の値が大きいほど、データの散らばりが大きい
※分散の値は、上式を変形し、
(x^2の平均)-(xの平均)^2
でも求められる
□標準偏差s:
√(分散s^2)
※分散の正の平方根
□偏差値:
x1,x2,……の中の数値xiの偏差値は、
10(x1-X)/s +50
□散布図:
2つの変数からなるデータを平面上に図示したもの。散布図において、
□正の相関関係:2つの変数の一方が増えるとき、もう一方の変数も増える傾向にある場合
□負の相関関係:2つの変数の一方が増えるとき、もう一方の変数が減る傾向にある場合
□共分散Sxy:
2種類のn個の変数x1,x2,……xn、y1,y2,……ynについて、xの平均値をX、yの平均値をY、xの標準偏差をSx、yの標準偏差をSyとすると、
Sx=√{(x1-X)^2 +(x2-X)^2 +(x3-X)^2}/n
Sy=√{(y1-Y)^2 +(y2-Y)^2 +(y3-Y)^2}/n
Sxy={(x1-X)(y1-Y)+(x2-X)(y2-Y)+……+(xn-X)(yn-Y)}/n
※共分散の値が正のとき、xとyには正の相関関係がある
※共分散の値が負のとき、xとyには負の相関関係がある
□相関係数r:
Sxy/SxSy
※相関係数rは、一般に-1≦r≦1が成り立つ
※相関係数の値が1に近いほど、正の相関が強い
※相関係数の値が-1に近いほど、負の相関が強い