はじめに:データの分析についてわかりやすく!
皆さんこんにちは!今回は数学のデータの分析を取り上げます。
データの分析は、見慣れない用語や公式が多く、定着しづらい分野です。
だから、試験直前に効率よく頭に詰めこむことが大切と言えます。
短時間でデータの分析を復習するため、本記事を活用してください!
目次
データの分析の用語・公式まとめ
$$(最大値)-(最小値)$$
□平均値:
$$\frac{データの合計値}{データの個数}$$
□四分位数:
データを大きさ順に並べたとき、25%、50%、75%にあたる数値
□第1四分位数:
下から25%にあたる数値
□第2四分位数(中央値):
下から50%にあたる数値
□第3四分位数:
下から75%にあたる数値
※データが偶数個のとき、以下のように線を引いて考え、第1、第3四分位数は線の上の値をとり、第2四分位数は線の前後の値を平均する。
□四分位偏差:
$$\frac{第3四分位数 – 第1四分位数}{2}$$
□箱ひげ図:
資料のばらつき具合を示すグラフで、最大・最小値、四分位数を用いる
A:最小値
B:第1四分位数
C:平均値
D:第2四分位数(中央値)
E:第3四分位数
F:最大値
□偏差:
n個の変数 x1,x2,……xn について、各変数と平均値Xとの差
$$x_{1}-X
x_{2}-X
……
x_{n}-X$$
を、それぞれ平均値からの偏差という
※偏差の平均値は常に0
□分散s^2
:n個の変数x1,x2,……xnについて、
$${(x_{1}-X)^2 + (x_{2}-X)^2 +……+(x_{n}-X)^2}/n$$
※偏差の2乗の平均
※分散の値が大きいほど、データの散らばりが大きい
※分散の値は、上式を変形し、
$$(x^2の平均)-(xの平均)^2$$
でも求められる
□標準偏差s:
$$\sqrt{s^2(分散)}$$
※分散の正の平方根
□偏差値:
x1,x2,……の中の数値xiの偏差値は、
$$10(x_{1}-X)/s + 50$$
□散布図:
2つの変数からなるデータを平面上に図示したもの。散布図において、
□正の相関関係:2つの変数の一方が増えるとき、もう一方の変数も増える傾向にある場合
□負の相関関係:2つの変数の一方が増えるとき、もう一方の変数が減る傾向にある場合
□共分散Sxy:
2種類のn個の変数x1,x2,……xn、y1,y2,……ynについて、xの平均値をX、yの平均値をY、xの標準偏差をSx、yの標準偏差をSyとすると、
$$S_{x}=\sqrt{{(x_{1}-X)^2 +(x_{2}-X)^2 +(x_{n}-X)^2}/n}$$
$$S_{y}=\sqrt{{(y_{1}-Y)^2 +(y_{2}-Y)^2 +(y_{n}-Y)^2}/n}$$
$$S_{xy}={(x_{1}-X)(y_{1}-Y)+(x_{2}-X)(y_{2}-Y)+$$
$$……+(x_{n}-X)(y_{n}-Y)}/n$$
※共分散の値が正のとき、xとyには正の相関関係がある
※共分散の値が負のとき、xとyには負の相関関係がある
□相関係数r:
Sxy/SxSy
※相関係数rは、一般に-1≦r≦1が成り立つ
※相関係数の値が1に近いほど、正の相関が強い
※相関係数の値が-1に近いほど、負の相関が強い
データの分析に関する問題とその解答
データの分析に関する問題
生徒10人のクラスで、英語と数学の試験を実施した。生徒ごとに、英語と数学の点数を表にまとめたものを以下に示す。
出席番号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
英語得点 | 74 | 91 | 69 | 66 | 71 | 80 | 68 | 77 | 61 | 73 |
数学得点 | 55 | 39 | 78 | 78 | 93 | 68 | 63 | 79 | 72 | 65 |
以下の値を求めてみよう。
・平均値(英語のみでよい)
・四分位数(英語のみでよい)
・偏差(英語のみでよい)
・分散(英語のみでよい)
・標準偏差(英語のみでよい)
・出席番号3の偏差値(英語のみでよい)
・英語と数学の共分散
・英語と数学の相関係数
データの分析に関する問題の解答
□範囲(英語のみ)
最大値91-最小値61=30
□平均値(英語のみ)
$$(74+91+69+66+71+80+68+77+61+73)/10=73$$
□四分位数(英語のみ)
変数を小さい順に並べると、
$$61,66,68,69,71,73,74,77,80,91$$
となり、
第1四分位数:68
第2四分位数(中央値):(71+73)/2=72
第3四分位数:77
□偏差(英語のみ)
出席番号順に、平均値76からの偏差は、
$$74-73=1,91-73=18,69-73=-4,……(以下略)$$
□分散(英語のみ)
$${(74-73)^2+(91-73)^2+(69-73)^2+(66-73)^2+(71-73)^2$$
$$+(80-73)^2+(68-73)^2+(77-73)^2+(61-73)^2+(72-73)^2}$$
$$/10=54.9$$
□標準偏差(英語のみ)
$$√54.9=7.409……≒7.41$$
□偏差値(英語のみ)
出席番号3の英語の偏差値は、
$$10(69-73)/7.41 +50=44.601……≒44.60$$
□散布図(画像)
□共分散
英語の分散:54.9(既に求めた)
数学の分散:198.9
共分散:
$${1×(-14)+18×(-30)-4×9-7×9-2×24+7×(-1)$$
$$-5×(-6)+4×10-12×3}/10=-67.4$$
□相関係数
$$-67.4/\sqrt{54.9×198.9}=-0.6450……≒-0.65$$
おわりに:データの分析のまとめ
いかがでしたか?データの分析は、高校数学の範囲では基本をおさえるだけで十分です。
データが与えられたとき、今回学んだ値が求められるようにしておきましょう。
それでは、がんばってください。