【試験直前に読む数学】共通テスト受験生必見の「データの分析」用語・公式まとめ

はじめに:データの分析についてわかりやすく!

皆さんこんにちは!今回は数学のデータの分析を取り上げます。

データの分析は、見慣れない用語や公式が多く、定着しづらい分野です。

だから、試験直前に効率よく頭に詰めこむことが大切と言えます。

短時間でデータの分析を復習するため、本記事を活用してください!

データの分析の用語・公式まとめ

範囲
$$(最大値)-(最小値)$$

平均値
$$\frac{データの合計値}{データの個数}$$

四分位数
データを大きさ順に並べたとき、25%、50%、75%にあたる数値

 □第1四分位数
下から25%にあたる数値
 □第2四分位数(中央値):
下から50%にあたる数値
 □第3四分位数
下から75%にあたる数値

※データが偶数個のとき、以下のように線を引いて考え、第1、第3四分位数は線の上の値をとり、第2四分位数は線の前後の値を平均する。

無題1

四分位偏差
$$\frac{第3四分位数 – 第1四分位数}{2}$$

箱ひげ図
資料のばらつき具合を示すグラフで、最大・最小値、四分位数を用いる

無題
 A:最小値
 B:第1四分位数
 C:平均値
 D:第2四分位数(中央値)
 E:第3四分位数
 F:最大値

偏差
n個の変数 x1,x2,……xn について、各変数と平均値Xとの差
 $$x_{1}-X
 x_{2}-X
 ……
 x_{n}-X$$
を、それぞれ平均値からの偏差という
※偏差の平均値は常に0

分散s^2
:n個の変数x1,x2,……xnについて、
$${(x_{1}-X)^2 + (x_{2}-X)^2 +……+(x_{n}-X)^2}/n$$
※偏差の2乗の平均
※分散の値が大きいほど、データの散らばりが大きい
※分散の値は、上式を変形し、
$$(x^2の平均)-(xの平均)^2$$
でも求められる

標準偏差s
$$\sqrt{s^2(分散)}$$

※分散の正の平方根

偏差値
x1,x2,……の中の数値xiの偏差値は、
$$10(x_{1}-X)/s + 50$$

散布図
2つの変数からなるデータを平面上に図示したもの。散布図において、

 □正の相関関係:2つの変数の一方が増えるとき、もう一方の変数も増える傾向にある場合
 □負の相関関係:2つの変数の一方が増えるとき、もう一方の変数が減る傾向にある場合

共分散Sxy
2種類のn個の変数x1,x2,……xn、y1,y2,……ynについて、xの平均値をX、yの平均値をY、xの標準偏差をSx、yの標準偏差をSyとすると、
$$S_{x}=\sqrt{{(x_{1}-X)^2 +(x_{2}-X)^2 +(x_{n}-X)^2}/n}$$
$$S_{y}=\sqrt{{(y_{1}-Y)^2 +(y_{2}-Y)^2 +(y_{n}-Y)^2}/n}$$
$$S_{xy}={(x_{1}-X)(y_{1}-Y)+(x_{2}-X)(y_{2}-Y)+$$
$$……+(x_{n}-X)(y_{n}-Y)}/n$$
※共分散の値が正のとき、xとyには正の相関関係がある
※共分散の値が負のとき、xとyには負の相関関係がある   
   
相関係数r
Sxy/SxSy
※相関係数rは、一般に-1≦r≦1が成り立つ
※相関係数の値が1に近いほど、正の相関が強い
※相関係数の値が-1に近いほど、負の相関が強い

データの分析に関する問題とその解答

データの分析に関する問題

生徒10人のクラスで、英語と数学の試験を実施した。生徒ごとに、英語と数学の点数を表にまとめたものを以下に示す。

出席番号 1 2 3 4 5 6 7 8 9 10
英語得点 74 91 69 66 71 80 68 77 61 73
数学得点 55 39 78 78 93 68 63 79 72 65

以下の値を求めてみよう。

・範囲
・平均値(英語のみでよい)
・四分位数(英語のみでよい)
・偏差(英語のみでよい)
・分散(英語のみでよい)
・標準偏差(英語のみでよい)
・出席番号3の偏差値(英語のみでよい)
・英語と数学の共分散
・英語と数学の相関係数

データの分析に関する問題の解答

□範囲(英語のみ)
 最大値91-最小値61=30

□平均値(英語のみ)
 $$(74+91+69+66+71+80+68+77+61+73)/10=73$$

□四分位数(英語のみ)
 変数を小さい順に並べると、
 $$61,66,68,69,71,73,74,77,80,91$$
 となり、
 第1四分位数:68
 第2四分位数(中央値):(71+73)/2=72
 第3四分位数:77

□偏差(英語のみ)
 出席番号順に、平均値76からの偏差は、
 $$74-73=1,91-73=18,69-73=-4,……(以下略)$$

□分散(英語のみ)
 $${(74-73)^2+(91-73)^2+(69-73)^2+(66-73)^2+(71-73)^2$$
$$+(80-73)^2+(68-73)^2+(77-73)^2+(61-73)^2+(72-73)^2}$$
$$/10=54.9$$

□標準偏差(英語のみ)
 $$√54.9=7.409……≒7.41$$

□偏差値(英語のみ)
 出席番号3の英語の偏差値は、
 $$10(69-73)/7.41 +50=44.601……≒44.60$$

□散布図(画像)
無題2

□共分散
 英語の分散:54.9(既に求めた)
 数学の分散:198.9
 共分散:
$${1×(-14)+18×(-30)-4×9-7×9-2×24+7×(-1)$$
$$-5×(-6)+4×10-12×3}/10=-67.4$$

□相関係数
 $$-67.4/\sqrt{54.9×198.9}=-0.6450……≒-0.65$$

おわりに:データの分析のまとめ

いかがでしたか?データの分析は、高校数学の範囲では基本をおさえるだけで十分です。

データが与えられたとき、今回学んだ値が求められるようにしておきましょう。

それでは、がんばってください。

【3分で分かる!】平均値・中央値・最頻値の求め方をわかりやすく(練習問題つき)

2020.08.18

【3分で分かる!】相関係数の求め方・問題の解き方をわかりやすく

2020.06.14



皆さんの意見を聞かせてください!
合格サプリWEBに関するアンケート