統計検定4級
◎統計の調査項目
①質的データ
例)体力測定時の最初に行った種目名
②量的データ・・・数量をして記録したデータ
・大きさ
・量
◎度数分布表・・・データの散らばり具合を知る
・階級
・階級の幅:各区間の幅(bin)
・度数:その階級のデータの個数
・階級値:各階級の幅の真ん中の値
例)「階級の幅」が10~25の時
「階級値」は10+25/2=17.5
◎データの代表値
・平均
・中央値(median):階級もしくは階級値を昇順に並べて奇数番目の真ん中、偶数時は平均
・最頻値(mode):度数が最も多い階級、2つあっても平均しない
*注)偶然同じ度数が2つある場合は、2つ共に最頻値(平均しないこと!!)
◎グラフについて
・比(%)グラフ・・・帯グラフ、円グラフ
・数量グラフ・・・積み上げ横棒グラフ、幹葉図、ヒストグラム
・変化を表す・・・折れ線グラフ
・分布を表す・・・ヒストグラム
・0%から始まり100%で終わる・・・累積相対度数折れ線
・度数の棒グラフ、累積相対度数の折れ線グラフ・・・パレート図
・数え上げ(正)・・・タリ-チャート
◎ヒストグラムから平均値を推定
・方法1
①階級の最小値だけで平均値を求める
②階級の最大値だけで平均値を求める
③正しい平均は①②の間に必ず入る
・方法2
ヒストグラムで平均値を元データと同じように求められないため
階級値で代用して考える
◎ヒストグラムの注意点
・ヒストグラムのbinはどれも同じとは限らない。(2016年6月 問題9)
例)0以上20点未満、20点以上30点未満、30点以上40点未満
といった感じで「0点以上20点未満」だけ他のbinに比べて2倍となる。
度数分布からヒストグラムを起こす時に「0点以上20点未満」は度数を
半分にしなければならない。
参考
・ハロー!パソコン教室 イオンモール和歌山校
・試験日:2020年8月~10月の土曜、日曜