統計検定4級
問題解決のサイクル
・PPDACサイクル・・・問題解決フレームワーク
・P(Problem)・・・課題の設定
・P(Plan)・・・計画
・D(Data)・・・データの収集
・Analysis・・・分析
・Conclusion・・・とりあえずの結果
・課題解決やデータ分析、A/Bテスト
四分位数
・全体を4分割する
・5つのデータ:最大値、最小値、第1~3四分位数
・第1~3四分位数:中央値を示す・・・結局度数です
・第1四分位数(Q1):下半分の中央値
・第2四分位数(Q2):中央値
・第3四分位数(Q3):上半分の中央値
・四分位範囲(IQR):Q3-Q1
・四分位偏差:(Q3-Q1)/2
標本調査
・標本の選び方・・・無作為抽出法
・無作為抽出法の道具・・・乱数表、乱数さい
・無作為抽出をすると・・・母集団から選ばれる確率が等しくなる
母集団の特性を持つ標本が出来る
統計の調査項目
①質的データ
例)体力測定時の最初に行った種目名
②量的データ・・・数量をして記録したデータ
・大きさ
・量
事例)
・配達希望時間・・・時間は質的データ、午前中希望とかあるから。
単純に「数字で表せる」か、「数字以外で表す」かで判断すべし。
あまり、内容を深く考える必要はない。
度数分布表・・・データの散らばり具合を知る
・階級
・階級の幅:各区間の幅(bin)
・度数:その階級のデータの個数
・階級値:各階級の幅の真ん中の値
例)「階級の幅」が10~25の時
「階級値」は10+25/2=17.5
データの代表値
・平均
・中央値(median):階級もしくは階級値を昇順に並べて奇数番目の真ん中、偶数時は平均
例)度数が47個の場合、中央値は47/2=23.5≒24番目が中央値
・最頻値(mode):度数が最も多い階級、2つあっても平均しない
*注)偶然同じ度数が2つある場合は、2つ共に最頻値(平均しないこと!!)
グラフについて
・比(%)グラフ・・・帯グラフ、円グラフ
・数量グラフ・・・積み上げ横棒グラフ、幹葉図、ヒストグラム
・変化を表す・・・折れ線グラフ
・分布を表す・・・ヒストグラム
・0%から始まり100%で終わる・・・累積相対度数折れ線
・度数の棒グラフ+累積相対度数の折れ線グラフ・・・パレート図
・数え上げ(正)・・・タリ-チャート
各グラフの特徴
・折れ線グラフ・・・**時間変化**を示す
・帯グラフ・円グラフ・・・全体に対する各項目の**割合**
・面グラフ・・・割合の加算
・累積相対度数分布・・・累積かつ%で表す=>
*注)比グラフ/数量グラフの選択は出題される:2018年11月問題5
ヒストグラムから平均値を推定
・方法1・・・2017年11月問題10
①階級の最小値だけで平均値を求める
②階級の最大値だけで平均値を求める
③正しい平均は①②の間に必ず入る
・方法2・・・2018年6月 問題12
ヒストグラムで平均値を元データと同じように求められないため
階級値で代用して考える
ヒストグラムの注意点
・ヒストグラムのbinはどれも同じとは限らない。(2016年6月 問題9)
例)0以上20点未満、20点以上30点未満、30点以上40点未満
といった感じで「0点以上20点未満」だけ他のbinに比べて2倍となる。
度数分布からヒストグラムを起こす時に「0点以上20点未満」は度数を
半分にしなければならない。
指数表について
・指数・・・データの一部を100として、その他のデータを相対的な%で表したもの
グラフの読み方について
・データの上昇傾向か否かは、データの最初と最後で判断すべし
2018年11月問題24
・
間違ったところ
・2018年11月 問題12、問題13、問題18
・2018年6月 問題12、問題14
・2017年11月 問題10
参考
・ハロー!パソコン教室 イオンモール和歌山校
・試験日:2020年8月~10月の土曜、日曜