統計検定4級

問題解決のサイクル

・PPDACサイクル・・・問題解決フレームワーク

・P(Problem)・・・課題の設定

・P(Plan)・・・計画

・D(Data)・・・データの収集

・Analysis・・・分析

・Conclusion・・・とりあえずの結果

・課題解決やデータ分析、A/Bテスト

 

四分位数

・全体を4分割する

・5つのデータ:最大値、最小値、第1~3四分位数

・第1~3四分位数:中央値を示す・・・結局度数です

・第1四分位数(Q1):下半分の中央値

・第2四分位数(Q2):中央値

・第3四分位数(Q3):上半分の中央値

四分位範囲(IQR):Q3-Q1

四分位偏差:(Q3-Q1)/2

 

標本調査

・標本の選び方・・・無作為抽出法

無作為抽出法の道具・・・乱数表、乱数さい

・無作為抽出をすると・・・母集団から選ばれる確率が等しくなる

             母集団の特性を持つ標本が出来る

 

統計の調査項目

①質的データ

  例)体力測定時の最初に行った種目名

②量的データ・・・数量をして記録したデータ

  ・大きさ

  ・量

 事例)

・配達希望時間・・・時間は質的データ、午前中希望とかあるから。

 

単純に「数字で表せる」か、「数字以外で表す」かで判断すべし。

あまり、内容を深く考える必要はない。

度数分布表・・・データの散らばり具合を知る

・階級

・階級の幅:各区間の幅(bin)

・度数:その階級のデータの個数

・階級値:各階級の幅の真ん中の値

  例)「階級の幅」が10~25の時

    「階級値」は10+25/2=17.5

データの代表値

・平均

中央値(median):階級もしくは階級値を昇順に並べて奇数番目の真ん中、偶数時は平均

例)度数が47個の場合、中央値は47/2=23.5≒24番目が中央値

最頻値(mode):度数が最も多い階級、2つあっても平均しない

 *注)偶然同じ度数が2つある場合は、2つ共に最頻値(平均しないこと!!)

 

グラフについて

・比(%)グラフ・・・帯グラフ、円グラフ

・数量グラフ・・・積み上げ横棒グラフ、幹葉図、ヒストグラム

 

・変化を表す・・・折れ線グラフ

・分布を表す・・・ヒストグラム

・0%から始まり100%で終わる・・・累積相対度数折れ線

・度数の棒グラフ+累積相対度数の折れ線グラフ・・・パレート図

・数え上げ(正)・・・タリ-チャート

 

f:id:strongerthansword2:20200904221406p:plain

乾葉図

 

f:id:strongerthansword2:20200905135634p:plain

各グラフの特徴

・折れ線グラフ・・・**時間変化**を示す

・帯グラフ・円グラフ・・・全体に対する各項目の**割合**

・面グラフ・・・割合の加算

・累積相対度数分布・・・累積かつ%で表す=>

 

*注)比グラフ/数量グラフの選択は出題される:2018年11月問題5

ヒストグラムから平均値を推定

・方法1・・・2017年11月問題10

 ①階級の最小値だけで平均値を求める

 ②階級の最大値だけで平均値を求める

 ③正しい平均は①②の間に必ず入る

・方法2・・・2018年6月 問題12

 ヒストグラムで平均値を元データと同じように求められないため

 階級値で代用して考える

 

ヒストグラムの注意点

ヒストグラムのbinはどれも同じとは限らない。(2016年6月 問題9)

  例)0以上20点未満、20点以上30点未満、30点以上40点未満

    といった感じで「0点以上20点未満」だけ他のbinに比べて2倍となる。

    度数分布からヒストグラムを起こす時に「0点以上20点未満」は度数を

    半分にしなければならない。

 

指数表について

・指数・・・データの一部を100として、その他のデータを相対的な%で表したもの

グラフの読み方について

・データの上昇傾向か否かは、データの最初と最後で判断すべし

 2018年11月問題24

 

間違ったところ

・2018年11月 問題12、問題13、問題18

・2018年6月 問題12、問題14

・2017年11月 問題10

 

 

参考

・ハロー!パソコン教室 イオンモール和歌山校

・試験日:2020年8月~10月の土曜、日曜