統計検定2級

第1章 データの記述と要約・・・記述統計

1.2量的データの分布

1.2.1ヒストグラムの作成

・棒グラフとヒストグラムの違い

 棒グラフ:的変数、度数(相対度数)は高さ、横軸順序変更可能

 ヒストグラム的変数、度数は面積、横軸順序変更不可、

 

f:id:strongerthansword2:20210306225222p:plain

棒グラフ

1.3 分布の特徴を表す指標

1.3.1 平均・分散・標準偏差

平均:分布が左右対称であれば全観測値の中心を示すが、非対称の度合いが強くなると中心としての意味は弱くなる。

 

標準偏差:データの「散らばり指標」

・左右対称であれば、平均・標準偏差が意味を持つ。(非対称であれば存在意義無)

 

1.3.2 標準化得点

 ・正規化・・・データを0~1に収める

・標準化・・・データを平均0、標準偏差1に収める

・白色化・・・データを

1.3.3 変動係数

標準偏差と違ったデータの「散らばり指標」

 

1.3.4 中央値、最頻値

・非対称であれば意味を持つ

 

1.4 量的データの要約とグラフ表現

・量的データのグラフ:箱ひげ図

1.4.3 箱ひげ図

・外れ値があった場合は最大値が

1.5 質的データの度数分布とグラフ表現

・質的データのグラフ

  -度数(相対度数):棒グラフ

  -割合:円グラフ、帯グラフ

1.6 2変数データの記述と要約とグラフ表現

・2変数データのグラフ:散布図

・2変数データの表:クロス集計表

*注意:クロス集計表は、「質的データ」「量的データ」両方で使える

 

・相関関係と因果関係は異なる。相関係数が提示するのは相関関係。

相関係数は、2変数間の直線性(線形性)について考察したもの

非線形関係であっても相関係数が大きいとは限らない

1.6.4 回帰直線

相関係数:2つの変数xとyを対等に扱い、直線的な関連性の強さを表す

・回帰:2つの変数は対等ではなく、xからyを説明や予測する方向性を持つ必要がある

1.6.5 質的データのクロス集計表

・2元クロス集計表を作って、行パーセント・列パーセント・総パーセントの表を作ってみると関連性がつかみやすい。

・パーセントの表から、オッズ比 

 

 

1.7 時系列データの記述と簡単な分析

1.7.2 指数化と幾何平均(時系列データの分析法)

・時系列データの分析:「差を見る方法」、「変化率で見る方法」

・複数の時系列の変化の比較法:

  ①指数化:ある時点を100とする

  ②

1.7.3 時系列データの変動分解

・傾向変動:長期的変動、影響一番大きいもの。周期というより上下変動。

・季節変動:1年周期、サイクル。

・不規則変動:規則的でない変動。予測困難な偶然変動。

1.7.4 自己相関

・時系列データは周期を扱うので、同じ時系列の時点をずらして相関が重要

 

第2章 確率と確率分布・・・推測統計への準備

・データそのものではなく、そのデータのもとになっている集団について推測=>推測統計

2.6 モーメント

・平均や分散を一般化した概念をモーメントという

・モーメントは「原点周りのモーメント(ただのモーメント)」と

 「平均回りのモーメント(中心モーメント)」の2種類ある。

E[x^k]・・・k次のモーメント

E[(x-μ)^k]・・・k次の中心モーメント

 

・歪度・・・非対称の度合い:3次の中心モーメント/標準偏差の3乗

   平均を中心に対称:歪度=0

   平均を中心に右に長い裾:歪度>0

   平均を中心に左に長い裾:歪度<0

   多峰性であっても左右対称ならば歪度=0

 

・尖度・・・平均付近のとがり具合及び分布の:4次の中心モーメント/標準偏差の4乗

 

第3章 統計的推定

3.2 統計的な研究の種類

統計学の役割

   ー母集団の特性を知る方法の提供

   ー標本を正しく取り出す方法の提供(無作為抽出)

・母集団の特性を知る研究の種類

   標本から母集団を推測するため標本が偏りなく母集団の特徴を示す必要がある

   ー実験研究・・・研究対象に介入可能

   ー観察研究・・・研究対象に介入不可能

3.2.1 実験研究のデザイン

・条件設定が研究者自らの手でできるもの

・実験結果を比較するために「実験群」「対照群」に分けて実験

・比較したい条件設定を処理という

フィッシャーの3原則・・・無作為化、繰り返し、局所管理(ブロック化)

3.2.3 標本調査と抽出方法

・単純無作為抽出法

  -各個体が標本として選択される確率がn/N

  -個体の組が選択される確率が1/NCn

  -層化無作為抽出法・・・ブロック化に対応したもの(年齢、性別)

・系統抽出法

  -単純無作為抽出の簡便法

  -

・多段抽出法

・集落(クラスター)抽出法

3.3 点推定と区間推定

3.3.3 点推定

・刈込み平均

 フィギュアスケートの採点は9人のうち最高点、最低点を除いた刈込み平均を使う

・一致推定量・・・標本の大きさが大きくなると母数に近づく(大数の法則

         つまり、母集団の確率分布に近づく

・一致推定量になる条件

  標本平均の場合、母集団の分布が対称ならば一致推定量になる。