MOS excel 2016 specialist
1-1ワークシートやブックを作成する
・新規ブックを開く: Cntrl+N(Cntrl newの略)
・既存ブックを開く:Cntrl+O(cntrl openの略)
・テンプレートを使ったブックの作成
テンプレートを検索にキーワードを入れる
・ワークシート名の制限:¥ [ ] * : / ? は使えない
・ワークシートのコピー:Cntrl+ワークシート名 でコピーすべし
右クリックで子画面を選択してはいけない
・新規ワークシートを開く:Shift+F11
1-2ワークシートやブック内を移動する(検索する)
・指定セルへ移動:2種類方法あり(名前ボックス、ジャンプ)
Cntrl+G
名前ボックスはセルに名前を付ける。名前ボックスに入力で移動。
・ハイパーリンクの挿入(ハーパーリンク子画面の表示):Cntrl+K
1-3 ワークシートやブックの書式を設定
・ブックのテーマ変更:[ページレイアウト]tab=>[テーマ]tab=>テーマを選択
あんまり使えないような気がします。
自動で雰囲気(色、書体)を変更するが、パッとしない
・ヘッダーやフッターの挿入:[挿入]tab=>[テキスト]grp=>ヘッダーを選択
ヘッダー挿入時は「ページレイアウト」モード
「標準」モードに戻すには以下のステータスバーの左端押下
・行や列の挿入:cntrl++(子画面が出る)
1-4ワークシートやブックのオプションと表示をカスタマイズ
・表示モードの変更:ステータスバーの使い方
次の3つがある。「標準」「ページレイアウト」「改ページプレビュー」
「標準」:いつも使ってるやつ
「ページレイアウト」:印刷結果と同じ。ヘッダーフッター設定。
「改ページプレビュー」:印刷範囲等変更設定。
・表示倍率:Cntrl+マウスホイール
・列や行の非表示を行うと印刷されない
・ワークシートも非表示にできる
・ブックにプロパティがある:[ファイル]tab=>[情報]
詳細プロパティは下の画面です
1-5配布するためにワークシートやブックを設定する
・表の印刷時は、複数ページのワークシートに列タイトルと行タイトルを繰り返し表示
上を印刷プレビューで見ると
ページ毎に表のヘッダーがついていることが分かります。
便利な機能です。
・ブック内の非表示のプロパティや個人情報の検査
・ブック内のアクセシビリティの問題を検査
「アクセシビリティ」とは、視覚障碍者が音声読み上げソフトを使う時に
判別しにくい情報が含まれていないかどうかチェックする
・ブック内の互換性の問題を検査
よくありがちなexcel間のバージョンによる互換性をチェック
例えば、excel2010,excel97とか
2-1セルやセル範囲にデータを挿入する
・オートフィル機能
-フィルハンドルをダブルクリック <=これが一般的なハンドリング
-ダブルクリックが効くのは隣行(既存行)に合わせて最終行を判断
-隣行がなければダブルクリック効かない
*注意:オートフィルのオプション画面でオプションを選択できる
・フラッシュフィル機能
ー指定列で最終行に向けてオートフィルする機能 <=これが一般的なハンドリング
ーCtrl+E でできる<=これが一般的なハンドリング
-オートフィルのようにダブルクリックではできない
ーフラッシュフィル機能は隣の行の書きようを自動で真似するので同じ書き方にすること
2.1.5データを置換する
・置換 Ctrl+H
2.2 セルやセル範囲の書式を設定する
・太字の設定 Ctrl+B
2.2.2 セルの配置やインデントを変更する
2.2.3 セル内の文字列を折り返して表示する
・タブの中にすべて操作があるみたい。これが最近のトレンドみたい。
2.2.5 数値の書式を適用
2.3データをまとめる、整理する
2.3.1スパークライン
・「スパークライン」とは・・・セルに小さなグラフを入れること
・[挿入]tabの[スパークライン]を押下
2.3.2データのアウトライン
・「アウトライン」とは・・・表の縦軸、横軸をグループ化すること
統計検定2級
第1章 データの記述と要約・・・記述統計
1.2量的データの分布
1.2.1ヒストグラムの作成
・棒グラフとヒストグラムの違い
棒グラフ:質的変数、度数(相対度数)は高さ、横軸順序変更可能、
ヒストグラム:量的変数、度数は面積、横軸順序変更不可、
1.3 分布の特徴を表す指標
1.3.1 平均・分散・標準偏差
・平均:分布が左右対称であれば全観測値の中心を示すが、非対称の度合いが強くなると中心としての意味は弱くなる。
・標準偏差:データの「散らばり指標」
・左右対称であれば、平均・標準偏差が意味を持つ。(非対称であれば存在意義無)
1.3.2 標準化得点
・正規化・・・データを0~1に収める
・標準化・・・データを平均0、標準偏差1に収める
・白色化・・・データを
1.3.3 変動係数
・標準偏差と違ったデータの「散らばり指標」
1.3.4 中央値、最頻値
・非対称であれば意味を持つ
1.4 量的データの要約とグラフ表現
・量的データのグラフ:箱ひげ図
1.4.3 箱ひげ図
・外れ値があった場合は最大値が
1.5 質的データの度数分布とグラフ表現
・質的データのグラフ
-度数(相対度数):棒グラフ
-割合:円グラフ、帯グラフ
1.6 2変数データの記述と要約とグラフ表現
・2変数データのグラフ:散布図
・2変数データの表:クロス集計表
*注意:クロス集計表は、「質的データ」「量的データ」両方で使える
・相関関係と因果関係は異なる。相関係数が提示するのは相関関係。
・相関係数は、2変数間の直線性(線形性)について考察したもの
1.6.4 回帰直線
・相関係数:2つの変数xとyを対等に扱い、直線的な関連性の強さを表す
・回帰:2つの変数は対等ではなく、xからyを説明や予測する方向性を持つ必要がある
1.6.5 質的データのクロス集計表
・2元クロス集計表を作って、行パーセント・列パーセント・総パーセントの表を作ってみると関連性がつかみやすい。
・パーセントの表から、オッズ比
1.7 時系列データの記述と簡単な分析
1.7.2 指数化と幾何平均(時系列データの分析法)
・時系列データの分析:「差を見る方法」、「変化率で見る方法」
・複数の時系列の変化の比較法:
①指数化:ある時点を100とする
②
1.7.3 時系列データの変動分解
・傾向変動:長期的変動、影響一番大きいもの。周期というより上下変動。
・季節変動:1年周期、サイクル。
・不規則変動:規則的でない変動。予測困難な偶然変動。
1.7.4 自己相関
・時系列データは周期を扱うので、同じ時系列の時点をずらして相関が重要
第2章 確率と確率分布・・・推測統計への準備
・データそのものではなく、そのデータのもとになっている集団について推測=>推測統計
・
2.6 モーメント
・平均や分散を一般化した概念をモーメントという
・モーメントは「原点周りのモーメント(ただのモーメント)」と
「平均回りのモーメント(中心モーメント)」の2種類ある。
E[x^k]・・・k次のモーメント
E[(x-μ)^k]・・・k次の中心モーメント
・歪度・・・非対称の度合い:3次の中心モーメント/標準偏差の3乗
平均を中心に対称:歪度=0
平均を中心に右に長い裾:歪度>0
平均を中心に左に長い裾:歪度<0
多峰性であっても左右対称ならば歪度=0
・尖度・・・平均付近のとがり具合及び分布の:4次の中心モーメント/標準偏差の4乗
第3章 統計的推定
3.2 統計的な研究の種類
・統計学の役割
ー母集団の特性を知る方法の提供
ー標本を正しく取り出す方法の提供(無作為抽出)
・母集団の特性を知る研究の種類
標本から母集団を推測するため標本が偏りなく母集団の特徴を示す必要がある
ー実験研究・・・研究対象に介入可能
ー観察研究・・・研究対象に介入不可能
・
3.2.1 実験研究のデザイン
・条件設定が研究者自らの手でできるもの
・実験結果を比較するために「実験群」「対照群」に分けて実験
・比較したい条件設定を処理という
・フィッシャーの3原則・・・無作為化、繰り返し、局所管理(ブロック化)
3.2.3 標本調査と抽出方法
・単純無作為抽出法
-各個体が標本として選択される確率がn/N
-個体の組が選択される確率が1/NCn
-層化無作為抽出法・・・ブロック化に対応したもの(年齢、性別)
・系統抽出法
-単純無作為抽出の簡便法
-
・多段抽出法
・集落(クラスター)抽出法
・
3.3 点推定と区間推定
3.3.3 点推定
・刈込み平均
フィギュアスケートの採点は9人のうち最高点、最低点を除いた刈込み平均を使う
・一致推定量・・・標本の大きさが大きくなると母数に近づく(大数の法則)
つまり、母集団の確率分布に近づく
・一致推定量になる条件
標本平均の場合、母集団の分布が対称ならば一致推定量になる。
・
読書感想文
僕は君たちに武器を配りたい
第1章勉強できてもコモディティ
どんどん広がる全産業の「コモディティ化」
・市場に出回っている商品が、個性を失ってしまい、消費者にとればどのメーカーのどの商品を買っても大差がない状態 => 「コモディティ化」
・「個性のないものはすべてコモディティ」
あらゆるものが買い叩かれるコモディティの市場
・コモディティ化した市場で商売することの弊害=>「徹底的に買い叩かれること」
・コモディティ化するのは商品だけではない
・労働市場の人材評価においても、コモディティ化は避けられない。
・資格やTOEICの点数といったコモディティ化した人材市場でも、応募者の間で「どれだけ安い給料で働けるか」という給料の値下げ競争が始まる。
高学歴ワーキングプアが生まれる背景
「スペシャリティ」だけが生き残れる
・「ほかの人には代えられない、唯一の人物」
・「スペシャル」な地位は決して永続的なものではない。
・ある時期にスペシャルであったとしても、時間の経過に伴い必ずその価値は減じて
いき、コモディティへと転落していく
第2章「本物の資本主義」が日本にやってきた
「正しい人が勝つ」のが資本主義
・資本主義の社会でのお金の増やし方=>「より少ないコストで、みんなが欲しがるものを作った人」
・コストを削って作った商品はさらに魅力がなくなり、ますます売れなくなる。
産業が発展すると、労働者は・・・
・工作機械の制度向上で、熟練労働者が不要になった。コストを抑えるために安い賃金で雇える人を採用。=>貧富の格差が拡大 =>技術革命
賃金が下がったのは技術革新のせい
・コモディティ化した労働者がそこに入っても、高品質な製品が作れるようになったことが賃金下落の本当の原因
・産業の成熟化が進み、熟練労働者が必要なくなれば、労働者は必然的に買い叩かれる存在となる
国レベルでビジネスモデルが陳腐化した日本
・工作機械の進歩がすさまじく、中国に対して品質やコストで差をつけることが難しい
・日産の「1/100から1/1000の技術」のキャッチフレーズは経営戦略の致命的な誤り
・1/1000の違いを感じ取れるユーザーは存在しない。
・ユーザーが「分からない差異は差異ではない」。
「すり合わせ」はもう時代遅れ
・電気自動車は、制御装置を簡略化でき、部品点数も大幅に減らせる。
技術的ハードルが低く、新規参入容易。
・アップルのiphoneですら中国で作れる。
第3章学校では教えてくれない資本主義に現在
なぜほとんどの学生ベンチャーは失敗するのか
・一番よくある失敗は「コモディティ会社」を作ること
例)文系の学生が家庭教師の派遣会社を作る
理系の学生がシステム会社を作る
・多くの会社が乱立し、過当競争が起きていて、産業としては古い。
・たまたま成功しても、「労働力が若いため安い」「ヒマだから仕事が早い」と
いった一時的な競争力である。
・「ブームとなってから投資すると死ぬ」
・誰も投資など考えられない、焼け野原で投資して、誰よりも早く実った果実を回収する。
一寸先は闇の金融業界
・ビジネスで利益の果実を得られるのは、最初に参入した少数の会社のみである。
・外資系証券が日本の土地やビルを底値で買いあさり、2003年ごろからミニバブルで売り抜けて、莫大な収益を上げた。
投資は地面に死体が転がっている時に
・ロスチャイルド家の考え方「地面に死体が転がっているような不景気な時に投資し、まだ早すぎるというタイミングで売り抜けろ」
・
流行に乗るのは危険
・「現在絶好調な会社」に就職することは、言葉を変えると「数年後にほぼ間違いなく
輝きを失っている会社」に就職することとほとんど同義である。
・どんな素晴らしい会社も未来永劫その価値を維持し続けることはできない
・働く個人が常に経済的、社会的に高いポジションを維持するためには、次にどのビジネスモデルがせいこうするか潮流を見極めながら転職を繰り返すことが必然の行動である。
・投資の世界では「高すぎる株を買ってはいけない」というのが常識。
会社選び同じで、就職先が高すぎる状態になっていないか、よく考えてみる必要がある。
若者を奴隷にする会社
・「勘違いカリスマ社長が君臨し、イエスマンだけが役員に残り、社員はみな奴隷」
・商品自体がコモディティ商品であるため利益を出すには給料を下げて従業員を
搾取するしかない
・「うちの会社はお客さんが儲けさせてくれるのではなく、社員が儲けさせてくれている。
ニッチな市場に目を付ける
ダメな方法「業界全体で何万人の雇用が生み出されるか」ではなく
イイ方法「今はニッチだが現時点で自分が飛び込めば、数年後に10倍、20倍の規模になっているかもしれない」
・ビジネスモデルが「顧客をバカにしている」「馬鹿な顧客をターゲットとしている」会社は長期的に未来がない
第4章 日本人で生き残る4つのタイプと生き残れない2つのタイプ
儲かる漁師と儲からない漁師
・儲からない漁師:自分で何も考えず、ただ人に使われているだけの漁師
=>「単なる労働力」「コモディティ」
「資本主義社会の中で安い値段でこき使われず(コモディティ)にならず、主体的に
稼ぐ人間になるためには、以下の6タイプ」
・トレーダー:「体力と根性」型
・エキスパート:自分の専門性を高めて、高いスキルによって仕事する人
・マーケッター:「付加価値」をつけて、市場に合わせて売ることができる人
・イノベーター:まったく新しい仕組みをイノベーションできる人
・リーダー:自分が起業家となり、みんなをマネージしリーダーとして行動
・インベスター:投資的として市場に参加する人
価値を失っていく2つのタイプ
・「トレーダー」「エキスパート」
・「トレーダー」的な業種は、「右から左へ」と渡すことで稼いだ企業は経営が苦しい
・商社、旅行、広告などの「代理」業務を行う会社はインターネットの普及でビジネスモデルの構造転換が求められる
トレーダー、必死の生き残り策
・広告会社の花形:アカウントエグゼクティブと呼ばれる営業職のプロ
・AEが自社のマーケッター、クリエイター、メディアプランナーとチームを組んで広告を行ってきた
・多くの企業が広告費を縮小、広告制作費とメディア購入費のコストカットを代理店に要求
・クリエイター、マーケッターのような専門性を直接クライアントにサービスを提供できる人(例えば佐藤可士和)
エキスパート、変化に乗り遅れる
・変化のスピードが速く付いていけない
・専門知識を身に付けても、その先にあるニーズが社会変化に伴い消えると、知識の必要性自体が一気に消滅する
消えゆく業種でも「スペシャリティ」は稼ぐ道がある
第5章企業の浮沈のカギを握る「マーケター」という働き方
マーケターとは「顧客」の需要を満たす人
・望ましいのは、 1人のビジネスパーソンが状況に応じて、4つの顔を使い分けること。仕事に応じて、時にはマーケターとして振る舞い、ある機会には投資家として活動していく。
・マーケターとは「顧客の需要を満たすことができる人」
・大切なのは「顧客自体を新たに再定義すること」=「人々の新しいライフスタイルや新たに生まれてきた文化的な潮流を見つけられる人」
・マーケターは、自分自身で何か画期的なアイディアを持っている必要はない。
・マーケターは、かすかな動きを感じ取る感度の良さと、なぜそういう動きが生じてきたのかを正確に推理、分析
・マーケターは、「ストーリー」「ブランド」といった一見とらえどころのないふわふわした付加価値や違いを作れること
・資本主義社会では、革新的な商品を開発しても、すぐに別会社がコモディティ化してしまう。
・企業が衰退を避けるには、イノベーションを繰り返して、商品の差異を作り続けなければならない
猛烈なコモディティ化に対抗する唯一の手段
・全産業の「コモディティ化」が進む世の中で、唯一の富を生み出す時代のキーワードは「差異」である
・ 「差異」 = 「ストーリー」
・マーケターとは・・・「差異」=「ストーリー」を生み出し、発見し、適切な市場
を選んで商品を売る戦略を考える人
成功するビジネスには「ストーリー」がある
・マスコミで情緒的な言葉を使ったキャッチフレーズを使う理由は、マーケティング的な視点で考えると理解できる
・マスメディアは人口の多い層をターゲットにする。日本の労働人口は製造業従事者が最も多いターゲットである。したがって、その層の耳障りの良いストーリーをメディアは流したい。
・重要なのは「キャッチフレーズの中身」ではなく、「エモーショナルなストーリー」である
商品にストーリーを乗せて売る
・「レッツノート」のセールスポイントは、PCのスペックではない
・ただ単に製品としてのノートパソコンを売るのではなく、「できるビジネスパーソン」というイメージを、PCに乗せる売っている。
・Wiiが発売前にゲーム業界全体の売上は落ち込んでいたが、そこが1つ目のチャンスであった。2つ目のチャンスは、「1人で遊ぶ」=>「複数で遊ぶ」というコンセプトを考え出した。コンセプトがすぐれていた。
「欲しかった商品だ」「売れなかったら会社を畳む」ストーリー
・コンセプトがすぐれていてヒットした商品に「ポメラ」がある。
役員の全員が販売発売に反対したが1人だけ賛成してヒットした。
・「ポメラ」はごく一部の人にしか必要とされないが、熱烈に欲しがってもらえる商品という思いを救い上げて、それを商品という形に結実させたマーケターの感性が光る仕事であった。
ブランドにイメージを乗せる
・現代のビジネスではあらゆる業態で、いかにコモディティ化しないストーリーを商品で作り出すことが出来るかが死命を分ける。
・ユニクロもストーリーをつくることで成功した。
・柳井氏は「ファッションビジネスでは何よりブランディングが大切」ということに早くから気が付いていた
・グローバルに活躍するクリエイティブに強い広告代理店を活用
・佐藤可士和という第一線で活躍するアートディレクターにロゴデザインおよびCIを一任=>都会的、グローバルイメージを作る
・ユニクロの商品は「超コモディティ」である。大手小売チェーンが驚く価格で売ったが短期間で追いつかれた。しかし、「イメージ戦略」によって息を吹き返した。
・ファッションは「コモディティ」と相容れないが「イメージ戦略」によって「コモディティ」のブランド化に成功した。=>既存のファッションとは違う文脈で売ることに成功した。=>マーケティング戦略がユニクロの躍進の本質
・ユニクロは戦略的に自社のブランドを「効率的・合理的・洗練されている」イメージ付けた。
=>ユニクロの服を着ても「効率的・合理的なライフスタイル上の選択」と見えるようにした。
=>「安くてダサい服を着る人」とは見られなくなった。
=>ブランディングのためメディアに登場、経営システムの先進性・合理性を繰り返し訴えた
コストダウンと差異の両立
・スティーブジョブスも「イメージとストーリー作り」に長けた経営者であった
・IBMもブランディングに成功した。ハードだけでなくITサービスまで提供する「e-ビジネス企業」へと大きく舵を切った。
・2002年以降のIBMはコモディティ化したノートPC、ハードディスク部門を売却した
*企業や商品で差をつけることは難しい。差をつけるには、ターゲットとなった顧客が共感できるストーリーを作ること
*マーケターとは新しくない要素の組み合わせで「差異」を作り出せる人のこと。これからのビジネスは「差異」が左右する。
新市場で再帰を図るコモディティー企業
・コモディティー化によって、落ち目企業も、マーケティングに成功し、復活することができる。
・NOK:自分たちのスキルが市場価値を持つ新しい市場に打って出ようと考えた。
・ガラスメーカー:世界レベルで同業他社を買収して、スケールメリットで利益を出すことで生き残りを図ろうとしたが失敗。携帯屋にガラスを売ると車屋に比べて何倍もの利益を出すことが出来るようになった
*ある分野でコモディティ化したして価値を失った技術でも、まったく別の分野に応用することで新しい価値を生み出す可能性がある
個人の働き方にも重要なマーケティング的発想
・個人の働き方においても、マーケティング的視点で工夫することが「稼げる人」と「稼げない人」を分けるポイントとなる。
・資格を持っていることやTOEICの点数が高いといった「高性能・高品質」といったものを売りにする人は、もはや通用しない。
・マーケティング的な発想をすることで、自分の「適切な売り方」を変えることができる
・英語教師の事例:ダメ高校で英語教職に失望。英会話学校を企業したがビジネス英会話に対応できず、経営難。外国人向けの日本語教師になり大当たりした。
・短大の家庭教師の事例:「短大の家庭教師」に需要がなかった。「偏差値40以下の中学生だけを教える家庭教師」で大当たり。
*個人の働き方においても自分の「ビジネスモデル」を環境の変化に合わせて変えていくことが求められるのである。
統計検定3級
◎間違えそうな量的変数と質的変数
・量的変数:年齢
・質的変数
◎回帰分析
・相関係数は、2つの変数の直線的な関係の強さを測る。
・回帰分析は、2つの変数になんらかの因果関係を想定する。
◎幾何平均
・データをすべて掛ける。そして、データ数でルートする。
◎乱数表
・乱数表はどんな数字も同じ確率で選ばれるので、あらゆる数字の並びの可能性がある
◎質的変数の棒グラフ
・選択肢(カテゴリ)に順番がある場合、棒グラフを描く際にもこの順序で並べる。
・選択肢(カテゴリ)の度数を度数の合計で割った割合で描いても良い。
◎連続変数に対するヒストグラム
・階級幅を常に同じにする必要はない。しかし、幅が小さくなると度数も小さくなるので注意が必要である。
・棒グラフと同じで各階級の順番を変更してはならない。
・「柱の高さ」ではなく「柱の面積」を度数とする
◎共分散
・共分散は変数の単位に依存するが、相関係数は単位に依存しない
・2変数の関係の強さを測る指標として、共分散があるが、所詮、正の相関か負の相関
かが分かるだけである。
◎相関係数
でもこれをもろに計算するのはめんどい。
分子の共分散=xyの積の平均ーxの平均*yの平均
xの平均、yの平均、xyの積の平均、xの標準偏差、yの標準偏差の5個のパラメータを求めよ。
結局のところ以下の式
=xy積の平均ーxの平均×yの平均/xの標準偏差*yの標準偏差
・共分散は変数の単位に依存するが、相関係数は単位に依存しない
◎相関関数の特徴
・相関の強さは、直線的な関係の強さを示している
つまり、ほぼ直線状に並んでいれば相関が強い
また、相関係数がー1、1であれば、直線である。
・相関の強さで、予測できるかどうかを評価できない。
例えば、相関0でも、曲線的な関係がある場合、予測できる。
・相関係数の片方のデータにバイアスを乗せても値に変化なし:2017年6月 問17
・
◎代表値と階級値
・代表値=階級値
・度数分布表の各階級を代表する値を階級の代表値又は階級値と呼ぶ
・各階級の代表値は、階級の上限と下限の平均値(階級の真ん中の値)にすることが多い
◎度数分布からの平均
・方法1
①階級の最小値だけで平均値を求める
②階級の最大値だけで平均値を求める
③正しい平均は①②の間に必ず入る
・方法2
ヒストグラムで平均値を元データと同じように求められないため
階級値で代用して考える
◎Zスコア、変動係数
・Zスコア=観測値ー平均値/標準偏差
・変動係数=標準偏差/平均値(ばらつきが平均値の何%か?)
◎変数の標準化(基準化)
・観測値への処理=観測値ー平均値/標準偏差・・・基準化
・基準化:平均値 0、標準偏差 1
・偏差値:平均値50、標準偏差10
50+10×得点ー得点の平均値/標準偏差
◎選択率とは
「年齢別人口構成比」と「年齢別選択率」があった場合
それぞれの積を行い、これらの和が選択率となる。
◎統計的問題解決におけるデータの収集
・「統計的な問題解決の一手法」=>巡回型プロセス「PPDAC」サイクル
・統計学・・・P:「知見を得たい集団」を明確化:問題の明確化
P:「適切に計画」:実験、調査の計画
D:「実験や調査」:データ抽出、収集
A:「統計モデル」=>情報抽出、グラフ
C:「集団やメカニズム」に関する知見を得る:問題の解決
・問題の明確化・・・「得られたデータで結論が出せる」というレベルまで具体化
◎実験研究と観察研究
・実験研究:対象者に介入を行う研究
・観察研究:対象者に介入を行うことなく自然の状態を観察する研究
国が実施している基幹調査
全数調査または標本調査の理解を問われる。
1.家計調査
・総務省、標本調査
・層化3段抽出法
2.国勢調査
・総務省、全数調査
・5年に一度(西暦一桁が0と5の年に)
・結果はインターネットで公表される
・統計法で回答を義務づけられている
・回答方法:調査票を調査員に直接提出と郵送提出とインターネット提出の3種
・対象者:日本国内にふだん住んでいるすべての人(外国人を含む)及び世帯
3.学校基本調査
・文部省、全数調査
・学校教育法、市町村教育委員会
4.国民経済計算
・内閣府、
・我が国の経済の全体象を国勢比較可能な形で体系的に記録することが目的
◎調査票について
・個人情報は含めてよい
・調査対象は一般の住民
・調査対象は誰にでも分かりやすい文章にすべき
・調査票の選択肢は「分からない」を含めてもよいし、含めなくてもよい
◎全数調査と標本調査
・特徴傾向を知りたい集団・・・母集団 <=> 標本
・標本に含まれる人数等・・・標本の大きさ *注意:標本数ではない。
・標本を偏りなく抽出する方法・・・確率的な現象を用いて、母集団から同確率で抽出
ー単純無作為抽出法:母集団に含まれる固定に全て異なる番号を付けて抽出
ーくじ、サイコロ、乱数表(アナログ、コンピュータ)
◎標本調査と誤差
[概要]
・標本調査を行うと発生する誤差:「標本誤差」「非標本誤差」
・2つの誤差:さらにその性質によって「偶然変動」「偏り」に区別される
[]
・標本誤差・・・「全数調査」と「標本調査」の間の誤差
-全数調査の場合、存在しない
-統計学の知識に基づいて理論的に計算・評価する
・非標本誤差・・・標本誤差以外の誤差
-調査の計画段階での誤差
-調査単位観察の段階の誤差
-結果の整理・解析・発表段階での誤差
例)回答者の疲労、質問文の不備
・偶然変動・・・誤差の生じる方向が真値に対して過大、過小に偏らせる要因なし
・偏り・・・過大、過小の一方向に偏らせる特定の要因あり
[特徴]
・全数調査でない限り、「標本誤差」「非標本誤差」は避けられない。
・非標本誤差は、全数調査の方が大きい
・全数調査と標本調査の精度は比較できない
◎分散と相関係数
・散布図上で特定データが平均より離れるとデータの分散は大きくなる
・散布図上で特定データが他のデータに近い傾向に移動すると相関関数は大きくなる
・相関係数の片方のデータにバイアスを乗せても値に変化なし
◎単純無作為抽出
・標本を偏りなく抽出する方法・・・確率的な現象を用いて、母集団から同確率で抽出
ー単純無作為抽出法:母集団に含まれる固定に全て異なる番号を付けて抽出
ーくじ、サイコロ、乱数表(アナログ、コンピュータ)
グラフ・表
1.棒グラフ(ヒストグラム)
・主にカテゴリの度数の比較に適したグラフ
・主にカテゴリの割合の比較でも良い
・量の大小を比較
・
2.折れ線グラフ
・推移を表すグラフ
3.散布図
・2変数の関係を見る
4.帯グラフ、円グラフ
・割合構成を比較
-コンビニの1時間ごとの顧客の年齢層の割合
・複数のグループの比較、年次的な変化を調べる=>帯グラフ
5.箱ひげ図
・箱ひげ図から平均は求められない
・箱ひげ図では単峰であるかは判断できない(複数の山をもつ場合は表現できない)
・量的変数の散らばり具合を表す
・左右のすその長い型、対称型の区別を表す
6.モザイク図
・クロス集計表から「縦棒の積み上げグラフ」「横幅は各層の度数」として表したグラフ
・面積が各セルの度数に比例した大きさになる。
7.クロス集計表
・質的変数の出現度数
・
8.積み上げ棒グラフ
・度数の変化を見る
9.乾葉図
・平均を求めるときは、先に10の位を計算して、次に1の位を計算すると少し楽になる
第7章 確率変数と確率分布
1.確率変数と確率分布の考え方
・確率変数は起こりうる事象に対して値xを割当てること。
コラム 確率から確率変数への拡張(展開)
・確率は、特定の事象に対して「確率を一意に決めることが目的」であった。
・確率変数は、複数の事象に対して「確率がどのような分布を示すのかを知ることが目的」である。
第9章 統計的な推測
1.統計的な推測
母平均、母比率と標本平均、標本比率
・標本比率とは・・・頻度論の確率は、試行を重ねて確率を求める。
この確率は標本比率の1例である。標本比率=標本確率
・統計学を用いて知りたいのは、標本調査で得られた標本平均や標本比率の信頼性。
・信頼性を測るには標本平均や標本比率がどのような分布に従うかを知っておく必要がる。
標本分布(標本平均)
・標本分布とは・・・標本平均や標本比率などの標本から推定された量に関する分布
・標本分布の作り方・・・母集団から繰り返し大きさnの標本を無作為抽出し、そのたびに標本平均を計算したとすれば、これらの値は母平均のまわりに分布する。
例)サイコロ10回投げを5回行う。それぞれの標本平均を計算したならば、
3.6、3.8、4.0、3.4、3.2
これらの値は母平均3.5の周りに分布することが
この繰り返しを無限回行う=>標本平均の標本分布が出来上がり!!
これから標本の大きさ・・・10回、試行回数・・・5回
試行回数を無限回行えば、標本平均は母平均に近づく=>大数の法則
試行回数を無限回行えば、標本平均の分布は正規分布に近づく=>中心極限定理
コラム
標本分布の話は、「標本平均」が多い。これは、「大数の法則」「中心極限定理」は
平均を議論の根っこになってあるから。
標本分布(標本比率)
ここまでは、標本平均の確率収束について考えた。
コラム 標本分布と確率分布の違い
標本分布は、標本したデータの分布。標本平均ならば母平均に収束する分布となる。
確率分布は、確率変数がどのような確率を取るかの分布。
◎過去問
・外れ値について
ー外れ値の発生要因にフォーカスを当てて考える必要がある。
ー外れ値の発生要因
「観測ミス」「記載ミス」「データ特性上発生しうる場合」
ー「観測ミス」「記載ミス」の場合、取り除くことが望ましい
ー「データ特性上発生しうる」場合、必ずしも取り除くべきでない
・選択率:2018年6月 問14
・分散、相関係数がどのように変化するかを散布図から判断:2018年6月 問23
・相関係数の片方のデータにバイアスを乗せても値に変化なし:2017年6月 問17
・74.46%≒74.5%=75%
・2018年11月:傾向を読み取るが割合があっていても、絶対数の違いが大きすぎるが
割合通りの
統計検定4級
問題解決のサイクル
・PPDACサイクル・・・問題解決フレームワーク
・P(Problem)・・・課題の設定
・P(Plan)・・・計画
・D(Data)・・・データの収集
・Analysis・・・分析
・Conclusion・・・とりあえずの結果
・課題解決やデータ分析、A/Bテスト
四分位数
・全体を4分割する
・5つのデータ:最大値、最小値、第1~3四分位数
・第1~3四分位数:中央値を示す・・・結局度数です
・第1四分位数(Q1):下半分の中央値
・第2四分位数(Q2):中央値
・第3四分位数(Q3):上半分の中央値
・四分位範囲(IQR):Q3-Q1
・四分位偏差:(Q3-Q1)/2
標本調査
・標本の選び方・・・無作為抽出法
・無作為抽出法の道具・・・乱数表、乱数さい
・無作為抽出をすると・・・母集団から選ばれる確率が等しくなる
母集団の特性を持つ標本が出来る
統計の調査項目
①質的データ
例)体力測定時の最初に行った種目名
②量的データ・・・数量をして記録したデータ
・大きさ
・量
事例)
・配達希望時間・・・時間は質的データ、午前中希望とかあるから。
単純に「数字で表せる」か、「数字以外で表す」かで判断すべし。
あまり、内容を深く考える必要はない。
度数分布表・・・データの散らばり具合を知る
・階級
・階級の幅:各区間の幅(bin)
・度数:その階級のデータの個数
・階級値:各階級の幅の真ん中の値
例)「階級の幅」が10~25の時
「階級値」は10+25/2=17.5
データの代表値
・平均
・中央値(median):階級もしくは階級値を昇順に並べて奇数番目の真ん中、偶数時は平均
例)度数が47個の場合、中央値は47/2=23.5≒24番目が中央値
・最頻値(mode):度数が最も多い階級、2つあっても平均しない
*注)偶然同じ度数が2つある場合は、2つ共に最頻値(平均しないこと!!)
グラフについて
・比(%)グラフ・・・帯グラフ、円グラフ
・数量グラフ・・・積み上げ横棒グラフ、幹葉図、ヒストグラム
・変化を表す・・・折れ線グラフ
・分布を表す・・・ヒストグラム
・0%から始まり100%で終わる・・・累積相対度数折れ線
・度数の棒グラフ+累積相対度数の折れ線グラフ・・・パレート図
・数え上げ(正)・・・タリ-チャート
各グラフの特徴
・折れ線グラフ・・・**時間変化**を示す
・帯グラフ・円グラフ・・・全体に対する各項目の**割合**
・面グラフ・・・割合の加算
・累積相対度数分布・・・累積かつ%で表す=>
*注)比グラフ/数量グラフの選択は出題される:2018年11月問題5
ヒストグラムから平均値を推定
・方法1・・・2017年11月問題10
①階級の最小値だけで平均値を求める
②階級の最大値だけで平均値を求める
③正しい平均は①②の間に必ず入る
・方法2・・・2018年6月 問題12
ヒストグラムで平均値を元データと同じように求められないため
階級値で代用して考える
ヒストグラムの注意点
・ヒストグラムのbinはどれも同じとは限らない。(2016年6月 問題9)
例)0以上20点未満、20点以上30点未満、30点以上40点未満
といった感じで「0点以上20点未満」だけ他のbinに比べて2倍となる。
度数分布からヒストグラムを起こす時に「0点以上20点未満」は度数を
半分にしなければならない。
指数表について
・指数・・・データの一部を100として、その他のデータを相対的な%で表したもの
グラフの読み方について
・データの上昇傾向か否かは、データの最初と最後で判断すべし
2018年11月問題24
・
間違ったところ
・2018年11月 問題12、問題13、問題18
・2018年6月 問題12、問題14
・2017年11月 問題10
参考
・ハロー!パソコン教室 イオンモール和歌山校
・試験日:2020年8月~10月の土曜、日曜
統計検定4級
◎統計の調査項目
①質的データ
例)体力測定時の最初に行った種目名
②量的データ・・・数量をして記録したデータ
・大きさ
・量
◎度数分布表・・・データの散らばり具合を知る
・階級
・階級の幅:各区間の幅(bin)
・度数:その階級のデータの個数
・階級値:各階級の幅の真ん中の値
例)「階級の幅」が10~25の時
「階級値」は10+25/2=17.5
◎データの代表値
・平均
・中央値(median):階級もしくは階級値を昇順に並べて奇数番目の真ん中、偶数時は平均
・最頻値(mode):度数が最も多い階級、2つあっても平均しない
*注)偶然同じ度数が2つある場合は、2つ共に最頻値(平均しないこと!!)
◎グラフについて
・比(%)グラフ・・・帯グラフ、円グラフ
・数量グラフ・・・積み上げ横棒グラフ、幹葉図、ヒストグラム
・変化を表す・・・折れ線グラフ
・分布を表す・・・ヒストグラム
・0%から始まり100%で終わる・・・累積相対度数折れ線
・度数の棒グラフ、累積相対度数の折れ線グラフ・・・パレート図
・数え上げ(正)・・・タリ-チャート
◎ヒストグラムから平均値を推定
・方法1
①階級の最小値だけで平均値を求める
②階級の最大値だけで平均値を求める
③正しい平均は①②の間に必ず入る
・方法2
ヒストグラムで平均値を元データと同じように求められないため
階級値で代用して考える
◎ヒストグラムの注意点
・ヒストグラムのbinはどれも同じとは限らない。(2016年6月 問題9)
例)0以上20点未満、20点以上30点未満、30点以上40点未満
といった感じで「0点以上20点未満」だけ他のbinに比べて2倍となる。
度数分布からヒストグラムを起こす時に「0点以上20点未満」は度数を
半分にしなければならない。
参考
・ハロー!パソコン教室 イオンモール和歌山校
・試験日:2020年8月~10月の土曜、日曜