#author("2024-05-07T08:26:24+09:00","default:cmdsadmin","cmdsadmin")
* 第1回:数理統計:母集団に対する統計的推測 [#je9709f5]
#author("2024-05-07T10:35:30+09:00","default:cmdsadmin","cmdsadmin")

#contents

* 1.1 数学の前提知識 [#ref198ec]

本論に入る前に,数学に関する知識が必要となるので必要事項をまとめる.

** 集合 [#q4ed51b4]

要素の集まりを''集合''という.ただし,この集合は,数学的に範囲が明確な要素の集まりでなければならない.

*** 集合の例 [#u87fb79a]

- 1以上13以下の整数
- 150以上160以下の実数

*** 集合でないものの例 [#x0dbad55]

- イケメン
- 賢い人

** 全体集合,空集合,集合の演算 [#lce73ff3]

#ref(./fig01.png,70%)

*** 全体集合 [#f3f4b476]

要素全体の集合を''全体集合''といい,Ωで表す.

*** 空集合 [#z0960a14]

要素を持たない集合を''空集合''といい,φで表す.

*** 和集合 [#lcf6159f]

Aの要素またはBの要素からなる集合を''AとBの和集合''といい,A∪Bで表す.

*** 積集合 [#o2e5a924]

Aの要素かつBの要素からなる集合を''AとBの積集合''といい,A∩Bで表す.

特にA∩B=φとなるとき, ''AとBは排反である''という.

*** 事象 [#o78469f6]

実験結果を要素にもつ集合を''事象''という(事象に対する上記4つをそれぞれ,全事象,空事象,和事象,積事象,排反事象という).

** 可算集合,非可算集合 [#bc6df494]

集合には数えられる集合(''可算集合'',とびとびの値をとる集合)と数えられない集合(''非可算集合'',連続的な値をとる集合)がある.変量(特徴量)のとり得る値の集合が可算集合であるか非可算集合であるかによって用いられる確率分布も異なってくる.

- 可算集合の例

サイコロの目(1,2,3,4,5,6),事故の件数(0,1,2,…)

- 非可算集合の例

身長(0より大きい実数)

#ref(./fig02.png,70%)

** 組み合わせ [#h11344dc]

n個からr個選ぶ場合の数

#ref(./fig03.png,70%)

ここで,n!はn×(n-1)×…×2×1である.

** 数列の極限 [#e60d34c7]

数列{a_n}について考える.nが大きくなるにつれてa_nがaに近づくとき

#ref(./fig46.png,70%)

とかく.aをa_nの''極限値''という.

- a_n = 1-1/nとするとき,a_nの極限値は1である.

** 定積分 [#bbe4e8bd]

関数f(x)をxがa以上b以下の範囲で積分する計算を

#ref(./fig04.png,70%)

で表す.これはx軸とf(x)で囲まれる部分の符号付面積を表す.つまり,以下の図でx軸よりも上の部分(赤の斜線部分)の面積を足し,x軸よりも下の部分(青の斜線部分)の面積を引いた値となる.

#ref(./fig05.png,70%)

** 確率 [#ed9eb9f7]

現在の確率論や統計科学における''確率''の定義は''公理的確率''が採用されている.

*** 数学的確率 [#vef30da5]

全事象Ωの場合の数をn,事象Aの場合の数をrとする.このとき,P(A)=r/nとする.

この定義の問題点:
- 数学的確率でじゃんけんでグーを出す確率は1/3.すぐにグーを出す癖のある人にとってこれは確率の定義として妥当であるか?
- 身長が150cm以上160cm以下となる確率を計算するとき,「150以上160以下の実数」は非可算集合.

*** 統計的確率 [#wda10efa]

試行を無限に繰り返し,事象Aが起こる割合がpAに近づくとする.このとき,P(A)=pAとする.

この定義の問題点:
- 試行回数を無限回にするとは…?(現実的には多くても有限回)

*** 公理的確率 [#la22dffd]

次の3条件を満たすPを''確率''という.(確率として成り立っていてほしい式をまとめたものになっている)

#ref(./fig06.png,70%)

** 確率変数 [#pd3ab00b]

事象を簡単に表すために,''確率変数''を用いる.例えば,サイコロを1回投げて奇数が出る確率を

P(X=1,3,5)

と表すために用いられる変数を確率変数という.確率変数が離散型か連続型かによって用いられる確率分布が異なるので注意すること.

*** 離散型確率変数 [#k509563a]
確率変数がとり得る値の集合が可算集合である場合(とびとびの値をとる場合)

-例:回数を表す確率変数,故障の件数を表す確率変数

*** 連続型確率変数 [#a77dd8e2]
確率変数がとり得る値の集合が非可算集合である場合(連続的な値をとる場合)

-例:濃度を表す確率変数,利率を表す確率変数

*** 確率変数の独立 [#mc9667e1]

確率変数X, Yについて,すべてのX=x, Y=yの組み合わせでP(X=x, Y=y)=P(X=x)P(Y=y)が成り立つとき,''XとYは独立である''という.

* 1.2 確率分布 [#r1759306]

''確率変数Xの確率分布を求めるとは,すべてのXの範囲で確率を求められるようにすること''である.

つまり,確率分布がわかっていれば,どんなXの範囲でも自由に確率を求められる.

** 離散型確率分布 [#c68e5981]

離散型確率変数Xの確率分布を総じて''離散型確率分布''という.

*** 離散型確率分布の基礎 [#l2c5de57]

ここでは

P(X=1)=1/12, P(X=2)=1/12, P(X=3)=1/3, P(X=4)=1/12, P(X=5)=1/3, P(X=6)=1/12,P(X≠1,2,3,4,5,6)=0

を例として,基本的な計算を身につけることとする.

- ''確率関数'' f_X(x)=P(X=x) (X=xとなる確率を表す関数, xは''実測値'')

#ref(./fig07.png,50%)

#ref(./fig11.png,70%)

- ''分布関数'' F_X(x)=P(X≦x) (Xがx以下となる確率を表す関数)

#ref(./fig10.png,50%)

- ''平均'' E(X)=∑xf_X(x)=μ (直感的にはXの確率分布の重心)

#ref(./fig08.png,50%)

- ''分散'' V(X)=∑(x-μ)^2 f_X(x)=σ^2 (Xの確率分布のばらつき)

#ref(./fig09.png,50%)

*** 離散型確率分布の例 [#vfd1b082]

- ''ベルヌーイ分布'' (パラメータ:E(X)=p,確率分布をBe(p)で表す)

あるメダルは1回のコイントスで,表が出る確率がpであるとする.

#ref(./fig22.png,70%)

1回コイントスをしたとき,x回表が出る確率は以下の確率関数で表される.

#ref(./fig23.png,70%)

つまり,1回の試行で得られる結果が2通りである場合に用いられる確率分布である.

- ''二項分布'' (パラメータ:n, p,確率分布をBinom(n, p)で表す)

n人患者がおり,1人が感染症に罹患する確率をpとする(ただし,各々の感染は互いに独立に起きるものとする)


#ref(./fig24.png,50%)

n人のうちx人が感染症に罹患する確率は以下の確率関数で表される.

#ref(./fig25.png,50%)

つまり,n回の独立試行で得られる結果がそれぞれ2通りである場合に用いられる確率分布である.

なお,E(X)=np,V(X)=np(1-p)である.

- ''ポアソン分布'' (パラメータ:μ,確率分布をPo(μ)で表す)

1ヶ月の自動車の平均事故件数をμ(=E(X))とする.

#ref(./fig26.png,70%)

1ヶ月の事故件数がx件となる確率は以下の確率関数で表される.

#ref(./fig27.png,50%)

ただし,e≒2.71828である.ポアソン分布は,二項分布においてn→∞,p→0,np→μとした場合の確率分布である.そのため,たくさんの試行回数で起こることが稀な事象が起こる件数を扱う際に用いられる確率分布である.

** 連続型確率分布 [#j03e3682]

連続型確率変数Xの確率分布を総じて''連続型確率分布''という.

*** 連続型確率分布の基礎 [#x0a94ebe]

ここでは

#ref(./fig12.png,70%)

を例として,基本的な計算を身につけることとする.ここで,ただし,e≒2.71828である.

#ref(./fig13.png,70%)

- ''確率密度関数'' f_X(x) (積分すると確率が求められる関数)

P(1≦X≦2)を求める場合,1≦x≦2の範囲でf_X(x)を積分すればよい.今回の例では

#ref(./fig14.png,70%)

つまり,以下の斜線部分の面積がP(1≦X≦2)となる:

#ref(./fig15.png,70%)

この結果から,''すべてのaでP(X=a)=0''となることがわかる.

- ''分布関数'' F_X(x)=P(X≦x) (Xがx以下となる確率を表す関数)

今回の例では

#ref(./fig16.png,70%)

つまり,以下の斜線部分の面積を表す関数である:

#ref(./fig17.png,70%)

- ''上側100a%点 (下側100(1-a)%点)'' (Xがx_a以下となる確率が1-a)

上側100a%点は下側100(1-a)%点であるから

#ref(./fig18.png,70%)

となるx_aが上側100a%点となる.

#ref(./fig19.png,70%)

- ''平均'' E(X)=∫xf_X(x) dx = μ (直感的にはXの確率分布の重心)

#ref(./fig20.png,50%)

- ''分散'' V(X)=∫(x-μ)^2 f_X(x) dx =σ^2 (Xの確率分布のばらつき)

#ref(./fig21.png,50%)

*** 連続型確率分布の例 [#ac999aaa]

- ''正規分布''  (パラメータ:平均E(X)=μ, 分散V(X)=σ^2,確率分布をN(μ, σ^2)で表す)

測定値が「平均μと誤差の和」の形で得られていることなどを仮定して考えられた連続型確率分布であり,主に実験データなどに用いられる.

#ref(./fig28.png,70%)

正規分布の確率密度関数は以下の通りである.

#ref(./fig29.png,70%)

ここで,e≒2.71828である.特に,μ=0, σ^2=1の正規分布(N(0, 1))を''標準正規分布''という.

- ''指数分布''  (パラメータ:λ,確率分布をExp(λ)で表す)

待ち時間や寿命の分布を表す連続型確率分布である.

#ref(./fig30.png,70%)

確率密度関数は以下の通りである.

#ref(./fig31.png,70%)

ここで,E(X)=1/λである.

* 1.3 母集団に対する統計的推測 [#i605e9b8]

すべてのデータが得られなければ,興味のあるデータの確率分布を正確に求めることができない.つまり,ほとんどの場合,''データの正確な確率分布を知ることはできない''.そこで,興味のあるデータの源泉として''母集団''を設定し,そこから得られたn個の''標本''から,母集団分布を統計的に推測することを考える(nを''標本サイズ''という).通常,標本は''無作為標本''(互いに独立,かつ,同一の分布から得られた標本)とする.

#ref(./fig32.png,50%)

無情報に母集団分布を推測しようとすれば,分布のとがり具合,ゆがみ具合,いくつの山を持つか(単峰か多峰か),どこでピークとなるかなど,推測すべき点が非常に多くなる.少ない標本で母集団分布を推測するには効率よく推測する必要があるため,母集団分布を仮定し推測する方法がとられる.確率分布はパラメータを決定できれば,確率分布を一意的に定めることができるからである.例えば,母集団分布が正規分布の場合,平均μ,分散σ^2さえ推定できてしまえば,母集団分布を推測することができる.このように,母集団分布を仮定し,パラメータを推定して母集団分布を推測し,データ解析を行う方法を''パラメトリックな方法''という.逆に,パラメトリックでない母集団分布の推測法を''ノンパラメトリックな方法''という.

#ref(./fig33.png,50%)

パラメトリックな方法では,母集団を推測することはパラメータを推定することに問題が置き換わっている.例えば,母集団分布が正規分布の場合,母集団分布の平均や分散を推定することで母集団を推測する.母集団分布の平均がいくつか,分散がいくつかが推定できれば,母集団を推測することができるからである.平均は''標本平均''によって,そして分散は''不偏標本分散''によって推定される.ここで,標本平均や不偏標本分散はそれぞれ

#ref(./fig34.png,50%)

#ref(./fig35.png,50%)

である.このように,パラメータの推定に用いられるデータの関数を''推定量''という.この場合,平均μの推定量は標本平均Xbar,分散の推定量は不偏標本分散U^2である.

** 推定量がもつべき性質 [#ra71aa04]

標本平均Xbar,不偏標本分散U^2を平均μや分散σ^2の推定量として使うならば,

- 推定量が平均的にパラメータの値をとっていてほしい.

- 推定量ができる限りパラメータの近くの値をとる確率が高くなっていてほしい.

と思うことが自然なことである.1個目の性質を満たすパラメータの推定量を''不偏推定量'',nが大きいときに2個目の性質を満たすパラメータの推定量を''一致推定量''という.

*** 不偏推定量 [#r363f869]

θを分布のパラメータ,θ^をθの推定量とする.このとき

#ref(./fig36.png,70%)

が成り立つようなθ^をθの''不偏推定量''という.

#ref(./fig37.png,70%)

をθ^の偏りという.

- 標本平均は平均の不偏推定量

#ref(./fig38.png,70%)

- 不偏標本分散は分散の不偏推定量

#ref(./fig39.png,70%)

- 標本分散は分散の不偏推定量ではない.

#ref(./fig40.png,70%)

*** 一致推定量 [#qcde0c08]

すべてのε>0に対して,以下が成り立つようなθの推定量θ^をθの一致推定量という:

#ref(./fig41.png,70%)

イメージとしては以下の図のとおりである.

#ref(./fig42.png,50%)

式や図の通り,θ^がθの一致推定量ならば,nが大きくなるにつれてθ^はθ付近に分布する確率が1に近づくことになる.

- 標本平均は平均の一致推定量(''大数の法則'')

#ref(./fig43.png,70%)

- 不偏標本分散は分散の一致推定量

#ref(./fig44.png,70%)

- 標本分散は分散の一致推定量

#ref(./fig45.png,70%)

*** まとめ [#e965d8c0]

- 平均の推定量としては''標本平均'',分散の推定量としては''不偏標本分散''が用いられる.
-- 標本平均は平均の不偏推定量かつ一致推定量である.
-- 不偏標本分散は分散の不偏推定量かつ一致推定量である.
-- 標本分散は分散の一致推定量ではあるが,不偏推定量ではない.

* 第1回ハンズオンへ [#v5096f00]
- [[第1回/ハンズオン]]


トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS