【このページは現在作成中です】
要素の集まりを集合という.ただし,この集合は,数学的に範囲が明確な要素の集まりでなければならない.
要素全体の集合を全体集合といい,Ωで表す.
要素を持たない集合を空集合といい,φで表す.
Aの要素またはBの要素からなる集合をAとBの和集合といい,A∪Bで表す.
Aの要素かつBの要素からなる集合をAとBの積集合といい,A∩Bで表す.
特にA∩B=φとなるとき, AとBは排反であるという.
実験結果を要素にもつ集合を事象という(事象に対する上記4つをそれぞれ,全事象,空事象,和事象,積事象,排反事象という).
集合には数えられる集合(可算集合,とびとびの値をとる集合)と数えられない集合(非可算集合,連続的な値をとる集合)がある.変量(特徴量)のとり得る値の集合が可算集合であるか非可算集合であるかによって用いられる確率分布も異なってくる.
サイコロの目(1,2,3,4,5,6),事故の件数(0,1,2,…)
身長(0以上の実数)
n個からr個選ぶ場合の数
ここで,n!はn×(n-1)×…×2×1である.
関数f(x)をxがa以上b以下の範囲で積分する計算を
で表す.これはx軸とf(x)で囲まれる部分の符号付面積を表す.つまり,以下の図でx軸よりも上の部分(赤の斜線部分)の面積を足し,x軸よりも下の部分(青の斜線部分)の面積を引いた値となる.
現在の確率論や統計科学における確率の定義は公理的確率が採用されている.
全事象Ωの場合の数をn,事象Aの場合の数をrとする.このとき,P(A)=r/nとする.
この定義の問題点:
試行を無限に繰り返し,事象Aが起こる割合がpAに近づくとする.このとき,P(A)=pAとする.
この定義の問題点:
次の3条件を満たすPを確率という.(確率として成り立っていてほしい式をまとめたものになっている)
事象を簡単に表すために,確率変数を用いる.例えば,サイコロを1回投げて奇数が出る確率を
P(X=1,3,5)
と表すために用いられる変数を確率変数という.確率変数が離散型か連続型かによって用いられる確率分布が異なるので注意すること.
確率変数がとり得る値の集合が可算集合である場合(とびとびの値をとる場合)
確率変数がとり得る値の集合が非可算集合である場合(連続的な値をとる場合)
確率変数Xの確率分布を求めるとは,すべてのXの範囲で確率を求められるようにすることである.
つまり,確率分布がわかっていれば,どんなXの範囲でも自由に確率を求められる.
離散型確率変数Xの確率分布を総じて離散型確率分布という.
ここでは
P(X=1)=1/12, P(X=2)=1/12, P(X=3)=1/3, P(X=4)=1/12, P(X=5)=1/3, P(X=6)=1/12,P(X≠1,2,3,4,5,6)=0
を例として,基本的な計算を身につけることとする.
連続型確率変数Xの確率分布を総じて連続型確率分布という.
ここでは
を例として,基本的な計算を身につけることとする.ここで,eは2.71828程度の値(ネイピア数)である.
P(1≦X≦2)を求める場合,1≦x≦2の範囲でf_X(x)を積分すればよい:
この結果から,すべてのaでP(X=a)=0となることがわかる.