「Q&Aで学ぶ 確率・統計の基礎」 木下栄蔵 2003年 ブルーバックス
確率・統計の基礎。ボケ防止で読んでみました。忘れているところもあって結構ムキになっちゃいました(-"-)。高校数学の復習みたいで … 深みは無い。でも、面白かったですよ!(^^)!
■ 順列・組合せ
順列の数は、[nPn=n! 0!=1,1!=1]。
円順列の総数は、[(n−1)!]。
組合せは、[nCr=n!/(r!(n−r)!)]。
n個の異なるものから重複を許してr個とる(重複組合せ)は、[nHr-1=n+r-1Cr]。
組合せ順列(最短経路など)。n個のi個,j個,k個 … は同じもので[i+j+k+…=n]は、n個を並べる順列は[n!/(i!j!k!…)]。
■ 確率の基礎
・トランプのスリーカードができる確率
[1×(3/51)×(2/50)×(48/49)×(44/48)]に、順列の数10通りを掛けた値となる。確率計算では、3枚の同じランクのカードが最初の3枚に固定されているため、残り2枚のカードの位置関係を考慮していません。手札5枚の中で、3枚の同じランクのカードと、2枚の異なるランクのカードの並び替え(順列)の数[5!/(3!2!)=10]。これは、「5枚のカードを並べたときに、同じランクの3枚と異なるランクの2枚がどのように配置されるかのパターン数」を示しています。
・ベイズの定理
現職大統領に対する反応はE1・E2・E3に分かれる。大統領支持層(E1)が大統領に投票する(A)確率は60%。ある人が現職大統領の投票したとき、この人がどの層に属しているか。その確率を計算する。
P(Ei|A)=P(Ei)P(A|Ei)/(ΣP(Ei)P(A|Ei))
・モンテカルロシミュレーション
ベルトランの逆説の理論解は、解釈し方で異なる。解析的に解けない問題を解くために近似的に答えを求める。
■ 統計の基礎
分布の特徴を捉える指標は、代表値と散布度。代表値は平均値と最頻値。散布度は分散、ピアソンの積率相関係数やスピアマンの準位相関係数。
■ 確率分布
パチンコ店の店舖数は書店を上回っている。
・2項分布とポアソン分布
ポアソン分布は、二項分布の極限状態。平均出現回数を一定にして試行回数を無限回にしたときの状態を表す。
*2項分布とポアソン分布
二項分布は、「ある試行を何回も繰り返して、特定の結果の回数を数える」確率分布。試行回数がどんどん増えるのに発生確率は変わらない、という条件になります。この条件を満たしたとき、二項分布はポアソン分布に近づきます。
・幾何分布
ある試行において、事象Eの起こる確率をPとすれば、x回目に初めてEが起こる確率は[f(x)=P(1−P)^x-1]。
・正規分布/ガウスの誤差曲線
・指数分布
社会現象に多く見られる。0で頻度が最も高く、次第に頻度が低くなる。
f(x)=λe^-λx x≧0
指数分布の平均値は[1/λ]、分散は[1/λ^2]。
■ 確率過程
・正規マルコフ連鎖
遷移確率行列の何乗かが、1つも0の要素を含んでいない。
・OERAモデル
打者の評価を行うOERAモデル。1試合(9回まで)の得点数を基準とする。吸収マルコフ連鎖(一度入ると出られない状態があるマルコフ連鎖)を用いてシミュレーションする。野球の場合の吸収源は、スリーアウト。
■ 推定
・平均値の推定
σ^2が未知の場合、mを推定するには(x‾−m)という標準偏差を単位とした値(t値)を用いる。
・平均の差の検定
2つの母集団の平均値の差の検定は、Zが正規分布(0,1)に従うことを活用する。
・比率の推定
母集団が二項分布のとき、母比率Pを推定する。
・分散の推定
χ二乗分布は、偏差平方和Sを推定したい母分散で割った値。
■ 検定
標本平均のx‾の分布は、正規分布N(m*,(σ^2)/n)。
棄却域が両側にある検定法を両側検定という。
比率の差の検定は、仮説[母比率Pα=Pβ]を設定し、uの値を計算する。
比率の検定は、仮説[母比率P=P*]を設定する。
χ二乗検定は、n回の試行により、結果がlのケースに分かれ、各ケースが出現する確率をP1,P2,…,Piとする。実測回数Qと期待回数Fとの間に有意差があるかどうかを検定する。
■ 待ち行列
待ち行列の長さは、サービス状況・客の到着状態・サービス窓口の数によって決まる。
利用率(ρ:ロー)=到着率(人/時間)/サービス率(人/時間)
窓口が1の場合の待ち行列の長さ=ρ^2/(1−ρ) 窓口の数n=1