----
なるほど。300人にアンケートをとればおよそ信頼できる結果になると…。
うちの区の人口がだいたい54万人だから抽出標本数は300で誤差6%か。
よし300!やりましょう!
----
これは統計学の標本調査について述べたものです。全体を対象に行う全数調査に比べて、一部を抽出して行う標本調査は結果に誤差が生じます。一般に、全体とくらべて標本数が少ないほど誤差は大きくなります。この場合、54万人の中から300人を調べるだけでも真の値との違いは6%以内ですむということを意味しています。その誤差については、Nを母集団、nを標本数、pを母比率とするとき、以下の式で計算されます。
①信頼区間95.44%のとき、2√((N-n)/(N-1))√(p(1-p)/n) (上図)
または
②信頼区間95%のとき、1.96√((N-n)/(N-1))√(p(1-p)/n) (下図)
または
③信頼区間95%のとき、2√((N-n)/(N-1))√(p(1-p)/n)
として計算する場合もあります。
ただ、この式でN=54万、n=300、p=0.5とすれば、√((N-n)/(N-1))はほぼ1になります。
√((540000-300)/(540000-1))=0.9997231093
なので、√((N-n)/(N-1))の部分を無視して、誤差を1.96√(p(1-p)/n)または2√(p(1-p)/n)で計算しても良いわけです。
①1.96√(p(1-p)/n)を計算すると、
1.96√(p(1-p)/n)=0.0565803264
なので上図の300-50%の値±5.66になり、誤差は約6%となります。
または、
②2√(p(1-p)/n)を計算すると、
2√(p(1-p)/n)=0.0577350269
なので下図の300-50%の値5.8になり、どちらにしても誤差は約6%となります。
因みに画面に登場した数学の書籍を紹介しておきましょう。
◆ゼロからわかる確率・統計 深川和久著
◆意味が分かる統計学 石井俊全著
◆入門はじめての統計解析 石村貞夫著
No comments:
Post a Comment