二项分布
二项分布:$n$次独立试验中,每次试验某事件出现的概率为$p$,某件事不出现的概率为$q$(等于$1-p$),则对于某件事出现$X$次的概率分布为:
$$b(x, n, p)=\mathrm{C}_{n}^{x} p^{x} q^{n-x}= \frac{n !}{x !(n-x) !}$$
若$X$是服从二项分布的随机变量,则$E(X)=np,D(X)=np(1-p)$
二项分布满足 $p < q,np \geqslant 5$或$p>q,nq \geqslant 5$时,二项分布接近正态分布。
二项分布在教育研究中,主要用于解决含有机遇性质的问题。
例1:判断题是否是猜测作答
有10道判断题,问答题者答对几题才能认为他是真会,或者说答对几题才能认为不是出于猜测因素?
猜错与猜对的概率 $p=q=0.5,np =5$,此二项接近正态分布。
$
\mu=n p=10 \times 0.5=5, \
\sigma=\sqrt{n p q}=\sqrt{10 \times 0.5 \times 0.5}=1.58
$
由正态分布概率,当Z=4.645时,该点以下包含全体的95%
用原始分数表示$\mu+1.645 \sigma=5+1.645 \times 1.58=7.6=8$,即10道题中猜对8道题以下的可能性为95%,猜对8-10道题的概率只有5%。因此可以推论说答对8道题以上者不是凭猜测(但做此结论,仍然有5%的可能会犯错。)
此问题可以直接用R语言中binom()
二项分布函数计算。
# qbinom(p, size, prob)
qbinom(0.95,10,0.5) # 8
例2:选择题是否是猜测作答
有10道单项选择题,每题4个选项,问答题者答对几题才能认为他是真会,或者说答对几题才能认为不是出于猜测因素?
此题中 $n=10, p=0.25,q =0.75, np<5$,应采用直接用二项分布函数计算。
qbinom(0.95,10,0.25) # 5
猜对题数与概率
p <- 0.25
n <- c(10,15,30,40,60)
n_q <- qbinom(0.95,n,p)
n_p <- pbinom(n_q -1,n,p,lower.tail = F)
题目总数(单选4选1) | 猜对题数 | 大于猜对题数概率 |
---|---|---|
10 | 5 | 7.8% |
15 | 7 | 5.7% |
30 | 12 | 5.1% |
40 | 15 | 5.4% |
60 | 21 | 5.4% |
p <- 0.5
n <- c(10,15,30,40,60)
n_q <- qbinom(0.97,n,p)
n_p <- pbinom(n_q -1,n,p,lower.tail = F)
题目总数(判断对错) | 猜对题数 | 大于猜对题数概率 |
---|---|---|
10 | 8 | 5.5% |
15 | 11 | 6.0% |
30 | 20 | 5.0% |
40 | 26 | 4.0% |
60 | 37 | 4.6% |