随机事件与概率
事件关系与运算
- 互斥事件:若事件A与B不同时发生,即AB=∅
- 对立事件:若AB=∅且A∪B=Ω,则A与B互为对立事件。
- 德摩根律:A∪B=A∩B
概率性质
非负性: 0≤P(A)≤1
规范性: P(S)=1
加法公式:P(A∪B)=P(A)+P(B)−P(AB)
对立事件概率:P(A)=1−P(A)
古典概型
基本原理
排列组合
- 排列数 Ank=(n−k)!n!
- 组合数 Cnk=(n−k)!k!n!
条件概率
条件概率:P(A∣B)=P(B)P(AB)(P(B)>0)
独立性:若P(AB)=P(A)P(B),则事件A与B独立,此时P(A∣B)=P(A)
全概率公式: P(A)=i=1∑nP(Bi)P(A∣Bi)
贝叶斯公式:P(Bj∣A)=∑i=1nP(Bi)P(A∣Bi)P(Bj)P(A∣Bj)
一维随机变量分布
分布类型 |
分布记法 |
概率分布/概率密度函数 |
期望E(X) |
方差D(X) |
离散型 |
0-1分布 X∼B(1,p) |
P(X=k)=pk(1−p)1−k,k=0,1 |
p |
p(1−p) |
|
二项分布 X∼B(n,p) |
P(X=k)=Cnkpk(1−p)n−k,k=0,1,…,n (其中 Cnk=k!(n−k)!n!) |
np |
np(1−p) |
|
泊松分布 X∼P(λ) |
P(X=k)=k!λke−λ,k=0,1,2,… (λ>0 为参数) |
λ |
λ |
|
几何分布 X∼G(p) |
P(X=k)=p(1−p)k−1,k=1,2,… |
p1 |
p21−p |
连续型 |
均匀分布 X∼U(a,b) |
概率密度:f(x)={b−a1,0,a<x<b其他 |
2a+b |
12(b−a)2 |
|
指数分布 X∼E(λ) |
概率密度:f(x)={λe−λx,0,x≥0x<0 |
λ1 |
λ21 |
|
正态分布 X∼N(μ,σ2) |
概率密度:f(x)=2πσ1e−2σ2(x−μ)2,−∞<x<+∞ |
μ |
σ2 |
|
伽马分布 X∼Γ(α,β) |
概率密度:f(x)=Γ(α)βαxα−1e−βx,x>0 (其中 Γ(α) 为伽马函数) |
βα |
β2α |
求Y=g(x) 的概率密度函数
FY(y)=P(Y≤y)=P(g(x)≤y)=P(x≤h(y)=Fx(h(y)))
fY(y)=fx(h(y))∣h′(y)∣
二维随机变量相关公式
分布函数:
F(x,y)=∫−∞x∫−∞yf(u,v)dudv
边缘分布函数:
FX(x)=∫−∞x∫−∞+∞f(u,v)dvdu
X 的边缘概率密度:
fX(x)=∫−∞+∞f(x,y)dy
条件概率密度
fX∣Y(x∣y)=fY(y)f(x,y)
条件分布函数:
FX∣Y(x∣y)=∫−∞xfY(y)f(u,y)du
独立条件
若 X,Y 相互独立,则 f(x,y)=fX(x)fY(y) ,F(x,y)=FX(x)FY(y)
随机变量函数的分布
设 Z=g(X,Y) ,求其分布通常先求分布函数 FZ(z) ,再通过对分布函数求导等方式得概率密度。
- 当 Z=X+Y 时,概率密度
fZ(z)=∫−∞+∞f(x,z−x)dx
- 当 M=max{X,Y} 时,分布函数 FM(m)=FX(m)FY(m)
- 当 N=min{X,Y} 时,分布函数 FN(n)=1−[1−FX(n)][1−FY(n)]
二维正态分布
f(x,y)=2πσ1σ21−ρ21exp{−2(1−ρ2)1[(σ1x−μ1)2−2ρ(σ1x−μ1)(σ2y−μ2)+(σ2y−μ2)2]}
标准二维正态分布概率密度函数 (μ₁=μ₂=0,σ₁²=σ₂²=1)
f(x,y)=2π1−ρ21exp{−2(1−ρ2)1(x2−2ρxy+y2)}
数字特征
- 数学期望
- 对于 X :E(X)=∫−∞+∞xfX(x)dx
- 对于 Y=g(X) :E(Y)=∫−∞+∞g(x)fX(x)dx (连续型,离散型为求和形式 )
- 方差:D(X)=E[(X−E(X))2] ,也常用公式 D(X)=E(X2)−[E(X)]2
- 标准差:σ(X)=D(X)
- 原点矩:E(Xk)
- 中心矩:E[(X−E(X))k]
- 协方差:Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY)−E(X)E(Y)
- 相关系数:ρXY=D(X)D(Y)Cov(X,Y)
期望、方差相关的性质
- E(cX)=cE(X)(c 为常数 )
- E(X1+X2)=E(X1)+E(X2)
- 若 X,Y 相互独立, 则 E(XY)=E(X)E(Y) ,且 E(X2)=[E(X)]2
- D(X)=E(X2)−[E(X)]2 ,其中 E(X2)=D(X)+[E(X)]2 (常用计算 E(X^2) 的方法 )
- D(cX)=c2D(X)(c 为常数 )
- 若 X,Y 相互独立,则 D(X+Y)=D(X)+D(Y) ;一般情况 D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
- Cov(X,c)=0(c 为常数 )
- Cov(aX,bY)=abCov(X,Y)(a,b 为常数 )
- Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
- Cov(X,Y)=E(XY)−E(X)E(Y)
极限定理
切比雪夫不等式
P(∣X−E(X)∣≥ε)≤ε2D(X)
依概率收敛: n→∞limP(∣Yn−a∣<ε)=1
切比雪夫大数定律
若 X1,X2,⋯,Xn 独立同分布,E(Xi)=μ,D(Xi)=σ2<∞,则Xˉ=n1i=1∑nXi→Pμ
辛钦大数定理
若 X1,X2,⋯,Xn 独立同分布,数学期望E(Xi)=μ,
∃ε st.n→∞limP(∣∣∣∣∣n1i=1∑nXi−μ∣∣∣∣∣<ε)=1
中心极限定理
若X1,X2,⋯,Xn独立同分布,E(Xi)=μ,D(Xi)=σ2,则nσ∑i=1nXi−nμ=δ/nxˉ−μ∼N(0,1)( n 充分大)
棣莫佛-拉普拉斯极限定理
Xn∼B(n,p) 泊松定理要求 λ=np (n很大时 p 很小)
np(1−p)Xn−np∼N(0,1) 一般 n,np 较大,用正态近似
数理统计
样本:随机性、独立性
统计量:不含未知参数
样本均值: Xˉ=n1∑i=1nXi
期望:E(Xˉ)=μ,方差:D(Xˉ)=nσ2
样本方差:S2=n−11∑i=1n(Xi−Xˉ)2 期望:E(S2)=σ2
卡方分布
构造:若 Xi∼N(0,1) 且相互独立,则
χ2=X12+X22+⋯+Xn2∼χ2(n)
性质:
χ12∼χ2(n1),χ22∼χ2(n2) 且独立,则 χ12+χ22∼χ2(n1+n2)
E(χ2)=n,D(χ2)=2n
t分布
构造:若 X∼N(0,1),Y∼χ2(n) 且相互独立,则
T=Y/nX∼t(n)
性质:
n>1时,E(T)=0
n>2时,D(T)=n−2n
t1−α(n)=−tα(n)
F分布
若 X∼χ2(n1),Y∼χ2(n2)且相互独立,则 F=Y/n2X/n1∼F(n1,n2)
性质:
n2>2时,E(F)=n2−2n2
F1−α(n1,n2)=Fα(n2,n1)1
三个定理
- 设 X1,X2,⋯,Xn 是来自正态总体 N(μ,σ2) 的样本:
Xˉ∼N(μ,nσ2)
σ2(n−1)S2∼χ2(n−1)
Xˉ与 S2 相互独立
- S/nXˉ−μ∼t(n−1)
- S22/σ22S12/σ12∼F(n1−1,n2−1)
参数估计
矩估计
总体分布:F(x;θ1,θ2,⋯,θk)
步骤
- 写出总体前 k 阶原点矩
⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧μ1=μ1(θ)μ2=μ2(θ)⋮μk=μk(θ) 个数取决于估计量
-
解矩方程
⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧θ1=θ1(μ)θ2=θ2(μ)⋮θk=θk(μ)
-
用样本值代替总体值,计算估计量 θ^
极大似然估计
设总体分布律 P(X=x;θ),样本 X1,X2,⋯,Xn 取值x1,x2,⋯,xn
步骤:
构造似然函数:
L(θ)=i=1∏nP(Xi=xi;θ)
L(θ)=i=1∏nf(xi;θ)——f为概率密度函数
取对数将乘积转求和:
lnL(θ)=i=1∑nlnP(Xi=xi;θ)
求导找极值:
对 lnL(θ) 关于 θ 求导(多参数时, 对各个参数求偏导),
令:∂θ∂lnL(θ)=0
解出 θ 的极大似然估计值(多参数解方程组,需验证极大值)。
例题1
设总体 X∼N(0,σ2),σ>0,设 X1,⋯,Xn 是来自总体 X 的样本,x1,⋯,xn 是样本值,根据这一样本,
(1)试求 σ2 的矩估计量 σ^M2 和极大似然估计量 σ^L2;
(2)极大似然估计量 σ^L2 是不是 σ2 的无偏估计量?
设总体 X∼N(0,σ2),σ>0,设 X1,⋯,Xn 是来自总体 X 的样本,x1,⋯,xn 是样本值,根据这一样本,
(1)试求 σ2 的矩估计量 σ^M2 和极大似然估计量 σ^L2;
(2)极大似然估计量 σ^L2 是不是 σ2 的无偏估计量?
解:(1) X∼N(0,σ2),fX(x)=2πσ1e−2σ2x2,
矩估计:可知 μ2=E(X2)=σ2+0=σ2,
令 μ2=σ2=A2=n1∑i=1nXi2,得 σ^M2=A2=n1∑i=1nXi2,
极大似然估计:似然函数:L(σ2)=∏i=1n2πσ1e−2σ2xi2=(2πσ2)−2ne−2σ2∑i=1nxi2,
lnL(σ2)=−2nln(2πσ2)−2σ2∑i=1nxi2,求导:dσ2dlnL(σ2)=−2σ2n+2(σ2)2∑i=1nxi2=0,
得 σ^L2=n1∑i=1nxi2,从而极大似然估计量为. σ^L2=n1∑i=1nXi2;
(2) E(σ^L2)=E(n1∑i=1nXi2)=n1∑i=1nE(Xi2)=n1∑i=1nσ2=σ2,因此,σ^L2 是 σ2 的无偏估计.
估计量评价标准
- 无偏性:若 E(θ^)=θ,则 θ^ 是 θ 的无偏估计。
- 有效性:若 θ^1,θ^2 均为 θ 的无偏估计,且 D(θ^1)<D(θ^2),则 θ^1 更有效。
- 一致性:若 n→∞limP(∣θ^n−θ∣<ε)=1
置信区间
定义
P(θ<θ<θ)=1−α 则 (θ,θ) 称为 θ 的置信水平为 1−α 的置信区间
求解步骤
- 选取一个点估计
- 构建枢轴量
- 针对枢轴量选择区间
- 恒等变形
待估参数 |
条件 |
枢轴量及分布 |
置信区间(置信水平 1−α ) |
μ |
σ2 已知 |
U=σ/nX−μ∼N(0,1) |
(X±zα/2⋅nσ) |
μ |
σ2 未知 |
T=S/nX−μ∼t(n−1) |
(X±tα/2(n−1)⋅nS) |
σ2 |
μ 已知 |
χ2=σ2∑i=1n(Xi−μ)2∼χ2(n) |
(χα/22(n)∑(Xi−μ)2,χ1−α/22(n)∑(Xi−μ)2) |
σ2 |
μ 未知 |
χ2=σ2(n−1)S2∼χ2(n−1) |
(χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2) |
例题
已知某种炮弹的炮口速度服从正态分布,X∼N(μ,σ2),现随机抽取 9 发进行随机试验,测得炮口速度的样本均值为 836(m/s),样本标准差为 11(m/s)。
(1) 求这种炮弹的炮口速度的方差σ2的置信度为 0.95 的置信区间。
可能用到的数据:
χ0.952(9)=3.325,χ0.952(8)=2.733,χ0.052(9)=16.919,χ0.052(8)=15.507,
χ0.9752(9)=2.70,χ0.9752(8)=2.18,χ0.0252(9)=19.023,χ0.0252(8)=17.533,
t0.025(9)=2.2622,t0.025(8)=2.3060,t0.05(9)=1.8331,t0.05(8)=1.8595
已知某种炮弹的炮口速度服从正态分布,X∼N(μ,σ2),现随机抽取 9 发进行随机试验,测得炮口速度的样本均值为 836(m/s),样本标准差为 11(m/s)。
(1) 求这种炮弹的炮口速度的方差σ2的置信度为 0.95 的置信区间。
可能用到的数据:
χ0.952(9)=3.325,χ0.952(8)=2.733,χ0.052(9)=16.919,χ0.052(8)=15.507,
χ0.9752(9)=2.70,χ0.9752(8)=2.18,χ0.0252(9)=19.023,χ0.0252(8)=17.533,
t0.025(9)=2.2622,t0.025(8)=2.3060,t0.05(9)=1.8331,t0.05(8)=1.8595
解:
- α=0.05,n=9,s=11 选取点估计
- σ2(n−1)S2∼χ2(n−1) 构建枢轴量
- P{χ1−2α2(n−1)<σ2(n−1)S2<χ2α2(n−1)}=1−α 选取区间
- 所求置信区间为
(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2)=(χ0.0252(8)8×112,χ0.9752(8)8×112)=(17.5338×112,2.188×112)=(55.210,444.036)
假设检验
两种错误:
- 弃真错误:P(拒绝H0∣H0为真)=α —— 显著性水平
- 取伪错误:P(不能拒绝H0∣H0为假)=β
显著性水平检验
-
提出假设
- 原假设 H0→ 有等号
- 备择假设 H1
-
检验统计量, 给出拒绝域
-
给定显著性水平 α, 确定拒绝域
-
根据样本观测值做出判断
例题
已知某种炮弹的炮口速度服从正态分布,X∼N(μ,σ2),现随机抽取 9 发进行随机试验,测得炮口速度的样本均值为 836(m/s),样本标准差为 11(m/s)。
(2) 若炮口速度不小于 850(即μ≥850 )为合格,是否可以认为这种炮弹合格?(显著性水平α=0.05)
可能用到的数据:
χ0.952(9)=3.325,χ0.952(8)=2.733,χ0.052(9)=16.919,χ0.052(8)=15.507,
χ0.9752(9)=2.70,χ0.9752(8)=2.18,χ0.0252(9)=19.023,χ0.0252(8)=17.533,
t0.025(9)=2.2622,t0.025(8)=2.3060,t0.05(9)=1.8331,t0.05(8)=1.8595
已知某种炮弹的炮口速度服从正态分布,X∼N(μ,σ2),现随机抽取 9 发进行随机试验,测得炮口速度的样本均值为 836(m/s),样本标准差为 11(m/s)。
(2) 若炮口速度不小于 850(即μ≥850 )为合格,是否可以认为这种炮弹合格?(显著性水平α=0.05)
可能用到的数据:
χ0.952(9)=3.325,χ0.952(8)=2.733,χ0.052(9)=16.919,χ0.052(8)=15.507,
χ0.9752(9)=2.70,χ0.9752(8)=2.18,χ0.0252(9)=19.023,χ0.0252(8)=17.533,
t0.025(9)=2.2622,t0.025(8)=2.3060,t0.05(9)=1.8331,t0.05(8)=1.8595
解:
- H0:μ≥μ0=850,H1:μ<μ0 提出原假设
- T=nSXˉ−μ0 选择统计量
- P{T=nSXˉ−μ0<t1−α(n−1)}≤α 检验统计量为
- 拒绝域为C=(−∞,t1−α(n−1))=(−∞,−t0.05(8))=(−∞,−1.8595) 确定拒绝域
计算得t=nsxˉ−μ0=911836−850≈−3.818∈C 判断样本