1.对于类Gi,总体的分布为N(μi,σi2),其中i=1,2.可以通过计算马氏距离进行判别,
不妨设μ1>μ2,按距离判别准则有
{x∈G1,x∈G2,x>μ∗,x⩽μ∗,
其中μ∗=σ1+σ2σ1μ2+σ2μ1.试求错判概率 Pr(2|1)和 Pr(1|2).
首先给出马氏距离定义:
d(x)=σ2(x−μ)2
将两个总体带入后易得到分界点:μ∗=σ1+σ2σ1μ2+σ2μ1.
Pr(2|1)=P{x∈G2∣x∈G1}
根据距离判别准则有:
Pr(2∣1)=PX1{X≤μ∗}=P{σ1X−μ1≤σ1+σ2μ2−μ1}=1−ϕ(σ1+σ2μ1−μ2)
对于Pr(1∣2)同理
2.设三个总体π1,π2和π3的分布分别为:N(2,0.52),N(0,22)和N(3,12).采用下面两
种判别准则,试问样品 x=2.5 应判归为哪一类?
(1) 按距离判别准则;
(2)按 Bayes 判别准则,取先验概率为q1=q2=q3=1/3,且考虑损失,当i=j时,损失
为C(j∣i)=1,否则损失为C(j∣i)=0.
(1)按照马氏距离准则判别:将x=2.5带入马氏距离中
d(x)=σ2(x−μ)2
π1:d1(2.5)=1π1:d2(2.5)=1.5625π1:d3(2.5)=0.25
因此按距离判别准则,归为π3
(2)贝叶斯判别准则:
C(j∣i)qifi
由于惩罚项和贝叶斯先验概率一致,因此至于比较密度函数大小即可
f1(2.5)=2π∗0.51exp{−21d1}f2(2.5)=2π∗21exp{−21d2}f3(2.5)=2π∗11exp{−21d3}
比较后可得f1(2.5)最大,因此按照贝叶斯判别准则,应该归类为π1
3.设总体πi的均值为μi(i=1,2),具有相同的协方差矩阵为Σ,令μ=21(a′μ1+a′μ2),
其中a=Σ−1(μ1−μ2).试证明:
(1) E(a′X∣π1)>μ;
(2) E(a′X∣π2)<μ.
(1)要证明
a′μ1>21a′(μ1+μ2)21a′(μ1−μ2)>021(μ1−μ2)′Σ−1(μ1−μ2)>0由Σ为正定矩阵可知不等号成立
(2)与(1)同理
4.设有两个二元正态总体π1∼N2(μ1,Σ1)和π2∼N2(μ2,Σ2),其中
μ1=(1015),Σ1=(18121232),μ2=(2025),Σ2=(20−7−75).
假设先验概率q1=q2,且损失为C(2∣1)=10和C(1∣2)=75.
试问样本x1=(20,20)′和x2=(15,20)′ 各应判归为哪一类?
(1) 按 Fisher 判别准则;
(2)按 Bayes 判别准则,其中假设Σ2=Σ1=(18121232);
(3)已知样品x=(20,20)′,对i=1,2,试计算后验概率 Pr(πi∣x).
(1)Fisher判别准则:
现在想要寻找某个方向a ,使得不同组数据投影之后,在该方向上的中心拉的足够开。即使得两者
的距离达到最大
a(Σ1+Σ2)a′∣∣aXˉ1−aXˉ2∣∣
考虑总体被分为 2 类,投影方向应该使得下面这个距离达到最大
a^=argmaxaa′(Σ1+Σ2)aa′(μ1−μ2)(μ1−μ2)′a
由题5的不等式可知,此时a取(Σ1+Σ2)−1(μ1−μ2)
计算可得:
a=
(2)按Bayes判别准则:
R1={x:x′Σ−1(μ1−μ2)−21(μ1+μ2)Σ−1(μ1−μ2)>lnk}R2={x:x′Σ−1(μ1−μ2)−21(μ1+μ2)Σ−1(μ1−μ2)<lnk}
由于惩罚项权重不同,因此取k=q1C(1∣2)q2C(1∣2) 即可
(3)
Pr(πi∣x)=qifi(x)/∑(qifi(x))
在本题中,由于先验概率相同,只需要看两个整体中的密度比即可
Pr(πi∣x)=fi(x)/∑(fi(x))
其中密度函数
fi(x)=2π∣Σi1/2∣1exp{−21(x−μi)′Σi−1(x−μi)}
5.已知xi(k)为来自类Gk的简单随机样本,其中k=1,2;i=1,⋯,nk.
记d= x(1)−x(2),其中x(k)=nk1∑i=1nkxi(k).
令S=n1+n2−21(V1+V2),其中Vk为类Gk的样本离差阵.试证明:
a=S−1(x(1)−x(2))使比值(a′d)2/a′Sa达最大值,
且最大值为马氏距离D2=(x(1)−x(2))′S−1(x(1)−x(2)).
易知,若a=S−1(x(1)−x(2))使比值(a′d)2/a′Sa达最大值,则带入后即为马氏距离
首先证明一个不等式:
(b′d)2≤(b′Bb)(d′B−1d)
其中b,d为p维向量B为一个p∗p的正定矩阵
b′d=b′B1/2B−1/2d=(B1/2b)′(B−1/2d)
则可由Cauchy-Shwarz不等式可知(向量点乘平方小于模的平方相乘)
((B1/2b)′(B−1/2d))2≤(b′Bb)(d′B−1d)
等号当且仅当(B1/2b)′=λ(B−1/2d) 即向量共线成比例的时候成立
在本题中,取a=b,d=d,B=S
(a′d)2≤(a′Sa)(d′S−1d)
则可知(a′d)2/a′Sa≤(d′S−1d)=D2 得证
且等号成立条件为(S1/2a)′=λ(S−1/2d) ,取λ=1将S−1/2乘过去则可得到
a=S−1(x(1)−x(2))
6.试证明:
−21(x−μ1)′Σ−1(x−μ1)+21(x−μ2)′Σ−1(x−μ2)=(μ1−μ2)′Σ−1x−21(μ1−μ2)′Σ−1(μ1+μ2).
直接将原式展开证明即可:
注意x′Σ−1μ=μ′Σ−1x即可
7.考虑下面两个数据集:
X1=324747,X2=654978.
计算可得:
x1=(36),x2=(58),Spooled=(1112).
(1)计算由式(11.16)定义的线性判别函数;
(2)如果假设先验概率和损失相等,对给定的观测值x0=(2,7)′,试用 Fisher 线性判别准则(11.17)把x0归类为总体π1或π2.
Spooled的求法可由题5得
(1)
W(x)=(μ1−μ2)′Σ−1x−21(μ1−μ2)′Σ−1(μ1+μ2)
带入得数后可得:
W(x)=(−2,0)x+8=−2x1+8
(2)
W(x0)=4>0
故归类为总体π1
8.在两个p元正态总体Np(μk,Σ)(k=1,2)下,设μ1,μ2和Σ均为已知.又设线性判
别函数为:
W(X)=(X−μ)′Σ−1(μ1−μ2),μ=21(μ1+μ2).
判别准则为:
{判X∈G1,判X∈G2,W(X)>0,W(X)⩽0.
试求错判概率Pr(2∣1)和Pr(1∣2).
易知Pr(2∣1)和Pr(1∣2)相等,这里只讨论Pr(2∣1),由正态分布性质,若X∈π1
W(X)∼N(21(μ1−μ2)′Σ−1(μ1−μ2),(μ1−μ2)′Σ−1(μ1−μ2))
则可知
P{W(x)>0}=P{(μ1−μ2)′Σ−1(μ1−μ2)W(x)−21(μ1−μ2)′Σ−1(μ1−μ2)>−21}=1−ϕ(21)=0.31
9.考虑线性函数:Y=ξ′X.如果X来自总体π1,则 令 E(X)=μ1, Cov(X)=Σ;如果X来自总体π2,则令E(X)=μ2, Cov(X)=Σ.令m=21(μ1Y+μ2Y)=21(ξ′μ1+ξ′μ2). 给定ξ′=(μ1−μ2)′Σ−1,试证明:
(1) E(ξ′X∣π1)−m=ξ′μ1−m>0;
(2) E(ξ′X∣π2)−m=ξ′μ2−m<0.
直接带入即可:
E(ξ′X∣π1)−m=ξ′μ1−m=21(μ1−μ2)′Σ−1(μ1−μ2)
由于Σ为正定矩阵,则可知原式严格大于零。
(2)同理可得
10.令两个总体的密度函数分别为
f1(x)={1−∣x∣,0,∣x∣⩽1,其他,f2(x)={1−∣x−0.5∣,0,−0.5⩽x⩽1.5,其他.
(1)绘制 f1(x) 和 f2(x) 的密度函数;
(2)当q1=q2且C(2∣1)=C(1∣2)时,试给出判别准则,并确定判别区域R1和R2;
(3)当q1=0.2且C(2∣1)=C(1∣2)时,试给出判别准则,并确定判别区域R1和R2.
(1)
(2)(3)直接考虑第三问即可,第二问为一个退化情况
ECM(R1,R2)=C(2∣1)Pr(2∣1,R)q1+C(1∣2)Pr(1∣2,R)q2=∫R2C(2∣1)q1f1+∫R1C(1∣2)q2f2dx=∫R2(C(2∣1)q1f1−C(1∣2)q2f2)dx+C(1∣2)q2
由于后一项为常数项,因此只需要考虑让前面积分值尽可能的小,也就是只积分负的部分则:
R1={x:[C(2∣1)q1f1(x)≥[C(1∣2)q2f2(x)}R2={x:[C(2∣1)q1f1(x)<[C(1∣2)q2f2(x)}
11.已知两个总体的分布为Np(μk,Σ)(k=1,2).又设μ1,μ2和Σ均为已知,先验概率为q1和q2,且满足q1+q2=1,错判损失为C(1∣2)和C(2∣1).试写出 Bayes 判别准则和距离判别准则,并说明它们之间的关系.
距离判别:
{X∈G1,X∈G2,d2(X,G1)<d2(X,G2)d2(X,G1)≥d2(X,G2)
d2(X,G1)−d2(X,G2)=(X−μ1)′Σ−1(X−μ1)−(X−μ2)′Σ−1(X−μ2)=(X−μ1)′Σ−1[(X−μ1)−(X−μ2)]+(X−μ1)′Σ−1(X−μ2)−(X−μ2)′Σ−1(X−μ2)=(X−μ1)′Σ−1(μ2−μ1)+(X−μ2)′Σ−1(X−μ1)−(X−μ2)′Σ−1(X−μ2)=(X−μ1)′Σ−1(μ2−μ1)+(X−μ2)′Σ−1(μ2−μ1)=2(X−2μ1+μ2)′Σ−1(μ2−μ1)=2(μ2−μ1)′Σ−1(X−2μ1+μ2)
Bayes判别准则
判别函数:
W(x)=(μ1−μ2)′Σ−1x−21(μ1−μ2)′Σ−1(μ1+μ2)=(μ2−μ1)′Σ−1(X−2μ1+μ2)
由于区域是与lnk=C(1∣2)q2/C(2∣1)q1进行比较,因此当该比例为1即lnk=0时距离判别与Bayes判别等价,这也说明Bayes判别在先验信息不足时退化为距离判别