UA MATH567 高维统计II 随机向量3 常见的高维随机向量的分布
UA MATH567 高维统计II 随机向量3 常见的高维随机向量的分布
- Spherical Distribution
- Symmetric Bernoulli Distribution
- 正态分布
- Frames
Spherical Distribution
X∼Unif(nSn−1)X \sim Unif(\sqrt{n}S^{n-1})X∼Unif(nSn−1),其中Sn−1S^{n-1}Sn−1表示nnn维空间中的单位球面,这个符号说明XXX在半径在n\sqrt{n}n的球面上服从均匀分布。对于这个在球面上的均匀分布,它具有非常完美的对称性,比如任意改变若干个坐标的符号,分布不会变,比如(−X1,⋯,Xn)∼Unif(nSn−1)(-X_1,\cdots,X_n) \sim Unif(\sqrt{n}S^{n-1})(−X1,⋯,Xn)∼Unif(nSn−1)。
考虑
(−X1,⋯,Xn)∼Unif(nSn−1)(X1,⋯,Xn)∼Unif(nSn−1)(-X_1,\cdots,X_n) \sim Unif(\sqrt{n}S^{n-1}) \\ (X_1,\cdots,X_n) \sim Unif(\sqrt{n}S^{n-1})(−X1,⋯,Xn)∼Unif(nSn−1)(X1,⋯,Xn)∼Unif(nSn−1)
因为nSn−1\sqrt{n}S^{n-1}nSn−1的球心在原点,所以EX1=0EX_1=0EX1=0(因为关于原点对称),对于每一个坐标,这个结论都成立,也就是EXi=0,∀iEX_i=0,\forall iEXi=0,∀i。根据这种完美的对称性,我们还可以得到一个结论:
E(−X1Xi)=E(X1Xi)⇒E(X1Xi)=0E(-X_1X_i)=E(X_1X_i) \Rightarrow E(X_1X_i)=0E(−X1Xi)=E(X1Xi)⇒E(X1Xi)=0
事实上∀i≠j\forall i\ne j∀i=j,EXiXj=0EX_iX_j=0EXiXj=0。因为球的半径为n\sqrt{n}n,所以
X12+⋯+Xn2=nX_1^2+\cdots +X_n^2 = nX12+⋯+Xn2=n
根据对称性,EX12=⋯=EXn2EX_1^2 = \cdots = EX_n^2EX12=⋯=EXn2,所以
EX12=⋯=EXn2=nn=1EX_1^2 = \cdots = EX_n^2 = \frac{n}{n}=1EX12=⋯=EXn2=nn=1
于是EXXT=InEXX^T=I_nEXXT=In,也就是说Spherical Distribution是零均值各向同性的。
注意事项
Spherical Distribution是一个非常神奇的分布,它满足任意两个坐标协方差为0但不独立,比如考虑(X1,X2)(X_1,X_2)(X1,X2)服从X12+X22=1X_1^2+X_2^2=1X12+X22=1上的均匀分布,则
P(X1>a)P(X2>a)≠0,∀a∈(1/2,1)P(X1>a,X2>a)=0P(X_1>a)P(X_2>a) \ne 0,\forall a \in (1/\sqrt{2},1) \\ P(X_1>a,X_2>a)=0P(X1>a)P(X2>a)=0,∀a∈(1/2,1)P(X1>a,X2>a)=0
即X1,X2X_1,X_2X1,X2不独立。
Symmetric Bernoulli Distribution
X∼Unif({−1,1}n)X \sim Unif(\{-1,1\}^n)X∼Unif({−1,1}n),也就是X=(X1,⋯,Xn)X=(X_1,\cdots,X_n)X=(X1,⋯,Xn),每一个坐标取值都是−1-1−1或111且概率都是1/2。这个分布就是Spherical Distribution的特殊情况,所以它也是零均值、各向同性的随机变量。但是与Spherical Distribution不同的是,它的每个坐标是独立的。
正态分布
先考虑标准正态分布,X∼N(0,In)X \sim N(0,I_n)X∼N(0,In),显然它是各向同性的,它的概率密度为
f(x)=(2π)−n/2e−∥x∥222f(x) = (2\pi)^{-n/2}e^{-\frac{\left\| x\right\|_2^2}{2}}f(x)=(2π)−n/2e−2∥x∥22
根据location-scale变换,如果X∼N(μ,Σ)X \sim N(\mu,\Sigma)X∼N(μ,Σ),
X+a∼N(μ+a,Σ)AX∼N(Aμ,AΣAT)X+a \sim N(\mu+a,\Sigma) \\ AX \sim N(A \mu,A\Sigma A^T)X+a∼N(μ+a,Σ)AX∼N(Aμ,AΣAT)
于是对于一般的正态分布,我们总是可以做标准化:
Z=Σ−1/2(X−μ)∼N(0,In)Z = \Sigma^{-1/2}(X-\mu) \sim N(0,I_n)Z=Σ−1/2(X−μ)∼N(0,In)
正态分布的边缘分布与条件分布都是正态分布,正态分布协方差为0等价于独立,这些性质可以参考多元正态分布基础。
关于标准正态分布还有一个重要的结果,X∼N(0,In)X \sim N(0,I_n)X∼N(0,In),则∥X∥2−n\left\| X\right\|_2-\sqrt{n}∥X∥2−n是亚高斯的,这个可以直接用第一讲的结论L2-Norm的Concentration得到。
接下来我们讨论标准正态分布的分解:
X=rθ=∥X∥2X∥X∥2X = r \theta = \left\| X \right\|_2 \frac{X}{\left\|X \right\|_2}X=rθ=∥X∥2∥X∥2X
根据第一讲定理的推论:
E∣∥X∥2−n∣<o(1)E|\left\| X \right\|_2-\sqrt{n}|<o(1)E∣∥X∥2−n∣<o(1)
于是当nnn足够大时,我们可以做近似:
X≈nθ∼Unif(nSn−1)X \approx \sqrt{n} \theta \sim Unif(\sqrt{n}S^{n-1})X≈nθ∼Unif(nSn−1)
这说明在高维的情况下,N(0,In)≈Unif(nSn−1)N(0,I_n)\approx Unif(\sqrt{n}S^{n-1})N(0,In)≈Unif(nSn−1)。
Frames
frames的思想比较像是对标准正交基的推广,我们称{ui}i=1N,ui∈Rn\{u_i\}_{i=1}^N,u_i \in \mathbb{R}^n{ui}i=1N,ui∈Rn是frames,如果
A∥x∥22≤∑i=1N⟨ui,x⟩2≤B∥x∥22,∀x∈RnA \left\| x\right\|_2^2 \le \sum_{i=1}^N \langle u_i,x\rangle^2 \le B \left\| x\right\|_2^2,\forall x \in \mathbb{R}^nA∥x∥22≤i=1∑N⟨ui,x⟩2≤B∥x∥22,∀x∈Rn
其中A,BA,BA,B叫frame bound。如果A=BA=BA=B,称这个frame为tight frame。tight frame也可以用来表示一个向量,但是它比标准正交基更有一般性。比如在二维欧氏空间中,u1=(1,0),u2=(−1/2,3/2),u3=(−1/2,−3/2)u_1=(1,0),u_2 = (-1/2,\sqrt{3}/2),u_3=(-1/2,-\sqrt{3}/2)u1=(1,0),u2=(−1/2,3/2),u3=(−1/2,−3/2)就是一组tight frame,frame bound是3/23/23/2,对于任意点(x1,x2)(x_1,x_2)(x1,x2),
∑i=13⟨ui,x⟩2=32(x12+x22)\sum_{i=1}^3 \langle u_i,x\rangle^2 = \frac{3}{2}(x_1^2+x_2^2)i=1∑3⟨ui,x⟩2=23(x12+x22)
tight frame的充要条件 {ui}i=1N\{u_i\}_{i=1}^N{ui}i=1N是tight frame的充要条件是∑i=1NuiuiT=AIn,∃A\sum_{i=1}^N u_iu_i^T = AI_n,\exists A∑i=1NuiuiT=AIn,∃A,其中AAA是frame bound
说明
根据定义,tight frame等价于
∑i=1N⟨ui,x⟩2=A∥x∥22=xT(AIn)x\sum_{i=1}^N \langle u_i,x\rangle^2=A \left\| x\right\|_2^2=x^T(AI_n)xi=1∑N⟨ui,x⟩2=A∥x∥22=xT(AIn)x
其中
∑i=1N⟨ui,x⟩2=∑i=1NxTuiuiTx=xT(∑i=1NuiuiT)x\sum_{i=1}^N \langle u_i,x\rangle^2 = \sum_{i=1}^N x^Tu_iu_i^Tx=x^T(\sum_{i=1}^N u_iu_i^T)xi=1∑N⟨ui,x⟩2=i=1∑NxTuiuiTx=xT(i=1∑NuiuiT)x
于是
∑i=1NuiuiT=AIn\sum_{i=1}^N u_iu_i^T = AI_ni=1∑NuiuiT=AIn
总结
以上是生活随笔为你收集整理的UA MATH567 高维统计II 随机向量3 常见的高维随机向量的分布的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: UA MATH567 高维统计II 随机
- 下一篇: UA MATH563 概率论的数学基础