当前位置：首页 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH566 统计理论 Fisher信息论的性质下

发布时间：2025/4/14 编程问答 50 豆豆

生活随笔收集整理的这篇文章主要介绍了 UA MATH566 统计理论 Fisher信息论的性质下小编觉得挺不错的,现在分享给大家,帮大家做个参考.

UA MATH566 统计理论 Fisher信息量的性质下

辅助统计量的Fisher信息为0
分布族参数变换后的Fisher信息
统计量的Fisher信息的有界性

下面介绍一些Fisher信息量的常用性质。

辅助统计量的Fisher信息为0

假设 $A(X)∼g(a,θ)A(X)\sim g(a,\theta)$ ，它的Fisher信息为
$IA(X)(θ)=E[S(A,θ)]2=E[∂log⁡g(A,θ)∂θ∂log⁡gT(A,θ)∂θ]IA(X)(θ)=0⇔E[∂log⁡g(A,θ)∂θ∂log⁡gT(A,θ)∂θ]=0I_{A(X)}(\theta) = E[S(A,\theta)]^2 = E \left[ \frac{\partial \log g(A,\theta)}{\partial \theta} \frac{\partial \log g^T(A,\theta)}{\partial \theta}\right] \\ I_{A(X)}(\theta) = 0 \Leftrightarrow E \left[ \frac{\partial \log g(A,\theta)}{\partial \theta} \frac{\partial \log g^T(A,\theta)}{\partial \theta}\right] = 0$

假设 $g(a,θ)g(a,\theta)$ 是完备的，则上式表示
$∂log⁡g(a,θ)∂θ=0,∀a\frac{\partial \log g(a,\theta)}{\partial \theta} = 0 ,\forall a$

这说明 $g(a,θ)g(a,\theta)$ 与参数 $θ\theta$ 无关，这正是 $A (X)$ 为辅助统计量的定义。根据这个推导过程，如果某个统计量的Fisher信息量为0，那么它也一定是辅助统计量。

分布族参数变换后的Fisher信息

已知分布族 $f(x,θ)f(x,\theta)$ 的Fisher信息为 $I(θ)I(\theta)$ ，现在想把它的参数变换为 $ξ\xi$ ，则变换后的Fisher信息为
$I(ξ)=[Dξθ(ξ)]TI(θ)Dξθ(ξ)I(\xi) = [D_{\xi}\theta(\xi)]^TI(\theta)D_{\xi}\theta(\xi)$

假设 $θ\theta$ 为 $n$ 维的， $ξ\xi$ 为 $m$ 维的，那么上式可以用分量表示为
$Iab(ξ)=∑i,j=1nIij∂θi∂ξa∂θj∂ξb,a,b=1,⋯,mI_{ab}(\xi) = \sum_{i,j=1}^n I_{ij}\frac{\partial \theta_i}{\partial \xi_a}\frac{\partial \theta_j}{\partial \xi_b},a,b = 1,\cdots,m$

根据定义计算即可
$Iab(ξ)=E[∂log⁡L∂ξa∂log⁡L∂ξb]=E[(∑i=1n∂log⁡L∂θi∂θi∂ξa)(∑j=1n∂log⁡L∂θj∂θj∂ξb)]=∑i,j=1nE[∂log⁡L∂θi∂log⁡L∂θj]∂θi∂ξa∂θj∂ξb=∑i,j=1nIij∂θi∂ξa∂θj∂ξbI_{ab}(\xi) = E \left[ \frac{\partial \log L}{\partial \xi_a} \frac{\partial \log L}{\partial \xi_b}\right] = E \left[ \left(\sum_{i=1}^n \frac{\partial \log L}{\partial \theta_i} \frac{\partial \theta_i}{\partial \xi_a}\right)\left(\sum_{j=1}^n \frac{\partial \log L}{\partial \theta_j} \frac{\partial \theta_j}{\partial \xi_b}\right)\right] \\ =\sum_{i,j=1}^n E \left[ \frac{\partial \log L}{\partial \theta_i} \frac{\partial \log L}{\partial \theta_j}\right]\frac{\partial \theta_i}{\partial \xi_a}\frac{\partial \theta_j}{\partial \xi_b}=\sum_{i,j=1}^n I_{ij}\frac{\partial \theta_i}{\partial \xi_a}\frac{\partial \theta_j}{\partial \xi_b}$

例自然参数形式的指数分布族 $f(x,θ)=h(x)exp⁡(θTT(x)−b(θ))f(x,\theta) = h(x)\exp(\theta^T T(x)-b(\theta))$ 的Fisher信息量为
$I(θ)=b′′(θ)=Var(T(X))I(\theta) = b''(\theta) = Var(T(X))$

假设参数 $η=Eθ(T(X))=b′(θ)\eta = E_{\theta}(T(X)) = b'(\theta)$ ，则根据隐映照定理，
$Dηθ(η)=[b′′(θ)]−1,θ=b′−1(η)D_{\eta}\theta(\eta) = [b''(\theta)]^{-1},\theta = b^{'-1}(\eta)$

根据Fisher信息参数变换的性质，
$I(η)=[b′′−1(θ)]TI(θ)b′′−1(θ)=b′′−1(θ),θ=b′−1(η)I(\eta) = [b^{''-1}(\theta)]^{T}I(\theta)b^{''-1}(\theta) = b^{''-1}(\theta),\theta = b^{'-1}(\eta)$

统计量的Fisher信息的有界性

假设 $\sim f(x,\theta)$ ， $\sim g(t,\theta)$ 是它的任意统计量，则
$\le I_T(X) \le I_X(\theta)$

当且仅当 $T (X)$ 为辅助统计量时取下界，当且仅当 $T (X)$ 为充分统计量时取上界。

证明
下界可以用 $IT(X)(θ)=Varθ(T(X))I_{T(X)}(\theta) = Var_{\theta}(T(X))$ 说明，方差一定是非负的，第一条性质说明当且仅当 $T (X)$ 为辅助统计量时取等。计算
$IX(θ)=Var(S(X,θ))=E[Var(S(X,θ)∣T)]+Var[E(S(X,θ)∣T)]I_{X}(\theta) = Var (S(X,\theta)) = E[Var (S(X,\theta)|T)] + Var[E(S(X,\theta)|T)]$

假设 $X$ 是概率空间 $(X,B(X),PX)(\mathcal{X},\mathcal{B}(\mathcal{X}),P_X)$ 上的随机变量， $X⊂Rn\mathcal{X} \subset \mathbb{R}^n$ 。统计量 $T (X)$ 是一个由复合函数 $\mathcal{X} \to \mathcal{T} \subset \mathbb{R}^k，k<n$ 定义的在概率空间 $(X,B(X),PX)(\mathcal{X},\mathcal{B}(\mathcal{X}),P_X)$ 上的随机变量，其中 $T$ 是可测函数。假设 $T (X)$ 是 $(T,B(T),PT)(\mathcal{T},\mathcal{B}(\mathcal{T}),P_T)$ 上的随机变量，则 $T$ 是可测函数意味着 $∀B∈B(T),T−1(B)∈B(X)\forall B \in \mathcal{B}(\mathcal{T}),T^{-1}(B) \in \mathcal{B}(\mathcal{X})$ ，从而导出测度 $P_T$ 可以表示为 $P_T(B)=P_X(T^{-1}(B))$ 。假设测度被参数化，且用 $θ\theta$ 表示其参数，则导出测度的关系意味着
$∂PT(B)∂θ=∂PX(T−1(B))∂θ\frac{\partial P_T(B)}{\partial \theta} = \frac{\partial P_X(T^{-1}(B))}{\partial \theta}$

将概率测度写成概率密度的积分，上式表示
$∂PT(B)∂θ=∂∂θ∫Bg(t,θ)dt=∂PX(T−1(B))∂θ=∂∂θ∫T−1(B)f(x,θ)dx\frac{\partial P_T(B)}{\partial \theta} = \frac{\partial }{\partial \theta} \int_{B} g(t,\theta)dt = \frac{\partial P_X(T^{-1}(B))}{\partial \theta} = \frac{\partial }{\partial \theta}\int_{T^{-1}(B)}f(x,\theta)dx$

凑出得分函数的形式，
$∫Bg(t,θ)S(t,θ)dt=∫T−1(B)f(x,θ)S(x,θ)dx\int_{B} g(t,\theta)S(t,\theta) dt = \int_{T^{-1}(B)}f(x,\theta)S(x,\theta)dx$

假设 $f(x,θ)f(x,\theta)$ 是完备分布族，这个式子说明 $S(T,θ)=E[S(X,θ)∣T]S(T,\theta) = E[S(X,\theta)|T]$ 。因此第二项可以化简为
$Var[E(S(X,θ)∣T)]=Var[S(T,θ)]=IT(θ)Var[E(S(X,\theta)|T)] = Var[S(T,\theta)] = I_T(\theta)$

因此
$IX(θ)−IT(θ)=E[Var(S(X,θ)∣T)]≥0I_X(\theta) - I_T(\theta) = E[Var (S(X,\theta)|T)]\ge0$

下面验证取等条件。充分性：
假设 $T$ 是充分统计量，根据Fisher-Neyman定理，
$f(x,θ)=g(T(x),θ)h(x)⇒log⁡f(x,θ)=log⁡g(T(x),θ)+log⁡h(x)⇒∂∂θlog⁡f(x,θ)=∂∂θlog⁡g(T(x),θ)f(x,\theta) = g(T(x),\theta)h(x) \\ \Rightarrow \log f(x,\theta) = \log g(T(x),\theta) + \log h(x) \\ \Rightarrow \frac{\partial }{\partial \theta} \log f(x,\theta) = \frac{\partial }{\partial \theta} \log g(T(x),\theta)$

因此 $IT(θ)=IX(θ)I_T(\theta) = I_X(\theta)$ 。

必要性：
我们计算下面这个量，
$E[(S(X,θ)−S(T,θ))(S(X,θ)−S(T,θ))T]=E[S(X,θ)ST(X,θ)]+E[S(T,θ)ST(T,θ)]−2E[S(X,θ)ST(T,θ)]=IX(θ)+IT(θ)−2IT(θ)=IX(θ)−IT(θ)E[(S(X,\theta)-S(T,\theta))(S(X,\theta)-S(T,\theta))^T] \\ = E[S(X,\theta)S^T(X,\theta)] + E[S(T,\theta)S^T(T,\theta)] - 2E[S(X,\theta)S^T(T,\theta)] \\ = I_X(\theta) + I_T(\theta) - 2I_T(\theta) = I_X(\theta) - I_T(\theta)$

其中
$E[S(X,θ)ST(T,θ)]=E[E[S(X,θ)ST(T,θ)∣T]]=E[E[S(X,θ)∣T]ST(T,θ)]=E[S(T,θ)ST(T,θ)]=IT(θ)E[S(X,\theta)S^T(T,\theta)] = E[E[S(X,\theta)S^T(T,\theta)|T]] = E[E[S(X,\theta)|T]S^T(T,\theta)] \\ = E[S(T,\theta)S^T(T,\theta)] = I_T(\theta)$

这个式子说明
$IX−IT=E[(S(X,θ)−S(T,θ))(S(X,θ)−S(T,θ))T]I_X - I_T = E[(S(X,\theta)-S(T,\theta))(S(X,\theta)-S(T,\theta))^T]$

左边为0，说明 $S(T,θ)=S(X,θ)S(T,\theta) = S(X,\theta)$ ，即
$∂∂θlog⁡f(x,θ)=∂∂θlog⁡g(T(x),θ)\frac{\partial }{\partial \theta} \log f(x,\theta) = \frac{\partial }{\partial \theta} \log g(T(x),\theta)$

$f(x,θ)f(x,\theta)$ 与 $g(t,θ)g(t,\theta)$ 只相差一个与 $θ\theta$ 无关的常函数，根据Neyman-Fisher定理， $T (X)$ 是充分统计量。

总结

以上是生活随笔为你收集整理的UA MATH566 统计理论 Fisher信息论的性质下的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇： UA MATH566 统计理论 Fish
下一篇： UA MATH571B 试验设计总结