当前位置：首页 >

LASSO与Item Response Theory模型中的隐变量选择

发布时间：2025/4/14 57 豆豆

生活随笔收集整理的这篇文章主要介绍了 LASSO与Item Response Theory模型中的隐变量选择小编觉得挺不错的,现在分享给大家,帮大家做个参考.

LASSO与Item Response Theory模型中的隐变量选择

Item Response Theory简介
- 统计模型
Latent Traits Selection
- 两参数模型的LASSO
- BIC for tuning
- Latent traits selection的EM算法

这是Latent Variable Selection for Multidimensional Item Response Theory Models via L1 Regularization的简单介绍。

Item Response Theory简介

在心理学中，有很多用于测量个人特质（trait）与dichotomous-response、polytomous-response item（就是用一些二选或者多选的问题来看被试者在一些具体场景中的反应）的量表和实验，基于这些量表与实验的测量结果，心理学家可以发掘item-trait之间的关系。

下面是几个二选的例子（如何应对坏男人）

下面是两个多选问题的例子（gender-orientation的测试）

统计模型

Item Response Theory (IRT)就是很常用的描述item-trait relation的统计模型。用 $θ=(θ1,⋯,θK)T\theta=(\theta^1,\cdots,\theta^K)^T$ 表示被试者的特质向量（这个是不可测量的），每一个分量表示被试者的一种潜在特质；考虑 $J$ 个二选题组成的量表，用 $Y_j$ 表示被试者对第 $j$ 个问题的回答，假设我们讨论两参数模型
$P(Yj=1∣θ)=F(ajTθ+bj)P(Y_j=1|\theta)=F(a_j^T\theta+b_j)$

其中 $aj=(aj1,⋯,ajK)Ta_j=(a_{j1},\cdots,a_{jK})^T$ ， $F(⋅)F(\cdot)$ 是一个累积分布函数，定义
$(a_1,\cdots,a_J),b=(b_1,\cdots,b_J)^T$

称 $a_j$ 为discrimination parameter vector， $b_j$ 为difficulty parameter。如果 $ajk≠0a_{jk} \ne 0$ ，就可以认为特质 $k$ 在被试者对第 $j$ 个问题做出1的回应中起到了一定作用。于是，为了构建特质与被试者在不同情景中的反应之间的关系，我们希望找出在被试者对每一个问题做出回应的过程中起作用的那些特质，这个正是variable selection可以解决的。正式描述的话就是我们希望估计一个0-1矩阵
$Λ=(λjk)J×K,λjk=Iajk≠0\Lambda=(\lambda_{jk})_{J \times K}, \lambda_{jk}=I_{a_{jk} \ne 0}$

用来描述item-trait relation。

另外，关于 $F$ 有两种流行的选择：
Normal Ogive Model
$P(Yj=1∣θ,aj,bj)=∫−∞ajTθ+bje−u222πduP(Y_j=1|\theta,a_j,b_j)=\int_{-\infty}^{a_j^T\theta+b_j}\frac{e^{-\frac{u^2}{2}}}{\sqrt{2\pi}}du$

Logistics Model

$P(Yj=1∣θ,aj,bj)=exp⁡(ajTθ+bj)1+exp⁡(ajTθ+bj)P(Y_j=1|\theta,a_j,b_j)=\frac{\exp(a_j^T\theta+b_j)}{1+\exp(a_j^T\theta+b_j)}$

在原文中，作者也讨论了一种三参数模型：
$P(Yj=1∣θ,aj,bj,cj)=cj+(1−cj)F(ajTθ+bj)P(Y_j=1|\theta,a_j,b_j,c_j)=c_j+(1-c_j)F(a_j^T\theta+b_j)$

$c_j$ 表示guessing probability。

Latent Traits Selection

两参数模型的LASSO

假设有 $N$ 个被试者，他们对 $J$ 个问题的回答用 $Y=(Yij)N×JY=(Y_{ij})_{N \times J}$ 表示，他们的特质满足 $θ1,⋯,θN∼iidN(0,Σ)\theta_1,\cdots,\theta_N \sim_{iid} N(0,\Sigma)$ （概率密度记为 $ϕ(θ)\phi(\theta)$ ），记 $Θ=(θ1,⋯,θN)\Theta=(\theta_1,\cdots,\theta_N)$ ，于是两参数模型的似然函数为（包含complete data $Y$ 与missing data $Θ\Theta$ ）
$L(A,b∣Y,Θ)=∏i=1Nϕ(θi)∏j=1J[F(ajTθi+bj)]yij[1−F(ajTθi+bj)]1−yijL(A,b|Y,\Theta)=\prod_{i=1}^N\phi(\theta_i)\prod_{j=1}^J [F(a_j^T \theta_i+b_j)]^{y_{ij}} \left[1-F(a_j^T\theta_i+b_j) \right]^{1-y_{ij}}$

complete data的对数似然为
$l(A,b∣Y)=log⁡∫Θ∈RK×NL(A,b∣Y,Θ)dΘl(A,b|Y)=\log \int_{\Theta \in \mathbb{R}^{K \times N}} L(A,b|Y,\Theta)d \Theta$

用complete data的对数似然扣掉discrimination parameter的LASSO penalty作为score function，最大化score function可以得到参数的LASSO估计：
$(A^η,b^η)=arg max⁡l(A,b∣Y)−η∥A∥1(\hat A_{\eta},\hat b_{\eta})=\argmax \ \ l(A,b|Y)-\eta \left\| A\right\|_1$

其中 $η>0\eta>0$ 是regularization parameter，
$∥A∥1=∑j=1J∑k=1K∣ajk∣\left\|A\right\|_1=\sum_{j=1}^J \sum_{k=1}^K |a_{jk}|$

如果 $η=0\eta=0$ ，那么LASSO估计退化为MLE。

BIC for tuning

原文作者采用BIC选择regularization parameter $η\eta$ ，IRT的BIC定义为
$BIC(Λ∗)=−2max⁡Λ(A)=Λ∗,bl(A,b∣Y)+∥A∥0log⁡N∥A∥0=∑j,kIajk≠0BIC(\Lambda^*)=-2\max_{\Lambda(A)=\Lambda^*,b}l(A,b|Y)+\left\|A \right\|_0\log N \\ \left\| A\right\|_0=\sum_{j,k}I_{a_{jk} \ne 0}$

在两参数模型的LASSO中，我们可以按下面的步骤做tuning：

给定一个

η\eta

的取值，得到两参数模型的LASSO估计

A^η,b^η\hat A_{\eta},\hat b_{\eta}

根据

A^η\hat A_{\eta}

写出指标矩阵

Λη=Λ(A^η)\Lambda_{\eta}=\Lambda(\hat A_{\eta})

对于

Λη\Lambda_{\eta}

，计算

BIC(Λη)BIC(\Lambda_{\eta})

对于 $η\eta$ 取值的一个范围，计算出对应的 $B I C$ 后选出 $B I C$ 最小的 $η∗\eta^*$ 作为regularization parameter。

Latent traits selection的EM算法

这部分我暂时不关注，所以贴原文（希望了解更多细节与数值实验的同学可以自行阅读全文）

总结

以上是生活随笔为你收集整理的LASSO与Item Response Theory模型中的隐变量选择的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇： UA PHYS515A 电磁理论V 电磁
下一篇： UA MATH567 高维统计专题1 稀