欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

LASSO与Item Response Theory模型中的隐变量选择

发布时间:2025/4/14 57 豆豆
生活随笔 收集整理的这篇文章主要介绍了 LASSO与Item Response Theory模型中的隐变量选择 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

LASSO与Item Response Theory模型中的隐变量选择

  • Item Response Theory简介
    • 统计模型
  • Latent Traits Selection
    • 两参数模型的LASSO
    • BIC for tuning
    • Latent traits selection的EM算法

这是Latent Variable Selection for Multidimensional Item Response Theory Models via L1 Regularization的简单介绍。


Item Response Theory简介

在心理学中,有很多用于测量个人特质(trait)与dichotomous-response、polytomous-response item(就是用一些二选或者多选的问题来看被试者在一些具体场景中的反应)的量表和实验,基于这些量表与实验的测量结果,心理学家可以发掘item-trait之间的关系。

下面是几个二选的例子(如何应对坏男人)

下面是两个多选问题的例子(gender-orientation的测试)

统计模型

Item Response Theory (IRT)就是很常用的描述item-trait relation的统计模型。用θ=(θ1,⋯,θK)T\theta=(\theta^1,\cdots,\theta^K)^Tθ=(θ1,,θK)T表示被试者的特质向量(这个是不可测量的),每一个分量表示被试者的一种潜在特质;考虑JJJ个二选题组成的量表,用YjY_jYj表示被试者对第jjj个问题的回答,假设我们讨论两参数模型
P(Yj=1∣θ)=F(ajTθ+bj)P(Y_j=1|\theta)=F(a_j^T\theta+b_j)P(Yj=1θ)=F(ajTθ+bj)

其中aj=(aj1,⋯,ajK)Ta_j=(a_{j1},\cdots,a_{jK})^Taj=(aj1,,ajK)TF(⋅)F(\cdot)F()是一个累积分布函数,定义
A=(a1,⋯,aJ),b=(b1,⋯,bJ)TA = (a_1,\cdots,a_J),b=(b_1,\cdots,b_J)^TA=(a1,,aJ),b=(b1,,bJ)T

aja_jaj为discrimination parameter vector,bjb_jbj为difficulty parameter。如果ajk≠0a_{jk} \ne 0ajk=0,就可以认为特质kkk在被试者对第jjj个问题做出1的回应中起到了一定作用。于是,为了构建特质与被试者在不同情景中的反应之间的关系,我们希望找出在被试者对每一个问题做出回应的过程中起作用的那些特质,这个正是variable selection可以解决的。正式描述的话就是我们希望估计一个0-1矩阵
Λ=(λjk)J×K,λjk=Iajk≠0\Lambda=(\lambda_{jk})_{J \times K}, \lambda_{jk}=I_{a_{jk} \ne 0}Λ=(λjk)J×K,λjk=Iajk=0

用来描述item-trait relation。

另外,关于FFF有两种流行的选择:
Normal Ogive Model
P(Yj=1∣θ,aj,bj)=∫−∞ajTθ+bje−u222πduP(Y_j=1|\theta,a_j,b_j)=\int_{-\infty}^{a_j^T\theta+b_j}\frac{e^{-\frac{u^2}{2}}}{\sqrt{2\pi}}duP(Yj=1θ,aj,bj)=ajTθ+bj2πe2u2du

Logistics Model

P(Yj=1∣θ,aj,bj)=exp⁡(ajTθ+bj)1+exp⁡(ajTθ+bj)P(Y_j=1|\theta,a_j,b_j)=\frac{\exp(a_j^T\theta+b_j)}{1+\exp(a_j^T\theta+b_j)}P(Yj=1θ,aj,bj)=1+exp(ajTθ+bj)exp(ajTθ+bj)

在原文中,作者也讨论了一种三参数模型:
P(Yj=1∣θ,aj,bj,cj)=cj+(1−cj)F(ajTθ+bj)P(Y_j=1|\theta,a_j,b_j,c_j)=c_j+(1-c_j)F(a_j^T\theta+b_j)P(Yj=1θ,aj,bj,cj)=cj+(1cj)F(ajTθ+bj)

cjc_jcj表示guessing probability。

Latent Traits Selection

两参数模型的LASSO

假设有NNN个被试者,他们对JJJ个问题的回答用Y=(Yij)N×JY=(Y_{ij})_{N \times J}Y=(Yij)N×J表示,他们的特质满足θ1,⋯,θN∼iidN(0,Σ)\theta_1,\cdots,\theta_N \sim_{iid} N(0,\Sigma)θ1,,θNiidN(0,Σ)(概率密度记为ϕ(θ)\phi(\theta)ϕ(θ)),记Θ=(θ1,⋯,θN)\Theta=(\theta_1,\cdots,\theta_N)Θ=(θ1,,θN),于是两参数模型的似然函数为(包含complete data YYY与missing data Θ\ThetaΘ
L(A,b∣Y,Θ)=∏i=1Nϕ(θi)∏j=1J[F(ajTθi+bj)]yij[1−F(ajTθi+bj)]1−yijL(A,b|Y,\Theta)=\prod_{i=1}^N\phi(\theta_i)\prod_{j=1}^J [F(a_j^T \theta_i+b_j)]^{y_{ij}} \left[1-F(a_j^T\theta_i+b_j) \right]^{1-y_{ij}}L(A,bY,Θ)=i=1Nϕ(θi)j=1J[F(ajTθi+bj)]yij[1F(ajTθi+bj)]1yij

complete data的对数似然为
l(A,b∣Y)=log⁡∫Θ∈RK×NL(A,b∣Y,Θ)dΘl(A,b|Y)=\log \int_{\Theta \in \mathbb{R}^{K \times N}} L(A,b|Y,\Theta)d \Thetal(A,bY)=logΘRK×NL(A,bY,Θ)dΘ

用complete data的对数似然扣掉discrimination parameter的LASSO penalty作为score function,最大化score function可以得到参数的LASSO估计:
(A^η,b^η)=arg max⁡l(A,b∣Y)−η∥A∥1(\hat A_{\eta},\hat b_{\eta})=\argmax \ \ l(A,b|Y)-\eta \left\| A\right\|_1(A^η,b^η)=argmax  l(A,bY)ηA1

其中η>0\eta>0η>0是regularization parameter,
∥A∥1=∑j=1J∑k=1K∣ajk∣\left\|A\right\|_1=\sum_{j=1}^J \sum_{k=1}^K |a_{jk}|A1=j=1Jk=1Kajk

如果η=0\eta=0η=0,那么LASSO估计退化为MLE。

BIC for tuning

原文作者采用BIC选择regularization parameter η\etaη,IRT的BIC定义为
BIC(Λ∗)=−2max⁡Λ(A)=Λ∗,bl(A,b∣Y)+∥A∥0log⁡N∥A∥0=∑j,kIajk≠0BIC(\Lambda^*)=-2\max_{\Lambda(A)=\Lambda^*,b}l(A,b|Y)+\left\|A \right\|_0\log N \\ \left\| A\right\|_0=\sum_{j,k}I_{a_{jk} \ne 0}BIC(Λ)=2Λ(A)=Λ,bmaxl(A,bY)+A0logNA0=j,kIajk=0

在两参数模型的LASSO中,我们可以按下面的步骤做tuning:

  • 给定一个η\etaη的取值,得到两参数模型的LASSO估计A^η,b^η\hat A_{\eta},\hat b_{\eta}A^η,b^η
  • 根据A^η\hat A_{\eta}A^η写出指标矩阵Λη=Λ(A^η)\Lambda_{\eta}=\Lambda(\hat A_{\eta})Λη=Λ(A^η)
  • 对于Λη\Lambda_{\eta}Λη,计算BIC(Λη)BIC(\Lambda_{\eta})BIC(Λη)
  • 对于η\etaη取值的一个范围,计算出对应的BICBICBIC后选出BICBICBIC最小的η∗\eta^*η作为regularization parameter。

    Latent traits selection的EM算法

    这部分我暂时不关注,所以贴原文(希望了解更多细节与数值实验的同学可以自行阅读全文)




    总结

    以上是生活随笔为你收集整理的LASSO与Item Response Theory模型中的隐变量选择的全部内容,希望文章能够帮你解决所遇到的问题。

    如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。