欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

《基于张量网络的机器学习入门》学习笔记4

发布时间:2025/4/5 编程问答 30 豆豆
生活随笔 收集整理的这篇文章主要介绍了 《基于张量网络的机器学习入门》学习笔记4 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

《基于张量网络的机器学习入门》学习笔记4

  • 量子概率
    • 将概率复数化
    • 分布与向量的表示
    • 事件与Hilbert空间
    • 不兼容属性及其复数概率表示
    • 为什么一定要复数概率

量子概率

将概率复数化

在经典概率中论中,我们将事件的概率视为一个可观测的量。例如,抛硬币时,会以p(1)p(1)p(1)出现正面,p(0)p(0)p(0)出现反面,并且p(0)+p(1)=1p(0)+p(1)=1p(0)+p(1)=1,这是可以通过NNN次重复实验来进行解释的,我们可以将p(1)p(1)p(1)解释为现实事件中出现正面的次数占总的抛硬币次数的比例。

但是,在通常情况下,事件的概率并不是一个可观测的量,在每次抛硬币的过程中,我们实际上只能观测到正面或者反面,而无法观测概率p(1)p(1)p(1)。经典概率论告诉我们,只有在进行了大量的重复独立实验的前提下,我们才能渐进地观测到某一个事件出现的概率。然而,在更多的无法进行重复实验的场合下(例如,明天是否会下雨),我们任可以定义概率,但是,这里的概率就是一个不可观测的量。

正是因为概率的这种不可观测性,我们“有机可乘”,将概率变为复数。当然,我们并不是简单的将概率p(1)p(1)p(1)变成复数,而是定义了一种叫做概率幅(复数概率)的新量,即:ψ=a+bi\psi=a+biψ=a+bi,并且,我们规定这个复数概率ψ\psiψ可以按照下面的规则转变为经典概率:
p=∣ψ∣2=ψ∗ψ=(a−bi)(a+bi)=a2+b2p=|\psi|^2=\psi^*\psi=(a-bi)(a+bi)=a^2+b^2p=ψ2=ψψ=(abi)(a+bi)=a2+b2
∣ψ∣|\psi|ψ表示求复数的模,ψ∗\psi^*ψ表示ψ\psiψ的共轭复数。当然,如果要求经典概率,那么必须要求a2+b2∈[0,1]a^2+b^2\in[0,1]a2+b2[0,1]

现在,我们假设每一次观测会发生333件事:
首先,在观测前,假设硬币向上可以用一个复数概率表示,例如:
∣ψ⟩=12+12i\mathinner{|\psi\rangle}=\frac{1}{2}+\frac{1}{2}iψ=21+21i
然后,在测量的瞬间,我们定义复数概率会自动转变成概率,即按照如下原则得到正面朝上的概率:
p(1)=∣ψ(1)∣2=(12)2+(12)2=12p(1)=|\psi(1)|^2=(\frac{1}{2})^2+(\frac{1}{2})^2=\frac{1}{2}p(1)=ψ(1)2=(21)2+(21)2=21
最后,硬币会按照这个概率p(1)p(1)p(1)随机地出现正面或反面,而且还可以用复数概率ψ(1)\psi(1)ψ(1)进行描述,并且对任意一次随机试验的观测实际上是先从复数概率转变为经典概率,再由经典概率支配出现某一个观测值的比例。

因此,我们可以假设,再概率背后,还有一个更基本的复数概率制约着概率本身,正是因为概率本身是不能被直接观测到的量,所以我们再做一层复数概率的假设不会引起实质的困难。

现在,我们知道,某一个事件XXX的经典概率与该事件的复数概率存在着对应关系:P(X)=∣ψ(X)∣2P(X)=|\psi(X)|^2P(X)=ψ(X)2。但是,这个关系不是对称的。从复数概率到经典概率的映射是一个多对一的映射,即一个具体的概率值P(X)P(X)P(X),存在着无穷多个复数概率与其对应,并且可以证明这群复数概率满足:
ψ(X)=P(X)(cos⁡θ+isin⁡θ)=P(X)exp(iθ)\psi(X)=\sqrt{P(X)}(\cos\theta+i\sin\theta)=\sqrt{P(X)}exp(i\theta)ψ(X)=P(X)(cosθ+isinθ)=P(X)exp(iθ)(其中θ\thetaθ为任意实数)
这群复数落到了以圆点为圆心,以P(X)\sqrt{P(X)}P(X)为半径的圆上。一方面,这种多对一的关系使得复数概率完全可以涵盖经典概率的内容,甚至可以包含更丰富的信息;另一方面,复数概率具有更深的不可观测性,因为即使你对事件XXX进行了大量的测量,也只能得到复数概率的模的信息,而不可能确定它的相角θ\thetaθ,同时,也因为这个相角的存在,复数概率和经典概率表现出了本质上的区别!

分布与向量的表示

经典概率中,一个随机变量可以取多个不同的值,这些取值构成了两两互斥的随机事件。我们假设随机变量XXX的可能取值为:{x1,x2,⋯,xn}\{x_1,x_2,\cdots,x_n\}{x1,x2,,xn},那么我们可以定义nnn个概率:
p(xi)=P{X=xi},i=1,2,⋯,np(x_i)=P\{X=x_i\},i=1,2,\cdots,np(xi)=P{X=xi},i=1,2,,n
并且这些概率满足归一化条件:∑i=1np(xi)=1\sum\limits_{i = 1}^n {p({x_i}) = 1}i=1np(xi)=1
那么,这一组概率p(xi)p(x_i)p(xi)就构成了XXX的一个概率分布,为了方便讨论,我们不妨将这一组概率写成一个向量的形式:F(X)=p1∣x1⟩+p2∣x2⟩+⋯+pn∣xn⟩F(X)=p_1\mathinner{|x_1\rangle}+p_2\mathinner{|x_2\rangle}+\cdots+p_n\mathinner{|x_n\rangle}F(X)=p1x1+p2x2++pnxn
其中,pi=p(xi),pi∣xi⟩p_i=p(x_i),p_i\mathinner{|x_i\rangle}pi=p(xi)pixi表示对应的XXX在取值为xix_ixi的时候概率为p(xi)p(x_i)p(xi)。我们知道,F(X)F(X)F(X)这个向量相当于nnn维空间中的向量(p1,p2,⋯,pn)(p_1,p_2,\cdots,p_n)(p1,p2,,pn),其中pip_ipi就是该向量在第iii个维度上的坐标。这样,∣xi⟩\mathinner{|x_i\rangle}xi就相当于是这nnn维空间中的第iii个基向量。所以F(X)F(X)F(X)又可以写成坐标乘以相应的基向量再求和的形式。
按照复数概率的思想,我们也可以将每个随机事件X=xiX=x_iX=xi定义复数概率,当复数概率为nnn时:
Ψ(X)=ψ1∣x1⟩+ψ2∣x2⟩+⋯+ψn∣xn⟩\Psi(X)=\psi_1\mathinner{|x_1\rangle}+\psi_2\mathinner{|x_2\rangle}+\cdots+\psi_n\mathinner{|x_n\rangle}Ψ(X)=ψ1x1+ψ2x2++ψnxn
变量XXX取值xix_ixi的经典概率就是:P{X=xi}=∣ψi∣2P\{X=x_i\}=|\psi_i|^2P{X=xi}=ψi2
并且要求:∑i=1n∣ψi∣2=1\sum\limits_{i=1}^n|\psi_i|^2=1i=1nψi2=1
在经典概率论中,系统的任何性质都可以从概率分布中得到,同理,在复数概率中,给定了向量Ψ(X)\Psi(X)Ψ(X),也就给定了系统的状态,因为系统的一切性质都蕴含在这个向量中。
在经典概率论中,如果一个系统的概率分布是F(X)F(X)F(X),我们可以说变量XXXp1p_1p1的概率取x1x_1x1,以p2p_2p2的概率取x2⋯x_2\cdotsx2,但是在状态为Ψ(X)\Psi(X)Ψ(X)的量子系统中,我们不能说系统以∣Ψ2∣2|\Psi_2|^2Ψ22的概率处于∣x2⟩\mathinner{|x_2\rangle}x2状态,这是因为这些状态之间会发生相互干涉。

由于概率是不可直接测量的量,因此,我们完全可以用复数概率来描述系统从而达到与经典概率描述同等的效果。例如,我们可以用经典概率分布:
F(X)=12∣0⟩+12∣1⟩F(X)=\frac{1}{2}\mathinner{|0\rangle}+\frac{1}{2}\mathinner{|1\rangle}F(X)=210+211
来表示一枚硬币处于正面(状态∣1⟩\mathinner{|1\rangle}1)和反面(状态∣0⟩\mathinner{|0\rangle}0)的概率格是0.50.50.5.同样,我们也可以假设这枚硬币处于一个可以用复数概率描述的量子叠加态:
Ψ(X)=(12+12i)∣0⟩+(12+12i)∣1⟩\Psi(X)=(\frac{1}{2}+\frac{1}{2}i)\mathinner{|0\rangle}+(\frac{1}{2}+\frac{1}{2}i)\mathinner{|1\rangle}Ψ(X)=(21+21i)0+(21+21i)1
或者:
Ψ(X)=12∣0⟩+12∣1⟩\Psi(X)=\frac{1}{\sqrt{2}}\mathinner{|0\rangle}+\frac{1}{\sqrt{2}}\mathinner{|1\rangle}Ψ(X)=210+211

事件与Hilbert空间

在量子概率体系中,事件不再对应经典的集合,而是对应于线性空间,这个空间又称为Hilbert(希尔伯特)空间。

我们知道一个硬币在具体的测量之前可以处于一种用复数概率描述的量子力学叠加态:
Ψ(X)=12∣0⟩+12∣1⟩\Psi(X)=\frac{1}{\sqrt{2}}\mathinner{|0\rangle}+\frac{1}{\sqrt{2}}\mathinner{|1\rangle}Ψ(X)=210+211
这个状态恰好能用一个二维的线性空间表达:

在经典的概率实验中,000表示的是抛硬币得到反面,111表示得到正面,出现正面或者反面实际上都是基本的事件,而在复数概率的向量表示中,这两个基本事件则变成了两个相互垂直,交于一点OOO的单位向量∣0⟩\mathinner{|0\rangle}0∣1⟩\mathinner{|1\rangle}1。这是一个非常关键的区别,只有这样扩展量子概率,我们才能表达不兼容性

不兼容属性及其复数概率表示

不兼容性是量子概率,将概率论扩充到复数域中最特别的概念,也是区别复数概率和经典概率的本质所在。所谓的一对不兼容属性,就是指一个客观事物所具备的两种属性,这两种属性不能同时得到确切的测量值。
下面,我们举一个例子来进行说明:
假设某一个系统具有属性AAA,属性AAA的取值可以有{U,D}\{U,D\}{U,D}(即上、下)两种可能。另外,该系统还具有属性BBBBBB的取值可以由{L,R}\{L,R\}{L,R}(即左、右)两种可能。这样,我们就可以构成444组不同的原子事件{A属性为U,A属性为D,B属性为L和B属性为R\{A属性为U,A属性为D,B属性为L和B属性为R{AU,AD,BLBR。我们知道,每个事件都可以用线性空间中的向量来表示。由于AAA属性要么取UUU要么取DDD,所以,前两个事件就可以用两个相互垂直的向量来表示。同理,BBB属性也可以用两个相互垂直的向量表示。显然,这里形成了两个平面,当这两个平面重合在一起时,如下图:

如图所示:前两个事件(属性AAAUUU或者DDD)的两个基向量是黑色的坐标系(∣U⟩(\mathinner{|U\rangle}(U∣D⟩)\mathinner{|D\rangle})D)。而后两个事件(属性BBBLLL或者RRR)对应的基向量则是用蓝色的坐标系(∣L⟩(\mathinner{|L\rangle}(L∣R⟩)\mathinner{|R\rangle})R)表示。这两个坐标系重合在了 同一个平面上,只不过它们之间存在一个夹角θ\thetaθ(在更一般的情况下该夹角可以取复数)。对于同一个向量,例如对图中的粗箭头来说,他在第一个坐标系下可以表示为:
ψA=x∣U⟩+y∣D⟩\psi_A=x\mathinner{|U\rangle}+y\mathinner{|D\rangle}ψA=xU+yD
那么,在第二个坐标系下(∣L⟩\mathinner{|L\rangle}L∣R⟩\mathinner{|R\rangle}R构成的坐标系)构成的坐标就是:

因此,同样的向量可以表示为:
ψB=x′∣L⟩+y′∣R⟩\psi_B=x^{'}\mathinner{|L\rangle}+y^{'}\mathinner{|R\rangle}ψB=xL+yR
ΨA\Psi_AΨAΨB\Psi_BΨB是同一个向量分别在不同坐标系下的表示。由于x′,y′x^{'},y^{'}x,yx,yx,yx,y存在着如上式的联系,所以AAA属性上的概率分布会对BBB属性造成影响,反之亦然。因此,AAABBB两个属性之间存在着一种强烈的联系,也就是不兼容性。
比如,假设我们确定的知道AAA属性的取值为UUU,即发生UUU事件的概率为111,则:
ψA=1∣U⟩+0∣D⟩\psi_A=1\mathinner{|U\rangle}+0\mathinner{|D\rangle}ψA=1U+0D
这样,根据坐标变换式,同样的状态反应在BBB属性上就成了:

这样,只要θ\thetaθ不是000或者909090度的整数倍,则我们必然得到BBB属性值是不确定的,它会以cos⁡2θ\cos^2\thetacos2θ的概率取值LLL,而以sin⁡2θ\sin^2\thetasin2θ的概率取值RRR。因此,我们说AAABBB是一对不兼容的属性,因为它们不能同时被测准。
总之,只要确定了两个不兼容属性,它们之间的夹角θ\thetaθ就确定了下来,因此给定属性AAA上的复数概率分布,就必然会确定一组BBB上的复数概率分布。

为什么一定要复数概率

只有当考虑复数概率的时候,才能引入坐标转换的概念,因为,坐标转换本质上来讲是一种旋转操作,而旋转操作会保持向量的模不改变,。所以对于任何一个复数概率分布所对应的状态向量ψA=x∣U⟩+y∣D⟩\psi_A=x\mathinner{|U\rangle}+y\mathinner{|D\rangle}ψA=xU+yD来说,由于它的模必须是111,所以无论转换到哪一个坐标系,它都保持长度的不变,也就能保证新的向量所对应的经典概率分布是一个定义的概率分布,即各个分量上面的概率求和为111。正是因为概率幅而非概率具有这种旋转模不变的性质,所以我们只能对复数概率进行坐标变换的定义。

总结

以上是生活随笔为你收集整理的《基于张量网络的机器学习入门》学习笔记4的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。