当前位置：首页 > 编程资源 > 编程问答 >内容正文

编程问答

《基于张量网络的机器学习入门》学习笔记4

发布时间：2025/4/5 编程问答 30 豆豆

生活随笔收集整理的这篇文章主要介绍了《基于张量网络的机器学习入门》学习笔记4 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

《基于张量网络的机器学习入门》学习笔记4

量子概率
- 将概率复数化
- 分布与向量的表示
- 事件与Hilbert空间
- 不兼容属性及其复数概率表示
- 为什么一定要复数概率

量子概率

将概率复数化

在经典概率中论中，我们将事件的概率视为一个可观测的量。例如，抛硬币时，会以 $p (1)$ 出现正面， $p (0)$ 出现反面，并且 $p (0) + p (1) = 1$ ，这是可以通过 $N$ 次重复实验来进行解释的，我们可以将 $p (1)$ 解释为现实事件中出现正面的次数占总的抛硬币次数的比例。

但是，在通常情况下，事件的概率并不是一个可观测的量，在每次抛硬币的过程中，我们实际上只能观测到正面或者反面，而无法观测概率 $p (1)$ 。经典概率论告诉我们，只有在进行了大量的重复独立实验的前提下，我们才能渐进地观测到某一个事件出现的概率。然而，在更多的无法进行重复实验的场合下(例如，明天是否会下雨)，我们任可以定义概率，但是，这里的概率就是一个不可观测的量。

正是因为概率的这种不可观测性，我们“有机可乘”，将概率变为复数。当然，我们并不是简单的将概率 $p (1)$ 变成复数，而是定义了一种叫做概率幅(复数概率)的新量，即： $ψ=a+bi\psi=a+bi$ ，并且，我们规定这个复数概率 $ψ\psi$ 可以按照下面的规则转变为经典概率：
$p=∣ψ∣2=ψ∗ψ=(a−bi)(a+bi)=a2+b2p=|\psi|^2=\psi^*\psi=(a-bi)(a+bi)=a^2+b^2$
$∣ψ∣|\psi|$ 表示求复数的模， $ψ∗\psi^*$ 表示 $ψ\psi$ 的共轭复数。当然，如果要求经典概率，那么必须要求 $a2+b2∈[0,1]a^2+b^2\in[0,1]$

现在，我们假设每一次观测会发生 $3$ 件事：
首先，在观测前，假设硬币向上可以用一个复数概率表示，例如：
$∣ψ⟩=12+12i\mathinner{|\psi\rangle}=\frac{1}{2}+\frac{1}{2}i$
然后，在测量的瞬间，我们定义复数概率会自动转变成概率，即按照如下原则得到正面朝上的概率：
$p(1)=∣ψ(1)∣2=(12)2+(12)2=12p(1)=|\psi(1)|^2=(\frac{1}{2})^2+(\frac{1}{2})^2=\frac{1}{2}$
最后，硬币会按照这个概率 $p (1)$ 随机地出现正面或反面，而且还可以用复数概率 $ψ(1)\psi(1)$ 进行描述，并且对任意一次随机试验的观测实际上是先从复数概率转变为经典概率，再由经典概率支配出现某一个观测值的比例。

因此，我们可以假设，再概率背后，还有一个更基本的复数概率制约着概率本身，正是因为概率本身是不能被直接观测到的量，所以我们再做一层复数概率的假设不会引起实质的困难。

现在，我们知道，某一个事件 $X$ 的经典概率与该事件的复数概率存在着对应关系： $P(X)=∣ψ(X)∣2P(X)=|\psi(X)|^2$ 。但是，这个关系不是对称的。从复数概率到经典概率的映射是一个多对一的映射，即一个具体的概率值 $P (X)$ ，存在着无穷多个复数概率与其对应，并且可以证明这群复数概率满足：
$ψ(X)=P(X)(cos⁡θ+isin⁡θ)=P(X)exp(iθ)\psi(X)=\sqrt{P(X)}(\cos\theta+i\sin\theta)=\sqrt{P(X)}exp(i\theta)$ (其中 $θ\theta$ 为任意实数)
这群复数落到了以圆点为圆心，以 $P(X)\sqrt{P(X)}$ 为半径的圆上。一方面，这种多对一的关系使得复数概率完全可以涵盖经典概率的内容，甚至可以包含更丰富的信息；另一方面，复数概率具有更深的不可观测性，因为即使你对事件 $X$ 进行了大量的测量，也只能得到复数概率的模的信息，而不可能确定它的相角 $θ\theta$ ，同时，也因为这个相角的存在，复数概率和经典概率表现出了本质上的区别！

分布与向量的表示

经典概率中，一个随机变量可以取多个不同的值，这些取值构成了两两互斥的随机事件。我们假设随机变量 $X$ 的可能取值为： ${x1,x2,⋯,xn}\{x_1,x_2,\cdots,x_n\}$ ，那么我们可以定义 $n$ 个概率：
$p(xi)=P{X=xi},i=1,2,⋯,np(x_i)=P\{X=x_i\},i=1,2,\cdots,n$
并且这些概率满足归一化条件： $∑i=1np(xi)=1\sum\limits_{i = 1}^n {p({x_i}) = 1}$
那么，这一组概率 $p(x_i)$ 就构成了 $X$ 的一个概率分布，为了方便讨论，我们不妨将这一组概率写成一个向量的形式： $F(X)=p1∣x1⟩+p2∣x2⟩+⋯+pn∣xn⟩F(X)=p_1\mathinner{|x_1\rangle}+p_2\mathinner{|x_2\rangle}+\cdots+p_n\mathinner{|x_n\rangle}$
其中， $pi=p(xi)，pi∣xi⟩p_i=p(x_i)，p_i\mathinner{|x_i\rangle}$ 表示对应的 $X$ 在取值为 $x_i$ 的时候概率为 $p(x_i)$ 。我们知道， $F (X)$ 这个向量相当于 $n$ 维空间中的向量 $(p1,p2,⋯,pn)(p_1,p_2,\cdots,p_n)$ ，其中 $p_i$ 就是该向量在第 $i$ 个维度上的坐标。这样， $∣xi⟩\mathinner{|x_i\rangle}$ 就相当于是这 $n$ 维空间中的第 $i$ 个基向量。所以 $F (X)$ 又可以写成坐标乘以相应的基向量再求和的形式。
按照复数概率的思想，我们也可以将每个随机事件 $X=x_i$ 定义复数概率，当复数概率为 $n$ 时：
$Ψ(X)=ψ1∣x1⟩+ψ2∣x2⟩+⋯+ψn∣xn⟩\Psi(X)=\psi_1\mathinner{|x_1\rangle}+\psi_2\mathinner{|x_2\rangle}+\cdots+\psi_n\mathinner{|x_n\rangle}$
变量 $X$ 取值 $x_i$ 的经典概率就是： $P{X=xi}=∣ψi∣2P\{X=x_i\}=|\psi_i|^2$
并且要求： $∑i=1n∣ψi∣2=1\sum\limits_{i=1}^n|\psi_i|^2=1$
在经典概率论中，系统的任何性质都可以从概率分布中得到，同理，在复数概率中，给定了向量 $Ψ(X)\Psi(X)$ ，也就给定了系统的状态，因为系统的一切性质都蕴含在这个向量中。
在经典概率论中，如果一个系统的概率分布是 $F (X)$ ，我们可以说变量 $X$ 以 $p_1$ 的概率取 $x_1$ ，以 $p_2$ 的概率取 $x2⋯x_2\cdots$ ，但是在状态为 $Ψ(X)\Psi(X)$ 的量子系统中，我们不能说系统以 $∣Ψ2∣2|\Psi_2|^2$ 的概率处于 $∣x2⟩\mathinner{|x_2\rangle}$ 状态，这是因为这些状态之间会发生相互干涉。

由于概率是不可直接测量的量，因此，我们完全可以用复数概率来描述系统从而达到与经典概率描述同等的效果。例如，我们可以用经典概率分布：
$F(X)=12∣0⟩+12∣1⟩F(X)=\frac{1}{2}\mathinner{|0\rangle}+\frac{1}{2}\mathinner{|1\rangle}$
来表示一枚硬币处于正面(状态 $∣1⟩\mathinner{|1\rangle}$ )和反面(状态 $∣0⟩\mathinner{|0\rangle}$ )的概率格是 $0.5$ .同样，我们也可以假设这枚硬币处于一个可以用复数概率描述的量子叠加态：
$Ψ(X)=(12+12i)∣0⟩+(12+12i)∣1⟩\Psi(X)=(\frac{1}{2}+\frac{1}{2}i)\mathinner{|0\rangle}+(\frac{1}{2}+\frac{1}{2}i)\mathinner{|1\rangle}$
或者：
$Ψ(X)=12∣0⟩+12∣1⟩\Psi(X)=\frac{1}{\sqrt{2}}\mathinner{|0\rangle}+\frac{1}{\sqrt{2}}\mathinner{|1\rangle}$

事件与Hilbert空间

在量子概率体系中，事件不再对应经典的集合，而是对应于线性空间，这个空间又称为Hilbert(希尔伯特)空间。

我们知道一个硬币在具体的测量之前可以处于一种用复数概率描述的量子力学叠加态：
$Ψ(X)=12∣0⟩+12∣1⟩\Psi(X)=\frac{1}{\sqrt{2}}\mathinner{|0\rangle}+\frac{1}{\sqrt{2}}\mathinner{|1\rangle}$
这个状态恰好能用一个二维的线性空间表达：

在经典的概率实验中， $0$ 表示的是抛硬币得到反面， $1$ 表示得到正面，出现正面或者反面实际上都是基本的事件，而在复数概率的向量表示中，这两个基本事件则变成了两个相互垂直，交于一点 $O$ 的单位向量 $∣0⟩\mathinner{|0\rangle}$ 和 $∣1⟩\mathinner{|1\rangle}$ 。这是一个非常关键的区别，只有这样扩展量子概率，我们才能表达不兼容性。

不兼容属性及其复数概率表示

不兼容性是量子概率，将概率论扩充到复数域中最特别的概念，也是区别复数概率和经典概率的本质所在。所谓的一对不兼容属性，就是指一个客观事物所具备的两种属性，这两种属性不能同时得到确切的测量值。
下面，我们举一个例子来进行说明：
假设某一个系统具有属性 $A$ ，属性 $A$ 的取值可以有 ${U,D\}$ (即上、下)两种可能。另外，该系统还具有属性 $B$ ， $B$ 的取值可以由 ${L,R\}$ (即左、右)两种可能。这样，我们就可以构成 $4$ 组不同的原子事件 ${A属性为U,A属性为D,B属性为L和B属性为R$ 。我们知道，每个事件都可以用线性空间中的向量来表示。由于 $A$ 属性要么取 $U$ 要么取 $D$ ，所以，前两个事件就可以用两个相互垂直的向量来表示。同理， $B$ 属性也可以用两个相互垂直的向量表示。显然，这里形成了两个平面，当这两个平面重合在一起时，如下图:

如图所示：前两个事件(属性 $A$ 取 $U$ 或者 $D$ )的两个基向量是黑色的坐标系 $(∣U⟩(\mathinner{|U\rangle}$ 和 $∣D⟩)\mathinner{|D\rangle})$ 。而后两个事件(属性 $B$ 取 $L$ 或者 $R$ )对应的基向量则是用蓝色的坐标系 $(∣L⟩(\mathinner{|L\rangle}$ 和 $∣R⟩)\mathinner{|R\rangle})$ 表示。这两个坐标系重合在了同一个平面上，只不过它们之间存在一个夹角 $θ\theta$ (在更一般的情况下该夹角可以取复数)。对于同一个向量，例如对图中的粗箭头来说，他在第一个坐标系下可以表示为：
$ψA=x∣U⟩+y∣D⟩\psi_A=x\mathinner{|U\rangle}+y\mathinner{|D\rangle}$
那么，在第二个坐标系下( $∣L⟩\mathinner{|L\rangle}$ 和 $∣R⟩\mathinner{|R\rangle}$ 构成的坐标系)构成的坐标就是：

因此，同样的向量可以表示为：
$ψB=x′∣L⟩+y′∣R⟩\psi_B=x^{'}\mathinner{|L\rangle}+y^{'}\mathinner{|R\rangle}$
$ΨA\Psi_A$ 和 $ΨB\Psi_B$ 是同一个向量分别在不同坐标系下的表示。由于 $x^{'},y^{'}$ 与 $x, y$ 存在着如上式的联系，所以 $A$ 属性上的概率分布会对 $B$ 属性造成影响，反之亦然。因此， $A$ 和 $B$ 两个属性之间存在着一种强烈的联系，也就是不兼容性。
比如，假设我们确定的知道 $A$ 属性的取值为 $U$ ，即发生 $U$ 事件的概率为 $1$ ，则：
$ψA=1∣U⟩+0∣D⟩\psi_A=1\mathinner{|U\rangle}+0\mathinner{|D\rangle}$
这样，根据坐标变换式，同样的状态反应在 $B$ 属性上就成了：

这样，只要 $θ\theta$ 不是 $0$ 或者 $90$ 度的整数倍，则我们必然得到 $B$ 属性值是不确定的，它会以 $cos⁡2θ\cos^2\theta$ 的概率取值 $L$ ，而以 $sin⁡2θ\sin^2\theta$ 的概率取值 $R$ 。因此，我们说 $A$ 和 $B$ 是一对不兼容的属性，因为它们不能同时被测准。
总之，只要确定了两个不兼容属性，它们之间的夹角 $θ\theta$ 就确定了下来，因此给定属性 $A$ 上的复数概率分布，就必然会确定一组 $B$ 上的复数概率分布。

为什么一定要复数概率

只有当考虑复数概率的时候，才能引入坐标转换的概念，因为，坐标转换本质上来讲是一种旋转操作，而旋转操作会保持向量的模不改变，。所以对于任何一个复数概率分布所对应的状态向量 $ψA=x∣U⟩+y∣D⟩\psi_A=x\mathinner{|U\rangle}+y\mathinner{|D\rangle}$ 来说，由于它的模必须是 $1$ ，所以无论转换到哪一个坐标系，它都保持长度的不变，也就能保证新的向量所对应的经典概率分布是一个定义的概率分布，即各个分量上面的概率求和为 $1$ 。正是因为概率幅而非概率具有这种旋转模不变的性质，所以我们只能对复数概率进行坐标变换的定义。

总结

以上是生活随笔为你收集整理的《基于张量网络的机器学习入门》学习笔记4的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇：《基于张量网络的学习入门》学习笔记3
下一篇：《基于张量网络的机器学习入门》学习笔记5