《基于张量网络的机器学习入门》学习笔记1
《基于张量网络的学习入门》学习笔记1
- 量子力学的三大奥义
- 什么是量子
- 量子力学的三大奥义——叠加、测量和纠缠
- 第一大奥义:量子的叠加态
- 第二大奥义:量子的测量
- 第三大奥义:量子的纠缠态
量子力学的三大奥义
什么是量子
定义 量子是“离散变化的最小单元”
“离散变化”即指量子的 变化是不能连续的,就像人一样,只有一个人,两个人等,不能出现1.5个人。因此,我们可以称某个只能离散变化的东西叫“量子化”的。
量子力学的三大奥义——叠加、测量和纠缠
第一大奥义:量子的叠加态
为了理解叠加态这个概念,首要要定义“态矢量”
定义: 态矢量——表示量子力学状态的矢量
在量子力学里中的态,是矢量,我们用符号∣a⟩\mathinner{|a\rangle}∣a⟩表示态矢量,它由Hilbert空间中的列向量表示(相应的⟨a∣用Hilbert空间中的\mathinner{\langle a|}用Hilbert空间中的⟨a∣用Hilbert空间中的行向量表示表示表示),其中“∣⟩\mathinner{|\quad\rangle}∣⟩”是英国物理学家狄拉克发明的,称为“狄拉克符号”。
注: ∣a⟩\mathinner{|a\rangle}∣a⟩称为右矢,相应的⟨a∣\mathinner{\langle a|}⟨a∣称为左矢,两者互为对偶向量,统称为态向量(或态矢)
定义: 经典位比特(比特)——一个经典位(比特)是可以处于两个完全不同状态的系统,这两个状态可以用二进制数000和111来表示
经典比特对应计算机的操作可以有“恒等”、“与”、“非”操作等,那么在量子计算机中或者量子计算领域,我们使用态矢量来作为“比特”。
在二维复数Hilbert空间中,经典比特的两个态可以用矢量的两个分量来表示,即用一堆正交归一的量子态来表示:
∣↑⟩≡(10)\mathinner{|\uparrow\rangle}\equiv \left(\begin{array}{c}1\\0\end{array}\right)∣↑⟩≡(10),经典比特000 \quad\quad ∣↓⟩≡(01)\mathinner{|\downarrow\rangle}\equiv \left(\begin{array}{c}0\\1\end{array}\right)∣↓⟩≡(01),经典比特111
通过线性代数的学习,我们知道,在一个线性空间中,如果给定一组线性无关的基底a1,a2,⋯,an,a_1,a_2,\cdots,a_n,a1,a2,⋯,an,则向量空间中的任意向量β\betaβ都可以表示为基底的线性组合:β=λ1a1+λ2a2+⋯+λnan\beta=\lambda_1a_1+\lambda_2a_2+\cdots+\lambda_na_nβ=λ1a1+λ2a2+⋯+λnan
量子世界中的态可以同时是两种态的叠加——既向上又向下。现在我们可以用线性组合来表示这个叠加的状态。将∣↑⟩\mathinner{|\uparrow\rangle}∣↑⟩和∣↓⟩\mathinner{|\downarrow\rangle}∣↓⟩看成某个抽象的二维空间中的基底,那么,叠加状态就是:∣φ⟩=α[10]+β[01]=[αβ]\mathinner{|\varphi\rangle}=\alpha\left[ \begin{array}{l}1\\0\end{array} \right] + \beta \left[ \begin{array}{l}0\\1\end{array} \right] = \left[ \begin{array}{l}\alpha \\\beta \end{array} \right]∣φ⟩=α[10]+β[01]=[αβ]
其中,α\alphaα和β\betaβ是复数,也叫做概率幅或者几率幅,并且满足∣α∣2+∣β∣2=1|\alpha|^2+|\beta|^2=1∣α∣2+∣β∣2=1这样的一个态就被称为量子比特。
定义: 量子比特——一个量子比特是一个可以在二维复数Hilbert空间中描述的两级量子体系
根据叠加原理,量子比特的任何态都可以写成如下形式:
∣φ⟩=α∣↑⟩+β∣↓⟩(∣α∣2+∣β∣2=1)\mathinner{|\varphi\rangle}=\alpha\mathinner{|\uparrow\rangle}+\beta\mathinner{|\downarrow\rangle}(|\alpha|^2+|\beta|^2=1)∣φ⟩=α∣↑⟩+β∣↓⟩(∣α∣2+∣β∣2=1)
式中的α,β,∣α∣2,∣β∣2\alpha,\beta,|\alpha|^2,|\beta|^2α,β,∣α∣2,∣β∣2分别为叠加态坍缩的000和111的概率,并且服从归一化条件
除此之外,我们还在一个Bloch球中来便是量子比特,即
∣φ⟩=eiγ(cosθ2∣0⟩+eiϕ(sinθ2∣1⟩)\mathinner{|\varphi\rangle}={e^{i\gamma }}(\cos \frac{\theta }{2}\mathinner{|0\rangle}+{e^{i\phi }}(\sin \frac{\theta }{2}\mathinner{|1\rangle})∣φ⟩=eiγ(cos2θ∣0⟩+eiϕ(sin2θ∣1⟩)(可借助欧拉公式进行理解:eix=cosx+isinx{e^{ix}} = \cos x + i\sin xeix=cosx+isinx)
下面会运用到一系列量子态相关的运算和性质,这里将常用的符号表附上
第二大奥义:量子的测量
回到叠加态的限制条件(∣α∣2+∣β∣2=1)(|\alpha|^2+|\beta|^2=1)(∣α∣2+∣β∣2=1),我们可以把这个条件改写为向量内积的形式
(αβ)(αβ)=1(\alpha\quad\beta)\left( \begin{array}{l}\alpha \\\beta \end{array} \right)=1(αβ)(αβ)=1,这总内积为1的条件,也就是前面的归一化条件。
在量子力学中,把态矢量∣φ⟩\mathinner{|\varphi\rangle}∣φ⟩和它自身的内积记为:⟨φ∣φ⟩\mathinner{\langle\varphi|\varphi\rangle}⟨φ∣φ⟩即左右矢相乘,那么归一化条件就可以记为⟨φ∣φ⟩=1\mathinner{\langle\varphi|\varphi\rangle}=1⟨φ∣φ⟩=1。但是,因为量子力学中叠加态的系数是复数,所以我们在复数域重新定义内积。
为了让内积的结果是实数,我们将它的定义改写为叠加系数的模平方求和:
⟨φ∣φ⟩=∣α∣2+∣β∣2=α∗α+β∗β\mathinner{\langle\varphi|\varphi\rangle}=|\alpha|^2+|\beta|^2=\alpha^*\alpha+\beta^*\beta⟨φ∣φ⟩=∣α∣2+∣β∣2=α∗α+β∗β,这里∗*∗表示共轭转置。
定义: 态矢量的内积——在态矢量空间中按照一定顺序选取任意两个态矢,总可以定义一种计算规则,得到一个数(实数或复数)与之对应
这一定义规则被称为内积,记做
c=⟨α∣β⟩=(∣α⟩,∣β⟩)=(∑iai∗⟨αi∣)(∑ibi∣βi⟩)=∑iai∗bi⟨αi∣βi⟩c=\mathinner{\langle\alpha|\beta\rangle}=(\mathinner{|\alpha\rangle},\mathinner{|\beta\rangle})=(\sum\limits_i {a_i^*\mathinner{\langle \alpha_i|}})(\sum\limits_i {b_i\mathinner{|\beta_i\rangle}})=\sum\limits_i {a_i^*{b_i}}\mathinner{\langle\alpha_i|\beta_i\rangle}c=⟨α∣β⟩=(∣α⟩,∣β⟩)=(i∑ai∗⟨αi∣)(i∑bi∣βi⟩)=i∑ai∗bi⟨αi∣βi⟩
态矢量有如下性质:
∙\bullet∙反对称性:⟨α∣β⟩=⟨β∣α⟩∗\mathinner{\langle\alpha|\beta\rangle}=\mathinner{\langle\beta|\alpha\rangle}^*⟨α∣β⟩=⟨β∣α⟩∗
∙\bullet∙线性性:⟨α∣β+γ⟩=⟨α∣β⟩+⟨α∣γ⟩\mathinner{\langle\alpha|\beta+\gamma\rangle}=\mathinner{\langle\alpha|\beta\rangle}+\mathinner{\langle\alpha|\gamma\rangle}⟨α∣β+γ⟩=⟨α∣β⟩+⟨α∣γ⟩
∙\bullet∙数乘性:⟨α∣bβ⟩=b⟨α∣β⟩=⟨α∣β⟩b\mathinner{\langle\alpha|b\beta\rangle}=b\mathinner{\langle\alpha|\beta\rangle}=\mathinner{\langle\alpha|\beta\rangle}b⟨α∣bβ⟩=b⟨α∣β⟩=⟨α∣β⟩b
∙\bullet∙半正定性:⟨α∣α⟩≥0\mathinner{\langle\alpha|\alpha\rangle}\ge0⟨α∣α⟩≥0
满足加法和数乘两种运算性质的集合,被称为矢量空间或线性空间.满足加法、数乘和内积三种运算的空间被称为内积空间.完备的内积空间则称为希尔伯特空间.
接下来,我们了解一下本征态的概念
定义: 本征态——经历了矩阵乘法之后,方向保持不变(可以反向)的矢量
这就意味着M∣i⟩=mi∣i⟩M\mathinner{|i\rangle}=m_i\mathinner{|i\rangle}M∣i⟩=mi∣i⟩,其中∣i⟩\mathinner{|i\rangle}∣i⟩是本征态,mim_imi则是相应的本征值。以此我们可以联想到线性代数的特征方程,本征态对应特征向量,本征值对应特征值。
现在,我们终于可以开始讲量子比特的测量了
我们可以把一个量子比特的状态以概率幅的方式变换成比特信息,也就是说,量子比特∣φ⟩\mathinner{|\varphi\rangle}∣φ⟩以概率∣⟨↑∣φ⟩∣2|\mathinner{\langle\uparrow|\varphi\rangle}|^2∣⟨↑∣φ⟩∣2变换成比特000,以概率∣⟨↓∣φ⟩∣2|\mathinner{\langle\downarrow|\varphi\rangle}|^2∣⟨↓∣φ⟩∣2变换成比特111,由于内积是线性演算,且∣↑⟩\mathinner{|\uparrow\rangle}∣↑⟩和∣↓⟩\mathinner{|\downarrow\rangle}∣↓⟩是正交基底,那么前面两式内积的结果为:
⟨↑∣φ⟩=⟨↑∣(α∣↑⟩+β∣↓⟩=α\mathinner{\langle\uparrow|\varphi\rangle}=\mathinner{\langle\uparrow|(\alpha\mathinner{|\uparrow\rangle}}+\beta\mathinner{|\downarrow\rangle}=\alpha⟨↑∣φ⟩=⟨↑∣(α∣↑⟩+β∣↓⟩=α
⟨↓∣φ⟩=⟨↓∣(α∣↑⟩+β∣↓⟩=β\mathinner{\langle\downarrow|\varphi\rangle}=\mathinner{\langle\downarrow|(\alpha\mathinner{|\uparrow\rangle}}+\beta\mathinner{|\downarrow\rangle}=\beta⟨↓∣φ⟩=⟨↓∣(α∣↑⟩+β∣↓⟩=β
即∣φ⟩\mathinner{|\varphi\rangle}∣φ⟩以概率∣α∣2|\alpha|^2∣α∣2变换成比特000,以概率∣β∣2|\beta|^2∣β∣2变换成比特111
在量子力学中,测量值就是本征值也就是特征值。那么,联系线性代数,我们可以知道,特征值就是可观测量MMM在某个地方出现的概率。
测量可以给出任何一个本征值mim_imi,且每一个都有一定的概率。现在用MMM的本征矢量为基来扩展任意态∣φ⟩\mathinner{|\varphi\rangle}∣φ⟩:∣φ⟩=∑iαi∣i⟩\mathinner{|\varphi\rangle}=\sum\limits_i {{\alpha_i}}\mathinner{|i\rangle}∣φ⟩=i∑αi∣i⟩,其中,αi\alpha_iαi是复常数。
根据量子力学的知识,在进行测量后,态矢量会发生坍缩,也就是如果本征态mim_imi被测量,那么测量后的系统的态矢对应的本征矢量∣i⟩\mathinner{|i\rangle}∣i⟩,当前的量子系统就会确定到这个本征态上。
∣φ⟩⟶mi∣i⟩\mathinner{|\varphi\rangle}\stackrel{m_i}{\longrightarrow}\mathinner{|i\rangle}∣φ⟩⟶mi∣i⟩
注:测量是量子态上唯一不可逆的操作,其他操作都是可逆的
(此部分可以去看看薛定谔的猫加深理解)
第三大奥义:量子的纠缠态
根据纠缠的定义,肯定不是单一的系统能观测到的。所以,现在我们需要将视线放到不同的系统之间的结合。
我们首先来学习下张量积
定义:张量积——对每一对矢量∣φ1⟩∈H1,∣φ2⟩∈H2\mathinner{|\varphi_1\rangle}\in H_1,\mathinner{|\varphi_2\rangle}\in H_2∣φ1⟩∈H1,∣φ2⟩∈H2,Hilbert空间HHH都有一个矢量∣φ⟩\mathinner{|\varphi\rangle}∣φ⟩与他们联系,∣φ⟩\mathinner{|\varphi\rangle}∣φ⟩被称为∣φ1⟩,∣φ2⟩\mathinner{|\varphi_1\rangle},\mathinner{|\varphi_2\rangle}∣φ1⟩,∣φ2⟩的张量积,记为∣φ⟩=∣φ1⟩⊗∣φ2⟩\mathinner{|\varphi_\rangle}=\mathinner{|\varphi_1\rangle}\otimes\mathinner{|\varphi_2\rangle}∣φ⟩=∣φ1⟩⊗∣φ2⟩,常记为∣φ1⟩∣φ2⟩\mathinner{|\varphi_1\rangle}\mathinner{|\varphi_2\rangle}∣φ1⟩∣φ2⟩或∣φ1φ2⟩\mathinner{|\varphi_1\varphi_2\rangle}∣φ1φ2⟩,HHH中的矢量是∣φ1⟩⊗∣φ2⟩\mathinner{|\varphi_1\rangle}\otimes\mathinner{|\varphi_2\rangle}∣φ1⟩⊗∣φ2⟩的线性叠加。
例如,A,BA,BA,B分别是m×mm\times mm×m和n×nn\times nn×n的方阵,则:
好,下面可以开始讲量子纠缠态了
定义:量子纠缠态——当量子比特的叠加状态无法用各量子比特的张量积乘积表示时,这种叠加态就称为量子纠缠态
现在,给定两个电子,AAA处于向上的态∣↑⟩A\mathinner{|\uparrow\rangle}_A∣↑⟩A,BBB处于向下的态∣↓⟩B\mathinner{|\downarrow\rangle}_B∣↓⟩B,根据排列组合,总共有四种结合态∣↑↑⟩、∣↑↓⟩、∣↓↑⟩、∣↓↓⟩\mathinner{|\uparrow\uparrow\rangle}、\mathinner{|\uparrow\downarrow\rangle}、\mathinner{|\downarrow\uparrow\rangle}、\mathinner{|\downarrow\downarrow\rangle}∣↑↑⟩、∣↑↓⟩、∣↓↑⟩、∣↓↓⟩.态矢量∣ψ⟩\mathinner{|\psi\rangle}∣ψ⟩可以是这四种态的叠加。如果,一个系统的态为:∣ψ⟩=12∣↑↓⟩+12∣↓↑⟩\mathinner{|\psi\rangle}=\frac{1}{{\sqrt 2 }}\mathinner{|\uparrow\downarrow\rangle}+\frac{1}{{\sqrt 2 }}\mathinner{|\downarrow\uparrow\rangle}∣ψ⟩=21∣↑↓⟩+21∣↓↑⟩,由于它不能被分厘为单个电子的态的乘积,所以这个系统的态被称为纠缠态。
现在例举一个不是纠缠态的例子,我们看看和纠缠态的区别
我们可以发现,不是纠缠态的,有个类似于提取公因式的操作,而上面的纠缠态式子明显无法完成这个操作。这种能提取“公因式” 式子又被叫做直积态,即能够直接写成张量积的态。
直观的说,纠缠态的量子是会相互影响的,而非纠缠态的量子不会。
好了,这部分内容到一段落,希望感兴趣的朋友能关注收藏。
总结
以上是生活随笔为你收集整理的《基于张量网络的机器学习入门》学习笔记1的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 洛谷P1040 加分二叉树运用区间DP(
- 下一篇: 《基于张量网络的机器学习入门》学习笔记2