当前位置：首页 >

矩阵快速幂一篇通

发布时间：2023/12/3 40 豆豆

生活随笔收集整理的这篇文章主要介绍了矩阵快速幂一篇通小编觉得挺不错的,现在分享给大家,帮大家做个参考.

文章目录

概述
快速幂
- 解析
- 代码
矩阵运算定义
- 加法
- 乘法
- 单位矩阵
一、斐波拉契（基础模板）
- 题目描述
- 解析
- 代码
二、行为方案（实际应用）
- 题目描述
- 解析
- 代码
三、矩阵求和（子矩阵作为矩阵元素）
- 题目描述
- 解析
- 代码
四、最短路径（对矩阵乘法灵活的定义方式）
- 题目描述
- 解析
- 代码：
thanks for reading！

概述

矩阵快速幂，顾名思义，就是矩阵乘法与快速幂的结合,可以将时间复杂度优化到log级别。
当数据范围中图的尺寸较小，而时间、变换次数、步数等的范围较大（通常在10^9左右）时，可以考虑矩阵快速幂问题
矩阵快速幂的关键在于构造转移矩阵

快速幂

解析

由于

x^a * x^b = x^(a+b)

逆向来看,对于一个较大的指数k，我们可以进行拆分：

x^k = x^a1 * x^a2 *…(a1+a2+…=k)

由于二进制拆分的唯一存在性，我们就可以把k拆成若干个2的幂数作为a序列，将其对应的乘幂求出，并乘在一起就能得到x^k了
时间复杂度log k

代码

ll ksm(ll x, int w) {//求x的w次幂ll ans = 1;while (w) {if (w & 1)ans = (ll)(ans * x) % mod;//mod是取模用的x = (x * x) % mod;w >>= 1;}return ans; }

矩阵运算定义

加法

对于两个大小完全相同的矩阵，定义二者相加为每个对应元素相加（比较简单，不细说了）

乘法

对于两个矩阵AB，若A的行数等于B的列数，则二者可以相乘
换言之，ab的矩阵A可以和bc的矩阵B相乘，结果是一个a*c的矩阵C，单次相乘时间复杂度为abc 的乘积
对于每一个c中的元素：

c[i][j]=∑a[i][p]+b[p][j](1<=p<=b)

简单说就是顶针式的乘积累加
容易证明，矩阵乘法满足结合律，但是不满足交换律
对于一个行列相等的方阵，可以不断累乘自身

单位矩阵

如果一个矩阵的结构为：
1 0 0 0 0
0 1 0 0 0
0 0 1 0 0
0 0 0 1 0
0 0 0 0 1
则称它为一个单位矩阵
对于一个a*b的矩阵A，它与一个边长为b的矩阵相乘，结果还是A本身
单位矩阵在矩阵运算中起着单位1的作用

矩阵简单的运算就是这些，接下来我们通过一些例题由浅入深，看看矩阵快速幂如何应用吧

一、斐波拉契（基础模板）

万物之始

题目描述

斐波拉契的定义为：

f[1]=f[2]=1; f[n]=f[n-1]+f[n-2](n>=3)

（不会真的有人不知道吧）
现在要你求出第k项取模后的结果
(k<=2^63)

解析

我们发现：
对于一个行矩阵：

f[n] f[n-1]

尝试构造出一个转移矩阵M：
（转移矩阵是矩阵题目的灵魂，多为方阵）

1 1
1 0

那么两者相乘后就会得到：

f[n]+f[n-1] f[n]

根据斐波拉契的定义，上面的结果就是：

f[n+1] f[n]

所以，要求第k项的值，就只需要把矩阵f[2] f[1]乘上k-2次转移矩阵即可
这样就可以用快速幂提速了
（由于本题原矩阵过于简单，其实代码实现时我们都不需要让那个行矩阵出现）

代码

#include<bits/stdc++.h> using namespace std; #define ll long long const int mod=1e9+7; ll a,b,c,k; ll ans[4][4],res[4][4],trans[4][4]; void mul1(){//res*resmemset(trans,0,sizeof(trans));for(int i=1;i<=2;i++){for(int j=1;j<=2;j++){for(int p=1;p<=2;p++){trans[i][j]+=res[i][p]*res[p][j];trans[i][j]%=mod;}}}for(int i=1;i<=2;i++){for(int j=1;j<=2;j++){res[i][j]=trans[i][j];}} } void mul2(){//res*ansmemset(trans,0,sizeof(trans));for(int i=1;i<=2;i++){for(int j=1;j<=2;j++){for(int p=1;p<=2;p++){trans[i][j]+=ans[i][p]*res[p][j];trans[i][j]%=mod;}}}for(int i=1;i<=2;i++){for(int j=1;j<=2;j++){ans[i][j]=trans[i][j];}} } void ksm(ll w){while(w){if(w&1) mul2();mul1();w>>=1;}return; } void print(){for(int i=1;i<=2;i++){for(int j=1;j<=2;j++){printf("%d ",ans[i][j]);}printf("\n");} } int main() {ans[1][1]=ans[2][2]=1;res[1][1]=res[1][2]=res[2][1]=1;scanf("%lld",&a);if(a<=2) {printf("1");return 0;}ksm(a-2); // print();printf("%lld",(ans[1][1]+ans[2][1])%mod);return 0; }

二、行为方案（实际应用）

题目描述

解析

定义dp[i][j][t]为经过t时间从i走到j的方案数
不难想到转移

dp[i][j][t]=∑dp[i][p][t-1]*dp[p][j][1]

我们发现出现了矩阵乘法标志性的顶针结构
也就是说，想要从t-1转移到t，只需要把t-1状态的矩阵与状态1的矩阵相乘就行了
换言之，询问t状态的矩阵，就是求状态1矩阵的t次幂
这样在提速的同时，也就把第三维空间优化掉了
这样就转化为快速幂问题了
接下来就是原始矩阵的构造问题

首先肯定要把存在边的点连上：

dp[from][to]=1

还可以停留在原点，也就相当于一个自环：

dp[i][i]=1;(1<=i<=n)

对于自爆，我们可以把0结点当成自爆的状态，在任何一个点均可自爆，所以：

dp[i][0]=1(1<=i<=n)

由于自爆后不能向任何状态转移了，所以0结点没有任何出边
最后的答案就是∑dp[1][i] (0<=i<=n）
这样本题就结束了

代码

#include<bits/stdc++.h> using namespace std; #define ll long long const int mod=2017; const int N=150; ll a,b,c,k; int n,m; ll ans[N][N],res[N][N],trans[N][N]; void mul1(){//res*resmemset(trans,0,sizeof(trans));for(int i=0;i<=n;i++){for(int j=0;j<=n;j++){for(int p=0;p<=n;p++){trans[i][j]+=res[i][p]*res[p][j];trans[i][j]%=mod;}}}for(int i=0;i<=n;i++){for(int j=0;j<=n;j++){res[i][j]=trans[i][j];}} } void mul2(){//res*ansmemset(trans,0,sizeof(trans));for(int i=0;i<=n;i++){for(int j=0;j<=n;j++){for(int p=0;p<=n;p++){trans[i][j]+=ans[i][p]*res[p][j];trans[i][j]%=mod;}}}for(int i=0;i<=n;i++){for(int j=0;j<=n;j++){ans[i][j]=trans[i][j];}} } void ksm(ll w){while(w){if(w&1) mul2();mul1();w>>=1;}return; } void print(){for(int i=0;i<=n;i++){for(int j=0;j<=n;j++){printf("%d ",ans[i][j]);}printf("\n");} } int main() {scanf("%d%d",&n,&m);for(int i=0;i<=n;i++) ans[i][i]=1;for(int i=1;i<=m;i++){int a,b;scanf("%d%d",&a,&b);res[a][b]=res[b][a]=1;}for(int i=0;i<=n;i++) res[i][i]=1;for(int i=1;i<=n;i++) res[i][0]=1;int t;scanf("%d",&t);ksm(t);int tot=0;for(int i=0;i<=n;i++){tot+=ans[1][i];} // print();printf("%d",tot%mod);return 0; }

三、矩阵求和（子矩阵作为矩阵元素）

题目描述

解析

对于矩阵A，我们构造转移矩阵：

（I表示与A边长相等的单位矩阵，矩阵套矩阵表示把小矩阵值套进大矩阵里）
比如，当A为：

2 3
1 5

时，转移矩阵为：

2 3 1 0
1 5 0 1
0 0 1 0
0 0 0 1

使它与自身相乘,得到：

A^2I+A

再乘一次：

A^3I+A+A^2

这样我们就可以得到规律了
只需要把这个转移矩阵构造出来后乘上k次幂在把左上角减去单位矩阵输出即可
注意：取模减法需要判断一下会不会减成负的！
（连ybt评测的答案似乎都没有注意。。。）

代码

#include<bits/stdc++.h> using namespace std; #define ll long long int mod=2017; const int N=150; ll a,b,c,k; int n,m; ll ans[N][N],res[N][N],trans[N][N]; void mul1(){//res*resmemset(trans,0,sizeof(trans));for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){for(int p=1;p<=n;p++){trans[i][j]+=res[i][p]*res[p][j];trans[i][j]%=mod;}}}for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){res[i][j]=trans[i][j];}} } void mul2(){//res*ansmemset(trans,0,sizeof(trans));for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){for(int p=1;p<=n;p++){trans[i][j]+=ans[i][p]*res[p][j];trans[i][j]%=mod;}}}for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){ans[i][j]=trans[i][j];}} } void ksm(ll w){while(w){if(w&1) mul2();mul1();w>>=1;}return; } void print(){for(int i=1;i<=n;i++){for(int j=1+n;j<=2*n;j++){if(i+n==j) ans[i][j]--; // if(ans[i][j]<0) ans[i][j]+=mod;printf("%lld ",ans[i][j]);}printf("\n");} } int main() {scanf("%d%d%d",&n,&m,&mod);for(int i=1;i<=n;i++){for(int j=1;j<=n;j++) scanf("%lld",&res[i][j]);}for(int j=n+1;j<=2*n;j++){res[j][j]=res[j-n][j]=1;}n<<=1;for(int i=1;i<=n;i++) ans[i][i]=1;ksm(m+1);n>>=1;print();return 0; }

四、最短路径（对矩阵乘法灵活的定义方式）

题目描述

解析

定义dp[i][j][k]：从i到j，经过k条边的最短路径
易得转移方程：

dp[i][j][k]=min(dp[i][j][k],dp[i][p][k-1]+dp[p][j][1];

我们发现出现了顶针结构，但似乎运算从乘积累加变成了求min
那么把运算的定义改一下不就好了！
（这样修改之后不再有单位矩阵的概念，好在本题也不需要）
还有一些细节问题：

1.在原始矩阵中dp[i][i]应该为正无穷而不是0，换言之，经过一条边走到原处的方案在没有自环的情况下应该是不可能的
2.由于边数<=100，所以点不会超过200个，但编号会达到1000。如果直接用原编号，会超时。所以本题需要对点进行离散化处理

代码：

#include<bits/stdc++.h> using namespace std; #define ll long long int mod=2017; const int N=1500; int s,e,n,m,k; int mx; int a,b,c,d; ll ans[N][N],res[N][N],trans[N][N]; int id[N*100],tot=0; void mul1(){//res*resmemset(trans,0x3f,sizeof(trans));for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){for(int p=1;p<=n;p++){trans[i][j]=min(trans[i][j],res[i][p]+res[p][j]); // trans[i][j]%=mod;}}}for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){res[i][j]=trans[i][j];}} } void mul2(){//res*ansmemset(trans,0x3f,sizeof(trans));for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){for(int p=1;p<=n;p++){trans[i][j]=min(trans[i][j],ans[i][p]+res[p][j]); // trans[i][j]%=mod;}}}for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){ans[i][j]=trans[i][j];}} } void ksm(ll w){while(w){if(w&1) mul2();mul1();w>>=1;}return; } void print(){for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){ // if(ans[i][j]<0) ans[i][j]+=mod;if(ans[i][j]>2e9) printf("-1 ");else printf("%lld ",ans[i][j]);}printf("\n");}printf("\n"); } void print_res(){for(int i=1;i<=n;i++){for(int j=1;j<=n;j++){ // if(ans[i][j]<0) ans[i][j]+=mod;if(res[i][j]>2e9) printf("-1 ");else printf("%lld ",res[i][j]);}printf("\n");} } int main() {scanf("%d%d%d%d",&k,&n,&s,&e);memset(res,0x3f,sizeof(res));memset(ans,0x3f,sizeof(ans));for(int i=1;i<=n;i++){scanf("%d%d%d",&c,&a,&b);if(!id[a]) id[a]=++tot;if(!id[b]) id[b]=++tot;a=id[a],b=id[b];res[a][b]=res[b][a]=c; // mx=max(mx,max(a,b)); // printf("a=%d b=%d v=%d\n",a,b,c);}n=tot; // print_res();for(int i=1;i<=n;i++) ans[i][i]=0;ksm(k); // mul2(); // print(); // mul2(); // print();printf("%lld",ans[id[s]][id[e]]);return 0; } /* 1 6 6 4 11 4 6 4 4 8 8 4 9 6 6 8 2 6 9 3 8 9 */

thanks for reading！

总结

以上是生活随笔为你收集整理的矩阵快速幂一篇通的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇：联想小新 mini 主机新配置开卖：i7
下一篇：多重背包的二进制优化（ybtoj-宝物筛