欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

YbtOJ-相似子串【SA,RMQ,二分】

发布时间:2023/12/3 54 豆豆
生活随笔 收集整理的这篇文章主要介绍了 YbtOJ-相似子串【SA,RMQ,二分】 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

正题


题目大意

给出一个长度为nnn的字符串,两个串相似当且仅当可以通过每种字符置换使得它们相同。

qqq次询问这个字符串所有子串中和这个串中sl,rs_{l,r}sl,r子串有多少个相似的。

1≤n≤105,1≤q≤5×1051\leq n\leq 10^5,1\leq q\leq 5\times 10^51n105,1q5×105

字符集是数字0∼90\sim 909


解题思路

请问我是在阴间吗

首先对于相似的比较相信很常见,维护每个数字上一个和它相同的数字的距离,然后没有上一个就定为000就好了。

但是这题的问题在于我们提取出区间构成的数组时前面有些要变成000

同样的这也是个提示,因为字符集大小只有10,我们也可以从这里入手,对于一个后缀,我们把第一个出现的数字的位置挖空后,我们至多会把这个后缀以这些位置分成101010份,我们将这个字符串序列称之为这个后缀的值。

然后我们需要的就是这些后缀值的“LCP”,而这样我们需要我们能快速求这些后缀中字符串的LCP。

子串的LCP直接上SA+RMQ就好了。

这样我们把弄出来的后缀的值排好序,然后维护一个相邻的两两之间的"LCP"计入一个类似height的数组的东西。

然后对于询问我们就直接二分在RMQ上查询就好了。

时间复杂度:O(10nlog⁡n+qlog⁡n)O(10n\log n+q\log n)O(10nlogn+qlogn)


code

#include<cstdio> #include<cstring> #include<algorithm> #include<vector> using namespace std; const int N=1e5+10; struct node{int l,r; }; struct nstr{vector<node> r;int id; }sr[N]; int n,m,q,nxt[10],p[10],pos[N]; int x[N],y[N],c[N],sa[N],rk[N]; int lg[N],f[N][20],h[N],s[N]; char rs[N]; void Qsort(){for(int i=1;i<=m;i++)c[i]=0;for(int i=1;i<=n;i++)c[x[i]]++;for(int i=1;i<=m;i++)c[i]+=c[i-1];for(int i=n;i>=1;i--)sa[c[x[y[i]]]--]=y[i],y[i]=0;return; } void Get_SA(){for(int i=1;i<=n;i++)x[i]=s[i]+1,m=max(m,s[i]+1),y[i]=i;Qsort();for(int w=1;w<=n;w<<=1){int p=0;for(int i=n-w+1;i<=n;i++)y[++p]=i;for(int i=1;i<=n;i++)if(sa[i]>w)y[++p]=sa[i]-w;Qsort();swap(x,y);x[sa[1]]=p=1;for(int i=2;i<=n;i++)x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+w]==y[sa[i-1]+w])?p:(++p);if(p==n)break;m=p;}return; } void Get_Height(){int k=0;for(int i=1;i<=n;i++)rk[sa[i]]=i;for(int i=1;i<=n;i++){if(rk[i]==1)continue;if(k)k--;int j=sa[rk[i]-1];while(i+k<=n&&j+k<=n&&s[j+k]==s[i+k])k++;h[rk[i]]=f[rk[i]][0]=k;}return; } void Get_RMQ(){for(int i=2;i<=n;i++)lg[i]=lg[i>>1]+1;for(int j=1;(1<<j)<=n;j++)for(int i=1;i+(1<<j)-1<=n;i++)f[i][j]=min(f[i][j-1],f[i+(1<<j-1)][j-1]);return; } int RMQ(int l,int r){if(!l||!r)return 0;if(l==r)return n-l+1;l=rk[l];r=rk[r];if(l>r)swap(l,r);l++;int z=lg[r-l+1];return min(f[l][z],f[r-(1<<z)+1][z]); } int RMQs(int l,int r){l++;int z=lg[r-l+1];return min(f[l][z],f[r-(1<<z)+1][z]); } void SA(){Get_SA();Get_Height();Get_RMQ();return; } int cp(node x,node y){//x<=yif(!x.l&&!y.l)return 2;if(!x.l)return 1;if(!y.l)return 0;int len=RMQ(x.l,y.l);if(len>x.r-x.l||len>y.r-y.l){if(x.r-x.l==y.r-y.l)return 2;return (x.r-x.l)<(y.r-y.l);}return s[x.l+len]<s[y.l+len]; } bool cmp(nstr x,nstr y){int i=0;while(1){if(i>=x.r.size())return 0;if(i>=y.r.size())return 1;int op=cp(x.r[i],y.r[i]);if(op==2)i++;else return op;}return 0; } int LCP(nstr x,nstr y){int i=0,ans=0;while(i<x.r.size()&&i<y.r.size()&&cp(x.r[i],y.r[i])==2)ans+=x.r[i].r-x.r[i].l+1,i++;if(i<x.r.size()&&i<y.r.size())ans+=min(RMQ(x.r[i].l,y.r[i].l),min(x.r[i].r-x.r[i].l,y.r[i].r-y.r[i].l)+1);return ans; } int main() { // freopen("similar.in","r",stdin); // freopen("similar.out","w",stdout); scanf("%d%d",&n,&q);scanf("%s",rs+1);for(int i=1;i<=n;i++){if(!nxt[rs[i]-'0'])s[i]=0;else s[i]=i-nxt[rs[i]-'0'];nxt[rs[i]-'0']=i;}SA();memset(nxt,0,sizeof(nxt));for(int i=n;i>=1;i--){nxt[rs[i]-'0']=i;for(int j=0;j<=9;j++)p[j]=nxt[j];sort(p,p+10);int now=i;for(int j=0;j<=9;j++){if(!p[j])continue;if(p[j]>now)sr[i].r.push_back((node){now,p[j]-1});sr[i].r.push_back((node){0,0});now=p[j]+1;}if(now<=n)sr[i].r.push_back((node){now,n});sr[i].id=i;}sort(sr+1,sr+1+n,cmp);for(int i=1;i<=n;i++)pos[sr[i].id]=i;for(int i=2;i<=n;i++)h[i]=LCP(sr[i-1],sr[i]);for(int i=2;i<=n;i++)f[i][0]=h[i];for(int j=1;(1<<j)<=n;j++)for(int i=1;i+(1<<j)-1<=n;i++)f[i][j]=min(f[i][j-1],f[i+(1<<j-1)][j-1]);int las=0;while(q--){int l,r;scanf("%d%d",&l,&r);l^=las;r^=las;if(l>n||r>n||l<1||r<1)continue;int x=pos[l],len=r-l+1;int L=x+1,R=n,ans=1;while(L<=R){int mid=(L+R)>>1;if(RMQs(x,mid)>=len)L=mid+1;else R=mid-1;}ans+=R-x;L=1;R=x-1;while(L<=R){int mid=(L+R)>>1;if(RMQs(mid,x)>=len)R=mid-1;else L=mid+1;}ans+=x-L;printf("%d\n",las=ans);}return 0; }

总结

以上是生活随笔为你收集整理的YbtOJ-相似子串【SA,RMQ,二分】的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。