[CH1401]兔子与兔子

Author： Kuludu
发布时间：April 17, 2019
2695 views
No comments
557 words
Categories： ACM

字符串哈希常用于字符串匹配的问题中，用$O(1)$的复杂度暴力求解。

这里使用的哈希算法(BKDRHash)思想就是将字符串转换为一个131进制数(至于为什么是这个数可以参考拓展参考)，并求前缀和取模，即

$$sum(x)=\sum_{i=1}^{x-1}\limits sum(i)+p_{x}\ (mod\ m)$$

预处理的复杂度是$O(n)$，我们通过比较$sum(r)-sum(l-1)*131^{r-l+1}(mod\ m)$就可以知道两个子串是否相等了。

值得一提的是，这样写是有错误率的，即哈希碰撞的现象，常见的处理方式包括建链表等，这里就不继续深入讨论了。

给出参考代码

#include <bits/stdc++.h>
#define f(a,b,c) for(int a=b;a<c;++a)
#define MAXN 1000001
using namespace std;

string s;
unsigned long long h[MAXN],p[MAXN];
int m;

int main() {
    cin >> s >> m;

    int cnt = 1;
    p[0] = 1;
    for(char x : s) {
        h[cnt] = h[cnt - 1] * 131 + (x - 'a' + 1) ;
        p[cnt] = p[cnt - 1] * 131;
        ++cnt;
    }

    int r1,l1,r2,l2;
    for(int i = 1; i <= m; ++i) {
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);

        if(h[r1] - h[l1 - 1] * p[r1 - l1 + 1] == h[r2] - h[l2 - 1] * p[r2 - l2 + 1])
            printf("Yes\n");
        else
            printf("No\n");
    }

    return 0;
}

由于用的是无符号长整型，溢出后就相当于自动取模了，而模数即$2^{64}-1$。

数据量有点大，尽量不要用C++的流操作（cin cout是真的慢）。

拓展参考：[https://blog.csdn.net/wanglx_/article/details/40400693]

Last modification：April 17, 2019

© Allow specification reprint

博客维护不易，如果你觉得我的文章有用，请随意赞赏

Leave a Comment Cancel reply
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Comment *

Private comment

Name *

🎲

Email *

Site

葫芦侠
呜呜呜，大哥发论文带带我
反emo达人
该评论仅登录用户及评论双方可见
不知名的男孩
大哥讲的通俗易懂，我一个小学二年级的学生都能看懂一点点点.....
反emo达人
天天看一下，知识涨不少
反emo达人
一天不访问，浑身不舒服

记一次极为蛋疼的运维
浏览次数: 4792
时间复杂度的计算方法
浏览次数: 2609
求位数
浏览次数: 2035
Merry Christmas!
浏览次数: 129
Easy Integration
浏览次数: 2735

[CH1401]兔子与兔子

Kuludu • 2019 年 04 月 17 日

<p>字符串哈希常用于字符串匹配的问题中，用$O(1)$的复杂度暴力求解。</p><p>这里使用的哈希算法(BKDRHash)思想就是将字符串转换为一个<strong>131进制数</strong>(至于为什么是这个数可以参考<em>拓展参考</em>)，并求前缀和取模，即</p><p>$$sum(x)=\sum_{i=1}^{x-1}\limits sum(i)+p_{x}\ (mod\ m)$$</p><p>预处理的复杂度是$O(n)$，我们通过比较$sum(r)-sum(l-1)*131^{r-l+1}(mod\ m)$就可以知道两个子串是否相等了。</p><p>值得一提的是，这样写是有错误率的，即哈希碰撞的现象，常见的处理方式包括建链表等，这里就不继续深入讨论了。</p><p>给出参考代码</p><pre><code class="lang-cpp">#include &lt;bits/stdc++.h&gt;
#define f(a,b,c) for(int a=b;a&lt;c;++a)
#define MAXN 1000001
using namespace std;

string s;
unsigned long long h[MAXN],p[MAXN];
int m;

int main() {
    cin &gt;&gt; s &gt;&gt; m;

int cnt = 1;
    p[0] = 1;
    for(char x : s) {
        h[cnt] = h[cnt - 1] * 131 + (x - &#039;a&#039; + 1) ;
        p[cnt] = p[cnt - 1] * 131;
        ++cnt;
    }

int r1,l1,r2,l2;
    for(int i = 1; i &lt;= m; ++i) {
        scanf(&quot;%d%d%d%d&quot;,&amp;l1,&amp;r1,&amp;l2,&amp;r2);

if(h[r1] - h[l1 - 1] * p[r1 - l1 + 1] == h[r2] - h[l2 - 1] * p[r2 - l2 + 1])
            printf(&quot;Yes\n&quot;);
        else
            printf(&quot;No\n&quot;);
    }

return 0;
}</code></pre><p>由于用的是无符号长整型，溢出后就相当于自动取模了，而模数即$2^{64}-1$。</p><p>数据量有点大，尽量不要用C++的流操作（cin cout是真的慢）。</p><hr><p>拓展参考：[<span class="external-link"><a class="no-external-link" href="https://blog.csdn.net/wanglx_/article/details/40400693" target="_blank"><i data-feather="external-link"></i>https://blog.csdn.net/wanglx_/article/details/40400693</a></span>]</p>