當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

傻子都能看懂的马拉车Manacher

發布時間：2023/12/13 编程问答 43 豆豆

生活随笔收集整理的這篇文章主要介紹了傻子都能看懂的马拉车Manacher 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Manacher's Algorithm 馬拉車算法操作及原理?

package advanced_001;public class Code_Manacher {public static char[] manacherString(String str) {char[] charArr = str.toCharArray();char[] res = new char[str.length() * 2 + 1];int index = 0;for (int i = 0; i != res.length; i++) {res[i] = (i & 1) == 0 ? '#' : charArr[index++];}return res;}public static int maxLcpsLength(String str) {if (str == null || str.length() == 0) {return 0;}char[] charArr = manacherString(str);int[] pArr = new int[charArr.length];int C = -1;int R = -1;int max = Integer.MIN_VALUE;for (int i = 0; i != charArr.length; i++) {pArr[i] = R > i ? Math.min(pArr[2 * C - i], R - i) : 1;while (i + pArr[i] < charArr.length && i - pArr[i] > -1) {if (charArr[i + pArr[i]] == charArr[i - pArr[i]])pArr[i]++;else {break;}}if (i + pArr[i] > R) {R = i + pArr[i];C = i;}max = Math.max(max, pArr[i]);}return max - 1;}public static void main(String[] args) {String str1 = "abc1234321ab";System.out.println(maxLcpsLength(str1));}}

問題：查找一個字符串的最長回文子串

首先敘述什么是回文子串：回文：就是對稱的字符串，或者說是正反一樣的

小問題一：請問，子串和子序列一樣么？請思考一下再往下看

?當然，不一樣。子序列可以不連續，子串必須連續。

舉個例子，”123”的子串包括1，2，3，12，23，123(一個字符串本身是自己的最長子串)，而它的子序列是任意選出元素組成，他的子序列有1，2，3，12，13，23，123，””,空其實也算，但是本文主要是想敘述回文，沒意義。

小問題二：長度為n的字符串有多少個子串？多少個子序列？

?子序列，每個元素都可以選或者不選，所以有2的n次方個子序列（包括空）

子串：以一位置開頭，有n個子串，以二位置開頭，有n-1個子串，以此類推，我們發現，這是一個等差數列，而等差序列求和，有n*(n+1)/2個子串(不包括空)。

(這里有一個思想需要注意，遇到等差數列求和，基本都是o(n^2)級別的)

一、分析枚舉的效率

好，我們來分析一下暴力枚舉的時間復雜度，上文已經提到過，一個字符串的所有子串，數量是o(n^2)級別，所以光是枚舉出所有情況時間就是o(n^2)，每一種情況，你要判斷他是不是回文的話，還需要o(n)，情況數和每種情況的時間，應該乘起來，也就是說，枚舉時間要o(n^3)，效率太低。

二、初步優化

思路：我們知道，回文全是對稱的，每個回文串都會有自己的對稱軸，而兩邊都對稱。我們如果從對稱軸開始，向兩邊闊，如果總相等，就是回文，擴到兩邊不相等的時候，以這個對稱軸向兩邊擴的最長回文串就找到了。

舉例：1 2 1 2 1 2 1 1 1

我們用每一個元素作為對稱軸，向兩邊擴

0位置，左邊沒東西，只有自己；

1位置，判斷左邊右邊是否相等，1=1所以接著擴，然后左邊沒了，所以以1位置為對稱軸的最長回文長度就是3；

2位置，左右都是2，相等，繼續，左右都是1，繼續，左邊沒了，所以最長為5

3位置，左右開始擴，1=1，2=2，1=1，左邊沒了，所以長度是7

如此把每個對稱軸擴一遍，最長的就是答案，對么？

你要是點頭了。。。自己扇自己兩下。

還有偶回文呢，，比如1221，123321.這是什么情況呢？這個對稱軸不是一個具體的數，因為人家是偶回文。

問題三：怎么用對稱軸向兩邊擴的方法找到偶回文？（容易操作的）

我們可以在元素間加上一些符號，比如/1/2/1/2/1/2/1/1/1/，這樣我們再以每個元素為對稱軸擴就沒問題了，每個你加進去的符號都是一個可能的偶數回文對稱軸，此題可解。。。因為我們沒有錯過任何一個可能的對稱軸，不管是奇數回文還是偶數回文。

那么請問，加進去的符號，有什么要求么？是不是必須在原字符中沒出現過？請思考

其實不需要的，大家想一下，不管怎么擴，原來的永遠和原來的比較，加進去的永遠和加進去的比較。（不舉例子說明了，自己思考一下）

好，分析一波時間效率吧，對稱軸數量為o(n)級別，每個對稱軸向兩邊能擴多少？最多也就o(n)級別，一共長度才n; 所以n*n是o(n^2) ??(最大能擴的位置其實也是兩個等差數列，這么理解也是o(n^2)，用到剛講的知識)

小結：

這種方法把原來的暴力枚舉o(n^3)變成了o(n^2),大家想一想為什么這樣更快呢？

我在kmp一文中就提到過，我們寫出暴力枚舉方法后應想一想自己做出了哪些重復計算，錯過了哪些信息，然后進行優化。

看我們的暴力方法，如果按一般的順序枚舉，012345，012判斷完，接著判斷0123，我是沒想到可以利用前面信息的方法，因為對稱軸不一樣啊，右邊加了一個元素，左邊沒加。所以剛開始，老是想找一種方法，左右都加一個元素，這樣就可以對上一次的信息加以利用了。

暴力為什么效率低？永遠是因為重復計算，舉個例子：12121211，下標從0開始，判斷1212121是否為回文串的時候，其實21212和121等串也就判斷出來了，但是我們并沒有記下結果，當枚舉到21212或者121時，我們依舊是重新嘗試了一遍。(假設主串長度為n，對稱軸越在中間，長度越小的子串，被重復嘗試的越多。中間那些點甚至重復了n次左右，本來一次搞定的事）

還是這個例子，我換一個角度敘述一下，比較直觀，如果從3號開始向兩邊擴，121，21212，最后擴到1212121，時間復雜度o(n),用枚舉的方法要多少時間？如果主串長度為n，枚舉嘗試的子串長度為，3，5，7....n,等差數列，大家讀到這里應該都知道了，等差數列求和，o(n^2)。

三、Manacher原理

首先告訴大家，這個算法時間可以做到o(n),空間o(n).

好的，開始講解這個神奇的算法。

首先明白兩個概念：

最右回文邊界R：挺好理解，就是目前發現的回文串能延伸到的最右端的位置(一個變量解決）

中心c：第一個取得最右回文邊界的那個中心對稱軸；舉個例子:12121，二號元素可以擴到12121，三號元素 可以擴到121，右邊界一樣，我們的中心是二號元素，因為它第一個到達最右邊界

當然，我們還需要一個數組p來記錄每一個可能的對稱軸最后擴到了哪里。

有了這么幾個東西，我們就可以開始這個神奇的算法了。

為了容易理解，我分了四種情況，依次講解：

假設遍歷到位置i，如何操作呢

1）i>R:也就是說，i以及i右邊，我們根本不知道是什么，因為從來沒擴到那里。那沒有任何優化，直接往右暴力 擴唄。

（下面我們做i關于c的對稱點，i’）

2）i<R:，

三種情況：

i’的回文左邊界在c回文左邊界的里面

i’回文左邊界在整體回文的外面

i’左邊界和c左邊界是一個元素

(怕你忘了概念，c是對稱中心，c它當初擴到了R，R是目前擴到的最右的地方，現在咱們想以i為中心，看能擴到哪里。)

按原來o(n^2)的方法，直接向兩邊暴力擴。好的，魔性的優化來了。咱們為了好理解，分情況說。首先，大家應該知道的是，i’其實有人家自己的回文長度，我們用數組p記錄了每個位置的情況，所以我們可以知道以i’為中心的回文串有多長。

2-1）i’的回文左邊界在c回文的里面：看圖

我用這兩個括號括起來的就是這兩個點向兩邊擴到的位置，也就是i和i’的回文串，為什么敢確定i回文只有這么長？和i’一樣？我們看c，其實這個圖整體是一個回文串啊。

串內完全對稱(1是括號左邊相鄰的元素，2是右括號右邊相鄰的元素，34同理)，

?由此得出結論1：

由整體回文可知，點2=點3，點1=點4

當初i’為什么沒有繼續擴下去？因為點1！=點2。

由此得出結論2：點1！=點2?

因為前面兩個結論，所以3！=4，所以i也就到這里就擴不動了。而34中間肯定是回文，因為整體回文，和12中間對稱。

2-2）i’回文左邊界在整體回文的外面了：看圖

這時，我們也可以直接確定i能擴到哪里，請聽分析：

當初c的大回文，擴到R為什么就停了？因為點2！=點4----------結論1；

2’為2關于i’的對稱點，當初i’左右為什么能繼續擴呢？說明點2=點2’---------結論2；

由c回文可知2’=3，由結論2可知點2=點2’，所以2=3；

但是由結論一可知，點2！=點4，所以推出3！=4，所以i擴到34為止了，34不等。

而34中間那一部分，因為c回文，和i’在內部的部分一樣，是回文，所以34中間部分是回文。

2-3）最后一種當然是i’左邊界和c左邊界是一個元素

點1！=點2，點2=點3，就只能推出這些，只知道34中間肯定是回文，外邊的呢？不知道啊，因為不知道3和4相不相等，所以我們得出結論：點3點4內肯定是，繼續暴力擴。

原理及操作敘述完畢，不知道我講沒講明白。。。

四、代碼及復雜度分析

?看代碼大家是不是覺得不像o(n)？其實確實是的，來分析一波。。

首先，我們的i依次往下遍歷，而R（最右邊界）從來沒有回退過吧？其實當我們的R到了最右邊，就可以結束了。再不濟i自己也能把R一個一個懟到最右

我們看情況一和四，R都是以此判斷就向右一個，移動一次需要o(1)

我們看情況二和三，直接確定了p[i]，根本不用擴，直接遍歷下一個元素去了，每個元素o(1).

綜上，由于i依次向右走，而R也沒有回退過，最差也就是i和R都到了最右邊，而讓它們移動一次的代價都是o(1)的，所以總體o(n)

可能大家看代碼依舊有點懵，其實就是code整合了一下，我們對于情況23，雖然知道了它肯定擴不動，但是我們還是給它一個起碼是回文的范圍，反正它擴一下就沒擴動，不影響時間效率的。而情況四也一樣，給它一個起碼是回文，不用驗證的區域，然后接著擴，四和二三的區別就是。二三我們已經心中有B樹，它肯定擴不動了，而四確實需要接著嘗試。

（要是寫四種情況當然也可以。。但是我懶的寫，太多了。便于理解分了四種情況解釋，code整合后就是這樣子）

字數3411

范天祚

2017/12/22

總結

以上是生活随笔為你收集整理的傻子都能看懂的马拉车Manacher的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。