當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

后缀数组--处理字符串的利器

發布時間：2025/6/15 编程问答 22 豆豆

生活随笔收集整理的這篇文章主要介紹了后缀数组--处理字符串的利器小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

后綴數組--處理字符串的利器

后綴數組是處理字符串的有力工具。后綴數組是后綴樹的一個非常精巧的替代品，它比后綴樹容易編程實現，能夠實現后綴樹的很多功能而時間復雜度也并不遜色，而且它比后綴樹所占用的內存空間小很多。

子串：字符串S的子串r[i..j]，i<=j，表示r串中從i到j這一段，也就是順次排列r[i],r[i+1],...,r[j]形成的字符串。

后綴：后綴是指從某個位置i開始到整個串末尾結束的一個特殊子串。字符串 s 的從第i個字符開始的后綴表示為Suffix(i)，也就是Suffix(i)=r[i..len(s)]。

大小比較：關于字符串的大小比較，是指通常所說的“字典順序”比較，也就是對于兩個字符串u、v，令i 從1 開始順次比較u[i]和v[i]，如果u[i]=v[i]則令i加1，否則若u[i]<v[i]則認為u<v，u[i]>v[i]則認為u>v（也就是v<u），比較結束。如果 i>len(u)或者i>len(v)仍比較不出結果，那么，若len(u)<len(v)則認為u<v，若len(u)=len(v)則認為u=v，若len(u)>len(v)則u>v。
從字符串的大小比較的定義來看，S的兩個開頭位置不同的后綴u和v進行比較的結果不可能是相等，因為u=v的必要條件len(u)=len(v)在這里不可能滿足。

后綴數組：后綴數組SA是一個一維數組，它保存1..n的某個排列SA[1]，SA[2]，……，SA[n]，并且保證Suffix(SA[i])<Suffix(SA[i+1])，1<=i<n。也就是將S的n個后綴從小到大進行排序之后把排好序的后綴的開頭位置順次放入SA中。

1 后綴數組求最長公共子串（LCS）

解法：將兩個字符串用一個特殊符號（兩個字符串中都沒有，比如‘#’）連接起來，構造連接后字符串的后綴數組，求后綴數組中的最長公共前綴，要保證最長的公共前綴在原來兩個字符串中都出現，而不是只出現在一個字符串中，這就是特殊連接符號的作用。

#include <iostream> using namespace std;//用于qsort的比較函數 int pstrcmp(const void *p, const void *q) { return strcmp(*(char**)p,*(char**)q); }//最長公共前綴 int comlen_suff(char * p, char * q) { int len = 0;int count = 0; //保證兩個子串中只有一個含有‘#’，LCS才來自兩個字符串，否則可能來自同一個字符串while(*p && *q && *p++ == *q++) { ++len; if(*p == '#' || *q == '#'){break;}}while(*p){if(*p++ == '#'){++ count;break;}}while(*q){if(*q++ == '#'){++ count;break;}}if(count == 1)return len;return 0; } //最長公共子串 int LCS(char * X, char * Y) {char * suff[999];int maxlen = 0;int suf_index;int xlen = strlen(X);int ylen = strlen(Y);int len_suff = xlen + ylen + 1; char * arr = new char[len_suff + 1]; // 將X和Y連接到一起 strcpy(arr,X); arr[xlen] = '#';strcpy(arr + xlen + 1, Y); for(int i = 0; i < len_suff; ++i) // 初始化后綴數組 {suff[i] = &arr[i]; }qsort(suff, len_suff, sizeof(char *), pstrcmp); for(int i = 0; i < len_suff-1; ++i) {int len = comlen_suff(suff[i],suff[i+1]);if(len > maxlen) {maxlen = len; suf_index = i; }}printf("%.*s\n", maxlen, suff[suf_index]);delete[] arr;return maxlen; }int main() {cout<<LCS("aabaaba","aba")<<endl;return 0; }

2 后綴數組求最長回文子串（LPS）

解法：將字符串的逆序與原來字符串用特殊符號連接，構造后綴數組，求后綴數組中的最長公共前綴，保證最長公共前綴出現在特殊連接符號的兩端。

#include <iostream> using namespace std;//用于qsort的比較函數 int pstrcmp(const void *p, const void *q) { return strcmp(*(char**)p,*(char**)q); }//最長公共前綴 int comlen_suff(char * p, char * q) { int len = 0;int count = 0; //保證兩個子串中只有一個含有‘#’，LCS才來自兩個字符串，否則可能來自同一個字符串while(*p && *q && *p++ == *q++) { ++len; if(*p == '#' || *q == '#'){break;}}while(*p){if(*p++ == '#'){++ count;break;}}while(*q){if(*q++ == '#'){++ count;break;}}if(count == 1)return len;return 0; }//最長回文子串 int LPS(char * X) {char * suff[999];int maxlen = 0;int suf_index;int xlen = strlen(X);int len_suff = 2 * xlen + 1; char * arr = new char[len_suff + 1]; // 將X和逆序X連接到一起 strcpy(arr,X);arr[xlen] = '#';char *p = X;char *q = arr + len_suff; *q = '\0';while(*p && (*--q = *p++)); // 逆序復制for(int i = 0; i < len_suff; ++i) // 初始化后綴數組 {suff[i] = &arr[i]; }qsort(suff, len_suff, sizeof(char *), pstrcmp); for(int i = 0; i < len_suff-1; ++i) { int len = comlen_suff(suff[i],suff[i+1]); if(len > maxlen){ maxlen = len;suf_index = i;} }printf("%.*s\n", maxlen, suff[suf_index]);delete[] arr;return maxlen; }int main() {cout<<LPS("aabaab")<<endl;return 0; }

3 后綴數組求最長重復子串（LRS）

解法：構造字符串的后綴數組，對后綴數組排序，再兩兩比較得到最長的重復子串

//compare funciton used by qsort() int pstrcmp(const void *p, const void *q) {return strcmp(*(char **)p, *(char **)q); }//get max common length of string p and q int comlen(char *p, char *q) {int len = 0;while (*p && (*p++ == *q++))len++;return len; }//get max repeat substring of str int find_max_repeat(char* str, char* result, int & len) {int temlen, maxi, maxlen = -1;char *a[99999];int n = 0;while (*str != '\0'){a[n++] = str++;}qsort(a, n, sizeof(char *), pstrcmp);for (int i = 0; i < n-1; i++){temlen = comlen(a[i], a[i+1]);if (temlen > maxlen){maxlen = temlen;maxi = i;}}result = a[maxi];len = maxlen;printf("%.*s\n", maxlen, result);return maxlen; }

4 后綴數組求最長的沒有重復字符的子串

解法：對這個字符串構造后綴數組，在每個后綴數組中，尋找沒有重復字符的最長前綴，就是要找的子串。

//得到字符串最長的無重復的前綴長度 int longestlen(char * p) {int hash[256];int len = 0;memset(hash,0,sizeof(hash));while (*p && !hash[*p]){hash[*p] = 1;++ len;++ p;}return len; }//使用后綴數組解法 int longest_unique_substring(char * str) {int maxlen = -1;int begin = 0;char *a[99999];int n = 0;while(*str != '\0'){a[n++] = str++;}for (int i=0; i<n; i++){int temlen = longestlen(a[i]);if (temlen > maxlen){maxlen = temlen;begin = i;}}printf("%.*s\n", maxlen, a[begin]);return maxlen; }

總結

以上是生活随笔為你收集整理的后缀数组--处理字符串的利器的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

后缀数组--处理字符串的利器

后綴數組--處理字符串的利器

總結