最大公共子串提取“模式”
生活随笔
收集整理的這篇文章主要介紹了
最大公共子串提取“模式”
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
今天一個自然語言處理的群里面有個哥們問了一個問題:
有如下的幾個例句:
1. 我把他打了
2. 你把小強打了
3. 他把小華打了
現在需要從以上幾個例句中提取公共部分。
提取的結果為: ?...把...打了
貌似網上的最大公共子串都是只提取一個連續的字符串,如上提取的結果就是一個"打了".
馬上就有群友反應這個問題其實不是提取公共字串,而是一個模板提取。
我提供的解決思路如下:
1. 還是使用現成的最大公共子串算法;
2.?第一次提取出 “打了”;
3. 然后將每一個剩下的字串,再提取一下就得到第二長的公共字串 “把”;
4. 然后將兩個字串合并即可得到最終結果。
群友(追尋ψ魔術師)評價:“算法很機智”。
轉載于:https://www.cnblogs.com/lloydzhou/p/3272697.html
總結
以上是生活随笔為你收集整理的最大公共子串提取“模式”的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HDU4662+无
- 下一篇: jQuery源码分析系列