java匹配出某单词除外_java正则匹配 指定内容以外的 内容
今天,遇到一個需要?匹配出 指定內容以外的 內容的需求。
乍一看,需求貌視很簡單啊,直接上 非貪婪模式的 雙向零寬斷言(有的資料上也叫 預搜索、預查、環(huán)視lookaround):
比如,我要匹配?串內所有 大寫C打頭后接數字(C\d+) 以外的 匹配數據,也就是:非貪婪匹配C\d+和后一個C\d+之間的內容
String test = "C77de3a4Cfg56C78ha123C923aabC123";
String reg = "((?<=C\\d{1,10}+))(.+?)((?=(C\\d+)+))";
Pattern pattern = Pattern.compile(reg);//這里因為反向零寬斷言不能出現不固定長度,所以把C\d+處理成了C\d{1,10},見https://www.jb51.net/article/73404.htm
Matcher matcher = pattern.matcher(test);
while (matcher.find()){
System.out.print(matcher.group()+" ");//de3a4Cfg56 ha123 aab
}
再處理下首尾遇到非C\d+的 串,表達式變成:
String reg = "((?<=C\\d{1,10}+)|^)(.+?)((?=(C\\d+)+)|$)";
這里,發(fā)現了 不能 處理連續(xù)C\d+這 種情況,想了很久,最后只能一個很不爽的實現來搞定了:
String test = "aC77de3a4Cfg56C78C66ha123C923aabC123g";
String reg = "((?<=C\\d{1,10}+)|^)(.+?)((?=(C\\d+)+)|$)";
test = test.replaceAll("("+"C\\d+"+")("+"C\\d+"+")+","$1");//預先將連續(xù)的可匹配串替換掉
Pattern pattern = Pattern.compile(reg);//因為
Matcher matcher = pattern.matcher(test);
while (matcher.find()){
System.out.print(matcher.group()+" ");//a de3a4Cfg56 ha123 aab g
}
結果,連續(xù)C\d+打頭 這種情況還得單獨做處理:
String test = "C66C77de3a4Cfg56C78C66ha123C923aabC123g";
String reg = "((?<=C\\d{1,10}+)|^)(.+?)((?=(C\\d+)+)|$)";
test = test.replaceAll("^(C\\d+)+","");//預先將打頭連續(xù)的可匹配串替換成空
test = test.replaceAll("("+"C\\d+"+")("+"C\\d+"+")+","$1");//預先將串中連續(xù)的可匹配串替換掉
Pattern pattern = Pattern.compile(reg);
Matcher matcher = pattern.matcher(test);
while (matcher.find()){
System.out.print(matcher.group()+" ");//de3a4Cfg56 ha123 aab g
}
終于大功告成~,最后把上面的邏輯封裝成兩個工具方法,第一個直接返回匹配串的List,第二個返回匹配 指定內容以外的 內容的List:
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegUtil {
public static List matches(String src,String reg){
Pattern pattern = Pattern.compile(reg);
Matcher matcher = pattern.matcher(src);
List list = new ArrayList<>();
while (matcher.find()){
list.add(matcher.group());
}
return list;
}
/**
* 注意,simpleReg正則必須為不帶分組的簡單正則表達式,至多一個限定符,且只能是+,限定符匹配串串長不超過10字符,例如:C\d+ d+長度不超過10(正), C\d* (誤)
* 否則匹配時可能報錯
* 匹配 src中匹配了simpleReg以外 的內容
* @param src
* @param simpleReg
* @return
*/
public static List beyondMatches(String src,String simpleReg){
int index = simpleReg.indexOf("+");
String preMatch = index!=-1?new StringBuilder(simpleReg).insert(index,"{1,10}").toString():simpleReg;
return matches(src.replaceAll("^("+simpleReg+")+","").replaceAll("("+simpleReg+")("+simpleReg+")+","$1")
,"((?<="+preMatch+")|^)(.+?)((?=("+simpleReg+")+)|$)");
}
public static void main(String[] args) {
String test = "C2C12C21caaCbC12C66C77de3a4Cfg56C78ha123C923aabC123C321";
List result =RegUtil.matches(test,"C\\d+");
for(String m:result){
System.out.print(m+" ");//C2 C12 C21 C12 C66 C77 C78 C923 C123 C321
}
System.out.println();
System.out.println("========");
result =RegUtil.beyondMatches(test,"C\\d+");
for(String m:result){
System.out.print(m+" ");//caaCb de3a4Cfg56 ha123 aab
}
}
}
收功~
總結
以上是生活随笔為你收集整理的java匹配出某单词除外_java正则匹配 指定内容以外的 内容的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 正序 逆序写 java_C語言版和JAV
- 下一篇: lamp怎么使用mysql_我的LAMP