matlab读取正则找科学,MATLAB常用正则表达式记录
MATLAB正則表達式
一、正則表達式
正則表達式是一串用于定義某種模式的字符。在有些情況下(例如,在解析程序輸入或處理文本塊時),您通常會使用正則表達式在文本中搜索與該模式匹配的一組單詞。
數據處理是matlab的長項,但是正則表達式在做一些不標準的excel數據處理等還是很有幫助的。
二、需要掌握的基礎
元字符
元字符表示字母、字母范圍、數字和空格字符。使用它們來構造廣義的字符模式。
元字符就是對未知的一種替代
環顧斷言
test='strxxx'; % 是一個字符串
% expr是表達式
環顧斷言查找緊鄰預期匹配項前后但并非該匹配項一部分的模式。
指針停留在當前位置,并且將放棄或不捕獲對應于 test 表達式的字符。因此,前向斷言可匹配重疊字符組。
環顧斷言就是指定匹配范圍
正則表達式
email = ‘[a-z_]+@[a-z]+.(com|net)’;
"+"是連接多個正則表達項
"[a-z_]“是匹配a-z的26個字母以及一個”_"符號
"\.“是指”."這個符號
"(com|net)"指"com"和"net"這兩個字符串二選一
就這樣,幾個正則表達項任意隨機(還是按自己的需求)組合在一起就構成了一個正則表達式
正則表達式的用途也就是兩種:
匹配(提取) | regexp(區分大小寫)、regexpi(不區分大小寫)
替換(替換) | regexprep
三、常用實例
1、匹配(提取)
其中和關鍵的一個split,能解決大多數問題。
分割返回的是一個數組或者是cell,然后索引就可以直接使用。
我用的
%% 匹配
% 捕獲字符向量中包含字母 x 的單詞。
str = 'EXTRA! The regexp function helps you relax.';
expression = '\w*x\w*';
matchStr = regexp(str,expression,'match')
% 關鍵(很多時候這一個就夠啦):使用 split 關鍵字在分隔符處拆分文本
str = 'She sells sea shells by the seashore.';
expression = '[Ss]h.';
[match,~] = regexp(str,expression,'match','split')
% 查找 dd-mmm-yyyy 形式的日期,包括日、月和年的標文。
str = 'Here is a date: 01-Apr-2020';
expression = '(\d+)-(\w+)-(\d+)';
mydate = regexp(str,expression,'tokens');
mydate{:}
% 查找指定字符串之間的內容
% \w* 是標識的一個單詞,注意單詞的分割
str = '缺少工資表的年份:2018、2019、2020-3000, 缺少考核表的年份: 1999、2008;';
expression = '(?<=:)\w*.*'; % \w*: 任意單字符 .:任何單字符 *:0次或連續多次
matchStr = regexp(str,expression,'match')
expression = '\w*.*(?=,)';
matchStr = regexp(matchStr{1},expression,'match')
%% 替換-只需要替換一下函數就行,方法基本和匹配一樣
2、替換
只需要替換一下函數就行,方法基本和匹配一樣
標簽:匹配,記錄,正則表達式,MATLAB,str,regexp,expression,替換
來源: https://blog.csdn.net/qq_37832932/article/details/110127541
總結
以上是生活随笔為你收集整理的matlab读取正则找科学,MATLAB常用正则表达式记录的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习NLP领域入门
- 下一篇: ASP.NET知识结构