php 匹配双字节字符串,收集一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~)...
正則表達式用于字符串處理,表單驗證等場合,實用高效,但用到時總是不太把握,以致往往要上網查一番。我將一些常用的表達式收藏在這里,作備忘之用。本貼隨時會更新,請持續關注本站。
匹配中文字符的正則表達式: [u4e00-u9fa5]
匹配雙字節字符(包括漢字在內):[^x00-xff]
應用:計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)
String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;}
匹配空行的正則表達式:n[s| ]*r
匹配HTML標記的正則表達式:/.*1>|/
匹配首尾空格的正則表達式:(^s*)|(s*$)
String.prototype.trim = function()
{
return this.replace(/(^s*)|(s*$)/g, "");
}
利用正則表達式分解和轉換IP地址:
下面是利用正則表達式匹配IP地址,并將IP地址轉換成對應數值的Javascript程序:
function IP2V(ip)
{
re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正則表達式
if(re.test(ip))
{
return RegExp.1?Math.pow(255,3))+RegExp.2*Math.pow(255,2))+RegExp.3?255+RegExp.4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}
不過上面的程序如果不用正則表達式,而直接用split函數來分解可能更簡單,程序如下:
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
匹配Email地址的正則表達式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配網址URL的正則表達式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?
利用正則表達式去除字串中重復的字符的算法程序:[注:此程序不正確,原因見紅色字體]
var s="abacabefgeeii"
var s1=s.replace(/(.).*1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi
===============================
如果var s = "abacabefggeeii"
結果就不對了,結果為:abeicfgg
正則表達式的能力有限
我原來在CSDN上發貼尋求一個表達式來實現去除重復字符的方法,最終沒有找到,這是我能想到的最簡單的實現方法。思路是使用后向引用取出包括重復的字符,再以重復的字符建立第二個表達式,取到不重復的字符,兩者串連。這個方法對于字符順序有要求的字符串可能不適用。
得用正則表達式從URL地址中提取文件名的javascript程序,如下結果為page1
s="http://www.9499.net/page1.htm"
s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2")
alert(s)
利用正則表達式限制網頁表單里的文本框輸入內容:
用正則表達式限制只能輸入中文:
οnkeyup="value=value.replace(/[^u4E00-u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^u4E00-u9FA5]/g,''))"
用正則表達式限制只能輸入全角字符:
οnkeyup="value=value.replace(/[^uFF00-uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^uFF00-uFFFF]/g,''))"
用正則表達式限制只能輸入數字:
οnkeyup="value=value.replace(/[^d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,''))"
用正則表達式限制只能輸入數字和英文:
οnkeyup="value=value.replace(/[W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,''))"
應用:javascript中沒有像vbscript那樣的trim函數,我們就可以利用這個表達式來實現,如下:
/**
* 計算字符串長度,將非寬字符計算為半個字符
*
* @param str
* @returns
*/
function gbLength(str) {
return typeof str === "string" ? str.length + str.replace(/[x00-x7f]/g, '').length + 1 >> 1 : 0;
}
/**
* 獲取字符串的指定長度的子串,將非寬字符計算為半個字符
*
* @param str
* @param length
* @returns
*/
function gbSubstr(str, length) {
if (typeof str !== "string")
return str;
length += length;
for ( var n = 0, L = str.length; n < L && length > 0; n++){
length -= str.charCodeAt(n) > 127 ? 2 : 1;
}
return str.substr(0, n);
}
/**
* 切割指定字符串的指定長度子串,如果長度超過指定長度,則丟棄末尾兩個字符并附加...
*
* @param str
* @param len
* @returns
*/
function fit_length(str, len){
len = len || 16;
if (typeof str !== "string" || str.length <= len || gbLength(str) <= len){
return str;
}
var ret = gbSubstr(str, len - 2);
return ret + '..';
}
var replaceCJK = /[^x00-xff]/g,
testCJK = /[^x00-xff]/;
cjkLength: function(strValue){
return strValue.replace(replaceCJK, "lv").length;
},
isCjk: function(strValue){
return testCJK.test(strValue);
},
cutString: function(str,len,suffix,slen){
suffix = suffix || '';
slen = slen || suffix.length;
if(str.length > len){
str = str.substr(0,len - slen) + suffix;
}
return str;
},
cutCjkString: function(str,len,suffix,slen){
suffix = suffix || '';
slen = slen || suffix.length;
len -= slen;
if(this.cjkLength(str) <= len){
return str;
}
var s = str.split(''),c = 0,tmpA = [];
for(var i=0;i
if(c < len){
tmpA[tmpA.length] = s[i];
}
if(this.isCjk(s[i])){
c += 2;
}else{
c += 1;
}
}
return tmpA.join('') + suffix;
}
}
以上內容給大家分享我日常收集的一些常用的正則表達式(匹配中文字符、匹配雙字節字符、匹配HTML標記、匹配空行 and so on~~~),希望大家喜歡。欲了解更多,請持續關注本站。
總結
以上是生活随笔為你收集整理的php 匹配双字节字符串,收集一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~)...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机一级选择题题库百度云,2017年全
- 下一篇: 汉字编码原则及0XA1与0X80代表的含