QuotedPrintable解码
最近在修改一個開源POP3客戶端框架時,碰到了QuotedPrintable亂碼的問題,原框架是老外寫的,沒有考慮到中文的情況。因此在對QuotedPrintable編碼的內容進行解碼時,是逐個字符進行轉換的,英文的當然不會有任何問題。于是在網上搜了一下,發現基于C#的QuotedPrintable解碼的代碼很少,找到的大部分都是轉帖,而且大部分都是采用默認的Encoding進行解碼,前提是用了他們自己寫的編碼方式才能解碼。這當然不符合我的要求,既然作為POP3客戶端,收到的郵件都是來自不同的服務器,編碼方式是動態變化的。
于是只能自己動手去解決,在對原始郵件內容(QuotedPrintable加密的內容)解析時,碰到的主要問題是一個中文字符由多個字節組成,如果字節取得不正確或沒有取完整,那么只能解碼一部分,會出現個別文字亂碼的情況。網上提供的清一色代碼都是用字符串截取的方式,但是這種方式不夠保險,總會出現截取不完整的情況,或者完全失效。參考開源POP3客戶端框架作者采用的正則匹配替換方式,采用替換的方式最為保險。
基本實現方式是,匹配出多個QuotedPrintable編碼的內容,比如得到=4F=B5=9F=AB,然后再分解得到單個編碼內容如=4F,這樣為一個字節的內容,將多個字節放在一個數組,得到一個完整的byte[],接下來就是用對應的編碼方式getstring即可。用得到的string替換編碼內容,達到解碼的方式。
QuotedPrintable解碼實現
1privateconststringQpSinglePattern="(\\=([0-9A-F][0-9A-F]))";
2
3privateconststringQpMutiplePattern=@"((\=[0-9A-F][0-9A-F])+=?\s*)+";
4
5publicstaticstringDecode(stringcontents,Encodingencoding)
6{
7if(contents==null)
8{
9thrownewArgumentNullException("contents");
10}
11
12//替換被編碼的內容
13stringresult=Regex.Replace(contents,QpMutiplePattern,newMatchEvaluator(delegate(Matchm)
14{
15List<byte>buffer=newList<byte>();
16//把匹配得到的多行內容逐個匹配得到后轉換成byte數組
17MatchCollectionmatches=Regex.Matches(m.Value,QpSinglePattern,RegexOptions.IgnoreCase|RegexOptions.Compiled);
18foreach(Matchmatchinmatches)
19{
20buffer.Add((byte)HexToByte(match.Groups[2].Value.Trim()));
21}
22returnencoding.GetString(buffer.ToArray());
23}),RegexOptions.IgnoreCase|RegexOptions.Compiled);
24
25//替換多余的鏈接=號
26result=Regex.Replace(result,@"=\s+","");
27
28returnresult;
29}
30
31privatestaticintHexToByte(stringhex)
32{
33intnum1=0;
34stringtext1="0123456789ABCDEF";
35for(intnum2=0;num2<hex.Length;num2++)
36{
37if(text1.IndexOf(hex[num2])==-1)
38{
39return-1;
40}
41num1=(num1*0x10)+text1.IndexOf(hex[num2]);
42}
43returnnum1;
44}
總結
以上是生活随笔為你收集整理的QuotedPrintable解码的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: ROS 下使用3D激光雷达 velody
- 下一篇: VSTO学习(三)——创建Excel解决
