php偷取,PHP偷取UTF-8目标网页内容输出为空白
利用PHP中的file_get_contents(URL)函數(shù)實現(xiàn)偷取網(wǎng)頁正文內(nèi)容的時候,將偷取過來的UTF-8網(wǎng)頁內(nèi)容進行轉(zhuǎn)碼后輸出,直接輸出可以看到偷取后的內(nèi)容??捎袝r我們有時也會遇到在輸出偷取過來的內(nèi)容時,卻是一片空白,什么都沒有。例如有如下代碼:
$url = "http://www.nbrlw.com/wtrl/2/index.html";
$string = file_get_contents($url); //得到網(wǎng)頁內(nèi)容
echo iconv('utf-8','gbk',$string); //轉(zhuǎn)碼輸出
卻是一片空白。折騰了半天,原來在轉(zhuǎn)碼時,應(yīng)該忽略一些不需要轉(zhuǎn)碼的字符,即:
echo iconv('utf-8','gbk',$string);
改寫成:
echo iconv('utf-8','gbk// ignore',$string);
utf-8直接轉(zhuǎn)gbk,這樣問題就來了,當(dāng)有些字符無法轉(zhuǎn)換的時候就從此處斷開,導(dǎo)致內(nèi)容不完整。后來又重新查手冊,才發(fā)現(xiàn)iconv還有兩個可選的輔助參數(shù):TRANSLIT和IGNORE ,(其中IGNORE 就是說遇到無法轉(zhuǎn)換的就跳過)。
No related posts.
總結(jié)
以上是生活随笔為你收集整理的php偷取,PHP偷取UTF-8目标网页内容输出为空白的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php图片去噪,python 图片去噪的
- 下一篇: 商业医疗保险一年大概多少