vc采集网页内frame框架下所有元素(不指定具体table/form)-升级版
升級版說明:增加對獲取指定控件的判斷,利用標志bGetCaller,減少循環和遞歸,基于效能提升門戶生產地址獲取主叫,可從60s壓縮到6s
1.獨立代碼
#include <atlbase.h>
#include <mshtml.h>
#include <winuser.h>
#include <comdef.h>
#include <string.h>
void EnumIE(void);//處理網頁
void EnumFrame(IHTMLDocument2 * pIHTMLDocument2);//處理框架
CComModule _Module;??//使用CComDispatchDriver ATL的智能指針,此處必須聲明
#include <atlcom.h>
void EnumAllElement(IHTMLDocument2 * pIHTMLDocument2);//獲取網頁內元素
CString???? glb_strCaller;//全局主叫
BOOL??????? glb_bGetCaller;//是否獲取到主叫
void EnumIE(void)??
{
?CComPtr<IShellWindows> spShellWin;??
?HRESULT hr=spShellWin.CoCreateInstance(CLSID_ShellWindows);??
?if (FAILED(hr))??
?{??
??return;??
?}??????
?long nCount=0;??? //取得瀏覽器實例個數(Explorer和IExplorer)??
?spShellWin->get_Count(&nCount);??
?if (0==nCount)??
?{??
?? return;??
?}
?for(int i=0; i<nCount; i++)??
?{??
??CComPtr<IDispatch> spDispIE;??
??hr=spShellWin->Item(CComVariant((long)i), &spDispIE);??
??if (FAILED(hr)) continue;
?
??CComQIPtr<IWebBrowser2>spBrowser=spDispIE;??
??if (!spBrowser) continue;
?
??CComPtr<IDispatch> spDispDoc;??
??hr=spBrowser->get_Document(&spDispDoc);??
??if (FAILED(hr)) continue;
?
??CComQIPtr<IHTMLDocument2>spDocument2 =spDispDoc;??
??if (!spDocument2) continue;??????
??//Modify by Fang jiansheng 2011-04-02
??//*******************************************************************************
??CString cIEUrl_Filter;? //設置的URL(必須是此URL的網站才有效);
??cIEUrl_Filter="http://172.20.33.130:8082/csp/"; //效能提升門戶過濾的網址???
??//*******************************************************************************
??CComBSTR IEUrl;
??spBrowser->get_LocationURL(&IEUrl);
??CString cIEUrl_Get;???? //從機器上取得的HTTP的完整的URL;
??cIEUrl_Get=IEUrl;
??cIEUrl_Get=cIEUrl_Get.Left(cIEUrl_Filter.GetLength()); //截取前面N位
??if (strcmp(cIEUrl_Get,cIEUrl_Filter)==0)
??{
???// 程序運行到此,已經找到了IHTMLDocument2的接口指針
???glb_bGetCaller=false;//恢復主叫未獲取標志
???EnumAllElement(spDocument2);//枚舉所有字段
??}???
? }??
}
//在框架內獲取主叫
void EnumAllElement(IHTMLDocument2 * pIHTMLDocument2) //枚舉所有字段
{
?if (!pIHTMLDocument2) return;?
??
?EnumFrame(pIHTMLDocument2);?? //遞歸枚舉當前IHTMLDocument2上的子框架frame?
?if (glb_bGetCaller) return;//已獲取主叫
?HRESULT?? hr;??
?CComQIPtr<IHTMLElementCollection> spAllElement;
?hr=pIHTMLDocument2->get_all(&spAllElement);//獲取所有網頁內所有元素
?if (FAILED(hr))??return;??
?long nLength = 0;
?spAllElement->get_length (&nLength);
?for (int i = 0; i < nLength; i++)
?{
??????? CComPtr<IDispatch> pDisp;
??hr = spAllElement->item(COleVariant((long)i),COleVariant((long)0),&pDisp); //獲取單個元素
??if(SUCCEEDED(hr))
??{
???//CComQIPtr <IHTMLElement, &IID_IHTMLElement> pElement(pDisp);
???CComQIPtr<IHTMLElement, &IID_IHTMLElement> pElement;
???pDisp->QueryInterface(&pElement);
???BSTR bTemp;
???pElement->get_id(&bTemp);//可以獲取其他特征,根據具體元素而定
???CString strTemp=bTemp;
???if(!strTemp.IsEmpty() && strTemp=="callNo")//根據id是主叫號碼獲取值或作其他處理
???{
????IHTMLInputTextElement* input;
????pDisp->QueryInterface(IID_IHTMLInputTextElement,(void**)&input);
????input->get_value(&bTemp);
????if(bTemp==NULL) glb_strCaller="";
????else glb_strCaller=bTemp;
????glb_bGetCaller=true;//找到主叫
????break;
???}
??}
?}
}
//循環頁面框架
void EnumFrame(IHTMLDocument2 * pIHTMLDocument2)
{??
?if (!pIHTMLDocument2) return;?????
?if (glb_bGetCaller) return;//已獲取主叫
?HRESULT?? hr;?????
?CComPtr<IHTMLFramesCollection2> spFramesCollection2;??
?pIHTMLDocument2->get_frames(&spFramesCollection2); //取得框架frame的集合??
???
?long nFrameCount=0;??????? //取得子框架個數??
?hr=spFramesCollection2->get_length(&nFrameCount);??
?if (FAILED(hr)|| 0==nFrameCount) return;??
???
?for(long i=0; i<nFrameCount; i++)??
?{??
??CComVariant vDispWin2; //取得子框架的自動化接口??
??hr = spFramesCollection2->item(&CComVariant(i), &vDispWin2);??
??if (FAILED(hr)) continue;??????
??CComQIPtr<IHTMLWindow2>spWin2 = vDispWin2.pdispVal;??
??if (!spWin2) continue; //取得子框架的?? IHTMLWindow2?? 接口??????
??CComPtr <IHTMLDocument2> spDoc2;??
??spWin2->get_document(&spDoc2); //取得子框架的?? IHTMLDocument2?? 接口
??EnumAllElement(spDoc2);????? //遞歸枚舉當前子框架?? IHTMLDocument2?? 上的所有控件?
?}??
}
?
//-----------結束---------------------//
2.執行代碼:
void CDemoDlg::OnOK()
{
?// TODO: Add extra validation here
?::CoInitialize(NULL); //初始化COM
???? EnumIE();???????????? //枚舉瀏覽器??????
???? ::CoUninitialize();?? //釋放COM
?//CDialog::OnOK();
}
總結
以上是生活随笔為你收集整理的vc采集网页内frame框架下所有元素(不指定具体table/form)-升级版的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 读张鸣-《辛亥:摇晃的中国》感
- 下一篇: vc采集网页内指定frame框架下所有元