搜狗用这个骚技术,把百度逼上了绝路...
點擊上方[全棧開發(fā)者社區(qū)]→右上角[...]→[設為星標?]
前幾天在百度搜索的時候,一不小心誤點搜索候選詞,給我跑到搜狗搜索里面去了,索性花了點時間分析一下這其中的貓膩,不看不知道,一看嚇一跳。
在瀏覽器中打開百度,使用搜狗輸入法輸入關鍵詞時將出現(xiàn)搜索候選詞列表:
隨便點擊列表中的某一個選項后,頁面跳轉到了搜狗搜索的結果頁:
測試實驗
測試1:360搜索輸入框并沒有這個候選詞列表,如下圖:
結論1:搜狗輸入法應該是對當前打開的頁面有判斷,不是隨便哪個網(wǎng)頁下面的輸入框都會出現(xiàn)這個列表
測試2:在百度頁面,除了主要的搜索框以外,其他入口也會出現(xiàn)這個搜索選項列表,下面是站點內搜索輸入框的測試:
結論2:搜狗輸入法沒有判斷當前輸入框目標是不是搜索框
測試3:這一次不用域名,換用IP地址來訪問百度搜索。我的環(huán)境下ping www.baidu.com 解析的IP地址為:220.181.38.149,結果搜狗輸入法竟然沒有出現(xiàn)這個搜索選項列表:
結論3:這個搜索選項列表的出現(xiàn)跟網(wǎng)頁當前的URL有關
測試4:這一次來把瀏覽器的進程名字改一下,我這里選擇火狐瀏覽器,將firefox.exe改為firefox1.exe,這個搜索選項列表也沒有出現(xiàn):
結論4:除了URL,對進程名字也有判斷,如果不是瀏覽器進程,也不會觸發(fā)
最終結論:搜狗輸入法檢測到用戶打開瀏覽器訪問www.baidu.com域名進行搜索時,將彈出搜索選項列表,引導用戶點擊。
技術分析
如何實現(xiàn)瀏覽器進程篩選?
第一個問題,搜狗輸入法怎么判斷當前是不是在瀏覽器進程中呢?總不能在微信聊天界面也給彈出搜索候選詞列表吧?
搜狗輸入法核心模塊是一個叫SogouPY.ime的文件,這實際上是一個動態(tài)鏈接庫文件,這個文件會隨你切換輸入法時加載到對應的進程中。使用IDA打開分析,發(fā)現(xiàn)這個模塊內部有很多瀏覽器進程名字的字符串:
你看,國內外主流的和非主流的瀏覽器基本都被列為了目標。
進一步分析發(fā)現(xiàn),上面這是一個字符串數(shù)組,找到了遍歷這個數(shù)組,挨個進行比較匹配的處理邏輯:
當前頁面的URL獲取及判斷
瀏覽器進程篩選出來了,還要篩選當前是不是在搜索引擎的頁面,接著往下看!
針對不同瀏覽器使用不同的獲取方式,這里以firefox為例,搜狗輸入法使用了MSAA(Microsoft Active Accessibility)技術獲取到了當前頁面URL。
調試發(fā)現(xiàn),如果修改獲取到的URL內容,搜狗輸入法的搜索選項列表就無法展示出來。
向上追溯可以找到根據(jù)不同瀏覽器進行不同的URL獲取方式分發(fā)入口:
繼續(xù)追溯,獲取當前瀏覽器信息后,還要進行是否是搜索引擎域名的判斷:
這個wcsstr函數(shù)就是在進行字符串比較了,調試得到wcsstr()的參數(shù)1:獲取到的頁面URL,參數(shù)2:搜索引擎域名。又是用一個數(shù)組在進行存儲:
百度居然還有個小名,www1.baidu.com,有意思。
我們來挨個試一下這個列表中的搜索引擎:
www1.baidu.com:
www.soso.com:
這個就不用試了,現(xiàn)在是搜狗自家人。
cn.bing.com:
www.google.cn:
so.sowang.com:
www.chinaso.com:
www.youdao.com:
www.zhongsou.com:
如何打開搜狗搜索頁面呢?
當發(fā)現(xiàn)是在瀏覽器進程中訪問上面的搜索引擎域名后,就該跳轉到搜狗自己的搜索頁面了,那它是如何打開的呢?繼續(xù)往下看!
打開firefox,使用調試器WinDbg 掛載到這個進程,執(zhí)行這個命令:bp shell32!ShellExecuteW,給函數(shù)ShellExecuteW下斷點。
接著打開百度首頁,切換到搜狗中文輸入法,這樣使得SoGouPY.ime模塊加載到firefox的進程空間中。
然后隨意輸入字符,出現(xiàn)搜狗搜索選項列表,隨便點擊一個,觸發(fā)斷點!來看一下參數(shù):
可以看到:這里通過啟動當前瀏覽器(firefox.exe)打開了URL。根據(jù)堆棧返回地址,可以進一步往前分析。
IDA反匯編太多,就不截圖了。總體來說,判斷當前瀏覽器是否是IE內核,如果是,就通過獲取到瀏覽器IWebBrowser2接口指針,調用接口中的Navigate2方法來打開搜狗搜索頁面。如果不是IE內核,直接調用ShellExecuteW打開URL。
那如何判斷是不是IE內核呢?
可以看搜狗的做法:獲取當前瀏覽器類別,內部通過進程名、當前焦點窗口的Class名(”Internet Explorer_Server”)綜合判斷:
總結
和實驗得到的結論一致。
一圖勝千言,整個過程就是這個樣子的:
多說幾句
事實上,搜狗干這事已經(jīng)有好些年了。幾年前,百度還把搜狗給告了,搜狗敗訴賠錢。不過,輸了是輸了,就是堅決不改。。。
對于搜狗輸入法的這騷操作,你怎么看?
本公眾號會不定期給大家發(fā)福利,包括送書、學習資源等,敬請期待吧! 如果感覺推送內容不錯,不妨右下角點個在看轉發(fā)朋友圈或收藏,感謝支持。 - EOF -想要加入中生代架構群的小伙伴,請?zhí)砑尤汉匣锶舜蟀椎奈⑿?申請備注(姓名+公司+技術方向)才能通過哦!擴展閱讀? ?阿里專家馬飛翔:一文讀懂架構整潔之道2020-10-16DDD專家張逸:構建領域驅動設計知識體系2020-10-13 京東架構師閆文廣:訂單系統(tǒng)高可用架構及演變過程2020-10-12 架構師,是否需要寫代碼?2020-09-18 阿里高級技術專家簫逸:如何畫好一張架構圖?2020-09-07 大神手把手教你設計秒殺架構模型2020-09-06 阿里巴巴閑魚架構負責人王樹彬:萬億交易規(guī)模技術架構實踐2020-09-05 阿里高級技術專家張建飛:應用架構分離業(yè)務邏輯和技術細節(jié)之道2020-08-31 波波老師大解密:如何成為優(yōu)秀的架構師?2020-06-25 微信支付軟件架構重構之旅2020-06-08 一個思維習慣,讓你成為架構師2020-06-03 阿里P9專家右軍:以終為始的架構設計2020-04-27END ? ?? #架構師必備#點分享點點贊點在看總結
以上是生活随笔為你收集整理的搜狗用这个骚技术,把百度逼上了绝路...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL添加服务、设置密码、修改密码
- 下一篇: NYOJ 1069 生活的难题