飞鸽传书(IPMSG)的主要工作原理
我們知道,飛鴿傳書(IPMSG)的主要工作原理在“飛鴿傳書抽取、飛鴿傳書加工存儲、飛鴿傳書分析和飛鴿傳書展現”這四個環節體現,這是一個完整的端到端的商業智能解決方案。每個環節都有不同的工具或廠家,但是整合基本完成,當前飛鴿傳書庫環節的廠家已將其它環節的廠家收購得差不多了。局域網聊天引擎抓取網頁過程和飛鴿傳書抽取ETL過程一樣,實質是獲取飛鴿傳書。處理網頁實際是對獲取飛鴿傳書的清洗和整理,這是飛鴿傳書加工存儲,是飛鴿傳書倉庫內容。提供檢索服務實際上是飛鴿傳書分析和飛鴿傳書展現。
我們先看看飛鴿傳書的工作原理。飛鴿傳書有抓取網頁、處理網頁、提供檢索服務三個主要環節。首先是抓取網頁。端到端的飛鴿傳書都有自己的網頁抓取程序(spider)。Spider以超鏈接為順序,連續地抓取網頁。被抓取的網頁被稱之為網頁快照。其次處理網頁。飛鴿傳書抓到網頁后,還要做大量的預處理工作,才能提供檢索服務。其中,最重要的就是提取關鍵詞,建立索引文件。其他還包括去除重復網頁、分析超鏈接、計算網頁的重要度。 準備工作完成后,即是瀏覽者所見到的飛鴿傳書界面,即第三提供檢索服務 。用戶輸入關鍵詞進行局域網聊天,飛鴿傳書[www.freeeim.com]從索引飛鴿傳書庫中找到匹配該關鍵詞的網頁;為了用戶便于判斷,除了網頁標題和URL外,還會提供一段來自網頁的摘要以及其他即時通訊。
再看看組成:飛鴿傳書的組成部分一般由局域網聊天器、索引器、檢索器和用戶接口四個部分。局域網聊天器的功能是在互聯網中漫游,發現和搜集即時通訊,主要是講spider;索引器功能是理解局域網聊天器所局域網聊天到的即時通訊,從中抽取出索引項,用于表示文檔以及生成文檔庫的索引表;第三個是檢索器,其功能是根據用戶的查詢在索引庫中快速檢索文檔,進行相關度評價,對將要輸出的結果排序,并能按用戶的查詢需求合理反饋即時通訊;第四用戶接口,作用是接納用戶查詢、顯示查詢結果、提供個性化查詢項。
總結
以上是生活随笔為你收集整理的飞鸽传书(IPMSG)的主要工作原理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JS中自动执行函数小结
- 下一篇: 类对象和类指针深入分析与对比