简易的信息检索系统
項(xiàng)目概覽: 本項(xiàng)目為 C++部分的課程考試題,需個(gè)人獨(dú)立完成。 設(shè)計(jì)并實(shí)現(xiàn)一個(gè)簡(jiǎn)易的信息檢索系統(tǒng),構(gòu)成搜索引擎的核心模塊。該系統(tǒng)讀取一組英文文本 文件,為該組文件創(chuàng)建反向索引(請(qǐng)參考“補(bǔ)充知識(shí)”部分),并借助創(chuàng)建好的反向索引實(shí) 現(xiàn)對(duì)文件內(nèi)容的快速查詢。 基本功能(必需): 1. 系統(tǒng)能夠?yàn)橐粋€(gè)文本文件集合創(chuàng)建反向索引。 2. 系統(tǒng)能夠根據(jù)單個(gè)詞語(yǔ)搜索相應(yīng)的文件(例如“movie”、“good”)。 3. 系統(tǒng)提供基于命令行的用戶交互界面,具體功能包括: ? 讓用戶指定需索引的文件目錄(該目錄包含需索引的全部文本文件); ? 讓用戶輸入搜索內(nèi)容; ? 顯示搜索到的文件名(一個(gè)或多個(gè))。 ? 高級(jí)功能(可選): 1. 系統(tǒng)支持組合查詢語(yǔ)句,該語(yǔ)句包含兩個(gè)或多個(gè)以“OR”或“AND”連接的單詞(例 如 “movie” AND “good”、“movie” OR “TV”)。系統(tǒng)無(wú)需支持同時(shí)包含“AND”和“OR” 的查詢語(yǔ)句,例如(“good” OR “bad”) AND “movie”。 2. 系統(tǒng)支持短語(yǔ)(包含兩個(gè)或多個(gè)單詞)查詢,例如“good movie”。 3. 系統(tǒng)能夠?qū)λ阉鞯降奈募c查詢語(yǔ)句之間的關(guān)聯(lián)度進(jìn)行分析與排序,并按照關(guān)聯(lián)度排序 (降序)顯示搜索到的文件。 4. 系統(tǒng)能夠支持一些更高級(jí)的用戶交互功能(例如:系統(tǒng)在顯示搜索結(jié)果時(shí)除了顯示文件 名外,還顯示文件內(nèi)容,并將被查詢的詞匯以特殊的方式標(biāo)出)。 5. 系統(tǒng)能夠讓用戶指定一個(gè)需排除的詞匯列表,這些詞匯在創(chuàng)建反向索引時(shí)不被檢索。 6. 其他能夠提升索引與搜索質(zhì)量的功能。專(zhuān)業(yè)程序代寫(xiě)大學(xué)生程序代寫(xiě)
轉(zhuǎn)載于:https://www.cnblogs.com/java20130722/archive/2013/06/08/3207504.html
總結(jié)
- 上一篇: spring junit 测试
- 下一篇: 阻止表中出现重复项——SQL UNIQU