python开发的著名软件公司_软件开发公司_软件外包_项目外包平台基于Python开发一个全文检索系统...
基于Python開發(fā)一個(gè)全文檢索系統(tǒng)。功能要求為:
使用全文檢索引擎對文本進(jìn)行檢索。文本的格式為Word、PDF、TXT。
同時(shí)按數(shù)據(jù)域進(jìn)行復(fù)合條件檢索。數(shù)據(jù)域指文本對應(yīng)的信息,例如創(chuàng)建人、文件編號、所述部門之類。
對數(shù)據(jù)域的數(shù)據(jù)進(jìn)行基本的維護(hù)管理。
對檢索結(jié)果進(jìn)行二次檢索,二次檢索基于程序插件模塊進(jìn)行,包括基于詞距(關(guān)鍵詞之間的距離)、詞頻等。部分二次檢索功能可以直接在全文引擎中實(shí)現(xiàn),但由于二次檢索的規(guī)則的廣泛性,所以二次檢索總是必須的。
對檢索結(jié)果進(jìn)行展現(xiàn),包括對于檢索條件相關(guān)的內(nèi)容進(jìn)行重點(diǎn)展現(xiàn)(如高亮、摘錄等)。
根據(jù)檢索結(jié)果查看和下載對應(yīng)的文件。可以進(jìn)行批量下載。可以控制下載的權(quán)限。
進(jìn)行檢索、查看和下載的Log記錄和統(tǒng)計(jì)。
進(jìn)行用戶一段時(shí)間內(nèi)下載次數(shù)的限制。
控制用戶組檢索數(shù)據(jù)域和文件的權(quán)限,例如有些用戶只能面向部分文件進(jìn)行檢索。
對開發(fā)方的要求:
基于Python+Flask開發(fā),可以使用全文檢索引擎模塊。
對于所開發(fā)的程序提供全部源代碼及注釋、文檔。使用第三方模塊需要得到需方同意。
不使用開發(fā)方的通用組件,除非這些組件代碼向需方開放并具有足夠的易讀性和易維護(hù)性。
需方擁有全部知識產(chǎn)權(quán)。開發(fā)方可以在其他項(xiàng)目中不受限制地使用、復(fù)用、修改所開發(fā)的代碼。
需要在6周內(nèi)提供包括基本功能的可用版本。
價(jià)格及完成時(shí)間可談
總結(jié)
以上是生活随笔為你收集整理的python开发的著名软件公司_软件开发公司_软件外包_项目外包平台基于Python开发一个全文检索系统...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C语言文件操作基本常识
- 下一篇: mysql 无法处理非法数据_MySQL