利用Synonyms库对论文进行降重
前些日子,收到了來自老師的畢業論文問候,本著學習的態度就在知識的海洋了瘋狂遨游,奈何風太大,差點翻車
于是我就萌發出一種可以自動降重的腳本(別說什么網上降重,沒錢!!!),眾所周知,論文降重其實就是找近義詞。正好,我想起了synonyms中文庫尋找近義詞
首先就是安裝
pip install synonyms想法是這樣的:首先輸入一條句子,然后進行分詞,找出所有分詞的近義詞(應該是形容詞,后續再弄),在拼接到一塊,最后進行句子的相識度展示。
在這個過程中需要解決一些問題,因為synonyms打包的display模塊里只有顯示,沒有返回數據,所以將synonyms的模塊進行了一些微調,讓它返回數據,如下
接下來就是我們的主程序了,簡單的不行,這里我把synonyms模塊改成了newsyn
import newsyn.newsynresult = newsyn.newsyn.seg('隨著現代信息化、智能制造的快速發展,工業數據在制造企業中呈日益增長趨勢。其中標準件的數量更是占據了全部零件數量的絕大部分,而標準件的管理卻依然采用著人工手動統計的方式,這種方式不僅浪費人力還容易出現種種差錯,影響了制造企業快速設計、制造的趨勢。在航空制造企業中,標準件件數量大、參數多,為了提高產品的設計效率,降低產品的開發成本,提高產品在市面上的競爭力,提出利用現代計算機語言創建飛機標準件庫存管理系統,增強了企業對標準件的信息化管理。')print(result[0])symbol = [',','.',',','。','?','‘','’','“','”','!','、'] str = [] for i in range(3):sentence = ''for words in result[0]:print(words)if words not in symbol:word = newsyn.newsyn.display(words)print(word[0])if word[0]==[]:sentence += wordselse:sentence += word[0][i]else:sentence += wordsstr.append(sentence)print(str) result = newsyn.newsyn.compare(str[0],str[1]) print('近似度:' , result) result = newsyn.newsyn.compare(str[0],str[2]) print('近似度:' , result)結果就是
隨著現代信息化、智能制造的快速發展,工業數據在制造企業中呈日益增長趨勢。其中標準件的數量更是占據了全部零件數量的絕大部分,而標準件的管理卻依然采用著人工手動統計的方式,這種方式不僅浪費人力還容易出現種種差錯,影響了制造企業快速設計、制造的趨勢。在航空制造企業中,標準件件數量大、參數多,為了提高產品的設計效率,降低產品的開發成本,提高產品在市面上的競爭力,提出利用現代計算機語言創建飛機標準件庫存管理系統,增強了企業對標準件的信息化管理。
隨著當代信息技術、智能化生產的的迅速經濟發展,輕工業信息特別是在生產民營企業之中呈圓形不斷增長態勢。當中特種玻璃的的數目可謂占有了有全數配件數目的的大部分,因而特種玻璃的的管理工作雖然仍然使用著育苗自動統計數據的的形式,此種形式不但節約物力也難發生諸多疏漏,負面影響了有生產民營企業迅速結構設計、生產的的態勢。特別是在航空公司生產民營企業之中,特種玻璃多件數目小、變量少,為的是提升商品的的結構設計工作效率,減少商品的的生產成本,提升商品特別是在市面的的競爭優勢,明確提出借助當代計算機語言建立直升機特種玻璃庫存量信息系統,進一步增強了有民營企業對于特種玻璃的的信息技術管理工作。
由于近代電子政務、智能家居組裝和加速產業發展,化學工業統計數據如在組裝中小企業當中呈長不斷增加格局。另外盒形和量著實占去了為剩余部件量和絕大多數,因此盒形和行政管理終究依舊選用著大滴灌全自動統計資料和方法,這樣方法不光消耗勞力就不易再次出現各種紕漏,沖擊了為組裝中小企業加速外觀設計、組裝和格局。如在國際航空組裝中小企業當中,盒形萬件量多、模塊頻密,借以降低系列產品和外觀設計效能,減低系列產品和投資成本,降低系列產品如在市售和競爭能力,制訂借由近代計算機語言創立客機盒形產能系統,提升了為中小企業對個人盒形和電子政務行政管理。
第一個為原文,和第二個和第三個的相識度分別為
近似度: 0.947
近似度: 0.919
話說,這個不能說是一摸一樣吧,最后一個簡直毫不相干
簡單算是一個思路吧,后續再把相關詞性進行一些操作,讓降重更精確點
總結
以上是生活随笔為你收集整理的利用Synonyms库对论文进行降重的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 冠词 article
- 下一篇: 面向对象(二)练习篇之对象数组问题