“互联网+”大学生创新创业大赛产业命题赛道命题方向分析
圖1 大賽產(chǎn)業(yè)命題賽道部分命題
?????????如圖1所示,產(chǎn)業(yè)命題賽道就好比命題作文,選題都是一些真實企業(yè)(如華為)提前定好的,參賽選手必須在命題要求的范圍內(nèi)按照要求進行準備。
? ? ? ? 這些命題直觀上令人感覺到十分前沿,大部分都要求應(yīng)用新技術(shù),如區(qū)塊鏈等,頗具難度。
? ? ? ? 作者對命題方向的分布十分感興趣,于是爬取了所有命題題目,并對其進行分詞,然后計算詞頻,并進行可視化呈現(xiàn),直觀準確地獲得了命題方向的大概分布情況。
1 整體思路
?
?圖2 整體思路流程圖
?2 項目實施
2.1 爬取題目
import requests from lxml import etree import pandas as pd import jieba import matplotlib.pyplot as pltword_list = [] # 用來儲存分好的詞 stopword_list = [] # 停用詞列表,用來排除分好的詞中虛詞等無意義的詞for i in range(8):url = 'https://cy.ncss.cn/mtcontest/mingtilist?pageIndex='+str(i)+'&pageSize=30&companyName=&name='headers={'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36','Host':'cy.ncss.cn'}text = requests.get(url = url, headers = headers).texthtml = etree.HTML(text)title = html.xpath('//div[@class="cyyq-title"]//text()')? ? ? ? 需要注意的是,目標網(wǎng)頁通過ajax加載數(shù)據(jù),需要通過chrome瀏覽器分析出發(fā)送ajax請求后的新url進行請求,不然無法獲得目標數(shù)據(jù)。
2.2 分詞操作
for item in title: # 接上面的代碼段for word in jieba.lcut(item,cut_all = False, HMM=True):word_list.append(word) with open('stopword.txt', encoding='utf-8') as f:for line in f.readlines():stopword_list.append(line.strip('\n')) word_list = [w for w in word_list if w not in stopword_list]? ? ? ? 利用jieba庫進行中文分詞,分詞后導(dǎo)入停用詞表刪除無效的虛詞、標點符號等無意義詞。
2.3 詞頻統(tǒng)計
df = pd.DataFrame(word_list) table = pd.DataFrame(df.iloc[:,0].value_counts())? ? ? ? 轉(zhuǎn)化為DataFrame格式,利用其自帶的方法進行詞頻統(tǒng)計。
2.4 畫條形圖
plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False plt.bar(range(50),table.iloc[0:50,0].values.tolist(), align='center', color='b') plt.xticks(range(50),table.iloc[0:50,0].index, rotation=45,fontsize=13) plt.xlabel('關(guān)鍵詞',labelpad=10) plt.ylabel('頻次',labelpad=20) plt.title('產(chǎn)業(yè)賽道命題關(guān)鍵詞頻次',pad=30) plt.show()? ? ? ? 最后進行可視化操作,以條形圖展現(xiàn)詞頻最高的前五十個詞。
3 結(jié)果展示
3.1 詞頻最高的前五十個詞條形圖
圖3??詞頻最高的前五十個詞條形圖
? ? ? ? 如圖所示,詞頻超過20頻次的詞分別是智能、智慧、技術(shù)、AI。由此可見產(chǎn)業(yè)命題賽道非常重視技術(shù),尤其是人工智能方向的新技術(shù),現(xiàn)階段具體而言包括但不限于自然語言處理,知識表現(xiàn),智能搜索,推理,規(guī)劃,機器學習,知識獲取,組合調(diào)度問題,感知問題,模式識別,邏輯程序設(shè)計軟計算,不精確和不確定的管理,人工生命,神經(jīng)網(wǎng)絡(luò),復(fù)雜系統(tǒng),遺傳算法等。
? ? ? ? 詞頻在10到20之間的詞分別是系統(tǒng)、平臺、創(chuàng)新、新、設(shè)計、解決方案、方案、工業(yè)、開發(fā)、識別、材料。首先,系統(tǒng)、平臺、解決方案、方案是結(jié)果形式,這說明產(chǎn)業(yè)命題賽道大多要求參賽選手最終結(jié)果以這些方式呈現(xiàn)。創(chuàng)新、新是原則要求,說明參賽選手最終結(jié)果應(yīng)該要有創(chuàng)新點。設(shè)計、開發(fā)是方法,指設(shè)計程序,開發(fā)系統(tǒng)、平臺等,對應(yīng)結(jié)果形式。工業(yè)、識別、材料是方向,其中識別屬于人工智能技術(shù)中的深度學習領(lǐng)域,工業(yè)主要指工業(yè)4.0,主要內(nèi)容一是“智能工廠”,重點研究智能化生產(chǎn)系統(tǒng)及過程,以及網(wǎng)絡(luò)化分布式生產(chǎn)設(shè)施的實現(xiàn);二是“智能生產(chǎn)”,主要涉及整個企業(yè)的生產(chǎn)物流管理、人機互動以及3D技術(shù)在工業(yè)生產(chǎn)過程中的應(yīng)用等。該計劃將特別注重吸引中小企業(yè)參與,力圖使中小企業(yè)成為新一代智能化生產(chǎn)技術(shù)的使用者和受益者,同時也成為先進工業(yè)生產(chǎn)技術(shù)的創(chuàng)造者和供應(yīng)者;三是“智能物流”,主要通過互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、物流網(wǎng),整合物流資源,充分發(fā)揮現(xiàn)有物流資源供應(yīng)方的效率,而需求方,則能夠快速獲得服務(wù)匹配,得到物流支持。也指向新技術(shù),重點在于技術(shù)的遷移和應(yīng)用。材料是材料科學與工程方向,主要研究一是粉末冶金新理論、新技術(shù);二是相圖研究與材料設(shè)計;三是粉末冶金特種新材料;四是有色、稀有金屬材料的合金化理論及新材料開發(fā);五是現(xiàn)代高性能符合材料;六是有色金屬功能材料。 六個研究方向的共同特色是:研究內(nèi)容隸屬學科前沿課題和國際熱點研究課題,具有創(chuàng)新性;緊密結(jié)合國民經(jīng)濟建設(shè)主戰(zhàn)場,實用性強;每個研究方向都有國家級或省部委級重點項目的支撐,實施過程可靠性高;有一支結(jié)構(gòu)合理的高水平學術(shù)隊伍和良好的研究條件,可實現(xiàn)預(yù)期研究目標,并具有可持續(xù)發(fā)展的良好前景
? ? ? ? 10以下詞頻較高的詞中,數(shù)據(jù)、云、互聯(lián)網(wǎng)等均體現(xiàn)大賽對信息技術(shù)的要求。區(qū)塊鏈作為近年來比較火的領(lǐng)域也榜上有名,此外鄉(xiāng)村振興作為關(guān)鍵詞也占據(jù)一席之地,可以體現(xiàn)國家政策的作用。而振興鄉(xiāng)村的最有利武器仍然是新技術(shù),因為新技術(shù)具有高效率,往往成本低。
3.2 詞頻最高的前三十個詞表格
表1
| 詞頻 | |
| 智能 | 26 |
| 智慧 | 24 |
| 技術(shù) | 23 |
| AI | 20 |
| 系統(tǒng) | 19 |
| 平臺 | 19 |
| 創(chuàng)新 | 18 |
| 新 | 16 |
| 設(shè)計 | 16 |
| 解決方案 | 16 |
| 方案 | 14 |
| 工業(yè) | 11 |
| 開發(fā) | 11 |
| 識別 | 10 |
| 材料 | 10 |
| 檢測 | 9 |
| 數(shù)據(jù) | 9 |
| 場景 | 8 |
| 云 | 7 |
| 研發(fā) | 7 |
| 互聯(lián)網(wǎng) | 7 |
| 管理 | 7 |
| 鄉(xiāng)村 | 6 |
| 區(qū)塊 | 6 |
| 產(chǎn)業(yè)化 | 6 |
| 鏈 | 6 |
| 能力 | 6 |
| 方向 | 6 |
| 自動 | 6 |
?
?
總結(jié)
以上是生活随笔為你收集整理的“互联网+”大学生创新创业大赛产业命题赛道命题方向分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 电机与运动控制笔记整理(二)——直流调速
- 下一篇: WPF实现倒计时