大数据在高校的应用场景_高校大数据及AI应用解决方案
為高校大數(shù)據(jù)解決方案提供建設(shè)咨詢、大數(shù)據(jù)建設(shè)、數(shù)據(jù)處理、數(shù)據(jù)的存儲與建模、分析與挖掘、呈現(xiàn)與應(yīng)用、安全與運維等全流程服務(wù)。面向高校管理、服務(wù)、科研和教學(xué)的主要職能,為用戶提供軟硬件環(huán)境的整體設(shè)計,為高校構(gòu)建整體的大數(shù)據(jù)應(yīng)用服務(wù)環(huán)境,從而幫助用戶開展教育數(shù)據(jù)的深度分析和應(yīng)用工作,助力高校從IT向DT邁進(jìn),創(chuàng)新信息化應(yīng)用價值,構(gòu)建持續(xù)化的發(fā)展能力。
一、 應(yīng)用需求
2015年8月,國務(wù)院印發(fā)了《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(以下簡稱《綱要》)。《綱要》明確指出,要將大數(shù)據(jù)技術(shù)應(yīng)用于我國的文化教育領(lǐng)域,建立教育文化大數(shù)據(jù)。從目前全國各高校的信息化規(guī)劃來看,都將大數(shù)據(jù)列為重點工作內(nèi)容。高校中的數(shù)據(jù)有很高挖掘分析價值,近幾年來高校數(shù)字化校園的建設(shè)豐富了學(xué)校教學(xué)、科研、行政管理、生活服務(wù)等各方面的數(shù)據(jù)。然而,高校要想發(fā)揮這些數(shù)據(jù)的潛在價值,探索教育大數(shù)據(jù)的應(yīng)用,還將面臨以下挑戰(zhàn):數(shù)據(jù)接口不完善,有效數(shù)據(jù)質(zhì)量不高;對信息化軟硬件和運維服務(wù)要求高;建設(shè)需要關(guān)聯(lián)分析、統(tǒng)一規(guī)劃;高校的用戶類型多,需求各異。
二、 架構(gòu)
高校大數(shù)據(jù)解決方案的核心智能大數(shù)據(jù)Sunm-In Center, 采用業(yè)內(nèi)領(lǐng)先技術(shù), Sunm-In Center具備極高的可用性、超強的擴(kuò)展能力、優(yōu)秀的處理性能,能高效處理PB級別以上的數(shù)據(jù)。支持圖形化采集校內(nèi)業(yè)務(wù)系統(tǒng)、互聯(lián)網(wǎng)以及設(shè)備日志等不同類別數(shù)據(jù),提供強大的實時和離線計算能力的同時還擁有豐富的數(shù)據(jù)挖掘分析算法,能夠為高校管理、服務(wù)、教學(xué)和科研等方向提供深度的大數(shù)據(jù)綜合分析結(jié)果,從而為高校用戶打下海量數(shù)據(jù)深度分析的基礎(chǔ),挖掘數(shù)據(jù)潛在的核心價值,輔助決策。
2.1、智能數(shù)據(jù)采集中心In Center-DC
InCenter-DC通過接口讀取、數(shù)據(jù)庫獲取、網(wǎng)絡(luò)爬蟲和智能錄入4種方式采集學(xué)校數(shù)據(jù), 全量存儲在融合HIVE、MySQL、HDFS多種集群的數(shù)據(jù)倉庫中, 保證數(shù)據(jù)的原始性和多元性。此外, In Center-DC支持結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù), 支持FTP、HTTP、Oracle和Syslog等采集方式。同時開創(chuàng)性地采用了可視化ETL工具設(shè)計, 用戶可靈活拖拽, 自主設(shè)計數(shù)據(jù)采集, 并提供圖形化的數(shù)據(jù)報告,用于數(shù)據(jù)監(jiān)控與質(zhì)量追蹤。
2.2、智能數(shù)據(jù)預(yù)處理中心In Center-PT
In Center-PT是數(shù)據(jù)預(yù)處理工具, 可將缺失數(shù)據(jù)、錯誤數(shù)據(jù)、不可用數(shù)據(jù)等進(jìn)行處理,結(jié)合學(xué)校標(biāo)準(zhǔn)和國家標(biāo)準(zhǔn)規(guī)范,對學(xué)校數(shù)據(jù)進(jìn)行重新梳理,以保證大數(shù)據(jù)分析的原始數(shù)據(jù)質(zhì)量。
2.3、智能挖掘算法中心In Center-MA
In Center-MA內(nèi)置了大量高校大數(shù)據(jù)與機(jī)器學(xué)習(xí)算法, 包括分類、聚類、回歸、頻度關(guān)聯(lián)和神經(jīng)網(wǎng)絡(luò)等,形成學(xué)生素質(zhì)評估、行為異常、心理異常等大數(shù)據(jù)分析模型。同時In Center-MA內(nèi)置超過50種高校行業(yè)定制優(yōu)化的專用算法, 用于深度挖掘分析大數(shù)據(jù)中的海量數(shù)據(jù),從而快速基于高校業(yè)務(wù)構(gòu)建大規(guī)模數(shù)據(jù)挖掘分析。
2.4、智能統(tǒng)一API中心In Center-UA
In Center-UA是通過整合大數(shù)據(jù)中各類型異構(gòu)的數(shù)據(jù)庫, 實現(xiàn)接口統(tǒng)一封裝與數(shù)據(jù)調(diào)度, 屏蔽由于語言和工具導(dǎo)致的接口差異, 對外提供標(biāo)準(zhǔn)的JDBC接口, 同時支持R語言、Python、Java等多種開發(fā)語言, 并且支持對接第三方BI開發(fā)工具,提高用戶數(shù)據(jù)查詢、數(shù)據(jù)存儲管理和自主開發(fā)的易用性。
三、關(guān)鍵技術(shù)
3.1、精準(zhǔn)可視化的數(shù)據(jù)治理技術(shù)
通過靈活拖拽,自主設(shè)計數(shù)據(jù)采集、適配和轉(zhuǎn)換的流程,并提供可視化的高校智能ETL工具箱, 實現(xiàn)數(shù)據(jù)的圖形化采集與監(jiān)控管理。同時, Sun m-In Center成功采集與治理過的高校數(shù)據(jù)源超過40種,每天處理的數(shù)據(jù)條目超過300萬,有著非常豐富的高校數(shù)據(jù)采集落地經(jīng)驗,可適應(yīng)高校不同現(xiàn)狀的數(shù)據(jù)治理需求。
3.2、高效實時的數(shù)據(jù)處理技術(shù)
提供了批處理、分時處理和實時處理等多種數(shù)據(jù)處理方式,滿足高校不同類別數(shù)據(jù)產(chǎn)生因時間、空間及格式不同帶來的數(shù)據(jù)多樣性; 同時提供了Hash、Range、List和Datetime等分片技術(shù), 實現(xiàn)了數(shù)據(jù)處理的動態(tài)均衡、彈性伸縮, 提升了數(shù)據(jù)處理的時效性。
3.3、極致性能與高效檢索技術(shù)
具備出色的多任務(wù)并行處理及分布式計算性能,在性能及擴(kuò)展性方面具備低延遲、高吞吐、強容錯、易擴(kuò)展等特點; 結(jié)合Eat ic Search和針對高校行業(yè)自定義分片技術(shù),達(dá)到毫秒級全文搜索,可實現(xiàn)單條查詢速度3毫秒以內(nèi)、十億多條日志量檢索時間在7秒以內(nèi)。
3.4、高校算法模型庫
集成Spark計算引擎, 結(jié)合多種分布式算法和標(biāo)準(zhǔn)語言算法, 形成內(nèi)容豐富的高校算法庫(含學(xué)生特征、心理異常等50多種算法),讓高校大數(shù)據(jù)分析更具有戰(zhàn)略性和預(yù)測性;內(nèi)置大量高校常用算法模型。用戶通過接口實時調(diào)用,實現(xiàn)自主大數(shù)據(jù)分析,實現(xiàn)數(shù)據(jù)的價值轉(zhuǎn)化,滿足高校自主開發(fā)應(yīng)用、大數(shù)據(jù)競賽及靈活的數(shù)據(jù)分析需求。
3.5、開放數(shù)據(jù)標(biāo)準(zhǔn)與生態(tài)體系
提供了對外統(tǒng)一的API接口, 支持SQL、R語言、Python、Scala、Java等多種語言,可無縫對接第三方主流BI,從而實現(xiàn)快速自主構(gòu)建大數(shù)據(jù)應(yīng)用環(huán)境,滿足高校開發(fā)和運維的需求。整個產(chǎn)品設(shè)計基于業(yè)內(nèi)領(lǐng)先的主流開源技術(shù)進(jìn)行深度定制,并采用模塊化設(shè)計,可實現(xiàn)在不影響業(yè)務(wù)正常運行下的版本無縫升級。
3.6、極為嚴(yán)密的安全防護(hù)體系
融合了權(quán)限控制、數(shù)據(jù)加密/脫敏、審計隔離、報警阻斷和多租戶安全等技術(shù),建立了標(biāo)準(zhǔn)規(guī)范的大數(shù)據(jù)安全防御體系,全面保障用戶的數(shù)據(jù)絕對安全。同時利用先進(jìn)的編碼容錯技術(shù),實現(xiàn)分布式數(shù)據(jù)存放與恢復(fù),將平均無故障時間提高一倍。
四、 應(yīng)用效果
為高校用戶的大數(shù)據(jù)應(yīng)用提供了“一站式”的解決方案,包括軟硬件環(huán)境的建設(shè)和統(tǒng)一管理系統(tǒng)的構(gòu)建,在高校大數(shù)據(jù)的實際應(yīng)用上,以精準(zhǔn)管理、個性化服務(wù)、科研評估以及個性化教學(xué)為目標(biāo),提供的大數(shù)據(jù)具體應(yīng)。在關(guān)鍵應(yīng)用的交付,能夠真正讓高校體驗到大數(shù)據(jù)的應(yīng)用價值。
4.1、實現(xiàn)精準(zhǔn)管理
1.微觀微觀分析學(xué)校所有數(shù)據(jù),建設(shè)“管理駕駛艙”,實現(xiàn)全校和職能部門的發(fā)展態(tài)勢一目了然,讓全校情況數(shù)據(jù)化、可視化。
2.宏觀宏觀展現(xiàn)全校人事、教務(wù)、學(xué)工、科研、信息化等全方位發(fā)展現(xiàn)狀,為學(xué)校分析深層次的管理問題提供數(shù)據(jù)支撐,提前發(fā)現(xiàn)潛在問題;支持開放權(quán)限給各個職能部門,顯示該部門的整體情況。
3.總體構(gòu)建正負(fù)面輿論預(yù)警模型,自動定位出現(xiàn)異常輿論通知校領(lǐng)導(dǎo),同時支持事后輸入關(guān)鍵詞跟蹤輿論動態(tài)。
4.2、提供個性化服務(wù)
提供學(xué)生在校學(xué)習(xí)生活的全面數(shù)據(jù)展示,橫縱向?qū)Ρ让總€學(xué)生的個人發(fā)展態(tài)勢,剖析學(xué)業(yè)、生活及綜合素質(zhì)上升和下降的原因;建立全校學(xué)生身體素質(zhì)、理工水平等多維度的個人畫像檔案,分析優(yōu)秀學(xué)生的行為特征,為學(xué)生樹立行為模范;繪制出學(xué)生“行為軌跡”,預(yù)測學(xué)生失聯(lián)、逃課、心理以及安全隱患等異常行為,通知老師和領(lǐng)導(dǎo)以規(guī)避風(fēng)險。
4.3、細(xì)化科研評估
挖掘高校科研的結(jié)構(gòu)發(fā)展、成果效益等維度的特征,發(fā)現(xiàn)科研項目、學(xué)科發(fā)展和成果產(chǎn)出等數(shù)據(jù)間的相互關(guān)系,為學(xué)校定性科研管理、科研決策提供全面的數(shù)據(jù)支持,實現(xiàn)高校科研管理的可視化、靈活化和多樣化;橫縱向?qū)Ρ葘W(xué)校科研發(fā)展情況,分析學(xué)校之間的差距與優(yōu)勢,提出科研發(fā)展策略和建議,提高科研管理的針對性和綜合效率。
4.4、促進(jìn)個性化教學(xué)
提供學(xué)習(xí)、生活和活動等方面的報告,推送符合學(xué)生課程和興趣的優(yōu)質(zhì)教學(xué)資源,對學(xué)生選課、課程學(xué)習(xí)和期末復(fù)習(xí)提供針對性建議,讓學(xué)生更好地規(guī)劃大學(xué)生活,為個性化學(xué)習(xí)提供指導(dǎo);分析各班各專業(yè)的課程學(xué)習(xí)進(jìn)展,評估教學(xué)質(zhì)量和預(yù)測教學(xué)效果,方便教師改善教學(xué)策略,促進(jìn)因材教學(xué)。
關(guān)注我,可領(lǐng)取更多行業(yè)智慧解決方案
總結(jié)
以上是生活随笔為你收集整理的大数据在高校的应用场景_高校大数据及AI应用解决方案的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为什么手机上传图片这么慢 前端_怎样在手
- 下一篇: 洲际的merlin怎么用_天问一号是怎么