新工科背景下的大数据体系建设探析
新工科背景下的大數據體系建設探析
王元卓,于建業
中國科學院計算技術研究所,北京 100190
北京物資學院信息學院,北京 101149
?
摘要:大數據產業迅猛發展,對大數據人才培養提出了巨大挑戰。如何有效地融合跨學科、交叉領域的知識,構建大數據教學體系,是當前高校大數據專業建設面臨的問題。從新工科角度出發,對大數據教學體系建設中的人才培養要求、課程體系、教材體系和實踐教學體系進行了探討,并對當前一些政產教融合的探索進行了介紹,最后對促進大數據專業建設的關鍵點進行了討論。
關鍵詞:大數據;新工科;專業建設
論文引用格式:
王元卓, 于建業. 新工科背景下的大數據教學體系建設探析. 大數據[J], 2018, 4(6): 11-18
WANG Y Z, YU J Y. Construction of big data teaching system under the background of emerging engineering education. Big data research[J], 2018, 4(6): 11-18
1 引言
這是大數據的時代。從公司戰略到產業生態,從學術研究到生產實踐,從城鎮管理到國家治理,都將發生本質的變換,大數據將成為時代變革的力量。然而,這也是大數據人才短缺的時代。大數據市場發展迅猛,大數據人才供給嚴重不足。根據Boss直聘的數據顯示(Boss直聘《2018求職旺季人才趨勢報告》),在人才最為緊缺的前十個職位中,大數據、人工智能、算法類崗位占據了半壁江山,以大數據、人工智能為代表的新興技術崗位的薪資,無論是薪資基數、漲幅,還是發展空間,均高于其他崗位。
我國是人才大國,但能掌握和應用大數據技術的創新人才仍是稀缺資源,培養大數據人才成為緊迫的問題。近3年來,開設“數據科學與大數據技術”專業的高校數量猛增,已累計達到283所。雖然大數據人才的培養已開始起步,但是大數據人才培養模式與體系尚未達成共識。其原因在于大數據是一個跨學科、領域交叉、與行業應用緊密結合的復合型專業,涉及的知識往往來自于計算機、統計、行業領域等。如何有效地融合跨學科、交叉領域的知識,培養具備數據思維和計算思維的大數據人才,是當前高校大數據專業建設面臨的問題。
與此同時,為主動應對新一輪的科技革命與產業變革,支撐服務創新驅動等一系列國家戰略,2017年2月以來,教育部組織了多次新工科研討會,先后形成了 “復旦共識”“天大行動”“北京指南”等指導性文件,指出了新工科建設的5個“新”,即工程教育的“新理念”、學科專業“新結構”、人才培養“新模式”“新質量”和“新體系”。隨后,有學者對新工科的內涵進行了解讀和探討。“復旦共識”指出新工科建設和發展以新經濟、新產業為背景,一方面主動設置和發展新興工科專業,另一方面推動現有工科專業的改革創新。數據作為一種新興戰略資源,運用數據科學理論和大數據技術,將形成數據服務、數據探礦、數據化學、數據材料、數據制藥等一系列戰略性的新興產業。同時大數據也滲透到金融、醫療、制造、流通等工業領域,提升傳統行業的價值,促進傳統行業的升級。大數據作為新工科專業的重要方面,相對于傳統的工科人才,未來新興產業和新經濟需要的是實踐能力強、創新能力強、具備國際競爭力的高素質復合型新工科人才。因此,在國家推動新工科建設的背景下,大數據專業建設與發展正當其時。
2 新工科背景下的大數據教學體系建設
在面向新工科的大數據專業建設中,應遵循以學生為中心、成果為導向、持續改進的國際工程教育專業認證理念——以成果為導向的教學模式 (outcame based education,OBE),提升大數據人才的培養水平。教育體系應注重數據思維和計算思維的培養,課程設置與行業應用緊密結合,專業課程注重實踐能力的培養,而數據則成為實踐的基礎。
2.1 大數據人才素質與能力要求
大數據專業是一門涉及數據科學、計算機科學、大數據技術、行業應用等多領域的復合型交叉學科,培養的人才也是兼具行業應用專業知識和大數據技術的復合型人才。因此,在確定大數據專業的人才培養目標時,需確立大數據專業人才的基本素質和能力要求。
大數據專業人才培養基本目標如圖1所示,主要包括以下方面。
圖1?大數據專業人才培養基本目標
(1)多學科交叉融合的基礎素質
大數據人才培養涉及數據科學、計算機和行業應用等多學科領域知識,在基礎素質培養方面需要注重多學科交叉融合的素質培養,包括通識教育、語言能力、法律道德、計算機倫理、數學基礎等。
(2)復合型專業能力
大數據人才兼具數據科學、大數據技術和行業應用等多專業知識,具備復合型專業能力,包括行業應用基礎理論、數據科學基礎理論、行業應用數據技術、學習方法等。
(3)計算思維與數據思維
除了具有多學科交叉融合的基礎素質和復合型專業能力外,大數據人才還需要培養計算思維和數據思維,具備建模能力、求解能力、數據分析能力等。
(4)工程實踐能力
大數據技術是與行業應用緊密結合的實踐性很強的技術,大數據人才培養中也需要工程實踐能力的培養,包括案例教學、實習實訓等。
2.2 打造大數據課程體系
為了達到大數據人才所需的素質和能力培養要求,必須打造大數據人才培養的核心知識體系。大數據人才的知識體系主要由3個方面構成,包括基礎理論與方法、大數據計算技術、行業領域知識。盡管不同高校的大數據專業特色和面向的行業領域有所不同,大數據的內涵和外延也在不斷拓展,但是大數據專業的核心知識體系(即基礎理論與方法、大數據計算技術)是共通的,包括大數據管理、大數據處理、大數據分析等。在大數據核心知識體系的基礎上,結合高校自身的行業領域優勢和特色,重組并優化涵蓋行業知識的專業課程體系,使課程體系一貫化、教學內容融合化,包含面向低年級的通識教育與專業基礎教育、面向高年級的工程驅動的計算思維與應用驅動的工程能力培養。同時,數據思維的培養應當貫穿大數據人才培養的全過程。大數據課程體系設置思路如圖2所示。
圖2?大數據課程體系設置思路
為了實現大數據專業課程體系的一貫化和融合化,需要對多學科交叉知識進行融合,對傳統計算機、數學、信息管理等專業的核心課程進行梳理,并與高校自身特色行業應用課程融合,涉及大數據的基礎理論、計算機技術、智能計算方法和行業應用4個方面。根據以上思路,大數據課程體系設置如圖3所示。
圖3?大數據專業課程體系設置
大數據專業課程分為三大類:專業基礎課、專業核心課和專業選修課。專業基礎課涉及傳統的數學基礎課程、統計基礎課程和計算機專業基礎課程,需要對這些課程進行整合,以適應大數據專業的基礎知識需求。專業核心課則涉及大數據及行業領域的專業核心知識,可分為大數據基礎、核心技術、分析基礎以及大數據分析等大數據專業核心知識。專業選修課側重大數據技術實踐和行業領域應用,從大數據平臺技術、智能計算方法、大數據行業應用3個方面,突出計算思維和數據思維的專業知識應用和實踐能力教學。
2.3 建設大數據專業系列教材
當前我國高校的大數據教學尚處在摸索階段,尤其缺乏成熟的、系統性和規范性的大數據教學體系和教材。在此背景下,中國計算機學會(CCF)大數據專家委員會成立了大數據系列教材叢書編委會,由梅宏院士牽頭組織業內資深專家,著手編著系列化、規范化的大數據教材,并在2018中國計算機大會(CNCC2018)上首先發布。
大數據系列教材叢書由中國計算機學會大數據專家委員會組織編寫,采用“1+3+X”的體系,即以1本《大數據導論》為基礎,設置《大數據管理》《大數據處理》和《大數據分析》3本關鍵技術教材以及針對行業領域的X本應用教材。
(1)1本基礎導論教材
《大數據導論》介紹什么是大數據、大數據的感知與獲取、大數據的存儲與管理、大數據的計算架構、大數據分析計算平臺、大數據治理、大數據安全與隱私、大數據行業應用等。
(2)3本專業關鍵技術教材
● 《大數據管理》從數據模型與語言、大數據管理系統兩大方面介紹大數據的管理。
● 《大數據處理》從基礎技術篇到計算篇,再到進階篇,由淺入深地介紹大數據處理框架和技術。
● 《大數據分析》從大數據分析的基礎知識、理論基礎、相關算法、典型應用等層面詳細進行闡述。
(3)X本行業領域應用教材
行業應用層面瞄準當前產業界大數據應用較為廣泛的領域,組織編寫面向行業領域的X本應用教材。“X”系列教材既可面向工程實踐教學,又可面向職業培訓,并且將隨著產業界大數據應用的發展進行更新。
2.4 構建突出計算思維和數據思維的實踐創新教學體系
大數據專業應以應用驅動和面向行業領域的職業導向為抓手,在基礎教育和跨專業融合的基礎上,構建以計算思維和數據思維為專業能力的實踐創新教育體系,培養面向行業應用的大數據人才。在構建實踐創新教育體系時,重點突出計算思維和數據思維的專業能力,通過關鍵技術、實驗教學、實施案例、實習實訓等具有實踐創新的教育教學,培養大數據人才的工程能力。大數據技術具有很強的工程實踐性,大數據實踐教育實施的基本條件包括數據條件、師資條件、計算條件等。這些大數據人才培養的基礎條件,對于一般的高校而言通常難以實現,需要政產教緊密結合,依托高校所在地的優勢產業,政府給予政策與資金支持,建設大數據創新基地,面向行業領域提供真實場景、真實數據、計算資源、企業導師等。
在構建實踐創新教學體系過程中,要將大數據專業教師和學生“走出去”與企業技術導師“走進來”兩種模式結合:
● 學生通過在學校實訓或到企業實習等機會進行鍛煉,提升學生的實踐動手能力,未來更加契合企業的實際需求,同時幫助企業完成智力引進;
● 高校聘請企業技術專家到校開展實訓、技術指導、講學等,使學生能夠開拓專業視野;
● 高校在引入企業導師的同時,對大數據專業教師進行“雙師型”培訓,使高校教師了解大數據在行業的應用現狀等,并與基礎課程教學相融合。
3 政產教融合的大數據教育創新探索
國內高校在大數據相關專業的建設和發展上持續探索。在大數據實踐教學中,需要計算資源、數據資源等條件。這些條件需要大量資金、政策、真實數據的投入,對于高校而言,通常難以實現,需要政府提供政策、資金,企業提供真實場景、數據資源等,政、產、教資源融合才能實現以學生為中心、成果為導向的教育理念。目前國內一些地方政府、企業、高校已經開始政、產、教融合的探索與實踐。
● 產教融合的大數據教育創 新機制。教育部學校規劃建設發展中心于2016年5月正式啟動數據中國“百校工程”項目,提出構建“五位一體”大數據創新生態體系,旨在通過2~3年的努力,在全國范圍內遴選百所高校,部署集人才培養、資源開發、科研支撐、行業應用及社會服務于一體的“大數據應用創新中心”,與項目院校共同設立“大數據學院”,促進大數據產業、有關高校和科研機構的深度融合發展,打造大數據發展的創新生態系統,助力大數據人才培養、科技進步和產業發展。同時百校聯網形成“大數據應用協同創新網絡”,構建協同創新大數據超級平臺。百校聯網超級大數據平臺具有100 PB數據規模,50萬通用核和100萬流處理核計算能力,約有600名學術帶頭人和5 000名科研人員以及一批科研團隊。通過校企共建大數據學院,計劃培養10萬~20萬名大數據工程師,成為我國大數據發展戰略的重要支撐和服務力量。
● 政產教融合的大數據試驗場用以提供大數據人才培養的數據條件和計算條件。“大數據試驗場”是面向大數據問題設計的大數據技術研發和試驗驗證環境,擁有大規模數據容量及管理分析能力的重大基礎設施,服務于大數據研究開發和人才培養、基于大數據的科技與產業創新等。上海市已將大數據試驗場寫入大數據相關規劃,并推進相關建設。2016年12月,由復旦大學和上海交通大學共同牽頭,29家高等院校、研究所、企事業單位在上海聯合成立了全國首個大數據試驗場聯盟,共同打造大數據試驗場產業生態圈。
● 產教融合的阿里云大學高校實訓項目。將阿里云的云上計算實驗資源、行業實戰經驗與課程體系、高校理論知識融合,通過短期集中強化訓練,幫助學生深入理解專業知識的應用場景和應用技巧。該實訓項目由阿里云認證的企業導師負責實訓教學,實現真實案例、真實場景、真實檢驗,并在重慶大學和貴州理工學院成功實施。
4 對大數據專業教育教學體系建設的思考
大數據產業是戰略性新興產業,大數據專業的建設和發展也剛剛起步。大數據自身的特點使得大數據專業建設需要產業界、政府、高校多方合作,共同努力。除了大數據教育教學體系建設,還應當在如下方面加快建設步伐。
(1)加強政產教融合的大數據教育生態體系建設
當前國內大數據教育方興未艾,吸引了產業界、政府和高校的關注,但是大數據專業建設尚在探索,大數據教育的生態尚不完善。大數據教育生態體系的構建需要政、產、教等多方緊密合作,共同推進,包括大數據教材體系的建設、大數據專業建設、產教融合的大數據創新學院建設、政產教融合的大數據創新基地建設以及以人才質量為核心的人才評價體系建設。
(2)建設政產教融合的大數據創新基地
作為大數據教育生態的重要一環,大數據創新基地建設需要高校、企業、政府多方合作,高校投入師資與科研力量,政府投入政策與資金支持,企業投入定制化實訓課程、數據與平臺,探索政產教融合的共同培養大數據人才的新模式,幫助高校推進高水平師資隊伍建設、培養戰略性新型產業的專業集群、提升服務區域經濟能力;幫助地方培育大數據經濟智庫,促進本地人才與科研成果轉化;幫助企業提供大數據生態與大數據人才。
(3)加強大數據師資培訓
當前大數據師資力量相當缺乏,而師資是關系到大數據人才培養質量的關鍵之一。大數據師資建設需要優化知識結構和師資隊伍,加強大數據師資培訓力度,鼓勵教師到企業掛職等,了解企業大數據應用需求,熟悉大數據工程實踐,增加師資隊伍中“雙師型”教師比例等。
The authors have declared that no competing interests exist.?
作者已聲明無競爭性利益關系。?
作者簡介
王元卓(1978-),男,中國科學院計算技術研究所研究員、博士生導師,新工科聯盟大數據與智能計算工作委員會主任,中國計算機學會大數據專家委員會常務委員,主要 研究方向為網絡大數據分析、知識圖譜、社交網絡演化計算。
于建業(1981-),男,北京物資學院信息學院講師、碩士生導師,主要研究方向為知識圖譜、社交網絡演化計算。
《大數據》期刊
《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的中文科技核心期刊。
關注《大數據》期刊微信公眾號,獲取更多內容
往期文章回顧
基于公開數據的特殊人群在線活動特征挖掘
基于社會化大數據的音樂文化研究進展
結合深度學習的工業大數據應用研究
冒煙指數:大數據監測互聯網金融風險
大數據驅動5G網絡與服務優化
總結
以上是生活随笔為你收集整理的新工科背景下的大数据体系建设探析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【CyberSecurityLearni
- 下一篇: 【CyberSecurityLearni