【2017年第2期】专题:大数据管理与分析
導讀
大數(shù)據(jù)為什么這么“火”?不是因為數(shù)據(jù)量的“大”,也不是因為大數(shù)據(jù)處理技術(shù)的“新”,最根本的原因是大數(shù)據(jù)所蘊含的巨大價值。大數(shù)據(jù)作為一種新的科研方法,已經(jīng)在數(shù)學、物理、工程乃至社會及經(jīng)濟等領(lǐng)域展示了其獨特的魅力。大數(shù)據(jù)分析作為一種工具,廣泛用于輔助各行各業(yè)的決策。有人將大數(shù)據(jù)比喻為現(xiàn)代信息社會的“石油”,也有人將其比喻為推動信息社會發(fā)展的“動力”,意思都一樣,都認可大數(shù)據(jù)具有非常大的價值。
2016年貴陽數(shù)博會期間舉行的第一屆大數(shù)據(jù)科學與工程國際會議“大數(shù)據(jù)管理與分析”高峰論壇,邀請了學者專家就大數(shù)據(jù)管理與分析的話題進行討論。受現(xiàn)場熱情聽眾和編輯部的鼓勵,我們邀請演講人結(jié)合他們的演講內(nèi)容再次整理成文,以饗讀者。大部分演講人都非常支持,及時寄來了他們的稿件。對此,我們深表感謝。我根據(jù)現(xiàn)場討論的情況,覺得有必要對大數(shù)據(jù)分析這個概念進行梳理,專門撰寫了一篇論文,也放在這一專題中。
周傲英的《感悟大數(shù)據(jù)——從數(shù)據(jù)管理和分析說起》,闡述了作者作為一位數(shù)據(jù)庫學者對“大數(shù)據(jù)”概念、“大數(shù)據(jù)”國家戰(zhàn)略、“互聯(lián)網(wǎng)+” 行動計劃等的深刻理解。論文在大數(shù)據(jù)語境下,重提數(shù)據(jù)庫理念,試圖從理解數(shù)據(jù)管理的發(fā)展趨勢中把握大數(shù)據(jù)技術(shù)發(fā)展的新機遇。作者對于IT發(fā)展范型的變化,有著獨到的見解,很受啟發(fā)。論文還介紹了作者近5年來領(lǐng)導研發(fā)的3個數(shù)據(jù)管理系統(tǒng)。
杜小勇和陳躍國的論文《大數(shù)據(jù)的價值發(fā)現(xiàn)方法》對大數(shù)據(jù)分析這個概念進行了進一步的解構(gòu),總結(jié)了從大數(shù)據(jù)中發(fā)現(xiàn)價值的3種基本途徑,即數(shù)據(jù)服務、數(shù)據(jù)分析與數(shù)據(jù)探索,并對它們的特點進行了分析和對比,為大數(shù)據(jù)分析展示了更清晰的圖景。
基于大數(shù)據(jù)的決策支持是大數(shù)據(jù)分析最重要的應用之一。然而,大數(shù)據(jù)分析結(jié)果是否可靠?這是人們普遍關(guān)心的問題。黃錦輝的論文《開發(fā)商業(yè)智能應用 小心大數(shù)據(jù)“陷阱”》探討了大數(shù)據(jù)中的可能“陷阱”和其引發(fā)的社會危害,并結(jié)合面向社交文本大數(shù)據(jù),提出了一種智能應用系統(tǒng)框架,以有效規(guī)避大數(shù)據(jù)中的“陷阱”,并自動提取有用信息,論文展示了作者近些年在該框架的指導下,在社交媒體上的事件檢測、自動摘要和謠言檢方面的研究成果。王騰蛟和李喜蓮的論文《讓大數(shù)據(jù)分析更可信》也對大數(shù)據(jù)可信性問題進行了討論,提出了與該問題緊密相關(guān)的3個挑戰(zhàn)的科學問題,即數(shù)據(jù)源的選擇、數(shù)據(jù)抽樣方法以及大數(shù)據(jù)工程。
邵鎣俠、馮是聰的論文《社交網(wǎng)絡分析在公共安全領(lǐng)域的應用》介紹了大數(shù)據(jù)分析技術(shù)在公共安全領(lǐng)域的應用。公共安全領(lǐng)域的重要工作對象就是人和人之間錯綜復雜的關(guān)系,社交網(wǎng)絡收集的數(shù)據(jù)無疑是大數(shù)據(jù),社交網(wǎng)絡分析技術(shù)能給該領(lǐng)域的日常工作帶來新的分析視角。論文所描述的具體大數(shù)據(jù)分析技術(shù)和應用實例生動具體,很有參考價值。
大數(shù)據(jù)分析作為一類新的應用需求,對于大數(shù)據(jù)的管理無疑會帶來新的挑戰(zhàn)和問題,對于關(guān)心數(shù)據(jù)庫技術(shù)的研究者來說,這是一個才剛剛興起的處女地,值得關(guān)注。大數(shù)據(jù)分析作為一種工具也必將隨著應用的不斷深入而獲得發(fā)展。從這個意義上講,本專題討論的話題正當其時,期待今后有更深入的成果呈現(xiàn)給讀者。
客座編輯:杜小勇(1963?),中國人民大學信息學院教授,博士生導師,教育部數(shù)據(jù)工程與知識工程重點實驗室主任,中國計算機學會會士,《大數(shù)據(jù)》期刊編委會副主任。主要研究方向為智能信息檢索、高性能數(shù)據(jù)庫、知識工程。主持和參與多項國家核高基(核心電子器件、高端通用芯片及基礎(chǔ)軟件產(chǎn)品)、“973”計劃、“863”計劃、國家自然科學基金項目,近年來在SIGMOD、VLDB、AAAI、IEEE TKDE等國際重要期刊和會議上發(fā)表論文百余篇。
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎總結(jié)
以上是生活随笔為你收集整理的【2017年第2期】专题:大数据管理与分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux_unix编程手册--信号处理
- 下一篇: 信号的高级特性-核心转储文件