《大数据、小数据、无数据:网络世界的数据学术》一 3.4 开放学术
3.4 開(kāi)放學(xué)術(shù)
隨著開(kāi)放獲取、開(kāi)放資源、開(kāi)放數(shù)據(jù)、開(kāi)放標(biāo)準(zhǔn)、開(kāi)放知識(shí)庫(kù)、開(kāi)放網(wǎng)絡(luò)、開(kāi)放書(shū)目、開(kāi)放注解等專(zhuān)業(yè)詞匯的出現(xiàn),“開(kāi)放”列表依舊不斷增加。正如第1章介紹的那樣,開(kāi)放獲取運(yùn)動(dòng)從19世紀(jì)70年代進(jìn)行至今。開(kāi)放獲取研究的發(fā)展旨在提高系統(tǒng)、工具和服務(wù)之間的互操作性機(jī)制。其與分布式計(jì)算網(wǎng)絡(luò)技術(shù)的進(jìn)步以及幾乎無(wú)所不在的互聯(lián)網(wǎng)接入,共同成就了今天的知識(shí)基礎(chǔ)設(shè)施,并將進(jìn)一步推動(dòng)其發(fā)展。
定義開(kāi)放學(xué)術(shù)的難度不亞于界定數(shù)據(jù)學(xué)術(shù),開(kāi)放學(xué)術(shù)幾乎等同于開(kāi)放科學(xué)。為方便討論,這里的開(kāi)放學(xué)術(shù)包括開(kāi)放獲取出版物、開(kāi)放數(shù)據(jù)、數(shù)據(jù)發(fā)布和數(shù)據(jù)共享相關(guān)的政策和實(shí)踐。開(kāi)放學(xué)術(shù)的目標(biāo)是加快研究速度,鼓勵(lì)提出新問(wèn)題、推動(dòng)調(diào)查方式創(chuàng)新,減少學(xué)術(shù)詐欺和不端行為,推動(dòng)技術(shù)和科學(xué)勞動(dòng)力增長(zhǎng),并利用公共投資推動(dòng)研究和教育事業(yè)發(fā)展(David,den Besten,and Schroeder 2010;Esanu and Uhlir 2004;Nielsen 2011;Boulton et al. 2012;Uhlir and Schr鰀er 2007)。
但是,開(kāi)放學(xué)術(shù)這種單一術(shù)語(yǔ)的使用,可能會(huì)模糊各開(kāi)放獲取形式間的本質(zhì)差異。本書(shū)的第三項(xiàng)挑戰(zhàn)指出,出版物和數(shù)據(jù)分別在學(xué)術(shù)活動(dòng)中發(fā)揮著不同作用,以下將進(jìn)一步闡述。開(kāi)放獲取出版物和開(kāi)放數(shù)據(jù)目標(biāo)相同,即促進(jìn)信息流動(dòng)、減少知識(shí)資源的使用限制、提高研究實(shí)踐透明度。二者的學(xué)術(shù)價(jià)值、利益相關(guān)者及其跨環(huán)境、隨時(shí)間的可移植性均有所差異。
3.4.1 開(kāi)放獲取研究成果
1665年第一批期刊出現(xiàn)后,學(xué)術(shù)活動(dòng)從私人領(lǐng)域的書(shū)信和會(huì)議形式轉(zhuǎn)變?yōu)楣_(kāi)傳播方式。讀者可以通過(guò)圖書(shū)館、書(shū)商和個(gè)人訂閱途徑獲取書(shū)籍、期刊和其他出版物。同時(shí),信件、草稿、手稿和預(yù)印本的私下交換方式依舊存在。
1991年,隨著arXiv的發(fā)布,開(kāi)放獲取研究成果取得了巨大飛躍。因?yàn)槌霈F(xiàn)在萬(wàn)維網(wǎng)之前,所以arXiv的原始地址為xxx.lanl.gov(Ginsparg 1994,2001)。在此后的20多年間,arXiv已擴(kuò)展到其他科學(xué)領(lǐng)域,從洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室搬到康奈爾大學(xué),并得到成員機(jī)構(gòu)的廣泛支持。其使用量呈指數(shù)形式持續(xù)增長(zhǎng)。目前,每月有8000多篇論文上傳到arXiv,且僅2012年的論文下載量就超過(guò)了6000萬(wàn)(ArXiv.org 2013)。
arXiv為今天的開(kāi)放獲取數(shù)據(jù)提供了三條重要經(jīng)驗(yàn)。首先,該系統(tǒng)的研究領(lǐng)域?yàn)楦吣芪锢韺W(xué),是活躍的預(yù)印本交流文化的產(chǎn)物。它建立在支持親近同事間進(jìn)行信息交換的知識(shí)基礎(chǔ)設(shè)施之上,這種基礎(chǔ)設(shè)施叫作無(wú)形學(xué)院(invisible colleges)(Crane 1972)。
其次,arXiv改變了物理學(xué)學(xué)術(shù)交流中作者、出版商、圖書(shū)館和讀者等利益相關(guān)者之間的關(guān)系,從而擾亂了現(xiàn)有知識(shí)基礎(chǔ)設(shè)施。無(wú)論國(guó)家富裕與否,研究人員和學(xué)生都能在官方發(fā)布出版物之前獲得論文。隨著arXiv的快速發(fā)展和廣泛應(yīng)用,物理學(xué)領(lǐng)域的期刊編輯和出版商除了接受它的存在之外,別無(wú)選擇。許多期刊之前不考慮在線發(fā)布論文,因?yàn)檫@樣的發(fā)布構(gòu)成了優(yōu)先出版(prior publication)。今天,許多領(lǐng)域仍有類(lèi)似政策。
最后,arXiv的成功并沒(méi)有很快或很好地遷移到其他領(lǐng)域。雖然其他領(lǐng)域的預(yù)印服務(wù)器規(guī)模和普及量均不斷加大,但沒(méi)有一個(gè)像arXiv那樣深入學(xué)術(shù)實(shí)踐中。arXiv目前已經(jīng)擴(kuò)展到物理、數(shù)學(xué)、天文學(xué)以及其他領(lǐng)域,但其并沒(méi)有深入每個(gè)領(lǐng)域的每個(gè)方面。在一些研究領(lǐng)域中,arXiv的使用無(wú)所不在。但在其他領(lǐng)域,它也只是偶爾發(fā)揮作用。
開(kāi)放獲取出版物在早期經(jīng)驗(yàn)的基礎(chǔ)上展開(kāi)。開(kāi)放獲取雖然是個(gè)簡(jiǎn)單概念,但由于利益相關(guān)者之間的競(jìng)爭(zhēng)性,其很容易被誤解。彼得·薩伯(Peter Suber 2012a,4)對(duì)該詞的定義最為簡(jiǎn)潔:“開(kāi)放獲取(Open Access,OA)文獻(xiàn)具有數(shù)字化、在線、免費(fèi)、大部分無(wú)版權(quán)和許可限制等特征。”薩伯隨后又指出,開(kāi)放獲取研究學(xué)術(shù)文獻(xiàn)和開(kāi)放獲取其他形式內(nèi)容的操作過(guò)程不同。開(kāi)放獲取文獻(xiàn)的原則之一為作者擁有作品版權(quán),除非或直到該權(quán)利被轉(zhuǎn)移到另一方(如出版商)。另一個(gè)原則是,學(xué)者寫(xiě)研究論文一般都不是為了獲取酬勞。在作品廣泛傳播的同時(shí),學(xué)者自己并不損失任何利益,但大部分其他作者、藝術(shù)家和創(chuàng)造者的收益往往會(huì)受到影響。學(xué)者寫(xiě)研究論文是為了提高影響力,而非收入。因此,他們希望可以盡可能接觸更多讀者以提高自身利益。學(xué)術(shù)研究的資金主要來(lái)源于學(xué)術(shù)工資和研究基金。學(xué)者的利益與雇傭、資助學(xué)者的機(jī)構(gòu)的利益相一致,因?yàn)樗麄兊某霭嫖镆部梢詮闹刑岣哂绊懥Α?br />開(kāi)放獲取文獻(xiàn)的實(shí)現(xiàn)方式多樣、監(jiān)管模式豐富,同時(shí)還有很多別稱(chēng)(如綠色、黃金、免費(fèi)、自由等)。這些模式的共同點(diǎn)是均基于上述兩個(gè)原則。作者通常會(huì)保留公開(kāi)傳播作品的版權(quán)或許可和作為作品創(chuàng)作者的其他權(quán)利。但一般情況下,對(duì)作者有直接收入的學(xué)術(shù)書(shū)籍、教科書(shū)和其他作品進(jìn)行開(kāi)放獲取時(shí),也會(huì)考慮一些其他問(wèn)題(Budapest Open Access Initiative 2002;Directory of Open Access Journals 2013;Howard 2013a;Jacobs2006;Laakso and Bj鰎k 2013;Leptin 2012;Pinter 2012;Research Councils UK 2013;Suber 2012a;Van Noorden 2013b;Wickham and Vincent 2013;Wilbanks 2006;Willinsky 2006)。
大約從2005年以來(lái),全世界越來(lái)越多的研究機(jī)構(gòu)對(duì)其研究人員的期刊出版物實(shí)行開(kāi)放獲取政策,如美國(guó)的哈佛大學(xué)、麻省理工學(xué)院、加利福尼亞理工學(xué)院和加利福尼亞大學(xué)(Harvard University 2010;MIT Libraries 2009;Caltech2013a;Office of Scholarly Communication 2013)。一般情況下,開(kāi)放獲取政策會(huì)授予高校非排他性許可,允許其將研究工作通過(guò)公共知識(shí)庫(kù)進(jìn)行傳播。開(kāi)放獲取出版物在2012年和2013年取得重大進(jìn)展。2012年,英國(guó)研究委員會(huì)(Research Councils of the United Kingdom,RCUK)宣布,受該機(jī)構(gòu)全部或部分資助的所有同行評(píng)審期刊論文和會(huì)議論文都將提交到開(kāi)放獲取期刊上。該政策于2013年4月起生效。由于爭(zhēng)議很大,因此政策中“開(kāi)放獲取期刊”的定義進(jìn)行了多次修改和解釋。“開(kāi)放獲取期刊”包括專(zhuān)有期、一系列商業(yè)模式以及一些臨時(shí)補(bǔ)貼(Research Councils UK 2012a,2012b)。2013年,美國(guó)政府行政部門(mén)對(duì)受聯(lián)邦基金資助的出版物宣布了一項(xiàng)類(lèi)似政策,即一般遵循由美國(guó)國(guó)家衛(wèi)生研究院和公共醫(yī)學(xué)中心(the National Institutes of Health and PubMed Central)規(guī)定的專(zhuān)有期和政策(Office of Science and Technology Policy 2013;Holdren 2013b)。歐盟、澳大利亞以及其他國(guó)家正在商討類(lèi)似政策。
各種各樣的政策、商業(yè)模式和出版物類(lèi)型使學(xué)術(shù)期刊文獻(xiàn)的公開(kāi)獲取途徑更加豐富。考慮到專(zhuān)有期,一年內(nèi)出版的期刊論文中約一半可以在網(wǎng)上免費(fèi)獲取,而且這一比例將進(jìn)一步增長(zhǎng)(Laakso et al.2011;Van Noorden 2013a)。雖然還有很多細(xì)節(jié)需要進(jìn)一步商榷,但開(kāi)放獲取期刊論文正逐漸成為一種制度。然而,利益相關(guān)者之間的緊張關(guān)系尚未得到緩解。部分作者依舊在網(wǎng)上發(fā)布不符合開(kāi)放獲取政策的文章、論文和其他作品,一些出版商對(duì)其具有獨(dú)家版權(quán)作品的相關(guān)開(kāi)放獲取政策表示不滿(Howard 2013b;SHERPA/RoMEO 2014)。
3.4.2 開(kāi)放獲取數(shù)據(jù)
許多資助機(jī)構(gòu)的開(kāi)放獲取數(shù)據(jù)政策都與開(kāi)放獲取出版物政策相關(guān)。英國(guó)的政策對(duì)這種關(guān)系進(jìn)行了清晰闡述(Research Councils UK2012b,1):“根據(jù)政務(wù)透明和開(kāi)放數(shù)據(jù)總戰(zhàn)略,政府致力于確保已發(fā)表的研究成果可以免費(fèi)獲取。”英國(guó)研究理事會(huì)關(guān)于開(kāi)放獲取期刊的政策要求作者說(shuō)明如何獲取出版物相關(guān)數(shù)據(jù),但同時(shí)承認(rèn)這種做法的復(fù)雜性(Research Councils UK2012b,4):“確保研究人員考慮數(shù)據(jù)獲取問(wèn)題……但是,本政策并不要求所有數(shù)據(jù)必須公開(kāi)。聲明指出,如果有足夠理由(如潛在包含參與者身份信息的數(shù)據(jù)具有商業(yè)機(jī)密性和法律敏感性)要求實(shí)現(xiàn)數(shù)據(jù)保護(hù)時(shí),可以有例外。”
美國(guó)國(guó)家衛(wèi)生研究院(National Institutes of Health,NIH)要求把受其資助的出版物存入公共醫(yī)學(xué)中心(PubMed Central),同時(shí)需要在項(xiàng)目申請(qǐng)書(shū)中加入數(shù)據(jù)管理計(jì)劃(Basken2012;National Institutes of Health 2013;PubMed Central 2009;Zerhouni2006)。美國(guó)國(guó)家科學(xué)基金(National Science Foundation,NSF)對(duì)數(shù)據(jù)管理計(jì)劃有要求,但對(duì)開(kāi)放獲取出版物沒(méi)有要求。然而,隨后美國(guó)聯(lián)邦政府發(fā)布的開(kāi)放獲取出版物相關(guān)政策將同樣適用于NSF、NIH和其他聯(lián)邦機(jī)構(gòu)。這些機(jī)構(gòu)平均每年在研發(fā)上投資1億多美元。該政策將指導(dǎo)每個(gè)機(jī)構(gòu)制定出科學(xué)出版物和數(shù)字科學(xué)數(shù)據(jù)的開(kāi)放獲取計(jì)劃(Holdren 2013b;Burwell et al. 2013)。
然而,開(kāi)放獲取期刊論文和開(kāi)放數(shù)據(jù)在薩伯(2012a)的兩條原則上均不相同。雖然作者至少最初是期刊論文的版權(quán)所有者,但該事實(shí)并不適用于數(shù)據(jù)。正如第9章深入探討的那樣,領(lǐng)域內(nèi)和領(lǐng)域間的數(shù)據(jù)歸屬權(quán)都是很有爭(zhēng)議的話題。該爭(zhēng)議一旦解決,作品“作者”就會(huì)擁有某些特定權(quán)利和責(zé)任。大多數(shù)合作都未探討過(guò)誰(shuí)有資格成為數(shù)據(jù)“作者”這一問(wèn)題(Wallis 2012)。即使將數(shù)據(jù)權(quán)限分配給個(gè)人和社區(qū),數(shù)據(jù)相關(guān)權(quán)責(zé)依舊不清晰。許多數(shù)據(jù)形式都是由學(xué)者創(chuàng)造和控制的,但是數(shù)據(jù)所有權(quán)卻是另一回事。某些數(shù)據(jù)形式不可能獲得版權(quán)。研究人員使用的數(shù)據(jù)多來(lái)自于其他利益相關(guān)者或公共資源池。人類(lèi)本身的機(jī)密記錄等數(shù)據(jù)由學(xué)者控制,而無(wú)法進(jìn)行發(fā)布。數(shù)據(jù)權(quán)利相關(guān)政策可能因機(jī)構(gòu)、資助機(jī)構(gòu)、合同、管轄權(quán)和其他因素而異。
薩伯的第二個(gè)原則指出,學(xué)者寫(xiě)期刊論文以及其他形式的出版物是為了提高影響力,而非收入。學(xué)者及其用人單位和資助者都有盡可能廣泛傳播出版物的動(dòng)力。但是,以上兩種情況均不適用于大多數(shù)數(shù)據(jù)。期刊論文經(jīng)處理后傳播給受眾,但數(shù)據(jù)卻很難從學(xué)術(shù)工作過(guò)程中提取出來(lái)。數(shù)據(jù)發(fā)布通常需要大量投入,而且這種投入量超過(guò)了研究和撰寫(xiě)出版物的行為成本。數(shù)據(jù)可以被視為職業(yè)生涯中積累的寶貴資產(chǎn)。因此,如果有數(shù)據(jù)的話,必須謹(jǐn)慎發(fā)布。
開(kāi)放獲取數(shù)據(jù)的治理模式剛剛興起,本書(shū)將在第4章和第10章對(duì)此展開(kāi)更全面的討論。由第1章中斯托曼的格言可知,英國(guó)研究理事會(huì)政策中的“freely accessible”一詞似乎更偏向于言論自由的意義,而非免費(fèi)啤酒的意義。解決任何普遍性問(wèn)題時(shí),都需要考慮公平性、效率性和可持續(xù)性(Hess and Ostrom 2007a)。目前,只有部分領(lǐng)域通過(guò)使用知識(shí)庫(kù)實(shí)現(xiàn)了數(shù)據(jù)的提煉、監(jiān)護(hù)和訪問(wèn),解決了公平和效率問(wèn)題。某些領(lǐng)域中,私人交換就能滿足數(shù)據(jù)需求,而其他領(lǐng)域則求助于研究型圖書(shū)館。在上述所有領(lǐng)域中,可持續(xù)性問(wèn)題依舊尚未解決。一些知識(shí)庫(kù)有長(zhǎng)期資金支持,而其他的只有短期支持。有些為所有人免費(fèi)提供數(shù)據(jù),而其他的只向?yàn)槠涮峁┵Y金的財(cái)團(tuán)成員提供數(shù)據(jù)。就像第8章討論的那樣,通過(guò)私下交易或研究團(tuán)隊(duì)網(wǎng)站發(fā)布方式進(jìn)行的數(shù)據(jù)共享只在短期內(nèi)有效。
因此,開(kāi)放數(shù)據(jù)與開(kāi)放獲取學(xué)術(shù)文獻(xiàn)截然不同。各領(lǐng)域至今尚未就數(shù)據(jù)“開(kāi)放”的涵義達(dá)成一致。彼得·默里-拉斯特(Peter Murray-Rust)和亨利·熱帕(Henry Rzepa)(2004)最早提出的開(kāi)放數(shù)據(jù)框架涵括了后來(lái)的大多數(shù)觀點(diǎn)。作為化學(xué)家,他們更關(guān)注自由訪問(wèn)以及結(jié)構(gòu)化數(shù)據(jù)的挖掘能力。算法可以通過(guò)分子等實(shí)體的表示識(shí)別出實(shí)體結(jié)構(gòu),當(dāng)實(shí)體用這種方式進(jìn)行表示時(shí),其就會(huì)成為可供挖掘、提取和操縱的數(shù)據(jù),也就更有用。當(dāng)相同分子僅用文本文件中的圖像進(jìn)行表示時(shí),就需要人工識(shí)別其結(jié)構(gòu)。在他們看來(lái),開(kāi)放數(shù)據(jù)是一種“數(shù)據(jù)文件”,其作用在于實(shí)現(xiàn)數(shù)據(jù)的機(jī)器可讀和自由訪問(wèn)。
在開(kāi)放知識(shí)基金會(huì)的支持下,默里-拉斯特等人提出了“開(kāi)放數(shù)據(jù)”簡(jiǎn)潔的法律定義:“一段數(shù)據(jù)或內(nèi)容開(kāi)放是指,在只有或至多滿足標(biāo)準(zhǔn)和(或)授權(quán)要求的條件下,所有人均可免費(fèi)使用、重用和重新分配它(Open Data Commons 2013)。”商業(yè)環(huán)境中的“開(kāi)放數(shù)據(jù)”定義更模糊:“開(kāi)放數(shù)據(jù)—政務(wù)數(shù)據(jù)等機(jī)器可讀信息以及他人可獲得的數(shù)據(jù)(Manyika et al. 2013)。”《經(jīng)濟(jì)合作與發(fā)展組織關(guān)于公共資金資助的研究數(shù)據(jù)獲取原則與指南》(Organisation for Economic Co-operation and Development 2007)在第13條原則中規(guī)定了開(kāi)放數(shù)據(jù)的框架,第8章將對(duì)這部分進(jìn)行說(shuō)明。英國(guó)皇家學(xué)會(huì)的報(bào)告《科學(xué):開(kāi)放的事業(yè)》(Boulton et al. 2012,14)將“開(kāi)放數(shù)據(jù)”定義為“滿足知識(shí)開(kāi)放標(biāo)準(zhǔn)的數(shù)據(jù)。數(shù)據(jù)必須具有可獲取、可使用、可評(píng)估和可識(shí)別特征。”生物醫(yī)學(xué)數(shù)據(jù)開(kāi)放的含義還包括成本效益權(quán)衡、數(shù)據(jù)發(fā)布的觸發(fā)定時(shí)機(jī)制、數(shù)據(jù)質(zhì)量確保方式、包含的數(shù)據(jù)范圍、保密性、隱私性、安全性、知識(shí)產(chǎn)權(quán)和管轄權(quán)(Boulton et al. 2011)。
開(kāi)放性可能會(huì)加速數(shù)據(jù)創(chuàng)造。比如,開(kāi)放獲取文本會(huì)使文本中的實(shí)體成為數(shù)據(jù)。文本挖掘技術(shù)可以對(duì)描述特定分子、天體、人、地點(diǎn)、事件或其他實(shí)體的所有文章或書(shū)籍進(jìn)行定位。從數(shù)據(jù)挖掘角度來(lái)看,出版物數(shù)據(jù)庫(kù)、數(shù)據(jù)檔案和數(shù)字書(shū)籍集合逐漸趨于相似(Bourne et al. 2011;Bourne 2005;Crane 2006; Murray-Rust et al. 2004)。但是,從知識(shí)產(chǎn)權(quán)的角度來(lái)看,它們卻完全不同,具體將在第4章進(jìn)行探討。
開(kāi)放數(shù)據(jù)還能夠?qū)⒀芯繉?duì)象的表示視為數(shù)據(jù),而且與研究對(duì)象本身是否公開(kāi)無(wú)關(guān)。研究對(duì)象的表示是出版物、數(shù)據(jù)集以及其他內(nèi)容的公開(kāi)標(biāo)簽或注釋。注釋和參考書(shū)目給描述對(duì)象賦予了價(jià)值,使其更容易被發(fā)現(xiàn)。共享注釋出現(xiàn)于數(shù)字化圖書(shū)館研究早期。目前,已經(jīng)產(chǎn)生了多種競(jìng)爭(zhēng)性的共享注釋方法。同時(shí),也有很多學(xué)者致力于提升注釋系統(tǒng)互操作性的標(biāo)準(zhǔn)化研究(Foster and Moreau 2006;Hunter 2009;Phelps and Wilensky 1997,2000)。ProCite、BiblioLink、RefWorks和EndNote等早期個(gè)人參考文獻(xiàn)管理工具,都基于本地存儲(chǔ)文件為單個(gè)作者提供服務(wù)。21世紀(jì)10年代初,研究人員開(kāi)始對(duì)網(wǎng)站、圖像、出版物和數(shù)據(jù)進(jìn)行標(biāo)記和注釋,并分享到Delicious和Flickr等社交網(wǎng)絡(luò)上。到21世紀(jì)10年代后期,個(gè)人參考文獻(xiàn)和開(kāi)放注釋逐步融合。Zotero、Mendeley和LibraryThing等其他工具可以共享參考文獻(xiàn)、標(biāo)簽和筆記。由于國(guó)家圖書(shū)館開(kāi)始發(fā)布開(kāi)放使用的編目記錄(Open Bibliography and Open Bibliographic Data 2013),因此開(kāi)放參考文獻(xiàn)運(yùn)動(dòng)獲得了巨大飛躍。隨著更多參考文獻(xiàn)記錄逐步公開(kāi)可用,參考文獻(xiàn)記錄成為待挖掘的數(shù)據(jù)之一。注釋工具帶來(lái)了數(shù)據(jù)類(lèi)型的與日俱增(Agosti and Ferro2007;Das et al. 2009;Kurtz and Bollen 2010;Renear and Palmer 2009;Rodriguez,Bollen,and Van de Sompel 2007)。
3.4.3 開(kāi)放技術(shù)
40余年來(lái),網(wǎng)絡(luò)技術(shù)逐漸從封閉向開(kāi)放過(guò)渡,而開(kāi)放學(xué)術(shù)正是其中一部分。互聯(lián)網(wǎng)的起源和發(fā)展軌跡在整個(gè)過(guò)渡中最為傳奇(Abbate 1999;Goldsmith and Wu2006;Kraut et al. 2002;Levien et al. 2005;MacLean 2004;O’Brien 2004;Odlyzko 2000;National Research Council 2001;Zittrain 2005)。人們普遍認(rèn)為,計(jì)算機(jī)網(wǎng)絡(luò)是政府出于研究和軍事目的而資助開(kāi)發(fā)的。從20世紀(jì)60年代末的第一次國(guó)際網(wǎng)絡(luò)互聯(lián)到90年代初的政策變化,互聯(lián)網(wǎng)僅通過(guò)政府合同供研究、學(xué)術(shù)和軍事團(tuán)隊(duì)使用。這種網(wǎng)絡(luò)被稱(chēng)為國(guó)家研究和教育網(wǎng)絡(luò)(National Research and Education Network,NREN)。計(jì)算機(jī)系統(tǒng)生命周期過(guò)程耗資較多,為了通過(guò)網(wǎng)絡(luò)對(duì)其實(shí)現(xiàn)共享,研究人員對(duì)原有的互聯(lián)網(wǎng)功能進(jìn)行了擴(kuò)展,具體包括電子郵件、文件傳輸以及其他類(lèi)似功能。為進(jìn)一步支持商業(yè)活動(dòng)、提供參考文獻(xiàn)數(shù)據(jù)庫(kù)等新型信息服務(wù),Telenet和Tymnet等并行式商業(yè)化分組交換網(wǎng)絡(luò)開(kāi)始給私營(yíng)企業(yè)提供商業(yè)通信(Borgman,Moghdam,and Corbett 1984;Borgman 2000)。
在國(guó)家信息基礎(chǔ)設(shè)施標(biāo)準(zhǔn)和全球信息基礎(chǔ)設(shè)施標(biāo)準(zhǔn)影響下,1993~1994年進(jìn)行的政策調(diào)整允許政府和商業(yè)機(jī)構(gòu)進(jìn)行網(wǎng)絡(luò)互聯(lián)。從此,商品互聯(lián)網(wǎng)誕生,通信網(wǎng)絡(luò)也完成了從國(guó)有或受保護(hù)系統(tǒng)到商業(yè)運(yùn)營(yíng)的轉(zhuǎn)變。互聯(lián)網(wǎng)宣稱(chēng)其為公共和私人實(shí)體提供的互聯(lián)和服務(wù)都具有“開(kāi)放”性。隨著萬(wàn)維網(wǎng)的首次展示和第一個(gè)瀏覽器界面的誕生,網(wǎng)絡(luò)逐漸趨于開(kāi)放。此后20年中,互聯(lián)網(wǎng)技術(shù)、功能和用戶群體均已遠(yuǎn)遠(yuǎn)超乎最初設(shè)計(jì)師的最大想象。但是,新型商業(yè)模式、利益相關(guān)者之間平衡關(guān)系的變遷以及安全和隱私中無(wú)法預(yù)見(jiàn)的挑戰(zhàn),均正在推動(dòng)基礎(chǔ)設(shè)施的再設(shè)計(jì)(Borgman 2000;Estrin et al. 2010)。
在開(kāi)放網(wǎng)絡(luò)中實(shí)現(xiàn)數(shù)據(jù)遷移與使已獲取數(shù)據(jù)可用完全不同。只有特定技術(shù)能讀取數(shù)字?jǐn)?shù)據(jù)和數(shù)字表示。數(shù)字?jǐn)?shù)據(jù)集的解釋需要以下內(nèi)容:生成數(shù)據(jù)的硬件,即傳感器網(wǎng)絡(luò)或?qū)嶒?yàn)室機(jī)器;數(shù)據(jù)編碼或分析軟件,即圖像處理工具或統(tǒng)計(jì)工具;以及整合以上內(nèi)容所需的協(xié)議和專(zhuān)業(yè)知識(shí)。技術(shù)發(fā)展非常迅速,在研究領(lǐng)域中更是如此。許多儀器產(chǎn)生的數(shù)據(jù)只能用特定軟件讀取。使用或重用數(shù)據(jù)時(shí),需要版本正確的軟件以及可能的其他儀器。許多分析工具具有專(zhuān)有性,因此數(shù)據(jù)分析可能產(chǎn)生特定格式的數(shù)據(jù)集,而這些與數(shù)據(jù)提取時(shí)的開(kāi)放程度無(wú)關(guān)。學(xué)者們經(jīng)常自己構(gòu)建工具,編寫(xiě)代碼來(lái)解決臨時(shí)問(wèn)題。雖然這種做法短期內(nèi)有效,但本地代碼和儀器很難進(jìn)行長(zhǎng)期維護(hù)。更何況學(xué)者們?cè)诮鉀Q臨時(shí)問(wèn)題時(shí),很少兼顧軟件工程的工業(yè)標(biāo)準(zhǔn)。本地工具具有靈活性和可適應(yīng)性,缺點(diǎn)是跨站點(diǎn)和跨情景的可移植性差(Easterbrook and Johns 2009;Edwards et al. 2013;Segal2005,2009)。
數(shù)據(jù)、標(biāo)準(zhǔn)和技術(shù)的開(kāi)放程度會(huì)影響數(shù)據(jù)在工具、實(shí)驗(yàn)室和合作伙伴之間以及隨時(shí)間的交換能力。標(biāo)準(zhǔn)可能改善社區(qū)內(nèi)的信息流動(dòng),但也可能在社區(qū)之間形成信息交流障礙。因?yàn)闃?biāo)準(zhǔn)可能不成熟或不適當(dāng),從而形成障礙,進(jìn)而阻礙創(chuàng)新。長(zhǎng)期以來(lái),系統(tǒng)和服務(wù)的技術(shù)互操作性一直是數(shù)字圖書(shū)館和軟件工程努力追求的目標(biāo)。互操作性允許部分?jǐn)?shù)據(jù)和利益相關(guān)者參與其中,而阻止其他對(duì)象進(jìn)入。與技術(shù)本身相比,政策、實(shí)踐、標(biāo)準(zhǔn)、商業(yè)模式和既得利益往往是決定互操作性的更重要的因素(Brown and Marsden 2013;Busch 2013;DeNardis 2011;Lampland and Star 2009;Libicki 1995;Palfrey and Gasser 2012)。
總結(jié)
以上是生活随笔為你收集整理的《大数据、小数据、无数据:网络世界的数据学术》一 3.4 开放学术的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: PAT乙级-1070. 结绳(25)
- 下一篇: 白洁血战Node.js并发编程 01 状