R语言观察日志(part23)--bibliometrix包
R語言文獻計量分析筆記
參考文獻:如何用 R 快速了解科研領域?; BiblioShiny使用介紹; R語言快速實現文獻計量分析
GitHub:https://github.com/massimoaria/bibliometrix
biblioshiny教程:http://bibliometrix.org/biblioshiny/assets/player/KeynoteDHTMLPlayer.html
文章目錄
- bibliometrix
- 描述
- 安裝
- 數據
- 提示
- 開始分析
- How to use ?
- 作者研究
- 文獻研究
- 主題研究
- 未來展望
bibliometrix
描述
Bibliometrix軟件包為文獻計量學和科學計量學的定量研究提供了一套工具。
它提供了從’SCOPUS’ (https://scopus.com)、‘Clarivate Analytics Web of Science’ (https://www.webofknowledge.com/)、‘Digital Science Dimensions’ (https://www.dimensions.ai/)、“Cochrane Library”(https://www.cochranelibrary.com/)和“PubMed”(https://pubmed.ncbi.nlm.nih.gov/)數據庫,進行文獻計量分析,構建共被引、耦合、科學合作和共詞分析網絡。
Bibliometrix支持學者在三個關鍵的分析階段:
- 數據導入及轉換為R格式;
- 出版物數據集的文獻計量分析;
- 為co-citation, coupling, collaboration 和 co-word分析建立和繪制矩陣。矩陣是執行網絡分析、多重對應分析和任何其他數據約簡技術的輸入數據。
安裝
我們運行以下代碼塊,安裝包,并導入包:
install.packages("bibliometrix", dependencies=TRUE) #bibliometrix library(bibliometrix) biblioshiny()注意,dependencies默認為FALSE,設置為TRUE就是下載bibliometrix包時順便下載并安裝bibliometrix包的依賴包。
如果不設置為TRUE(就像我第一次下載那樣),執行biblioshiny()時就可能出現沒有"withSpinner"這個函數的錯誤.
好的,我將dependencies設置為TRUE,并重新裝以下bibliometrix,導入包,并執行biblioshiny()打開biblioshiny(針對非編碼者的bibliometrix,為bibliometrix提供web界面的應用程序):
數據
以下摘自知乎學習導讀:
我是做信息科學的。出于近便原則,本文的樣例分析對象,是信息科學領域的一份權威期刊:Management Information Systems Quarterly (下文簡稱 MIS Quarterly)。
注意你在分析的時候,并不需要局限在某一本或者幾本期刊。完全可以使用關鍵詞搜索相關文獻。
MIS Quarterly 的文獻數據,我是從 Web of Science 下載的。
我對結果進行了精煉,只選擇了其中的 Articles 類型。
一共 743 篇文章,導出選擇的格式,為 BibTex 。
因為 Web of Science 每次導出記錄數量,不能超過500,因此前后下載了2個 BibTex 格式文件。
我把它們打包成了一個 zip 文件(Archive.zip)。這個文件,我為你放在了這個位置(http://t.cn/EPIs99X)。你可以直接下載使用。
如果你希望自己從 Web of Science 下載文獻記錄,可以參考我的研究生吳查科和同學合作的這份視頻教程(http://t.cn/EPIsjtk)。教程是關于 VosViewer 的。但其中4分鐘以后,就有 Web of Science 文獻記錄檢索和導出的完整介紹與展示。
(以下為GoatBishop言)
看完知乎上的導讀,我把他提供的數據放到了我的藍奏云上方便大家下載,密碼為rrrr
提示
最近我上web of science的時候,發現他網頁更新了:
Export下拉菜單里的內容也與舊版有點不同,我試了試,點擊Plain text file,按照如下操作導出txt文件,并將txt文件打包為zip 文件(Archive.zip),也是可以在bibliometrix中進行分析的:
開始分析
- 在biblioshiny中導入下載的文獻信息。
為了方便起見,我將下載下來的Archive.zip放在我的桌面,在biblioshiny界面的導航欄中,選擇 Data 下拉菜單,再點擊Import or Load files:
出現以下界面:
進行以下設置:
備注:知乎文章上選擇的是,但是現在的選項里沒有,在網上查了一下Web of Knowledge與Web of Science的關系:Web of Knowledge與Web of Science之間是什么關系?
點擊 Start,可以看到,界面中間出現了加載動畫:
等待一會,導入完畢后,展示結果列表如下:
How to use ?
作者研究
如果我們想查看最高產作者,可以點擊 Authors下拉菜單,再點擊 Most Relevant Authors :
此時就會出現如下界面:
其中,Fractionalized Frequency是作者對于論文的貢獻率:
點擊Apply!,進入 Table選項卡,可以看到我們想要的結果:
備注:Authors下拉菜單的其他選項的意思為:
Most Local Cited Sources:高被引期刊(當前文獻集)
Author’s Production over Time:高產作者近期發文
Lotka’s law:洛特卡定律(核心作者)
Author Impact:作者影響因子
Most Relevant Affiliations:最高產機構
Corresponding Author’s Country:合著作者的國籍
Country Scientific Production:各個國家發文量
Most Cited Countries:高被引國家以及被引次數
文獻研究
我們查看在web of science中被引文獻的情況,點擊 Documents下拉菜單中的 Most Global Cited Documents:
此時就會出現如下界面:
點擊Apply!,進入 Table選項卡,可以看到我們想要的結果:
備注: Documents下拉菜單的其他選項的意思為:
Most Local Cited Documents:在當前數據集中高被引文獻
Most Local Cited References:在當前數據集中高被引的參考文獻
Reference Spectroscopy:每年參考文獻的數量
Most Frequent Words:高頻詞
WordCloud:詞云
TreeMap:樹圖
Word Dynamics:詞出現次數,展示詞變化趨勢
Trend Topics:根據今年詞出現頻次推測熱點話題
主題研究
如果我們想知道哪些主題更值得研究,可以通過詞云圖,直觀的得到想要的信息,點擊document下拉菜單中的worldcloud:
我們在左側的Field選項中,選擇 Author Keywords 即作者自己列出的關鍵詞,并進行一些列自定義設置,最后點擊Apply!:
點擊 Conceptual Structure 下拉菜單,選擇其中的Factorial Analysis把主題歸類一下:
這里我就不更改左側的參數選項了,點擊左側 Apply!,得到詞匯地圖:
由結果可知,我們大概可以把研究關注點聚焦在兩個類別上,并且可以知道每個類別是如何被關鍵詞描述的。
未來展望
我們可以通過繪制主題地圖(Thematic Map),分析未來哪些主題可能會有長遠發展:
主題地圖中,橫軸代表中心度(Centrality),縱軸代表密度(Density),并據此繪制出4個象限:
- 第一象限(右上角):motor-themes,既重要,又已有良好發展(well-developed);
- 第二象限(左上角):Niche themes,已有良好發展,但是對于當前領域不重要;
- 第三象限(左下角):emerging or disappearing themes,邊緣主題,也沒有好的發展,可能剛剛涌現,也許即將消失;
- 第四象限(右下角):basic themes,對領域很重要,但是未獲得良好發展。一般是指基礎概念。
隨著時間變化,可以研究主題演化過程:
在biblioshiny中的具體操作為,點擊 Conceptual Structure 下拉菜單中的 Thematic Map:
在左側進行一些設置,并點擊 Apply!:
總結
以上是生活随笔為你收集整理的R语言观察日志(part23)--bibliometrix包的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 文献记录(part82)--基于监督联合
- 下一篇: flash怎么放大缩小图片并改变中心位置