精选| 2021年6月R新包推荐(第55期)
翻譯:黃小偉,資深大數據分析從業者。目前就職杭州有贊數據分析團隊!
知乎專欄:中國R語言社區、R語言中文社區?|26,000+關注、150萬+閱讀
知乎圈子:數據分析圈|11,000+加入
崗位招聘:急招|高級數據分析師、數據分析專家
2021年6月,197個R新包收錄于CRAN(2021年5月份收錄205個),累計收錄約19,285個R包!此次選摘了40個R包(10個類別),分布結構如下:
一. 計算方法
1.?disordR: 提供用于操作以任意順序存儲的關聯映射值的工具.
2.?ICvectorfields: 提供使用數字圖像相關技術將光柵格式的空間、密度數據時間序列轉換為人口流動矢量場的功能.
3.?rim: 提供計算機代數系統 Maxima 的接口,其中包括從 R 中運行 Maxima 命令、在 LaTeX 和 MathML 以及 R Markdown 中生成輸出.
二. 數據
1.?PlanetNICFI: 提供使用 Planet Mosaics API 下載、處理來自挪威國際氣候和森林倡議的 Planet NICFI 衛星圖像的功能.
2.?rgovcan: 支持對加拿大開放政府門戶網站提供的數據和其他資源的訪問.
3.?wcde: 提供維特根斯坦人力資本數據瀏覽器的接口.
三. 金融
1.?etrm: 提供在能源交易和風險管理中執行核心任務的功能,包括計算具有流量的電力和天然氣合同的最大平滑度遠期價格曲線,如 Benth 等人所述?(2007) 和 Black (1976) 中描述的遠期市場價格風險管理的投資組合保險交易策略.
2.?mshap: 根據 Matthews & Hartman (2021) 提出的使用 Lundberg 等人中描述的 TreeSHAP 算法的建議,提供在two-part模型上計算 mSHAP 值的函數.
四. 基因組學
1.?harmony: 實現 Korsunsky 等人描述的用于單細胞整合的The Harmony Algorithm?(2019).
五.?機器學習
1.?AutoScore: 實施可解釋的機器學習框架,以自動開發預定義結果的臨床評分模型.
2.?daiR: 為 Google Cloud Services Document AI API 實現一個接口,并帶有用于輸出文件解析和文本重建的附加工具.
3.?luz: 實現 Torch 的高級接口,提供實用程序以減少常見任務所需的代碼量,抽象出 Torch 細節并使相同的代碼在 CPU 和 GPU 上工作.
4.?mcboost: 實現多校準提升和多精度提升,以對機器學習模型的預測進行多校準.
5.?RFpredInterval: 使用隨機森林和提升森林實現各種預測區間方法.
六. 醫藥領域
1.?aldvmm: 適用于健康狀態效用調整有限因變量混合模型,即正態分布的有限混合.
2.?clinDataReview: 提供創建交互式表格、列表和圖表以及相關報告的功能,以便在臨床試驗環境中進行探索性分析.
3.?clinUtils: 提供實用功能以輔助導入、探索和報告臨床數據以及 SDTM 和 ADaM 格式的數據集.
4. inTextSummaryTable: 提供為 TLF 的臨床數據創建匯總統計表或計數表的功能。這些表格可以導出為 MS Word 格式的臨床研究報告的文本表格或演示文稿的 MS PowerPoint 格式,或作為交互式表格.
5.?patientProfilesVis: 提供創建患者特定配置文件可視化的功能,用于臨床試驗期間的探索、診斷或監測目的,可顯示實驗室測量值、ECG 數據、生命體征、不良事件等參數的演變.
6.?RHRT: 提供掃描早發性心室復合體的 RR 間期數據并參數化和繪制由此產生的心率湍流的方法.
7.?visR: 提供基于圖形原理生成具有合理默認值的臨床圖形和表格的功能,如 Vandemeulebroecke 等人所述(2018 年),Vandemeulebroecke 等人?(2019) 和莫里斯等人?(2019).
七.?統計領域
1.?admix: 實現了幾種方法來估計與雙組分混合模型相關的未知量,其中兩個組分可以屬于任何分布.
2.?ahMLE: 實現了擬合Additive Hazards Model的方法,包括最大似然法和 Aalen 估計Additive Hazards Model的方法.
3.?bayesrules: 提供用于在線貝葉斯規則手冊中的分析和可視化的數據集和函數.
4. dbglm: 支持在中等規模的數據集上擬合廣義線性模型,方法:獲取初始樣本并在內存中擬合,然后評估數據庫中完整數據的得分函數.
5.?fasano.franceschini.test: 實施 Fasano & Franceschini (1987) 中定義的二維 Kolmogorov-Smirnov (KS) two-sample檢驗.
6.?flatness: 提供 S3 類、繪圖函數、指數和測試來分析直方圖的平坦度,包括 Jolliffe & Primo (2008) 中引入的平坦度測試函數、Wilks (2019) 中描述的平坦度指數,及 Benjamini 和 Hochberg 中描述的多重假設過程 (1995).
7.?outlierensembles: 提供用于檢測異常值和異常的集成函數,包括基于 Kandanaarachchi (2021) 中描述的項目響應理論的新方法和 Schubert 等人描述的方法(2012),蔣等人(2017 年)以及 Aggarwal 和 Sathe(2015 年).
8. susieR: 如 Wang 等人 (2020) 所述,基于單效應總和模型實現線性回歸中的變量選擇方法。迭代貝葉斯逐步選擇算法允許將模型擬合到具有數千個樣本和數十萬個變量的大型數據集.
八. 時間序列
1.?psdr: 提供在給定時間序列數據的情況下,生成、比較功率譜密度圖及比較多組時間序列主要頻率的函數.
2.?proteus:?基于不同分布,實現了一種用于時間特征分析的序列間變分模型.
九. 應用工具
1.?archive: 實現與 libarchive 的綁定,這是一個多格式存檔和壓縮庫,它為許多存檔格式提供連接和直接提取,包括 tar、ZIP、7-zip、RAR、CAB 和壓縮格式,包括 gzip、bzip2、compress、lzma 和 xz.
2.?pasadr: 實現了 Aoudi 等人?(2018)中描述的異常檢測方法.
3.?recogito: 提供與 recogito 和 annotorious 庫的 htmlwidgets 綁定,以注釋圖像中感興趣的文本和區域.
4.?rextendr: 提供從 R 編譯和加載 Rust 代碼的函數以及幫助函數來創建使用 Rust 代碼的 R 包.
5. shinymeta: 提供用于捕獲Shiny應用程序中的邏輯并將其公開為可在Shiny外部運行的代碼(例如,從R控制臺)的工具。還提供了將代碼和結果捆綁到最終用戶的工具.
十. 可視化
1.?dynplot: 提供將單個細胞軌跡可視化為圖形或樹狀圖的函數.
2.?gridpattern: 提供網格抓取以使用各種圖案填充用戶定義的繪圖區域,包括基于幾何和圖像的圖案,并支持自定義用戶定義的圖案.
3.?netplot: 實現了一個圖形可視化引擎,該引擎強調美感,同時提供默認參數,產生開箱即用的可視化效果.
4.?NGLVieweR: 實現 NGL.js 的 htmlwidgets 接口,使用戶能夠在 R 和 Shiny 應用程序中可視化蛋白質數據庫 PDBand 結構文件并與之交互.
5.?precisePlacement: 提供一系列工具,可以更輕松地將元素放置在?R 圖中您想要的位置.
說明:限于個人水平,錯誤之處難免,煩請批評指正,共同交流~
https://rviews.rstudio.com/2021/07/26/june-2021-top-40-new-cran-packages/
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的精选| 2021年6月R新包推荐(第55期)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用matlab编译器生成EXE文件
- 下一篇: 为什么matlab生成的exe文件只能在