IBM 推出开源工具,助力 COVID-19 数据分析
IBM 開源數據和 AI 技術中心(CODAIT)推出了一個新工具包 covid-notebooks,該工具包可幫助開發人員和數據科學家回答有關大流行的問題。
covid-notebooks 旨在幫助完成以下任務:
- 獲得有關爆發當前狀態的權威數據,
- 清除最嚴重的數據質量問題,
- 將數據整理成易于使用 Pandas 和 Scikit-Learn 等工具進行分析的格式,
- 以及構建一組初始的示例報告和圖形。
IBM 方面表示,處理好這些任務,開發人員和數據科學家就可以解放出來,專注于高級分析和建模任務,而不用擔心數據格式和數據清理等問題。該存儲庫使用開發者友好的 Jupyter notebook 來涵蓋每個初始數據分析步驟。
此外還使用 Elyra Notebook Pipelines Visual Editor 和 KubeFlow Pipelines 創建了數據處理管道。示例如下:
這些管道使用戶只需單擊一個按鈕即可重新運行整個提取、轉換、分析工作流程。“我們資源庫中的工具使用權威來源,得出決策者可用于做出實時、關鍵決策的綜合見解。“
IBM 開源數據中心和 AI 中心首席架構師 Frederick Reiss 表示:“對于正在分析 COVID-19 的影響并試圖根據數據提出可行計劃的數據科學家和決策者來說,相關信息可以說是鋪天蓋地。來自研究報告、新聞媒體、社交媒體和健康組織的數據幾乎源源不斷,這使得將數據分析為有用的行動的任務幾乎不可能完成。開發人員和數據科學家需要回答他們關于數據來源、工具以及如何從不斷變化的數據中得出有意義的、統計上有效的結論的問題。”
總結
以上是生活随笔為你收集整理的IBM 推出开源工具,助力 COVID-19 数据分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 良人是谁唱的啊?
- 下一篇: 国产Model 3性能规格公布 高性能版