送书《R语言数据分析和可视化》 | 这个为生信学习和生信作图打造的开源R教程真香!!!...
生物信息學習的正確姿勢
NGS系列文章包括NGS基礎、在線繪圖、轉錄組分析?(Nature重磅綜述|關于RNA-seq你想知道的全在這)、ChIP-seq分析?(ChIP-seq基本分析流程)、單細胞測序分析?(重磅綜述:三萬字長文讀懂單細胞RNA測序分析的最佳實踐教程)、DNA甲基化分析、重測序分析、GEO數據挖掘(典型醫學設計實驗GEO數據分析 (step-by-step))、批次效應處理等內容。
點擊閱讀原文跳轉完整教案。
1 思考題
2 R基礎
2.1 R安裝
2.2 Rstudio基礎
2.2.1 Rstudio版本
2.2.2 Rstudio安裝
2.2.3 Rstudio 使用
2.3 R基本語法
2.3.1 獲取幫助文檔,查看命令或函數的使用方法、事例或適用范圍
2.3.2 R中的變量及其初始化
2.3.3 變量類型和轉換
2.3.4 R中矩陣運算
2.3.5 R中矩陣篩選合并
2.3.6 str的應用
2.3.7 R的包管理
2.4 ggplot2繪圖
2.4.1 數據格式轉換和字符串處理
2.4.2 配色
2.4.3 pheatmap繪制熱圖
3 R plots
3.1 qplot繪制圖形 (王緒寧)
3.2 熱圖繪制
3.2.1 生成測試數據
3.2.2 轉換數據格式
3.2.3 分解繪圖
3.2.4 圖形存儲
3.3 熱圖美化
3.3.1 對數轉換
3.3.2 Z-score轉換
3.3.3 抹去異常值
3.3.4 非線性顏色
3.3.5 調整行或列的順序
3.4 熱圖繪制 - pheatmap
3.5 聚類熱圖如何按自己的意愿調整分支順序?
3.5.1 數據示例
3.5.2 繪制一個聚類熱圖很簡單
3.5.3 如何自定義分支順序呢
3.5.4 人為指定順序排序樣品
3.5.5 按某個基因的表達由小到大排序
3.5.6 按某個基因的表達由大到小排序
3.5.7 按分支名字(樣品名字)的字母順序排序
3.5.8 梯子形排序:最小的分支在右側
3.5.9 梯子形排序:最小的分支在左側
3.5.10 按特征值排序
3.6 箱線圖
3.6.1 一步步解析箱線圖繪制
3.6.2 繪制單個基因 (A)的箱線圖
3.6.3 長矩陣繪制箱線圖
3.7 線圖
3.7.1 單線圖
3.7.2 多線圖
3.7.3 橫軸文本線圖
3.8 散點圖
3.8.1 橫縱軸都為數字的散點圖解析
3.8.2 橫縱軸都為字符串的散點圖展示
3.9 功能富集泡泡圖
3.9.1 單樣品分開繪制
3.9.2 多樣品合并繪制
3.10 韋恩圖
3.10.1 韋恩圖三個圈
3.10.2 韋恩圖五個圈
3.10.3 UpSetView展示
3.11 柱狀圖繪制
3.11.1 常規矩陣柱狀圖繪制
3.11.2 長矩陣分面繪制
3.12 圖形支持中文字體
3.12.1 修改圖形的字體
3.12.2 ggplot2支持中文字體輸出PDF
3.12.3 系統可用字體
3.12.4 合并字體支持中英文
3.12.5 一個示例
3.13 PCA原理解析和圖形繪制
3.13.1 主成分分析簡介
3.13.2 主成分分析的意義
3.13.3 示例展示原始變量對樣品的分類
3.13.4 PCA的實現原理
3.13.5 簡單的PCA實現
3.13.6 PCA結果解釋
3.13.7 PCA應用于測試數據
3.13.8 PCA注意事項
3.13.9 參考資料
3.14 生存分析
3.14.1 R做生存分析
3.15 一步作圖的優勢
3.16 不改腳本的熱圖繪制
3.16.1 箱線圖 - 一步繪制
3.16.2 線圖 - 一步繪制
3.16.3 一網打進散點圖繪制
4 網絡圖
4.0.4 基本操作
4.0.5 miRNA-mRNA調控網絡
4.0.6 不同的布局的調試和修改
5 圖形排版
6 高通量數據中批次效應的鑒定和處理
6.1 什么是批次效應?
6.2 批次效應會有什么影響?
6.3 怎么確認數據有無受到批次效應影響
6.4 怎么避免批次效應呢?
6.5 如何在差異基因鑒定過程中移除批次效應
6.5.1 不考慮批次因素直接進行差異基因分析
6.5.2 考慮已知的批次因素進行差異基因分析
6.5.3 比較批次校正前后差異基因變化
6.6 批次效應未知時如何判斷和在差異基因鑒定過程中移除批次效應
6.6.1 預測混雜因素(cofounding factors)并在差異基因分析中移除這些因素
6.6.2 預測可能存在的混雜因素
6.6.3 比較批次校正前、已知批次校正后和預測的批次校正后差異基因變化
6.6.4 直接校正表達矩陣
6.6.5 ComBat_seq直接校正Count matrix
6.6.6 怎么從FASTQ數據中獲得測序設備和批次相關信息
6.6.7 如何合并人的表達數據和小鼠的表達數據?
6.6.8 質控中的GC含量和Overrepresented sequences
6.6.9 樣品是否在某種屬性中存在偏好性
6.6.10 為什么聚類結果不可靠
6.6.11 sampleFile文件的生成
7 易生信-數據可視化
7.1 加載需要的包
7.2 讀入數據
7.2.1 Duplicate row names
7.2.2 行名唯一化處理
7.3 熱圖繪制
7.3.1 提取差異基因繪制熱圖
7.4 箱線圖和統計比較
7.4.1 單基因箱線圖
7.4.2 多基因箱線圖 (combine)
7.4.3 多基因箱線圖 (merge)
7.4.4 數據對數轉換后繪制箱線圖
7.4.5 用ggplot2實現ggpubr
7.4.6 配色
7.4.7 箱線圖加統計分析
7.5 通路內基因的比較
7.5.1 密度圖
7.6 ggstatsplot繪圖和統計分析
7.6.1 散點圖
7.6.2 相關性圖
8 高顏值免費在線繪圖(提供繪圖源碼)
8.1 高顏值免費在線繪圖基礎版視頻
8.2 高顏值免費在線繪圖進階版視頻
9 參考
http://www.ehbio.com/Bioinfo_R_course/
這個為生信學習打造的開源Bash教程真香!!(目錄更新)!
送書
本期的留言主題是:你是什么時候關注生信寶典的,有什么意見和建議?歡迎轉發朋友圈并留言評論。
留言符合主題,得贊最高者以及幾位幸運讀者獲得下面由北京大學出版社贊助的書籍,結果在下一期送書活動中公布:
1. 理論為輔、實踐為主。本書涉及一些必要的理論知識,特別是在數據分析部分,但總體以實踐為主,因此幾乎每節都有大量的代碼,方便讀者實踐。
2. 知識全面、系統。本書在介紹了R語言的基礎知識后,從數據獲取和導出、數據清理和操作、數據分析和可視化方面分別進行了探討,內容由淺入深、循序漸進。
3. 案例廣泛。本書中的案例涉及心理學、社會學、醫學、商業和經濟等領域,但并不需要讀者具備這些領域的專業知識。
4. “新手問答”和“小試牛刀”知識模塊。“新手問答”主要對讀者學習過程中易出現的疑問或容易犯的錯誤進行針對性的解答;“小試牛刀”結合每章知識及相關技能,列舉綜合上機案例,讓讀者在學完一章內容后能及時回顧和練習,旨在讓讀者鞏固知識、學以致用。
往期精品(點擊圖片直達文字對應教程)
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
?
總結
以上是生活随笔為你收集整理的送书《R语言数据分析和可视化》 | 这个为生信学习和生信作图打造的开源R教程真香!!!...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 用了这么多年的PCA可视化竟然是错的!!
- 下一篇: 高通量数据中批次效应的鉴定和处理(二)