Python多元线性回归、机器学习、深度学习在近红外光谱分析中的应用
導師:郁磊副教授,主要從事MATLAB 編程、機器學習與數據挖掘、數據可視化和軟件開發、人工智能近紅外光譜分析、生物醫學系統建模與仿真,具有豐富的實戰應用經驗,主編《MATLAB智能算法30個案例分析》、《MATLAB神經網絡43個案例分析》相關著作。已發表多篇高水平的國際學術研究論文。
基于Python多元線性回歸、機器學習、深度學習在近紅外光譜分析中的實踐應用
第一章:Python入門基礎
1、Python環境搭建( 下載、安裝與版本選擇)。
2、如何選擇Python編輯器?(IDLE、Notepad++、PyCharm、Jupyter…)
3、Python基礎(數據類型和變量、字符串和編碼、list和tuple、條件判斷、循環、函數的定義與調用等)
4、常見的錯誤與程序調試
5、第三方模塊的安裝與使用
6、文件讀寫(I/O)
7、實操練習
第二章:Python進階與提高
1、Numpy模塊庫(Numpy的安裝;ndarray類型屬性與數組的創建;數組索引與切片;Numpy常用函數簡介與使用)
2、Pandas模塊庫(DataFrame數據結構、表格的變換、排序、拼接、融合、分組操作等)
3、Matplotlib基本圖形繪制(線形圖、柱狀圖、餅圖、氣泡圖、直方圖、箱線圖、散點圖等)
4、圖形的布局(多個子圖繪制、規則與不規則布局繪制、向畫布中任意位置添加坐標軸)
5、Scikit-Learn模塊庫簡介、下載與安裝
6、實操練習
第三章:多元線性回歸及其在近紅外光譜分析中的應用
1、多元線性回歸模型(工作原理、最小二乘法)
2、嶺回歸模型(工作原理、嶺參數k的選擇、用嶺回歸選擇變量)
3、LASSO模型(工作原理、特征選擇、建模預測、超參數調節)
4、Elastic Net模型(工作原理、建模預測、超參數調節)
5、多元線性回歸、嶺回歸、LASSO、Elastic Net的Python代碼實現
6、案例演示:近紅外光譜回歸擬合建模
第四章:BP神經網絡及其在近紅外光譜分析中的應用
1、BP神經網絡的基本原理(人工智能發展過程經歷了哪些曲折?人工神經網絡的分類有哪些?BP神經網絡的拓撲結構和訓練過程是怎樣的?什么是梯度下降法?BP神經網絡建模的本質是什么?)
2、怎樣劃分訓練集和測試集?為什么需要歸一化?歸一化是必須的嗎? BP神經網絡的常用激活函數有哪些?如何查看模型的參數?
3、BP神經網絡參數的優化(隱含層神經元個數、學習率、初始權值和閾值等如何設置?什么是交叉驗證?)
4、值得研究的若干問題(欠擬合與過擬合、泛化性能評價指標的設計、樣本不平衡問題等)
5、極限學習機(Extreme Learning Machine, ELM)的基本原理(ELM的基本算法,“極限”體現在哪些地方?ELM 與 BP 神經網絡的區別與聯系)
6、BP神經網絡、極限學習機的Python代碼實現
7、案例演示:
1)近紅外光譜回歸擬合建模;
2)近紅外光譜分類識別建模
第五章:支持向量機(SVM)及其在近紅外光譜分析中的應用
1、SVM的基本原理(什么是經驗誤差最小和結構誤差最小?SVM的本質是解決什么問題?SVM的四種典型結構是什么?核函數的作用是什么?什么是支持向量?)
2、SVM擴展知識(如何解決多分類問題?SVM除了建模型之外,還可以幫助我們做哪些事情?SVM的啟發:樣本重要性的排序及樣本篩選)
3、SVM的Python代碼實現
4、案例演示:近紅外光譜分類識別建模
第六章:決策樹、隨機森林、Adaboost、XGBoost和LightGBM及其在近紅外光譜分析中的應用
1、決策樹的基本原理(微軟小冰讀心術的啟示;什么是信息熵和信息增益?ID3算法和C4.5算法的區別與聯系)
2、決策樹的啟發:變量重要性的排序及變量篩選
3、隨機森林的基本原理與集成學習框架(為什么需要隨機森林算法?廣義與狹義意義下的“隨機森林”分別指的是什么?“隨機”提現在哪些地方?隨機森林的本質是什么?)
4、Bagging與Boosting集成策略的區別
5、Adaboost算法的基本原理
6、Gradient Boosting Decision Tree (GBDT)模型的基本原理
7、XGBoost與LightGBM簡介
8、決策樹、隨機森林、Adaboost、XGBoost與LightGBM的Python代碼實現
9、案例演示:近紅外光譜回歸擬合建模
第七章:遺傳算法及其在近紅外光譜分析中的應用
1、群優化算法概述
2、遺傳算法(Genetic Algorithm)的基本原理(什么是個體和種群?什么是適應度函數?選擇、交叉與變異算子的原理與啟發式策略)
3、遺傳算法的Python代碼實現
4、案例演示:基于二進制遺傳算法的近紅外光譜波長篩選
第八章:變量降維與特征選擇算法及其在近紅外光譜分析中的應用
1、主成分分析(PCA)的基本原理
2、偏最小二乘(PLS)的基本原理(PCA與PLS的區別與聯系;PCA除了降維之外,還可以幫助我們做什么?)
3、近紅外光譜波長選擇算法的基本原理(Filter和Wrapper;前向與后向選擇法;區間法;無信息變量消除法等)
4、PCA、PLS的Python代碼實現
5、特征選擇算法的Python代碼實現
6、案例演示:
1)基于L1正則化的近紅外光譜波長篩選
2)基于信息熵的近紅外光譜波長篩選
3)基于Recursive feature elimination的近紅外光譜波長篩選
4)基于Forward-SFS的近紅外光譜波長篩選
第九章:Pytorch環境搭建與編程入門
1、深度學習框架概述(PyTorch、Tensorflow、Keras等)
2、PyTorch簡介(動態計算圖與靜態計算圖機制、PyTorch的優點)
3、PyTorch的安裝與環境配置(Pip vs. Conda包管理方式、驗證是否安裝成功)
4、張量(Tensor)的定義,以及與標量、向量、矩陣的區別與聯系)
5、張量(Tensor)的常用屬性與方法(dtype、device、requires_grad、cuda等)
6、張量(Tensor)的創建(直接創建、從numpy創建、依據概率分布創建)
7、張量(Tensor)的運算(加法、減法、矩陣乘法、哈達瑪積(element wise)、除法、冪、開方、指數與對數、近似、裁剪)
8、張量(Tensor)的索引與切片
9、PyTorch的自動求導(Autograd)機制與計算圖的理解
10、PyTorch常用工具包及API簡介(torchvision(transforms、datasets、model)、torch.nn、torch.optim、torch.utils(Dataset、DataLoader)
第十章:卷積神經網絡及其在近紅外光譜分析中的應用
1、深度學習與傳統機器學習的區別與聯系(神經網絡的隱含層數越多越好嗎?深度學習與傳統機器學習的本質區別是什么?)
2、卷積神經網絡的基本原理(什么是卷積核?CNN的典型拓撲結構是怎樣的?CNN的權值共享機制是什么?CNN提取的特征是怎樣的?)
3、卷積神經網絡參數調試技巧
4、卷積神經網絡的Python代碼實現
5、案例演示:基于卷積神經網絡的近紅外光譜建模
第十一章:遷移學習及其在近紅外光譜分析中的應用
1、遷移學習算法的基本原理(為什么需要遷移學習?為什么可以遷移學習?遷移學習的基本思想是什么?)
2、常用的遷移學習算法簡介(基于實例、特征和模型,譬如:TrAdaboost算法)
3、基于卷積神經網絡的遷移學習算法
4、遷移學習的Python代碼實現
5、案例演示:基于遷移學習的近紅外光譜的模型傳遞(模型移植)
第十二章:自編碼器及其在近紅外光譜分析中的應用
1、自編碼器(Auto-Encoder的工作原理)
2、常見的自編碼器類型簡介(降噪自編碼器、深度自編碼器、掩碼自編碼器等)
3、自編碼器的Python代碼實現
4、案例演示:
1)基于自編碼器的近紅外光譜數據預處理
2)基于自編碼器的近紅外光譜數據降維與有效特征提取
第十三章:復習
1、課程復習與總結(知識點梳理)
2、資料分享(圖書、在線課程資源、源代碼等)
3、科研與創新方法總結(如何利用Google Scholar、Sci-Hub、ResearchGate等工具查閱文獻資料、配套的數據和代碼?如何更好地撰寫論文的Discussion部分?如果在算法層面上難以做出原創性的工作,如何結合實際問題提煉與挖掘創新點?)
?
總結
以上是生活随笔為你收集整理的Python多元线性回归、机器学习、深度学习在近红外光谱分析中的应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 由1078引申出的音视频开发(一)之我们
- 下一篇: Juniper入门之RIP