《機器學習從線性回歸到大模型》以回歸為主線,系統(tǒng)介紹統(tǒng)計學、機器學習與深度學習中最常用的分類與回歸方法,力圖在大數據與人工智能背景下,突破傳統(tǒng)統(tǒng)計建模的局限,構建一個融合多學科視角的現代回歸分析框架。
全書覆蓋線性回歸、嶺回歸、Lasso、Logistic回歸等經典線性模型,決策樹、隨機森林、GBDT、XGBoost等集成方法,BP神經網絡、卷積神經網絡、循環(huán)神經網絡等深度學習模型,以及基于Transformer的大語言模型(如BERT和GPT)。 此外,《機器學習從線性回歸到大模型》還介紹因果推斷方法、模型可解釋性工具(如SHAP)與遷移學習等前沿技術,強調跨學科融合,關注算法應用場景. 書中穿插算法發(fā)展史,展現行業(yè)應用,聚焦人工智能在中國的發(fā)展脈絡,增強學生的責任意識與現實關懷。
《機器學習從線性回歸到大模型》配套案例涵蓋農業(yè)、醫(yī)學等領域,以場景建模為理念,展現模型與國家、行業(yè)需求緊密結合的完整建模流程。 配套習題涵蓋風控、幸福感預測、圖像識別、視頻生成等主題,具有實踐性和挑戰(zhàn)性,有助于培養(yǎng)實戰(zhàn)能力。
《機器學習從線性回歸到大模型》算法基于Python實現,深度學習部分使用TensorFlow與Keras框架,配套提供案例和習題數據集、案例源代碼,便于教學和自學使用。
《機器學習從線性回歸到大模型》適用于統(tǒng)計、數據科學、人工智能、經濟管理等專業(yè)的本科生與研究生,可作為回歸分析統(tǒng)計模型機器學習等課程教材,也可作為人工智能通識教材使用,同時可供數據分析相關從業(yè)者參考。
本書以回歸為主線,系統(tǒng)整合統(tǒng)計學與機器學習的核心方法,從經典線性模型延伸至大語言模型,構建跨學科的知識體系。通過原理講解、代碼實現與真實案例結合,幫助讀者掌握建模思維與實踐能力,適合多學科背景學習者使用,是一本兼具深度與廣度的現代回歸分析指南。
董巖
----------------------------
中國科學院數學與系統(tǒng)科學研究院博士,現任北京理工大學數學與統(tǒng)計學院講師,碩士生導師。研究方向為回歸建模、機器學習。負責系統(tǒng)可靠性等研究課題。有多年一線教學經驗,主講北京理工大學一流本科專業(yè)本科專業(yè)統(tǒng)計學核心課程線性統(tǒng)計模型,其他開設課程包括:機器學習回歸方法、概率與數理統(tǒng)計、多元分析、SPSS統(tǒng)計軟件分析等。著有數學建模教材《數學建模方法進階》(合著)。曾多次指導全國大學生數學建模競賽、美國大學生數學建模競賽并獲獎。
目 錄
第1章 經典線性模型
1.1 監(jiān)督學習
1.2 分類及應用場景
1.3 回歸及應用場景
1.4 多元線性回歸模型
1.5 正則化線性回歸模型
1.6 Logistic 回歸模型
第2章 基于決策樹的模型
2.1 決策樹
2.2 隨機森林
2.3 因果森林
2.4 梯度提升決策樹
2.5 極端梯度提升
2.6 輕量梯度提升機
2.7 類別特征梯度提升
第3章 神經網絡
3.1 人工神經網絡發(fā)展史
3.2 生物神經元與人工神經元
3.3 激活函數
3.4 多層感知器
3.5 梯度下降優(yōu)化算法
第4章 深度學習
4.1 卷積神經網絡
4.2 LeNet-5 網絡
4.3 AlexNet 網絡
4.4 批量歸一化
4.5 殘差網絡
4.6 語言模型與 Word2Vec 詞向量
4.7 循環(huán)神經網絡
第5章 大語言模型
5.1 Transformer 模型
5.2 BERT 模型
5.3 GPT 模型
5.4 GPT-2 模型
5.5 GPT-3 模型
5.6 ChatGPT 模型
第6章 案例分析
6.1 中國糧食產量影響因素分析
6.2 心臟病數據分析
6.3 深度學習在阿爾茨海默病識別中的應用