本書聚焦人工智能領域中機器學習的基礎理論與方法,通過嚴謹的數學推導和可解釋性分析,幫助讀者理解常用方法的理論內涵與實現細節(jié)。全書共8章,第1章簡要講解機器學習的基本概念與發(fā)展脈絡;第2章和第3章介紹所需的數學基礎與優(yōu)化基礎;第4章介紹數據基礎理論方面的知識;第5~8章分類探討經典機器學習方法,涵蓋特征處理、聚類分析、回歸與分類等主要方向,在介紹典型算法原理的同時,拓展至相關進階方法與前沿研究思路。本書通過典型算法示例與原理推導相結合的方式,以期讀者系統(tǒng)地掌握機器學習的基礎理論與常用方法,為從事該領域相關科研工作打下基礎。
更多科學出版社服務,請掃碼獲取。
1994-09~1998-07 中國科學技術大學電子工程與信息科學系 電子工程專業(yè) 學士
1998-09~2002-11 中國科學技術大學電子工程與信息科學系 通信與信息系統(tǒng)專業(yè) 博士2003-08~2004-08 英國 Ulster 大學 Lecturer(講師 A級)正式教職;
2004-09~2009-05 英國倫敦大學 Birkbeck 學院 講師 A, B 級、終身教職 2006、高級講師、Reader;
2009-05~2018-11 中國科學院西安光學精密機械研究所 研究員、副所長2015、千人2010、杰青2012、領軍2015
2018-11~至今 西北工業(yè)大學 教授、校學術委員會副主任 2019,工信部重點實驗室主任2021信息科學與工程-光電信息科學與工程發(fā)表論文 192 篇,其中SCI檢索 192 篇,SSCI檢索 192 篇,EI檢索 0 篇,CSSCI檢索 0 篇,其他核心期刊檢索 0 篇。
1.Y. Duan, J. He, R. Zhang, et al., Prediction Consistency Regularization for Generalized Category Discovery, Information Fusion, vol. 112, 2024, Art. no. 102547.
2.W. K. Wong, Y. Lu, Z. Lai, et al., Graph Correlated Discriminant Embedding for Multi-Source Domain Adaptation, Pattern Recognition, vol. 153, 2024, Art. no. 110538.
目錄
前言
第1章 緒論 1
1.1 機器學習內涵 1
1.2 定義與術語 4
1.2.1 機器學習相關定義 4
1.2.2 機器學習相關術語 6
1.3 發(fā)展簡史 10
1.4 典型應用 16
1.5 倫理計算 22
第2章 機器學習數學基礎 27
2.1 向量與矩陣運算 27
2.1.1 向量與矩陣基本概念 27
2.1.2 向量與矩陣范數 28
2.1.3 矩陣性能指標與相關計算 34
2.2 特征值分析 37
2.2.1 特征值問題與特征向量 37
2.2.2 矩陣特征值與相關計算 41
2.3 奇異值分解 42
2.3.1 奇異值分解及其解釋 42
2.3.2 奇異值分解與特征值 44
2.3.3 奇異值的性質 47
2.4 圖論基礎 50
2.4.1 權重圖與圖切 50
2.4.2 鄰接矩陣構建 52
2.4.3 拉普拉斯矩陣 58
2.5 張量基礎 62
2.5.1 基本概念 62
2.5.2 相關運算 64
2.5.3 張量分解 66
2.6 小結 70
第3章 機器學習優(yōu)化基礎 72
3.1 優(yōu)化理論基本概念 72
3.1.1 建立最優(yōu)化模型 73
3.1.2 凸優(yōu)化問題及求解 74
3.2 拉格朗日乘子法與KKT 條件 77
3.2.1 等式約束問題 78
3.2.2 不等式約束問題 79
3.2.3 原始問題與對偶問題 80
3.3 梯度下降法 82
3.3.1 批量梯度下降法 82
3.3.2 隨機梯度下降法 84
3.4 牛頓迭代法 85
3.5 坐標下降法 88
3.6 小結 91
第4章 機器學習數據基礎 92
4.1 合成數據集 92
4.1.1 數據線性可分 93
4.1.2 數據線性不可分 93
4.2 真實數據集 96
4.2.1 圖像數據集 96
4.2.2 視頻數據集 99
4.2.3 生物信息數據集 100
4.2.4 自然語言數據集 101
4.2.5 其他數據集 101
4.3 數據處理 103
4.3.1 數據清洗與特征處理 103
4.3.2 不平衡問題 105
4.3.3 數據類型轉換 108
4.4 小結 109
第5章 特征提取方法 110
5.1 經典方法 110
5.1.1 主成分分析 110
5.1.2 局部保持投影 113
5.1.3 線性判別分析 116
5.1.4 張量分析方法 121
5.1.5 經典方法總結與分析 124
5.2 進階方法 126
5.2.1 基于自適應圖嵌入的無監(jiān)督方法 126
5.2.2 基于快速構圖的無監(jiān)督方法 131
5.2.3 基于最大化比率和線性判別分析的方法 138
5.3 小結 148
第6章 特征選擇方法 150
6.1 經典方法 150
6.1.1 過濾式方法 151
6.1.2 包裹式方法 156
6.1.3 嵌入式方法 160
6.1.4 經典方法總結與分析 163
6.2 進階方法 164
6.2.1 基于多分類邏輯斯諦回歸的方法 164
6.2.2 基于稀疏無監(jiān)督投影的聯(lián)合方法 175
6.2.3 非線性特征選擇網絡方法 183
6.3 小結 186
第7章 聚類分析方法 187
7.1 經典方法 188
7.1.1 K均值聚類 188
7.1.2 模糊K均值聚類 190
7.1.3 密度聚類 192
7.1.4 層次聚類 195
7.1.5 譜聚類 197
7.1.6 經典方法總結與分析 202
7.2 進階方法 208
7.2.1 基于熵正則化的自適應近鄰圖方法 208
7.2.2 基于二部圖的快速自監(jiān)督方法 216
7.2.3 基于新類發(fā)現的遞進式自監(jiān)督方法 224
7.3 小結 228
第8章 回歸與分類方法 229
8.1 經典方法 230
8.1.1 最小二乘回歸 230
8.1.2 支持向量回歸 235
8.1.3 K近鄰法 238
8.1.4 決策樹 243
8.1.5 支持向量機 248
8.1.6 感知機與神經網絡 255
8.1.7 經典方法總結與分析 263
8.2 進階方法 265
8.2.1 基于*范數最小化的方法 265
8.2.2 基于分隔平面的邏輯回歸方法 272
8.3 正激勵噪聲 280
8.4 小結 286
參考文獻 288
附錄A 相關學術組織、重要會議與期刊 295
A1 相關學術組織 295
A2 重要會議與期刊 296