本書旨在為不同專業(yè)背景的學(xué)生系統(tǒng)構(gòu)建人工智能的知識(shí)體系。全書內(nèi)容由基礎(chǔ)到前沿,系統(tǒng)講述了計(jì)算機(jī)科學(xué)與人工智能的宏觀概述與發(fā)展歷史,介紹了驅(qū)動(dòng)當(dāng)代人工智能發(fā)展的三大引擎——深度學(xué)習(xí)、自然語言處理與計(jì)算機(jī)視覺的基本原理與典型應(yīng)用,并延伸至以大模型、AIGC為代表的技術(shù)前沿,以及對(duì)AI倫理的思考。在編寫上,本書注重通識(shí)教育的特性,語言闡述通俗易懂,邏輯脈絡(luò)清晰明了。通過將抽象概念與豐富實(shí)例相結(jié)合,力求在避免復(fù)雜數(shù)學(xué)推導(dǎo)的同時(shí),揭示技術(shù)背后的基本原理與廣泛的社會(huì)應(yīng)用,有效激發(fā)學(xué)生的學(xué)習(xí)興趣并建立立體化的認(rèn)知。本書主要面向高等院校各專業(yè)的本科通識(shí)課教學(xué),同樣適合作為廣大人工智能初學(xué)者入門的首選讀物。通過學(xué)習(xí),讀者不僅能夠理解人工智能的基本概念與技術(shù),也能對(duì)其發(fā)展、現(xiàn)狀與未來有系統(tǒng)性的了解,為在智能化時(shí)代中進(jìn)一步探索與創(chuàng)新奠定基石。
張軍,教授、博士研究生、碩士生導(dǎo)師,江西省高層次人才(E類),中國計(jì)算機(jī)學(xué)會(huì)(CCF)高級(jí)會(huì)員,國家自然科學(xué)基金項(xiàng)目評(píng)審專家,全國研究生教育評(píng)估監(jiān)測專家?guī)鞂<遥?018ISCIPT組委會(huì)專家成員,江西省計(jì)算機(jī)科學(xué)與技術(shù)高水平教學(xué)團(tuán)隊(duì)成員。
第 1 章? 緒論 …………………………………………………………………………………… 001
1.1? 計(jì)算機(jī)概述 …………………………………………………………………………… 002
1.1.1 計(jì)算機(jī)的定義與本質(zhì) ………………………………………………………… 002
1.1.2 通用計(jì)算機(jī)模型:馮·諾依曼體系結(jié)構(gòu) …………………………………… 003
1.2? 計(jì)算機(jī)的發(fā)展史 ……………………………………………………………………… 004
1.2.1 硬件發(fā)展 ……………………………………………………………………… 004
1.2.2 軟件發(fā)展 ……………………………………………………………………… 005
1.3? 人工智能概述 ………………………………………………………………………… 006
1.3.1 人工智能的定義 ……………………………………………………………… 006
1.3.2 圖靈測試 ……………………………………………………………………… 006
1.3.3 人工智能的三大學(xué)派 ………………………………………………………… 007
1.4? 人工智能分類 ………………………………………………………………………… 009
1.4.1 從與人的融合程度分類 ……………………………………………………… 009
1.4.2 按照發(fā)展過程及功能強(qiáng)度分類 ……………………………………………… 009
1.5? 人工智能的發(fā)展史 …………………………………………………………………… 010
1.5.1 國外人工智能發(fā)展史 ………………………………………………………… 010
1.5.2 人工智能國內(nèi)發(fā)展史 ………………………………………………………… 012
1.6? 人工智能的應(yīng)用 ……………………………………………………………………… 015
1.6.1 智能安防 ……………………………………………………………………… 015
1.6.2 智慧醫(yī)療 ……………………………………………………………………… 017
1.6.3 智能制造 ……………………………………………………………………… 018
1.6.4 智能家居與個(gè)人助理 ………………………………………………………… 019
1.6.5 智能客服 ……………………………………………………………………… 020
1.6.6 智慧教育 ……………………………………………………………………… 021
1.6.7 地球觀測與預(yù)測 ……………………………………………………………… 022
VI? /? 人工智能導(dǎo)論
1.7? 知識(shí)表示與知識(shí)推理 ………………………………………………………………… 023
1.7.1 知識(shí)表示 ……………………………………………………………………… 023
1.7.2 知識(shí)圖譜 ……………………………………………………………………… 024
1.7.3 知識(shí)推理 ……………………………………………………………………… 026
本章小結(jié) …………………………………………………………………………………… 027
習(xí)題 ………………………………………………………………………………………… 027
第 2 章? 機(jī)器學(xué)習(xí)基礎(chǔ) ………………………………………………………………………… 029
2.1? 機(jī)器學(xué)習(xí)發(fā)展歷程 …………………………………………………………………… 029
2.2? 機(jī)器學(xué)習(xí)分類 ………………………………………………………………………… 030
2.3? 機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)流程 ……………………………………………………………… 031
2.4? 數(shù)據(jù)預(yù)處理 …………………………………………………………………………… 032
2.4.1 數(shù)據(jù)探索 ……………………………………………………………………… 033
2.4.2 數(shù)據(jù)清洗 ……………………………………………………………………… 033
2.4.3 數(shù)據(jù)變換 ……………………………………………………………………… 034
2.4.4 數(shù)據(jù)規(guī)約 ……………………………………………………………………… 034
2.5? 機(jī)器學(xué)習(xí)算法介紹及其應(yīng)用 ………………………………………………………… 036
2.5.1 線性模型 ……………………………………………………………………… 036
2.5.2 邏輯回歸 ……………………………………………………………………… 037
2.5.3 決策樹模型 …………………………………………………………………… 042
2.5.4 K- 近鄰………………………………………………………………………… 046
2.5.5 樸素貝葉斯模型 ……………………………………………………………… 050
2.5.6 SVM 算法 …………………………………………………………………… 055
2.5.7 隨機(jī)森林 ……………………………………………………………………… 060
2.5.8 K- 均值聚類…………………………………………………………………… 065
2.5.9 神經(jīng)網(wǎng)絡(luò) ……………………………………………………………………… 069
本章小結(jié) …………………………………………………………………………………… 071
習(xí)題 ………………………………………………………………………………………… 071
第 3 章? 深度學(xué)習(xí) ……………………………………………………………………………… 072
3.1? 深度學(xué)習(xí)起源 ………………………………………………………………………… 073
3.1.1 淺層學(xué)習(xí)的局限性 …………………………………………………………… 073
3.1.2 深度學(xué)習(xí)的提出 ……………………………………………………………… 074
3.1.3 深度學(xué)習(xí)的發(fā)展 ……………………………………………………………… 075
3.1.4 深度學(xué)習(xí)情景案例 …………………………………………………………… 076
3.2? 卷積神經(jīng)網(wǎng)絡(luò)與膠囊網(wǎng)絡(luò) …………………………………………………………… 077
目錄? /? VII
3.2.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) …………………………………………………………… 077
3.2.2 卷積的物理、生物與生態(tài)學(xué)意義 …………………………………………… 079
3.2.3 卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算 …………………………………………………… 080
3.2.4 卷積神經(jīng)網(wǎng)絡(luò)的關(guān)鍵技術(shù) …………………………………………………… 081
3.2.5 卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 ………………………………………………………… 084
3.2.6 膠囊網(wǎng)絡(luò) ……………………………………………………………………… 085
3.3? 深度學(xué)習(xí)工具框架介紹 ……………………………………………………………… 087
3.3.1 深度學(xué)習(xí)框架概述 …………………………………………………………… 087
3.3.2 PyTorch ……………………………………………………………………… 087
3.3.2 TensorFlow …………………………………………………………………… 090
3.3.3 Keras…………………………………………………………………………… 093
3.3.5 對(duì)比與選擇建議 ……………………………………………………………… 094
3.3.6 模型調(diào)優(yōu) ……………………………………………………………………… 095
3.4? 生成對(duì)抗網(wǎng)絡(luò)及其應(yīng)用 ……………………………………………………………… 097
3.4.1 生成對(duì)抗網(wǎng)絡(luò)的基本原理 …………………………………………………… 097
3.4.2 生成對(duì)抗網(wǎng)絡(luò)的結(jié)構(gòu)與訓(xùn)練 ………………………………………………… 098
3.4.3 生成對(duì)抗網(wǎng)絡(luò)在圖像處理中的意義 ………………………………………… 100
3.4.4 生成對(duì)抗網(wǎng)絡(luò)在語言處理中的意義 ………………………………………… 101
3.4.5 生成對(duì)抗網(wǎng)絡(luò)在視頻生成中的意義 ………………………………………… 102
3.4.6 生成對(duì)抗網(wǎng)絡(luò)在醫(yī)療中的意義 ……………………………………………… 104
本章小結(jié) …………………………………………………………………………………… 104
習(xí)題 ………………………………………………………………………………………… 104
第 4 章? 自然語言處理 ………………………………………………………………………… 105
4.1? 自然語言處理概論 …………………………………………………………………… 106
4.1.1 基本概念 ……………………………………………………………………… 106
4.1.2 發(fā)展歷程 ……………………………………………………………………… 107
4.1.3 自然語言的層次結(jié)構(gòu) ………………………………………………………… 109
4.2? 自然語言處理的典型應(yīng)用 …………………………………………………………… 111
4.2.1 分詞 …………………………………………………………………………… 112
4.2.2 詞性標(biāo)注 ……………………………………………………………………… 112
4.2.3 詞義消歧 ……………………………………………………………………… 113
4.2.4 句法分析 ……………………………………………………………………… 114
4.2.5 文本分類 ……………………………………………………………………… 115
4.2.6 情感分析和觀點(diǎn)挖掘 ………………………………………………………… 115
4.2.7 信息提取 ……………………………………………………………………… 116
4.2.8 信息檢索 ……………………………………………………………………… 117
VIII? /? 人工智能導(dǎo)論
4.2.9 文本生成 ……………………………………………………………………… 118
4.2.10 自動(dòng)問答 …………………………………………………………………… 118
4.2.11 機(jī)器翻譯 …………………………………………………………………… 118
4.3? 自然語言處理的關(guān)鍵技術(shù)與方法 …………………………………………………… 119
4.3.1 文本的表示 …………………………………………………………………… 119
4.3.2 基于規(guī)則的推理 ……………………………………………………………… 123
4.3.3 循環(huán)神經(jīng)網(wǎng)絡(luò) ………………………………………………………………… 124
4.3.4 長短期記憶網(wǎng)絡(luò) ……………………………………………………………… 124
4.3.5 大語言模型 …………………………………………………………………… 125
4.4? 自然語言處理常用資源與工具 ……………………………………………………… 129
4.4.1 常用語料庫 …………………………………………………………………… 129
4.4.2 常用詞典 ……………………………………………………………………… 130
4.4.3 常用工具集 …………………………………………………………………… 130
4.4.4 預(yù)訓(xùn)練模型庫 ………………………………………………………………… 131
本章小結(jié) …………………………………………………………………………………… 132
習(xí)題 ………………………………………………………………………………………… 132
第 5 章? 計(jì)算機(jī)視覺 …………………………………………………………………………… 134
5.1? 人類圖像處理系統(tǒng) …………………………………………………………………… 134
5.2? 圖像處理基礎(chǔ) ………………………………………………………………………… 136
5.2.1 人類圖像識(shí)別能力的關(guān)鍵特征與機(jī)制 ……………………………………… 137
5.2.2 圖像的表示與處理 …………………………………………………………… 138
5.2.3 圖像特征提取 ………………………………………………………………… 141
5.2.4 圖像預(yù)處理 …………………………………………………………………… 142
5.3? 計(jì)算機(jī)視覺技術(shù) ……………………………………………………………………… 143
5.3.1 計(jì)算機(jī)視覺的基本概念 ……………………………………………………… 144
5.3.2 計(jì)算機(jī)視覺與人類視覺的區(qū)別 ……………………………………………… 145
5.4? 圖像分割 ……………………………………………………………………………… 146
5.4.1 圖像分割的定義 ……………………………………………………………… 146
5.4.2 圖像分割的基本原理 ………………………………………………………… 147
5.4.3 FCN …………………………………………………………………………… 147
5.4.4 UNet…………………………………………………………………………… 148
5.5? 目標(biāo)檢測 ……………………………………………………………………………… 149
5.5.1 目標(biāo)檢測常用術(shù)語 …………………………………………………………… 153
5.5.2 目標(biāo)檢測經(jīng)典算法 …………………………………………………………… 155
5.6? 應(yīng)用案例 ……………………………………………………………………………… 160
5.6.1 基于 YOLOv8 的膝骨關(guān)節(jié)炎檢測…………………………………………… 160
目錄? /? IX
5.6.2 基于 DeepLabv3+ 的圖像語義分割方法 …………………………………… 163
5.6.3 基于 MediaPipe 的化學(xué)實(shí)驗(yàn)操作標(biāo)準(zhǔn)化分析 ……………………………… 166
本章小結(jié) …………………………………………………………………………………… 168
習(xí)題 ………………………………………………………………………………………… 168
第 6 章? 大模型與 AI 應(yīng)用 …………………………………………………………………… 170
6.1? 大模型 ………………………………………………………………………………… 170
6.1.1 大模型的發(fā)展歷程 …………………………………………………………… 170
6.1.2 大模型的能力特點(diǎn) …………………………………………………………… 173
6.1.3 大語言模型的技術(shù)原理 ……………………………………………………… 174
6.1.4 典型大模型產(chǎn)品 ……………………………………………………………… 181
6.1.5 大模型應(yīng)用領(lǐng)域 ……………………………………………………………… 185
6.2? AIGC 與提示工程 …………………………………………………………………… 189
6.2.1 AIGC ………………………………………………………………………… 189
6.2.2 提示工程 ……………………………………………………………………… 192
6.3? 基于大模型的智能體 ………………………………………………………………… 209
6.3.1 智能體概述 …………………………………………………………………… 209
6.3.2 大語言模型智能體的構(gòu)建 …………………………………………………… 210
6.3.3 多智能體系統(tǒng)的構(gòu)建 ………………………………………………………… 213
6.3.4 大語言模型智能體的典型應(yīng)用 ……………………………………………… 214
6.3.4 待解決的關(guān)鍵技術(shù)問題 ……………………………………………………… 215
6.4? 具身智能 ……………………………………………………………………………… 216
6.4.1 具身智能的概念與內(nèi)涵 ……………………………………………………… 217
6.4.2 具身智能發(fā)展歷程 …………………………………………………………… 218
6.4.3 具身智能發(fā)展面臨的挑戰(zhàn) …………………………………………………… 221
6.5? AI 倫理 ……………………………………………………………………………… 223
本章小結(jié) …………………………………………………………………………………… 225
習(xí)題 ………………………………………………………………………………………… 226