本書主要是為非計算機和人工智能領域?qū)I(yè)學生編寫的人工智能通識教材,旨在培養(yǎng)具備AI基礎知識和AI素養(yǎng)的高素質(zhì)復合型人才。本書緊扣AI技術前沿,系統(tǒng)講解核心概念、發(fā)展歷程、主流學派及核心技術,涵蓋機器學習、深度學習、計算機視覺、智能體及自然語言處理等領域,并通過無人駕駛、醫(yī)療診斷、智慧城市等典型案例,展現(xiàn)其廣泛的應用場景。全書分為七講:AI概覽(基本概念與發(fā)展歷史)、AI學習機制(AI算法與模型)、感知與認知智能(機器視覺與知識圖譜)、智能體與智能系統(tǒng)(AI系統(tǒng)架構與大模型)、NLP與AI大模型(語言處理與生成式AI)、AI應用與發(fā)展(AI領域?qū)嵺`)、AI安全與倫理(AI問題與社會問題)。本書內(nèi)容新穎實用,兼顧廣度與深度,注重AI思維和素養(yǎng)的培養(yǎng),弱化理論基礎和實踐門檻,助力讀者構建AI知識體系,培養(yǎng)AI合規(guī)應用與倫理意識。
王海濤,南京審計大學金審學院信息科學與工程學院教授,數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)負責人,碩士生導師。江蘇省人工智能學會理事、江蘇省大數(shù)據(jù)專委會委員、江蘇省應用型高校計算機學科建設專委會委員、計算機學會和通信學會高級會員、系統(tǒng)仿真學報編委,IEEE期刊、通信學報、電子學報和軟件學報審稿專家。先后畢業(yè)于解放軍通信工程學院和解放軍理工大學獲學士、碩士和博士學位。主持國家自然科學基金面上項目1項,主持和參與完成軍隊和省級科研項目多項,獲軍隊科技進步二等獎1項、軍隊科技進步三等獎2項。研究方向主要包括:計算機網(wǎng)絡、無線自組網(wǎng)、人工智能、信息安全、應急通信和大數(shù)據(jù)等。迄今,發(fā)表學術論文百余篇,出版著作7部,授權國家發(fā)明專利9項。
目 錄
第1講 AI概覽 1
1.1 相關概念 1
1.1.1 智能的定義 1
1.1.2 人工智能的定義 2
1.2 發(fā)展歷程 4
1.2.1 漫長孕育 4
1.2.2 誕生成長 5
1.2.3 曲折前行 6
1.2.4 蓬勃興起 8
1.2.5 發(fā)展總結 9
1.3 主流學派 10
1.3.1 符號主義學派 10
1.3.2 連接主義學派 10
1.3.3 行為主義學派 11
1.3.4 學派對比分析 11
1.4 研究范疇 12
1.4.1 學科內(nèi)涵 12
1.4.2 研究領域 13
1.5 典型應用 18
習題 21
第2講 AI學習機制 22
2.1 機器學習 22
2.1.1 機器學習概述 22
2.1.2 機器學習分類 24
2.1.3 常見的機器學習算法 31
2.2 機器學習主要流程 36
2.2.1 數(shù)據(jù)與數(shù)據(jù)集——機器學習的基石 37
2.2.2 數(shù)據(jù)預處理 38
2.2.3 模型訓練與測試 41
2.2.4 模型評估 42
2.2.5 新樣本預測 42
2.3 深度學習常見模型 43
2.3.1 卷積神經(jīng)網(wǎng)絡 43
2.3.2 循環(huán)神經(jīng)網(wǎng)絡 46
2.3.3 Transformer 47
2.3.4 生成對抗網(wǎng)絡 48
2.3.5 深度強化學習 49
習題 51
第3講 感知與認知智能 52
3.1 機器視覺 52
3.1.1 什么是機器視覺 52
3.1.2 機器視覺的發(fā)展 53
3.1.3 機器視覺的技術要素 53
3.2 計算機視覺 54
3.2.1 什么是計算機視覺 54
3.2.2 計算機視覺的發(fā)展歷程 56
3.3 模式識別 62
3.3.1 什么是模式識別 62
3.3.2 模式識別的研究進展 63
3.3.3 模式識別的核心任務 63
3.3.4 模式識別的主要方法 63
3.3.5 模式識別的發(fā)展趨勢 63
3.4 圖像識別 64
3.4.1 人類的圖像識別能力 64
3.4.2 圖像識別的基礎 65
3.4.3 圖形識別的模型 66
3.4.4 神經(jīng)網(wǎng)絡圖像識別 67
3.5 圖像理解 67
3.5.1 圖像數(shù)據(jù)處理 67
3.5.2 圖像分類 69
3.5.3 圖像分割 70
3.6 計算機視覺的應用 72
3.6.1 自動駕駛環(huán)境感知系統(tǒng) 72
3.6.2 工業(yè)智能質(zhì)檢系統(tǒng) 73
3.6.3 醫(yī)療影像輔助診斷系統(tǒng) 74
3.7 知識表示 75
3.7.1 知識和知識表示的概念 75
3.7.2 知識表示方法 75
3.7.3 知識圖譜的價值 76
習題 79
第4講 智能體與智能系統(tǒng) 80
4.1 智能體與智能系統(tǒng)概述 80
4.1.1 智能體組成要素 81
4.1.2 智能系統(tǒng)的分類與演進 82
4.1.3 大模型對智能體發(fā)展的影響 83
4.2 智能體的基礎理論與架構 85
4.2.1 基礎理論 85
4.2.2 智能體的架構模式 86
4.2.3 典型案例 87
4.3 大模型與智能體的關鍵技術 88
4.3.1 Transformer架構與自注意力機制 88
4.3.2 預訓練、微調(diào)與指令優(yōu)化 89
4.3.3 多模態(tài)融合 90
4.3.4 復雜環(huán)境下的動態(tài)推理 91
4.3.5 智能體的持續(xù)學習與進化 91
4.4 構建基于大模型的智能體 92
4.4.1 關鍵模塊 92
4.4.2 規(guī)劃和決策能力 93
4.4.3 記憶機制 93
4.4.4 工具調(diào)用 94
4.4.5 推理引擎:ReAct框架 94
4.5 智能系統(tǒng)工程化實踐 95
4.5.1 需求分析與場景定制 95
4.5.2 數(shù)據(jù)處理與管理 95
4.5.3 模型選擇與訓練優(yōu)化 96
4.5.4 智能體設計與集成 96
4.5.5 系統(tǒng)部署與運維 96
4.5.6 開發(fā)工具鏈與框架 97
4.6 未來技術趨勢 98
4.6.1 具身智能 98
4.6.2 通用人工智能 99
習題 100
第5講 NLP與AI大模型 101
5.1 語言理解為何困難 101
5.1.1 語言的千面之謎 101
5.1.2 孩童的啟示錄 101
5.1.3 機器的困境之旅 102
5.2 NLP的核心任務 102
5.2.1 基礎處理技術:語言的解剖學 102
5.2.2 深度理解技術:語義的破譯工程 103
5.2.3 內(nèi)容生成技術:機器的創(chuàng)造力覺醒 104
5.3 技術演進之路 104
5.3.1 規(guī)則驅(qū)動時期(1950—1989):語言的“樂高積木”時代 104
5.3.2 統(tǒng)計學習時期(1990—2009):概率開啟的巴別塔 105
5.3.3 深度學習革命(從2010年至今):神經(jīng)網(wǎng)絡的覺醒 105
5.4 語法分析與語義分析:解碼語言的雙重密碼 106
5.4.1 語法分析:語言的建筑學 106
5.4.2 語義分析:意義的偵探術 107
5.4.3 技術進化的雙重奏 108
5.4.4 現(xiàn)實挑戰(zhàn)與人文思考 109
5.5 處理數(shù)據(jù)與處理工具:從原始礦藏到精煉燃料 109
5.5.1 數(shù)據(jù)集:NLP的原始礦脈 109
5.5.2 處理工具:數(shù)據(jù)煉金術的熔爐 110
5.5.3 現(xiàn)實難點:煉金術士的荊棘之路 110
5.6 大語言模型的概念:數(shù)字化的語言基因 111
5.6.1 無預設的進化 111
5.6.2 動態(tài)的語義網(wǎng)絡 112
5.7 發(fā)展歷程:從統(tǒng)計模型到認知革命 113
5.7.1 統(tǒng)計機器翻譯時代(2000—2012):笨拙的詞語搬運工 113
5.7.2 深度學習崛起(2013—2017):神經(jīng)網(wǎng)絡的啟蒙運動 113
5.7.3 預訓練模型紀元(從2018年至今):智能的寒武紀大爆發(fā) 113
5.8 技術原理:智能涌現(xiàn)的數(shù)學密碼 114
5.8.1 Transformer:語言的時空折疊術 114
5.8.2 訓練范式知識的煉金術 115
5.8.3 參數(shù)矩陣:智慧的量子糾纏 116
5.8.4 計算煉獄:智能的物理代價 116
5.9 應用場景:從文本生成到社會重構 116
5.9.1 內(nèi)容創(chuàng)作革命:數(shù)字繆斯的覺醒 117
5.9.2 垂直領域突破:專業(yè)智能體的崛起 117
5.9.3 多模態(tài)融合:跨維度的認知飛躍 118
5.9.4 社會重構:文明演進的雙刃劍 118
5.10 生成式人工智能:創(chuàng)造力的數(shù)字覺醒 119
5.10.1 多模態(tài)生成應用圖譜 119
5.10.2 技術基石:創(chuàng)造力的數(shù)學密碼 121
習題 122
第6講 AI應用與發(fā)展 123
6.1 AI在自主智能系統(tǒng)中的應用 123
6.1.1 無人駕駛汽車 123
6.1.2 無人機集群 124
6.1.3 探索機器人 125
6.2 AI在制造業(yè)中的應用 126
6.2.1 工業(yè)缺陷檢測 126
6.2.2 預測性維護 127
6.3 AI在農(nóng)業(yè)中的應用 128
6.3.1 病蟲害檢測與管理 128
6.3.2 智能采摘 129
6.4 AI在智慧城市中的應用 129
6.4.1 智能交通 130
6.4.2 智慧能源管理 131
6.4.3 智能廢料管理 132
6.5 AI在醫(yī)療健康中的應用 133
6.5.1 醫(yī)學影像智能診斷 133
6.5.2 健康監(jiān)測與遠程醫(yī)療 134
6.5.3 AI驅(qū)動的藥物研發(fā) 135
6.6 人工智能的未來發(fā)展趨勢 136
習題 138
第7講 AI安全與倫理 139
7.1 AI安全和隱私問題 139
7.1.1 AI安全性挑戰(zhàn) 139
7.1.2 AI隱私保護 142
7.2 AI倫理和法律問題 143
7.2.1 倫理與AI倫理概念 143
7.2.2 AI倫理困境 144
7.2.3 AI法律困境 146
7.3 AI產(chǎn)生的其他社會問題 147
7.4 AI安全與倫理問題的應對 148
習題 152
實驗平臺 153
實驗任務一 客戶評價情感分析 156
實驗任務二 語音識別 165
實驗任務三 TTS文字轉語音 171
實驗任務四 OCR文字識別 173
參考文獻 177