對(duì)抗性機(jī)器學(xué)習(xí)安全
定 價(jià):149.8 元
- 作者:沈超
- 出版時(shí)間:2025/10/1
- ISBN:9787115659446
- 出 版 社:人民郵電出版社
- 中圖法分類:TP181
- 頁碼:222
- 紙張:
- 版次:01
- 開本:小16開
為了響應(yīng)國(guó)家健康發(fā)展人工智能技術(shù)的戰(zhàn)略,針對(duì)國(guó)家、社會(huì)、個(gè)人對(duì)于提高機(jī)器學(xué)習(xí)安全與數(shù)據(jù)隱私保護(hù)的迫切需求,本書聚焦機(jī)器學(xué)習(xí)攻防對(duì)抗問題,根據(jù)機(jī)器學(xué)習(xí)的生命周期系統(tǒng)梳理了包括模型訓(xùn)練、模型推理、算法實(shí)踐3個(gè)階段的安全與隱私相關(guān)問題,并深入探討了常見的攻防對(duì)抗場(chǎng)景及對(duì)應(yīng)場(chǎng)景面臨的安全威脅與隱私風(fēng)險(xiǎn),如數(shù)據(jù)隱私泄露、模型后門攻擊等。此外,本書還展望了提升模型安全性的可行方案,為讀者提供了理論與實(shí)踐結(jié)合的全面視角。
本書可供網(wǎng)絡(luò)空間安全、計(jì)算機(jī)科學(xué)與技術(shù)、人工智能等相關(guān)專業(yè)的高年級(jí)本科生和研究生閱讀,尤其適合具備機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)、網(wǎng)絡(luò)安全等基礎(chǔ)知識(shí)的讀者。
1、本書聚焦機(jī)器學(xué)習(xí)攻防對(duì)抗問題,根據(jù)機(jī)器學(xué)習(xí)的生命周期系統(tǒng)梳理了包括模型訓(xùn)練、模型推理、算法實(shí)踐3個(gè)階段的安全與隱私相關(guān)問題;
2、本書深入探討了常見的攻防對(duì)抗場(chǎng)景及對(duì)應(yīng)場(chǎng)景面臨的安全威脅與隱私風(fēng)險(xiǎn),如數(shù)據(jù)隱私泄露、模型后門攻擊等;
3、本書還展望了提升模型安全性的可行方案,提供了豐富的實(shí)戰(zhàn)案例和理論分析,為讀者提供了理論與實(shí)踐結(jié)合的全面視角。
沈超,西安交通大學(xué)二級(jí)教授,教育部長(zhǎng)江學(xué)者特聘教授,國(guó)家自然科學(xué)基金委創(chuàng)新群體B負(fù)責(zé)人,教育部創(chuàng)新團(tuán)隊(duì)負(fù)責(zé)人,科學(xué)探索獎(jiǎng)、達(dá)摩院青橙獎(jiǎng)、基金委優(yōu)青獲得者,信息物理融合系統(tǒng)教育部工程研究中心主任,國(guó)家重點(diǎn)研發(fā)計(jì)劃首席科學(xué)家,國(guó)家基礎(chǔ)加強(qiáng)計(jì)劃技術(shù)首席科學(xué)家,國(guó)家重點(diǎn)研發(fā)計(jì)劃“先進(jìn)計(jì)算與新興軟件”重點(diǎn)專項(xiàng)指南專家組成員,麻省理工MIT TR35 China、霍英東青年教師一等獎(jiǎng)、IEEE SMC Early Career Award、陜西省青年五四獎(jiǎng)?wù)芦@得者。主要從事智能系統(tǒng)安全與控制、人工智能可信與安全、智能軟硬件測(cè)試的研究,在IEEE S&P、ACM CCS、USENIX Security、ICSE、ASE、ICML、NIPS等計(jì)算機(jī)和自動(dòng)化領(lǐng)域的學(xué)術(shù)刊物上發(fā)表論文100余篇,獲學(xué)術(shù)會(huì)議最佳論文獎(jiǎng)12項(xiàng),2021—2025年連續(xù)5年入選全球前2%頂尖科學(xué)家榜單。
第 1章 對(duì)抗性機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí) 001
1.1 監(jiān)督學(xué)習(xí) 002
1.1.1 分類 002
1.1.2 回歸 004
1.1.3 對(duì)抗環(huán)境中的監(jiān)督學(xué)習(xí) 006
1.2 無監(jiān)督學(xué)習(xí) 006
1.2.1 聚類 007
1.2.2 降維 009
1.2.3 對(duì)抗環(huán)境中的無監(jiān)督學(xué)習(xí) 011
1.3 半監(jiān)督學(xué)習(xí) 011
1.3.1 半監(jiān)督學(xué)習(xí)的3個(gè)基本假設(shè) 011
1.3.2 半監(jiān)督學(xué)習(xí)在分類和回歸兩種場(chǎng)景下的應(yīng)用 012
1.4 強(qiáng)化學(xué)習(xí) 012
1.4.1 強(qiáng)化學(xué)習(xí)概述 013
1.4.2 有模型學(xué)習(xí) 016
1.4.3 基于學(xué)習(xí)的預(yù)測(cè) 018
1.4.4 對(duì)抗環(huán)境中的強(qiáng)化學(xué)習(xí) 023
1.5 深度學(xué)習(xí) 023
1.5.1 多層感知器 024
1.5.2 卷積神經(jīng)網(wǎng)絡(luò) 025
1.5.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 026
1.5.4 對(duì)抗環(huán)境中的深度學(xué)習(xí) 027
1.6 本章小結(jié) 029
參考文獻(xiàn) 029
第 2章 對(duì)抗性機(jī)器學(xué)習(xí)與隱私攻防 032
2.1 對(duì)抗與隱私攻擊分類 032
2.1.1 對(duì)抗性攻擊 032
2.1.2 對(duì)抗性機(jī)器學(xué)習(xí)與隱私攻擊場(chǎng)景 033
2.1.3 訓(xùn)練階段的攻擊 037
2.1.4 推理階段的攻擊 038
2.2 對(duì)抗與隱私防御分類 040
2.2.1 對(duì)抗性防御 040
2.2.2 對(duì)抗性機(jī)器學(xué)習(xí)防御場(chǎng)景 041
2.2.3 訓(xùn)練階段攻擊防御 043
2.2.4 推理階段攻擊防御 045
2.3 本章小結(jié) 047
參考文獻(xiàn) 048
第3章 訓(xùn)練階段的攻擊 054
3.1 數(shù)據(jù)投毒攻擊 054
3.1.1 數(shù)據(jù)投毒攻擊概述 055
3.1.2 破壞可用性目標(biāo)的數(shù)據(jù)投毒攻擊 056
3.1.3 破壞完整性目標(biāo)的數(shù)據(jù)投毒攻擊 062
3.2 模型投毒攻擊 066
3.2.1 模型投毒攻擊概述 066
3.2.2 模型更新投毒攻擊 067
3.2.3 聯(lián)邦數(shù)據(jù)投毒攻擊 072
3.3 模型后門攻擊 076
3.3.1 模型后門攻擊概述 077
3.3.2 模型后門觸發(fā)器 079
3.3.3 模型后門訓(xùn)練數(shù)據(jù)集 082
3.3.4 模型后門植入階段 084
3.4 本章小結(jié) 086
參考文獻(xiàn) 086
第4章 訓(xùn)練階段的防御 089
4.1 數(shù)據(jù)投毒防御 089
4.1.1 數(shù)據(jù)投毒防御概述 090
4.1.2 數(shù)據(jù)投毒檢測(cè) 091
4.1.3 數(shù)據(jù)投毒修復(fù) 093
4.2 模型投毒防御 095
4.2.1 魯棒性聯(lián)邦學(xué)習(xí)聚合算法 095
4.2.2 魯棒性聯(lián)邦學(xué)習(xí)協(xié)議 097
4.3 模型后門防御 099
4.3.1 模型后門防御概述 099
4.3.2 基于模型輸入的防御方法 100
4.3.3 基于模型參數(shù)的防御方法 103
4.4 本章小結(jié) 105
參考文獻(xiàn) 106
第5章 推理階段的攻擊 109
5.1 數(shù)字域?qū)构? 109
5.1.1 數(shù)字域白盒對(duì)抗攻擊 110
5.1.2 數(shù)字域黑盒對(duì)抗攻擊 116
5.2 物理域?qū)构? 123
5.2.1 物理域?qū)构舾攀? 124
5.2.2 物理域?qū)构舴椒? 124
5.3 隱私攻擊 132
5.3.1 模型逆向攻擊 133
5.3.2 成員推理攻擊 137
5.3.3 模型竊取攻擊 141
5.4 本章小結(jié) 144
參考文獻(xiàn) 145
第6章 推理階段的防御 148
6.1 數(shù)字域?qū)构舴烙? 148
6.1.1 基于修改輸入的對(duì)抗攻擊防御 149
6.1.2 基于修改網(wǎng)絡(luò)結(jié)構(gòu)的對(duì)抗攻擊防御 150
6.1.3 基于訓(xùn)練過程的對(duì)抗攻擊防御 151
6.1.4 基于對(duì)抗樣本檢測(cè)的對(duì)抗攻擊防御 153
6.1.5 數(shù)字域?qū)构舴烙渌侄? 155
6.2 物理域?qū)构舴烙? 155
6.2.1 物理域?qū)构舻奶厥庑? 156
6.2.2 物理域?qū)构舴烙椒? 158
6.3 隱私攻擊防御 160
6.3.1 模型堆疊 161
6.3.2 模型水印 163
6.3.3 差分隱私 166
6.4 本章小結(jié) 171
參考文獻(xiàn) 172
第7章 對(duì)抗性機(jī)器學(xué)習(xí)算法實(shí)踐 174
7.1 機(jī)器學(xué)習(xí)可解釋性 174
7.1.1 內(nèi)生可解釋性 175
7.1.2 后置可解釋性 176
7.1.3 可解釋性的應(yīng)用 178
7.2 機(jī)器學(xué)習(xí)公平性 179
7.2.1 公平性準(zhǔn)則 179
7.2.2 公平性測(cè)試 182
7.2.3 公平性修復(fù) 184
7.3 機(jī)器學(xué)習(xí)框架漏洞 185
7.3.1 機(jī)器學(xué)習(xí)框架性能漏洞 187
7.3.2 機(jī)器學(xué)習(xí)框架環(huán)境漏洞 188
7.3.3 機(jī)器學(xué)習(xí)框架功能漏洞 189
7.4 深度偽造生成 191
7.4.1 深度偽造生成概述 191
7.4.2 深度偽造人臉生成 192
7.4.3 文本內(nèi)容生成 196
7.5 深度偽造檢測(cè) 198
7.5.1 深度偽造檢測(cè)概述 198
7.5.2 深度偽造人臉檢測(cè) 199
7.5.3 生成文本檢測(cè) 202
7.6 本章小結(jié) 204
參考文獻(xiàn) 205
第8章 對(duì)抗性機(jī)器學(xué)習(xí)與安全的展望 209
8.1 訓(xùn)練階段攻擊展望 209
8.2 訓(xùn)練階段防御展望 210
8.3 推理階段攻擊展望 211
8.4 推理階段防御展望 212
8.5 對(duì)抗性機(jī)器學(xué)習(xí)展望 213
參考文獻(xiàn) 214
名詞索引 218