知識圖譜:基礎(chǔ)、技術(shù)與應(yīng)用
定 價:149.8 元
- 作者:[美] 馬揚(yáng)克·柯內(nèi)瓦爾(Mayank Kejriwal) [美] 克雷格·A. 諾布洛克(Craig A. Knoblock) [哥倫比亞] 佩德羅·塞凱伊(Pedro Szekely)
- 出版時間:2025/10/1
- ISBN:9787115682635
- 出 版 社:人民郵電出版社
- 中圖法分類:G302
- 頁碼:354
- 紙張:
- 版次:01
- 開本:16開
知識圖譜以直觀方式呈現(xiàn)實體間的關(guān)系,能夠有效整合、表示和挖掘復(fù)雜知識,為信息檢索、智能問答、數(shù)據(jù)分析等眾多領(lǐng)域提供強(qiáng)大的知識支撐。本書系統(tǒng)講解知識圖譜的完整體系,從基礎(chǔ)到應(yīng)用層層深入。第一部分介紹基礎(chǔ)知識,內(nèi)容包括知識圖譜的建模和表示方法。第二部分聚焦知識圖譜構(gòu)建過程,涵蓋領(lǐng)域發(fā)現(xiàn)、命名實體識別、信息提取等技術(shù)。第三部分講解知識圖譜補(bǔ)全技術(shù),包括實例匹配、統(tǒng)計關(guān)系學(xué)習(xí)等。第四部分闡述知識圖譜的訪問方式,涉及推理、檢索、結(jié)構(gòu)化查詢及問答。第五部分展現(xiàn)知識圖譜生態(tài)系統(tǒng),介紹關(guān)聯(lián)數(shù)據(jù)及知識圖譜在多個領(lǐng)域中的應(yīng)用。
從數(shù)據(jù)混沌到智能洞察,用知識圖譜讀懂AI世界
* 全景式展現(xiàn)知識圖譜知識體系
* MIT機(jī)器學(xué)習(xí)叢書系列新作
* 近130道精選習(xí)題
系統(tǒng)講解知識圖譜的完整體系,從基礎(chǔ)到應(yīng)用層層深入
馬揚(yáng)克·柯內(nèi)瓦爾(Mayank Kejriwal)
美國南加州大學(xué)工業(yè)與系統(tǒng)工程系研究副教授,他擁有計算機(jī)科學(xué)博士學(xué)位,其畢業(yè)論文獲2017年語義網(wǎng)科學(xué)協(xié)會最佳論文獎。他在ISWC、AAAI等頂會/期刊上發(fā)表論文40余篇,并入選2019年Forbes 30 Under 30科學(xué)榜。
克雷格·A. 諾布洛克(Craig A. Knoblock)
AAAI會士、ACM會士,美國南加州大學(xué)信息科學(xué)研究所執(zhí)行所長、知識圖譜研究中心研究主任,卡內(nèi)基?梅隆大學(xué)計算機(jī)科學(xué)博士,曾任國際人工智能聯(lián)合會議(IJCAI)主席及理事,人工智能重要獎項羅伯特·S. 恩格爾莫爾獎得主。
佩德羅·塞凱伊(Pedro Szekely)
亞馬遜首席應(yīng)用科學(xué)家,卡內(nèi)基?梅隆大學(xué)計算機(jī)科學(xué)博士,曾任職于美國南加州大學(xué)信息科學(xué)研究所及多個學(xué)術(shù)會議程序委員會。他在“領(lǐng)域洞察圖譜”方面的研究成果榮獲多項最佳論文獎。
第 一部分 知識圖譜基礎(chǔ)知識
第 1章 知識圖譜導(dǎo)論 2
1.1 圖 2
1.2 將知識表示為圖 3
1.3 知識圖譜應(yīng)用案例 7
1.3.1 案例1:學(xué)術(shù)出版物和學(xué)者 7
1.3.2 案例2:電子商務(wù)、產(chǎn)品和公司 8
1.3.3 案例3:社會網(wǎng)絡(luò) 8
1.3.4 案例4:地緣政治事件 9
1.4 如何閱讀本書 11
1.5 本章小結(jié) 11
1.6 軟件和資源 12
1.7 文獻(xiàn)注釋 12
1.8 習(xí)題 14
第 2章 知識圖譜建模與表示 16
2.1 概覽 16
2.1.1 RDF 17
2.1.2 RDF 序列化 20
2.2 RDF 模式 22
2.2.1 RDF 模式的類別 22
2.2.2 RDF 模式的屬性 24
2.3 以屬性為中心的模型 25
2.4 Wikidata 模型 26
2.4.1 Wikidata 數(shù)據(jù)項 29
2.4.2 Wikidata 屬性 30
2.5 語義網(wǎng)多層蛋糕 32
2.6 模式異質(zhì)性和語義標(biāo)記 33
2.7 本章小結(jié) 35
2.8 軟件和資源 35
2.9 文獻(xiàn)注釋 36
2.10 習(xí)題 38
第二部分 知識圖譜構(gòu)建
第3章 領(lǐng)域發(fā)現(xiàn) 42
3.1 概覽 42
3.2 聚焦抓取 44
3.2.1 設(shè)計要素 45
3.2.2 最佳優(yōu)先爬蟲 47
3.2.3 語義爬蟲 48
3.2.4 學(xué)習(xí)爬蟲 49
3.2.5 聚焦抓取的性能評估 50
3.3 有影響力的系統(tǒng)和方法 51
3.3.1 語境爬蟲 51
3.3.2 領(lǐng)域發(fā)現(xiàn)工具 53
3.4 本章小結(jié) 57
3.5 軟件和資源 57
3.6 文獻(xiàn)注釋 58
3.7 習(xí)題 60
第4章 命名實體識別 62
4.1 概覽 62
4.2 為什么很難提取信息 65
4.3 命名實體識別方法 66
4.3.1 監(jiān)督學(xué)習(xí)方法 67
4.3.2 半監(jiān)督學(xué)習(xí)方法和無監(jiān)督學(xué)習(xí)方法 70
4.4 用于命名實體識別的深度學(xué)習(xí) 71
4.5 具體領(lǐng)域的命名實體識別 73
4.6 評估信息提取質(zhì)量 73
4.7 本章小結(jié) 74
4.8 軟件和資源 75
4.9 文獻(xiàn)注釋 75
4.10 習(xí)題 77
第5章 互聯(lián)網(wǎng)信息提取 78
5.1 概覽 78
5.2 生成包裝器 81
5.2.1 手動構(gòu)建的包裝器和監(jiān)督包裝器 82
5.2.2 半監(jiān)督包裝器 85
5.2.3 無監(jiān)督包裝器 86
5.2.4 實證比較分析 89
5.3 不止包裝器:針對結(jié)構(gòu)化數(shù)據(jù)的信息提取 90
5.4 本章小結(jié) 95
5.5 軟件和資源 96
5.6 文獻(xiàn)注釋 97
5.7 習(xí)題 98
第6章 關(guān)系提取 100
6.1 概覽 100
6.2 本體和相關(guān)項目 102
6.2.1 ACE 102
6.2.2 其他本體:簡要入門 104
6.3 關(guān)系提取技術(shù) 105
6.3.1 監(jiān)督關(guān)系提取 105
6.3.2 評估監(jiān)督關(guān)系提取 108
6.3.3 半監(jiān)督關(guān)系提取 108
6.3.4 無監(jiān)督關(guān)系提取 110
6.4 最近的研究:針對關(guān)系提取的深度學(xué)習(xí) 111
6.5 關(guān)系提取拓展:事件提取和聯(lián)合信息提取 114
6.6 本章小結(jié) 115
6.7 軟件和資源 115
6.8 文獻(xiàn)注釋 116
6.9 習(xí)題 117
第7章 非傳統(tǒng)信息提取 118
7.1 概覽 118
7.2 開放信息提取 119
7.2.1 KnowItAll 124
7.2.2 TextRunner 125
7.2.3 評估和比較不同的開放信息提取系統(tǒng) 126
7.3 社交媒體信息提取 128
7.3.1 TWICAL 129
7.3.2 TwitIE 130
7.4 其他非傳統(tǒng)信息提取類型 131
7.5 本章小結(jié) 132
7.6 軟件和資源 133
7.7 文獻(xiàn)注釋 134
7.8 習(xí)題 135
第三部分 知識圖譜補(bǔ)全
第8章 實例匹配 138
8.1 概覽 138
8.2 形式 140
8.3 為什么實例匹配具有挑戰(zhàn)性 142
8.4 兩步流程 142
8.4.1 分塊步驟 143
8.4.2 相似性步驟 150
8.5 評估兩步流程 153
8.5.1 評估分塊步驟 154
8.5.2 評估相似性步驟 155
8.6 后相似性步驟 156
8.6.1 聚類和傳遞閉包 156
8.6.2 實體命名系統(tǒng) 158
8.7 用Swoosh 形式化實例匹配 160
8.8 關(guān)于研究前沿的說明 162
8.9 不限于實例匹配的數(shù)據(jù)清理 164
8.10 本章小結(jié) 168
8.11 軟件和資源 168
8.12 文獻(xiàn)注釋 170
8.13 習(xí)題 171
第9章 統(tǒng)計關(guān)系學(xué)習(xí) 175
9.1 概覽 175
9.2 依存關(guān)系建模 176
9.3 統(tǒng)計關(guān)系學(xué)習(xí)框架 177
9.3.1 馬爾可夫邏輯網(wǎng)絡(luò) 178
9.3.2 概率軟邏輯 182
9.4 知識圖譜識別 183
9.4.1 表示不確定的提取內(nèi)容 184
9.4.2 表示實例匹配輸出 185
9.4.3 執(zhí)行本體約束 185
9.4.4 整合:非確定知識圖譜的概率分布 186
9.4.5 關(guān)于實驗性能的說明 186
9.5 其他應(yīng)用 186
9.5.1 集合分類 187
9.5.2 鏈接預(yù)測 187
9.5.3 社會網(wǎng)絡(luò)建模 187
9.6 高級研究領(lǐng)域:數(shù)據(jù)編程 187
9.7 本章小結(jié) 188
9.8 軟件和資源 188
9.9 文獻(xiàn)注釋 189
9.10 習(xí)題 190
第 10章 知識圖譜表示學(xué)習(xí) 191
10.1 概覽 191
10.2 嵌入式架構(gòu):入門 193
10.2.1 CBOW 模型 194
10.2.2 skip-gram 模型 195
10.3 超越詞嵌入 195
10.4 知識圖譜嵌入 196
10.5 有影響力的知識圖譜嵌入系統(tǒng) 199
10.5.1 結(jié)構(gòu)化嵌入 199
10.5.2 神經(jīng)張量網(wǎng)絡(luò) 201
10.5.3 平移嵌入模型 202
10.5.4 TransE 203
10.5.5 其他Trans*算法 204
10.6 超事實語境 208
10.6.1 實體類型 208
10.6.2 文本描述 209
10.6.3 超越文本和概念:其他信息集 210
10.7 應(yīng)用 211
10.7.1 鏈接預(yù)測 211
10.7.2 三元組分類 212
10.7.3 實體分類 213
10.7.4 重溫實例匹配 213
10.7.5 其他應(yīng)用 214
10.8 本章小結(jié) 214
10.9 軟件和資源 215
10.10 文獻(xiàn)注釋 215
10.11 習(xí)題 216
第四部分 訪問知識圖譜
第 11章 推理與檢索 220
11.1 概覽 220
11.2 推理 222
11.2.1 描述邏輯:簡要入門 223
11.2.2 網(wǎng)絡(luò)本體語言 224
11.2.3 范例推理框架:Protégé 228
11.3 檢索 229
11.4 對比檢索與推理 231
11.4.1 評估 232
11.4.2 范例檢索框架:Lucene 237
11.5 本章小結(jié) 238
11.6 軟件和資源 239
11.7 文獻(xiàn)注釋 239
11.8 習(xí)題 240
第 12章 結(jié)構(gòu)化查詢 243
12.1 概覽 243
12.2 SPARQL 243
12.3 知識圖譜查詢的關(guān)系處理 246
12.3.1 三元組(垂直)表存儲 247
12.3.2 屬性表存儲 248
12.3.3 水平表存儲 249
12.4 NoSQL 250
12.4.1 鍵 值存儲 251
12.4.2 圖數(shù)據(jù)庫 254
12.4.3 具有極高可擴(kuò)展性的NoSQL 數(shù)據(jù)庫 259
12.5 本章小結(jié) 261
12.6 軟件和資源 261
12.7 文獻(xiàn)注釋 262
12.8 習(xí)題 263
第 13章 問答 266
13.1 概覽 266
13.2 作為獨立應(yīng)用的問答 267
13.2.1 從會話式對話中學(xué)習(xí):KnowBot 268
13.2.2 BERT 269
13.2.3 知識圖譜的必要性 272
13.3 作為知識圖譜查詢的問答 273
13.3.1 挑戰(zhàn)與解決方法 274
13.3.2 基于模板的解決方案 280
13.3.3 語義問答評估 281
13.4 本章小結(jié) 282
13.5 軟件和資源 283
13.5.1 BERT 和基于語言模型的問答系統(tǒng) 283
13.5.2 HOBBIT 283
13.6 文獻(xiàn)注釋 283
13.7 習(xí)題 285
第五部分 知識圖譜生態(tài)系統(tǒng)
第 14章 關(guān)聯(lián)數(shù)據(jù) 288
14.1 概覽 288
14.1.1 原則1 292
14.1.2 原則2 292
14.1.3 原則3 294
14.1.4 原則4 294
14.2 關(guān)聯(lián)數(shù)據(jù)原則的影響和采用 295
14.3 關(guān)聯(lián)開放數(shù)據(jù)生態(tài)系統(tǒng)中的重要知識圖譜 297
14.3.1 DBpedia 298
14.3.2 GeoNames 298
14.3.3 YAGO 299
14.3.4 Wikidata 299
14.3.5 UMBEL 300
14.3.6 FOAF 301
14.3.7 其他例子 302
14.4 本章小結(jié) 302
14.5 軟件和資源 303
14.6 文獻(xiàn)注釋 303
14.7 習(xí)題 304
第 15章 企業(yè)和政府機(jī)構(gòu) 305
15.1 概覽 305
15.2 企業(yè) 306
15.2.1 知識寶庫 308
15.2.2 社交媒體和開放圖譜協(xié)議 311
15.2.3 Schema 網(wǎng)站 312
15.3 政府機(jī)構(gòu)和非營利組織 313
15.3.1 公開政務(wù)數(shù)據(jù) 313
15.3.2 BBC 315
15.4 未來展望 316
15.5 本章小結(jié) 317
15.6 軟件和資源 317
15.7 文獻(xiàn)注釋 318
15.8 習(xí)題 320
第 16章 自然科學(xué)領(lǐng)域中的知識圖譜和本體 322
16.1 概覽 322
16.2 生物學(xué) 323
16.3 化學(xué) 328
16.3.1 ChEBI 328
16.3.2 PubChem 330
16.4 地球科學(xué)、環(huán)境科學(xué)和地理科學(xué) ... 330
16.4.1 SWEET 330
16.4.2 GEON 門戶和OpenTopography 332
16.4.3 ENVO 333
16.5 本章小結(jié) 335
16.6 軟件和資源 335
16.7 文獻(xiàn)注釋 336
16.8 習(xí)題 337
第 17章 在特定領(lǐng)域具有社會影響力的知識圖譜 338
17.1 概覽 338
17.2 DIG 339
17.2.1 領(lǐng)域設(shè)置 340
17.2.2 領(lǐng)域探索 344
17.3 替代方案:DeepDive 346
17.4 應(yīng)用和用例 347
17.4.1 調(diào)查領(lǐng)域 347
17.4.2 危機(jī)信息學(xué) 350
17.5 本章小結(jié) 351
17.6 軟件和資源 352
17.7 文獻(xiàn)注釋 352
17.8 習(xí)題 354