Python網(wǎng)絡數(shù)據(jù)挖掘
定 價:59.9 元
叢書名:高等學校大數(shù)據(jù)專業(yè)系列教材
- 作者:楊波
- 出版時間:2024/12/1
- ISBN:9787302696223
- 出 版 社:清華大學出版社
- 中圖法分類:TP312.8PY
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書將復雜網(wǎng)絡理論與算法實現(xiàn)相結(jié)合,深入淺出地介紹了網(wǎng)絡數(shù)據(jù)挖掘和網(wǎng)絡模擬中的物理機制和相關(guān)算法,然后通過Python語言中的NetworkX和igraph庫加以實現(xiàn),最后對所得結(jié)果進行了分析和討論。全書共12章,分別介紹圖論基礎、網(wǎng)絡基本拓撲特性、節(jié)點重要性、社團探測、鏈路預測、網(wǎng)絡生成模型、滲流相變和網(wǎng)絡魯棒性、Ising模型和網(wǎng)絡博弈、網(wǎng)絡傳播、網(wǎng)絡上的混沌同步、隨機游走與node2vec模型和圖表示學習等知識。本書主要面向廣大從事復雜系統(tǒng)與復雜網(wǎng)絡、網(wǎng)絡科學與工程、社交網(wǎng)絡分析、網(wǎng)絡數(shù)據(jù)挖掘或圖神經(jīng)網(wǎng)絡的專業(yè)人員,從事高等教育的專任教師,高等學校的學生及相關(guān)領域的廣大科研人員。
(1)理論聯(lián)系實際,由淺入深。本書由淺入深、逐步地對復雜網(wǎng)絡的重要概念及算法進行編程實踐、分析探索及可視化,為讀者更好地掌握相關(guān)知識,提供便利和支持。(2)突出重點,強化理解。本書結(jié)合作者近年來的教學和科研經(jīng)驗,突出重點、深入分析,同時在內(nèi)容方面兼顧知識的系統(tǒng)性和完整性。(3)風格簡潔,使用方便。本書風格簡潔明快,對于非重點的內(nèi)容不作長篇論述,以便讀者在學習過程中明確內(nèi)容之間的邏輯關(guān)系,更好地掌握操作系統(tǒng)的內(nèi)容。
前言
黨的二十大報告強調(diào)“必須堅持科技是優(yōu)質(zhì)生產(chǎn)力、人才是優(yōu)質(zhì)資源、創(chuàng)新是優(yōu)質(zhì)動力,深入實施科教興國戰(zhàn)略、人才強國戰(zhàn)略、創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略,開辟發(fā)展新領域新賽道,不斷塑造發(fā)展新動能新優(yōu)勢”。
復雜網(wǎng)絡理論將對象和對象間的聯(lián)系轉(zhuǎn)換為節(jié)點和邊加以描述,以圖論為數(shù)學基礎,融合概率論、信息論、博弈論、傳播學、非線性動力學、圖神經(jīng)網(wǎng)絡、隨機過程、推薦系統(tǒng)、數(shù)據(jù)挖掘、統(tǒng)計物理和復雜系統(tǒng)等知識,已廣泛運用到社交網(wǎng)絡、Internet、WWW、引文網(wǎng)絡、生物網(wǎng)絡、金融網(wǎng)絡、電力和交通網(wǎng)絡等的研究中,逐步發(fā)展為研究事物相關(guān)性的重要手段和方法之一。
主要內(nèi)容
本書強調(diào)抽象概念的實例化,理論和算法的程序化與可視化,以Python為基本編程工具,輔以NumPy、Matplotlib、NetworkX、igraph、PyTorch和PyG等擴展包,力求形象生動地展示網(wǎng)絡數(shù)據(jù)挖掘的相關(guān)內(nèi)容,使讀者可以在短時間內(nèi)上手開展學習和研究工作。
全書從圖論開始,然后逐步介紹網(wǎng)絡數(shù)據(jù)挖掘的各方面知識,共12章。
第1章圖論基礎,包括幾個有趣的圖論問題、圖的定義和基本概念、圖的路和連通性、樹與生成樹、平面圖及其歐拉公式、圖的表示和存儲。第2章網(wǎng)絡基本拓撲特性,包括稀疏性和連通性,度、度分布和度相關(guān)性,平均路徑長度和網(wǎng)絡效率,聚類系數(shù)和圈系數(shù),網(wǎng)絡子結(jié)構(gòu): kclique、環(huán)和模體。第3章節(jié)點重要性,包括無向網(wǎng)絡節(jié)點重要性指標、有向網(wǎng)絡節(jié)點重要性指標、節(jié)點重要性衡量標準。第4章社團探測,包括社團探測基礎、凝聚算法、分裂算法、重疊社團探測算法、其他社團探測算法、社團探測檢測標準。第5章鏈路預測,包括鏈路預測基礎、基于網(wǎng)絡結(jié)構(gòu)相似性的鏈路預測、其他鏈路預測方法。第6章網(wǎng)絡生成模型,包括隨機網(wǎng)絡、小世界網(wǎng)絡、無標度網(wǎng)絡、配置模型。第7章滲流相變和網(wǎng)絡魯棒性,包括滲流相變基礎、規(guī)則格子上的點滲流和邊滲流、ER網(wǎng)絡上的滲流相變、其他滲流相變模型。第8章Ising模型和網(wǎng)絡博弈,包括Ising模型的相變和臨界現(xiàn)象、Ising模型的蒙特卡洛模擬、博弈論和博弈模型、規(guī)則網(wǎng)絡上的空間演化博弈模型、復雜網(wǎng)絡上的空間演化博弈模型。第9章網(wǎng)絡傳播,包括常見傳染病模型、網(wǎng)絡上的傳染病模型、免疫。第10章網(wǎng)絡上的混沌同步,包括非線性動力學和混沌簡介、線性雙耦合系統(tǒng)的同步、網(wǎng)絡上的連續(xù)時間線性耗散耦合。第11章隨機游走與node2vec模型,包括隨機游走簡介、網(wǎng)絡上隨機游走的穩(wěn)態(tài)分布、網(wǎng)絡上隨機游走的特征量、node2vec節(jié)點嵌入模型。第12章圖表示學習,包括圖表示學習簡介、LINE模型、圖卷積神經(jīng)網(wǎng)絡、圖注意力網(wǎng)絡、GraphSAGE圖神經(jīng)網(wǎng)絡、圖分類任務。
本書特色
(1) 理論聯(lián)系實際,由淺入深。
本書由淺入深、逐步地對復雜網(wǎng)絡的重要概念及算法進行編程實踐、分析探索及可視化,為讀者更好地掌握相關(guān)知識提供便利和支持。
(2) 突出重點,強化理解。
本書結(jié)合作者近年來的教學和科研經(jīng)驗,突出重點、深入分析,同時在內(nèi)容方面兼顧知識的系統(tǒng)性和完整性。
(3) 風格簡潔,使用方便。
本書風格簡潔明快,對于非重點的內(nèi)容不作長篇論述,以便讀者在學習過程中明確內(nèi)容之間的邏輯關(guān)系,更好地掌握操作系統(tǒng)的內(nèi)容。
配套資源
為便于教與學,本書配有源代碼、數(shù)據(jù)集、教學課件、教學大綱、教學進度表、期末試卷及答案、案例素材、軟件安裝說明。
(1) 獲取源代碼、數(shù)據(jù)集等方式: 先刮開并用手機版微信App掃描本書封底的文泉云盤防盜碼,授權(quán)后再掃描下方二維碼,即可獲取。
源代碼、數(shù)據(jù)集
案例素材
軟件安裝說明
彩色圖片
(2) 其他配套資源可以掃描本書封底的“書圈”二維碼,關(guān)注后回復本書書號,即可下載。
讀者對象
本書主要面向廣大從事復雜系統(tǒng)與復雜網(wǎng)絡、網(wǎng)絡科學與工程、社交網(wǎng)絡分析、網(wǎng)絡數(shù)據(jù)挖掘或圖神經(jīng)網(wǎng)絡的專業(yè)人員,從事高等教育的專任教師,高等學校的學生及相關(guān)領域的廣大科研人員。
在編寫本書的過程中,作者參考了諸多相關(guān)資料,在此對相關(guān)資料的作者表示衷心的感謝。限于個人水平和時間倉促,書中難免存在疏漏之處,歡迎廣大讀者批評指正。
作者
2025年5月
目錄
第1章圖論基礎
1.1幾個有趣的圖論問題
1.1.1哥尼斯堡七橋問題
1.1.2哈密頓周游世界問題
1.1.3旅行推銷員問題
1.1.4中國郵路問題
1.1.5四色問題
1.1.6迷宮問題
1.1.7可平面化問題
1.2圖的定義和基本概念
1.2.1簡單圖
1.2.2有向圖
1.2.3加權(quán)圖
1.2.4圖間的關(guān)系
1.2.5特殊圖
1.3圖的路和連通性
1.3.1通道、跡和路
1.3.2連通性
1.3.3節(jié)點間的距離
1.3.4歐拉圖和哈密頓圖
1.4樹與生成樹
1.5平面圖及其歐拉公式
1.6圖的表示和存儲
第2章網(wǎng)絡基本拓撲特性
2.1稀疏性和連通性
2.1.1網(wǎng)絡基本信息
2.1.2網(wǎng)絡密度
2.1.3網(wǎng)絡連通性
2.2度、度分布和度相關(guān)性
2.2.1度
2.2.2度分布
2.2.3冪律分布
2.2.4度相關(guān)性和同配性
2.2.5判斷網(wǎng)絡同配性的方法
2.3平均路徑長度和網(wǎng)絡效率
2.3.1平均路徑長度
2.3.2網(wǎng)絡直徑
2.3.3網(wǎng)絡效率
2.4聚類系數(shù)和圈系數(shù)
2.4.1聚類系數(shù)
2.4.2圈系數(shù)
2.5網(wǎng)絡子結(jié)構(gòu): kclique、環(huán)和模體
2.5.1kclique
2.5.2環(huán)
2.5.3模體
第3章節(jié)點重要性
3.1無向網(wǎng)絡節(jié)點重要性指標
3.1.1度中心性
3.1.2接近度中心性
3.1.3介數(shù)中心性
3.1.4特征向量中心性
3.1.5H指數(shù)
3.1.6k殼分解
3.2有向網(wǎng)絡節(jié)點重要性指標
3.2.1HITS算法
3.2.2PageRank算法
3.3節(jié)點重要性衡量標準
3.3.1靜態(tài)魯棒性
3.3.2動態(tài)魯棒性
3.3.3級聯(lián)失效模型
第4章社團探測
4.1社團探測基礎
4.1.1社團的定義
4.1.2基準網(wǎng)絡
4.1.3模塊度
4.1.4社團探測算法
4.2凝聚算法
4.2.1FN算法
4.2.2CNM算法
4.2.3魯汶算法
4.2.4其他凝聚算法
4.3分裂算法
4.4重疊社團探測算法
4.4.1派系過濾算法
4.4.2邊聚類算法
4.5其他社團探測算法
4.5.1基于拉普拉斯矩陣的譜平分算法
4.5.2基于信息編碼的Infomap算法
4.5.3標簽傳播算法
4.6社團探測檢測標準
第5章鏈路預測
5.1鏈路預測基礎
5.1.1訓練集和測試集
5.1.2鏈路預測的衡量指標
5.1.3鏈路預測方法
5.2基于網(wǎng)絡結(jié)構(gòu)相似性的鏈路預測
5.2.1優(yōu)先連接
5.2.2基于共同鄰居的相似性指標
5.2.3基于路徑的相似性指標
5.2.4基于隨機游走的相似性指標
5.3其他鏈路預測方法
5.3.1基于似然分析的鏈路預測
5.3.2基于機器學習的鏈路預測
第6章網(wǎng)絡生成模型
6.1隨機網(wǎng)絡
6.1.1網(wǎng)絡生成算法
6.1.2網(wǎng)絡的基本拓撲特性
6.2小世界網(wǎng)絡
6.2.1WS小世界網(wǎng)絡
6.2.2NW小世界網(wǎng)絡
6.3無標度網(wǎng)絡
6.3.1BA無標度網(wǎng)絡的度分布
6.3.2BA無標度網(wǎng)絡的聚類系數(shù)
6.3.3BA無標度網(wǎng)絡的平均路徑長度
6.3.4無標度網(wǎng)絡冪指數(shù)的測定
6.4配置模型
第7章滲流相變和網(wǎng)絡魯棒性
7.1滲流相變基礎
7.2規(guī)則格子上的點滲流和邊滲流
7.2.1二維正方格子上的點滲流
7.2.2二維正方格子上的邊滲流
7.3ER網(wǎng)絡上的滲流相變
7.3.1G(N,p)隨機網(wǎng)絡上的滲流
7.3.2G(N,M)隨機網(wǎng)絡上的滲流
7.4其他滲流相變模型
7.4.1kclique滲流相變
7.4.2kcore滲流相變
7.5實際網(wǎng)絡中的滲流/網(wǎng)絡魯棒性
第8章Ising模型和網(wǎng)絡博弈
8.1Ising模型的相變和臨界現(xiàn)象
8.2Ising模型的蒙特卡洛模擬
8.2.1Metropolis算法
8.2.2蒙特卡洛模擬
8.3博弈論和博弈模型
8.3.1博弈論
8.3.2博弈模型
8.3.3演化博弈模型
8.4規(guī)則網(wǎng)絡上的空間演化博弈模型
8.4.1博弈模型
8.4.2演化規(guī)則
8.4.3博弈模型的計算機模擬
8.5復雜網(wǎng)絡上的空間演化博弈模型
8.5.1WS小世界網(wǎng)絡上的弱囚徒博弈
8.5.2BA無標度網(wǎng)絡上的弱囚徒博弈
第9章網(wǎng)絡傳播
9.1常見傳染病模型
9.1.1SI模型
9.1.2SIS模型
9.1.3SIR模型
9.2網(wǎng)絡上的傳染病模型
9.2.1網(wǎng)絡上的SI模型
9.2.2網(wǎng)絡上的SIS模型
9.2.3網(wǎng)絡上的SIR模型
9.3免疫
9.3.1隨機免疫
9.3.2目標免疫
9.3.3熟人免疫
第10章網(wǎng)絡上的混沌同步
10.1非線性動力學和混沌簡介
10.2線性雙耦合系統(tǒng)的同步
10.3網(wǎng)絡上的連續(xù)時間線性耗散耦合
10.3.1網(wǎng)絡同步的計算機模擬
10.3.2網(wǎng)絡同步判據(jù)
第11章隨機游走與node2vec模型
11.1隨機游走簡介
11.1.1一維隨機游走
11.1.2二維隨機游走
11.2網(wǎng)絡上隨機游走的穩(wěn)態(tài)分布
11.3網(wǎng)絡上隨機游走的特征量
11.3.1平均首達時間
11.3.2平均返回時間
11.3.3覆蓋時間
11.3.4平均通勤時間
11.4node2vec節(jié)點嵌入模型
第12章圖表示學習
12.1圖表示學習簡介
12.2LINE模型
12.3圖卷積神經(jīng)網(wǎng)絡
12.4圖注意力網(wǎng)絡
12.4.1計算注意力權(quán)重
12.4.2加權(quán)求和
12.5GraphSAGE圖神經(jīng)網(wǎng)絡
12.6圖分類任務
參考文獻