《數(shù)據挖掘技術》是基于數(shù)據挖掘經典算法及數(shù)據挖掘領域最新研究技術進行數(shù)據分析的教材。全書內容包括數(shù)據挖掘概述、分類算法、聚類算法、關聯(lián)規(guī)則算法及相應典型算法的算法描述及分析等。對當前數(shù)據挖掘的新技術——流數(shù)據挖掘技術、高維聚類算法、分布式數(shù)據挖掘、物聯(lián)網數(shù)據挖掘進行了詳細的介紹。該部分在講述基本概念及典型算法的基礎上配有新研究的算法模型及分析,并有實驗數(shù)據分析及結果顯示。最后對其他數(shù)據挖掘新技術,包括業(yè)務活動監(jiān)控挖掘技術、云計算平臺架構和數(shù)據挖掘方法及思維流程數(shù)據挖掘技術進行了描述。
本書可以作為高等院校信息管理、數(shù)理統(tǒng)計等專業(yè)有關數(shù)據挖掘教學的本科生或者研究生的專業(yè)課教材,也可以作為各類相關培訓班的教材,還可以作為從事數(shù)據分析、智能產品軟件開發(fā)人員的參考書及數(shù)據挖掘愛好者的自學用書。
第1章 數(shù)據挖掘概述 1.1 數(shù)據挖掘的概念 1.1.1 KDD與數(shù)據挖掘 1.1.2 數(shù)據挖掘過程 1.1.3 數(shù)據挖掘任務 1.2 數(shù)據挖掘的發(fā)展歷程 1.3 數(shù)據挖掘 第1章 數(shù)據挖掘概述 1.1 數(shù)據挖掘的概念 1.1.1 KDD與數(shù)據挖掘 1.1.2 數(shù)據挖掘過程 1.1.3 數(shù)據挖掘任務 1.2 數(shù)據挖掘的發(fā)展歷程 1.3 數(shù)據挖掘的分類 1.4 數(shù)據挖掘的研究方法 1.4.1 統(tǒng)計分析方法 1.4.2 決策樹方法 1.4.3 模糊集方法 1.4.4 粗糙集方法 1.4.5 人工神經網絡方法 1.4.6 遺傳算法 1.5 國內外數(shù)據挖掘研究現(xiàn)狀 本章小結 參考文獻第2章 分類算法分析 2.1 分類概念 2.2 分類方法 2.3 決策樹算法 2.3.1 ID3算法 2.3.2 C4.5 算法 2.4 貝葉斯分類 2.5 粗糙集方法 2.5.1 粗糙集模型擴展 2.5.2 粗糙集與其他不確定信息處理理論的關系 2.6 遺傳算法 2.7 其他分類算法 本章小結 參考文獻第3章 聚類算法分析 3.1 聚類分析概述 3.1.1 聚類分析概念 3.1.2 聚類分析中的數(shù)據類型 3.2 聚類分類 3.3 劃分方法 3.3.1 K—means算法 3.3.2 Kmedoid算法 3.4 層次方法 3.4.1 BIRCH算法 3.4.2 CURE算法 3.5 密度方法 3.5.1 DBSCAN算法 3.5.2 OPTICS算法 3.6 網格方法 3.6.1 STING算法 3.6.2 Wavecluster算法 3.7 基于標量化Ⅲ的聚類統(tǒng)計算法 3.7.1 數(shù)學描述 3.7.2 計算方法 3.7.3 文本數(shù)據 3.7.4 應用實例 3.8 其他聚類算法 本章小結 參考文獻第4章 關聯(lián)規(guī)則算法分析 4.1 關聯(lián)規(guī)則概念 4.2 頻繁模式挖掘 4.2.1 Apriori算法 4.2.2 FP-Growth算法 4.2.3 DHP算法 4.2.4 DIC算法 4.3 序列模式挖掘 4.3.1 序列模式挖掘的相關概念 4.3.2 基于Apriori的序列模式挖掘算法 4.3.3 基于序列模式增長的序列模式挖掘算法 4.4 其他關聯(lián)規(guī)則算法 4.4.1 并行Apriori-like算法 4.4.2 并行FP-Growth算法 本章小結 參考文獻第5章 流數(shù)據挖掘技術 5.1 流數(shù)據挖掘技術概述 5.1.1 流數(shù)據概念 5.1.2 流數(shù)據模型 5.1.3 流數(shù)據挖掘算法特點 5.2 流數(shù)據挖掘技術分類 5.2.1 概要數(shù)據結構 5.2.2 滑動窗口技術 5.2.3 多窗口和衰減因子技術 5.2.4 近似技術、自適應技術和子空間技術 5.3 流數(shù)據聚類算法 5.3.1 CluStream算法 5.3.2 STREAM算法 5.3.3 D-Stream算法 5.3.4 GSCDS算法 5.3.5 HCluStrearn算法 5.4 流數(shù)據頻繁項集挖掘算法 5.4.1 FPN算法 5.4.2 NEC算法 5.4.3 Kaal算法 5.5 流數(shù)據分類算法 5.5.1 VFDT算法 5.5.2 CVFDT算法 5.6 多數(shù)據流挖掘算法 5.7 實時數(shù)據流挖掘技術 5.7.1 實時數(shù)據挖掘概述 5.7.2 實時數(shù)據挖掘方法 5.7.3 實時數(shù)據挖掘框架 5.7.4 實時數(shù)據挖掘模型 5.7.5 實時數(shù)據挖掘技術分類 5.8 流數(shù)據聚類演化分析 5.9 流數(shù)據挖掘新技術研究 本章小結 參考文獻第6章 高維聚類算法 6.1 高維聚類算法概述 6.1.1 高維聚類算法 6.1.2 高維度數(shù)據處理方法 6.2 高維數(shù)據流聚類分類 6.3 維度對聚類算法精度的影響 6.3.1 維度對數(shù)據對象間距離的影響 6.3.2 維度對算法聚類精度的影響 6.3.3 傳統(tǒng)方法降維實驗 6.4 混合類型屬性聚類算法 6.4.1 混合類型屬性的處理 6.4.2 UCI數(shù)據集實驗分析 6.4.3 流數(shù)據實驗分析 6.5 基于復相關系數(shù)倒數(shù)的降維 6.5.1 復相關系數(shù) 6.5.2 復相關系數(shù)倒數(shù)加權 6.5.3 降維實驗分析 本章小結 參考文獻第7章 分布式數(shù)據挖掘 7.1 分布式數(shù)據挖掘概述 7.2 分布式聚類算法 7.2.1 分布式聚類算法分析 7.2.2 分布式K-means聚類算法 7.2.3 分布式聚類算法K-DMeans 7.2.4 分布式聚類算法DK-Means 7.3 DRA-Kmeans聚類算法 7.3.1 DRA-Kmeans聚類算法相關技術 7.3.2 DRA-Kmeans局部聚類算法 7.3.3 DRA-Kmeans全局聚類算法 7.4 分布式數(shù)據挖掘新技術研究 本章小結 參考文獻第8章 物聯(lián)網數(shù)據挖掘 8.1 物聯(lián)網數(shù)據挖掘概述 8.2 物聯(lián)網數(shù)據挖掘技術分類 8.2.1 物聯(lián)網環(huán)境下基于分類的數(shù)據挖掘方法 8.2.2 物聯(lián)網環(huán)境下基于關聯(lián)規(guī)則的數(shù)據挖掘方法 8.2.3 物聯(lián)網環(huán)境下基于聚類分析的數(shù)據挖掘方法 8.2.4 物聯(lián)網環(huán)境下基于時間序列分析的數(shù)據挖掘方法 8.3 無線傳感器網絡中的聚類算法 8.4 RA-Cluster算法 8.5 物聯(lián)網路由算法 8.5.1 無線分布式網絡及其路由協(xié)議 8.5.2 物聯(lián)網路由算法分析 8.5.3 RA-AODVjr算法原理 8.5.4 RA-AODVjr算法實驗分析 8.6 物聯(lián)網數(shù)據挖掘新技術研究 本章小結 參考文獻第9章 數(shù)據挖掘新技術 9.1 業(yè)務活動監(jiān)控挖掘技術 9.1.1 業(yè)務活動監(jiān)控概述 9.1.2 業(yè)務活動監(jiān)控系統(tǒng)預測模型 9.1.3 結構數(shù)據挖掘理論 9.2 云計算平臺架構及數(shù)據挖掘方法 9.2.1 基于云計算的分布式數(shù)據挖掘平臺架構 9.2.2 基于云計算的分布式數(shù)據挖掘算法 9.3 思維流程數(shù)據挖掘技術 9.3.1 思維流程發(fā)現(xiàn)的基本思想 9.3.2 思維流程發(fā)現(xiàn)的關鍵任務 9.3.3 思維流程發(fā)現(xiàn)研究的關鍵問題 本章小結 參考文獻