數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘教程(21世紀(jì)高等學(xué)校規(guī)劃教材·計(jì)算機(jī)科學(xué)與技術(shù))
定 價(jià):54.9 元
當(dāng)前圖書(shū)已被 5 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:黃德才
- 出版時(shí)間:2016/7/4
- ISBN:9787302434122
- 出 版 社:清華大學(xué)出版社
- 中圖法分類(lèi):TP311.13
- 頁(yè)碼:405
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16K
本書(shū)較詳細(xì)地介紹了數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的原理、方法及應(yīng)用技術(shù)。全書(shū)共有14章,分為4篇。第1章為緒論篇,介紹數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的基本概念及其相互關(guān)系;第2~6章為數(shù)據(jù)倉(cāng)庫(kù)原理及應(yīng)用篇,主要介紹數(shù)據(jù)倉(cāng)庫(kù)的概念模型、邏輯模型和物理模型,以及數(shù)據(jù)倉(cāng)庫(kù)的規(guī)劃、設(shè)計(jì)、實(shí)施和OLAP應(yīng)用等;第7~10章為傳統(tǒng)數(shù)據(jù)挖掘原理及算法篇,介紹數(shù)據(jù)的屬性類(lèi)型與相似性度量、關(guān)聯(lián)規(guī)則挖掘、分類(lèi)規(guī)則挖掘、聚類(lèi)分析和離群點(diǎn)挖掘算法等;第11~14章為數(shù)據(jù)挖掘創(chuàng)新篇,主要內(nèi)容取自編者近年指導(dǎo)研究生發(fā)表的學(xué)術(shù)論文,并根據(jù)教學(xué)需要進(jìn)行適當(dāng)補(bǔ)充修改而成,包括混合屬性數(shù)據(jù)、數(shù)據(jù)流和不確定數(shù)據(jù)的聚類(lèi)分析,以及量子遺傳聚類(lèi)算法等。本書(shū)可作為普通高等院校計(jì)算機(jī)專(zhuān)業(yè)與IT相關(guān)專(zhuān)業(yè)高年級(jí)本科生和研究生的教材,也可作為經(jīng)濟(jì)管理類(lèi)專(zhuān)業(yè)同名課程的教材和參考書(shū),還可作為電子商務(wù)、金融保險(xiǎn)等行業(yè)數(shù)據(jù)管理與數(shù)據(jù)分析人員的培訓(xùn)教材或自學(xué)參考書(shū)。
兼顧應(yīng)用型人才與學(xué)術(shù)型人才的培養(yǎng)需求;
有機(jī)融合傳統(tǒng)理論方法與創(chuàng)新思想方法;
理論敘述深入淺出,實(shí)際應(yīng)用具體完整;
算法描述自然易懂,計(jì)算實(shí)例詳略得當(dāng)。
第1章緒論
1.1數(shù)據(jù)倉(cāng)庫(kù)概述
1.1.1從傳統(tǒng)數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)
1.1.2數(shù)據(jù)倉(cāng)庫(kù)的4個(gè)特征
1.1.3數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)
1.1.4數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)體系結(jié)構(gòu)
1.1.5數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)的粒度與組織
1.2數(shù)據(jù)挖掘概述
1.2.1數(shù)據(jù)挖掘產(chǎn)生的背景
1.2.2數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)
1.2.3數(shù)據(jù)挖掘的數(shù)據(jù)來(lái)源
1.2.4數(shù)據(jù)挖掘的任務(wù)
1.2.5數(shù)據(jù)挖掘的步驟
1.2.6數(shù)據(jù)挖掘的應(yīng)用
1.3數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘
1.3.1數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的區(qū)別
1.3.2數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系
1.4教程章節(jié)組織與學(xué)時(shí)建議
習(xí)題1
第2章數(shù)據(jù)倉(cāng)庫(kù)原理
2.1多數(shù)據(jù)源問(wèn)題
2.2數(shù)據(jù)預(yù)處理
2.2.1數(shù)據(jù)清洗
2.2.2數(shù)據(jù)變換
2.2.3數(shù)據(jù)歸約
2.3ER模型
2.4數(shù)據(jù)倉(cāng)庫(kù)的概念模型
2.4.1多維數(shù)據(jù)模型
2.4.2維度與粒度
2.5數(shù)據(jù)倉(cāng)庫(kù)的邏輯模型
2.5.1多維數(shù)據(jù)庫(kù)系統(tǒng)
2.5.2星形模型
2.5.3雪花模型
2.6數(shù)據(jù)倉(cāng)庫(kù)的物理模型
2.6.1位圖索引模型
2.6.2廣義索引模型
2.6.3連接索引模型
2.6.4RAID存儲(chǔ)結(jié)構(gòu)
習(xí)題2
第3章數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)開(kāi)發(fā)應(yīng)用
3.1數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的特點(diǎn)
3.2數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)開(kāi)發(fā)過(guò)程
3.3數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的規(guī)劃
3.4數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)
3.4.1需求分析
3.4.2概念設(shè)計(jì)
3.4.3邏輯設(shè)計(jì)
3.4.4物理設(shè)計(jì)
3.5數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施
3.5.1數(shù)據(jù)倉(cāng)庫(kù)的創(chuàng)建
3.5.2數(shù)據(jù)的抽取、轉(zhuǎn)換和加載
3.6數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的開(kāi)發(fā)
3.6.1開(kāi)發(fā)任務(wù)
3.6.2開(kāi)發(fā)方法
3.6.3系統(tǒng)測(cè)試
3.7數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的應(yīng)用
3.7.1用戶(hù)培訓(xùn)
3.7.2決策支持
3.7.3維護(hù)評(píng)估
習(xí)題3
第4章警務(wù)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)
4.1SQL Server 2008 R2
4.1.1SQL Server的服務(wù)功能
4.1.2SQL Server Management Studio
4.1.3Microsoft Visual Studio
4.2創(chuàng)建集成服務(wù)項(xiàng)目與SSIS包
4.3配置“旅館_ETL”數(shù)據(jù)流任務(wù)
4.3.1創(chuàng)建“旅館_ETL”對(duì)象
4.3.2配置“旅館_ETL”參數(shù)
4.4配置“人員_ETL”數(shù)據(jù)流任務(wù)
4.4.1創(chuàng)建“人員_ETL”對(duì)象
4.4.2配置“人員_ETL”參數(shù)
4.5配置“時(shí)間_ETL”數(shù)據(jù)流任務(wù)
4.5.1創(chuàng)建“時(shí)間_ETL”對(duì)象
4.5.2配置“時(shí)間_ETL”參數(shù)
4.6配置“入住_ETL”數(shù)據(jù)流任務(wù)
4.6.1創(chuàng)建“入住_ETL”對(duì)象
4.6.2配置“入住_ETL”參數(shù)
4.7部署前面配置的SSIS包
4.7.1將包另存到SSIS服務(wù)器
4.7.2創(chuàng)建作業(yè)代理
習(xí)題4
第5章聯(lián)機(jī)分析處理技術(shù)
5.1OLAP概述
5.1.1OLAP的定義
5.1.2OLAP的12條準(zhǔn)則
5.1.3OLAP的簡(jiǎn)要準(zhǔn)則
5.1.4OLAP系統(tǒng)的基本結(jié)構(gòu)
5.2OLAP的多維分析操作
5.2.1切片
5.2.2切塊
5.2.3旋轉(zhuǎn)
5.2.4鉆取
5.3OLAP系統(tǒng)的分類(lèi)
5.3.1多維OLAP
5.3.2關(guān)系OLAP
5.3.3MOLAP與ROLAP的比較
5.3.4混合OLAP
5.4OLAP、DW與DM的關(guān)系
5.4.1OLAP、DW與DM的聯(lián)系
5.4.2OLAP、DW與DM的區(qū)別
5.4.3OLAP與DW的關(guān)系
5.4.4OLAP與DM的關(guān)系
5.5DOLAM決策支持系統(tǒng)方案
習(xí)題5
第6章警務(wù)數(shù)據(jù)倉(cāng)庫(kù)的OLAP應(yīng)用
6.1創(chuàng)建分析服務(wù)項(xiàng)目
6.1.1進(jìn)入商業(yè)智能開(kāi)發(fā)平臺(tái)
6.1.2創(chuàng)建分析服務(wù)項(xiàng)目
6.2配置項(xiàng)目的數(shù)據(jù)源
6.3構(gòu)建數(shù)據(jù)源視圖
6.4創(chuàng)建多維數(shù)據(jù)集
6.5配置維的層次結(jié)構(gòu)
6.5.1配置日期維的層次
6.5.2配置地址維的層次
6.5.3配置人員維的層次
6.5.4配置旅館維的層次
6.6添加人口來(lái)源地址維
6.7分析服務(wù)項(xiàng)目的部署
6.8瀏覽多維數(shù)據(jù)集
習(xí)題6
第7章數(shù)據(jù)的屬性與相似性
7.1數(shù)據(jù)集的結(jié)構(gòu)
7.1.1二維表
7.1.2數(shù)據(jù)矩陣
7.2屬性的類(lèi)型
7.2.1連續(xù)屬性
7.2.2離散屬性
7.2.3分類(lèi)屬性
7.2.4二元屬性
7.2.5序數(shù)屬性
7.2.6數(shù)值屬性
7.3相似度與相異度
7.3.1數(shù)值屬性的距離
7.3.2分類(lèi)屬性的相似度
7.3.3余弦相似度
7.3.4混合屬性的相異度
習(xí)題7
第8章關(guān)聯(lián)規(guī)則挖掘
8.1關(guān)聯(lián)規(guī)則的概念
8.1.1基本概念
8.1.2項(xiàng)集的性質(zhì)
8.2關(guān)聯(lián)規(guī)則的Apriori算法
8.2.1發(fā)現(xiàn)頻繁項(xiàng)集
8.2.2產(chǎn)生關(guān)聯(lián)規(guī)則
8.3FP增長(zhǎng)算法
8.3.1算法的背景
8.3.2構(gòu)造FP樹(shù)
8.3.3生成頻繁項(xiàng)集
8.4關(guān)聯(lián)規(guī)則的評(píng)價(jià)
8.4.1支持度和置信度的不足
8.4.2相關(guān)性分析
8.5序列模式發(fā)現(xiàn)算法
8.5.1序列模式的概念
8.5.2類(lèi)Apriori算法
8.6關(guān)聯(lián)規(guī)則其他算法
8.6.1頻繁項(xiàng)集算法優(yōu)化
8.6.2CLOSE算法
8.6.3時(shí)態(tài)關(guān)聯(lián)規(guī)則
8.6.4含負(fù)項(xiàng)的關(guān)聯(lián)規(guī)則
習(xí)題8
第9章分類(lèi)規(guī)則挖掘
9.1分類(lèi)問(wèn)題概述
9.2k最近鄰分類(lèi)法
9.3決策樹(shù)分類(lèi)方法
9.3.1決策樹(shù)生成框架
9.3.2ID3分類(lèi)方法
9.3.3決策樹(shù)的剪枝
9.3.4C4.5算法
9.4貝葉斯分類(lèi)方法
9.4.1貝葉斯定理
9.4.2樸素貝葉斯分類(lèi)器
9.4.3樸素貝葉斯分類(lèi)方法的改進(jìn)
9.5其他分類(lèi)方法
習(xí)題9
第10章聚類(lèi)分析方法
10.1聚類(lèi)分析原理
10.1.1聚類(lèi)分析概述
10.1.2聚類(lèi)的數(shù)學(xué)定義
10.1.3簇的常見(jiàn)類(lèi)型
10.1.4聚類(lèi)框架及性能要求
10.1.5簇的距離
10.2劃分聚類(lèi)算法
10.2.1劃分聚類(lèi)框架
10.2.2劃分聚類(lèi)的質(zhì)量
10.2.3kmeans算法
10.2.4空簇與離群點(diǎn)
10.2.5k中心點(diǎn)算法
10.3層次聚類(lèi)方法
10.3.1層次聚類(lèi)策略
10.3.2AGNES算法
10.3.3DIANA算法
10.4密度聚類(lèi)方法
10.4.1基本概念
10.4.2算法描述
10.4.3計(jì)算實(shí)例
10.4.4算法的性能分析
10.5聚類(lèi)的質(zhì)量評(píng)價(jià)
10.5.1簇的數(shù)目估計(jì)
10.5.2外部質(zhì)量評(píng)價(jià)
10.5.3內(nèi)部質(zhì)量評(píng)價(jià)
10.6離群點(diǎn)挖掘
10.6.1相關(guān)問(wèn)題概述
10.6.2基于距離的方法
10.6.3基于相對(duì)密度的方法
10.7其他聚類(lèi)方法
習(xí)題10
第11章混合屬性數(shù)據(jù)的聚類(lèi)分析
11.1混合屬性數(shù)據(jù)集聚類(lèi)
11.1.1混合屬性數(shù)據(jù)普遍存在
11.1.2kprototypes算法
11.1.3kprototypes算法的不足
11.2改進(jìn)的kprototypes算法
11.2.1加權(quán)頻率最大原型
11.2.2離散屬性的頻率相異度
11.2.3改進(jìn)的kprototypes算法
11.3強(qiáng)連通聚類(lèi)融合算法
11.3.1聚類(lèi)融合方法
11.3.2強(qiáng)連通聚類(lèi)融合
11.3.3聚類(lèi)融合優(yōu)化算法
習(xí)題11
第12章數(shù)據(jù)流挖掘與聚類(lèi)分析
12.1數(shù)據(jù)流挖掘的概念
12.1.1數(shù)據(jù)流的定義
12.1.2數(shù)據(jù)流挖掘的任務(wù)
12.2數(shù)據(jù)流處理技術(shù)
12.2.1概要數(shù)據(jù)結(jié)構(gòu)
12.2.2時(shí)間傾斜技術(shù)
12.2.3數(shù)據(jù)流聚類(lèi)的要求
12.2.4數(shù)據(jù)流聚類(lèi)的一般步驟
12.3兩層數(shù)據(jù)流聚類(lèi)框架
12.4三層數(shù)據(jù)流聚類(lèi)框架
12.5最優(yōu)2k近鄰聚類(lèi)算法
12.5.1算法設(shè)計(jì)動(dòng)因
12.5.2定義2k最近鄰集
12.5.3在線(xiàn)2k最近鄰集生成
12.5.4最優(yōu)2k近鄰集算法
12.5.5最優(yōu)2k近鄰聚類(lèi)算法
12.5.6實(shí)例計(jì)算結(jié)果
習(xí)題12
第13章不確定數(shù)據(jù)的聚類(lèi)分析
13.1不確定數(shù)據(jù)挖掘概述
13.1.1不確定數(shù)據(jù)的產(chǎn)生
13.1.2不確定數(shù)據(jù)的種類(lèi)
13.1.3不確定數(shù)據(jù)的聚類(lèi)
13.2基于相對(duì)密度的不確定數(shù)據(jù)聚類(lèi)算法
13.2.1基于相對(duì)密度的聚類(lèi)思想
13.2.2不確定相異度與k最近鄰集
13.2.3不確定k最近鄰密度
13.2.4RDBCAU算法描述
13.2.5計(jì)算實(shí)例
13.3不確定分類(lèi)屬性數(shù)據(jù)聚類(lèi)算法
13.3.1傳統(tǒng)分類(lèi)屬性相似度
13.3.2分類(lèi)屬性加權(quán)相似度
13.3.3分類(lèi)屬性雙重加權(quán)相似度
13.3.4不確定分類(lèi)屬性雙重加權(quán)相似度
13.3.5基于連通分支的不確定分類(lèi)屬性聚類(lèi)算法
習(xí)題13
第14章量子計(jì)算與量子遺傳聚類(lèi)算法
14.1量子計(jì)算與數(shù)據(jù)挖掘
14.1.1量子計(jì)算的誕生
14.1.2量子計(jì)算研究
14.1.3量子數(shù)據(jù)挖掘算法
14.2量子計(jì)算原理
14.2.1量子態(tài)與量子比特
14.2.2量子門(mén)與基本運(yùn)算
14.2.3量子糾纏特性
14.3經(jīng)典量子算法
14.3.1量子傅里葉變換
14.3.2Shor因子分解算法
14.3.3Grover算法
14.4基于3D角度編碼的量子遺傳算法
14.4.1量子遺傳算法
14.4.2量子3D角度編碼
14.4.3解空間的映射
14.4.4量子染色體更新
14.4.5量子位的變異
14.4.6QGAB3DC算法
14.5量子遺傳聚類(lèi)算法
14.5.1屬性值q分位數(shù)與極差
14.5.2基于極差的廣義加權(quán)距離
14.5.3量子遺傳聚類(lèi)算法
習(xí)題14
參考文獻(xiàn)