定 價:39 元
叢書名:高等院校數據科學與大數據專業(yè)"互聯(lián)網+"創(chuàng)新規(guī)劃教材
當前圖書已被 2 所學校薦購過!
查看明細
- 作者:王道平,崔鴻飛,葛根哈斯 主編
- 出版時間:2025/1/1
- ISBN:9787301352205
- 出 版 社:北京大學出版社
- 中圖法分類:TP274
- 頁碼:184
- 紙張:
- 版次:2
- 開本:16開
本書緊跟大數據技術的最新發(fā)展、重視基礎知識體系,系統(tǒng)地介紹了大數據技術與應用的基本概念和思維方式,詳細闡述了大數據的采集、存儲、處理、分析和可視化等相關內容,并結合了最新的技術應用案例,講述了大數據在金融、互聯(lián)網、生物醫(yī)學等領域的應用以及大數據環(huán)境下的隱私和安全問題。
本書既可以作為高等院校大數據、計算機科學與技術、軟件工程及相關專業(yè)課程的教材,也可以供系統(tǒng)分析師、系統(tǒng)架構師、軟件開發(fā)工程師、項目經理及對大數據技術感興趣的讀者閱讀和參考。
王道平【主編】【現當代】
————————————————————
王道平,博士,教授,博士生導師,北京科技大學經濟管理學院管理科學系,研究方向為供應鏈與物流管理、大數據技術與應用、智能管理系統(tǒng)等,主講大數據概論、數據組織與分析技術、供應鏈與物流管理等課程,承擔多項國家自然科學基金課題和省部級課題,主編出版《現代物流信息技術》、《現代物流管理》、《供應鏈管理》、《大數據導論》、《大數據處理》、《智能制造概論》等多部教材,其中1部教材被評為北京高校優(yōu)質本科教材,2部教材被評為北京市高等教育精品教材。
崔鴻飛【主編】【現當代】
————————————————————
崔鴻飛,女,2016年畢業(yè)于清華大學自動化系,并在清華大學計算機系從事博士后研究,2019年6月起就職于北京科技大學經濟管理學院管理科學與工程系,研究方向為商業(yè)及醫(yī)療的大數據分析處理。參加了多項國家自然科學基金課題,在國際期刊上發(fā)表學術論文10余篇。
葛根哈斯【主編】【現當代】
————————————————————
葛根哈斯,女,蒙古族,1988年出生,畢業(yè)于北京科技大學經濟管理學院管理科學與工程專業(yè),獲博士學位,現為內蒙古財經大學統(tǒng)計學院講師,主要研究方向為大數據分析,供應鏈與物流管理等。公開發(fā)表論文十余篇。
目 錄
第1章 大數據概述 1
1.1 大數據的背景 1
1.1.1 互聯(lián)網的四次浪潮 2
1.1.2 大數據的變革思維 2
1.2 大數據簡介 3
1.2.1 大數據的概念 3
1.2.2 大數據的特征 4
1.2.3 大數據的結構類型 5
1.2.4 大數據的關鍵技術 6
1.2.5 大數據的核心產業(yè)鏈 7
1.3 大數據的發(fā)展和應用 9
1.3.1 大數據的發(fā)展態(tài)勢 9
1.3.2 我國大數據發(fā)展面臨的問題與
挑戰(zhàn) 11
1.3.3 大數據的應用 13
小結 14
習題 14
第2章 大數據的采集和預處理 16
2.1 大數據的采集 16
2.1.1 大數據的采集來源 17
2.1.2 大數據的采集方法 18
2.1.3 大數據的采集平臺 20
2.2 大數據的預處理技術 22
2.2.1 數據清洗 22
2.2.2 數據集成 23
2.2.3 數據變換 24
2.2.4 數據歸約 24
2.3 數據倉庫與ETL工具 26
2.3.1 數據倉庫的組成 26
2.3.2 數據倉庫的數據模型 28
2.3.3 常用的ETL工具 30
小結 33
習題 33
第3章 大數據存儲 35
3.1 傳統(tǒng)存儲 36
3.1.1 硬盤 36
3.1.2 直連式存儲 37
3.1.3 網絡存儲 39
3.2 分布式存儲 42
3.2.1 存儲結構 42
3.2.2 系統(tǒng)架構 43
3.2.3 典型系統(tǒng) 44
3.3 云存儲 46
3.3.1 云存儲的結構模型 46
3.3.2 云存儲的分類 47
3.3.3 云存儲的優(yōu)勢和劣勢 48
3.3.4 云存儲的發(fā)展趨勢 49
小結 51
習題 51
第4章 大數據處理與計算 53
4.1 Hadoop處理框架 54
4.1.1 HDFS 54
4.1.2 MapReduce 55
4.1.3 YARN 58
4.1.4 ZooKeeper 60
4.2 Spark處理框架 62
4.2.1 Scala 62
4.2.2 Spark SQL 64
4.2.3 Spark Streaming 66
4.3 Storm開源流計算框架 67
4.3.1 Storm的基本概念 67
4.3.2 Spout和Bolt 69
4.3.3 Topology 69
小結 71
習題 71
第5章 大數據分析 73
5.1 大數據分析的類型 73
5.1.1 描述性分析 74
5.1.2 探索性分析 75
5.1.3 驗證性分析 75
5.2 大數據分析的方法 76
5.2.1 回歸分析 76
5.2.2 關聯(lián)分析 77
5.2.3 分類 82
5.2.4 聚類 84
5.3 大數據分析的工具 87
5.3.1 Excel 87
5.3.2 R 88
5.3.3 RapidMiner 89
5.3.4 KNIME 90
5.3.5 Weka 91
小結 93
習題 94
第6章 大數據可視化 96
6.1 大數據可視化概述 97
6.1.1 大數據可視化的概念 97
6.1.2 可視化的起源 97
6.1.3 大數據可視化的作用 98
6.2 大數據可視化的技術 99
6.2.1 基于圖形的可視化技術 99
6.2.2 基于平行坐標法的
可視化技術 106
6.2.3 其他大數據可視化技術 107
6.3 大數據可視化的工具 107
6.3.1 入門級工具 107
6.3.2 信息圖表工具 108
6.3.3 地圖工具 108
6.3.4 時間線工具 108
6.3.5 高級分析工具 109
6.4 大數據可視化的發(fā)展 109
6.4.1 大數據可視化面臨的挑戰(zhàn) 109
6.4.2 大數據可視化的發(fā)展方向 110
6.4.3 大數據可視化未來的應用 111
小結 112
習題 113
第7章 大數據應用 115
7.1 大數據在金融領域的應用 115
7.1.1 大數據與客戶管理 116
7.1.2 大數據與風險管控 119
7.1.3 大數據與運營優(yōu)化 121
7.2 大數據在互聯(lián)網領域的應用 122
7.2.1 大數據與電子商務 122
7.2.2 大數據與社交媒體 126
7.2.3 大數據與零售行業(yè) 128
7.3 大數據在生物醫(yī)學領域的應用 129
7.3.1 大數據與流行病預測 129
7.3.2 大數據與智慧醫(yī)療 132
7.3.3 大數據與生物信息學 134
7.4 大數據在其他領域的應用 135
7.4.1 大數據與智慧物流 136
7.4.2 大數據與汽車行業(yè) 137
7.4.3 大數據與公共管理 141
7.4.4 大數據與教育行業(yè) 145
小結 147
習題 148
第8章 大數據隱私與安全 150
8.1 大數據面臨的隱私與安全問題 151
8.1.1 大數據隱私與安全的定義 151
8.1.2 影響大數據隱私與安全的
主要因素 152
8.1.3 大數據隱私與安全問題的
分類 153
8.2 大數據隱私與安全的防護策略 156
8.2.1 存儲安全策略 157
8.2.2 應用安全策略 158
8.2.3 管理安全策略 159
8.3 大數據隱私與安全的防護技術 162
8.3.1 數據采集與存儲安全技術 162
8.3.2 數據挖掘安全技術 166
8.3.3 數據發(fā)布安全技術 167
8.3.4 防范APT技術 168
小結 172
習題 173
參考文獻 175