描述統(tǒng)計與探索性數(shù)據(jù)分析
定 價:75 元
- 作者:張理
- 出版時間:2025/4/1
- ISBN:9787030778468
- 出 版 社:科學出版社
- 中圖法分類:C8,O212.1
- 頁碼:284
- 紙張:
- 版次:1
- 開本:B5
本書是數(shù)據(jù)科學方法及應用系列教材之一。本書融合統(tǒng)計學和數(shù)據(jù)科學的方法,系統(tǒng)介紹描述統(tǒng)計和探索性數(shù)據(jù)分析的原理和方法。主要內(nèi)容包括:指標設(shè)計、數(shù)據(jù)預處理、描述統(tǒng)計量計算、數(shù)據(jù)可視化、相關(guān)分析、關(guān)聯(lián)分析、聚類分析、綜合指數(shù)分析等。重點介紹數(shù)據(jù)分析的統(tǒng)計流程和軟件實現(xiàn)方法,培養(yǎng)學生理解數(shù)據(jù)、分析數(shù)據(jù)的基本能力。
本書將基本理論與應用相結(jié)合,實用性、操作性較強,可廣泛應用在需要開展數(shù)據(jù)分析的各個領(lǐng)域。本書采用四模塊結(jié)構(gòu):理論與方法+案例分析+R軟件應用(含代碼)+思考與練習,并提供第3~8章的在線自測習題,習題內(nèi)容覆蓋主要學習要點,題型包括選擇題、填空題、計算題、軟件應用題等,幫助學習者檢驗學習效果。通過掃描二維碼獲取相關(guān)在線資源和習題。
更多科學出版社服務(wù),請掃碼獲取。
1990年,獲云南大學經(jīng)濟學學士學位
1997年,獲云南大學統(tǒng)計學碩士學位
2004年-2005年,復旦大學訪問學者
2019年,英國普利茅斯大學University of Plymouth訪問學者
主要講授下列課程:經(jīng)濟學基礎(chǔ)(一、二),經(jīng)濟學原理,統(tǒng)計學原理,描述統(tǒng)計。(均為統(tǒng)計學本科專業(yè)課程)
目錄
叢書序
前言
第1章 總論 1
1.1 數(shù)據(jù)的定義 1
1.2 數(shù)據(jù)的特點 2
1.3 數(shù)據(jù)的類型 2
1.4 本書框架介紹 4
1.5 R軟件應用 7
初步認識R軟件 7
思考與練習 17
第2章 統(tǒng)計指標概述 18
2.1 統(tǒng)計指標的含義 18
2.1.1 指標與統(tǒng)計指標 18
2.1.2 統(tǒng)計指標的特點 19
2.1.3 統(tǒng)計指標的構(gòu)成要素 20
2.2 統(tǒng)計指標類型 22
2.2.1 根據(jù)指標形式和作用分類 22
2.2.2 根據(jù)指標值獲取方式分類 22
2.2.3 根據(jù)指標反映的數(shù)量關(guān)系分類 22
2.2.4 根據(jù)指標數(shù)值類型分類 25
2.3 統(tǒng)計指標設(shè)計 26
2.3.1 統(tǒng)計指標設(shè)計原則 26
2.3.2 統(tǒng)計指標設(shè)計步驟 27
2.4 案例分析 29
可持續(xù)發(fā)展投入產(chǎn)出效率測度指標設(shè)計 29
2.5 R 軟件應用 31
創(chuàng)建數(shù)據(jù)對象及讀入外部數(shù)據(jù) 31
思考與練習 43
第3章 數(shù)據(jù)采集 45
3.1 數(shù)據(jù)采集渠道 45
3.1.1 調(diào)查 45
3.1.2 觀測 46
3.1.3 實驗 46
3.1.4 網(wǎng)絡(luò)數(shù)據(jù)采集 46
3.1.5 手機 APP 數(shù)據(jù) 47
3.2 數(shù)據(jù)采集方法及技術(shù) 47
3.2.1 抽樣調(diào)查方法 47
3.2.2 網(wǎng)絡(luò)數(shù)據(jù)采集方法 51
3.2.3 APP數(shù)據(jù)采集方法 53
3.3 案例分析 54
抽樣方法的具體應用 54
3.4 R軟件應用 59
抽樣方法和八爪魚軟件應用 59
思考與練習 67
第4章 數(shù)據(jù)預處理 69
4.1 數(shù)據(jù)審核 69
4.1.1 直接來源數(shù)據(jù)審核 69
4.1.2 間接來源數(shù)據(jù)審核 70
4.2 數(shù)據(jù)清洗 71
4.2.1 數(shù)據(jù)篩選 71
4.2.2 缺失數(shù)據(jù)處理 72
4.2.3 異常數(shù)據(jù)處理 74
4.2.4 數(shù)據(jù)脫敏 77
4.3 數(shù)據(jù)變換 77
4.3.1 數(shù)據(jù)編碼 77
4.3.2 數(shù)據(jù)標準化 78
4.4 數(shù)據(jù)集成 81
4.5 數(shù)據(jù)歸約 81
4.6 案例分析 82
缺失數(shù)據(jù)插補 82
4.7 R 軟件應用 86
數(shù)據(jù)采集與預處理 86
思考與練習 92
第5章 數(shù)據(jù)基本特征測度 93
5.1 數(shù)據(jù)基本特征概述 93
5.2 頻數(shù)統(tǒng)計 94
5.2.1 頻數(shù)統(tǒng)計概述 94
5.2.2 頻數(shù)統(tǒng)計表及編制 94
5.2.3 頻數(shù)統(tǒng)計表的類型 97
5.3 集中趨勢測度.99
5.3.1 幾種常見平均數(shù) 100
5.3.2 中位數(shù) 102
5.3.3 眾數(shù) 102
5.4 離散程度測度 104
5.5 數(shù)據(jù)分布形態(tài)測度 107
5.5.1 矩 107
5.5.2 偏度與偏度系數(shù) 108
5.5.3 峰度 109
5.6 動態(tài)趨勢測度 109
5.6.1 發(fā)展速度 110
5.6.2 增長速度 110
5.7 案例分析 111
R自帶數(shù)據(jù)集iris(鳶尾花)的描述統(tǒng)計指標計算 111
5.8 R軟件應用 114
計算描述統(tǒng)計量 114
思考與練習 123
第6章 數(shù)據(jù)可視化 124
6.1 統(tǒng)計圖形的基本要素 124
6.2 數(shù)據(jù)規(guī)模和結(jié)構(gòu)可視化圖 125
6.2.1 條形圖 125
6.2.2 餅圖 127
6.2.3 玫瑰圖 128
6.2.4 矩形樹圖 131
6.2.5 馬賽克圖 132
6.3 數(shù)據(jù)分布可視化圖 133
6.3.1 直方圖 133
6.3.2 箱線圖 135
6.3.3 概率密度圖 136
6.4 數(shù)據(jù)變化趨勢圖 138
6.4.1 點圖 138
6.4.2 線圖 139
6.5 多維數(shù)據(jù)可視化 141
6.5.1 雷達圖 141
6.5.2 星圖 143
6.5.3 臉譜圖 144
6.6 文本數(shù)據(jù)可視化 146
6.6.1 詞云圖 146
6.6.2 社會網(wǎng)絡(luò)圖 147
6.7 案例分析 148
R數(shù)據(jù)集HairEyeColor(頭發(fā)眼睛顏色)可視化 148
R數(shù)據(jù)集iris (鳶尾花)植物特征可視化 150
R數(shù)據(jù)集ToothGrowth(豚鼠牙齒生長)特征可視化 153
6.8 R軟件應用.155
數(shù)據(jù)可視化 155
思考與練習 171
第7章 相關(guān)與關(guān)聯(lián)分析 172
7.1 相關(guān)關(guān)系 172
7.1.1 一般相關(guān)關(guān)系 172
7.1.2 典型相關(guān)分析 176
7.2 相關(guān)關(guān)系可視化 179
7.2.1 二維散點圖 179
7.2.2 三維散點圖 180
7.2.3 氣泡圖 182
7.2.4 散點圖矩陣 183
7.2.5 相關(guān)系數(shù)矩陣 185
7.3 關(guān)聯(lián)分析 186
7.3.1 關(guān)聯(lián)規(guī)則的基本概念 186
7.3.2 關(guān)聯(lián)規(guī)則的Apriori算法 190
7.4 案例分析 191
鳶尾花的外形特征相關(guān)關(guān)系 191
科技創(chuàng)新活動投入和產(chǎn)出的典型相關(guān)分析 194
Apriori 算法示例 200
7.5 R 軟件應用 203
相關(guān)與關(guān)聯(lián)分析 203
思考與練習 209
第8章 聚類分析 211
8.1 聚類分析概述 211
8.2 距離的計算方法 212
8.2.1 歐氏距離 212
8.2.2 曼哈頓距離 213
8.2.3 明氏距離 213
8.2.4 蘭氏距離 214
8.2.5 馬氏距離 214
8.2.6 相關(guān)距離 215
8.2.7 余弦相似度 215
8.2.8 漢明距離 215
8.3 聚類算法 216
8.3.1 系統(tǒng)聚類方法 216
8.3.2 K-means聚類法 222
8.3.3 K-modes聚類法 224
8.4 最佳K值的兩種確定方法 226
8.4.1 肘部法 226
8.4.2 輪廓系數(shù)法 229
8.5 案例分析 230
紅酒質(zhì)量數(shù)據(jù)的聚類分析 230
8.6 R軟件應用.234
聚類函數(shù)的應用 234
思考與練習 237
第9章 綜合指數(shù)分析 238
9.1 綜合指數(shù)分析概述 238
9.2 以專家賦權(quán)為主的綜合指數(shù)分析 239
9.2.1 專家評分法 239
9.2.2 德爾菲法 241
9.2.3 層次分析法 241
9.3 以數(shù)據(jù)特征賦權(quán)為主的綜合指數(shù)分析 245
9.3.1 熵權(quán)法 245
9.3.2 變異系數(shù)法 247
9.3.3 主成分分析法 247
9.3.4 TOPSIS方法 250
9.3.5 灰色關(guān)聯(lián)分析法 252
9.4 案例分析 255
高技術(shù)產(chǎn)業(yè)創(chuàng)新能力綜合評價 255
9.5 R軟件應用 273
綜合指數(shù)計算 273
思考與練習 277
參考文獻 279
附錄 280