Python數(shù)據(jù)處理與分析案例教程
定 價(jià):49.8 元
- 作者:藺首晶
- 出版時(shí)間:2025/4/1
- ISBN:9787121500749
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP312.8
- 頁(yè)碼:244
- 紙張:
- 版次:01
- 開本:16開
本書以VSCode為主要開發(fā)工具,全面系統(tǒng)地介紹了Python數(shù)據(jù)應(yīng)用開發(fā)的相關(guān)知識(shí)。本書采用理論與案例相結(jié)合,多樣化的案例、通俗易懂的講解形式、詳細(xì)的演示步驟,幫助大家輕松地學(xué)習(xí)Python數(shù)據(jù)分析的相關(guān)知識(shí)。全書共6個(gè)項(xiàng)目,前兩個(gè)項(xiàng)目介紹了文件采集和MySQL與Python交互的應(yīng)用,后面四個(gè)項(xiàng)目介紹了Python數(shù)據(jù)分析的常用庫(kù)及其應(yīng)用,涵蓋了科學(xué)計(jì)算庫(kù)NumPy、數(shù)據(jù)分析庫(kù)Pandas、數(shù)據(jù)清洗和數(shù)據(jù)可視化庫(kù)Matplotlib和pyecharts。每個(gè)項(xiàng)目中都結(jié)合所學(xué)的技術(shù)開發(fā)了綜合實(shí)訓(xùn),演示如何在項(xiàng)目中運(yùn)用所學(xué)的知識(shí),通過(guò)動(dòng)手操作和練習(xí),幫助讀者更好地理解和掌握所學(xué)的知識(shí)。
藺首晶, 畢業(yè)于哈爾濱師范大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)本科學(xué)歷,在東北財(cái)經(jīng)大學(xué)獲得碩士學(xué)位,"雙師型”教師,自2005年至今,從教于大連電子學(xué)校軟件及應(yīng)用教學(xué)部,現(xiàn)任高級(jí)講師,長(zhǎng)期工作在職業(yè)院校計(jì)算機(jī)軟件專業(yè)教學(xué)管理一線,有著較強(qiáng)的教育教學(xué)管理能力和豐富的教學(xué)經(jīng)驗(yàn),多次參編教材,主持、參與科研課題多項(xiàng),在各項(xiàng)教學(xué)比賽、課件比賽中榮獲國(guó)家級(jí)、省級(jí)、市級(jí)等多個(gè)獎(jiǎng)項(xiàng),多篇教學(xué)論文在國(guó)內(nèi)期刊教育專欄發(fā)表并獲獎(jiǎng)。2021年被評(píng)為大連市職業(yè)院校骨干教師,具備很好的教學(xué)素質(zhì),并有一定的研究能力,可以帶動(dòng)身邊的教師一起參與研究。
項(xiàng)目1 文件采集 001
1.1 第三方模塊 002
1.1.1 第三方模塊的概念 002
1.1.2 NumPy、Pandas模塊的下載與安裝 004
1.2 CSV格式化數(shù)據(jù)的讀寫 006
1.2.1 CSV文件和csv模塊 006
1.2.2 使用NumPy模塊讀寫CSV文件 013
1.2.3 Pandas讀取和寫入CSV文件 015
1.3 XML文件讀寫 017
1.3.1 XML文件結(jié)構(gòu) 017
1.3.2 解析XML文件 018
1.4 JSON格式化數(shù)據(jù)的讀寫 020
1.4.1 JSON數(shù)據(jù)格式 020
1.4.2 JSON文件讀取 020
1.5 Excel格式化數(shù)據(jù)的讀寫 024
1.5.1 使用xlrd和xlwt模塊讀寫Excel文件 024
1.5.2 使用Pandas讀寫Excel文件 030
任務(wù)拓展 031
實(shí)訓(xùn)1:汽車數(shù)據(jù)寫入CSV文件 031
實(shí)訓(xùn)2:網(wǎng)絡(luò)數(shù)據(jù)爬取 038
課后練習(xí) 047
項(xiàng)目2 Python訪問(wèn)MySQL與MongoDB數(shù)據(jù)庫(kù) 049
2.1 數(shù)據(jù)庫(kù)基礎(chǔ) 050
2.1.1 概述 050
2.1.2 數(shù)據(jù)庫(kù)分類 051
2.2 MySQL與Python交互 052
2.2.1 pymysql庫(kù) 052
2.2.2 訪問(wèn)及查詢MySQL數(shù)據(jù)庫(kù) 053
2.3 MongoDB與Python交互 064
2.3.1 pymongo庫(kù)概述 064
2.3.2 訪問(wèn)MongoDB 數(shù)據(jù)庫(kù) 064
任務(wù)拓展 069
實(shí)訓(xùn)3:構(gòu)建基于MySQL與Python交互的汽車數(shù)據(jù)管理系統(tǒng) 069
課后練習(xí) 075
項(xiàng)目3 NumPy庫(kù) 077
3.1 Ndarray對(duì)象 078
3.1.1 認(rèn)識(shí)NumPy數(shù)組對(duì)象 078
3.1.2 創(chuàng)建NumPy數(shù)組 079
3.1.3 NumPy數(shù)組屬性 081
3.1.4 NumPy切片和索引 083
3.2 NumPy數(shù)組操作 088
3.2.1 修改數(shù)組形狀 089
3.2.2 連接數(shù)組 089
3.2.3 分割數(shù)組 093
3.2.4 數(shù)組元素的添加與刪除 095
3.3 NumPy函數(shù) 098
3.3.1 NumPy通用函數(shù) 099
3.3.2 NumPy統(tǒng)計(jì)函數(shù) 102
任務(wù)拓展 108
實(shí)訓(xùn)4:管理手機(jī)卡用戶數(shù)據(jù) 108
課后練習(xí) 117
項(xiàng)目4 Pandas庫(kù) 119
4.1 Pandas數(shù)據(jù)結(jié)構(gòu) 120
4.1.1 Series的組成及創(chuàng)建 120
4.1.2 DataFrame的組成及創(chuàng)建 123
4.1.3 DataFrame的數(shù)據(jù)切片與合并 127
4.1.4 numpy.array與pandas.DataFrame的轉(zhuǎn)換 131
4.2 數(shù)據(jù)訪問(wèn) 132
4.2.1 獲取DataFrame的字段信息 132
4.2.2 獲取指定的行和列 135
4.2.3 獲取數(shù)值型字段的統(tǒng)計(jì)信息 139
4.2.4 獲取文本型字段的取值信息 140
任務(wù)拓展 141
實(shí)訓(xùn)5:藥店數(shù)據(jù)維護(hù)與銷售情況分析 141
課后練習(xí) 146
項(xiàng)目5 數(shù)據(jù)清洗 148
5.1 數(shù)據(jù)清洗 149
5.1.1 缺失值的處理 149
5.1.2 重復(fù)值的處理 155
5.1.3 異常值的處理 157
5.1.4 更改數(shù)據(jù)類型 161
5.2 數(shù)據(jù)轉(zhuǎn)換 164
5.2.1 重命名軸索引 165
5.2.2 離散化連續(xù)數(shù)據(jù) 167
5.2.3 啞變量處理類別型數(shù)據(jù) 168
任務(wù)拓展 170
實(shí)訓(xùn)6:餐飲數(shù)據(jù)清洗 170
課后練習(xí) 177
項(xiàng)目6 數(shù)據(jù)可視化 179
6.1 數(shù)據(jù)可視化概述 180
6.1.1 什么是數(shù)據(jù)可視化 180
6.1.2 常見的圖表類型 180
6.1.3 數(shù)據(jù)可視化工具 184
6.2 使用Matplotlib繪制圖表 190
6.2.1 通過(guò)figure()函數(shù)創(chuàng)建畫布 190
6.2.2 通過(guò)subplot()函數(shù)創(chuàng)建單個(gè)子圖 194
6.2.3 通過(guò)subplots()函數(shù)創(chuàng)建多個(gè)子圖 197
6.2.4 通過(guò)add_subplot()方法添加和選中子圖 198
6.3 使用Matplotlib繪制其他簡(jiǎn)單圖表 200
6.3.1 plot()函數(shù)繪制折線圖 200
6.3.2 通過(guò)scatter()繪制散點(diǎn)圖或氣泡圖 203
6.3.2 通過(guò)hist()函數(shù)繪制直方圖 206
6.3.3 通過(guò)pie()函數(shù)繪制餅圖或圓環(huán)圖 208
6.3.4 通過(guò)barth()方法繪制條形圖或堆積條形圖 210
任務(wù)拓展 215
實(shí)訓(xùn)7:使用pyecharts 繪制常見圖表 215
課后練習(xí) 235