體育數(shù)據(jù)分析方法--數(shù)學(xué)和統(tǒng)計學(xué)在棒球、足球、籃球等運動中的應(yīng)用(原書第二版)
定 價:160 元
- 作者:盧文云,虞思逸,劉雨劍
- 出版時間:2026/1/1
- ISBN:9787030823885
- 出 版 社:科學(xué)出版社
- 中圖法分類:G80-32
- 頁碼:338
- 紙張:
- 版次:1
- 開本:B5
本書以精煉而系統(tǒng)的方式,介紹在體育研究中切實有用的分析與統(tǒng)計方法。全書以體育數(shù)據(jù)的實際應(yīng)用與結(jié)果解讀為主線,突出體育數(shù)據(jù)分析有別于常規(guī)統(tǒng)計分析的特性。全書匯集了多種運動項目的大量典型案例,為各章提供必要的計算指導(dǎo)與進階閱讀建議,幫助讀者進一步將所述方法有效落地。
更多科學(xué)出版社服務(wù),請掃碼獲取。
主持國家社科基金項目3項、國家體育總局決策咨詢研究重大項目2項、國家社科基金重大招標(biāo)項目子課題2項,參與國家社科基金項目12項;作為執(zhí)筆人撰寫3份專報獲副國級領(lǐng)導(dǎo)批示;在核心期刊發(fā)表論文40余篇,出版專著4部;獲省政府一等獎2項,三等獎2項;曾獲全國教育碩士優(yōu)秀教育管理者榮譽。
目錄
1 引言 1
1.1 體育數(shù)據(jù)的分析方法 1
1.2 全書架構(gòu) 2
1.3 數(shù)據(jù) 3
1.4 計算 4
1.5 進階閱讀建議 5
2 體育數(shù)據(jù)描述與匯總 7
2.1 引言 7
2.2 體育數(shù)據(jù)的種類 8
2.3 頻率分布 10
2.4 單指數(shù)結(jié)果匯總:平均值與中位數(shù) 18
2.5 體育數(shù)據(jù)中的變化檢測 21
2.6 定性變量中的變化檢測:以投球種類為例 24
2.7 使用數(shù)學(xué)變換來提高球隊和球員表現(xiàn)的測量水平 26
2.8 每壘全壘打數(shù)與每全壘打壘數(shù) 30
2.9 計算 33
2.10 進階閱讀建議 43
2.11 練習(xí) 44
3 概率 46
3.1 引言 46
3.2 在體育領(lǐng)域應(yīng)用概率規(guī)則 46
3.3 將體育事件結(jié)果作為隨機變量進行建模 49
3.4 總結(jié)隨機變量的分布 52
3.5 得分分布與期望得分 53
3.6 概率分布與體育數(shù)據(jù)間的關(guān)系 55
3.7 在特定條件下的概率計算:條件概率 56
3.8 無條件概率與條件概率的紐帶:全概率法則 60
3.9 足球中率先進球得分的重要性 61
3.10 獲勝概率 63
3.11 基于全概率法則對體育統(tǒng)計量進行修正 64
3.12 NFL得分王對比 67
3.13 體育數(shù)據(jù)建模的兩大重要分布:二項分布與正態(tài)分布 68
3.14 使用Z分?jǐn)?shù)來比較NFL賽季的接球表現(xiàn) 72
3.15 使用概率論分析體育中的連勝紀(jì)錄 76
3.16 使用概率論評價統(tǒng)計中的“怪現(xiàn)象” 79
3.17 計算 82
3.18 進階閱讀建議 84
3.19 練習(xí) 85
4 統(tǒng)計方法 88
4.1 引言 88
4.2 使用誤差范圍量化體育統(tǒng)計中的變化 88
4.3 計算均值和相關(guān)統(tǒng)計的誤差范圍 92
4.4 使用模擬分析檢測復(fù)雜統(tǒng)計中的變化 96
4.5 NFL傳球評分中的誤差范圍 99
4.6 球隊與球員間的比較 102
4.7 當(dāng)前結(jié)果是不是偶然的?理解統(tǒng)計顯著性 104
4.8 比較美國聯(lián)盟與國家聯(lián)盟 105
4.9 誤差范圍與修正統(tǒng)計量 108
4.10 將統(tǒng)計學(xué)方法應(yīng)用到體育數(shù)據(jù)時的重要注意事項 111
4.11 計算 112
4.12 進階閱讀建議 118
4.13 練習(xí) 118
5 運用相關(guān)性分析來發(fā)現(xiàn)數(shù)據(jù)中的統(tǒng)計關(guān)系 121
5.1 引言 121
5.2 線性關(guān)系:相關(guān)系數(shù) 121
5.3 “畢達(dá)哥拉斯公式”能被用于預(yù)測隊伍下半場的表現(xiàn)嗎? 127
5.4 運用秩相關(guān)來描述一些特定的非線性關(guān)系 128
5.5 一名頂級跑衛(wèi)在NFL比賽中的重要性 129
5.6 識別和移除潛在變量的影響 130
5.7 MLB比賽中投手防御率與殘壘率的關(guān)系 131
5.8 運用自相關(guān)來發(fā)現(xiàn)體育數(shù)據(jù)中的規(guī)律 132
5.9 量化NFL中薪資帽的影響 135
5.10 描述類別變量間的關(guān)聯(lián)性 136
5.11 分析傳球沖擊對Brady比賽表現(xiàn)的影響 142
5.12 納達(dá)爾為什么在紅土場地表現(xiàn)很好 143
5.13 使用球隊層面的數(shù)據(jù)所要注意的事項 144
5.14 傾向于面對更多投球的擊球員表現(xiàn)會更優(yōu)秀嗎? 146
5.15 計算 148
5.16 進階閱讀建議 153
5.17 練習(xí) 154
6 運用線性回歸進行體育數(shù)據(jù)建模 157
6.1 引言 157
6.2 運用簡單線性回歸來對兩個變量間的關(guān)系進行建模 157
6.3 回歸系數(shù)的不確定性:誤差范圍與統(tǒng)計顯著性 162
6.4 勝于替補與團隊獲勝之間的關(guān)系 164
6.5 均值回歸:為什么表現(xiàn)極佳的隊伍可能會逐漸變差而墊底球隊
可能會逐漸提升 166
6.6 尋找逆轉(zhuǎn)局勢的擊打 170
6.7 NFL教練會落伍嗎?一次數(shù)據(jù)不全的案例 172
6.8 運用多項式回歸來建模非線性關(guān)系 173
6.9 英超聯(lián)賽中傳球與進球的關(guān)系 178
6.10 用log 變換對那些在運動分析中有乘積效應(yīng)的變量進行建模 180
6.11 使用多年度數(shù)據(jù)進行分析時的注意事項 186
6.12 計算 188
6.13 進階閱讀建議 195
6.14 練習(xí) 195
7 多變量的回歸模型 199
7.1 引言 199
7.2 多元回歸分析 199
7.3 多元回歸分析中系數(shù)的意義 200
7.4 三振率與投球速度和投球軌跡的關(guān)系建模 203
7.5 英超聯(lián)賽中傳球與進球關(guān)系的進一步分析 205
7.6 多變量相關(guān)性與回歸 206
7.7 分析西甲選手的進攻貢獻(xiàn) 207
7.8 利用交互作用對有協(xié)同效應(yīng)和拮抗效應(yīng)的變量進行建模 210
7.9 沖刺時間與體重和力量的建模 212
7.10 分析三振率與投球速度和軌跡的模型中變量之間的交互關(guān)系 214
7.11 運用如聯(lián)盟和位置等類別變量進行預(yù)測 215
7.12 NBA中籃板與得分的關(guān)系 218
7.13 確定模型中最重要的變量:預(yù)測變量的相對重要性 221
7.14 影響PGA高爾夫選手得分的因子 225
7.15 選擇預(yù)測變量:找到最適合的NFL球隊得分模型 226
7.16 運用回歸模型對預(yù)測進行修正 231
7.17 修正后的平均失球率 233
7.18 使用Excel 計算 235
7.19 進階閱讀建議 241
7.20 練習(xí) 242
8 一些進階方法 245
8.1 引言 245
8.2 使用交叉驗證和重采樣評價統(tǒng)計模型 246
8.3 二元響應(yīng)變量回歸模型 253
8.4 使用樹方法對復(fù)雜關(guān)系進行建模 263
8.5 使用隨機森林對觀測進行分類 269
8.6 分析變異性 272
8.7 使用池化方法提高隊伍及選手特定變量的估算能力 279
8.8 使用隨機效應(yīng)對回歸模型中的相關(guān)性進行建模 285
8.9 使用樣條函數(shù)對非線性關(guān)系進行建模 289
8.10 使用主成分分析對多變量數(shù)據(jù)進行匯總 299
8.11 進階閱讀建議 309
8.12 練習(xí) 310
參考文獻(xiàn) 314
可用數(shù)據(jù)集 318
圖表目錄
圖2.1 Braun 2011賽季安打數(shù)直方圖 14
圖2.2 Brady 2001—2011賽季傳球碼數(shù)直方圖 15
圖2.3 正態(tài)分布形狀 15
圖2.4 Charles 2010賽季進攻嘗試碼數(shù) 16
圖2.5 2010—2011賽季NBA球員的命中率 16
圖2.6 2010—2011賽季不同位置NBA球員的命中率分布 17
圖2.7 2010—2011賽季不同位置NBA球員的命中率分布 18
圖2.8 2012年P(guān)GA高爾夫球員的獎金分布 30
圖2.9 2011年MLB職業(yè)球員每棒全壘打數(shù)分布 32
圖2.10 2011年MLB職業(yè)球員每全壘打棒數(shù)分布 32
圖2.11 Seahawks隊2012年輸贏場次數(shù)據(jù)表 33
圖2.12 Brady數(shù)據(jù)表若干行 33
圖2.13 直方圖制作流程中的對話框 34
圖2.14 表格中的區(qū)間間斷值區(qū)域 34
圖2.15 Brady例子中的直方圖制作對話框 35
圖2.16 直方圖制作結(jié)果 35
圖2.17 Brady傳球數(shù)據(jù)的默認(rèn)直方圖 36
圖2.18 描述性統(tǒng)計對話框 36
圖2.19 描述性統(tǒng)計結(jié)果 37
圖3.1 一個示例性的直方圖 51
圖3.2 P(a圖3.3 正態(tài)分布的示例 70
圖4.1 Flacco逐場比賽的表現(xiàn)統(tǒng)計 112
圖4.2 Flacco的一次模擬賽季結(jié)果 113
圖4.3 Flacco的第二次模擬賽季結(jié)果 114
圖5.1 2011賽季MLB選手的得分?jǐn)?shù)與安打數(shù) 122
圖5.2 2011賽季MLB選手的保送數(shù)與安打數(shù) 122
圖5.3 2011—2012賽季NBA選手的場均進攻籃板與場均防守籃板 123
圖5.4 2009賽季NFL四分衛(wèi)選手的達(dá)陣與被擒殺 123
圖5.5 MLB球隊2011賽季勝場數(shù)與2010賽季勝場數(shù) 124
圖5.6 2011賽季NFL球隊場均得分與場均失分 124
圖5.7 MLB球隊的每次上壘擊打中投球數(shù)與上壘率 147
圖5.8 MLB球員的每次上壘擊打中投球數(shù)與上壘率 147
圖5.9 MLB球員2011賽季的得分與安打數(shù)據(jù)示例 148
圖5.10 相關(guān)性對話框 149
圖5.11 相關(guān)性對話框的輸出 149
圖5.12 2011賽季MLB球員安打數(shù)據(jù)的示例 149
圖5.13 2011賽季MLB球員安打數(shù)據(jù)的相關(guān)性矩陣 150
圖5.14 2011賽季NFL球隊數(shù)據(jù)示例 150
圖5.15 2011賽季MLB球隊的秩數(shù)據(jù) 151
圖5.16 Chris Paul的一階滯后每場得分 151
圖6.1 2007—2011賽季MLB球隊得分與OPS的散點圖 158
圖6.2 球隊得分與OPS的回歸線 160
圖6.3 球隊得分與OPS的兩條回歸線 160
圖6.4 2007—2011賽季MLB球隊得分與全壘打的關(guān)系 161
圖6.5 Griffey每年的全壘打率 174
圖6.6 二次函數(shù)的一些例子 175
圖6.7 用二次回歸函數(shù)擬合Griffey的全壘打率 175
圖6.8 NHL前鋒場均得分與平均出場時間 176
圖6.9 NHL前鋒場均得分與平均出場時間的二次回歸 177
圖6.10 EPL場均進球和傳球成功率的關(guān)系 178
圖6.11 EPL場均得分和傳球成功率關(guān)系的二次曲線圖 179
圖6.12 NHL比賽中l(wèi)og每場比賽得分與平均上場比賽時間的關(guān)系 181
圖6.13 NHL比賽中每場比賽得分與平均上場比賽時間的關(guān)系 181
圖6.14 40碼沖刺時間和體重的關(guān)系 183
圖6.15 2007—2011賽季MLB球隊的得分和OPS數(shù)據(jù)的前幾行 188
圖6.16 回歸的對話框 188
圖6.17 得分與OPS例子的回歸結(jié)果 189
圖6.18 Griffey數(shù)據(jù)的前幾列 189
圖6.19 Griffey數(shù)據(jù)的二次回歸結(jié)果 190
圖6.20 趨勢線(Trendline)按鈕 191
圖6.21 趨勢線(Trendline)對話框 191
圖7.1 MLB進攻數(shù)據(jù)的前幾列 235
圖7.2 MLB例子中的回歸程序?qū)υ捒?236
圖7.3 2009賽季MLB投手?jǐn)?shù)據(jù)的前幾列示例 236
圖7.4 包含聯(lián)盟指示變量的2009 MLB投手?jǐn)?shù)據(jù) 237
圖8.1 NBA每場比賽的平均得分 250
圖8.2 使用不同的p得到的NBA得分?jǐn)?shù)據(jù)的回歸模型估計 251
圖8.3 不同擬合優(yōu)度在不同p下的值 252
圖8.4 射門命中率估計曲線 257
圖8.5 基于選秀和大學(xué)數(shù)據(jù)的外接手職業(yè)生涯預(yù)測分類樹 265
圖8.6 剪枝后的外接手職業(yè)生涯預(yù)測分類樹 266
圖8.7 NBA得分?jǐn)?shù)據(jù)的4節(jié)點線性樣條估計 291
圖8.8 NBA得分?jǐn)?shù)據(jù)的4節(jié)點三次樣條估計 291
圖8.9 NBA得分?jǐn)?shù)據(jù)的3節(jié)點三次樣條估計 292
圖8.10 使用不同節(jié)點數(shù)的三次樣條估計擬合NBA得分?jǐn)?shù)據(jù) 293
圖8.11 NBA得分?jǐn)?shù)據(jù)的32節(jié)點懲罰三次樣條估計 294
圖8.12 NBA得分?jǐn)?shù)據(jù)的16 節(jié)點懲罰三次樣條估計 295
圖8.13 場均得分和場均投籃次數(shù)的關(guān)系 296
圖8.14 式(8.15)中關(guān)于年份與得分的樣條估計 296
圖8.15 5 個假想點的近似 301
圖8.16 仿真點以及其對應(yīng)的最大方差方向與回歸直線 302
表2.1 洋基隊2011賽季勝負(fù)場記錄 10
表2.2 洋基隊2011賽季勝負(fù)場統(tǒng)計 10
表2.3 Braun 2011賽季安打數(shù)據(jù) 11
表2.4 Brady 2001—2011賽季傳球碼數(shù)頻數(shù)表Ⅰ 11
表2.5 Brady 2001—2011賽季傳球碼數(shù)頻數(shù)表Ⅱ 12
表2.6 Brady 2001—2011賽季傳球碼數(shù)頻數(shù)表Ⅲ 12
表2.7 Charles 2010 賽季進攻嘗試碼數(shù)頻數(shù)表Ⅰ 13
表2.8 Charles 2010 賽季進攻嘗試碼數(shù)頻數(shù)表Ⅱ 13
表2.9 2011MLB選手進攻數(shù)據(jù)統(tǒng)計 19
表2.10 各聯(lián)盟隊伍得分和失分的標(biāo)準(zhǔn)差 22
表2.11 各聯(lián)盟隊伍得分和失分的標(biāo)準(zhǔn)差 23
表2.12 打擊數(shù)據(jù)的四分位數(shù)范圍及標(biāo)準(zhǔn)差 24
表2.13 2012賽季投球變化率最高與最低的五位MLB投手 26
表2.14 2012年P(guān)GA高爾夫球手獎金收入 28
表2.15 2012年P(guān)GA高爾夫球員對數(shù)變換獎金 29
表3.1 一個概率分布的例子 50
表3.2 一個分布函數(shù)的例子 50
表3.3 在2009年綜合BAA是0.244的投球手的調(diào)整BAA 66
表3.4 標(biāo)準(zhǔn)正態(tài)分布的概率 71
表3.5 不同時代的最佳接球碼數(shù) 72
表3.6 至少有一次接球的所有球員當(dāng)年度接球碼數(shù)均值與標(biāo)準(zhǔn)差 73
表3.7 相較于表3.5的調(diào)整后的接球碼數(shù) 75
表3.8 基于最佳球員的均值與標(biāo)準(zhǔn)差統(tǒng)計量 76
表3.9 基于Miguel Cabrera數(shù)據(jù)的連續(xù)安打分布 77
表3.10 連勝紀(jì)錄的概率分布 79
表4.1 Durant 2011—2012賽季表現(xiàn)數(shù)據(jù)統(tǒng)計結(jié)果 92
表4.2 p<0.4時不同樣本量的誤差范圍 94
表4.3 Durant 2011—2012賽季的每場得分 97
表4.4 Durant模擬賽季的每場得分 98
表4.5 不同模擬次數(shù)對應(yīng)的誤差范圍的分布 99
表4.6 2012賽季NFL最強四分衛(wèi)的傳球評分及其誤差范圍 101
表4.7 Durant與James 2011—2012賽季比賽得分統(tǒng)計均值 102
表5.1 NFL勝率的滯后年數(shù)與自相關(guān)系數(shù) 135
表5.2 NFL勝率的滯后年數(shù)與自相關(guān)系數(shù) 136
表5.3 2014賽季NFL半場比賽結(jié)果和全場比賽結(jié)果的關(guān)系 137
表5.4 表示兩種分類變量的一般性表格 138
表5.5 2012賽季MLB先發(fā)投手?jǐn)?shù)據(jù) 138
表5.6 2012賽季MLB先發(fā)投手的假想數(shù)據(jù) 139
表5.7 2012賽季MLB先發(fā)投手的實際數(shù)據(jù) 139
表5.8 2009—2012賽季Brady 觸地傳球與擒殺數(shù)之間的關(guān)系 142
表5.9 Nadal在紅土場地和非紅土場地上的表現(xiàn) 143
表5.10 Nadal在紅土場地和非紅土場地時在自己發(fā)球局的表現(xiàn) 143
表5.11 Nadal在紅土場地和非紅土場地時在對手發(fā)球局的表現(xiàn) 144
表6.1 均值回歸的一些例子 168
表6.2 均值回歸進一步的一些例子 168
表6.3 2011賽季關(guān)鍵OPS排名前十和后十的MLB選手 171
表6.4 2011賽季OPS排名前十和后十的MLB選手 172
表7.1 西甲聯(lián)賽中進攻貢獻(xiàn)排名前20 位球員 209
表7.2 高爾夫數(shù)據(jù)的分析 225
表7.3 使用14個預(yù)測特征的回歸分析結(jié)果 227
表7.4 模型Ⅱ回歸分析結(jié)果 228
表7.5 模型Ⅲ回歸分析結(jié)果 230
表7.6 模型Ⅳ回歸分析結(jié)果 231
表7.7 2011賽季調(diào)整后的防守率(Adj RA)榜 233
表7.8 2010—2011賽季守門員中調(diào)整平均失球數(shù)(Adj GAA)最優(yōu)榜 234
表8.1 不同概率的優(yōu)勢和對數(shù)優(yōu)勢 255