書單推薦
更多
新書推薦
更多

大模型訓練與推理加速實戰(zhàn):基于CUDA計算平臺(Python版)

大模型訓練與推理加速實戰(zhàn):基于CUDA計算平臺(Python版)

定  價:129 元

        

當前圖書已被 4 所學校薦購過!
查看明細

  • 作者:溫浩
  • 出版時間:2025/7/1
  • ISBN:9787121505430
  • 出 版 社:電子工業(yè)出版社
  • 中圖法分類:TP181;TP312.8 
  • 頁碼:464
  • 紙張:
  • 版次:01
  • 開本:16開
9
7
5
8
0
7
5
1
4
2
3
1
0

讀者對象:本書兼具理論深度與工程實用性,適合從事深度學習系統(tǒng)優(yōu)化的研究人員、高性能計算工程師及希望掌握GPU加速部署的開發(fā)者參考使用,是一本面向大模型時代的CUDA并行計算加速實戰(zhàn)指南。

本書深入探討深度學習模型訓練和推理加速的前沿技術,尤其是在 NVIDIA CUDA(Compute Unified Device Architecture)平臺上的應用與優(yōu)化。本書從大模型訓練的挑戰(zhàn)和分布式訓練,到 CUDA 加速推理技術,再到端側推理的優(yōu)化部署,系統(tǒng)地介紹如何利用 CUDA 平臺加速大模型的訓練與推理過程,并結合具體案例深入講解數(shù)據(jù)并行、模型并行、任務調度、負載均衡等技術。本書共 10 章,首先介紹大模型訓練面臨的計算復雜性、內(nèi)存帶寬和數(shù)據(jù)傳輸瓶頸等問題,并講解基于NCCL(NVIDIA Collective Communications Library)的優(yōu)化方法;然后,通過深入淺出的講解,展示如何使用 TensorRT 進行推理加速,并探討多模型并行推理架構、混合精度訓練與推理等優(yōu)化策略;最后,詳細闡述端側推理加速,特別是在移動設備和邊緣設備中的應用,強調模型量化、裁剪等技術在推理加速中的重要作用。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容