DeepSeek實戰(zhàn):從提示詞到部署和實踐
定 價:68 元
當前圖書已被 8 所學校薦購過!
查看明細
- 作者:張成文
- 出版時間:2025/4/1
- ISBN:9787121500312
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP18
- 頁碼:294
- 紙張:
- 版次:01
- 開本:16開
本書旨在提供一份全面、易懂的DeepSeek大模型實戰(zhàn)內(nèi)容,通過深入淺出的講解,幫助讀者快速掌握DeepSeek的核心技術和應用場景。本書不僅涵蓋了DeepSeek的技術原理、架構設計和訓練方法,還詳細介紹了如何通過API調用、本地部署和云服務等方式將DeepSeek集成到實踐項目中。此外,本書通過大量實例和案例分析,展示了DeepSeek在不同領域的應用實踐,幫助讀者更好地理解和應用這一強大的工具。本書圖文并茂,理論翔實,案例豐富,適合從事DeepSeek開發(fā)的科研人員以及廣大的開發(fā)者作為技術參考和培訓資料,亦可作為高校本科生和研究生的教材。
張成文,北京郵電大學副教授,中國人工智能學會高級會員、中國教育發(fā)展戰(zhàn)略學會人工智能與機器人專委會理事、中國生物醫(yī)學工程學會醫(yī)學人工智能分會委員、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟產(chǎn)學研工作組副組長
目 錄
第1章 DeepSeek初探 1
1.1 大模型的定義 2
1.2 從GPT到DeepSeek 3
1.2.1 GPT模型的發(fā)展脈絡 4
1.2.2 DeepSeek模型的發(fā)展脈絡 7
1.2.3 技術突破:從全球競速到本土創(chuàng)新 10
1.2.4 應用生態(tài)的進化:從工具到生態(tài)伙伴 11
1.3 DeepSeek的核心能力和獨特優(yōu)勢 12
1.3.1 核心能力 12
1.3.2 獨特優(yōu)勢 14
1.4 DeepSeek的應用場景 16
1.4.1 智能客服 16
1.4.2 輔助辦公 18
1.4.3 智能家居 20
1.4.4 醫(yī)療診斷 21
1.4.5 教育學習 22
1.4.6 金融投資 24
1.4.7 智能政務 24
1.5 DeepSeek帶來的機遇 25
1.5.1 DeepSeek模型帶給個人的機遇 26
1.5.2 DeepSeek帶給中小企業(yè)的機遇 28
小結 30
第2章 DeepSeek的模型架構 32
2.1 DeepSeek-V3/R1模型的架構 33
2.2 混合專家 35
2.2.1 稠密MoE架構和稀疏MoE架構 36
2.2.2 DeepSeekMoE 37
2.2.3 無輔助損耗負載均衡 39
2.3 多頭潛在注意力 41
2.3.1 鍵值緩存簡介 41
2.3.2 RoPE簡介 43
2.3.3 傳統(tǒng)MHA的緩存機制的不足 46
2.3.4 低秩鍵值聯(lián)合壓縮的注意力機制 47
2.4 多Token預測 52
2.4.1 塊級并行解碼策略 53
2.4.2 Meta的MTP方法 53
2.4.3 DeepSeek的MTP方法 54
小結 56
第3章 DeepSeek的訓練架構 57
3.1 DeepSeek的訓練 58
3.1.1 基礎技術 58
3.1.2 訓練過程 61
3.2 DeepSeek在硬件層面的訓練亮點 62
3.2.1 FP8混合精度訓練 62
3.2.2 DualPipe算法 63
3.3 DeepSeek在算法層面的訓練亮點 66
3.3.1 組相對策略優(yōu)化 67
3.3.2 知識蒸餾 69
3.4 DeepSeek的數(shù)據(jù)優(yōu)化手段 70
小結 72
第4章 高質量提示詞 74
4.1 提示詞概述 75
4.1.1 提示詞的定義 75
4.1.2 提示詞的種類 76
4.2 新手常見誤區(qū)和陷阱 77
4.3 提示詞的設計技巧 79
4.3.1 STAR法則:讓問題更有條理 79
4.3.2 5W2H法則:全面提問的利器 80
4.3.3 CO-STAR框架:精準表達需求 82
4.3.4 CRISPE框架:激發(fā)創(chuàng)意和拓展深度 85
4.3.5 BROKE框架:目標導向和持續(xù)優(yōu)化 86
4.3.6 借助大模型優(yōu)化提示詞 88
4.4 企業(yè)層面的提示詞應用場景 92
4.4.1 傳播策略制定 92
4.4.2 執(zhí)行發(fā)展制定 93
4.4.3 品牌故事生成 94
4.4.4 產(chǎn)品定位 96
小結 97
第5章 面向個人的DeepSeek部署 98
5.1 DeepSeek的模型 99
5.1.1 DeepSeek模型的常見版本 99
5.1.2 DeepSeek模型的版本說明 100
5.1.3 DeepSeek模型的開源協(xié)議 101
5.2 硬件需求和配置建議 103
5.2.1 存儲精度 103
5.2.2 顯存占用估算 105
5.3 軟件環(huán)境安裝和配置 107
5.3.1 Ollama安裝 107
5.3.2 使用Ollama部署DeepSeek模型 111
5.3.3 Ollama常用API 113
5.4 DeepSeek模型下載和部署 121
5.4.1 Hugging Face社區(qū)簡介 121
5.4.2 模型下載 121
5.4.3 常見大模型文件類型 125
5.5 使用Web UI構建對話界面 126
5.5.1 Open-WebUI 126
5.5.2 Hollama 129
5.5.3 ChatBox 132
小結 133
第6章 面向企業(yè)的DeepSeek API調用 135
6.1 API調用的優(yōu)勢 136
6.2 常用DeepSeek API調用方式 137
6.2.1 DeepSeek官方開放平臺 137
6.2.2 DMXAPI 144
小結 148
第7章 面向企業(yè)的DeepSeek云服務部署 149
7.1 本地部署與云服務部署的對比 150
7.1.1 本地部署的特點 150
7.1.2 云服務部署的特點 151
7.2 模型推理加速框架 152
7.2.1 推理加速框架的必要性 153
7.2.2 BladeLLM 153
7.2.3 SGLang 156
7.2.4 vLLM 159
7.3 常用DeepSeek云服務部署方式 164
7.3.1 阿里云 164
7.3.2 騰訊云 171
7.3.3 華為云 176
7.3.4 火山引擎 181
7.3.5 AutoDL 187
小結 198
第8章 DeepSeek模型訓練 199
8.1 常用訓練框架 200
8.1.1 Unsloth 200
8.1.2 TRL 201
8.2 DeepSeek模型的SFT訓練 202
8.2.1 算力租用 202
8.2.2 模型下載和部署 204
8.2.3 數(shù)據(jù)預處理 207
8.2.4 模型訓練 208
8.2.5 模型推理 210
8.3 DeepSeek模型的GRPO訓練 212
8.3.1 加載模型 212
8.3.2 配置PEFT模型 213
8.3.3 數(shù)據(jù)集準備 213
8.3.4 模型訓練 216
8.3.5 模型推理 217
小結 219
第9章 DeepSeek的RAG實戰(zhàn) 220
9.1 用LangChain構建簡單的RAG本地系統(tǒng) 221
9.1.1 RAG管道構建 221
9.1.2 向量數(shù)據(jù)庫構建 223
9.1.3 Web頁面啟動 225
9.2 開源DeepSeek RAG應用案例 227
9.2.1 Local PDF Chat RAG 227
9.2.2 RAG Flow 231
小結 239?
第10章 DeepSeek的Agent實戰(zhàn) 241
10.1 基于LlamaIndex項目構建簡單的智能體應用 242
10.1.1 軟件安裝和模型下載 243
10.1.2 構建本地知識庫 245
10.1.3 實現(xiàn)基于本地知識庫的智能體問答 246
10.2 基于Swarm框架構建智能體應用 250
10.2.1 Swarm框架介紹 251
10.2.2 DeepSeek模型接入 253
10.2.3 調用外部工具 255
10.3 開源Agent應用框架 260
10.3.1 Browser Use 260
10.3.2 Camel 268
小結 279
參考文獻 281