書單推薦
更多
新書推薦
更多

大模型算法:強化學習、微調(diào)與對齊

 大模型算法:強化學習、微調(diào)與對齊

定  價:109 元

叢書名:通用智能與大模型叢書

        

當前圖書已被 1 所學校薦購過!
查看明細

  • 作者:余昌葉
  • 出版時間:2025/4/1
  • ISBN:9787121500725
  • 出 版 社:電子工業(yè)出版社
  • 中圖法分類:TP391 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:128開
9
7
5
8
0
7
0
1
7
2
2
1
5

本書系統(tǒng)地講解了大模型技術(shù)、訓練算法(包括強化學習、RLHF、GRPO、DPO、SFT與CoT蒸餾等)、 微調(diào)與對齊、效果優(yōu)化及其實踐。全書以大語言模型(LLM)為主線,絕大部分內(nèi)容也適用于多模態(tài)大模型(VLM 和MLLM)。本書面向AI算法與工程領域的從業(yè)者、相關專業(yè)的學生,以及希望深入了解大模型技術(shù)、擁抱AI與大模型浪潮的跨行業(yè)讀者。

 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容