書單推薦
更多
新書推薦
更多

視覺語言模型VLM原理與實戰(zhàn)

視覺語言模型VLM原理與實戰(zhàn)

定  價:99 元

        

當前圖書已被 2 所學校薦購過!
查看明細

  • 作者:吳建明、吳一昊 編著
  • 出版時間:2025/9/1
  • ISBN:9787122478733
  • 出 版 社:化學工業(yè)出版社
  • 中圖法分類:TP391 
  • 頁碼:267
  • 紙張:
  • 版次:01
  • 開本:小16開
9
7
4
8
7
7
8
1
7
2
3
2
3

讀者對象:本書系統(tǒng)性與前沿性并重,理論與實踐結合,非常適合AI算法工程師、大模型及多模態(tài)人工智能研究者學習,也可用作高等院校相關專業(yè)的教材及參考書。

本書系統(tǒng)闡述了視覺語言模型的理論體系與技術實踐。全書共15章,分為三大部分:基礎綜述(第1章)、關鍵技術(第2~14章)與未來展望(第15章)。
第一部分詳解視覺語言模型的網(wǎng)絡架構、預訓練目標、評估方法及數(shù)據(jù)集體系,對比分析對抗訓練、生成式預訓練等范式,并建立性能評估基準。第二部分:第2章通過多個案例展示技術多樣性;第3~5章深入探討少樣本學習、魯棒微調等關鍵問題,提出約束線性探測等原創(chuàng)方法;第6~10章聚焦模型擴展性,涵蓋InternVL億級參數(shù)訓練、VinVL視覺表征重構等前沿實踐;第11~14章探索提示工程、異常檢測等應用場景,包含MATCHER一次性分割等突破性方案。第三部分展望多模態(tài)生成、組合推理等未來方向。
本書系統(tǒng)性與前沿性并重,理論與實踐結合,非常適合AI算法工程師、大模型及多模態(tài)人工智能研究者學習,也可用作高等院校相關專業(yè)的教材及參考書。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容