圖解AI Agent:智能體從原理到實(shí)踐
定 價(jià):109 元
- 作者:王振麗 著
- 出版時(shí)間:2025/11/1
- ISBN:9787301366479
- 出 版 社:北京大學(xué)出版社
- 中圖法分類(lèi):TP18
- 頁(yè)碼:432
- 紙張:
- 版次:1
- 開(kāi)本:16開(kāi)
本書(shū)系統(tǒng)闡述了AI Agent底層架構(gòu)的設(shè)計(jì)與實(shí)現(xiàn),內(nèi)容涵蓋從基礎(chǔ)理論到實(shí)際應(yīng)用的多個(gè)層面,內(nèi)容豐富且深入。全書(shū)共11章,從通用AI Agent的定義與分類(lèi)、核心特征入手,逐步展開(kāi)至開(kāi)發(fā)工具鏈、仿真與測(cè)試環(huán)境,并對(duì)各類(lèi)典型架構(gòu)模式進(jìn)行了詳細(xì)解析。書(shū)中不僅探討了感知、決策、規(guī)劃、推理和學(xué)習(xí)等關(guān)鍵模塊的技術(shù)原理,還深入剖析了多Agent協(xié)作與群體智能等復(fù)雜場(chǎng)景下的設(shè)計(jì)策略。通過(guò)對(duì)智能客服、自動(dòng)駕駛和量化交易等多個(gè)實(shí)際案例的詳細(xì)講解,展現(xiàn)了AI Agent在不同應(yīng)用領(lǐng)域的廣泛潛力和技術(shù)演進(jìn)路徑。本書(shū)既適合人工智能領(lǐng)域的研究人員深入學(xué)習(xí),也可為從業(yè)者提供詳盡的設(shè)計(jì)指南和工程實(shí)現(xiàn)方案,為構(gòu)建更先進(jìn)的AI系統(tǒng)奠定堅(jiān)實(shí)基礎(chǔ)。
王振麗
----------------------------
華中科技大學(xué)計(jì)算機(jī)碩士,騰訊T4工程師,資深A(yù)I與系統(tǒng)架構(gòu)專(zhuān)家。精通C、C#、C++、Java等多種編程語(yǔ)言,具備深厚的底層系統(tǒng)架構(gòu)和驅(qū)動(dòng)開(kāi)發(fā)經(jīng)驗(yàn),同時(shí)在AI Agent開(kāi)發(fā)、強(qiáng)化學(xué)習(xí)、知識(shí)圖譜、大規(guī)模分布式計(jì)算等領(lǐng)域有深入研究。作為資深Python開(kāi)發(fā)工程師,對(duì)人工智能框架、深度學(xué)習(xí)模型訓(xùn)練與優(yōu)化、Agent架構(gòu)設(shè)計(jì)及其在復(fù)雜場(chǎng)景中的應(yīng)用有深刻理解。擅長(zhǎng)構(gòu)建自適應(yīng)智能體系統(tǒng),在通用AI Agent、自動(dòng)決策系統(tǒng)、多智能體協(xié)作等方向有豐富的工程實(shí)踐經(jīng)驗(yàn),并致力于推動(dòng)Agent技術(shù)在自動(dòng)化、智能交互和工業(yè)應(yīng)用中的落地。
第1章 通用AI Agent概述
1.1 AI Agent的定義與分類(lèi)
1.1.1 反應(yīng)式Agent與認(rèn)知式Agent
1.1.2 單Agent系統(tǒng)與多Agent系統(tǒng)
1.2 通用AI Agent的核心特征
1.2.1 自主性、學(xué)習(xí)性與目標(biāo)導(dǎo)向性
1.2.2 動(dòng)態(tài)適應(yīng)能力
1.3 典型應(yīng)用場(chǎng)景與發(fā)展趨勢(shì)
1.3.1 智能助手、工業(yè)自動(dòng)化與復(fù)雜決策場(chǎng)景
1.3.2 通用AI Agent的技術(shù)演進(jìn)路徑
1.4 Manus初體驗(yàn)
1.4.1 登錄Manus
1.4.2 使用Manus制訂旅行計(jì)劃
1.4.3 總結(jié)通用AI Agent和GPT的區(qū)別
第2章 開(kāi)發(fā)工具鏈與框架
2.1 主流開(kāi)發(fā)框架
2.1.1 TensorFlow/PyTorch的Agent擴(kuò)展
2.1.2 ROS集成
2.2 仿真與測(cè)試環(huán)境
2.2.1 Unity ML-Agents與Gazebo
2.2.2 OpenAI Gym自定義環(huán)境開(kāi)發(fā)
2.3 專(zhuān)用工具庫(kù)
2.3.1 DialogFlow/Rasa對(duì)話系統(tǒng)開(kāi)發(fā)
2.3.2 開(kāi)源多Agent框架
2.3.3 云端異步處理環(huán)境框架
第3章 通用AI Agent的架構(gòu)設(shè)計(jì)
3.1 分層架構(gòu)設(shè)計(jì)
3.1.1 感知層、決策層與執(zhí)行層
3.1.2 模塊化與松耦合設(shè)計(jì)
3.1.3 容錯(cuò)性與實(shí)時(shí)性設(shè)計(jì)
3.2 核心組件與數(shù)據(jù)流
3.2.1 環(huán)境感知與狀態(tài)表示
3.2.2 任務(wù)規(guī)劃與動(dòng)作序列生成
3.2.3 數(shù)據(jù)流優(yōu)化策略
3.3 典型架構(gòu)模式分析
3.3.1 BDI架構(gòu)
3.3.2 端到端學(xué)習(xí)架構(gòu)與混合架構(gòu)
3.3.3 多Agent協(xié)同架構(gòu)
3.3.4 架構(gòu)選型與場(chǎng)景適配指南
第4章 環(huán)境感知與決策模型
4.1 多模態(tài)感知技術(shù)
4.1.1 計(jì)算機(jī)視覺(jué)與傳感器融合
4.1.2 自然語(yǔ)言處理與語(yǔ)音識(shí)別
4.2 動(dòng)態(tài)環(huán)境下的決策模型
4.2.1 基于強(qiáng)化學(xué)習(xí)的決策框架
4.2.2 知識(shí)圖譜驅(qū)動(dòng)的推理引擎
4.3 不確定性處理
4.3.1 貝葉斯網(wǎng)絡(luò)與馬爾可夫決策過(guò)程
4.3.2 實(shí)時(shí)決策的魯棒優(yōu)化
4.4 多Agent協(xié)同架構(gòu)
4.4.1 規(guī)劃代理與任務(wù)分解策略
4.4.2 執(zhí)行代理的動(dòng)態(tài)工具鏈調(diào)用
4.4.3 驗(yàn)證代理的魯棒性檢測(cè)機(jī)制
4.4.4 Manus中的多Agent協(xié)同架構(gòu)
第5章 任務(wù)規(guī)劃與推理系統(tǒng)
5.1 經(jīng)典規(guī)劃算法
5.1.1 啟發(fā)式搜索中的A*算法
5.1.2 分層任務(wù)網(wǎng)絡(luò)
5.2 現(xiàn)代規(guī)劃技術(shù)
5.2.1 基于深度學(xué)習(xí)的神經(jīng)規(guī)劃器
5.2.2 蒙特卡洛樹(shù)搜索的擴(kuò)展應(yīng)用
5.3 邏輯推理與符號(hào)系統(tǒng)
5.3.1 一階邏輯與Prolog引擎集成
5.3.2 神經(jīng)符號(hào)推理的混合方法
5.4 動(dòng)態(tài)任務(wù)分解與工具鏈集成
5.4.1 基于神經(jīng)符號(hào)系統(tǒng)的任務(wù)拆解方法
5.4.2 代碼Agent與可解釋性設(shè)計(jì)
第6章 學(xué)習(xí)與自適應(yīng)機(jī)制
6.1 遷移學(xué)習(xí)與領(lǐng)域適應(yīng)
6.1.1 預(yù)訓(xùn)練模型遷移策略
6.1.2 零樣本/小樣本學(xué)習(xí)
6.2 在線學(xué)習(xí)與持續(xù)優(yōu)化
6.2.1 增量式模型更新
6.2.2 基于反饋的強(qiáng)化學(xué)習(xí)
6.3 自我改進(jìn)機(jī)制
6.3.1 自動(dòng)機(jī)器學(xué)習(xí)
6.3.2 元學(xué)習(xí)框架
第7章 多Agent協(xié)作與競(jìng)爭(zhēng)
7.1 多Agent系統(tǒng)設(shè)計(jì)
7.1.1 集中式與分布式協(xié)作架構(gòu)
7.1.2 通信協(xié)議與共識(shí)算法
7.2 競(jìng)爭(zhēng)場(chǎng)景下的博弈策略
7.2.1 納什均衡與博弈論模型
7.2.2 深度強(qiáng)化學(xué)習(xí)在競(jìng)爭(zhēng)中的應(yīng)用
7.3 復(fù)雜環(huán)境中的群體智能
7.3.1 群體路徑規(guī)劃與資源分配
7.3.2 基于群體智能的協(xié)同優(yōu)化
第8章 基于DeepSeek/OpenAI的智能客服Agent
8.1 背景介紹
8.2 項(xiàng)目介紹
8.3 大模型交互
8.3.1 通用接口
8.3.2 工廠函數(shù)
8.3.3 調(diào)用 DeepSeek
8.3.4 調(diào)用OpenAI
8.4 實(shí)體模型
8.4.1 用戶請(qǐng)求數(shù)據(jù)模型
8.4.2 聊天助手配置
8.4.3 對(duì)話和消息模型
8.5 Agent
8.5.1 Agent工廠
8.5.2 OpenAI對(duì)話Agent
8.5.3 DeepSeek對(duì)話Agent
8.6 API服務(wù)
8.6.1 FastAPI服務(wù)
8.6.2 對(duì)話Agent
8.6.3 對(duì)話管理
8.6.4 隊(duì)列消息處理
8.6.5 事件路由
第9章 基于ROS具身智能的自動(dòng)駕駛Agent
9.1 背景介紹
9.2 項(xiàng)目介紹
9.3 公用文件
9.3.1 數(shù)學(xué)運(yùn)算
9.3.2 偽隨機(jī)數(shù)生成器
9.4 障礙物和邊界檢測(cè)
9.4.1 檢測(cè)全局障礙物和邊界
9.4.2 檢測(cè)本地障礙物和邊界
9.5 路徑規(guī)劃
9.5.1 跟墻壁行駛
9.5.2 A*算法路徑規(guī)劃
9.5.3 RRT算法
第10章 基于OpenAI的量化交易Agent
10.1 背景介紹
10.2 項(xiàng)目介紹
10.2.1 強(qiáng)化學(xué)習(xí)環(huán)境
10.2.2 模塊架構(gòu)
10.2.3 準(zhǔn)備環(huán)境
10.3 數(shù)據(jù)處理
10.3.1 準(zhǔn)備數(shù)據(jù)
10.3.2 數(shù)據(jù)預(yù)處理
10.4 構(gòu)建交易環(huán)境
10.4.1 訓(xùn)練數(shù)據(jù)拆分
10.4.2 投資組合配置環(huán)境
10.5 Agent交易模型
10.5.1 交易模型1:基于A2C算法
10.5.2 交易模型2: 基于PPO算法
10.5.3 交易模型3: 基于DDPG算法
10.5.4 交易模型4: 基于SAC算法
10.5.5 交易模型5: 基于TD3算法
10.5.6 交易測(cè)試
10.6 回測(cè)交易策略
10.6.1 回測(cè)統(tǒng)計(jì)
10.6.2 回測(cè)結(jié)果可視化
10.7 最小方差投資組合分配
10.7.1 優(yōu)化投資組合
10.7.2 深度強(qiáng)化學(xué)習(xí)、最小方差和DJIA的可視化
第11章 基于DeepSeek/OpenAI的仿Manus系統(tǒng)
11.1 背景介紹
11.2 功能介紹
11.3 系統(tǒng)配置
11.3.1 環(huán)境配置
11.3.2 Agent與LLM的映射
11.4 工具模塊
11.4.1 Bash命令工具
11.4.2 Python代碼執(zhí)行工具
11.4.3 爬蟲(chóng)工具
11.4.4 瀏覽器工具
11.5 語(yǔ)言模型模塊
11.6 Agent模塊
11.6.1 Agent節(jié)點(diǎn)
11.6.2 網(wǎng)頁(yè)瀏覽Agent
11.6.3 編程Agent
11.6.4 Agent協(xié)調(diào)器
11.6.5 報(bào)告Agent
11.6.6 信息收集Agent
11.7 提示模板模塊
11.7.1 提示模板管理
11.7.2 瀏覽器Agent的提示模板
11.8 Web請(qǐng)求響應(yīng)
11.8.1 FastAPI服務(wù)器端
11.8.2 客戶端腳本
11.9 Docker部署和配置
11.9.1 Docker部署
11.9.2 項(xiàng)目配置