大模型項目實戰(zhàn):Agent開發(fā)與應(yīng)用 高強文
定 價:89 元
叢書名:智能系統(tǒng)與技術(shù)叢書
當(dāng)前圖書已被 2 所學(xué)校薦購過!
查看明細(xì)
- 作者:高強文
- 出版時間:2025/3/1
- ISBN:9787111777335
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP18
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
這是一本面向初中級讀者的Agent學(xué)習(xí)指南,作者既是資深的AI技術(shù)專家,又是經(jīng)驗豐富的項目導(dǎo)師,融合作者親身實踐、培訓(xùn)反饋與官方資源,為Agent使用者和開發(fā)者提供了快速上手的實用指導(dǎo)。
本書從基礎(chǔ)知識、操作和應(yīng)用開發(fā)3個維度循序漸進(jìn)地講解Agent實戰(zhàn)技巧,分為三篇:
?基礎(chǔ)篇(1~2章) 介紹Agent定義、發(fā)展歷程、常用開源技術(shù)、主要組件等基礎(chǔ)知識和開發(fā)環(huán)境的搭建過程。
?應(yīng)用篇(3~6章) 從通用型、任務(wù)驅(qū)動型、輔助開發(fā)型和檢索增強型 4大類,通過AutoGPT、MemGPT、BabyAGI、Camel、Devika、CodeFuse-ChatBot、DB-GPT、QAnything這8種具體類型,詳細(xì)描述Agent的安裝、配置和使用等操作步驟。
?開發(fā)篇(7~16章) 展開分析10個不同場景的Agent應(yīng)用開發(fā)實例。一方面,以AgentScope、LangChain、LangGraph、AutoGen、LlamaIndex、CrewAI、Qwen-Agent這7種被廣泛應(yīng)用的開源Agent開發(fā)框架為基礎(chǔ),針對每個框架各講解一個開發(fā)案例。另一方面,通過案例介紹Agent開發(fā)過程中關(guān)鍵的Function-calling特性及大語言模型開發(fā)技術(shù)。此外,對基于CogVLM2的多模態(tài)模型應(yīng)用開發(fā),也提供詳細(xì)的案例演示。
(1)實力派作者,洞察讀者實際需求:作者既是資深A(yù)I技術(shù)專家,也是經(jīng)驗豐富的項目導(dǎo)師,深諳行業(yè)動態(tài)和讀者需求。本書融合了作者的實踐經(jīng)驗、培訓(xùn)反饋與官方資源,提供了一套快速上手、實用高效的指導(dǎo)方案。
(2)翔實內(nèi)容,降低開發(fā)門檻:本書采用開源框架,降低選型成本。書中深入剖析AI Agent的核心原理及15種主流框架,并通過10個不同領(lǐng)域的實例詳細(xì)講解實戰(zhàn)技巧,操作步驟細(xì)致、源代碼完整,助力讀者迅速掌握關(guān)鍵技術(shù)。
(3)貼近實際,滿足職場與創(chuàng)業(yè)需求:這是一本面向初中級讀者的Agent學(xué)習(xí)指南,覆蓋職場應(yīng)用與創(chuàng)業(yè)項目的實際場景,幫助Agent使用者和開發(fā)者實現(xiàn)定制化開發(fā),切實滿足多樣化的行業(yè)需求。
前 言
AI Agent(或簡稱為Agent)是建立在大語言模型之上的智能應(yīng)用,是將人工智能與特定場景深度結(jié)合的重要方式。Agent模仿人類“思考–行動–觀察”的規(guī)劃模式,具備自主思考和自主決策的能力,能夠適應(yīng)環(huán)境的變化,自主學(xué)習(xí)和改進(jìn),完成用戶設(shè)定的目標(biāo)。與大語言模型的對話應(yīng)用不同,Agent的突出特點是主動性,在行為上表現(xiàn)為多步操作、多角色會話、多輪迭代、反復(fù)修正答案以及調(diào)用外部資源的能力。
20世紀(jì)80年代,對于AI Agent是否能夠真正產(chǎn)生自主性的、生物意義上的“智能”這一問題已在哲學(xué)層面展開討論。20年前,深度學(xué)習(xí)的發(fā)展促進(jìn)了Agent的進(jìn)化。近幾年來,在大語言模型的支持下,Agent越來越具備主動性,“思考”問題的方法也在參考人類特征的基礎(chǔ)上,形成一套包含規(guī)劃、記憶、工具和行動的功能規(guī)范。在Agent與大語言模型技術(shù)結(jié)合方面,ReAct、ToT、Reflexion、CoT等思考框架的研究成果不斷,相關(guān)論文以及與之配套的開源代碼詮釋了理論如何變?yōu)楝F(xiàn)實。看似眼花繚亂實則科學(xué)嚴(yán)謹(jǐn)?shù)奶崾驹~工程,在與大語言模型的交互中,使得Agent像施展魔法般地實現(xiàn)了人類預(yù)定的目標(biāo)。展望未來,基于Agent,人們對通用人工智能(Artificial General Intelligence, AGI)充滿了想象空間。
Agent的發(fā)展離不開大語言模型的支持,而大語言模型則通過Agent擴展其功能。隨著GPT-4、GLM-4、Llama3、Qwen2等模型的發(fā)布,依托這些模型的應(yīng)用技術(shù)也取得了顯著的進(jìn)步,GPT-4率先推出了Function-calling功能,其他模型也迅速跟進(jìn)。這一創(chuàng)新反映了大語言模型將超越單純的內(nèi)容生成,向更智能、更主動、更有規(guī)劃性的AGI方向發(fā)展。AutoGPT、BabyAGI等Agent應(yīng)用的推出,使代表著主動思考、主動決策、主動執(zhí)行的AGI技術(shù)取得了長足的進(jìn)步。同時,LangChain、AutoGen等Agent開發(fā)框架的問世與流行,使這個領(lǐng)域的應(yīng)用開發(fā)變得更加便捷,多角色、多模態(tài)的Agent應(yīng)用紛紛涌現(xiàn)。
目前,Agent正處于快速發(fā)展過程中,已在長記憶會話、任務(wù)處理、檢索增強、輔助編程等領(lǐng)域產(chǎn)生了許多產(chǎn)品和應(yīng)用案例。本書詳細(xì)介紹了8種開源的主流Agent應(yīng)用以及7種Agent開發(fā)框架,從基礎(chǔ)、應(yīng)用、開發(fā)三個層面對Agent知識進(jìn)行了循序漸進(jìn)的講解?紤]到實際應(yīng)用場景,本書還涵蓋了支撐Agent應(yīng)用的大型語言模型的安裝、服務(wù)開發(fā)以及微調(diào)技術(shù),從而使Agent的知識體系更加完整。
本書特點
本書具有以下特點:
基于開源技術(shù):本書中涉及的所有Agent技術(shù)都是開源項目,所使用的大模型也皆為開源模型且可在本地部署,而非依賴OpenAI等云服務(wù)。案例代碼中不依賴額外的API,均可在本地部署的模型支持下進(jìn)行調(diào)試和運行。此外,本書所有案例代碼已在GitHub上開源。
技術(shù)廣泛:本書涵蓋了8種Agent應(yīng)用(應(yīng)用篇)和7種Agent開發(fā)框架(開發(fā)篇),共涉及15種開源Agent技術(shù)。Agent正在快速發(fā)展,覆蓋的技術(shù)越多,讀者學(xué)習(xí)或深入研究的選擇越多。
國內(nèi)外并重:本書使用的技術(shù)中,國產(chǎn)Agent、國產(chǎn)大模型技術(shù)占有一定的比例,如QAnything、AgentScope、CodeFuse-ChatBot、Qwen-Agent、GLM-4、CogVLM2等。對于讀者來說,閱讀本書后,如果想了解相關(guān)技術(shù)細(xì)節(jié),那么國產(chǎn)項目的中文文檔更易于深入學(xué)習(xí)。
詳解大模型技術(shù):大語言模型是Agent的運行基礎(chǔ),本書專門對大模型的開發(fā)技術(shù)進(jìn)行了詳細(xì)講解,內(nèi)容包括大語言模型的應(yīng)用、服務(wù)開發(fā)與微調(diào)。通過學(xué)習(xí),讀者能夠深入了解Agent背后的內(nèi)容生成原理。
案例涉及的領(lǐng)域廣泛:本書提供了10個不同場景的Agent應(yīng)用開發(fā)案例,案例涉及的領(lǐng)域廣泛,且貼近讀者的學(xué)習(xí)與生活,如任務(wù)驅(qū)動、多角色協(xié)同、輔助編程、RAG、圖像、多模態(tài)等,實用性強。
內(nèi)容來源
本書的內(nèi)容源于筆者的研究與實踐。在寫作過程中,我精心挑選了各類Agent技術(shù),涵蓋多個領(lǐng)域和場景,力求在知識的廣度和深度上都有所考量,希望為讀者提供多元化的參考。具體來說,本書的寫作素材來源主要包括以下幾個方面:
實踐案例:在本書撰寫過程中,我實踐了大量Agent應(yīng)用,并開發(fā)了一系列多領(lǐng)域的示例程序。
官方資源:本書整合了來自各種Agent應(yīng)用和開發(fā)框架的官網(wǎng)資料,確保得到官方的前沿信息。
培訓(xùn)課件:在過去兩年中,我作為培訓(xùn)講師,為教師、學(xué)生以及軟件企業(yè)舉辦了多場大語言模型培訓(xùn),其中,Agent實操課程也是一個重要的培訓(xùn)主題,因此獲得了大量學(xué)員反饋,從而優(yōu)化了本書內(nèi)容。
讀者對象
本書涉及的Agent技術(shù)豐富、操作步驟詳細(xì)、源代碼完整,適合Agent使用者和開發(fā)者上手實踐。
對于使用者來說,8種典型的Agent開源應(yīng)用,能夠滿足他們在部署與使用方面的需求。
對于開發(fā)者來說,10個不同場景的Agent應(yīng)用開發(fā)案例以及多種大語言模型服務(wù),能夠滿足他們學(xué)習(xí)、實踐的需求。
如何閱讀本書
這是一本講解Agent基礎(chǔ)知識、開發(fā)與應(yīng)用方法的實戰(zhàn)指南,共分為三篇:
基礎(chǔ)篇:包括第1和2章,介紹了Agent定義、發(fā)展歷程、常用開源技術(shù)、主要組件等基礎(chǔ)知識和開發(fā)環(huán)境的搭建過程。
應(yīng)用篇:包括第3~6章,從通用型、任務(wù)驅(qū)動型、輔助開發(fā)型和檢索增強型的分類角度,介紹了AutoGPT、MemGPT、BabyAGI、Camel、Devika、CodeFuse-ChatBot、DB-GPT、QAnything這8種流行度高、社區(qū)完善、正在快速發(fā)展的開源Agent應(yīng)用,描述其運行原理、安裝方法和使用過程。
開發(fā)篇:包括第7~16章,完成10個不同場景的Agent應(yīng)用開發(fā)實戰(zhàn)。一方面,以AgentScope、LangChain、LangGraph、AutoGen、LlamaIndex、CrewAI、Qwen-Agent這7種目前被廣泛應(yīng)用的開源Agent開發(fā)框架為基礎(chǔ),針對每個框架各講解一個開發(fā)案例。另一方面,通過案例介紹了Agent開發(fā)過程中關(guān)鍵的Function-calling特性及大語言模型開發(fā)技術(shù)。此外,對基于CogVLM2的多模態(tài)模型應(yīng)用開發(fā),也提供了案例演示。
實踐要求及說明
在本書的大部分示例中,Agent需要大語言模型具備Function-calling特性或?qū)ν评砟芰σ筝^高,所以基本上選用了8B、9B等參數(shù)規(guī)模的模型,運行這些模型所需的GPU內(nèi)存在20GB左右。書中還涉及一些大模型的微調(diào)技術(shù)和多模態(tài)模型的應(yīng)用開發(fā),所以至少需要1張24GB內(nèi)存的推理卡或顯卡。雖然部分示例在Ollama的量化環(huán)境下只需要6GB內(nèi)存即可正常運行,但為了完整實踐所有示例,建議采用24GB或以上內(nèi)存的推理卡或顯卡,以及與之配套的服務(wù)器或高端個人計算機。
以下是關(guān)于閱讀與實踐本書內(nèi)容的注意事項。
①操作系統(tǒng)。Agent應(yīng)用服務(wù)本身可以運行在Windows和Linux下。Agent需要大語言模型的支持,在本書所介紹的裝載大語言模型的三種方法中,只有Ollama支持Windows操作系統(tǒng),其余兩種由于依賴vLLM而不能在Windows上運行。綜合以上情況,建議讀者在Ubuntu 22.04操作系統(tǒng)中實踐本書內(nèi)容。書中涉及的文件下載、文件編輯、文件復(fù)制等操作系統(tǒng)命令均使用了Linux的方式描述,如果讀者使用Windows,則要根據(jù)情況采用對應(yīng)的操作方法。
②命令換行。在操作系統(tǒng)命令行下執(zhí)行命令時,Linux系統(tǒng)支持對較長的命令采用“\”進(jìn)行換行,命令執(zhí)行結(jié)果不會發(fā)生變化,而在Windows系統(tǒng)中要將“\”換成“^”。
例如,以下命令在Linux系統(tǒng)中運行正常:
pip install -r requirements.txt -i \
https://pypi.mirrors.ustc.edu.cn/simple
該命令如果要在Windows系統(tǒng)中正常運行,則需要把首行行尾的“\”替換成“^”,格式如下:
pip install -r requirements.txt -i ^
https://pypi.mirrors.ustc.edu.cn/simple
③命令注釋。本書中描述的在操作系統(tǒng)命令行下執(zhí)行的命令,如果以“#”開頭則為注釋,無須執(zhí)行。為了避免讀者將多條命令誤以為是一條連續(xù)的命令一起執(zhí)行而發(fā)生錯誤,我一般會在每條命令的前一行加注釋。
④示例代碼。得益于Python語言的精練以及各種Agent開發(fā)框架的封裝,本書的示例代碼大多在100行左右,開發(fā)篇中列出的基本上都是完整源代碼。但書中為了詳細(xì)地解釋程序原理,特意對代碼進(jìn)行了分段敘述,這會因縮進(jìn)難以觀察而影響代碼的整體性和可讀性,建議讀者調(diào)試程序時,從本書的配套代碼庫中下載所用的代碼。
⑤主機名稱。為了統(tǒng)一和規(guī)范書中程序的配置與訪問方式,減少可能的歧義,本書采用以下約定:如果是本機地址,則使用127.0.0.1表示;如果涉及GPU服務(wù)器,則使用主機名“server-dev”指代。主機名對應(yīng)的IP地址可以通過配置DNS解析來確定,在Windows系統(tǒng)中修改C:\Windows\System32\drivers\etc\HOSTS文件,在Linux系統(tǒng)中修改/etc/hosts文件。
勘誤和支持
本書的所有源代碼和簡要操作步驟,已在https://github.com/little51/agent-dev上開源,讀者可自行查閱。
雖然我在寫作時已盡力謹(jǐn)慎,反復(fù)測試驗證,但本書中仍可能出現(xiàn)一些疏漏或者不準(zhǔn)確之處,懇請讀者指正。若讀者有勘誤或意見,可通過郵件little51@126.com反饋,或者在https://github.com/little51/agent-dev代碼庫上提交issue。
致謝
2023年以后,我一直從事大語言模型應(yīng)用開發(fā)與培訓(xùn)工作。2024年初,我結(jié)合工作中積累的經(jīng)驗,對培訓(xùn)課件進(jìn)行整理,形成一些關(guān)于大模型應(yīng)用開發(fā)的原始寫作素材,并獲得與機械工業(yè)出版社合作的機會,開始撰寫《大模型項目實戰(zhàn):多領(lǐng)域智能應(yīng)用開發(fā)》一書。2024年7月,在該書的寫作接近尾聲時,為期半個月的人工智能培訓(xùn)也在按計劃進(jìn)行,我將AI Agent的一些內(nèi)容加到課程中,得到了廣大學(xué)員的積極反饋和同事的建議,這激勵我撰寫一本關(guān)于Agent的圖書,于是我一邊開發(fā)多個領(lǐng)域的Agent示例程序,一邊進(jìn)行文本書寫。經(jīng)過近三個月不停歇的工作,這本新書即將問世。
在這一過程中,我要感謝以下朋友:
我要感謝我所在公司的集團(tuán)領(lǐng)導(dǎo)梁明道先生,在我的印象中,十年前他就開始反復(fù)給我描繪“智體”的前景,這對我在Agent方面的研究大有裨益。在他的理論中,這種具有主動性、自我決策和自動執(zhí)行的實體,一定會成為AGI的發(fā)展方向。甚至在十年前,他就注冊了aiit.com這樣的四字域名,用于以后的智體產(chǎn)品研發(fā)與推廣。
感謝我的同事董煒,他一如既往、一絲不茍地安排培訓(xùn)工作,使我在培訓(xùn)過程中將所有精力都用到了課件的準(zhǔn)備和與學(xué)員的交流上。學(xué)員的學(xué)習(xí)反饋和他們對課程的建議,對本書中的Agent技術(shù)選型起到關(guān)鍵作用。
感謝我的同事楊樂,他很早就開始研究Agent開發(fā),得知我打算寫一本該領(lǐng)域的圖書時,他給了我很多建議,并協(xié)助我采購了雙推理卡設(shè)備。具備一定算力的機器,是Agent開發(fā)中最重要的基礎(chǔ)設(shè)施支持。
本書中涉及的Agent應(yīng)用與開發(fā)框架以及各種大語言模型,都是開源項目,而且很大一部分使用的是極其寬松的MIT授權(quán)方式。作為開源社區(qū)的負(fù)責(zé)人和開源的受益者,本書的示例源碼也全部開源。感謝開源!
高強文
高強文
資深A(yù)I技術(shù)專家與項目導(dǎo)師。作為數(shù)字技術(shù)正高級工程師,專注于人工智能大語言模型應(yīng)用開發(fā)、開源社區(qū)開發(fā)與運營。
AI領(lǐng)域創(chuàng)業(yè)先鋒,寧夏回族自治區(qū)勞動模范。現(xiàn)任互鏈高科(北京)技術(shù)發(fā)展有限公司總經(jīng)理,銀川方達(dá)電子系統(tǒng)工程有限公司董事長。20多年來,一直從事信息化、人工智能等產(chǎn)品研發(fā)與管理工作。
近年來積極投身于開源事業(yè),開發(fā)運營aliendao.cn、gitclone.com和opendao.cn等開源社區(qū),在GitHub上貢獻(xiàn)了20多個開源代碼庫。著有《大模型項目實戰(zhàn):多領(lǐng)域智能應(yīng)用開發(fā)》,旨在為開發(fā)者提供AI技術(shù)實踐指導(dǎo)。
目 錄
前言
基礎(chǔ)篇
第1章 Agent基礎(chǔ)知識 2
1.1 Agent的概念 2
1.2 Agent的發(fā)展歷程 3
1.2.1 Agent起源 3
1.2.2 將Agent引入AI領(lǐng)域 4
1.2.3 Agent技術(shù)進(jìn)化與理論完善 5
1.2.4 Agent的深度學(xué)習(xí)應(yīng)用 5
1.2.5 基于LLM的Agent 6
1.3 常用的Agent開源技術(shù)及分類 6
1.4 Agent主要組件 10
1.4.1 大語言模型 11
1.4.2 規(guī)劃組件 12
1.4.3 記憶組件 15
1.4.4 工具組件 15
1.4.5 行動組件 16
第2章 Agent應(yīng)用與開發(fā)環(huán)境搭建 17
2.1 Agent應(yīng)用部署結(jié)構(gòu) 17
2.1.1 服務(wù)同機部署模式 18
2.1.2 服務(wù)分布式部署模式 19
2.2 Agent應(yīng)用環(huán)境安裝與驗證 19
2.2.1 推理卡驅(qū)動安裝 20
2.2.2 CUDA安裝 23
2.2.3 Anaconda安裝 25
2.2.4 Git安裝 26
2.2.5 應(yīng)用環(huán)境驗證 26
2.2.6 關(guān)于開發(fā)工具的建議 27
2.3 大語言模型的裝載及API服務(wù)搭建 27
2.3.1 Ollama 27
2.3.2 vLLM 30
2.3.3 GLM-4專用服務(wù) 32
應(yīng)用篇
第3章 通用型Agent應(yīng)用 37
3.1 AutoGPT:個人助理 37
3.1.1 AutoGPT介紹 37
3.1.2 AutoGPT原理 38
3.1.3 AutoGPT應(yīng)用 42
3.2 MemGPT:長記憶會話應(yīng)用 47
3.2.1 MemGPT介紹 47
3.2.2 MemGPT原理 47
3.2.3 MemGPT應(yīng)用 52
第4章 任務(wù)驅(qū)動型Agent應(yīng)用 56
4.1 BabyAGI:任務(wù)自驅(qū)動應(yīng)用 56
4.1.1 BabyAGI介紹 56
4.1.2 BabyAGI原理 57
4.1.3 BabyAGI應(yīng)用 62
4.2 Camel:角色扮演應(yīng)用 65
4.2.1 Camel介紹 65
4.2.2 Camel原理 65
4.2.3 Camel應(yīng)用 67
第5章 輔助開發(fā)型Agent應(yīng)用 70
5.1 Devika:AI“軟件工程師”應(yīng)用 70
5.1.1 Devika介紹 70
5.1.2 Devika原理 71
5.1.3 Devika應(yīng)用 75
5.2 CodeFuse-ChatBot:輔助編程應(yīng)用 79
5.2.1 CodeFuse-ChatBot介紹 79
5.2.2 CodeFuse-ChatBot原理 80
5.2.3 CodeFuse-ChatBot應(yīng)用 82
第6章 檢索增強型Agent應(yīng)用 85
6.1 DB-GPT:數(shù)據(jù)庫應(yīng)用 85
6.1.1 DB-GPT介紹 85
6.1.2 DB-GPT原理 86
6.1.3 DB-GPT應(yīng)用 88
6.2 QAnything:知識庫應(yīng)用 90
6.2.1 QAnything介紹 90
6.2.2 QAnything原理 91
6.2.3 QAnything應(yīng)用 93
開發(fā)篇
第7章 大語言模型開發(fā)與微調(diào) 97
7.1 開發(fā)要點 97
7.2 GLM-4 98
7.2.1 GLM-4介紹 98
7.2.2 GLM-4安裝 98
7.2.3 Chat應(yīng)用開發(fā) 99
7.2.4 GLM-4兼容API服務(wù)開發(fā) 102
7.2.5 GLM-4微調(diào) 104
7.3 Llama3 108
7.3.1 Llama3介紹 108
7.3.2 Llama3安裝 109
7.3.3 Chat應(yīng)用開發(fā) 110
7.3.4 Llama3兼容API服務(wù)
開發(fā) 113
7.3.5 Llama3微調(diào) 118
第8章 基于GLM-4的Function-calling應(yīng)用開發(fā) 124
8.1 開發(fā)要點 124
8.2 案例場景 125
8.3 關(guān)鍵原理 126
8.4 實現(xiàn)過程 128
8.4.1 環(huán)境安裝 128
8.4.2 源代碼 128
8.4.3 運行 133
第9章 基于AgentScope的ReAct Agent應(yīng)用開發(fā) 134
9.1 開發(fā)要點 134
9.2 案例場景 134
9.3 關(guān)鍵原理 135
9.4 實現(xiàn)過程 138
9.4.1 環(huán)境安裝 138
9.4.2 源代碼 139
9.4.3 運行 142
第10章 基于LangChain的任務(wù)驅(qū)動Agent應(yīng)用開發(fā) 143
10.1 開發(fā)要點 143
10.2 案例場景 144
10.3 關(guān)鍵原理 144
10.3.1 應(yīng)用架構(gòu) 145
10.3.2 應(yīng)用運行流程 145
10.3.3 應(yīng)用運行示例 146
10.4 實現(xiàn)過程 149
10.4.1 環(huán)境安裝 149
10.4.2 源代碼 150
10.4.3 運行 153
第11章 基于LangGraph的工作流Agent應(yīng)用開發(fā) 155
11.1 開發(fā)要點 155
11.2 案例場景 155
11.3 關(guān)鍵原理 156
11.3.1 基本概念 156
11.3.2 工作流定義 157
11.4 實現(xiàn)過程 158
11.4.1 環(huán)境安裝 158
11.4.2 源代碼 159
11.4.3 運行 163
第12章 基于AutoGen的輔助編程Agent應(yīng)用開發(fā) 164
12.1 開發(fā)要點 164
12.2 案例場景 165
12.3 關(guān)鍵原理 165
12.4 實現(xiàn)過程 167
12.4.1 環(huán)境安裝 167
12.4.2 源代碼 168
12.4.3 運行 171
第13章 基于LlamaIndex的RAG Agent綜合應(yīng)用開發(fā) 173
13.1 開發(fā)要點 173
13.2 案例場景 174
13.3 關(guān)鍵原理 174
13.3.1 索引建立 175
13.3.2 智體查詢 176
13.4 實現(xiàn)過程 176
13.4.1 環(huán)境安裝 176
13.4.2 源代碼 178
13.4.3 運行 181
第14章 基于CrewAI的多角色Agent應(yīng)用開發(fā) 182
14.1 開發(fā)要點 182
14.2 案例場景 183
14.3 關(guān)鍵原理 183
14.3.1 應(yīng)用架構(gòu) 183
14.3.2 主要組件 184
14.3.3 流式會話實現(xiàn)原理 185
14.4 實現(xiàn)過程 186
14.4.1 環(huán)境安裝 186
14.4.2 源代碼 187
14.4.3 運行 191
第15章 基于Qwen-Agent的多智體圖像應(yīng)用開發(fā) 193
15.1 開發(fā)要點 193
15.2 案例場景 194
15.3 關(guān)鍵原理 195
15.3.1 應(yīng)用架構(gòu) 195
15.3.2 關(guān)鍵技術(shù) 196
15.4 實現(xiàn)過程 198
15.4.1 環(huán)境安裝 198
15.4.2 源代碼 200
15.4.3 運行 202
15.4.4 增強方案 202
第16章 基于CogVLM2的多模態(tài)Agent應(yīng)用開發(fā) 204
16.1 開發(fā)要點