從零構(gòu)建向量數(shù)據(jù)庫(kù)·珊瑚書(shū)
定 價(jià):69.8 元
叢書(shū)名:圖靈原創(chuàng)
這是一本需要?jiǎng)邮謱?shí)踐的圖書(shū),通過(guò)帶領(lǐng)大家從零構(gòu)建一款分布式向量數(shù)據(jù)庫(kù),讓大家透徹理解向量數(shù)據(jù)庫(kù)的技術(shù)原理和實(shí)現(xiàn)細(xì)節(jié)。本書(shū)共分為三大部分,內(nèi)容由淺入深、循序漸進(jìn)。第一部分 認(rèn)識(shí)向量數(shù)據(jù)庫(kù)(第1~3章)是基礎(chǔ)篇,介紹向量數(shù)據(jù)庫(kù)的基礎(chǔ)知識(shí),涵蓋向量及數(shù)據(jù)庫(kù)的基本概念、向量數(shù)據(jù)庫(kù)的發(fā)展歷程和核心功能。第二部分 構(gòu)建向量數(shù)據(jù)庫(kù)(第4~6章)是核心篇,詳細(xì)介紹如何從零開(kāi)始構(gòu)建并優(yōu)化向量數(shù)據(jù)庫(kù),巨細(xì)靡遺地展示數(shù)據(jù)庫(kù)內(nèi)核的技術(shù)實(shí)現(xiàn)細(xì)節(jié)并輔以代碼示例、技術(shù)架構(gòu)圖等,旨在讓大家真正實(shí)現(xiàn)動(dòng)手寫(xiě)向量數(shù)據(jù)庫(kù)。第三部分 向量數(shù)據(jù)庫(kù)的實(shí)踐與展望(第7~8章)是結(jié)束篇,通過(guò)實(shí)踐案例展示向量數(shù)據(jù)庫(kù)在AI應(yīng)用中的使用方法,并嘗試勾勒向量數(shù)據(jù)庫(kù)的未來(lái)。本書(shū)面向數(shù)據(jù)庫(kù)開(kāi)發(fā)人員、數(shù)據(jù)庫(kù)管理員、數(shù)據(jù)庫(kù)架構(gòu)師等數(shù)據(jù)庫(kù)從業(yè)人員,AI從業(yè)者,及其他對(duì)向量數(shù)據(jù)庫(kù)感興趣的讀者。
1.【實(shí)操】涉及技術(shù)原理、實(shí)現(xiàn)細(xì)節(jié)和實(shí)踐應(yīng)用,涵蓋向量數(shù)據(jù)庫(kù)的方方面面2.【生動(dòng)】10次版本迭代/10000行代碼;27張表/41幅圖/22個(gè)思維導(dǎo)圖輕松學(xué)3.【專(zhuān)業(yè)】作者羅云是騰訊云向量數(shù)據(jù)庫(kù)負(fù)責(zé)人,帶領(lǐng)團(tuán)隊(duì)積累了豐富的一線經(jīng)驗(yàn)4.【熱門(mén)】自制成功立馬投入實(shí)踐,帶大家結(jié)合RAG實(shí)現(xiàn)個(gè)人知識(shí)庫(kù)等大模型應(yīng)用5.【簡(jiǎn)單】附贈(zèng)隨書(shū)代碼,隨學(xué)隨查原來(lái),構(gòu)建向量數(shù)據(jù)庫(kù)如此簡(jiǎn)單!
羅云 騰訊云數(shù)據(jù)庫(kù)副總經(jīng)理、騰訊云創(chuàng)始團(tuán)隊(duì)成員、中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(huì)(CCSA TC601)數(shù)據(jù)庫(kù)與存儲(chǔ)工作組副組長(zhǎng)。 十余年云計(jì)算產(chǎn)品技術(shù)專(zhuān)家,在復(fù)雜分布式系統(tǒng)的建設(shè)和管理上實(shí)踐多年并積累了豐富的經(jīng)驗(yàn),擅長(zhǎng)將數(shù)據(jù)治理技術(shù)(采集、加工、存儲(chǔ)、檢索)和AI結(jié)合,在AI時(shí)代更好地發(fā)揮數(shù)據(jù)的價(jià)值。 領(lǐng)導(dǎo)多個(gè)平臺(tái)或產(chǎn)品完成從0到1的上線與商業(yè)化運(yùn)營(yíng),達(dá)到國(guó)內(nèi)領(lǐng)先水平,其中包括: 1. 一站式 Serverless開(kāi)發(fā)平臺(tái)(小程序云開(kāi)發(fā)) 2. TencentDB for Redis/MongoDB/KeeWiDB、Tencent Cloud VectorDB等數(shù)據(jù)庫(kù)產(chǎn)品 3. 騰訊云數(shù)據(jù)傳輸服務(wù)(DTS)、數(shù)據(jù)庫(kù)智能管家(DBbrain)等多款數(shù)據(jù)采集和智能化應(yīng)用平臺(tái)
第 一部分 認(rèn)識(shí)向量數(shù)據(jù)庫(kù)第 1章 向量數(shù)據(jù)庫(kù)基礎(chǔ) 21.1 向量 21.1.1 什么是向量 21.1.2 萬(wàn)物皆可向量 41.1.3 向量間的相似度 61.1.4 相似度應(yīng)用案例 81.2 數(shù)據(jù)庫(kù) 111.2.1 什么是數(shù)據(jù)庫(kù) 111.2.2 關(guān)系型數(shù)據(jù)庫(kù) 131.2.3 非關(guān)系型數(shù)據(jù)庫(kù) 141.2.4 傳統(tǒng)數(shù)據(jù)庫(kù)的限制 151.3 為什么需要向量數(shù)據(jù)庫(kù) 161.3.1 向量數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)的差異 161.3.2 向量數(shù)據(jù)庫(kù)應(yīng)運(yùn)而生 171.3.3 大模型時(shí)代的智能存儲(chǔ)平臺(tái) 181.4 小結(jié) 19第 2章 向量數(shù)據(jù)庫(kù)極簡(jiǎn)史 212.1 孕育期(19802012) 212.1.1 深度神經(jīng)網(wǎng)絡(luò)的飛速發(fā)展 222.1.2 深度神經(jīng)網(wǎng)絡(luò)vs向量數(shù)據(jù)庫(kù) 232.2 誕生期(20122017) 242.3 成長(zhǎng)期(2017年至今) 252.3.1 行業(yè)發(fā)展簡(jiǎn)況 262.3.2 代表性產(chǎn)品能力對(duì)比 272.3.3 代表性產(chǎn)品技術(shù)架構(gòu) 282.4 小結(jié) 32第3章 向量數(shù)據(jù)庫(kù)的核心能力 333.1 基礎(chǔ)能力 333.1.1 邏輯層次 343.1.2 索引 393.1.3 關(guān)鍵指標(biāo) 423.2 高階能力 433.2.1 動(dòng)態(tài)schema 433.2.2 別名機(jī)制 443.2.3 向量化 453.2.4 混合查詢(xún) 463.3 小結(jié) 47第二部分 構(gòu)建向量數(shù)據(jù)庫(kù)第4章 實(shí)現(xiàn)單機(jī)向量數(shù)據(jù)庫(kù) 504.1 實(shí)現(xiàn)向量數(shù)據(jù)索引 504.1.1 FAISS核心功能 514.1.2 實(shí)現(xiàn)扁平索引 56初始版本v0.0.1 624.1.3 HNSWLib核心功能 634.1.4 實(shí)現(xiàn)HNSW索引 70版本迭代v0.0.2 734.2 實(shí)現(xiàn)混合數(shù)據(jù)索引 744.2.1 實(shí)現(xiàn)標(biāo)量數(shù)據(jù)索引 744.2.2 統(tǒng)一管理入口 76版本升級(jí)v0.1 794.2.3 實(shí)現(xiàn)過(guò)濾索引 80版本迭代v0.1.1 864.3 實(shí)現(xiàn)系統(tǒng)異;謴(fù) 874.3.1 數(shù)據(jù)日志持久化 87版本迭代v0.1.2 914.3.2 數(shù)據(jù)快照持久化 92版本升級(jí)v0.2 974.4 小結(jié) 97第5 章 實(shí)現(xiàn)分布式向量數(shù)據(jù)庫(kù) 995.1 集群數(shù)據(jù)管理 1005.1.1 認(rèn)識(shí)NuRaft 1025.1.2 建立主從關(guān)系 1065.1.3 實(shí)現(xiàn)數(shù)據(jù)復(fù)制 110版本升級(jí)v0.3 1135.2 集群流量管理 1135.2.1 集群的元數(shù)據(jù)管理 1145.2.2 統(tǒng)一的流量入口 1175.2.3 讀寫(xiě)分離 1215.2.4 保證讀寫(xiě)一致性 122版本升級(jí)v0.4 1235.3 集群異常管理 1235.3.1 發(fā)現(xiàn)新主節(jié)點(diǎn) 1235.3.2 發(fā)現(xiàn)故障從節(jié)點(diǎn) 1255.3.3 實(shí)現(xiàn)故障切換 127版本升級(jí)v0.5 1285.4 集群的分片 1305.4.1 配置集群的分片策略 1305.4.2 根據(jù)分片策略轉(zhuǎn)發(fā)請(qǐng)求 132版本升級(jí)v0.6 1395.5 小結(jié) 140第6 章 優(yōu)化向量數(shù)據(jù)庫(kù) 1426.1 性能優(yōu)化 1436.1.1 利用指令集優(yōu)化向量計(jì)算 1436.1.2 優(yōu)化查詢(xún)算法 1446.1.3 優(yōu)化通信協(xié)議 1476.1.4 自定義基準(zhǔn)測(cè)試工具 1496.2 成本優(yōu)化 1546.2.1 多模塊混合部署 1556.2.2 單節(jié)點(diǎn)部署 1586.3 易用性?xún)?yōu)化 1606.3.1 SDK 1606.3.2 訪問(wèn)鑒權(quán) 1626.3.3 數(shù)據(jù)備份 1696.4 小結(jié) 172第三部分 向量數(shù)據(jù)庫(kù)的實(shí)踐與展望第7 章 向量數(shù)據(jù)庫(kù)實(shí)踐案例 1767.1 搭建圖片查詢(xún)系統(tǒng) 1767.1.1 圖片向量化 1767.1.2 圖片上傳和查詢(xún) 1797.1.3 系統(tǒng)效果一覽 1817.2 搭建個(gè)人知識(shí)庫(kù) 1827.2.1 知識(shí)預(yù)處理 1827.2.2 知識(shí)向量化 1837.2.3 知識(shí)庫(kù)管理 1847.2.4 知識(shí)問(wèn)答 1857.2.5 系統(tǒng)效果一覽 1867.3 小結(jié) 187第8 章 展望 1898.1 從行業(yè)演進(jìn)視角看 1908.1.1 人類(lèi)調(diào)度數(shù)據(jù)新范式 1908.1.2 向量數(shù)據(jù)抹平數(shù)據(jù)格式差異 1928.1.3 向量數(shù)據(jù)庫(kù)平臺(tái)化的關(guān)鍵 1938.2 從行業(yè)應(yīng)用視角看 1948.2.1 RAG 簡(jiǎn)介 1958.2.2 降低RAG 使用門(mén)檻 1968.3 小結(jié) 197