生成式人工智能是當今科技領(lǐng)域的前沿熱點技術(shù)。本書從生成式AI入手,系統(tǒng)介紹了人工智能基礎(chǔ)知識。全書分為四個部分共15個項目,包含35個學習任務(wù),全面系統(tǒng)地介紹了生成式AI的基礎(chǔ)理論、核心技術(shù)、應(yīng)用場景以及社會影響,既突出生成式AI和AIGC技術(shù),又重視AIGC應(yīng)用,旨在為讀者提供一個全面、深入且實用的學習平臺,幫助讀者快速掌握生成式AI和AIGC技術(shù)的精髓及其在各領(lǐng)域的應(yīng)用實踐。本書內(nèi)容豐富、結(jié)構(gòu)清晰、理論與實踐相結(jié)合,既適合高等職業(yè)院校各專業(yè)的師生作為教材使用,也適合AI領(lǐng)域從業(yè)者、研究人員以及對AI技術(shù)感興趣的讀者自學參考。通過閱讀本書,讀者將能夠全面了解AI和生成式AI的核心技術(shù)與應(yīng)用實踐,掌握其在各領(lǐng)域的創(chuàng)新應(yīng)用,為未來的職業(yè)發(fā)展和個人成長奠定堅實基礎(chǔ)。
采用項目式編寫形式,面向高等職業(yè)院校的人工智能通識教育需求。詳細介紹LLM技術(shù)、提示工程、文本生成、圖像生成、音頻生成以及多模態(tài)生成等關(guān)鍵領(lǐng)域。展示生成式AI在文化創(chuàng)意、金融服務(wù)、智能制造、科學研究等領(lǐng)域的廣泛應(yīng)用。配套提供電子課件、微課視頻、教學大綱、教案、教學指導、作業(yè)集與答案。
2022年11月30日,美國OpenAI公司對外發(fā)布了基于大語言模型(LLM)的AI聊天機器人程序ChatGPT,它展現(xiàn)出絕妙的人機交互體驗,能夠充分理解人類自然語言,可以用人類自然對話的方式來交互。此外,它還可以用于更為復雜的語言工作,如自動生成文本、自動問答、自動摘要等多種任務(wù)。一時間,人們對其背后技術(shù)的了解和研究,對LLM和生成式AI技術(shù)的關(guān)注沖向了頂 峰。很快,中國的AI初創(chuàng)企業(yè)如雨后春筍般不斷涌現(xiàn)。2025 年年初,發(fā)布了低成本、高性能生成式AI的DeepSeek(深度求索公司)在全世界爆紅,成為在互聯(lián)網(wǎng)巨頭的資金和學術(shù)機構(gòu)的人才支撐下茁壯成長的“中華AI”,原本以美國企業(yè)為中心的AI性能競爭迎來全新局面。生成式AI已經(jīng)成為當今科技領(lǐng)域極具影響力和變革性的力量之一。它不僅推動了技術(shù)的進步,更深刻地改變了人們的生活方式、工作模式以及對世界的認知。本書旨在為讀者提供一個全面、系統(tǒng)且深入的生成式AI知識體系,幫助讀者更好地理解這一前沿技術(shù),并探索其在各個領(lǐng)域的廣泛應(yīng)用。本書分為四個部分。在基礎(chǔ)理論篇(項目1、2)中,深入探討了人工智能(AI)的起源、大數(shù)據(jù)的特征以及機器學習與深度學習的關(guān)系,為讀者構(gòu)建起理論框架。同時,通過對生成式AI的定義、層次和應(yīng)用場景的介紹,幫助讀者初步了解這一技術(shù)的核心概念和價值。核心技術(shù)篇(項目3~8)是本書的重點,詳細介紹了LLM技術(shù)、提示工程與技巧、文本生成技術(shù)、圖像生成技術(shù)、音頻生成技術(shù)以及多模態(tài)生成技術(shù)等關(guān)鍵領(lǐng)域。通過對技術(shù)的剖析,讀者能夠掌握生成式AI的核心原理和實現(xiàn)方法,并了解如何通過技術(shù)創(chuàng)新推動其發(fā)展。應(yīng)用場景篇(項目9~13)展示了生成式AI在文化創(chuàng)意、金融服務(wù)、智能制造、科學研究與設(shè)計以及智慧城市等領(lǐng)域的廣泛應(yīng)用。通過豐富的案例和實踐分析,讀者將看到AI和生成式AI如何為各個行業(yè)帶來創(chuàng)新和變革,同時也將了解到其在實際應(yīng)用中面臨的挑戰(zhàn)和未來的發(fā)展方向。最后,社會影響篇(項目14、15)深入探討了AI和生成式AI所帶來的倫理、法律和社會問題。從數(shù)據(jù)隱私保護到知識產(chǎn)權(quán)保護,從AI倫理原則到AGI(通用人工智能)的未來發(fā)展,將引導讀者思考如何在技術(shù)進步的同時,確保其符合人類的價值觀和社會利益。在撰寫本書的過程中,我們力求保證內(nèi)容的全面性、準確性和可讀性。希望本書不僅能夠成為高校各專業(yè)人工智能通識教材和專業(yè)人士的參考書籍,也能為那些對AI和生成式AI感興趣的讀者提供一個清晰易懂的入門指南。同時,我們鼓勵讀者在閱讀本書的過程中,積極參與相關(guān)技術(shù)的研究和實踐,探索AI和生成式AI的無限可能。AI和生成式AI的概念、技術(shù)與應(yīng)用是一門理論性和實踐性都很強的必修課程。本書精心設(shè)計教學過程,每個項目都有針對性地設(shè)計了課后作業(yè)以及實訓與思考環(huán)節(jié)。本書的教學進度設(shè)計見課程教學進度表,該表可作為教師授課參考。實際執(zhí)行時,教師可按照教學大綱安排教學進度,確定本課程的教學進度。本課程的教學評測可以從以下幾個方面入手,即:(1)每個項目的課后作業(yè)(15項)。(2)每個項目的“實訓與思考”活動(14項)。(3)項目15的“課程學習與實訓總結(jié)”。(4)學生針對每個項目的內(nèi)容寫下的閱讀筆記(建議)。(5)平時考勤情況。(6)授課老師認為有必要的其他評測方法。本書特色鮮明、易讀易學,適合高等職業(yè)院校各專業(yè)學生學習,也適合對AI以及LLM、生成式AI、AIGC、AGI相關(guān)領(lǐng)域感興趣的讀者閱讀參考。本書配有授課電子課件、20講微課教學視頻以及豐富的教學資源,需要的教師可登錄www.cmpedu.com免費注冊,審核通過后下載,或聯(lián)系編輯索取。本書微課視頻二維碼的使用方式:1)刮開教材封底處的“刮刮卡”,獲得“兌換碼”。2)關(guān)注微信公眾號“天工講堂”,選擇“我的”-“使用”。3)輸入“兌換碼”和“驗證碼”,選擇本書全部資源并免費結(jié)算。4)使用微信掃描教材中的二維碼觀看微課視頻。本書由湖南財經(jīng)工業(yè)職業(yè)技術(shù)學院張小寒、謝超擔任主編,湖南財經(jīng)工業(yè)職業(yè)技術(shù)學院王成、黃承明擔任副主編。參加本書編寫工作的還有湖南財經(jīng)工業(yè)職業(yè)技術(shù)學院王帥、羅爭、唐騰、胡迎春、匡孟秋,浙大城市學院周蘇。本書在編寫過程中得到了湖南財經(jīng)工業(yè)職業(yè)技術(shù)學院領(lǐng)導、同事,以及中慧云啟科技集團有限公司、新道科技股份有限公司、東軟睿新科技集團、北京博導前程信息技術(shù)股份有限公司等企業(yè)的大力支持和幫助,在此表示衷心的感謝!歡迎教師與作者交流并索取與本書配套的相關(guān)教學資料。由于作者水平有限,書中難免有疏漏之處,懇請讀者批評指正。
張小寒,男,漢族,1979年出生,湖南財經(jīng)工業(yè)職業(yè)技術(shù)學院副教授,信息工程學院院長。中共黨員,大學本科學歷,碩士學位。參加工作以來一直從事職業(yè)教育工作,先后主編教材3部、專著1部,參編教材10余部,主持省市校級課題近10項,發(fā)表論文40余篇。先后參與多項企業(yè)項目,有較豐富的實戰(zhàn)經(jīng)驗和較強的實踐能力。
前言第一部分 基礎(chǔ)理論篇項目1 人工智能基礎(chǔ) 2任務(wù)1.1 熟悉計算機基礎(chǔ) 21.1.1 通用電子計算機 31.1.2 圖靈測試及其發(fā)展 31.1.3 大數(shù)據(jù)定義 41.1.4 大數(shù)據(jù)的3V特征 51.1.5 人工智能的定義 61.1.6 人工智能發(fā)展的“中國風” 6任務(wù)1.2 進入人工智能時代 91.2.1 強人工智能 91.2.2 弱人工智能 101.2.3 實用型AI 111.2.4 機器學習 111.2.5 深度學習 131.2.6 機器學習與深度學習的關(guān)系 14【作業(yè)】 14【實訓與思考】探索AI在日常生活中的應(yīng)用 16項目2 生成式AI與AIGC 18任務(wù)2.1 從自然語言處理起步 182.1.1 Blockhead思維實驗 182.1.2 NLP研究內(nèi)容 192.1.3 深度學習的影響 202.1.4 LLM崛起 212.1.5 LLM的幻覺 22任務(wù)2.2 熟悉生成式人工智能 242.2.1 關(guān)于判別式AI 242.2.2 關(guān)于生成式AI 252.2.3 生成式AI的層次 262.2.4 定義AIGC 282.2.5 生成式AI與AIGC的關(guān)系 292.2.6 AIGC應(yīng)用場景 29【作業(yè)】 31【實訓與思考】熟悉阿里云大模型“通義千問” 32第二部分 核心技術(shù)篇項目3 大語言模型技術(shù) 36任務(wù)3.1 熟悉算法、算力與算料概念 363.1.1 算法:人工智能的智慧之源 363.1.2 算力:人工智能的動力引擎 373.1.3 算料:人工智能的燃料之源 373.1.4 DeepSeek帶來的啟示 37任務(wù)3.2 熟悉LLM工作原理 383.2.1 詞元及其標記化 383.2.2 基礎(chǔ)模型 383.2.3 詞嵌入及其含義 393.2.4 生成和理解 403.2.5 預訓練與微調(diào) 40任務(wù)3.3 熟悉關(guān)鍵生成模型 413.3.1 語言模型基礎(chǔ) 413.3.2 生成對抗網(wǎng)絡(luò)GAN 413.3.3 變分自編碼器VAE 443.3.4 流模型 463.3.5 接入LLM的幾種方法 47【作業(yè)】 49【實訓與思考】LLM典型案例分析 51項目4 提示工程與技巧 54任務(wù)4.1 熟悉提示工程技術(shù) 544.1.1 提示的原理 554.1.2 提示詞的分類和調(diào)優(yōu) 564.1.3 鏈式思考提示 574.1.4 生成知識提示 584.1.5 少樣本提示 584.1.6 自一致提示 584.1.7 思維樹提示 59任務(wù)4.2 掌握提示工程技巧 604.2.1 提示詞的原則 604.2.2 提示學習 614.2.3 語境學習 624.2.4 提示詞框架推薦 634.2.5 提示詞實踐技巧 65【作業(yè)】 66【實訓與思考】練習撰寫提示詞 68項目5 文本生成技術(shù) 71任務(wù)5.1 熟悉典型語言模型方法 715.1.1 基于規(guī)則的方法 725.1.2 統(tǒng)計語言模型 735.1.3 循環(huán)神經(jīng)網(wǎng)絡(luò)及其變體 745.1.4 Transformer模型 755.1.5 Transformer結(jié)構(gòu) 805.1.6 Transformer模塊 815.1.7 混合模型 82任務(wù)5.2 掌握典型文本生成技術(shù) 835.2.1 文本摘要 835.2.2 詩歌生成 835.2.3 簡單對話系統(tǒng) 845.2.4 翻譯任務(wù)中的應(yīng)用 84【作業(yè)】 85【實訓與思考】熟悉AI助手Kimi 87項目6 圖像生成技術(shù) 90任務(wù)6.1 熟悉圖像生成模型 906.1.1 擴散模型 916.1.2 自回歸模型 916.1.3 典型圖像生成模型 926.1.4 圖像生成應(yīng)用場景 92任務(wù)6.2 熟悉圖像與視頻生成技術(shù) 946.2.1 圖像風格遷移 956.2.2 超分辨率重建 966.2.3 視頻生成 986.2.4 醫(yī)療影像合成 996.2.5 挑戰(zhàn)與未來發(fā)展 100【作業(yè)】 101【實訓與思考】基于深度學習的圖像生成 103項目7 音頻生成技術(shù) 105任務(wù)7.1 熟悉音頻生成技術(shù) 1057.1.1 音頻與音樂 1067.1.2 音頻生成核心技術(shù) 1067.1.3 語音合成 1077.1.4 音樂旋律生成 1097.1.5 波形建模 1107.1.6 用戶交互與自動化 111任務(wù)7.2 掌握音頻增強與修復 1127.2.1 噪聲減少 1127.2.2 回聲消除 1137.2.3 音頻修復 1137.2.4 動態(tài)范圍壓縮 1137.2.5 等化 1147.2.6 時間拉伸與音高轉(zhuǎn)換 115【作業(yè)】 116【實訓與思考】探索音樂旋律生成模型 117項目8 多模態(tài)生成技術(shù) 120任務(wù)8.1 熟悉多模態(tài)生成的概念 1208.1.1 多模態(tài)生成技術(shù)基礎(chǔ) 1208.1.2 模型結(jié)構(gòu)融合策略 1218.1.3 多模態(tài)生成的應(yīng)用場景 1228.1.4 技術(shù)挑戰(zhàn)與發(fā)展趨勢 124任務(wù)8.2 掌握典型多模態(tài)生成技術(shù) 1268.2.1 視覺與文本結(jié)合 1268.2.2 跨媒體內(nèi)容生成 1278.2.3 智能感知與響應(yīng) 1298.2.4 生成中的情感一致性 1318.2.5 案例:Muse文生圖模型 131【作業(yè)】 132【實訓與思考】多模態(tài)生成技術(shù)應(yīng)用—情感音樂可視化 133第三部分 應(yīng)用場景篇項目9 AIGC促進文化創(chuàng)意 137任務(wù)9.1 文化創(chuàng)意應(yīng)用場景 1379.1.1 AIGC用于文學創(chuàng)作 1389.1.2 自動化寫作工具 1399.1.3 激發(fā)創(chuàng)意靈感 1399.1.4 AIGC帶來新商業(yè)模式 1409.1.5 版權(quán)保護與交易機制 140任務(wù)9.2 視覺藝術(shù)創(chuàng)作 1419.2.1 圖像生成與編輯 1419.2.2 藝術(shù)風格遷移 1419.2.3 VR與AR 1429.2.4 AI繪圖工具 1429.2.5 視頻生成典型工具 144任務(wù)9.3 音樂與音頻制作 1459.3.1 自動作曲 1459.3.2 效果遷移與融合 1469.3.3 音頻處理與配樂 1469.3.4 智能混音與母帶處理 1469.3.5 互動式音樂體驗 146任務(wù)9.4 影視娛樂開發(fā) 1489.4.1 劇本開發(fā)與優(yōu)化 1489.4.2 視覺效果生成 1489.4.3 智能剪輯與敘事結(jié)構(gòu) 1489.4.4 互動式影視體驗 149【作業(yè)】 149【實訓與思考】文生圖:注冊使用Midjourney繪圖工具 151項目10 AIGC提升金融服務(wù) 153任務(wù)10.1 智慧金融服務(wù) 15310.1.1 金融服務(wù)概述 15310.1.2 智能客服 15510.1.3 風險評估 15610.1.4 個性化推薦 15710.1.5 智能投顧 15910.1.6 反欺詐系統(tǒng) 161任務(wù)10.2 金融服務(wù)應(yīng)用AIGC典型案例 16210.2.1 智投寶智能投顧平臺 16210.2.2 智安盾金融反欺詐系統(tǒng) 163【作業(yè)】 164【實訓與思考】AIGC在金融服務(wù)中的應(yīng)用探索 166項目11 AIGC助力智能制造 169任務(wù)11.1 智能制造基本概念 16911.1.1 智能制造系統(tǒng) 17011.1.2 綜合特征 17111.1.3 智能技術(shù) 17211.1.4 測控裝置 17311.1.5 運作過程 173任務(wù)11.2 將AIGC應(yīng)用于智能制造 17411.2.1 產(chǎn)品設(shè)計與創(chuàng)新 17411.2.2 工藝規(guī)劃生產(chǎn)流程優(yōu)化 17511.2.3 生產(chǎn)調(diào)度與資源配置 17511.2.4 數(shù)據(jù)驅(qū)動精準需求預測 17611.2.5 生產(chǎn)流程模擬與優(yōu)化 17611.2.6 生產(chǎn)過程監(jiān)控與質(zhì)量控制 17711.2.7 設(shè)備維護與故障預測 177任務(wù)11.3 AIGC優(yōu)化智能制造供應(yīng)鏈 17711.3.1 需求預測與庫存管理 17711.3.2 物流與運輸 17811.3.3 供應(yīng)商管理與協(xié)同 17911.3.4 生產(chǎn)過程質(zhì)量控制 17911.3.5 面臨的挑戰(zhàn)與應(yīng)對 179【作業(yè)】 180【實訓與思考】AIGC在智能制造中的應(yīng)用探索 182項目12 AIGC賦能科學研究與設(shè)計 185任務(wù)12.1 AIGC應(yīng)用于設(shè)計 18512.1.1 AIGC設(shè)計應(yīng)用場景 18512.1.2 與設(shè)計師的協(xié)同模式 18612.1.3 跨學科合作 18912.1.4 科研文獻管理 19012.1.5 開放科學與共享平臺建設(shè) 191任務(wù)12.2 AIGC典型科研應(yīng)用 19212.2.1 數(shù)據(jù)增強 19212.2.2 科學模擬 19212.2.3 自動化實驗設(shè)計 19312.2.4 模型訓練與改進 19312.2.5 理論驗證與假設(shè)測試 194任務(wù)12.3 AIGC科研應(yīng)用案例 19512.3.1 加速藥物發(fā)現(xiàn) 19612.3.2 生命科學案例 19712.3.3 材料科學案例 19712.3.4 環(huán)境科學案例 19712.3.5 社會科學案例 19812.3.6 物理科學案例 198【作業(yè)】 198【實訓與思考】AIGC在科研中的應(yīng)用探索 200項目13 AIGC造就智慧城市 203任務(wù)13.1 智能交通概念 20313.1.1 智能交通要素 20413.1.2 智能交通關(guān)鍵技術(shù) 20513.1.3 車聯(lián)網(wǎng)技術(shù) 20613.1.4 AIGC應(yīng)用于智能交通 20813.1.5 AIGC應(yīng)用于自動駕駛 209任務(wù)13.2 智慧城市發(fā)展與AIGC 21113.2.1 智慧城市組成與特點 21213.2.2 AIGC應(yīng)用于智慧城市 21213.2.3 AIGC應(yīng)用于醫(yī)療服務(wù) 21313.2.4 個性化健康管理 21413.2.5 康復與治療支持 215【作業(yè)】 215【實訓與思考】AIGC智能交通應(yīng)用案例分析 217第四部分 社會影響篇項目14 倫理與法律考量 222任務(wù)14.1 AIGC面臨的倫理挑戰(zhàn) 22214.1.1 AIGC倫理問題 22214.1.2 數(shù)據(jù)主權(quán)和數(shù)據(jù)權(quán)問題 22314.1.3 數(shù)據(jù)利用失衡問題 22414.1.4 構(gòu)建隱私保護倫理準則 22414.1.5 健全道德倫理約束機制 225任務(wù)14.2 AI倫理原則與知識產(chǎn)權(quán) 22514.2.1 職業(yè)倫理準則的目標 22514.2.2 創(chuàng)新發(fā)展道德倫理宣言 22614.2.3 歐盟可信賴的倫理準則 22714.2.4 封禁存在“不可接受風險”AI系統(tǒng) 22814.2.5 LLM的知識產(chǎn)權(quán)保護 22814.2.6 邊緣群體的數(shù)字平等 232【作業(yè)】 232【實訓與思考】AI獨立完成的視覺藝術(shù)品無法獲得版權(quán) 234項目15 面向AGI 236任務(wù)15.1 生成式AI進步 23615.1.1 生成式AI的關(guān)鍵方面 23715.1.2 AGI的定義 23815.1.3 龍頭企業(yè)對AGI的認識 23915.1.4 LLM與AGI 24015.1.5 生成式AI與AGI 240任務(wù)15.2 從生成式AI邁向AGI 24115.2.1 邁向AGI的關(guān)鍵步驟 24115.2.2 邁向AGI的關(guān)鍵要素 24115.2.3 面臨的挑戰(zhàn) 24215.2.4 潛在的發(fā)展路徑 24215.2.5 AI的未來發(fā)展 243【作業(yè)】 244【課程學習與實訓總結(jié)】 245參考文獻 249