本書是一本關(guān)于人腦智能與人工智能的教材,旨在介紹人腦各個系統(tǒng)以及相關(guān)人工智能技術(shù)。全書分為多個章節(jié),詳細(xì)介紹了人腦的視覺、聽覺、運(yùn)動、語言等系統(tǒng)以及人工智能在相關(guān)方向的進(jìn)展。本書的特色在于從人腦智能與人工智能兩個角度講述,不僅包含人腦是如何實(shí)現(xiàn)各系統(tǒng)功能,還介紹了人工智能在相關(guān)方向的研究進(jìn)展和兩者結(jié)合的研究動態(tài)。除了解釋人腦系統(tǒng)和人工智能技術(shù)的基礎(chǔ)理論,本書還提供了將兩者融合的具體方法和實(shí)踐案例,使其具備高度的實(shí)用性和參考價值。本書的讀者對象包括對神經(jīng)科學(xué)、腦科學(xué)以及人工智能感興趣的讀者,以及從事相關(guān)領(lǐng)域研究的人員。
這本書的選題旨在探索人腦智能與人工智能技術(shù),通過介紹人腦各個系統(tǒng)的神經(jīng)表征和機(jī)器學(xué)習(xí)技術(shù)的融合建模,為讀者提供更多樣化的閱讀選擇。這本書的特色在于以下幾點(diǎn):1.創(chuàng)新性:將人腦智能與人工智能相結(jié)合,通過融合建模的方式探索內(nèi)在聯(lián)系和互動機(jī)制,是近年來人工智能領(lǐng)域的一個熱門方向,具有較高的研究價值和應(yīng)用前景。2.內(nèi)容全面:這本書涵蓋了人腦的各個系統(tǒng)和人工智能技術(shù),不僅介紹了視覺系統(tǒng)、聽覺系統(tǒng)、嗅覺系統(tǒng)等的神經(jīng)表征,還介紹了機(jī)器學(xué)習(xí)技術(shù)在這些系統(tǒng)的融合建模方法和應(yīng)用前景。3.學(xué)術(shù)性強(qiáng):通過對人腦各個系統(tǒng)的神經(jīng)表征和人工智能技術(shù)的深入介紹,可以讓讀者更好地了解人腦的工作機(jī)制和人工智能技術(shù)的原理。
序
人類天生渴望認(rèn)知。
——亞里士多德
人類探索智能本質(zhì)的旅程漫長而曲折。從遠(yuǎn)古先民虔誠樸素的“萬物有靈論”(Animism),到霍布斯在《利維坦》中細(xì)致描述的“自動機(jī)”(Automata);從十八世紀(jì)沃坎森傾力打造的、擁有消化系統(tǒng)的機(jī)械鴨子,到雅克德羅妙手創(chuàng)造的能吟唱、繪畫與書寫的機(jī)械人偶,我們的認(rèn)知旅程充滿了離經(jīng)叛道的想象與人定勝天的
自負(fù)。
如今,以GPT系列為代表的大模型技術(shù)所帶來的人工智能風(fēng)潮席卷,其在智力推理、情緒感知乃至文學(xué)藝術(shù)創(chuàng)造等多個領(lǐng)域的表現(xiàn),已逐漸達(dá)到甚至超越人類自身。這不禁促使我們重新審視:人工智能作為最初從模仿生命行為與人腦機(jī)制中誕生的技術(shù),是否還需要繼續(xù)向認(rèn)知科學(xué)與腦科學(xué)汲取靈感,是否依然需要追隨人類足跡,還是已經(jīng)可以踏上屬于自己的探索之路?
辛頓早在2020年GPT-3嶄露頭角時,就宣稱:“或許生命、宇宙和萬物的終極答案不過是4.398萬億個參數(shù)而已!边@個宣言所表達(dá)的是一種對“參數(shù)量”的崇拜——仿佛只要參數(shù)足夠龐大,人工智能便可以接近甚至超越人類智慧。
作為一個腦科學(xué)和人工智能交叉學(xué)科的研究者,我不知道答案。但是生物的進(jìn)化給我們提供了一個信仰的基石——智能并非簡單地依賴神經(jīng)元數(shù)量。大象的大腦重約5?kg,擁有約2570?億個神經(jīng)元;而虎鯨的大腦重達(dá)9?kg,僅小腦神經(jīng)元數(shù)量便超過1000?億,遠(yuǎn)超過人類大腦的860?億個神經(jīng)元。但是它們的智能程度卻遠(yuǎn)不及人類——在浩瀚無垠的宇宙中,只有我們?nèi)祟惸軌騽?chuàng)造語言、發(fā)展數(shù)學(xué)、探索宇宙,甚至建造文明。所以,智能并非參數(shù)量的簡單疊加;可能更在于這些神經(jīng)元的連接方式、信息流的動態(tài)模式,以及復(fù)雜系統(tǒng)內(nèi)部的協(xié)作與協(xié)調(diào)機(jī)制。所以,在我看來,人工智能依然需要腦科學(xué)的持續(xù)啟發(fā)。
首先是智能架構(gòu)的優(yōu)化與模塊化設(shè)計(jì)。人類大腦的皮層分區(qū)與功能模塊呈現(xiàn)出精妙的分層特化和精細(xì)協(xié)作模式。視覺、聽覺、運(yùn)動、情緒、語言,這些系統(tǒng)看似獨(dú)立,卻又緊密相連,形成高效的多模態(tài)信息處理體系。而當(dāng)前主流的人工智能模型,雖然參數(shù)規(guī)模龐大,卻仍未真正掌握這種精巧的功能模塊獨(dú)立性和交互機(jī)制。因此,腦科學(xué)對大腦分區(qū)與功能整合的進(jìn)一步揭示,將為人工智能提供極為重要的架構(gòu)啟示。
其次是持續(xù)學(xué)習(xí)與記憶整合。人類大腦可以在生命過程中不斷接納新知識,同時牢牢保留已有的記憶和技能。目前人工智能的“災(zāi)難性遺忘”問題,恰恰暴露了其在持續(xù)學(xué)習(xí)上的不足。深入研究海馬與皮層的協(xié)作機(jī)制、記憶的重放現(xiàn)象以及睡眠對記憶的鞏固作用,都將為構(gòu)建能夠真正自我適應(yīng)、持續(xù)進(jìn)化的智能模型提供寶貴的理論基礎(chǔ)和實(shí)踐范例。
再者,魯棒性與可解釋性是當(dāng)前人工智能應(yīng)用的重大挑戰(zhàn),尤其在面對噪聲、缺失信息或未知環(huán)境時尤為明顯。而人腦卻表現(xiàn)出非凡的韌性與適應(yīng)性,其多通路信息冗余機(jī)制、反饋控制機(jī)制和注意力調(diào)控策略,無疑是提高人工智能魯棒性和可解釋性的絕佳藍(lán)圖。
最后,人工智能最稀缺的真正從0到1的顛覆式創(chuàng)造力,或許來源于我們根植于內(nèi)心深處的生命與的本能驅(qū)動力,亦或許來源于我們在浩瀚空間與無限時間中逐漸塑造出的獨(dú)一無二的自我意識。這些閃耀于智能之冠上的璀璨明珠,也許只有在人類大腦的幽微深處,我們才能真正窺見其神秘的光輝。
因此,我們亟須推動一種更深層次的腦科學(xué)與人工智能的聯(lián)姻。不再是單純的模仿,而是互相促進(jìn)共同進(jìn)化:腦科學(xué)將提供更多關(guān)于腦連接組、神經(jīng)動力學(xué)、認(rèn)知理論的發(fā)現(xiàn)和啟示,指導(dǎo)人工智能構(gòu)建更高效的架構(gòu)和算法;而人工智能則可以利用強(qiáng)大的計(jì)算力與算法分析工具,深入解析海量神經(jīng)數(shù)據(jù),推進(jìn)腦科學(xué)的基礎(chǔ)研究與應(yīng)用開發(fā)。這種深度融合的科學(xué)范式,將為理解智能的本質(zhì)帶來質(zhì)的飛躍。
正是在這樣的背景下,劉泉影的《人腦智能與人工智能》應(yīng)運(yùn)而生。它基于David Marr提出的智能分析三層次(目標(biāo)、算法、實(shí)現(xiàn)),將人腦功能系統(tǒng)的探索與人工智能的實(shí)踐緊密結(jié)合。前半部分系統(tǒng)探討了視覺、聽覺、嗅覺、運(yùn)動、情緒、語言、睡眠與夢境等人腦關(guān)鍵功能系統(tǒng),細(xì)致揭示了其背后的神經(jīng)機(jī)制以及人工智能對其的實(shí)現(xiàn)或模擬;后半部分則集中呈現(xiàn)了人工智能如何深入賦能腦科學(xué)研究,通過多模態(tài)神經(jīng)數(shù)據(jù)處理、腦網(wǎng)絡(luò)建模、數(shù)字孿生腦等技術(shù),推動腦科學(xué)研究邁向新的高度。
在認(rèn)知科學(xué)、腦科學(xué)與人工智能深度融合的前沿領(lǐng)域,我們正站在一個關(guān)鍵的歷史轉(zhuǎn)折點(diǎn)。我誠摯邀請來自計(jì)算機(jī)科學(xué)、神經(jīng)科學(xué)、心理學(xué)、工程學(xué)乃至哲學(xué)等各學(xué)科領(lǐng)域的研究者與青年學(xué)子,共同參與到這一充滿挑戰(zhàn)且富有深遠(yuǎn)意義的跨學(xué)科探索中來,加入到探索智能本質(zhì)的旅程中來,在理解人類智能的過程中,創(chuàng)造出一個全新的智能。
清華大學(xué)基礎(chǔ)科學(xué)講席教授
心理與認(rèn)知科學(xué)系主任
2025年8月于北京
序
還記得五年前,劉泉影老師在南方科技大學(xué)神經(jīng)計(jì)算與控制實(shí)驗(yàn)室初創(chuàng)《大腦智能與機(jī)器智能》這門新課。彼時,我也在準(zhǔn)備《AI與心理學(xué)》的新課。我們都苦于找不到現(xiàn)成教材,茶水涼了又熱,PPT改了又改,開課優(yōu)質(zhì)年幾乎每堂課前都備課至凌晨。常常左邊畫著大腦皮層結(jié)構(gòu)圖,右邊貼著卷積神經(jīng)網(wǎng)絡(luò)示意圖;這邊討論著腦科學(xué)與AI結(jié)合的創(chuàng)新點(diǎn),那邊琢磨著如何用AI模型解析心理學(xué)機(jī)制。就是在這些“燒腦”又興奮的夜晚,一個念頭愈發(fā)清晰:人腦與機(jī)器智能這兩條軌跡,正從并行走向交織,彼此照亮。
劉老師曾幾次邀我參與課堂,終于有幸成行一次。看著那些年輕面孔從最初被跨學(xué)科概念搞得暈頭轉(zhuǎn)向,到后來能侃侃而談?wù)n程核心觀點(diǎn),甚至結(jié)課后設(shè)計(jì)出融合雙領(lǐng)域思想的創(chuàng)新模型。助教們也通過持續(xù)參與教學(xué)成長為跨領(lǐng)域新銳——這大概是做教師最欣慰的事。他們的蛻變印證著時代命題:理解智能本質(zhì),需同時穿越“突觸密林”與“算法星河”。他們讓我確信,未來突破必屬于既通生物腦之精妙,又諳機(jī)器智能之精髓的“兩棲”探索者。
但說實(shí)話,想同時掌握這兩套體系談何容易!我們備課時就深有體會:想找本真正打通“腦”與“機(jī)”的書,難!神經(jīng)科學(xué)教材把神經(jīng)機(jī)制與認(rèn)知功能講得透徹,卻很少提及這些發(fā)現(xiàn)如何催生了Transformer這樣顛覆性的AI;AI專著詳解公式代碼,卻鮮少剖析AI如何促進(jìn)對大腦運(yùn)作機(jī)制的理解。這種割裂讓學(xué)生困惑,更讓研究者錯失啟發(fā)良機(jī)。
正因如此,劉老師團(tuán)隊(duì)執(zhí)筆寫就此書:只為搭建一座橋。例如,為我們解析視覺之謎:為何獼猴顳葉神經(jīng)元活動模式,與卷積神經(jīng)網(wǎng)絡(luò)中層特征驚人相似?其間藏著何種普適的對物理世界的編碼法則?
我篤信,書中諸多洞見正源自那些備課深夜里師生思維碰撞的火花,以及我們在交叉領(lǐng)域跌撞前行的體悟。它或許不優(yōu)質(zhì),但竭力實(shí)現(xiàn)一個愿景:當(dāng)你研讀大腦章節(jié)時,會自然聯(lián)想到某個人工智能模型;而當(dāng)你調(diào)試算法時,又忍不住翻看書中對應(yīng)的神經(jīng)機(jī)制解析。
若你也為“智能”著迷——無論你是探索腦機(jī)制的科學(xué)家、構(gòu)建智能算法的工程師,還是求知若渴的學(xué)生——愿此書成為你征途上的伙伴。當(dāng)你在深夜被難題所困,或許書中某個人腦的“巧思”或AI的“妙招”,能倏然點(diǎn)亮靈感的星火。
因此,書中傳遞的不只是知識——更是投向“智能”深淵的微光,照亮來者的路。
澳門大學(xué)協(xié)同創(chuàng)新研究所教授
認(rèn)知與腦科學(xué)中心
2025年6月于澳門
劉泉影,南方科技大學(xué)生物醫(yī)學(xué)工程系助理教授、博士生導(dǎo)師,神經(jīng)計(jì)算與控制實(shí)驗(yàn)室PI。擅長領(lǐng)域:利用動力學(xué)系統(tǒng)模型和深度學(xué)習(xí)模型,研究神經(jīng)信息表征,探索大腦的計(jì)算機(jī)制,用于解釋神經(jīng)信號、大腦功能和行為三者之間的關(guān)系;結(jié)合現(xiàn)代控制理論,優(yōu)化神經(jīng)反饋控制,用于調(diào)節(jié)人類行為、輔助神經(jīng)相關(guān)疾病。
目?錄
優(yōu)質(zhì)部分
第1章?緒論 3
1.1 智能的本質(zhì)與多樣性 3
1.2 人工智能的發(fā)展與腦科學(xué)的價值 5
1.3 AI與BI的相似之處 6
1.4 BI與AI的相互啟發(fā) 7
1.5 本書的章節(jié)結(jié)構(gòu) 9
第2章?AI基礎(chǔ) 11
2.1 引言 11
2.2 簡介 12
2.3 基礎(chǔ)概念 15
2.4 神經(jīng)網(wǎng)絡(luò) 19
2.5 常見網(wǎng)絡(luò)架構(gòu) 31
2.6 生成模型 38
第3章?視覺系統(tǒng) 51
3.1 引言 51
3.2 眼睛的演化 52
3.3 視覺系統(tǒng)的功能 53
3.4 眼睛的結(jié)構(gòu) 55
3.5 視覺通路 61
3.6 視覺系統(tǒng)中生物智能和人工智能的討論 65
第4章?聽覺系統(tǒng) 69
4.1 引言 69
4.2 聲音的性質(zhì) 69
4.3 人耳的結(jié)構(gòu) 70
4.4 中樞聽覺過程 72
4.5 聲音定位機(jī)制 74
4.6 聽覺皮層與神經(jīng)可塑性 75
4.7 聽覺系統(tǒng)中生物智能和人工智能的應(yīng)用 78
第5章?嗅覺系統(tǒng) 85
5.1 引言 85
5.2 嗅覺 86
5.3 嗅覺受體:感知?dú)馕兜暮诵?87
5.4 嗅覺皮層:氣味感知的高級處理中心 89
5.5 氣味的編碼機(jī)制:從化學(xué)信號到大腦語言 92
5.6 與嗅覺相關(guān)的新興研究 94
第6章?體感系統(tǒng) 99
6.1 引言 99
6.2 皮膚中的接受器 100
6.3 初級傳入纖維和外周神經(jīng)系統(tǒng) 101
6.4 脊髓 102
6.5 背柱-內(nèi)側(cè)門神經(jīng)通路及三叉神經(jīng)觸覺通路 104
6.6 體感皮層 105
6.7 利用電刺激恢復(fù)觸覺 107
6.8 電子皮膚 108
第7章?運(yùn)動系統(tǒng) 113
7.1 引言 113
7.2 基礎(chǔ)結(jié)構(gòu)(肌肉與神經(jīng)系統(tǒng)) 114
7.3 低級控制:反射與脊髓水平通路 115
7.4 高級控制:復(fù)雜運(yùn)動與大腦協(xié)調(diào)機(jī)制 118
7.5 運(yùn)動的建模與控制 121
7.6 運(yùn)動與人工智能 122
第8章?情緒 127
8.1 引言 127
8.2 情緒的定義 128
8.3 情緒的神經(jīng)基礎(chǔ) 130
8.4 情緒調(diào)節(jié) 136
8.5 情緒識別與情感智能 139
第9章?語言 143
9.1 引言 143
9.2 什么是語言 144
9.3 大腦中的語言系統(tǒng) 146
9.4 語言相關(guān)疾病 149
9.5 語言處理模型 151
9.6 自然語言處理中的語言模型 153
9.7 人工智能與大腦中的自然語言處理 157
第10章?睡眠與夢 161
10.1 引言 161
10.2 睡眠與夢的基礎(chǔ)理論 162
10.3 睡眠障礙與疾病 167
10.4 基于人工智能的睡眠與夢境研究 170
10.5 睡眠與夢對人工智能的啟發(fā) 175
第二部分
第11章?多模態(tài)神經(jīng)信號處理 179
11.1 引言 179
11.2 神經(jīng)信號采集技術(shù) 180
11.3 fMRI信號處理 181
11.4 EEG信號處理 183
11.5 iEEG信號處理 188
11.6 多模態(tài)融合分析 190
11.7 深度學(xué)習(xí)在神經(jīng)信號處理中的應(yīng)用 193
11.8 結(jié)語 196
第12章?神經(jīng)數(shù)據(jù)的預(yù)訓(xùn)練模型 199
12.1 預(yù)訓(xùn)練模型背景 199
12.2 神經(jīng)數(shù)據(jù)的特性與預(yù)訓(xùn)練模型的應(yīng)用價值 200
12.3 預(yù)訓(xùn)練相關(guān)概念 201
12.4 處理神經(jīng)數(shù)據(jù)的經(jīng)典預(yù)訓(xùn)練模型 209
12.5 預(yù)訓(xùn)練模型在神經(jīng)數(shù)據(jù)處理中的意義與展望 212
第13章?大腦中的潛在表征 217
13.1 引言 217
13.2 大腦中的潛在表征——神經(jīng)群體編碼 223
13.3 概念表征與心理空間中的隱變量模型 229
13.4 大腦與人工智能的表征對齊 232
第14章?神經(jīng)科學(xué)中的生成模型 235
14.1 計(jì)算神經(jīng)科學(xué)為什么需要生成模型 235
14.2 生成模型在神經(jīng)科學(xué)中的應(yīng)用 243
14.3 現(xiàn)代神經(jīng)科學(xué)研究中的生成模型應(yīng)用 251
第15章?人工智能賦能神經(jīng)科學(xué) 255
15.1 引言 255
15.2 深度學(xué)習(xí)為腦科學(xué)提供數(shù)據(jù)分析工具 256
15.3 深度學(xué)習(xí)為腦科學(xué)提供實(shí)驗(yàn)仿真工具 261
15.4 腦科學(xué)為深度學(xué)習(xí)提供腦啟發(fā)的先驗(yàn)假設(shè)和分析方法論 265
第16章?腦網(wǎng)絡(luò)建模 267
16.1 引言 267
16.2 大腦網(wǎng)絡(luò)建;A(chǔ) 268
16.3 大腦網(wǎng)絡(luò)動力學(xué)建模 275
16.4 大腦網(wǎng)絡(luò)建模的應(yīng)用 280
第17章?腦結(jié)構(gòu)、腦功能、行為的關(guān)系 289
17.1?引言 289
17.2 大腦結(jié)構(gòu)、功能與行為 290
17.3 大腦結(jié)構(gòu)、功能與行為的關(guān)系 291
17.4 結(jié)構(gòu)-功能-行為的計(jì)算建模方法 294
第18章?數(shù)字孿生腦 303
18.1 引言 303
18.2 數(shù)字孿生腦的基本概念 304
18.3 數(shù)字孿生腦的模型構(gòu)建 308
18.4 數(shù)字孿生腦的評估 311
18.5 數(shù)字孿生腦的應(yīng)用 313
18.6 數(shù)字孿生腦的未來挑戰(zhàn) 318
第19章?基于模型的神經(jīng)調(diào)控 323
19.1 引言 323
19.2 神經(jīng)調(diào)控技術(shù) 324
19.3 經(jīng)顱電刺激前向建模及逆向優(yōu)化調(diào)控策略 325
19.4 基于動力學(xué)模型的神經(jīng)調(diào)控方法 333
19.5 基于行為獎勵的強(qiáng)化學(xué)習(xí)閉環(huán)神經(jīng)調(diào)控方法 337
第20章?通往智能之路:人腦智能與人工智能 341
20.1 引言 341
20.2 智能的起源:進(jìn)化與工程化 342
20.3 智能發(fā)展的未來:融合與創(chuàng)新 350
參考文獻(xiàn) 357