自行星探索開始以來,人類就使用機器人探索太陽系中的其他行星。阿波羅時代,機器結構的宇宙飛船先于人類登陸月球,以收集有關月球表面特征和著陸地點等關鍵信息。如今,科學家們使用搭載照相機、光譜儀及其他儀器的毅力號和好奇號探測車,對火星表面進行詳細的科學分析與實地地質考察。如今,人類正在使用20多個探測器積極探索太陽系行星及其他星體,未來十年這一數(shù)字還會變得更大[1]。人類將越來越多攜帶精密儀器的探測器發(fā)射到太陽系,從而使每次觀測都能獲得更多可供科學家分析的信息,增加了現(xiàn)存行星探測任務數(shù)據(jù)量。圖01證明了這一點。它展示了1965年拍攝的第一張火星照片,以及近50年后的2014年拍攝的另一張火星特寫照片?茖W家需要采用一種不同的機器手段,即機器學習,來分析過去、現(xiàn)在和未來行星探測任務所獲取的數(shù)據(jù)。機器學習是人工智能的分支領域,它可以自動從數(shù)據(jù)中學習、感知與預測。
圖01左圖:1965年7月15日,水手4號探測器拍攝的第一張火星特寫照片
(資料來源:NASA/JPLCaltech);右圖:2014年1月9日,HiRISE拍攝的火星撞擊坑
圖像(資料來源:NASA/JPLCaltech/UA)
機器學習是一門廣泛涉及方法、模型、學習類型及機器行為的學科。行星科學中,機器學習可通過揭示人類難以分析的大型復雜數(shù)據(jù)集中感興趣的模式或特征,通過激發(fā)基于數(shù)據(jù)結構和模式的新假設或自動完成繁雜或耗時的任務等多種方式,促進科學發(fā)現(xiàn)與分析。本書的目標是在機器學習和行星科學領域之間建造一座橋梁,使行星科學領域能夠應用更多的機器學習方法,同時也可提高機器學習領域使用行星科學數(shù)據(jù)的效率。本書第一部分將介紹機器學習的基礎知識、機器學習應用于行星科學數(shù)據(jù)集的特點、使用機器學習模型的規(guī)則以及當讀者需要更深入地理解機器學習方法時所需的資源。第二部分將介紹行星科學領域面臨的數(shù)據(jù)類型及挑戰(zhàn)。第三部分將介紹機器學習應用準備及訪問行星科學數(shù)據(jù)集的教程。最后一部分則將引入幾個案例,詳細介紹如何在各種行星科學應用和數(shù)據(jù)類型中實現(xiàn)機器學習。
第1章機器學習簡介1
1.1機器學習方法概述1
1.2監(jiān)督學習2
1.2.1分類2
1.2.2回歸分析3
1.3無監(jiān)督學習4
1.3.1聚類分析5
1.3.2降維5
1.4半監(jiān)督學習6
1.4.1自我訓練6
1.4.2期望最大化的自我訓練7
1.4.3協(xié)同訓練8
1.5主動學習8
1.5.1不確定度采樣8
1.5.2委員會查詢9
1.6流行的機器學習方法9
1.6.1主成分分析法9
1.6.2K均值聚類10
1.6.3支持向量機10
1.6.4決策樹與隨機森林法11
1.6.5神經網絡12
1.7數(shù)據(jù)集準備14
參考文獻16
第2章行星任務中獨特的新挑戰(zhàn)19
2.1跨越50年的水星探測19
2.2大型復雜數(shù)據(jù)返回面臨的挑戰(zhàn)23
2.3面對未知24
2.4行星科學中的機器學習25
參考文獻26
第3章行星數(shù)據(jù)的查找與讀取29
3.1數(shù)據(jù)采集29
3.1.1簡介29
3.1.2數(shù)據(jù)處理級別29
3.1.3PDS30
3.1.4歐洲空間局行星科學檔案35
3.1.5使用Python讀取數(shù)據(jù)36
3.1.6要查看的空間39
第4章Python高光譜分析工具(PyHAT)簡介40
4.1簡介40
4.2 PyHAT庫結構41
4.3PyHAT 軌道43
4.3.1緊湊型火星偵察成像分光計(CRISM)44
4.3.2月球礦物學制圖儀(M3)46
4.3.3Kaguya光譜剖面儀48
4.4原位PyHAT52
4.4.1基線刪除示例54
4.4.2回歸分析示例56
4.4.3數(shù)據(jù)勘探示例56
4.4.4校準轉移58
4.5結論61
參考文獻64
第5章教程:如何訪問、處理和標記用于機器學習的PDS圖像數(shù)據(jù)69
5.1簡介69
5.2訪問PDS數(shù)據(jù)產品70
5.2.1PDS成像圖集70
5.2.2PDS成像節(jié)點數(shù)據(jù)門戶71
5.3對PDS數(shù)據(jù)產品進行標準圖像格式預處理73
5.3.1PDS圖像數(shù)據(jù)產品74
5.3.2PDS瀏覽圖像74
5.3.3轉換PDS圖像數(shù)據(jù)產品75
5.4標記圖像數(shù)據(jù)77
5.4.1公開可用的標記圖像數(shù)據(jù)集77
5.4.2用于標記圖像數(shù)據(jù)的工具79
5.5PDS圖像分類器示例結果81
5.5.1訓練集、驗證集和測試集81
5.5.2模型微調81
5.5.3模型校準與性能81
5.5.4訪問HiRISeNet分類結果82
5.6總結83
參考文獻84
第6章通過學習特定模式回歸模型進行行星圖像補繪85
6.1簡介85
6.2相關工作86
6.3實驗數(shù)據(jù)87
6.4提出的方法87
6.4.1直方圖聚類的無監(jiān)督分離88
6.5網絡架構90
6.5.1訓練細節(jié)90
6.5.2基于反射的信息增強方法91
6.6實驗結果91
6.6.1性能評估92
6.7結論97
參考文獻98
第7章基于無監(jiān)督學習的水星可見近紅外反射率光譜自動表面制圖與分類100
7.1簡介100
7.2水星與MASCS儀器101
7.3數(shù)據(jù)準備102
7.4從多元數(shù)據(jù)中學習103
7.4.1降維:ICA103
7.4.2流形學習104
7.4.3聚類分析107
7.4.4結論109
參考文獻112
第8章繪制土星上的風暴圖116
8.1介紹116
8.1.1卡西尼惠更斯號和氨云116
8.2探索性主成分分析117
8.3深度學習方法118
8.3.1預處理和預標記120
8.3.2神經網絡 121
8.3.3訓練與超參數(shù)優(yōu)化122
8.3.4分類驗證123
8.4土星特征圖124
參考文獻127
第9章行星漫游車的機器學習130
9.1簡介130
9.2風險和資源感知型AutoNav133
9.2.1概述133
9.2.2地形分類133
9.2.3巖石災害探測136
9.2.4基于視覺的滑移和驅動能量預測137
9.3科學駕駛139
9.3.1概述139
9.3.2SCOTI:地形圖像的科學說明139
9.3.3圖像相似性搜索141
9.3.4DBS接口141
9.3.5科學家的DBS實驗142
9.4測試漫游車演示143
9.5結論與未來工作144
參考文獻146
第10章結合機器學習回歸模型和貝葉斯推斷來解釋遙感數(shù)據(jù)149
10.1對精確快進功能的需求149
10.2反問題的貝葉斯方法149
10.3基于機器學習的代理模型150
10.4案例研究:用代理模型約束小行星的熱特性150
10.4.1熱物理模擬數(shù)據(jù)集151
10.4.2風化層與巖石混合物的紅外代理模型152
10.4.3Itokawa熱物理性質的貝葉斯推斷153
10.5數(shù)據(jù)融合的未來展望154
10.5.1遙感數(shù)據(jù)融合154
10.5.2行星形成理論155
10.5.3航天器自主性155
參考文獻157