本書使用淺顯易懂的語言,系統(tǒng)介紹了數據標注的概念、分類,重點是通過各個項目來闡述文本數據、圖像數據、語音數據等幾類數據標注的工具、步驟、規(guī)范和質檢。通過理論與項目實戰(zhàn)相結合,幫助讀者由淺入深地學習和實踐,從而真正掌握數據標注的理論、技術和實施。本書既可以作為大數據人才培訓的基礎教材,也適用于初學者的入門教材,以及為大數據初級、中級標注員崗位提供理論知識和技能的行業(yè)培訓教材。
求秋音,浙江大學信息電子技術專業(yè),教務處主任,高級講師,計算機網絡管理高級技師,全國優(yōu)秀指導教師,浙江省技工計算機學科帶頭人,紹興市計算機學科帶頭人,紹興市計算機組大組長,紹興市跨界融合創(chuàng)新團隊,紹興市教育信息化專家。參加上海第二工業(yè)大學的全國中職骨干教師網絡管理員培訓,赴德國參加"德國職業(yè)教育研修班”,赴加拿大參加紹興市高層次人才學習。
項目1 數據版面分析 1
任務1 認識數據標注 1
1.1.1 什么是數據標注 1
1.1.2 數據標注與人工智能的關系 2
1.1.3 數據標注分類和平臺 2
1.1.4 數據標注流程 2
1.1.5 學生自我學習單 5
1.1.6 學習評價表 6
任務2 安裝與使用標注軟件 Labelme 7
1.2.1 搭建Labelme工具的安裝環(huán)境 7
1.2.2 Labelme工具的安裝 7
1.2.3 Labelme 工具的使用方法 8
1.2.4 學生自我學習單 12
1.2.5 學習評價表 13
任務3 學習版面分析標注規(guī)范 14
1.3.1 版面分析 14
1.3.2 標注規(guī)范 14
1.3.3 畫框規(guī)范 15
1.3.4 注意事項 19
1.3.5 學生自我學習單 25
1.3.6 學習評價表 26
任務4 學習版面分析基礎屬性規(guī)范 27
1.4.1 標注規(guī)范 27
1.4.2 畫框規(guī)范 27
1.4.3 學生自我學習單 29
1.4.4 學習評價表 31
任務5 學習版面分析易錯點 32
1.5.1 基礎屬性 32
1.5.2 關鍵要素 32
1.5.3 學生自我學習單 35
1.5.4 學習評價表 36
作業(yè)與練習 37
項目2 手寫文本數據標注 39
任務1 了解文本標注應用領域 39
2.1.1 認識文本標注 39
2.1.2 客服行業(yè) 40
2.1.3 金融行業(yè) 40
2.1.4 醫(yī)療行業(yè) 41
2.1.5 學生自我學習單 42
2.1.6 學習評價表 43
任務2 學習手寫文本數據標注規(guī)范 44
2.2.1 標注要素 44
2.2.2 文本轉寫操作步驟 45
2.2.3 文本轉寫操作要求 45
2.2.4 標注規(guī)范說明 46
2.2.5 學生自我學習單 50
2.2.6 學習評價表 51
任務3 學習畫框規(guī)范 52
2.3.1 基本原則 52
2.3.2 畫框方式 52
2.3.3 框的屬性列表 53
2.3.4 學生自我學習單 54
2.3.5 學習評價表 55
任務4 學習文本行畫框要求和案例 56
2.4.1 緊致畫框 56
2.4.2 分開畫框 56
2.4.3 涂抹處理 56
2.4.4 非文字處理 58
2.4.5 插入文字 59
2.4.6 縱向文字排版 59
2.4.7 箭頭符號的處理 59
2.4.8 涂鴉的處理 61
2.4.9 流程圖的處理 62
2.4.10 坐標圖的處理 62
2.4.11 表格的處理 62
2.4.12 公式的處理 63
2.4.13 學生自我學習單 64
2.4.14 學習評價表 65
作業(yè)與練習 66
項目3 圖像數據標注 68
任務1 認識圖像數據標注 68
3.1.1 什么是圖像標注 68
3.1.2 圖像標注應用領域 69
3.1.3 車牌號框圖標注規(guī)范 70
3.1.4 人臉框圖標注規(guī)范 71
3.1.5 醫(yī)療影像標注 71
3.1.6 學生自我學習單 73
3.1.7 學習評價表 74
任務2 了解圖像數據標注工具 75
3.2.1 摳圖圣手平臺登錄 75
3.2.2 摳圖圣手標注流程 77
3.2.3 摳圖圣手操作說明 80
3.2.4 圖像標注規(guī)則 80
3.2.5 學生自我學習單 81
3.2.6 學習評價表 82
任務3 標注馬路欄桿 83
3.3.1 道路兩側及對向車道中間欄桿的標注 83
3.3.2 欄桿中廣告牌或廣告橫幅的標注 83
3.3.3 欄桿上有植物的標注 84
3.3.4 不同區(qū)域欄桿的標注 84
3.3.5 高架橋上的欄桿標注 85
3.3.6 學生自我學習單 87
3.3.7 學習評價表 88
任務4 標注路邊的墻類建筑 89
3.4.1 圍墻上的欄桿標注 89
3.4.2 施工工地圍擋和廣告立體墻標注 90
3.4.3 高架橋標注 90
3.4.4 被遮擋的墻標注 91
3.4.5 墻上或墻下有植物標注 92
3.4.6 學生自我學習單 94
3.4.7 學習評價表 95
任務5 標注路邊桿狀物 96
3.5.1 路邊桿狀物的標注要求 96
3.5.2 顏色一致桿子的標注 97
3.5.3 被物體截斷桿子的標注 98
3.5.4 重疊桿子的標注 100
3.5.5 有底座交通桿子的標注 101
3.5.6 特殊紅綠燈桿子標注 102
3.5.7 樹干標注 103
3.5.8 學生自我學習單 105
3.5.9 學習評價表 106
任務6 學習地面印刷物標注規(guī)范 107
3.6.1 車道線?實線和車道線?虛線的標注 107
3.6.2 停止線標注 108
3.6.3 待轉區(qū)的標注 111
3.6.4 禁停區(qū)的標注 112
3.6.5 減速帶的標注 113
3.6.6 道路箭頭的標注 113
3.6.7 停車讓行線的標注 114
3.6.8 減速讓行線的標注 114
3.6.9 振蕩標線的標注 115
3.6.10 學生自我學習單 116
3.6.11 學習評價表 117
任務7 學習道路可通行區(qū)域標注規(guī)范 118
3.7.1 連續(xù)道路可通行區(qū)域標注 118
3.7.2 欄桿下面的通行道路標注 118
3.7.3 不連續(xù)的道路通行區(qū)域標注 119
3.7.4 確定的通行區(qū)域標注 120
3.7.5 自行車道標注 121
3.7.6 停車位的標注 121
3.7.7 其他 123
3.7.8 學生自我學習單 125
3.7.9 學習評價表 126
作業(yè)與練習 127
項目4 拍搜標注案例 128
任務1 學習數據集標注標準 128
4.1.1 拍搜標注數據需求 128
4.1.2 檢測標注框類別 129
4.1.3 檢測標注方式 130
4.1.4 學生自我學習單 131
4.1.5 學習評價表 132
任務2 標注檢測框 133
4.2.1 題框 133
4.2.2 文本行框 135
4.2.3 答案框 136
4.2.4 圖框 137
4.2.5 表框 137
4.2.6 題號框 137
4.2.7 學生自我學習單 139
4.2.8 學習評價表 140
任務3 學習拍搜標注 141
4.3.1 圖中文本行 141
4.3.2 單個題目的多個圖 141
4.3.3 表中有圖 142
4.3.4 單個題目和周邊文字 143
4.3.5 應用題的答案行 143
4.3.6 題目的解析部分 143
4.3.7 學生自我學習單 145
4.3.8 學習評價表 146
任務4 標注轉寫物理化學圖文 147
4.4.1 整體流程 147
4.4.2 畫框規(guī)范 147
4.4.3 屬性規(guī)范 149
4.4.4 轉寫規(guī)范 152
4.4.5 學生自我學習單 154
4.4.6 學習評價表 155
作業(yè)與練習 156
項目5 語音數據標注 157
任務1 認識語音數據標注 157
5.1.1 什么是語音標注 157
5.1.2 語音數據標注工具 157
5.1.3 語音標注分析六大元素 159
5.1.4 學生自我學習單 161
5.1.5 學習評價表 162
任務2 了解語音標注Praat工具 163
5.2.1 Praat 工具的介紹 163
5.2.2 Praat 工具的使用 163
5.2.3 Praat 工具標注常用操作指令 164
5.2.4 學生自我學習單 165
5.2.5 學習評價表 166
任務3 客服語音轉寫 167
5.3.1 用Praat工具打開語音文件 167
5.3.2 開始標注語音文件 167
5.3.3 工具自查 checktool 173
5.3.4 學生自我學習單 174
5.3.5 學習評價表 175
任務4 學習錄音數據標注規(guī)范 176
5.4.1 語音文件分類 176
5.4.2 語音標注層級 176
5.4.3 標注規(guī)范細則 177
5.4.4 質檢驗收標準 181
5.4.5 學生自我學習單 182
5.4.6 學習評價表 183
作業(yè)與練習 184