本書是“格致方法·商科研究方法譯叢”中的一種,商科研究方法主要是幫助相關專業(yè)的研究生進行理論研究的教學參考書。數字方法在商科方法研究中經過許不斷發(fā)展,形成了完備的體系。本書主要教學的是使用數字方法收集定性數據,即在定性研究中使用數字方法(包括跟蹤和追蹤),幫助相關專業(yè)的碩士研究生完成其畢業(yè)論文。全書分六章,手把手地幫助
本書采用案例式編寫模式,包括7個單元,其中,單元1介紹數據分析的基本概念、流程和常用工具包,單元2介紹數據標注的分類、基本流程及工具的使用,單元3介紹ndarray數組及Python科學計算庫NumPy,單元4介紹數據分析處理庫pandas,單元5介紹數據可視化工具包Matplotlib和seaborn,單元6介紹分類
本書共有九章,從數據采集與預處理概述開始,介紹了大數據環(huán)境的搭建,并對數據采集與數據預處理的技術方法進行了系統(tǒng)介紹。數據采集的內容包括Flume日志數據采集、Kafka日志數據采集、Fluentd與Logstach等一系列數據采集技術;數據預處理的內容包括網絡爬蟲采集Web數據、Python數據預處理技術、Kettle
本書以廣泛使用的Alluxio2.8.0版本為基礎編寫,深入介紹Alluxio相關技術原理與實踐案例。本書主要內容包括Alluxio系統(tǒng)入門與使用、Alluxio系統(tǒng)內核組件設計實現原理,同時詳細介紹了Alluxio在大型企業(yè)中的經典應用案例與生產實踐,并附有Alluxio的開源社區(qū)開發(fā)者指南。本書是工業(yè)界和學術界從事
本書為高等職業(yè)教育計算機類新形態(tài)——工作手冊式教材,內容包括基礎環(huán)境的搭建與配置,Hadoop完全分布式集群的搭建與運行,Hadoop核心組件的應用案例,Hive組件的安裝、配置與應用,ZooKeeper的安裝、配置與應用,HBase的安裝、配置與應用,Sqoop組件的安裝、配置與應用,Flume組件的安裝、配置與應用
本書是數據標注領域領先的實訓講義。本書著重對常見的文本、語音和圖像標注任務類型進行介紹,幫助從事標注工作的學習者快速地完成系統(tǒng)化學習,進行標注實戰(zhàn)。本書對文本、語音及圖像標注的多種任務類型逐一進行講解和分析,每種標注類型均配有對應的規(guī)范、舉例分析、習題及解析。同時,本書還針對各類標注配套多種子任務類型或多個領域的實操練
本書是一本專門面向數據標注人才培養(yǎng)的實訓教材,適用于有意從事人工智能訓練師和數據標注工作的人員。為了使學習更具有針對性,本書特別選擇了能代表行業(yè)普遍需求的標注項目管理知識及典型文本、語音和圖像標注任務進行講解與訓練,輔助學習者快速完成系統(tǒng)化學習,進行標注實戰(zhàn)工作。本書對文本的事件標注和關系標注、語音的采集和質檢、圖像的
隨著“十四五”規(guī)劃綱要中提出“協(xié)同發(fā)展云服務與邊緣計算服務”的觀點,邊云智能已成為未來發(fā)展的重要趨勢。本書依托于政策大背景,旨在向讀者介紹邊云智能的基礎知識和應用。書中分為四個篇章,第一篇章介紹了邊云架構的骨架和基礎概念,第二篇章介紹了人工智能算法和深度學習模型,第三篇章介紹了云端決策算法和邊緣端輕量化算法,第四篇章介
本書系統(tǒng)講述ApacheSpark/PySpark大數據計算平臺的原理,以及如果將ApachePySpark應用于大數據的實時流處理、批處理等各個場景。通過原理深入學習和實踐示例、案例的學習應用,使讀者了解并掌握ApacheSpark/PySpark的基本原理和技能,接近理論與實踐的距離。全書共分為8章,主要內容包括:
本書是一本全面介紹數據挖掘基本原理、核心算法以及典型應用方法的專業(yè)書籍。第4版在前三版的基礎上,對數據挖掘的方法論和知識點進行了重新歸納,按照基礎篇、提高篇和應用篇進行設計。從方法論上說,數據挖掘是一個方法和原理逐步演變的過程。首先,最基礎的數據挖掘方法主要有“關聯(lián)規(guī)則”“分類”“聚類”,它們是數據挖掘的靈魂和基礎,因