精心選取十個大數據與機器學習的實戰(zhàn)案例,采用迭代遞進模式,邊理論邊實踐,深入淺出,讓讀者在工程實踐中熏陶成長,在復雜系統設計中淬煉過硬本領。十個案例全部采用國際著名機構發(fā)布的真實數據,研究領域涉及生物信息、圖像處理、商業(yè)零售、銀行金融、自然語言處理等。每個案例采用的數據集規(guī)模相對較大,鮮明體現了機器學習在大規(guī)模數據挖掘
本書以Kettle實現ETL流程為目標,將ETL知識點與任務相結合,配套真實案例,深入淺出地介紹了ETL數據整合與處理的相關內容。全書共8章,第1章介紹了ETL概念和ETL工具,讓讀者在了解ETL相關的概念后,立刻上手ETL工具Kettle;第2~6章介紹了Kettle工具轉換相關的組件,包括源數據獲取、記錄處理、字段
第1章緒論、第2章Linux操作系統的安裝、第3章Hadoop的偽分布式安裝、第4章Hadoop集群的搭建及配置、第5章HadoopHDFS命令、第6章MapReduce編程入門、第7章Hive:SQLonHadoop、第8章Sqoop:SQLtoHadoop、第9章HBase:HadoopDatabase、第10章S
本書是高校的大數據導論課程教材,清楚地介紹了大數據相關的概念、理論、術語與基礎技術,并使用真實連貫的商業(yè)案例以及簡單的圖表,幫助讀者更清晰地理解大數據技術。本書可作為高等院校相關專業(yè)“大數據基礎”“大數據道路”等課程的教材,也可供有一定實踐經驗的軟件開發(fā)人員、管理人員和所有對大數據感興趣的人士閱讀。
本書介紹了不同的場景及假設,包括感知、人工計算、同行評級、評審以及預測。書中綜述了不同的激勵機制,包括適當的打分規(guī)則、市場預測和同行預測,貝葉斯測真機,同行測真機,相關協議以及使它們適用的一些設置。作為替代方案,也考慮了信譽機制。同時補充了博弈論分析在預測平臺、群智傳感、同行評級中的應用實例。本書適合數據科學、機器學習
本書以培養(yǎng)大學生解決復雜工程問題能力為出發(fā)點,以滿足新工科背景下社會對工程技術人才的需求為目標,著重強化大學生解決實際工程問題的能力。全書共6章,包括:計算機控制系統概述、計算機控制系統的理論基礎、過程通道設計、數字控制器設計與應用、網絡控制系統、計算機控制系統設計。本書內容豐富,以大量翔實的案例貫穿相關知識點的學習,
機械工業(yè)出版社本教材首先介紹了數據分析的基本概念和方法,然后通過大量實例介紹了如何使用Matlab實現數據分析,并深入淺出地介紹了數據建模過程中的有關方法。本教材共分8章,主要內容包括:數據的基本概念及其應用、Matlab基礎、隨機模擬、數據預處理、數據探索與分析、多元線性回歸模型、聚類分析和分類。本教材可作為職業(yè)院校
本書共13章,闡述了過程控制系統的結構、原理、特點、設計及應用等問題,探討了流程工業(yè)典型生產單元控制方案的工程設計、系統調試與運行分析。方法篇(第1~5章)詳細介紹了過程特性、檢測儀表、執(zhí)行器和常用控制系統;應用篇(第6~10章)講解了流體輸送設備、傳熱設備、鍋爐設備、精餾塔、化學反應器等典型單元的控制方案設計與應用;
在本書的di一部分,每一章都聚焦社交網站生態(tài)的某個具體方面,囊括了各大主流社交網站,也包括了網頁、博客和訂閱、郵箱、GitHub以及新增加的Instagram的內容。第二部分提供了實用指南,其中包含超過20個供挖掘Twitter數據之用的簡短代碼。
本書闡述數字系統設計方法和可編程邏輯器件PLD的應用技術。引導讀者從一般的數字功能電路設計轉向數字系統設計;從傳統的非定制通用集成電路的應用轉向用戶半定制的PLD的應用;從單純的硬件設計轉向硬件、軟件高度滲透的設計方法。從而了解數字技術的新發(fā)展、新思路、新器件,拓寬軟、硬件設計的知識面,提高設計能力。從而了解數字技術的