本書以電商網(wǎng)站中的用戶行為數(shù)據(jù)作為數(shù)據(jù)源,系統(tǒng)地介紹了如何使用Spark生態(tài)系統(tǒng)進(jìn)行大數(shù)據(jù)離線分析和實時分析的方法。全書共7章,分別講解了項目需求、項目架構(gòu)、項目實現(xiàn)流程、大數(shù)據(jù)集群環(huán)境搭建、熱門品類Top10分析、各區(qū)域熱門商品Top3分析、網(wǎng)站轉(zhuǎn)化率統(tǒng)計、廣告點擊流實時統(tǒng)計和使用FineBI實現(xiàn)數(shù)據(jù)可視化。本書附有
內(nèi)容簡介這是6位來自多個大廠的大數(shù)據(jù)工程師聯(lián)合力扣撰寫的,深度解讀大數(shù)據(jù)算法面試母題的求職手冊。本融合了幾位作者總計數(shù)百次面試他人和被他人面試的經(jīng)驗,結(jié)合對大廠招聘的真實需求,深度解讀精選自力扣的近百道具有代表性的算法題。這些題目覆蓋了幾乎所有大數(shù)據(jù)從業(yè)者需要掌握的算法題類型,它們有的來自力扣多年的專業(yè)沉淀,有的來自各
本書內(nèi)容分七大模塊:大數(shù)據(jù)概述、開發(fā)環(huán)境搭建、大數(shù)據(jù)采集(爬。、大數(shù)據(jù)分析、數(shù)據(jù)建模與數(shù)據(jù)挖掘、數(shù)據(jù)可視化以及大數(shù)據(jù)分析挖掘綜合案例。開發(fā)環(huán)境采用Python語言環(huán)境,詳細(xì)講解爬蟲技術(shù)原理、python爬蟲第三方庫、scrapy爬蟲框架等。大數(shù)據(jù)分析部分講解Numpy和Pandas。數(shù)據(jù)建模與數(shù)據(jù)挖掘模塊講解相關(guān)性與
"本書系統(tǒng)地介紹了生產(chǎn)過程控制系統(tǒng)與自動化儀表的理論和工作原理、過程系統(tǒng)的建模、簡單過程系統(tǒng)及串級、復(fù)雜過程控制系統(tǒng)的分析與設(shè)計、先進(jìn)控制系統(tǒng)等內(nèi)容。本書從基本概念出發(fā),循序漸進(jìn)、每章開始扼要提出了本章教學(xué)內(nèi)容和應(yīng)達(dá)到的基本要求,配合每章末的習(xí)題及最后一章的仿真實例、深入淺出地闡明過程控制系統(tǒng)的特點,使學(xué)生掌握過程控制
數(shù)據(jù)治理與認(rèn)知安全在推動國家發(fā)展、保障國家安全、維護(hù)社會穩(wěn)定和促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展等方面具有不可替代的重要作用。本書覆蓋數(shù)據(jù)治理與認(rèn)知安全兩部分內(nèi)容。數(shù)據(jù)治理包含數(shù)據(jù)治理體系、數(shù)據(jù)處理方法和數(shù)據(jù)合規(guī)審計三方面內(nèi)容,主要關(guān)注數(shù)據(jù)的采集、清洗、集成、標(biāo)注、增強(qiáng)和分析等規(guī)范化的管理過程,確保數(shù)據(jù)在整個生命周期中保持高質(zhì)量、一致
本書共8章,分別講解了Spark基礎(chǔ)知識、Spark部署、SparkRDD、SparkSQL、SparkStreaming、Kafka、StructuredStreaming和SparkMLlib,并在最后完整開發(fā)了一個在線教育學(xué)生學(xué)習(xí)情況分析系統(tǒng),幫助大家鞏固前面所學(xué)的內(nèi)容。
本書內(nèi)容主要分為四部分,前7章為第1部分,描述如何質(zhì)疑、審查證據(jù),如何收集、分析并處理缺失數(shù)據(jù),避免數(shù)據(jù)操控等。第2部分為第8-11章,討論數(shù)據(jù)呈現(xiàn)中的問題并通過創(chuàng)新方法取得研究新發(fā)現(xiàn)。第3部分為第12-17章,聚焦教育領(lǐng)域,再次利用證據(jù)證明了發(fā)現(xiàn)似實謬誤之易,第4部分為結(jié)論。
在數(shù)字化和智能化逐漸成為工業(yè)發(fā)展主流的背景下,《工業(yè)控制網(wǎng)絡(luò)》一書為讀者提供了一個全面而系統(tǒng)的指南,涵蓋了現(xiàn)場總線、工業(yè)以太網(wǎng)、Modbus控制網(wǎng)絡(luò)及無線通信技術(shù)等關(guān)鍵領(lǐng)域。全書共分為12章,從基礎(chǔ)理論到實際應(yīng)用案例,深入探討了工業(yè)控制網(wǎng)絡(luò)的核心技術(shù)及其廣泛應(yīng)用,旨在幫助讀者掌握如何提高生產(chǎn)效率、降低成本和實現(xiàn)靈活管理
這是一本講解在數(shù)據(jù)要素大背景下,企業(yè)如何將數(shù)據(jù)資源開發(fā)成數(shù)據(jù)產(chǎn)品,進(jìn)而通過數(shù)據(jù)產(chǎn)品實現(xiàn)數(shù)據(jù)資產(chǎn)化和資本化的著作,為企業(yè)釋放數(shù)據(jù)價值提供了科學(xué)的方法論和國內(nèi)領(lǐng)先的實踐方案。這本書由全球數(shù)據(jù)資產(chǎn)理事會(DAC)組織編寫,融合了國內(nèi)數(shù)據(jù)資產(chǎn)管理領(lǐng)域多家企業(yè)的10位專家的研究成果和實戰(zhàn)經(jīng)驗,得到了湖南數(shù)據(jù)產(chǎn)業(yè)集團(tuán)、廣州數(shù)據(jù)集團(tuán)
本書提供了關(guān)于如何在數(shù)據(jù)治理中建立和運(yùn)行數(shù)據(jù)認(rèn)責(zé)工作的適用且可操作的信息和說明,旨在為新任數(shù)據(jù)專員或數(shù)據(jù)治理經(jīng)理提供在數(shù)據(jù)認(rèn)責(zé)方面所需的知識,以確保其工作有效和高效。本書分為11章,包括:數(shù)據(jù)認(rèn)責(zé)和數(shù)據(jù)治理:二者如何結(jié)合;了解數(shù)據(jù)認(rèn)責(zé)的類型;認(rèn)責(zé)管理的角色和職責(zé);實施數(shù)據(jù)認(rèn)責(zé);培訓(xùn)業(yè)務(wù)型數(shù)據(jù)專員;數(shù)據(jù)認(rèn)責(zé)實踐;數(shù)據(jù)專員