中文字幕狠狠干,国产孕妇孕交600集,www一区二区,免费又黄又爽又猛的毛片

推薦 資訊 標準 培訓 考試 大賽 關于我們
  聯(lián)系電話:010-82895227
首屆工業(yè)大數(shù)據(jù)賽項說明
競賽采用實踐操作技能和技術答辯相結合的方式。第一部分實踐操作技能,首先按照任務要求對Hadoop平臺進行安裝部署操作,再依據(jù)給定的數(shù)據(jù)源、大數(shù)據(jù)實驗環(huán)境以及賽場預先安裝的軟件等,按照任務書要求,完成數(shù)據(jù)整合、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)可視化等過程,最終形成完整的工業(yè)大數(shù)據(jù)分析報告,提出合理化建議。然后結合第二部分技術答辯給出綜合評分。
競賽時間5小時,競賽連續(xù)進行。
(一)Hadoop平臺安裝部署
參賽選手依據(jù)任務要求,對Hadoop平臺進行安裝部署和基本配置。主要內(nèi)容包括:Hadoop集群節(jié)點的動態(tài)增加與刪除、Hadoop集群的負載均衡、HDFS常用操作命令(查詢文件類別、上傳、刪除文件、查詢HDFS基本統(tǒng)計信息等)。
(二)數(shù)據(jù)整合
參賽選手根據(jù)現(xiàn)場提供的不同格式的數(shù)據(jù)源,通過整理、清洗、轉化、合并等過程,形成完整的單一有效數(shù)據(jù)源。該模塊主要考察選手對混亂數(shù)據(jù)、臟數(shù)據(jù)進行數(shù)據(jù)整合的能力,使數(shù)據(jù)和信息集中化,提高資源利用效率。
(三)數(shù)據(jù)存儲
參賽選手在比賽提供的大數(shù)據(jù)平臺環(huán)境下,通過已安裝好的大數(shù)據(jù)平臺組件,把整合好的數(shù)據(jù)或數(shù)據(jù)庫的數(shù)據(jù),存儲到大數(shù)據(jù)平臺指定路徑中。該模塊主要考核選手應用大數(shù)據(jù)相關組件將大數(shù)據(jù)集存儲能力。
(四)數(shù)據(jù)分析
數(shù)據(jù)分析包含了數(shù)據(jù)描述性統(tǒng)計分析和數(shù)據(jù)建模分析兩項內(nèi)容如下:
數(shù)據(jù)描述性統(tǒng)計分析部分,參賽選手需熟悉Pig、Hive、Impala等大數(shù)據(jù)分析相關組件,運用SQL語句,查詢hdfs上需要分析的數(shù)據(jù),根據(jù)任務要求,計算出最大值、最小值、均值、中位數(shù)、眾數(shù)、方差等常規(guī)統(tǒng)計分析指標。
    數(shù)據(jù)建模分析部分,參賽選手根據(jù)描述統(tǒng)計分析得出的正確指標,選擇適當?shù)臄?shù)學模型,利用Spark大數(shù)據(jù)計算引擎,進行迭代計算。發(fā)現(xiàn)工業(yè)大數(shù)據(jù)中存在的異常點,預測未來發(fā)展變化趨勢。
(五)數(shù)據(jù)可視化
參賽選手利用比賽預裝軟件,借助于圖形化手段,選擇適當?shù)谋憩F(xiàn)形式,清晰有效地傳達數(shù)據(jù)分析的結果。該模塊主要考核選手對分析結果有效展示的能力。
(六)報告撰寫
參賽選手按照要求,結合數(shù)據(jù)分析結論和數(shù)據(jù)可視化產(chǎn)品,輸出完整規(guī)范的數(shù)據(jù)分析報告。報告要求量化規(guī)范、重點突出、邏輯清晰、思維嚴謹、有創(chuàng)新點等。該模塊主要考核選手數(shù)據(jù)分析專業(yè)文檔編輯能力。
(七)技術答辯
通過對完成情況和數(shù)據(jù)分析報告質(zhì)量分析,闡述工業(yè)大數(shù)據(jù)分析得到的結論。答辯中要了解:選手對工業(yè)大數(shù)據(jù)整個產(chǎn)品全生命周期各個環(huán)節(jié)產(chǎn)生的各類數(shù)據(jù)及相關技術的知識掌握程度。選手須根據(jù)給定場景,從數(shù)據(jù)采集、數(shù)據(jù)整合、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)可視化五個方面對項目進行準備.

首屆工業(yè)大數(shù)據(jù)技術規(guī)程下載http://m.pps.sh.cn/uploadfile/2019/0405/20190405055352100.pdf