2018Hadoop大數(shù)據(jù)處理高級(jí)工程師培訓(xùn)班

授課機(jī)構(gòu)：中聯(lián)軟博

關(guān)注度：590

課程價(jià)格：￥5800.00元

上課地址：請咨詢客服

開課時(shí)間：滾動(dòng)開班

咨詢熱線：400-850-8622

在線報(bào)名

課程詳情在線報(bào)名

更新時(shí)間：2024-10-23

關(guān)于舉辦“Hadoop大數(shù)據(jù)處理高級(jí)工程師” 實(shí)戰(zhàn)培訓(xùn)班的通知各有關(guān)單位：為貫徹落實(shí)黨中央國務(wù)院“十二五”規(guī)劃指導(dǎo)精神，云計(jì)算作為戰(zhàn)略重點(diǎn)項(xiàng)目新興產(chǎn)業(yè)，*和業(yè)界都表現(xiàn)出了極大的熱情。日前發(fā)改委、工信部、財(cái)政部支持的云計(jì)算項(xiàng)目正式啟動(dòng)，云計(jì)算平臺(tái)和云計(jì)算服務(wù)模式已成為今后IT服務(wù)的主流。云計(jì)算服務(wù)應(yīng)用的種類不斷增多，普及程度逐漸深入，使用者正向普通用戶拓展。未來，云計(jì)算及其基礎(chǔ)設(shè)施將是信息產(chǎn)業(yè)的核心平臺(tái)，其所蘊(yùn)含的技術(shù)變革和創(chuàng)新服務(wù)模式，將深刻影響全球產(chǎn)業(yè)技術(shù)創(chuàng)新的發(fā)展。目前，互聯(lián)網(wǎng)正從數(shù)據(jù)爆炸進(jìn)一步發(fā)展到海量數(shù)據(jù)分析和挖掘的時(shí)代，而基于Hadoop技術(shù)的解決方案為海量數(shù)據(jù)存儲(chǔ)和處理提供了經(jīng)濟(jì)、高效、高安全性和高可靠性的保障，Apache Hadoop也因此成為大數(shù)據(jù)行業(yè)發(fā)展背后的驅(qū)動(dòng)力。由于Hadoop技術(shù)已成為當(dāng)下最火熱的云計(jì)算技術(shù)之一，各行業(yè)中希望深入了解并掌握這門技術(shù)的人也越來越多，*軟件行業(yè)產(chǎn)業(yè)培訓(xùn)網(wǎng)決定開展“大數(shù)據(jù)處理Hadoop應(yīng)用與開發(fā)”實(shí)戰(zhàn)培訓(xùn)班，本次培訓(xùn)由中聯(lián)軟博（北京）科技有限公司具體承辦，望相關(guān)單位收到通知后積極參加。相關(guān)培訓(xùn)事宜如下: 一、課程目標(biāo) 1、了解Hadoop的歷史及目前發(fā)展的現(xiàn)狀、以及Hadoop的技術(shù)特點(diǎn)，從而把握分布式計(jì)算框架及未來發(fā)展方向，在大數(shù)據(jù)時(shí)代能為企業(yè)的技術(shù)選型及架構(gòu)設(shè)計(jì)提供決策參考。 2、全面掌握Hadoop的架構(gòu)原理和使用場景，并通過貫穿課程的項(xiàng)目進(jìn)行實(shí)戰(zhàn)鍛煉，從而熟練使用Hadoop進(jìn)行MapReduce程序開發(fā)。課程還涵蓋了分布式計(jì)算領(lǐng)域的常用算法介紹，幫助學(xué)員為企業(yè)在利用大數(shù)據(jù)方面體現(xiàn)自身價(jià)值。 3、深入理解Hadoop技術(shù)架構(gòu),對(duì)Hadoop運(yùn)作機(jī)制有清晰全面的認(rèn)識(shí)，可以獨(dú)立規(guī)劃及部署生產(chǎn)環(huán)境的Hadoop集群，掌握Hadoop基本運(yùn)維思路和方法，對(duì)Hadoop集群進(jìn)行管理和優(yōu)化。二、培訓(xùn)時(shí)間及地點(diǎn) 北京上海廣州成都月月開課常年開課三、培訓(xùn)對(duì)象各地*云計(jì)算物聯(lián)網(wǎng)產(chǎn)業(yè)相關(guān)負(fù)責(zé)人，各企業(yè)CIO、信息中心負(fù)責(zé)人、技術(shù)總監(jiān)，云計(jì)算中心負(fù)責(zé)人，云計(jì)算產(chǎn)業(yè)投資團(tuán)隊(duì)，云計(jì)算應(yīng)用開發(fā)商，云計(jì)算硬件設(shè)備供應(yīng)商，云服務(wù)提供商，高校、科研院所云計(jì)算項(xiàng)目負(fù)責(zé)人。各企業(yè)大數(shù)據(jù)架構(gòu)師、技術(shù)總監(jiān)、數(shù)據(jù)挖掘負(fù)責(zé)人、數(shù)據(jù)挖掘開發(fā)工程師四、師資力量張老師：阿里大數(shù)據(jù)高級(jí)專家，國內(nèi)資深的Spark、Hadoop技術(shù)專家、虛擬化專家，對(duì)HDFS、MapReduce、HBase、Hive、Mahout、Storm、spark和openTSDB等Hadoop生態(tài)系統(tǒng)中的技術(shù)進(jìn)行了多年的深入的研究，更主要的是這些技術(shù)在大量的實(shí)際項(xiàng)目中得到廣泛的應(yīng)用，因此在Hadoop開發(fā)和運(yùn)維方面積累了豐富的項(xiàng)目實(shí)施經(jīng)驗(yàn)。近年主要典型的項(xiàng)目有：某電信集團(tuán)網(wǎng)絡(luò)優(yōu)化、*移動(dòng)某省移動(dòng)公司請賬單系統(tǒng)和某省移動(dòng)詳單實(shí)時(shí)查詢系統(tǒng)、*銀聯(lián)大數(shù)據(jù)數(shù)據(jù)票據(jù)詳單平臺(tái)、某大型銀行大數(shù)據(jù)記錄系統(tǒng)、某大型通信運(yùn)營商*用戶上網(wǎng)記錄、某省交通*違章系統(tǒng)、某區(qū)域醫(yī)療大數(shù)據(jù)應(yīng)用項(xiàng)目、互聯(lián)網(wǎng)公共數(shù)據(jù)大云(DAAS)和構(gòu)建游戲云(Web Game Daas)平臺(tái)項(xiàng)目等。五、培訓(xùn)特色注重應(yīng)用：分析國內(nèi)實(shí)際情況，結(jié)合國際、國內(nèi)成功經(jīng)驗(yàn)。Hadoop采用實(shí)戰(zhàn)的項(xiàng)目，讓學(xué)員在短時(shí)間內(nèi)掌握Hadoop的搭建與配置。并進(jìn)行高效的大數(shù)據(jù)清洗和分析。形式靈活：互動(dòng)課堂、免費(fèi)技術(shù)沙龍、提供云計(jì)算項(xiàng)目建設(shè)咨詢、大數(shù)據(jù)Hadoop平臺(tái)的搭建。六、頒發(fā)證書參加相關(guān)培訓(xùn)并通過考試的學(xué)員，可以獲得：工業(yè)和信息化部頒發(fā)的-大數(shù)據(jù)處理高級(jí)工程師。該證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明，以及專業(yè)技術(shù)人員崗位聘用、任職、定級(jí)和晉升職務(wù)的重要依據(jù)。注：請學(xué)員帶一寸彩照2張（背面注明姓名）、身份證復(fù)印件一張。七、培訓(xùn)費(fèi)用及須知 5800 元/人（含教材、培訓(xùn)費(fèi)、以及學(xué)習(xí)用具等費(fèi)用）食宿統(tǒng)一安排，費(fèi)用自理。八、培訓(xùn)內(nèi)容（3天課程）課程模塊課程主題主要內(nèi)容案例和演示模塊一 Hadoop在云計(jì)算技術(shù)的作用和地位 ? 傳統(tǒng)大規(guī)模系統(tǒng)存在的問題 ? Hadoop概述 ? Hadoop分布式文件系統(tǒng) ? MapReduce工作原理 ? Hadoop集群剖析 ? Hadoop生態(tài)系統(tǒng)對(duì)一種新的解決方案的需求 ? Hadoop的行業(yè)應(yīng)用案例分析 ? Hadoop在云計(jì)算和大數(shù)據(jù)的位置和關(guān)系 ? 數(shù)據(jù)開放,數(shù)據(jù)云服務(wù)平臺(tái)(DAAS)時(shí)代 ? Hadoop平臺(tái)在數(shù)據(jù)云平臺(tái)(DAAS)上的天然優(yōu)勢 ? 數(shù)據(jù)云平臺(tái)(DAAS 平臺(tái))組成部分 ? 互聯(lián)網(wǎng)公共數(shù)據(jù)大云(DAAS)案例 ? Hadoop構(gòu)建構(gòu)建游戲云(Web Game Daas)平臺(tái) 模塊二 Hadoop生態(tài)系統(tǒng)介紹和演示 ? Hadoop HDFS 和 MapReduce ? Hadoop數(shù)據(jù)庫之HBase ? Hadoop數(shù)據(jù)倉庫之Hive ? Hadoop數(shù)據(jù)處理腳本Pig ? Hadoop數(shù)據(jù)接口Sqoop和Flume，Scribe DataX ? Hadoop工作流引擎 Oozie ? 運(yùn)用Hadoop自下而上構(gòu)建大規(guī)模企業(yè)數(shù)據(jù)倉庫 ? 暴風(fēng)影音數(shù)據(jù)倉庫實(shí)戰(zhàn)解析模塊三 Hadoop組件詳解 ? Hadoop HDFS 基本結(jié)構(gòu) ? Hadoop HDFS 副本存放策略 ? Hadoop NameNode 詳解 ? HadoopSecondaryNameNode 詳解 ? Hadoop DataNode 詳解 ? Hadoop JobTracker 詳解 ? Hadoop TaskTracker 詳解 ? Hadoop Mapper類核心代碼 ? Hadoop Reduce類核心代碼 ? Hadoop 核心代碼模塊四 Hadoop安裝和部署 ? Hadoop系統(tǒng)模塊組件概述 ? Hadoop試驗(yàn)集群的部署結(jié)構(gòu) ? Hadoop 安裝依賴關(guān)系 ? Hadoop 生產(chǎn)環(huán)境的部署結(jié)構(gòu) ? Hadoop集群部署 ? Hadoop 高可用配置方法 ? Hadoop 集群簡單測試方法 ? Hadoop 集群異常Debug方法 ? Hadoop安裝部署實(shí)驗(yàn) ? Red hat Linux基礎(chǔ)環(huán)境搭建 ? Hadoop 單機(jī)系統(tǒng)版本安裝配置 ? Hadoop 集群系統(tǒng)版本安裝和啟動(dòng)配置 ? 使用 Hadoop MapReduce Streaming 快速測試系統(tǒng) ? Hadoopcore-site，hdfs-site，mapred-site 配置詳解模塊五 Hadoop集群規(guī)劃 ? Hadoop 集群內(nèi)存要求 ? Hadoop集群磁盤分區(qū) ? 集群和網(wǎng)絡(luò)拓?fù)湟? ? 集群軟件的端口配置 ? 針對(duì)NameNode Jobtracker DataNode TaskTracker Hiveserver 等不同組件需求推薦服務(wù)器配置模塊六 MapReduce 算法原理 ? Hadoop MapReduce 算法的原理和優(yōu)化思想 ? 靈活運(yùn)用MapReduce 實(shí)現(xiàn)算法 ? 運(yùn)用MapReduce 構(gòu)建數(shù)據(jù)庫算法 ? Select Sort GrougBy Sum Count ? Join 新進(jìn)流失算法 ? 使用 Y-Smart 快速轉(zhuǎn)換SQL 為MapReduce 代碼模塊七編寫MapReduce高級(jí)程序 ? 使用 Hadoop MapReduce Streaming 編程 ? MapReduce流程 ? 剖析一個(gè)MapReduce程序 ? 基本MapReduceAPI概念 ? 驅(qū)動(dòng)代碼 Mapper、Reducer ? Hadoop流 ? API 使用Eclipse進(jìn)行快速開發(fā) ? 新MapReduce API ? MapReduce的優(yōu)化 ? MapReduce的任務(wù)調(diào)度 ? MapReduce編程實(shí)戰(zhàn) ? 如何利用其他Hadoop相關(guān)技術(shù)，包括Apache Hive， Apache Pig，Sqoop和Oozie等 ? 滿足解決實(shí)際數(shù)據(jù)分析問題的高級(jí)Hadoop API ? Hadoop Streaming 和 Java MapReduce Api 差異。 ? MapReduce 實(shí)現(xiàn)數(shù)據(jù)庫功能 ? 利用Combiners來減少中間數(shù)據(jù) ? 編寫Partitioner來優(yōu)化負(fù)載平衡 ? 直接訪問Hadoop分布式文件系統(tǒng)（HDFS） ? Hadoop的join操作 ? 輔助排序在Reducer方的合并 ? 定制Writables和WritableComparables ? 使用SequenceFiles和Avro文件保存二進(jìn)制數(shù)據(jù) ? 創(chuàng)建InputFormats OutputFormats ? Hadoop的二次排序 ? Hadoop的海量日志分析 ? 在Map方的合并模塊八集成Hadoop到現(xiàn)有工作流及Hadoop API深入探討 ? 存儲(chǔ)系統(tǒng) ? 利用Sqoop從關(guān)系型數(shù)據(jù)庫系統(tǒng)中導(dǎo)入數(shù)據(jù)到Hadoop ? 利用Flume導(dǎo)入實(shí)時(shí)數(shù)據(jù)到Hadoop ? ToolRunner介紹、使用MRUnit進(jìn)行測試 ? 使用Configure和Close方法來進(jìn)行Map/Reduce設(shè)置和關(guān)閉 ? 使用FuseDFS和Hadoop訪問HDFS ? 使用分布式緩存（Distributed Cache） ? 直接訪問Hadoop分布式文件系統(tǒng)（HDFS） ? 利用Combiners來減少中間數(shù)據(jù) ? 編寫Partitioner來優(yōu)化負(fù)載平衡模塊九使用Hive和Pig開發(fā)及技巧 ? Hive和Pig基礎(chǔ) ? Hive的作用和原理說明 ? Hadoop倉庫和傳統(tǒng)數(shù)據(jù)倉庫的協(xié)作關(guān)系 ? Hadoop/Hive倉庫數(shù)據(jù)數(shù)據(jù)流 ? Hive 部署和安裝 ? Hive Cli 的基本用法 ? HQL基本語法 ? 運(yùn)用Pig 過濾用戶數(shù)據(jù) ? 使用JDBC 連接Hive進(jìn)行查詢和分析 ? 使用正則表達(dá)式加載數(shù)據(jù) ? HQL高級(jí)語法 ? 編寫UDF函數(shù) ? 編寫UDAF自定義函數(shù) ? 基于Hive腳本內(nèi)嵌Streaming 編程模塊十 Hbase安裝和使用 ? Hbase 安裝部署 ? Hbase原理和結(jié)構(gòu) ? Hbase 運(yùn)維和管理 ? 使用Hbase+Hive 提供 OLAP SQL查詢能力 ? 使用Hbase+Phoenix提供 OLTP SQL能力 ? 基于Hbase 的時(shí)間序列數(shù)據(jù)庫 OpenTsDb 結(jié)構(gòu)解析模塊十一 Hadoop2.0 集群探索 ? Hadoop2.0 HDFS 原理 ? Hadoop2.0 Yarn 原理 ? Hadoop2.0 生態(tài)系統(tǒng) ? 基于Hadoop2.0 構(gòu)建分布式系統(tǒng) 模塊十二 Hadoop企業(yè)級(jí)別案例解析 ? Hadoop 結(jié)構(gòu)化數(shù)據(jù)案例 ? Hadoop 非結(jié)構(gòu)化案例 ? Hbase 數(shù)據(jù)庫案例 ? Hadoop 視頻分析案例 ? 利用大數(shù)據(jù)分析改進(jìn)交通管理 ? 區(qū)域醫(yī)療大數(shù)據(jù)應(yīng)用案例 ? 銀聯(lián)大數(shù)據(jù)數(shù)據(jù)票據(jù)詳單平臺(tái) ? 廣東移動(dòng)省公司請賬單系統(tǒng) ? 上海電信網(wǎng)絡(luò)優(yōu)化 ? 某通信運(yùn)營商*用戶上網(wǎng)記錄 ? 浙江臺(tái)州市智能交通系統(tǒng) ? 移動(dòng)廣州詳單實(shí)時(shí)查詢系統(tǒng) ? 跨區(qū)域?qū)崟r(shí)視頻監(jiān)控系統(tǒng) 模塊十三 RedHadoop 企業(yè)版本 ? 運(yùn)用RedHadoop快速構(gòu)建服務(wù)集群 ? 運(yùn)用RedHadoop DW 構(gòu)建數(shù)據(jù)倉庫 ? 基于RedHadoop Hive構(gòu)建數(shù)據(jù)倉庫平臺(tái) ? 靈活運(yùn)用 Hive 加速游戲數(shù)據(jù)倉庫 ? 基于Pig+OpenCV大規(guī)模圖像人臉識(shí)別模塊十四 Spark原理和入門 ? Spark原理；Spark的架構(gòu)圖；Spark運(yùn)行模式介紹 ? —local；—standalone；—messos；—yarn；Spark的RDD ? 什么是RDD；RDD的種類；—Tranformation；—Action ? Spark的存儲(chǔ)級(jí)別；Cache介紹；Spark的容錯(cuò)原理 ? Lineage容錯(cuò)；Checkpoint容錯(cuò)；RDD的創(chuàng)建 ? 案例—統(tǒng)計(jì)單詞的個(gè)數(shù) 聯(lián) 系人：岳老師 *軟件產(chǎn)業(yè)培訓(xùn)網(wǎng)

相關(guān)課程

熱門課程

申請?jiān)嚶犝n程

只要一個(gè)電話
我們免費(fèi)為您回電

姓名不能為空

手機(jī)號(hào)格式錯(cuò)誤