【課程介紹】
(1)培訓(xùn)架構(gòu):
本課程分為三個(gè)主要部分:
部分:重點(diǎn)講述大數(shù)據(jù)技術(shù)在的應(yīng)用,使學(xué)員對(duì)大數(shù)據(jù)技術(shù)的廣泛應(yīng)用有清晰的認(rèn)識(shí),在這環(huán)節(jié)當(dāng)中會(huì)重點(diǎn)介紹Hadoop技術(shù)在整個(gè)大數(shù)據(jù)技術(shù)應(yīng)用中的重要地位和應(yīng)用情況。
第二部分:具體對(duì)hadoop技術(shù)進(jìn)行模塊化分拆,從大數(shù)據(jù)文件存儲(chǔ)系統(tǒng)技術(shù)和分布式文件系統(tǒng)平臺(tái)及其應(yīng)用談起,介紹Hadoop技術(shù)各主要應(yīng)用工具和方法,以及在運(yùn)維維護(hù)當(dāng)中的主流做法,使學(xué)員全面了解和掌握Hadoop技術(shù)的精華。
第三部分:重點(diǎn)剖析大數(shù)據(jù)的應(yīng)用案例,使學(xué)員在案例當(dāng)中對(duì)該項(xiàng)技術(shù)有更深入的感觀印象
(2)設(shè)計(jì)思路:
本課程采用模塊化教學(xué)方法,以案例分析為主線,由淺入深、循序漸進(jìn)、由理論到實(shí)踐操作進(jìn)行設(shè)計(jì)。
(3)與企業(yè)的貼合點(diǎn):
本課程結(jié)合企業(yè)轉(zhuǎn)型發(fā)展及大數(shù)據(jù)發(fā)展戰(zhàn)略,圍繞企業(yè)大數(shù)據(jù)業(yè)務(wù)及行業(yè)應(yīng)用市場拓展發(fā)展目標(biāo),重點(diǎn)講授Hadoop的應(yīng)用技術(shù),提升企業(yè)IT技術(shù)人員的開發(fā)和運(yùn)維能力,有很強(qiáng)的貼合度。
【培訓(xùn)對(duì)象】
業(yè)務(wù)支撐建設(shè)維護(hù)室、業(yè)務(wù)維護(hù)室、經(jīng)營分析室人員;網(wǎng)絡(luò)部、網(wǎng)管中心、網(wǎng)優(yōu)中心從事大數(shù)據(jù)相關(guān)工作的人員
【培訓(xùn)目標(biāo)】
掌握大數(shù)據(jù)處理平臺(tái)(Hadoop、Spark、Storm)技術(shù)架構(gòu)、以及平臺(tái)的安裝部署、運(yùn)維配置、應(yīng)用開發(fā);掌握主流大數(shù)據(jù)Hadoop平臺(tái)和Spark實(shí)時(shí)處理平臺(tái)的技術(shù)架構(gòu)和實(shí)際應(yīng)用;利用Hadoop+Spark對(duì)行業(yè)大數(shù)據(jù)進(jìn)行存儲(chǔ)管理和分析挖掘的技術(shù)應(yīng)用;講解Hadoop生態(tài)系統(tǒng)組件,包括Storm,HDFS,MapReduce,HIVE,HBase,Spark,GraphX,MLib,Shark, ElasticSearch等大數(shù)據(jù)存儲(chǔ)管理、分布式數(shù)據(jù)庫、大型數(shù)據(jù)倉庫、大數(shù)據(jù)查詢與搜索、大數(shù)據(jù)分析挖掘與分布式處理技術(shù)
【培訓(xùn)內(nèi)容】
模塊一 移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算相關(guān)技術(shù)介紹
數(shù)據(jù)中心與云計(jì)算技術(shù)應(yīng)用
智慧城市與云計(jì)算技術(shù)應(yīng)用
移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)與云計(jì)算關(guān)聯(lián)技術(shù)
移動(dòng)云計(jì)算的生態(tài)系統(tǒng)及產(chǎn)業(yè)鏈
大數(shù)據(jù)技術(shù)在運(yùn)營商、金融業(yè)、銀行業(yè)、電子商務(wù)行業(yè)、零售業(yè)、制造業(yè)、政務(wù)信息化、互聯(lián)網(wǎng)、教育信息化等行業(yè)中的應(yīng)用實(shí)踐
國內(nèi)外主流的大數(shù)據(jù)解決方案介紹
當(dāng)前大數(shù)據(jù)解決方案與傳統(tǒng)數(shù)據(jù)庫方案的剖析比較
Cloudera Hadoop 大數(shù)據(jù)平臺(tái)方案剖析
開源的大數(shù)據(jù)生態(tài)系統(tǒng)平臺(tái)剖析
模塊二 大數(shù)據(jù)的挑戰(zhàn)和發(fā)展方向
大數(shù)據(jù)時(shí)代的挑戰(zhàn)
大數(shù)據(jù)時(shí)代的發(fā)展方向
大數(shù)據(jù)挖掘在各行業(yè)應(yīng)用情況
模塊三 大數(shù)據(jù)文件存儲(chǔ)系統(tǒng)技術(shù)和分布式文件系統(tǒng)平臺(tái)及其應(yīng)用
Hadoop的發(fā)展歷程
分布式文件系統(tǒng)HDFS
分布式文件系統(tǒng)HDFS架構(gòu)及原理
分布式文件系統(tǒng)HDFS操作
Hadoop生態(tài)系統(tǒng)組件
模塊四 Hadoop文件系統(tǒng)HDFS佳實(shí)戰(zhàn)
HDFS的設(shè)計(jì)
HDFS的概念
命令行接口
Hadoop文件系統(tǒng)
Java接口
數(shù)據(jù)流
通過Flume和Sqoop導(dǎo)入數(shù)據(jù)
通過distcp并行復(fù)制
Hadoop存檔
模塊五 Hadoop運(yùn)維管理與性能調(diào)優(yōu)
第二代大數(shù)據(jù)處理框架
集群配置管理
HDFS的靜態(tài)調(diào)優(yōu)技巧
模塊六 NOSQL數(shù)據(jù)庫Hbase與Redis
NOSQL基礎(chǔ)
HBase分布式數(shù)據(jù)基礎(chǔ)
安裝Hbase
Hbase應(yīng)用
Base分布式數(shù)據(jù)庫簡介、發(fā)展歷程、應(yīng)用場景、工作原理、以及應(yīng)用優(yōu)勢(shì)與不足之處
Redis內(nèi)存數(shù)據(jù)庫介紹,以及業(yè)界應(yīng)用案例
模塊七 類SQL語句工具——Hive
安裝Hive
示例
運(yùn)行Hive
Hive與傳統(tǒng)數(shù)據(jù)庫相比
HiveQL
表
查詢數(shù)據(jù)
用戶定義函數(shù)
模塊八 數(shù)據(jù)挖掘SPARK建?;A(chǔ)介紹
Spark簡介
Spark架構(gòu)
Spark集群的安裝與部署
Spark硬件配置
模塊九 Kafka基礎(chǔ)介紹
Kafka介紹
kafka體系結(jié)構(gòu)
kafka設(shè)計(jì)理念簡介
kafka通信協(xié)議
kafka的偽分布安裝、集群安裝
kafka的shell操作、java操作
kafka設(shè)計(jì)理念*
kafka producer和consumer開發(fā)
Kafka分布式消息訂閱系統(tǒng)的應(yīng)用介紹、平臺(tái)架構(gòu)、集群部署與配置應(yīng)用實(shí)戰(zhàn)
Flume-NG數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)流模型、平臺(tái)架構(gòu)、集群部署與配置應(yīng)用實(shí)戰(zhàn)
Hadoop與DBMS之間數(shù)據(jù)交互工具Sqoop的應(yīng)用實(shí)踐,
Sqoop導(dǎo)入導(dǎo)出數(shù)據(jù)以及Sqoop集群部署與配置
Kettle 集群的平臺(tái)架構(gòu)、核心技術(shù)、部署配置和應(yīng)用實(shí)戰(zhàn)
利用Sqoop實(shí)現(xiàn) MySQL 與 Hadoop 集群之間
模塊十 大數(shù)據(jù)典型應(yīng)用與開發(fā)案例分析:互聯(lián)網(wǎng)數(shù)據(jù)運(yùn)營
案例1:貴州數(shù)據(jù)交易中心
案例2:大數(shù)據(jù)應(yīng)用案例:公共交通線路的智能規(guī)劃
討論:浙江移動(dòng)大數(shù)據(jù)應(yīng)用與開發(fā)方向
模塊十一 當(dāng)前數(shù)據(jù)中心的改造和轉(zhuǎn)換分析-以國內(nèi)外運(yùn)營商、互聯(lián)網(wǎng)公司為例
流商業(yè)大數(shù)據(jù)解決方案比較
主流開源云計(jì)算系統(tǒng)比較
國內(nèi)外代表性大數(shù)據(jù)平臺(tái)比較
各廠商新的大數(shù)據(jù)產(chǎn)品介紹
案例分析
【課程安排】
【師資介紹】
張老師
阿里大數(shù)據(jù)專家,國內(nèi)的Spark、Hadoop技術(shù)專家、虛擬化專家,對(duì)HDFS、MapReduce、HBase、Hive、Mahout、Storm、spark和openTSDB等Hadoop生態(tài)系統(tǒng)中的技術(shù)進(jìn)行了多年的深入的研究,更主要的是這些技術(shù)在大量的實(shí)際項(xiàng)目中得到廣泛的應(yīng)用,因此在Hadoop開發(fā)和運(yùn)維方面積累了豐富的項(xiàng)目實(shí)施經(jīng)驗(yàn)。近年主要典型的項(xiàng)目有:某電信集團(tuán)網(wǎng)絡(luò)優(yōu)化、中國移動(dòng)某省移動(dòng)公司請(qǐng)賬單系統(tǒng)和某省移動(dòng)詳單實(shí)時(shí)查詢系統(tǒng)、中國銀聯(lián)大數(shù)據(jù)數(shù)據(jù)票據(jù)詳單平臺(tái)、某大型銀行大數(shù)據(jù)記錄系統(tǒng)、某大型通信運(yùn)營商全國用戶上網(wǎng)記錄、某省交通部門違章系統(tǒng)、某區(qū)域醫(yī)療大數(shù)據(jù)應(yīng)用項(xiàng)目、互聯(lián)網(wǎng)公共數(shù)據(jù)大云(DAAS)和構(gòu)建游戲云(Web Game Daas)平臺(tái)項(xiàng)目等。
【頒發(fā)證書】
參加相關(guān)培訓(xùn)并通過考試的學(xué)員,可以獲得:
工業(yè)和信息化部頒發(fā)的-《HADOOP大數(shù)據(jù)》技能證書。該證書可作為專業(yè)技術(shù)人員職業(yè)能力考核的證明,以及專業(yè)技術(shù)人員崗位聘用、任職、定級(jí)和晉升職務(wù)的重要依據(jù)。注:請(qǐng)學(xué)員帶一寸彩照2張(背面注明姓名)、身份證復(fù)印件一張。