企業(yè)管理培訓(xùn)分類導(dǎo)航
企業(yè)管理培訓(xùn)公開課計(jì)劃
企業(yè)培訓(xùn)公開課日歷
2025年
2024年
職業(yè)技能培訓(xùn)公開課
職業(yè)技能培訓(xùn)內(nèi)訓(xùn)課程
熱門企業(yè)管理培訓(xùn)關(guān)鍵字
您所在的位置:名課堂>>公開課>>職業(yè)技能培訓(xùn)公開課
Spark大數(shù)據(jù)挖掘工具M(jìn)llib實(shí)戰(zhàn)(機(jī)器學(xué)習(xí))
【課程編號(hào)】:MKT028424
Spark大數(shù)據(jù)挖掘工具M(jìn)llib實(shí)戰(zhàn)(機(jī)器學(xué)習(xí))
【課件下載】:點(diǎn)擊下載課程綱要Word版
【所屬類別】:職業(yè)技能培訓(xùn)
【時(shí)間安排】:2025年02月18日 到 2025年02月19日5500元/人
2024年03月05日 到 2024年03月06日5500元/人
【授課城市】:北京
【課程說明】:如有需求,我們可以提供Spark大數(shù)據(jù)挖掘工具M(jìn)llib實(shí)戰(zhàn)(機(jī)器學(xué)習(xí))相關(guān)內(nèi)訓(xùn)
【課程關(guān)鍵字】:北京大數(shù)據(jù)挖掘培訓(xùn)
我要報(bào)名
咨詢電話: | |
手 機(jī): | 郵箱: |
課程介紹
隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展,我們已經(jīng)切實(shí)地迎來了一個(gè)大數(shù)據(jù)的時(shí)代。大數(shù)據(jù)是指無法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合,對(duì)大數(shù)據(jù)的實(shí)時(shí)分析已經(jīng)成為一個(gè)非常重要且緊迫的需求。目前對(duì)大數(shù)據(jù)的實(shí)時(shí)分析工具,業(yè)界公認(rèn)最佳為Spark。Spark是一個(gè)開源集群運(yùn)算框架,最初是由加州大學(xué)柏克利分校AMPLab所開發(fā),Spark使用了內(nèi)存內(nèi)運(yùn)算技術(shù),在內(nèi)存上的運(yùn)算速度比Hadoop MapReduce的運(yùn)算速度快上100倍,即便是在磁盤上運(yùn)行也能快10倍。
為解決廣大系統(tǒng)設(shè)計(jì)人員深入研究與開發(fā)大數(shù)據(jù)挖掘和實(shí)時(shí)分析的需要,培訓(xùn)中心特舉辦“Spark大數(shù)據(jù)挖掘工具M(jìn)Llib實(shí)戰(zhàn)”培訓(xùn)班,本課程主要講解Spark MLlib,Spark MLlib是一種高效、快速、可擴(kuò)展的分布式計(jì)算框架,實(shí)現(xiàn)了常用的機(jī)器學(xué)習(xí),如:聚類、分類、回歸等算法。講解各個(gè)算法的理論、詳細(xì)展示Spark源碼實(shí)現(xiàn),最后均會(huì)通過實(shí)例進(jìn)行解析實(shí)戰(zhàn),幫助大家真正從理論到實(shí)踐全面掌握Spark MLlib分布式機(jī)器學(xué)習(xí)和大數(shù)據(jù)挖掘方法
培訓(xùn)對(duì)象
1,系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級(jí)程序員、資深開發(fā)人員。
2,牽涉到大數(shù)據(jù)實(shí)時(shí)處理的數(shù)據(jù)中心運(yùn)行、規(guī)劃、設(shè)計(jì)負(fù)責(zé)人。
3,政府機(jī)關(guān),金融保險(xiǎn)、移動(dòng)和互聯(lián)網(wǎng)等大數(shù)據(jù)來源單位的負(fù)責(zé)人。
4,高校、科研院所牽涉到大數(shù)據(jù)與分布式數(shù)據(jù)處理的項(xiàng)目負(fù)責(zé)人。
課程目標(biāo)
1, 全面了解大數(shù)據(jù)實(shí)時(shí)處理技術(shù)的相關(guān)知識(shí)。
2,學(xué)習(xí)Spark的核心技術(shù)方法以及應(yīng)用特征。
3,深入使用MLLib在大數(shù)據(jù)挖掘和實(shí)時(shí)分析中的使用。
4,掌握MLlib相關(guān)機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘工具的使用。
課程大綱
第一講 Spark大數(shù)據(jù)實(shí)時(shí)處理技術(shù)
1)大數(shù)據(jù)處理技術(shù)
2)Spark實(shí)時(shí)處理技術(shù)
3)Spark生態(tài)系統(tǒng)BDAS
4)Spark架構(gòu)分析
第二講 Spark安裝配置及監(jiān)控
1)Ubuntu環(huán)境的準(zhǔn)備
2)Hadoop2.X和Scala
3)搭建Spark開發(fā)環(huán)境
4)Idea編譯和運(yùn)行
5)Spark監(jiān)控管理
第3講 Scala編程語言和分布式計(jì)算模型
1) Scala編程語言
2) 操作基本數(shù)據(jù)類型
3)Spark計(jì)算模型和RDD
4)Transformation及Actions算子
5)Spark MLlib矩陣向量
第四講 Spark MLlib線性回歸和邏輯回歸算法
1)線性回歸算法
2)線性回歸代碼實(shí)例
3)邏輯回歸算法
4)邏輯回歸回歸代碼實(shí)例
5)線性回歸和邏輯回歸代碼實(shí)操
第五講 Spark MLlib貝葉斯分類算法
1) 貝葉斯分類算法原理
2) Spark貝葉斯分類源碼
3) Spark貝葉斯分類代碼示例
4) 貝葉斯分類代碼實(shí)操
第六講 Spark MLlib決策樹算法
1) 決策樹算法原理
2) Spark決策樹算法源碼
3) Spark決策樹算法代碼示例
4) 決策樹代碼實(shí)操
第七講 Spark MLlib聚類算法
1) K-Means聚類算法原理
2) Spark K-Means聚類算法源碼
3) SparkK-Means聚類代碼示例
4) 聚類算法代碼實(shí)操
第八講 Spark MLlib關(guān)聯(lián)規(guī)則算法
1) FPGrowth關(guān)聯(lián)規(guī)則算法原理
2) FPGrowth關(guān)聯(lián)規(guī)則算法源碼
3) FPGrowth關(guān)聯(lián)規(guī)則代碼示例
4) 關(guān)聯(lián)規(guī)則代碼實(shí)操
第九講 Spark MLlib個(gè)性化推薦算法
1) 協(xié)同過濾推薦算法原理
2) Spark協(xié)同過濾推薦源碼
3) Spark協(xié)同過濾推薦代碼示例
4) 推薦代碼實(shí)操
第十講 Spark MLlib神經(jīng)網(wǎng)絡(luò)算法
1) 神經(jīng)網(wǎng)絡(luò)算法原理
2) Spark神經(jīng)網(wǎng)絡(luò)算法源碼
3) Spark神經(jīng)網(wǎng)絡(luò)代碼示例
4) 神經(jīng)網(wǎng)絡(luò)代碼實(shí)操
楊老師
由業(yè)界知名大數(shù)據(jù)專家親自授課:
楊老師 主要研究網(wǎng)絡(luò)信息分析以及云計(jì)算相關(guān)技術(shù),長(zhǎng)期從事通信網(wǎng)管系統(tǒng)、網(wǎng)絡(luò)信息處理、商務(wù)智能(BI)以及電信決策支持系統(tǒng)的研究開發(fā)工作,主持和參與了多個(gè)國(guó)家和省部級(jí)基金項(xiàng)目,具有豐富的工程實(shí)踐及軟件研發(fā)經(jīng)驗(yàn)。