使用python做數據分析
【課程編號】:NX20902
使用python做數據分析
【課件下載】:點擊下載課程綱要Word版
【所屬類別】:研發管理培訓
【培訓課時】:5天,6小時/天
【課程關鍵字】:python培訓
我要預訂
咨詢電話:027-5111 9925 , 027-5111 9926手機:18971071887郵箱:Service@mingketang.com
課程目標
理解python的特征
知曉python的結構
會使用相應方法,完成部分數據分析工作
培訓對象
有數據庫基礎知識
有編程基礎知識
有統計學基本知識
有數據分析、數據挖掘、統計分析的基本概念
對數據分析感興趣
課程內容
第1天
主題Python的優點和不足
優點
1、python語言更接近自然語言
2、python是開放源碼的自由軟件
3、python可移植在各種平臺上
4、python支持面向過程的函數編程,也支持面向對象的抽象編程
5、可擴展和可嵌入
6、各種功能豐富的庫
7、編碼規范。各種強制縮進方式提供了可讀性。
不足
8、運行速度可能不理想。
9、python是開源軟件,通過封裝加密進行商業化,就是一個問題。
10,、繁多的標準庫和第三方庫
主題重要的python庫
1、NumPy (numerical python)
2、Pandas 處理結構化數據的大量數據結構和函數
3、Matplotlib 繪制數據圖表
4、IPython 交互式窗口,科學計算工具集的一部分
5、SciPy 專門解決科學計算中,標準問題域的包的集合。
6、Scikit-learn 機器學習庫
主題Python的安裝和配置
1、anaconda
2、Windows系統下的安裝
3、Linux系統下的安裝
主題 Ipython基礎
1、IPython交互式計算和開發環境
2、Ipython啟動、簡單命令
3、內省
4、使用歷史命令
5、與操作系統交互
6、軟件開發工具
7、ipython html notebook
8、用ipython提高代碼開發效率
9、ipython高級功能
主題Ipython編碼效率與高級功能
1、利用python提高代碼效率的幾點提示
2、高級Ipython功能
第2天
主題numpy數組和矢量計算
1、NumPy的ndarray:多維數組
2、通用函數 數組函數
3、利用數組進行數據處理
4、用于數組文件的輸入輸出
5、線性代數
6、隨機數生產
7、隨機漫步
主題pandas 數據處理分析工具
1、pandas的數據結構介紹
2、基本功能
3、匯總和計算描述統計
4、處理缺失數據
5、層次化索引
6、其他有關pandas的話題
主題數據加載 轉儲
1、讀寫文本格式的數據
2、二進制數據格式
3、使用HTML和Web API
4、使用數據庫
5、使用excel文件
6、使用hadoop大數據
主題簡單數據清洗
1、合并數據集
2、重塑和軸向旋轉
3、數據轉換
4、字符串操作
主題python的繪圖和可視化
1、python的圖形化工具生態系統
2、matplotlib API入門
3、pandas中的繪圖函數
4、繪制地圖
第3天
主題數據的分組計算--分層樣本
1、GroupBy技術
2、數據聚合
3、分組運算和轉換
4、透視表和交叉表
主題時間序列
1、日期和時間數據類型及工具
2、時間序列基礎
3、日期的范圍、頻率以及移動
4、時區處理
5、時期及其算數運算
6、重采樣及頻率轉換
7、時間序列繪圖
8、移動窗口函數
9、性能和內存使用方面的注意事項
主題numpy高級應用
1、ndarray對象的內部機制
2、高級數組操作
3、廣播
4、ufunc高級應用
5、結構化和記錄式數組
6、關于排序
7、numpy的matrix類
8、高級數組輸入輸出
9、性能建議
主題蒙特卡洛模擬
1、純python
2、用numpy向量化
3、用對數歐拉方法實現全向量化
4、圖形化分析
5、技術分析
主題統計學 正態檢驗
1、正態性檢驗
2、基準案例
3、現實世界的數據
第4天
主題金融應用 投資優化組合
1、基本理論
2、數據
3、投資組合優化
4、有效邊界
5、資本市場線
主題k 近鄰算法
1、k近鄰算法概述
2、準備數據:從文本文件中解析數據
3、分析數據:使用matplotlib創建散點圖
4、準備數據:歸一化數值
5、測試算法:作為完整程序驗證分類器
6、使用算法:構建完整可用的系統
主題決策樹
1、決策樹的構造
信息增益
劃分數據集
遞歸構建決策樹
2、使用matplotlib注解繪制樹形圖
matplotlib注解
構造注解樹
3、測試和存儲分類器
測試算法:使用決策樹執行分類
使用算法:決策樹的存儲
主題概率論 樸素貝葉斯
1、基于貝葉斯決策理論的分類方法
2、條件概率
3、使用條件概率來分類
4、使用樸素貝葉斯進行文檔分類
5、使用python進行文本分類
主題Logistic 回歸分析
大綱1、基于Logistic回歸和sigmoid函數的分類
2、基于最優化方法的 最佳回歸系數確定
梯度上升法
訓練算法:使用梯度上升找到最佳參數
分析數據:畫出決策邊界
訓練算法:隨機梯度上升
第5天
主題支持向量機
1、SVM應用的一般框架
2、基于最大間隔分隔數據
3、尋找最大間隔
4、SMO高效優化算法
5、利用完整plattSMO算法加速優化
6、在復雜數據上應用核函數
主題回歸 ----- 預測數值型數據
1、用線性回歸找到最佳擬合直線
2、局部加權線性回歸
3、縮減系數來“理解”數據
嶺回歸
lasso
向前逐步回歸
4、權衡偏差與方差
主題樹回歸
1、復雜數據的局部性建模
2、連續和離散型特征的樹的構建
3、將CART算法用于回歸
構建樹 運行代碼
4、樹剪枝
預剪枝 后剪枝
5、模型樹
6、樹回歸與標準回歸的比較
主題大數據與mapreduce
1、mapreduce:分布式計算框架
2、hadoop流
3、mapreduce上的機器學習
4、在python中使用mrjob來自動化MapReduce
5、真的需要MapReduce嗎
孫老師
講師資質
Oracle 數據庫 DBA認證
SAS 數據分析高級程序員認證
Hadoop大數據及數據分析講師
講師簡介
數據庫專家。 孫增輝老師多年從事數據庫的管理和教學工作。對oracle、sql server、mysql等關系型數據庫有豐富的教學經驗。對于hive、HBase這些非關系型NoSql數據庫也有相當成熟的教學實踐。
數據分析講師。孫增輝老師多年講授SAS數據分析軟件的應用與數據分析實踐。對SSPS、R、python等在數據分析方向的教學也有相當經驗。
Hadoop大數據、spark大數據分析講師。自2015年以來,孫增輝老師頻繁從事大數據方向的教學工作
Python+人工智能
Openstack云計算技術
Docker應用容器引擎
講師專長
孫增輝老師在數據庫、大數據、數據分析,python+人工智能,這條數據應用鏈路上,非常擅長。
講師IT從業經驗證明和項目經驗證明?從業經驗:
孫增輝老師從2008您進入數據庫行業之后,基本上一直從事數據相關工作。沒有脫離這個行業。
項目經驗 :
1.項目名稱:華夏銀行oracle數據庫技術培訓
項目描述:孫增輝老師多次在華夏銀行進行oracle數據庫培訓。從2013年至2016年,幾乎每年都要進行兩三次數據庫培訓項目。
工作內容:為專業數據庫技術部門及非技術相關部門培訓數據庫技術
2.項目名稱:廣東移動 鼎湖培訓學院 大數據及數據分析
項目描述:長期多次在鼎湖培訓中心,多次講授大數據、大數據分析等相關課程。
工作內容:為專業技術部門及非技術相關部門培訓大數據、數據分析技術
3.項目名稱:建設銀行研發中心 大數據技術培訓(北京西城)
項目描述:為研發人員進行大數據技術培訓
某銀行數據庫遷移項目
因業務發展,舊有的系統無法承擔業務增長造成的壓力,需要將數據庫遷移到新的平臺。
作為項目負責人,編寫實施方案,溝通項目實踐窗口,安排方案測試并組織實施。
某銀行全國數據庫管理員培訓項目
為金融機構的oracle數據庫管理員提供培訓。
金融機構的技術人員一般有較好的技術基礎,這對講師的能力也是一種考驗。
作為主講講師,講授相關技術知識。
某銀行儲蓄數據庫性能調優項目
為機構的數據庫查詢性能提供優化。
由于新業務上線,系統老舊,以及管理能力瓶頸造成的性能無法滿足需要,對數據庫進行調優。通過優化代碼、重新組織存儲、合理建設索引等方法完成項目。
作為項目工程師,確認影響范圍,組織實施測試,實施調優。
某銀行數據庫開發項目
審核代碼、優化代碼在數據庫中的執行效率。維護測試數據庫、組織測試數據。
作為數據庫管理員,提供技術支持。
ORACLE OCP公開課項目
面向社會培訓的oracle認證課程。
主要是對oracle數據庫的初級學員進行培訓。課程內容涉及oracle數據庫的全方位知識,知識點全面,深度中等。
作為主講講師,安排課程進度,組織教學實驗,維護學習氣氛。
ORACLE 數據庫災備方案 咨詢項目
對企業的oracle數據庫災備項目進行咨詢。
企業的oracle數據庫災備,是數據安全工作的重點,也是保障數據安全的重要手段。幫助企業完成災備方案并實施,是一項十分重要的工作。
作為咨詢顧問,進行售前技術交流、審核實施方案、安排組織方案測試。
ORACLE系統管理 系列培訓/咨詢項目
結合各行業企業客戶的項目和培訓需求,設計、開發相應的課程體系、定制課件、現場培訓、系統規劃、安裝、配置、性能優化、疑難解答等。
作為主講講師/咨詢顧問,提供技術支持,幫助界定項目范圍、時間長度安排。
某大學 計算機學院 oracle培訓項目
大學生的oracle數據庫培訓,與其他數據庫培訓有所不同。掌握課堂紀律,安排好課程的節奏反而是更重要的部分。
作為主講講師,安排課程進度,組織教學實驗,維護學習氣氛。
廣東移動 SAS數據分析培訓項目
培訓項目內容深度要求并不嚴格,但是移動公司人員對知識的廣度要求加大。很多時候培訓組織的過程中,都要求按照學員的需求,隨時調整講授內容。這對講師的講授經驗、項目經驗、課程熟悉程度都會有較高要求。
作為主講講師,安排課程進度,組織教學實驗,維護學習氣氛。
SAS程序開發
面向社會的SAS公開課。主要內容為數據處理與簡單建模。
很多數據分析課程,一開始就講授建模部分,但是數據的采集、整理、篩選、變換才是一個數據分析師的基本功。本課程的內容主要是數據處理。
作為主講講師,安排課程進度,組織教學實驗,維護學習氣氛。
SAS數據分析
主要內容是使用描述統計、相關分析、主成分分析、聚類、回歸分析、邏輯回歸、方差分析、時間序列分析等方法對數據繼續分析處理。
作為主講講師,安排課程進度,組織教學實驗,維護學習氣氛。
工作內容:
組織培訓并安排考試考核
講師認證證書
講師授課經驗?廣東移動中高級數據庫培訓
招商銀行數據庫技術培訓
中國征信(北京)公司數據庫運維培訓
建設銀行大數據技術培訓
中石油化工oracle項目技術培訓
廣東移動數據分析培訓
上海CDA數據分析師項目培訓
泰安煙草數據分析培訓
我要預訂
咨詢電話:027-5111 9925 , 027-5111 9926手機:18971071887郵箱:Service@mingketang.com
企業管理培訓分類導航
企業培訓公開課日歷
2025年
2024年