主講老師: 盧森煌(培訓(xùn)費(fèi):2-2.5萬(wàn)元/天)
工作背景:
曾任職阿里巴巴畢業(yè)于北京郵電大學(xué)0-1策劃多個(gè)傳播量過(guò)億的互聯(lián)網(wǎng)營(yíng)銷(xiāo)案例孵化過(guò)30個(gè)賬號(hào),單條百萬(wàn)播放視頻過(guò)100條操盤(pán)互聯(lián)網(wǎng)渠道銷(xiāo)售金額累計(jì)10億前啊喔科技CEO,18個(gè)月完成3...
主講課程:
《制造業(yè)數(shù)智化轉(zhuǎn)型的機(jī)遇與挑戰(zhàn)》《ChatGPT原理與移動(dòng)通信的結(jié)合》《基于人工智能進(jìn)行人物形象設(shè)計(jì)》《AI在直播和短視頻中的應(yīng)用》

Python應(yīng)用與大數(shù)據(jù)分析課程大綱詳細(xì)內(nèi)容
課程分類(lèi): 大數(shù)據(jù)
課程目標(biāo):
課程對(duì)象:
課程時(shí)間:
時(shí)間 | 培訓(xùn)項(xiàng)目 | 具體內(nèi)容 |
| ||
第 一 天 上 午 | Python Package 與數(shù)據(jù)分析 | Numpy/Scipy/Pandas/Matplotlib/Seaborn庫(kù) |
| ||
Numpy基礎(chǔ)屬性與數(shù)組創(chuàng)建 |
| ||||
Numpy索引 |
| ||||
Numpy數(shù)學(xué)運(yùn)算與常用分布 |
| ||||
Pandas數(shù)據(jù)處理與分析 |
| ||||
Pandas文件讀寫(xiě)和個(gè)性化控制 |
| ||||
Pandas的concat與merge |
| ||||
Matplotlib 基本圖結(jié)構(gòu)介紹 |
| ||||
基于Matplotlib繪制散點(diǎn)圖、柱狀圖、等高線、3D圖等 |
| ||||
多圖合并與圖片文件存取 |
| ||||
Seaborn/PyEcharts等包的使用 |
| ||||
scikit-learn的介紹和典型使用 |
| ||||
TensorFlow經(jīng)典應(yīng)用 |
| ||||
多元高斯分布 |
| ||||
典型圖像處理 |
| ||||
多種數(shù)學(xué)曲線 |
| ||||
多項(xiàng)式擬合 |
| ||||
代碼 和案例實(shí)踐 | 快速傅里葉變換FFT與信號(hào)處理 |
| |||
Soble/Prewitt/Laplacian算子與卷積網(wǎng)絡(luò) |
| ||||
卷積與(指數(shù))移動(dòng)平均線 |
| ||||
股票數(shù)據(jù)分析 |
| ||||
缺失數(shù)據(jù)的處理和預(yù)測(cè) |
| ||||
環(huán)境數(shù)據(jù)異常檢測(cè)和分析 |
| ||||
快速傅里葉變換FFT |
| ||||
圖像處理與奇異值分解SVD |
| ||||
第 一 天 下 午 : 實(shí) 踐 | 使用numpy、 PIL等包 實(shí)現(xiàn)圖像的卷積 | 使用Python常用包實(shí)現(xiàn)給定圖像的卷積輸出 |
| ||
比較不同卷積核的效果 |
| ||||
將OpenCV和PIL讀取圖像的結(jié)果比較異同 |
| ||||
使用 TensorFlow/Keras 實(shí)現(xiàn)貓狗分類(lèi) | 了解TensorFlow的基本流程 |
| |||
學(xué)會(huì)使用Keras搭建卷積神經(jīng)網(wǎng)絡(luò) |
| ||||
比較padding、stride、卷積核大小對(duì)輸出圖像的影響 |
| ||||
掌握?qǐng)D像分類(lèi)的方法和步驟 |
| ||||
第 二 天 上 午 | 機(jī)器學(xué)習(xí)基礎(chǔ) 與多元回歸 | 線性回歸 | |||
Logistic/Softmax回歸 | |||||
廣義線性回歸 | |||||
L1/L2正則化 | |||||
Ridge與LASSO | |||||
Elastic Net | |||||
梯度下降算法:BGD與SGD | |||||
特征選擇與過(guò)擬合 | |||||
Softmax回歸的概念源頭 | |||||
最大熵模型 | |||||
K-L散度 | |||||
代碼 和案例實(shí)踐 | 鳶尾花數(shù)據(jù)集的分類(lèi) | ||||
股票數(shù)據(jù)的特征提取和應(yīng)用 | |||||
泰坦尼克號(hào)乘客缺失數(shù)據(jù)處理和存活率預(yù)測(cè) | |||||
環(huán)境檢測(cè)數(shù)據(jù)異常分析和預(yù)測(cè) | |||||
模糊數(shù)據(jù)查詢和數(shù)據(jù)校正方法 | |||||
PCA與鳶尾花數(shù)據(jù)分類(lèi) | |||||
二手車(chē)數(shù)據(jù)特征選擇與算法模型比較 | |||||
廣告投入與銷(xiāo)售額回歸分析 | |||||
第 二 天 下 午 : 實(shí) 踐 | 實(shí)現(xiàn)葡萄酒 三分類(lèi)數(shù)據(jù) 的邏輯回歸建模 與應(yīng)用 | 使用Pandas讀寫(xiě)文件csv等表格文件 | |||
實(shí)現(xiàn)scikit-learn的建??傔^(guò)程 | |||||
掌握scikit-learn中的常用函數(shù),并學(xué)會(huì)使用官網(wǎng)查閱幫助文檔 | |||||
混淆函數(shù)的使用和正確率、準(zhǔn)確率、召回率、F1-Measure等的度量 | |||||
基于人口特征 數(shù)據(jù)預(yù)測(cè)年收入 | 缺失值、異常值處理 | ||||
One-Hot編碼的應(yīng)用場(chǎng)景分析 | |||||
字符串特征的處理 | |||||
樣本不均衡問(wèn)題的初步理解和使用 | |||||
第 三 天 上 午 | 決策樹(shù)、 隨機(jī)森林、 SVM | 熵、聯(lián)合熵、條件熵、KL散度、互信息 |
| ||
最大似然估計(jì)與最大熵模型 |
| ||||
ID3、C4.5、CART詳解 |
| ||||
決策樹(shù)的正則化 |
| ||||
預(yù)剪枝和后剪枝 |
| ||||
Bagging |
| ||||
不平衡數(shù)據(jù)集的處理 |
| ||||
利用隨機(jī)森林做特征選擇 |
| ||||
使用隨機(jī)森林計(jì)算樣本相似度 |
| ||||
線性可分支持向量機(jī) |
| ||||
軟間隔 |
| ||||
損失函數(shù)的理解 |
| ||||
核函數(shù)的原理和選擇 |
| ||||
SMO算法 |
| ||||
支持向量回歸SVR |
| ||||
多分類(lèi)SVM |
| ||||
代碼 和案例實(shí)踐 | 隨機(jī)森林與特征選擇 |
| |||
決策樹(shù)應(yīng)用于回歸 |
| ||||
多標(biāo)記的決策樹(shù)回歸 |
| ||||
決策樹(shù)和隨機(jī)森林的可視化 |
| ||||
葡萄酒數(shù)據(jù)集的決策樹(shù)/隨機(jī)森林分類(lèi) |
| ||||
泰坦尼克乘客存活率估計(jì) |
| ||||
葡萄酒數(shù)據(jù)分類(lèi) |
| ||||
數(shù)字圖像的手寫(xiě)體識(shí)別 |
| ||||
MNIST手寫(xiě)體識(shí)別 |
| ||||
SVR用于時(shí)間序列曲線預(yù)測(cè) |
| ||||
SVM、Logistic回歸、隨機(jī)森林三者的橫向比較 |
| ||||
第 三 天 下 午 : 實(shí) 踐 | 路透社新聞 語(yǔ)聊的分類(lèi) | 文本數(shù)據(jù)的特征抽取方法 |
| ||
中英文分類(lèi)模型的區(qū)別和聯(lián)系 |
| ||||
分詞系統(tǒng)的使用和優(yōu)化 |
| ||||
機(jī)器學(xué)習(xí)分類(lèi)模型的綜合運(yùn)用 |
| ||||
圖像 像素聚類(lèi) 與調(diào)色板的應(yīng)用 | 矢量量化算法的實(shí)現(xiàn) |
| |||
圖像通道的綜合運(yùn)用 |
| ||||
自動(dòng)選擇聚類(lèi)個(gè)數(shù)與elbow-method |
| ||||
計(jì)算聚類(lèi)指標(biāo)并比較相互關(guān)系 |
|