主講老師: 林海(深圳)(培訓(xùn)費:3-3.5萬元/天)
工作背景:
高端前沿技術(shù)培訓(xùn)/業(yè)務(wù)創(chuàng)新咨詢師TOGAF9Level2鑒定師國際數(shù)據(jù)管理(DAMA)協(xié)會會員全球企業(yè)架構(gòu)師協(xié)會(AEA)會員中國企業(yè)數(shù)據(jù)治理聯(lián)盟會員Hiblock區(qū)塊鏈社區(qū)專職講...
主講課程:
1.區(qū)塊鏈培訓(xùn):《區(qū)塊鏈技術(shù)沙盤推演和商業(yè)模式重構(gòu)》2.大數(shù)據(jù)培訓(xùn):《大數(shù)據(jù)思維演變和商業(yè)模式創(chuàng)新》3.企業(yè)架構(gòu)培訓(xùn):《企業(yè)架構(gòu)方法(TOGAF9)和信息化頂層設(shè)計》4.財務(wù)共...

進入大數(shù)據(jù)的真實世界-數(shù)據(jù)挖掘入門和應(yīng)用課程大綱詳細內(nèi)容
課程分類: 大數(shù)據(jù)
課程目標:
課程對象:
課程時間:1天
第一單元思維轉(zhuǎn)變:從報表統(tǒng)計思維進入數(shù)據(jù)分析思維
一、入門:數(shù)據(jù)是對“事實”的觀測
二、轉(zhuǎn)變:數(shù)據(jù)思維意味著什么
1、主動找數(shù)據(jù)變?yōu)楸粍油扑]
2、抽樣數(shù)據(jù)變?yōu)槿瘮?shù)據(jù)
3、要求精確變?yōu)闅g迎復(fù)雜
4、事后分析變?yōu)閷崟r監(jiān)控
5、專家分析變?yōu)闄C器學(xué)習(xí)
6、由流程為核心變?yōu)橐詳?shù)據(jù)為核心
7、由客戶分類變?yōu)閭€性化服務(wù)
8、由人與人連接變?yōu)槿伺c機器連接
第二單元認知重構(gòu):進入模型和算法統(tǒng)治的世界
一、數(shù)據(jù)分析三大核心模型
1、分類:真與假;好與壞;高、中、低。不會分類,就不會思考
2、預(yù)測:輸入變量,求得結(jié)果。代表了掌握規(guī)律的能力,生活是可預(yù)知的
3、相關(guān)性:模糊、近似、有關(guān),是一種簡便的、粗略的全盤操控能力
二、五大初級算法
1、相關(guān)性分析:最入門、最常用、最剛需的分析方法
2、散點圖分析:最被忽略的探索性分析方法
3、概覽性分析:教科書上都不重視的全局總覽的分析方法
4、回歸分析:最容易理解的由x推導(dǎo)出y的方程式分析法
5、聚類分析:最粗暴的物以類聚人以群分的分析方法
三、六大中級算法
1、降維分析:數(shù)據(jù)太多,抓住主要數(shù)據(jù)的方法
2、決策樹分析:最容易理解的決策分析
3、關(guān)聯(lián)規(guī)則分析:貌似沒有規(guī)模,卻可以尋找一個規(guī)律
4、相似性分析:當(dāng)前最熱門的分析方法,如:人臉識別、指紋識別
5、可視化分析:河流圖、風(fēng)向圖、熱力圖等各種別具一格的數(shù)據(jù)呈現(xiàn)方式
6、文本分析:從大量的文字中快速提取關(guān)鍵信息
四、兩大大數(shù)據(jù)高級算法
1、神經(jīng)網(wǎng)絡(luò)算法:最牛逼的模擬大腦的算法,如埃爾法狗圍棋
2、支持向量機算法:實用性和準確性較強的一個機器學(xué)習(xí)算法
第三單元操作實戰(zhàn):從代碼中觀測到的“真實”世界
一、學(xué)會用數(shù)據(jù)分析創(chuàng)新性的解決問題
1、What:問題是什么
2、Judgement:能用數(shù)據(jù)分析解決嗎
3、Prerequisite:具備數(shù)據(jù)基礎(chǔ)嗎
4、ModelSelect:選擇哪個模型
5、Visualization:怎么呈現(xiàn)結(jié)果
6、Design:設(shè)計流程,形成文檔
二、學(xué)會用代碼去測試和逼近真相
1、數(shù)據(jù)獲取(導(dǎo)入數(shù)據(jù)、爬取數(shù)據(jù))
2、數(shù)據(jù)探索分析、概覽分析
3、明確分析目的
4、選擇x和y
5、對格式進行轉(zhuǎn)換
6、選擇模型(模型選擇準則)
7、使用交叉驗證規(guī)則,切分數(shù)據(jù)
8、用模型進行訓(xùn)練
9、分析模型預(yù)測結(jié)果
10、確定最優(yōu)模型
11、使用和預(yù)測
12、報告和呈現(xiàn)