主講老師: 林海(深圳)(培訓費:3-3.5萬元/天)
工作背景:
高端前沿技術培訓/業(yè)務創(chuàng)新咨詢師TOGAF9Level2鑒定師國際數(shù)據(jù)管理(DAMA)協(xié)會會員全球企業(yè)架構師協(xié)會(AEA)會員中國企業(yè)數(shù)據(jù)治理聯(lián)盟會員Hiblock區(qū)塊鏈社區(qū)專職講...
主講課程:
1.區(qū)塊鏈培訓:《區(qū)塊鏈技術沙盤推演和商業(yè)模式重構》2.大數(shù)據(jù)培訓:《大數(shù)據(jù)思維演變和商業(yè)模式創(chuàng)新》3.企業(yè)架構培訓:《企業(yè)架構方法(TOGAF9)和信息化頂層設計》4.財務共...

進入大數(shù)據(jù)的真實世界-數(shù)據(jù)挖掘入門和應用課程大綱詳細內容
課程分類: 大數(shù)據(jù)
課程目標:
課程對象:
課程時間:1天
第一單元思維轉變:從報表統(tǒng)計思維進入數(shù)據(jù)分析思維
一、入門:數(shù)據(jù)是對“事實”的觀測
二、轉變:數(shù)據(jù)思維意味著什么
1、主動找數(shù)據(jù)變?yōu)楸粍油扑]
2、抽樣數(shù)據(jù)變?yōu)槿瘮?shù)據(jù)
3、要求精確變?yōu)闅g迎復雜
4、事后分析變?yōu)閷崟r監(jiān)控
5、專家分析變?yōu)闄C器學習
6、由流程為核心變?yōu)橐詳?shù)據(jù)為核心
7、由客戶分類變?yōu)閭€性化服務
8、由人與人連接變?yōu)槿伺c機器連接
第二單元認知重構:進入模型和算法統(tǒng)治的世界
一、數(shù)據(jù)分析三大核心模型
1、分類:真與假;好與壞;高、中、低。不會分類,就不會思考
2、預測:輸入變量,求得結果。代表了掌握規(guī)律的能力,生活是可預知的
3、相關性:模糊、近似、有關,是一種簡便的、粗略的全盤操控能力
二、五大初級算法
1、相關性分析:最入門、最常用、最剛需的分析方法
2、散點圖分析:最被忽略的探索性分析方法
3、概覽性分析:教科書上都不重視的全局總覽的分析方法
4、回歸分析:最容易理解的由x推導出y的方程式分析法
5、聚類分析:最粗暴的物以類聚人以群分的分析方法
三、六大中級算法
1、降維分析:數(shù)據(jù)太多,抓住主要數(shù)據(jù)的方法
2、決策樹分析:最容易理解的決策分析
3、關聯(lián)規(guī)則分析:貌似沒有規(guī)模,卻可以尋找一個規(guī)律
4、相似性分析:當前最熱門的分析方法,如:人臉識別、指紋識別
5、可視化分析:河流圖、風向圖、熱力圖等各種別具一格的數(shù)據(jù)呈現(xiàn)方式
6、文本分析:從大量的文字中快速提取關鍵信息
四、兩大大數(shù)據(jù)高級算法
1、神經網(wǎng)絡算法:最牛逼的模擬大腦的算法,如埃爾法狗圍棋
2、支持向量機算法:實用性和準確性較強的一個機器學習算法
第三單元操作實戰(zhàn):從代碼中觀測到的“真實”世界
一、學會用數(shù)據(jù)分析創(chuàng)新性的解決問題
1、What:問題是什么
2、Judgement:能用數(shù)據(jù)分析解決嗎
3、Prerequisite:具備數(shù)據(jù)基礎嗎
4、ModelSelect:選擇哪個模型
5、Visualization:怎么呈現(xiàn)結果
6、Design:設計流程,形成文檔
二、學會用代碼去測試和逼近真相
1、數(shù)據(jù)獲?。▽霐?shù)據(jù)、爬取數(shù)據(jù))
2、數(shù)據(jù)探索分析、概覽分析
3、明確分析目的
4、選擇x和y
5、對格式進行轉換
6、選擇模型(模型選擇準則)
7、使用交叉驗證規(guī)則,切分數(shù)據(jù)
8、用模型進行訓練
9、分析模型預測結果
10、確定最優(yōu)模型
11、使用和預測
12、報告和呈現(xiàn)