課程介紹
本課程基于ClickHouse最新穩定版本進行講解,著重講解ClickHouse大數據技術理論與實戰。課程全面包含ClickHouse核心理論、分布式集群部署、架構設計、數據實時查詢、MergeTree表引擎底層設計、副本與分片讀寫原理、外部系統集成開發以及ClickHouse全流程大數據項目實戰等內容,讓大家從基礎到實戰快速掌握ClickHouse大數據分析技術。
課程特色
1.3分理論、7分實戰
2.立足ClickHouse,圍繞ClickHouse生態進行講解
3.弱化ppt,強調實戰操作
4.注重課程的連貫性,與實際項目相結合
適用人群
1.對大數據感興趣的學員
2.對OLAP、BI感興趣的學員
3.想提升ClickHouse實戰經驗的學員
4.想系統學習ClickHouse實時分析技術的學員
技術版本
1.ClickHouse20.2
2.Centos7
3.Zookeeper3.5.6
講師介紹
-
楊俊
大講臺大數據高級講師 | 原某廣電數據咨詢公司大數據高級架構師
原某廣電數據咨詢公司大數據高級架構師 資深Java玩家,大數據技術狂熱者。曾在北京某廣電數據咨詢公司擔任大數據高級架構師,7年以上大數據實操經驗, 經歷過10個以上的重量級大數據項目。Hadoop源碼級技術大咖,熟練使用Hadoop、Spark、Flink、Hive、HBase、Flume、Kafka、ElasticSearch等各大主流組件。謙虛親和,崇尚實操至上的教學理念。受到學員一致好評。
免費視頻這么多,為什么還要來大講臺?
智能化
學習任務智能推送
混合式
“圖文+視頻”混合式課件
答疑快
30分鐘問答響應
實戰多
3分理論7分實戰
包學會
賬號長期有效學會為止
課程大綱
ClickHouse概述 |
01大數據核心術語-OLTP 02大數據核心術語-數據倉庫 03大數據核心術語-BI 04大數據核心術語-OLAP 05大數據核心術語-立方體 06ClickHouse介紹及特點 07ClickHouse前世今生 08ClickHouse應用場景 09誰在使用ClickHouse 10ClickHouse與其他技術高性能對比 |
ClickHouse單節點安裝部署 |
11ClickHouse系統規劃 12Linux系統環境要求 13ClickHouse多種安裝方式 14ClickHouse下載安裝文件 15Linux關閉防火墻 16Linux設置FQDN 17ClickHouse解壓安裝 18CLickHouse核心目錄講解 19ClickHouse額外配置文件講解 20ClickHouse修改配置文件 21ClickHouse服務啟動與關閉 22ClickHouse訪問測試 23點擊和訪問數據下載 24ClickHouse創建數據庫與表 25ClickHouse海量數據導入與優化 26ClickHouse數據實時查詢 |
ClickHouse架構設計 |
27ClickHouse核心特性-MPP架構 28ClickHouse核心特性-完備的DBMS功能 29ClickHouse核心特性-列式存儲 30ClickHouse核心特性-向量化執行引擎 31ClickHouse核心特性-支持SQL查詢 32ClickHouse核心特性-支持多種表引擎 33ClickHouse核心特性-支持多線程和分布式 34CClickHouse核心特性-多主架構優勢 35ClickHouse核心特性-支持實時查詢 36ClickHouse核心特性-支持分布式查詢 37ClickHouse架構設計與原理 38ClickHouse高性能秘訣-硬件才是硬道理 39ClickHouse高性能秘訣-算法是重中之重 40ClickHouse高性能秘訣-具體問題具體分析 |
ClickHouse數據分析查詢實操 |
41ClickHouse創建數據庫 42ClickHouse創建數據表 43數據下載與導入 44ClickHouse分析查詢受歡迎城市 45ClickHouse分析查詢愛旅行的城市 46ClickHouse分析查詢到達目的地最多的出發城市 47ClickHouse分析查詢周內各天航班延誤率 48ClickHouse分析查詢每年航班延誤率 49ClickHouse分析查詢各家航空公司航班延誤率 50ClickHouse分析查詢停止航班運營的航空公司 |
MergeTree底層原理分析 |
51MergeTree表引擎語法結構 52MergeTree數據物理存儲結構 53MergeTree分區規則與命名規則 54MergeTree分區目錄合并詳細過程 55MergeTree稀松索引及生成規則 56MergeTree一級索引查詢過程 57MergeTree二級索引 58MergeTree按列存儲 59MergeTree壓縮數據塊 60MergeTree數據標記生成規則 61MergeTree數據標記工作方式 62MergeTree一級索引VS數據標記VS壓縮數據塊 63MergeTree數據寫入過程 64MergeTree數據查詢過程 |
多節點Linux系統與網絡配置(補充) |
65-1VMware虛擬機安裝 65-2Linux系統介紹 65-3Linux系統安裝1 65-4Linux系統安裝2 65-5Linux網絡配置 65-6配置靜態IP 65-7x-shell工具使用 65-8FileZilla工具使用 65-9修改Linux主機名 65-10配置主機名與IP映射 65-11關閉Linux防火墻 65-12創建用戶和用戶組 65-13配置ssh免密登錄 65-14克隆并配置Linux虛擬機 65-15配置集群hosts 65-16部署時鐘同步服務器 65-17集群ssh免密登錄配置 65-18集群部署腳本使用 |
ClickHouse分布式集群安裝部署 |
65ClickHouse集群依賴Zookeeper通信原理 66-1Zookeeper安裝前規劃(補充) 66-2JDK安裝配置(補充) 66-3Zookeeper分布式集群構建(補充) 66ClickHouse集群節點實例準備 67ClickHouse集群文件配置 68ClickHouse集群服務啟動 69ClickHouse訪問Zookeeper |
ClickHouse副本與分片使用及讀寫原理 |
70ClickHouse副本與分片的邏輯和物理關系 71ClickHouse副本同步原理及實操 72分布式DDL實操及執行流程分析 73分布式表引擎實操 74分布式表引擎分片寫入流程分析 75通過Distributed復制數據原理及實操 76通過ReplicatedMergeTree復制數據原理及實操 77分布式查詢原理及實操 |
ClickHouse與Kafka集成開發 |
78-1Kafka概述 78-2系統架構 78-3Kafka拓撲結構 78-4Kafka集群配置 78-5Kafka集群服務啟動與測試 78-6Kafka 新api數據發送與消費 78-7Kafka舊api數據發送與消費 78kafka表引擎介紹 79Kafka架構原理 80ClickHouse讀Kafka數據流程 81ClickHouse寫Kafka數據流程 82ClickHouse讀Kafka案例實現 83ClickHouse寫Kafka案例實現 |
ClickHouse與MySQL集成開發 |
84MySQL表引擎介紹 85MySQL安裝與啟動1 86MySQL安裝與啟動2 87ClickHouse讀MySQL案例實現 |
Spark與ClickHouse集成開發 |
88-1Spark概述 88-2Spark Streaming概述 88-3Spark Streaming運行原理 88-4Spark Streaming 編程套路 88引入Spark和ClickHouse相關依賴 89Kafka+Spark+ClickHouse集成開發1 90Kafka+Spark+ClickHouse集成開發2 91ClickHouse集群啟動及表創建 92Spark Streaming消費Kafka寫入ClickHouse |