色婷婷av一区二区_国产一区二区三区四区在线观看 _中文字幕一区二区在线观看_亚洲综合激情另类小说区

您的位置:首頁 >錢幣收藏 > 人民幣 >

LenovoxDorisDB:簡化數據處理鏈路,極大提升BI分析效率

2022-07-28 11:40:53 來源:

  

(原標題:Lenovo x DorisDB:簡化數據處理鏈路,極大提升BI分析效率)

   Lenovo聯晟智達隸屬于全球PC領導廠商聯想集團,致力于打造科技驅動、柔性敏捷、服務體驗一流的智慧物流生態平臺,面向產業端企業提供綜合物流解決方案,成為服務于中國及全球客戶的智能供應鏈科技企業。聯晟智達大數據團隊逐步引入了多種OLAP分析引擎來更好的滿足需求。DorisDB從眾多的OLAP分析引擎中脫穎而出,它采用了全面向量化的計算技術,是性能非常強悍的新一代MPP數據庫。通過引入DorisDB,構建了全新的統一數據服務平臺,大大降低了數據鏈路開發復雜性,極大提升了BI分析效率。

   “作者:韓文博聯想銷售物流大數據平臺負責人,專注于數倉建設、數據分析等領域研究。”

   一、OLAP引擎在Lenovo聯晟智達的演進史

   第一階段

   在2018年之前,聯晟智達的數據總量還不是特別大,這個階段使用的是傳統關系型數據庫(SQL Server),數據倉庫體系還尚未建立,很多數據需求的實現都是以SQL腳本的開發方式來滿足。

   但隨著業務復雜度不斷提升,以及數據量的快速增長,這種模式很快遇到了瓶頸。最主要體現在查詢響應時效變得越來越慢。例如:之前運行一個任務需要10分鐘或20分鐘,現在需要一個小時或更長時間,查詢效率嚴重下降。另外數據存儲容量也存在瓶頸,無法滿足隨業務而快速增長的數據量存儲需求。

   第二階段

   2019年隨著數據倉庫在Hadoop/Hive體系上搭建和完善,ETL任務全部轉移至Hadoop集群,這個階段使用數十臺Presto完成OLAP分析。Presto天然和Hive共享元數據信息,且共同使用物理數據存儲,大量的對數倉表的靈活查詢使用Presto完成。前端BI層面使用Tableau直接連接Presto,實現數據分析與挖掘。

   第三階段

   2021年聯晟大數據團隊進行了離線數倉的整體設計和搭建,既需要做低延時的BI報表,又要滿足Adhoc復雜查詢,同時對高效明細查詢也有很高的要求。這個階段我們根據場景引入了OLAP圈炙手可熱的DorisDB產品,它既能做Presto的Adhoc多表關聯查詢及復雜嵌套子查詢,又能提供比ClickHouse更好的單表明細查詢和多維物化視圖上卷加速,滿足極速BI分析需求。

   二、數據分析體系架構

   1。OLAP體系現狀

   整個數據分析體系,由數據采集、數據存儲與計算、數據查詢與分析和數據應用組成。

   原始架構圖:

  

src=https://nimg.ws.126.net/?url=https%3A%2F%2Fcrawl.ws.126.net%2Fnbot2%2Fimg%2F4300bf05e24f2ce843392ced3c7d55d0.jpg&thumbnail=660x2147483647&quality=80&type=jpg

   數據采集

   1)通過Sqoop讀取RDBMS導入Hive。

   2)用Flume來同步日志文件到Hive。

   3)通過爬蟲技術將網上數據爬取下來,存儲到RDBMS,再由Sqoop讀取RDBMS,導入到Hive。

   數據存儲與計算

   離線數據處理:利用Hive高可擴展的批處理能力承擔所有的離線數倉的ETL和數據模型加工的工作。

   數據查詢與分析

   數據共享層主要提供對外服務的底層數據存儲和查詢共享界面。離線ETL后的數據寫入RDBMS或MPP數據庫中,面向下游多種服務,為Tableau BI、多維固定報表、Adhoc即席查詢等不同場景提供OLAP查詢分析能力。應用側完美服務于BI報表平臺、即席查詢分析平臺及數據可視化平臺(Control Tower)

   數據應用層

   數據應用層主要為面向管理和運營人員的報表,查詢要求低時延響應,需求也是迭代層出不窮。面向數據分析師的即席查詢,更是要求OLAP引擎能支持復雜SQL處理、從海量數據中快速遴選數據的能力。

   三、各OLAP分析工具選型比較

   1。ClickHouse

   優點

   1)很強的單表查詢性能,適合基于大寬表的OLAP多維分析查詢。

   2)包含豐富的MergeTree Family,支持預聚合。

   3)非常適合大規模日志明細數據寫入分析。

   缺點

   1)不支持真正的刪除與更新。

   2)Join方式不是很友好。

   3)并發能力比較低。

   4)MergeTree合并不完全。

   2。DorisDB

   優點

   1)單表查詢和多表查詢性能都很強,可以同時較好支持寬表查詢場景和復雜多表查詢。

   2)支持高并發查詢。

   3)支持實時數據微批ETL處理。

   4)流式和批量數據寫入都能都比較強。

   5)兼容MySQL協議和標準SQL。

   缺點

   1)大規模ETL能力不足。

   2)資源隔離還不完善。

   四、DorisDB在SEC數據中心的應用實踐

   渠道倉配管理(SEC)的核心數據來自兩大塊:一個是消費業務;第二個是SMB中小企業務(Think、揚天)。基于這些數據,根據不同的業務場景需求,匯總出相關業務統計指標,對外提供查詢分析服務。

   1。原有解決方案

   在引入DorisDB之前,用到大量Hive任務進行業務邏輯清洗加工,清洗加工后的數據部分保留在Hive,部分數據寫入MySQL/SQL Server,以達到數據的落地。前端BI通過Presto計算引擎連接Hive、MysSQL、SQL Server等,實現報表分析及數據可視化。

   2。技術痛點

   原有架構主要有以下兩個問題:

   1)數據邏輯沒有很好做歸攏合并,維護工作量大,新需求無法快速響應。

   2)Presto的在SQL較多的Tableau復雜報表上響應較慢,不能滿足業務即時看數需求。

   因此我們希望對原有體系進行優化,核心思路是利用一個OLAP引擎進行這一層的統一,對OLAP引擎的要求是比較高的:

   1)能支撐大吞吐量的數據寫入要求。

   2)可以支持多維度組合的靈活查詢,響應時效在100ms以下。

   3)比較好的支持多表關聯。

   4)單表查詢數據量在10億以上,響應時效在100ms以下。

   經過大量調研,DorisDB比較契合數據中心的整體要求。DorisDB本身高效的查詢能力,可以為數據中心數據報告提供一體化服務。新架構具備以下優點:

   1)結構清晰,RDBMS專注于數據的清洗,業務邏輯計算從Hive遷到DorisDB內實現,DorisDB就是數據業務邏輯的終點。

   2)可以維護統一的數據口徑,一份數據輸入,多個APP接口輸出。

   3)MPP分布式架構,得以更好的支持分布式聚合和關聯查詢。

   4)和Tableau有較好的兼容性,可以滿足核心BI分析需求。

   3。基于DorisDB的解決方案

   升級后架構圖:

  

src=https://nimg.ws.126.net/?url=https%3A%2F%2Fcrawl.ws.126.net%2Fnbot2%2Fimg%2F9ff083e63341ac99d01e750022c547c0.jpg&thumbnail=660x2147483647&quality=80&type=jpg

   數據表設計

   1)數據模型設計

   DorisDB本身提供三種數據模型:明細模型/聚合模型/更新模型。對SEC業務來說,目前以明細模型為主,后續如果有其他場景,再考慮應用其他模型。

   2)數據分區/分桶

   DorisDB提供的數據分區和分桶功能,可以很好的提升歷史庫存及周轉場景下明細查詢的性能。例如,歷史庫存查詢常見的一種查詢場景,是查詢過去某一時間段內的庫存周轉情況,我們可以在DorisDB中根據出庫時間進行分區,過濾掉不必要的分區數據,減少整個查詢的數據量進行快速定位,盡量減少了查詢語句所覆蓋的數據范圍,分區、分桶、前綴索引等能力,可以大大提高點查并發能力。這些特性對業務迎接增長,面對未來可能出現的高并發場景也具有非常大的意義。查詢某一個物料條碼(SN)的歷史軌跡數據,能夠快速的檢索出該條碼的所有歷史出入庫軌跡信息,幫助我們高效的完成供應鏈全生命周期回溯。

   物化視圖

   我們利用DorisDB物化視圖能夠實時、按需構建,靈活增加刪除以及透明化使用的特性,建立了基于庫存物料SN粒度、基于產品類型特征粒度、基于庫房粒度、基于分銷商粒度的物化視圖。基于這些物化視圖,可以極大加速查詢。

   數據導入

   數據導入DorisDB這里用到了兩種方案:

   1)在DorisDB提供的Broker Load基礎上將離線數倉Hive的表導入到DorisDB中。

   2)通過DataX工具,將SQL Server、MySQL上的數據導入到DorisDB。

   4。DorisDB使用效果

   靈活建模提升開發效率

   結合使用寬表模型和星型模型,寬表和物化視圖可以保證報表性能和并發能力,而星型模型可以讓AP如TP里那樣建模,直接進行關聯查詢,不必所有場景都依賴寬表準備,在數據一致性和開發效率上得到很好提升。另外,有不少表是在MySQL里的,我們通過DorisDB外表的方式暴露查詢,省去了數據導入的過程,大大降低了業務方的開發和遷移周期。DorisDB的分布式Join能力非常強,結合View的能力構建統一的視圖層,面下不同BI報表進行查詢,提升了指標口徑的一致性,降低了重復開發。

   BI體驗極好

   前期部分BI可視化是基于SQL Server、MySQL構建的。部分看板不斷優化和豐富需求后,加上多維度靈活條件篩選,每次加載很慢,有些Tableau報表很長時間才能加載出來,業務無法接受。引入DorisDB之后,我們用DataX將SQL Server數據導入DorisDB,這里使用了DorisDB-Writer插件,底層封裝的Stream-Load接口,向量化導入效率非常高。MySQL可以通過外表insert into select流式導入,也可以直接外表查詢,非常便捷。Tableau圖表秒出,體驗有了質的飛躍。

   運維成本較低

   數據中心是非常核心的一個線上服務,因此對高可用及靈活擴容能力有非常高的要求。DorisDB支持數據多副本,FE、BE僅僅2種角色組成的簡潔架構,在單個節點故障的時候可以保證整個集群的高可用。另外,DorisDB在大數據規模下可以進行在線彈性擴展,在擴容時無Down Time,不會影響到在線業務,這個能力也是我們非常需要的。

   總結

   Lenovo聯晟智達從今年(2021年)4月份開始調研DorisDB,POC測試階段用了1/4的資源,就完美替代了數十個節點的Presto集群,當前DorisDB已經上線穩定運行。引入DorisDB后,實現了數據服務統一化,大大簡化了離線數據處理鏈路,同時也能保障查詢時延要求,之后將用來提升更多業務場景的數據服務和查詢能力。最后,感謝鼎石科技的大力支持,也期望DorisDB作為性能強悍的新一代MPP數據庫引領者越來越好!

相關閱讀
熱門新聞
LenovoxDorisDB:簡化數據處理鏈路,極大提升BI分析效率

LenovoxDorisDB:簡化數據處理鏈路,極大提升BI分析效率

  (原標題:Lenovo x DorisDB:簡化數據處理鏈路,極大提升BI分析效率)   Lenovo聯晟智達隸屬于全球PC領導廠商聯想集團,致力于打造

2022-07-28 11:40
技術創新迎數據未來,紫晶存儲亮相2020數據與存儲峰會

技術創新迎數據未來,紫晶存儲亮相2020數據與存儲峰會

  (原標題:技術創新迎數據未來,紫晶存儲亮相2020數據與存儲峰會)  2020年11月18-19日,2020數據與存儲峰會以新數智·新未來為主題,在

2022-07-28 06:30
“數據中臺+隱私計算”助力數據協作增效

“數據中臺+隱私計算”助力數據協作增效

  (原標題:數據中臺+隱私計算 助力數據協作增效)  隨著數字經濟時代的來臨,數據價值在商業發展過程中愈發重要,各企業均擁有寶貴

2022-07-28 04:17
NAS上架鐵威馬-應用中心!

NAS上架鐵威馬-應用中心!

  (原標題:NAS迅雷上架鐵威馬-應用中心!)   經過一個多月的內測,NAS迅雷正式上架鐵威馬應用中心!     NAS迅雷支持哪些功能?

2022-07-28 00:05
GOOVIS航拍千里眼面市助推航拍行業發展新高度

GOOVIS航拍千里眼面市助推航拍行業發展新高度

  (原標題:GOOVIS航拍千里眼面市 助推航拍行業發展新高度)   本月,國內領先的AR VR近眼顯示技術公司納德光學發布了GOOVIS系列首款專

2022-07-26 18:18
愛奇藝與星巴克中國聯名會員權益卡正式上線??愛奇藝VIP會員可享星巴克產品買贈、滿減、免運費等優惠

愛奇藝與星巴克中國聯名會員權益卡正式上線??愛奇藝VIP會員可

  (原標題:愛奇藝與星巴克中國聯名會員權益卡正式上線愛奇藝VIP會員可享星巴克產品買贈、滿減、免運費等優惠)  11月2日,愛奇藝與星巴

2022-07-26 17:19
主站蜘蛛池模板: 俄罗斯精品一区二区| 日韩色av导航| 国产亚洲精品网站| 日韩久久久久久久久久久久| 99久久精品免费看国产四区| 久久久久久久少妇| 欧美日韩一区在线观看视频| 日韩欧美不卡在线| 日本不卡久久| 日本精品中文字幕| 欧美亚洲国产免费| 欧美大片欧美激情性色a∨久久| 日韩精品视频在线观看视频 | 国产成人精品久久| 国产在线98福利播放视频| 久久久精品在线视频| 精品国产免费人成电影在线观... 精品国产一区二区三区久久久狼 精品国产一区二区三区久久狼黑人 | 欧美中文字幕视频| 久久亚洲欧美日韩精品专区| 欧美亚洲另类在线| 久久久91精品| 国产乱子伦精品视频| 懂色av一区二区三区四区五区| 久久精品久久精品国产大片| 精品无码一区二区三区爱欲| 国产精品视频二| av免费观看国产| 午夜久久资源| 久久网站免费视频| 国产欧美在线播放| 91精品国产自产91精品| 日韩一区免费观看| 免费中文日韩| 国产美女精品久久久v| 国产精品 欧美在线| 午夜免费电影一区在线观看| 日本久久中文字幕| 国产欧美日韩中文| 色综合天天综合网国产成人网| 美女视频久久| 国产精品激情自拍|