CGFT知識點解析：什么是批處理計算？

編輯：融躍教育 2021-12-20 09:06:59

批處理計算是CGFT所包含的內容，那么，具體的什么是批處理計算？下文是對它的詳細介紹，一起隨融躍小編了解一下！

批處理計算主要解決針對大規(guī)模數(shù)據的批量處理，也是我們日常數(shù)據分析工作中常見的一類數(shù)據處理需求。

MapReduce是具有代表性和影響力的大數(shù)據批處理技術，可以并行執(zhí)行大規(guī)模數(shù)據處理任務，用于大規(guī)模數(shù)據集（大于1TB）的并行運算。

MapReduce方便了分布式編程工作，它將復雜的、運行于大規(guī)模集群上的并行計算過程高度的抽象到了兩個函數(shù)--Map和Reduce，編程人員在不會分布式并行編程的情況下，也可以很容易將自己的程序運行在分布式系統(tǒng)上，完成海量數(shù)據集的計算。

Spark是一個針對超大數(shù)據集合的低延遲的集群分布式計算系統(tǒng)，比MapReduce快很多。Spark啟用了內存分布數(shù)據集，除了能夠提供交互式查詢外，還可以優(yōu)化迭代式工作負載。

在MapReduce中，數(shù)據流從一個穩(wěn)定的來源，進行一系列加工處理后，流出到一個穩(wěn)定的文件系統(tǒng)（如HDFS）。而對于spark而言，則使用內存替代HDFS或本地磁盤來存儲中間結果，因此，spark要比MapReduce的速度快許多。

聲明：本文章為學習相關信息展示文章，非課程及服務內容文章，產品及服務詳情可咨詢網站客服微信。文章轉載須注明來源，文章素材來源于網絡，若侵權請與我們聯(lián)系，我們將及時處理。

CGFT知識點解析：什么是批處理計算？