亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Spark有哪些優點

發布時間:2021-12-16 10:51:06 來源:億速云 閱讀:174 作者:iii 欄目:云計算

這篇文章主要介紹“Spark有哪些優點”,在日常操作中,相信很多人在Spark有哪些優點問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Spark有哪些優點”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

一、MapReduce已死,Spark稱霸 

由于Hadoop的MapReduce高延遲的死穴,導致Hadoop無力處理很多對時間有要求的場景,人們對其批評越來越多,Hadoop無力改變現在而導致正在死亡。正如任何領域一樣,死亡是一個過程,Hadoop正在示例這樣的一個過程,Hadoop的死亡過程在2012年已經開始

1,原先支持Hadoop的四大商業機構紛紛宣布支持Spark;

2,Mahout前一階段表示從現在起他們將不再接受任何形式的以MapReduce形式實現的算法,另外一方面,Mahout宣布新的算法基于Spark;

3,Cloudera的機器學習框架Oryx的執行引擎也將由Hadoop的MapReduce替換成Spark;

4,Google已經開始將負載從MapReduce轉移到Pregel和Dremel上;

5,FaceBook則將負載轉移到Presto上;

現在很多原來使用深度使用Hadoop的公司都在紛紛轉向Spark,國內的淘寶是典型的案例。在此,我們以使用世界上使用Hadoop最典型的公司Yahoo!為例,大家可以看一下其數據處理的架構圖:

Spark有哪些優點

而使用Spark后的架構如下:

Spark有哪些優點

大家可以看出,現階段的Yahoo!是使用Hadoop和Spark并存的架構,而隨著時間的推進和Spark本身流處理、圖技術、機器學習、NoSQL查詢的出色特性,最終Yahoo!可能會完成Spark全面取代Hadoop,而這也代表了所有做云計算大數據公司的趨勢。

或許有朋友會問,Hadoop為何不改進自己?

其實,Hadoop社區一直在改進Hadoop本身,但事實是無力回天:

1,Hadoop的改進基本停留在代碼層次,也就是修修補補的事情,這就導致了Hadoop現在具有深度的“技術債務”,負載累累;

2,Hadoop本身的計算模型決定了Hadoop上的所有工作都要轉化成Map、Shuffle和Reduce等核心階段,由于每次計算都要從磁盤讀或者寫數據,同時真個計算模型需要網絡傳輸,這就導致了越來越不能忍受的延遲性,同時在前一個任務運行完之前,任何一個任務都不可以運行,這直接導致了其無力支持交互式應用;

那么,為什么不全部重新寫一個更好的Hadoop呢?答案是Spark的出現使得沒有必要這樣做了。

Spark是繼Hadoop之后,成為替代Hadoop的下一代云計算大數據核心技術,目前SPARK已經構建了自己的整個大數據處理生態系統,如流處理、圖技術、機器學習、NoSQL查詢等方面都有自己的技術,并且是Apache頂級Project,可以預計的是2014年下半年到2015年在社區和商業應用上會有爆發式的增長。

國外一些大型互聯網公司已經部署了Spark。甚至連Hadoop的早期主要貢獻者Yahoo現在也在多個項目中部署使用Spark;國內的淘寶、優酷土豆、網易、Baidu、騰訊等已經使用Spark技術用于自己的商業生產系統中,國內外的應用開始越來越廣泛。Spark正在逐漸走向成熟,并在這個領域扮演更加重要的角色。

二、企業為什么需要Spark;

1,現在很多原來使用深度使用Hadoop的公司都在紛紛轉向Spark,國內的淘寶是典型的案例。在此,我們以使用世界上使用Hadoop最典型的公司Yahoo!為例,大家可以看一下其數據處理的架構圖:

Spark有哪些優點

而使用Spark后的架構如下:

Spark有哪些優點

大家可以看出,現階段的Yahoo!是使用Hadoop和Spark并存的架構,而隨著時間的推進和Spark本身流處理、圖技術、機器學習、NoSQL查詢的出色特性,最終Yahoo!可能會完成Spark全面取代Hadoop,而這也代表了所有做云計算大數據公司的趨勢。

2,Spark是可以革命Hadoop的目前唯一替代者,能夠做Hadoop做的一切事情,同時速度比Hadoop快了100倍以上:

Spark有哪些優點

Logistic regression in Hadoop and Spark

可以看出在Spark特別擅長的領域其速度比Hadoop快120倍以上!

,3,原先支持Hadoop的四大商業機構紛紛宣布支持Spark,包含知名Hadoop解決方案供應商Cloudera和知名的Hadoop供應商MapR;

4,Spark是繼Hadoop之后,成為替代Hadoop的下一代云計算大數據核心技術,目前SPARK已經構建了自己的整個大數據處理生態系統,如流處理、圖技術、機器學習、NoSQL查詢等方面都有自己的技術,并且是Apache頂級Project,可以預計的是2014年下半年到2015年在社區和商業應用上會有爆發式的增長。

5,國外一些大型互聯網公司已經部署了Spark。甚至連Hadoop的早期主要貢獻者Yahoo現在也在多個項目中部署使用Spark;國內的淘寶、優酷土豆、網易、Baidu、騰訊等已經使用Spark技術用于自己的商業生產系統中,國內外的應用開始越來越廣泛。Spark正在逐漸走向成熟,并在這個領域扮演更加重要的角色。

6,不得不提的是Spark的“One stack to rule them all”的特性,Spark的特點之一就是用一個技術堆棧解決云計算大數據中流處理、圖技術、機器學習、交互式查詢、誤差查詢等所有的問題

7,Mahout前一階段表示從現在起他們將不再接受任何形式的以MapReduce形式實現的算法,另外一方面,Mahout宣布新的算法基于Spark;

8,如果你已經使用了Hadoop,就更加需要Spark。Mahout前一階段表示從現在起他們將不再接受任何形式的以MapReduce形式實現的算法,另外一方面,Mahout宣布新的算法基于Spark,同時,這幾年來,Hadoop的改進基本停留在代碼層次,也就是修修補補的事情,這就導致了Hadoop現在具有深度的“技術債務”,負載累累;

8,,此時我們只需要一個技術團隊通過Spark就可以搞定一切問題,而如果基于Hadoop就需要分別構建實時流處理團隊、數據統計分析團隊、數據挖掘團隊等,而且這些團隊之間無論是代碼還是經驗都不可相互借鑒,會形成巨大的成本,而使用Spark就不存在這個問題;

9,百億美元市場,教授為之辭職,學生為止輟學,大勢所趨!

10,Life is short!

到此,關于“Spark有哪些優點”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

丹寨县| 南乐县| 江永县| 沽源县| 灯塔市| 蕲春县| 南充市| 合川市| 门头沟区| 新田县| 兰溪市| 库车县| 杂多县| 旌德县| 息烽县| 襄垣县| 仲巴县| 长白| 任丘市| 姜堰市| 东港市| 穆棱市| 桐柏县| 龙川县| 江西省| 枣强县| 观塘区| 蒙山县| 淅川县| 马公市| 平舆县| 明星| 定结县| 泗水县| 木里| 茌平县| 开远市| 安溪县| 固阳县| 新乡县| 维西|