亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Spark的知識點有哪些呢

發布時間:2021-12-17 14:01:35 來源:億速云 閱讀:125 作者:柒染 欄目:大數據

這篇文章給大家介紹Spark的知識點有哪些呢,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

  Spark是基于內存的迭代計算框架,適用于需要多次操作特定數據集的應用場合。需要反復操作的次數越多,所需讀取的數據量越大,受益越大,數據量小但是計算密集度較大的場合,受益就相對較小(大數據庫架構中這是是否考慮使用Spark的重要因素)。

  1、Spark的核心是什么?

  RDD是Spark的基本抽象,是對分布式內存的抽象使用,實現了以操作本地集合的方式來操作分布式數據集的抽象實現。RDD也是Spark非常核心的東西,它表示已被分區,不可變的并能夠被并行操作的數據集合,不同的數據集格式對應不同的RDD實現。

  RDD必須是可序列化的。RDD可以cache到內存中,每次對RDD數據集的操作之后的結果,都可以存放到內存中,下一個操作可以直接從內存中輸入,省去了MapReduce大量的磁盤IO操作。這對于迭代運算比較常見的機器學習算法, 交互式數據挖掘來說,效率提升比較大。

  2、Spark的適用場景有哪些?

  由于RDD的特性,Spark不適用那種異步細粒度更新狀態的應用,例如web服務的存儲或者是增量的web爬蟲和索引。就是對于那種增量修改的應用模型不適合。總的來說Spark的適用面比較廣泛且比較通用。

  3、Spark支持的編程語言有哪幾種?

  Spark通過與編程語言集成的方式暴露RDD的操作,類似于DryadLINQ和FlumeJava,每個數據集都表示為RDD對象,對數據集的操作就表示成對RDD對象的操作。Spark主要支持的編程語言是Scala、java、python。

  Scala

  Spark使用Scala開發,默認使用Scala作為編程語言。編寫Spark程序比編寫Hadoop MapReduce程序要簡單的多,SparK提供了Spark-Shell,可以在Spark-Shell測試程序。

  Java

  Spark支持Java編程,但對于使用Java就沒有了Spark-Shell這樣方便的工具,其它與Scala編程是一樣的,因為都是JVM上的語言,Scala與Java可以互操作,Java編程接口其實就是對Scala的封裝。

  Python

  現在Spark也提供了Python編程接口,Spark使用py4j來實現python與java的互操作,從而實現使用python編寫Spark程序。Spark也同樣提供了pyspark,一個Spark的python shell,可以以交互式的方式使用Python編寫Spark程序。

關于Spark的知識點有哪些呢就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

蓬莱市| 锦屏县| 房山区| 婺源县| 土默特右旗| 勐海县| 张家界市| 兴业县| 信阳市| 崇义县| 商丘市| 田林县| 贺兰县| 桐柏县| 金阳县| 柯坪县| 泰宁县| 轮台县| 和林格尔县| 六枝特区| 遂平县| 双江| 永嘉县| 福贡县| 兴国县| 平顶山市| 淅川县| 洛南县| 甘谷县| 盐边县| 永吉县| 西乌珠穆沁旗| 沂水县| 公主岭市| 津南区| 吉木乃县| 团风县| 双辽市| 遵义市| 荥阳市| 乃东县|