亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

第15課:RDD創建內幕徹底解密

發布時間:2020-06-27 20:21:15 來源:網絡 閱讀:423 作者:Spark_2016 欄目:大數據

本節課主要內容:

    1、RDD創建的幾種方式

    2、RDD創建實戰

    3、RDD內幕


RDD創建有很多種方式,以下幾種創建RDD的方式:

     1、使用程序中的集合創建RDD,實際意義用于測試用;

     2、使用本地文件系統創建RDD,測試大量數據的文件;

     3、使用HDFS創建RDD,最常用的方式;

     4、基于DB創建RDD;

     5、基于NoSQL創建RDD,例如HBase;

     6、基于S3創建RDD;

     7、基于數據源創建RDD;


RDD實戰:

//通過集合方式創建RDD

val conf = new SparkConf().setAppName("RDDDemo").setMaster("local")
val sc = new SparkContext(conf)
//創建RDD
val rdd = sc.parallelize(0 to 100)
//1+2=3 3+3 = 6 6+4 = 10 ....
val sum = rdd.reduce(_ + _)
println(sum)


//通過HDFS上文件創建RDD

val conf = new SparkConf().setAppName("RDDDemo").setMaster("local")
val sc = new SparkContext(conf)
//創建RDD
val 
lines = sc.textFile("hdfs://Master:9000/data/README.md")
val words = lines.flatMap(line => line.split(" ")).map(line => (line, 1))
val wordCount = words.reduceByKey(_ + _)
wordCount.collect().foreach(println)


備注:

資料來源于:DT_大數據夢工廠

更多私密內容,請關注微信公眾號:DT_Spark

如果您對大數據Spark感興趣,可以免費聽由王家林老師每天晚上2000開設的Spark永久免費公開課,地址YY房間號:68917580

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

信丰县| 阿坝| 噶尔县| 清镇市| 托克逊县| 晴隆县| 咸丰县| 宜章县| 乾安县| 涞水县| 日照市| 广河县| 东辽县| 平度市| 北京市| 峡江县| 新郑市| 内江市| 敦煌市| 西贡区| 博湖县| 吉木萨尔县| 中牟县| 金门县| 连云港市| 威海市| 松江区| 梁山县| 龙游县| 本溪市| 武清区| 榆林市| 海口市| 菏泽市| 旌德县| 和顺县| 平谷区| 满城县| 江西省| 宣化县| 林芝县|