亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

spark寫orc格式文件

發布時間:2020-07-24 12:11:01 來源:網絡 閱讀:8216 作者:xiaobin0303 欄目:大數據
  1. 在hive中建表格式存儲格式為orc

      create table user(id int,name string) stored as orc;  

  2. spark寫文件        

    val jsons = "hdfs://localhost:9000/test/artist_orc.json"
    val people = sc.textFile(jsons)
    val schemaString = "id name"
    val schema = StructType(schemaString.split(" ").map(fieldName => {if(fieldName == "name")
      StructField(fieldName, StringType, true) else StructField(fieldName, IntegerType, true)}))

    val rowRDD = people.map(line=>{
      JSONObject.fromObject(line)
    }).map(p => Row(new Integer(p.get("id").toString), p.get("name")))

    val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)
    val peopleSchemaRDD = hiveContext.createDataFrame(rowRDD, schema)
    peopleSchemaRDD.write.format("orc").save("hdfs://localhost:9000/user/xb/warehouse/artist_orc/adf")


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

乐东| 阳高县| 同心县| 宁波市| 永安市| 佛学| 祁阳县| 绥芬河市| 松桃| 英德市| 莱州市| 绿春县| 治县。| 巨野县| 嘉禾县| 辰溪县| 喜德县| 绥宁县| 巩义市| 洪湖市| 荆门市| 象山县| 隆化县| 安远县| 山东省| 鹰潭市| 如皋市| 霍山县| 临汾市| 新竹市| 宜黄县| 临泉县| 镇安县| 洛宁县| 福海县| 社旗县| 吴忠市| 当阳市| 巫山县| 卢湾区| 安龙县|