亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Spark 數據導入時的類型檢測相關問題

發布時間:2020-08-04 19:57:26 來源:網絡 閱讀:801 作者:去買大白兔 欄目:大數據

Spark 可以讀取文本,csv和rmdb中的數據,并且帶有類型自動檢測功能


public final static String DATA_SEPARATOR_TAB = "\t";

session.read().format("csv").option("delimiter", Constants.DATA_SEPARATOR_TAB).option("inferSchema", "true").option("header", "true").option("encoding", charset).csv(path).toDF(columnNames).write().mode(mode).saveAsTable(tempTable);


紅色屬性決定spark是否自動探測數據類型,如果不開啟自動探測,默認都是string

rdbms導入到spark中默認會類型探測和對應,但是在處理sqlserver的時間類型有問題

Spark 數據導入時的類型檢測相關問題



如上圖所示

只有datetime可以被spark識別并存儲為日期類型,其他的都落地成了String類型,所以在執行data_formate時因為要多做一步轉換所以性能會差很多




向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

聂拉木县| 平度市| 长兴县| 阳东县| 深水埗区| 洪雅县| 陆良县| 孟津县| 大同市| 麻阳| 明水县| 丹棱县| 乌兰浩特市| 山阴县| 宣恩县| 察哈| 根河市| 长寿区| 科技| 通化市| 武胜县| 清新县| 聂荣县| 新源县| 青铜峡市| 翼城县| 东辽县| 平乡县| 富锦市| 莱阳市| 固安县| 五峰| 昌乐县| 钟山县| 达拉特旗| 扎囊县| 南靖县| 银川市| 嘉荫县| 精河县| 大庆市|