您好,登錄后才能下訂單哦!
一直做的數據分析均是基于數據庫數據、日志進行分析,開發業務模型,日志深度監控系統。也一直想抓取到用戶的感知,幸好找大數據平臺的人要到了我們網站嵌碼采集的相關數據,準備對用戶行為從早期的access日志外,另一層面做下分析。
用到時間函數時存在很大于oracle不同,用from_unixtime(unix_timestamp(),'HH:mm')搞定時間,網上查詢頁面:http://blog.csdn.net/ningyuanhuo/article/details/21481307,后期在遇到在來細查時間函數。
其他函數想了下應該和sql類似,也查了下文檔,hive常用函數http://blackproof.iteye.com/blog/2108353,主要用到substr,length。
Hive的工作模式是提交一個任務,等到任務結束時被通知,而不是實時查詢。即使查了個很小的數也需要很久,用慣了數據庫,查這個多少有些不適應。不過和sql語法基本類似,學習成本較低。細節還是見文檔hive深入淺出http://blog.csdn.net/hguisu/article/details/18986759。
利用sqoop將hive/hdfs數據導入到oracle中
使用的是sqoop1,其次我們需要ojdbc6.jar 這個jar 包下載地址如下:
http://www.oracle.com/technetwork/database/enterprise-edition/jdbc-112010-090769.html
將解壓的包 復制到sqoop安裝目錄下的lib 目錄中
執行我們的導入命令即可
sqoop export --table FDC_JPLP --connect jdbc:oracle:thin:@localhost:port:test1 --username test --password test --export-dir /user/hive/warehouse/data_w.db/seq_fdc_jplp --columns goal_ocityid,goal_issueid,compete_issueid,ncompete_rank --input-fields-terminated-by '\001' --input-lines-terminated-by '\n'
注意要指定 --columns 參數 否則會報錯 找不到 columns
用法: --columns
查詢數據是否導入成功
sqoop eval --connect jdbc:oracle:thin:@localhost:port:test1 --query "select * from FDC_JPLP" --username fccsreport --password fccsoracle10g_report
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。