亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

hive 文件系統學習實例

發布時間:2020-07-22 15:09:18 來源:網絡 閱讀:550 作者:reylee 欄目:大數據

Hive存儲是基于hadoop hdfs文件系統的,通過默認內嵌的Derby 數據庫或外部數據庫系統(如mysql)組織元數據訪問,下面就通過實際案例描述其存儲過程。

 

1, 在hive 中創建表,然后把外部csv文件導入其中(外部文件為Batting.csv, 內部表為temp_batting):

hive>create table temp_batting(col_value STRING);

hive> show tables;
OK
temp_batting
...

 

hive>LOAD DATAINPATH'hive/data/Batting.csv' OVERWRITE INTO TABLE temp_batting;

 

2, 查看外部mysql數據庫,可以看到新創建的temp_batting表:


mysql> use hive;
Reading table information for completion of table and column names
You can turn off this feature to get a quicker startup with -A

mysql> select * from TBLS;
+--------+-------------+-------+------------------+-------+-----------+-------+--------------+----------------+--------------------+--------------------+
| TBL_ID | CREATE_TIME | DB_ID | LAST_ACCESS_TIME | OWNER | RETENTION | SD_ID |TBL_NAME     | TBL_TYPE       | VIEW_EXPANDED_TEXT |VIEW_ORIGINAL_TEXT |
+--------+-------------+-------+------------------+-------+-----------+-------+--------------+----------------+--------------------+----------
|     66 |  1432707070 |     1 |               0 | root  |        0 |    66 | temp_batting | MANAGED_TABLE  |NULL               | NULL              |
|               |
+--------+-------------+-------+------------------+-------+-----------+-------+--------------+----------------+--------------------+----------

...

查看其在hdfs上存儲路徑:


mysql> select * from SDS;
+-------+-------+--------------------------------------------------+---------------+---------------------------+--------------------------------------------------------+-------------+------------------------------------------------------------+----------+
| SD_ID | CD_ID | INPUT_FORMAT                                    |IS_COMPRESSED | IS_STOREDASSUBDIRECTORIES | LOCATION                                             | NUM_BUCKETS |OUTPUT_FORMAT                                            | SERDE_ID |
+-------+-------+--------------------------------------------------+---------------+---------------------------+--------------------------------
|    66 |    71 | org.apache.hadoop.mapred.TextInputFormat        |              |                          |hdfs://localhost:9000/user/hive/warehouse/temp_batting |         -1 |org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat |      66 |

可以看到是:
hdfs://localhost:9000/user/hive/warehouse/temp_batting

 

3,到hadoop 的hdfs文件系統中查看這個表路徑:

[root@lr rli]# hadoop dfs -ls /user/hive/warehouse
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.
...

drwxr-xr-x   - root supergroup          02015-05-27 14:16 /user/hive/warehouse/temp_batting
...

[root@lr rli]# hadoop dfs -ls/user/hive/warehouse/temp_batting

DEPRECATED: Use of this script to execute hdfs command isdeprecated.
Instead use the hdfs command for it.


Found 1 items
-rwxr-xr-x   1 root supergroup    6398990 2015-05-2714:02 /user/hive/warehouse/temp_batting/Batting.csv

 

可以看到其文件大小及內容。

 

結論:

Hive通過關聯數據庫系統記錄文件的存儲路徑,屬性等,實際數據存在hdfs系統中,當通過select等操作生成相應的map/reduce進程進一步數據分析處理。


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

乡城县| 林州市| 长寿区| 肃宁县| 石狮市| 西吉县| 安康市| 枝江市| 天全县| 界首市| 类乌齐县| 察隅县| 田东县| 塔河县| 贵南县| 南城县| 类乌齐县| 嫩江县| 南岸区| 定襄县| 肥西县| 永寿县| 格尔木市| 盐山县| 彰武县| 繁昌县| 隆尧县| 集贤县| 平和县| 阿鲁科尔沁旗| 琼海市| 英山县| 平远县| 瑞丽市| 延长县| 泾阳县| 济宁市| 余干县| 道真| 新乡市| 宁晋县|