在Pig中加載數據可以通過使用LOAD
語句來實現。在Pig Latin腳本中,可以使用如下語法來加載數據:
data = LOAD 'input_data' USING PigStorage(',') AS (column1:datatype1, column2:datatype2, ...);
其中,input_data
是要加載的數據文件的路徑,PigStorage(',')
指定了數據文件的格式(這里假設數據文件是以逗號分隔的),column1:datatype1, column2:datatype2, ...
指定了數據文件中的列名和對應的數據類型。
例如,要加載一個名為data.txt
的數據文件,其中包含兩列,一列是字符串,一列是整數,可以使用如下語句:
data = LOAD 'data.txt' USING PigStorage(',') AS (name:chararray, age:int);
加載數據后,可以對數據進行各種操作,如過濾、轉換、分組等。