在RHadoop中使用rhdfs包進行HDFS操作需要先安裝rhdfs包。可以使用以下命令安裝rhdfs包:
install.packages("rhdfs", repos = c("http://archive.linux.duke.edu/cran"))
安裝完成后,可以按照以下步驟進行HDFS操作:
library(rhdfs)
hdfs.init()
hdfs.ls(path)
:列出HDFS指定路徑下的文件和文件夾hdfs.mkdir(path)
:創建HDFS中的文件夾hdfs.put(local_path, hdfs_path)
:將本地文件上傳到HDFShdfs.get(hdfs_path, local_path)
:將HDFS中的文件下載到本地hdfs.rm(path)
:刪除HDFS中的文件或文件夾例如,上傳本地文件到HDFS的示例代碼如下:
hdfs.put("local_file.txt", "/hdfs_folder/local_file.txt")
這樣就可以利用rhdfs包進行基本的HDFS操作了。