要在Java中讀取Hadoop文件,可以使用Hadoop的FileSystem API。以下是一種常見的方法:
Configuration conf = new Configuration();
conf.addResource(new Path("/path/to/hadoop/conf/core-site.xml"));
conf.addResource(new Path("/path/to/hadoop/conf/hdfs-site.xml"));
FileSystem fs = FileSystem.get(conf);
Path filePath = new Path("/path/to/hadoop/file");
FSDataInputStream in = fs.open(filePath);
BufferedReader reader = new BufferedReader(new InputStreamReader(in));
String line;
while ((line = reader.readLine()) != null) {
System.out.println(line);
}
注意:在讀取文件后,記得關閉輸入流和文件系統實例。
in.close();
fs.close();
以上就是在Java中讀取Hadoop文件的基本步驟。可以根據實際需求進行適當的修改和擴展。