HDFS上的小文件问题产生原因及后果
产生原因:
后果:
几种文件合并的代码记录
抽象类:
1 | import org.apache.hadoop.fs.FileStatus; |
合并 parquet 文件
1 | import org.apache.hadoop.fs.Path; |
合并 textfile 小文件
1 | import org.apache.hadoop.fs.FSDataInputStream; |
合并 ORC 文件
1 | 待定 |
铁马冰河入梦来
1 | import org.apache.hadoop.fs.FileStatus; |
1 | import org.apache.hadoop.fs.Path; |
1 | import org.apache.hadoop.fs.FSDataInputStream; |
1 | 待定 |