HDFS上的小文件问题产生原因及后果
产生原因:
后果:
几种文件合并的代码记录
抽象类:
| 1 | import org.apache.hadoop.fs.FileStatus; | 
合并 parquet 文件
| 1 | import org.apache.hadoop.fs.Path; | 
合并 textfile 小文件
| 1 | import org.apache.hadoop.fs.FSDataInputStream; | 
合并 ORC 文件
| 1 | 待定 | 
铁马冰河入梦来
| 1 | import org.apache.hadoop.fs.FileStatus; | 
| 1 | import org.apache.hadoop.fs.Path; | 
| 1 | import org.apache.hadoop.fs.FSDataInputStream; | 
| 1 | 待定 |