要处理大文件,linux系统的大文件处理命令将会派上用场,让你节省了不少时间,利用这5条神奇命令,你可以轻松处理大文件:
一、 split 命令:
split将文件分割为更小的部分,便于更有效地处理这些大文件。如,通过使用 split -b 20m /big.file 命令,大文件 /big.file 就会被划分为20MB一个的文件,每个子文件都以 xxx.aa,xxx.ab等命名:
$ split -b 20m /big.file
$ ls
big.file.aa big.file.ab big.file.ac big.file.ad
二、 cat 命令:
cat 命令不仅用于显示文件内容,也可将多个文件合并为一个。如,如果你早先使用 split 命令将 /big.file 文件划分成4个部分,可以用 cat 将它们重新组合成一个文件:
$ cat big.fileal big.file.ab big.file.ac big.file.af > /temp/combine.file
$ ls
combine.file
三、 head 和 tail 命令:
head 和 tail 命令用于查看文件的开头和尾部,有时会接受一个参数 -c ,从而指定要显示文件多少个字节:
$ head -c 100 file.dat
$ tail -c 100 file.dat
四、 cmp 命令:
cmp 是一个比较大文件的有用工具,它会将两个文件的第一个不同之处停下来并报告出错位置。 如果两个文件完全相同,则不显示任何信息:
$ cmp file1.dat file2.dat
file1.dat file2.dat differ: byte 7, line 2
五、 wc 命令:
wc 命令可以计算一个文件的行数、词数和字节数,因此可用来检查两个文件的大小是否相近:
$ wc file1.dat
8372 42464 596595 file1.dat