文本处理命令有什么?

文本处理命令有:sort命令;uniq命令;tr命令;cut命令;split命令;eval命令;wc命令。sort命令用于将文本文件内容加以排序,可针对文本文件的内容以及不同的数据类型,以行为单位来排序。

1.sort命令

sort命令以行为单位对文件内容进行排序,也可以根据不同的数据类型来排序,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。语法格式:sort[选项]参数。

常用选项:

  • sort -n:按照数字大小进行排序;
  • sort -r:反向排序;
  • sort -u:等同于uniq,相同的数据仅显示一行;
  • sort -t:指定字段分隔符,默认使用[Tab]键分隔;
  • sort -k:指定排序字段;
  • sort -o:将结果转存到指定文件。

2.uniq命令

uniq命令以行为单位,进行行与行之间的字符串比较并进行去重;只能对有序的文本行进行有效去重,所以常与sort命令结合使用。语法格式:uniq[选项]参数。

常用选项:

  • uniq-c:统计重复出现的次数;
  • uniq-d:所有邻近的重复行只被打印一次。重复次数要>=2次;
  • uniq-D:所有邻近的重复行将全部打印;
  • uniq-f:跳过对前n个列的比较;
  • uniq-s:跳过对前n个字符的比较;
  • uniq-w:只对每行前n个字符进行比较。

3.tr命令

常用来对来自标准输入的字符进行替换、压缩和删除。语法格式:tr [选项] [参数]。

常用选项:

  • tr-c∶保留字符集1的字符,其他的字符(也包括换行符\n)用字符集2替换;
  • tr-d∶ 删除所有属于字符集1的字符;
  • tr-s∶ 将重复出现的字符串压缩为一个字符串,用字符集2替换字符集1;
  • tr-t∶ 字符集2替换字符集1,与不加选项-t结果相同。

4.cut命令

cut命令用于显示行中的指定部分,删除文件中指定字段。

(1)cut命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。

(2)如果不指定File参数,cut命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一。

常用选项:

  • cut-f∶通过指定哪一个字段进行提取。cut命令使用”TAB”作为默认的字段分隔符;
  • cut-d∶“TAB”是默认的分隔符,使用此选项可以更改为其他的分隔符;
  • cut–complement∶ 此选项用于排除所指定的字段;
  • cut–output-delimiter∶ 更改输出内容的分隔符;
  • cut-b:以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了-n标志。

5.split命令

Linux下将一个大的文件拆分成若干个小文件。语法格式:split 选项 参数 原始文件 拆分后文件名前缀。

常用选项:

  • split-l:以行数拆分;
  • split-b:以大小拆分。
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《文本处理命令有什么?》
文章链接:https://zhuji.vsping.com/4448.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。