wiki/运维/操作系统/Linux/笔记/11.文本分析.md

##### 1、wc（文本数据统计）
-l：只统计行数
-w：只统计单词数

##### 2、sort（文本排序，仅输出到STDOUT）
-R：随机排序
-n：按数字大小整理
-h：按人类可读排序
-u：合并重复项

##### 3、uniq（文本去重）
-c：显示每行重复次数
-d：仅显示重复的行
-u：仅显示不重复的行
范例：统计日志访问量最多的请求
```shell
cut -d" " access_log | sort | uniq -c | sort -nr | head -3
```

##### 4、cut（按列抽取文本）
-d：指定分隔符
-c：按字符分隔
-f：取第几列，1-6或1，3，5