awk内置变量NR与FNR使用详解

变量
awk

awk内置变量NR与FNR

awk 命令中NR表示从awk开始执行后，按照记录分隔符读取的数据次数，默认的记录分隔符为换行符，因此默认的就是读取的数据行数，NR可以理解为Number of Record的缩写。

在awk处理多个输入文件的时候，在处理完第一个文件后，NR并不会从1开始，而是继续累加，因此就出现了FNR，每当处理一个新文件的时候，FNR就从1开始计数，FNR可以理解为File Number of Record。

下面看两个例子:

1,对于单个文件NR 和FNR 的输出结果一样的：

# awk '{print NR,$0}' file1 
1 a b c d
2 a b d c
3 a c b d
#awk '{print FNR,$0}' file1 
1 a b c d
2 a b d c
3 a c b d

2,但是对于多个文件：

# awk '{print NR,$0}' file1 file2
1 a b c d
2 a b d c
3 a c b d
4 aa bb cc dd
5 aa bb dd cc
6 aa cc bb dd
# awk '{print FNR,$0}' file1 file2
1 a b c d
2 a b d c
3 a c b d
1 aa bb cc dd
2 aa bb dd cc
3 aa cc bb dd

NR和FNR的典型应用场景

现在有两个文件格式如下：

#cat account.data
张三|1
李四|2
#cat course.data
1|语文
1|数学
2|英语
2|化学

想要得到的结果是将用户名，帐号和课程在同一行打印出来,如下:

张三|1|语文
张三|1|数学
李四|2|英语
李四|2|化学

执行如下代码

#awk -F \| 'NR==FNR{a[$2]=$0;next}{print a[$1]"|"$2}' account.data course.data

注释:

由NR=FNR为真时,判断当前读入的是第一个文件account.data,然后使用{a[$2]=$0;next}循环将account文件的每行记录都存入数组a,并使用$2第2个字段作为下标引用.

由NR=FNR为假时,判断当前读入了第二个文件course.data,然后跳过{a[$2]=$0;next},对第二个文件cdr的每一行都无条件执行{print a[$1]"|"$2},此时变量$1为第二个文件的第一个字段,与读入第一个文件时,采用第一个文件第二个字段$2为数组下标相同.因此可以在此使用a[$1]引用数组。

awk常用命令

1、打印文件的第一列(域) ： awk '{print $1}' filename

2、打印文件的前两列(域) ： awk '{print $1,$2}' filename

3、打印完第一列，然后打印第二列： awk '{print $1 $2}' filename

4、打印文本文件的总行数： awk 'END{print NR}' filename

5、打印文本第一行：awk 'NR==1{print}' filename

上一篇：Linux sed 命令字符串替换使用方法详解
下一篇：删除大量文件Argument list too long错误解决

PythonTab微信公众号:

Python技术交流互助群 ( 请勿加多个群 ):

群1: 87464755

群2: 333646237

群3: 318130924

群4: 385100854

awk内置变量NR与FNR使用详解