首页 > Linux教程 > 正文

awk内置变量NR与FNR使用详解

awk内置变量NR与FNR

awk 命令中NR表示从awk开始执行后,按照记录分隔符读取的数据次数,默认的记录分隔符为换行符,因此默认的就是读取的数据行数,NR可以理解为Number of Record的缩写。

在awk处理多个输入文件的时候,在处理完第一个文件后,NR并不会从1开始,而是继续累加,因此就出现了FNR,每当处理一个新文件的时候,FNR就从1开始计数,FNR可以理解为File Number of Record。


下面看两个例子:


1,对于单个文件NR 和FNR 的 输出结果一样的 :

# awk '{print NR,$0}' file1 
1 a b c d
2 a b d c
3 a c b d
#awk '{print FNR,$0}' file1 
1 a b c d
2 a b d c
3 a c b d


2,但是对于多个文件 :

# awk '{print NR,$0}' file1 file2
1 a b c d
2 a b d c
3 a c b d
4 aa bb cc dd
5 aa bb dd cc
6 aa cc bb dd
# awk '{print FNR,$0}' file1 file2
1 a b c d
2 a b d c
3 a c b d
1 aa bb cc dd
2 aa bb dd cc
3 aa cc bb dd


NR和FNR的典型应用场景

现在有两个文件格式如下:

#cat account.data
张三|1
李四|2
#cat course.data
1|语文
1|数学
2|英语
2|化学


想要得到的结果是将用户名,帐号和课程在同一行打印出来,如下:

张三|1|语文
张三|1|数学
李四|2|英语
李四|2|化学


执行如下代码

#awk -F \| 'NR==FNR{a[$2]=$0;next}{print a[$1]"|"$2}' account.data course.data


注释:


由NR=FNR为真时,判断当前读入的是第一个文件account.data,然后使用{a[$2]=$0;next}循环将account文件的每行记录都存入数组a,并使用$2第2个字段作为下标引用.


由NR=FNR为假时,判断当前读入了第二个文件course.data,然后跳过{a[$2]=$0;next},对第二个文件cdr的每一行都无条件执行{print a[$1]"|"$2},此时变量$1为第二个文件的第一个字段,与读入第一个文件时,采用第一个文件第二个字段$2为数组下标相同.因此可以在此使用a[$1]引用数组。


awk常用命令

1、打印文件的第一列(域) : awk '{print $1}' filename

2、打印文件的前两列(域) : awk '{print $1,$2}' filename

3、打印完第一列,然后打印第二列 : awk '{print $1 $2}' filename

4、打印文本文件的总行数 : awk 'END{print NR}' filename

5、打印文本第一行 :awk 'NR==1{print}' filename


上一篇:Linux sed 命令字符串替换使用方法详解
下一篇:删除大量文件Argument list too long错误解决

PythonTab微信公众号:

Python技术交流互助群 ( 请勿加多个群 ):

群1: 87464755

群2: 333646237

群3: 318130924

群4: 385100854