嵌入式爱好者

查看: 9825|回复: 1

Linux文本处理—awk gawk命令的使用

[复制链接]

0

主题

0

帖子

0

积分

扫一扫,手机访问本帖
发表于 2013-10-11 09:57:40 | 显示全部楼层 |阅读模式
    AWK 是一种文本处理和模式匹配语言,所以它通常称为数据驱动的语言,程序语句描述需要进行匹配和处理的输入数据,而不是程序操作步骤的序列,在许多语言中都是这样的。AWK 程序在其输入数据中搜索包含模式的记录、对该记录执行指定的操作,直到程序到达输入的末尾。AWK 程序擅长于处理数据库和表型数据,如从多个数据集中提取一些列、建立报表或分析数据。事实上,AWK 适合于编写短小的、一次性程序,以执行一些灵活的文本处理,而使用其他的语言则可能成本较高。另外,作为一种功能强大的工具,AWK常常在命令行中使用或与管道一起使用。

      GAWK 具有下列独特的特性和优点:
   1. 在所有主要的 UNIX 平台以及其他操作系统中都可以使用它,包括 Mac OS X 和 Microsoft® Windows®。
   2.它是可移植操作系统接口 (POSIX) 兼容的,并且包含 1992 POSIX 标准中的所有特性。
   3.它没有预定义的内存限制。
   4.可以使用一些新的内置函数和变量。
   5.它包含一些特殊的regexp 操作符。
   6.记录分隔符中可以包含 regexp 操作符。
   7.可以使用特殊文件支持来访问标准的 UNIX 流。
   8.可以使用 Lint 检查。
   9.在缺省情况下,它使用扩展的正则表达式。
   10.它支持无限制的行长度和连续使用反斜杠字符 (/)。
   11.它具有更好的、更具描述性的错误消息。
   12.它包含一些 TCP/IP 网络函数。
   
    GAWK 是 GNU Project 的 AWK 解释器的开放源代码实现。尽管早期的 GAWK 发行版是旧的 AWK 的替代程序,但不断地对其进行了更新,以包含 NAWK 的特性。
    GAWK的主要功能就是处理文本文件的数据,自动将变量分配给每行的每个数据元素实现这一功能。
    $0 表示整行
    $1 表示第一个数据字段
                 .
                 .
                 .
    $n 表示第n个数据字段

    gawk ‘{print $1}’ data
    如果正在读取使用其他分隔符的文本,则使用选项-F
    gawk  -F:‘{print $1}’ /etc/passwd
    从文件中读取程序:
    首先将处理的命令写入文本文件script
    {print $5 “’s user id is ”$1}
    然后使用命令gawk –F: –f script /etc/passwd
回复

使用道具 举报

追求女神 该用户已被删除
发表于 2013-10-11 15:09:33 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋| 飞凌嵌入式 ( 冀ICP备12004394号-1 )

GMT+8, 2024-11-23 05:17

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表