2008年7月20日星期日

文件与目录操作

用户的资料和程序大多以文件的形式保存。用户使用Linux系统的过程中,需要经常对文件和目录进行操作。本节讲述了文件与目录的基本概念、有关文件和目录操作的命令以及如何在Linux环境下运行DOS命令。

  文件与目录的基本概念

  在多数操作系统中都有文件的概念。文件是Linux用来存储信息的基本结构,它是被命名(称为文件名)的存储在某种媒介(如磁盘、光盘和磁带等)上的一组信息的集合。Linux文件均为无结构的字符流形式。文件名是文件的标识,它由字母、数位、下划线和圆点组成的字串构成。用户 应该选择有意义的文件名。Linux要求文件名的长度限制在255个字符以内。

  为了便于管理和识别,用户可以把扩展名作为文件名的一部分。圆点用于区分文件名和扩展名。扩展名对于将文件分类是十分有用的。用户可能对某些大众已接纳的标准扩展名比较熟悉,例如,C语言编写的源代码文件总是具有C的扩展名。用户可以根据自己的需要,随意加入自己的副文件名。

  以下例子都是有效的Linux文件名。

  preface

  chapter1.txt

  xu.c

  xu.bak

  1.文件的类型

  Linux系统中有3种基本的文件类型:普通文件、目录文件和设备文件。

  普通文件是用户最经常面对的文件,它又分为文本文件和二进制文件。

  (1)文本文件:这类文件以文本的ASCII码形式存储在电脑中。它是以“行”为基本结构的一种信息组织和存储方式。

  (2)二进制文件:这类文件以文本的二进制形式存储在电脑中,用户一般不能直接读懂它们,只有通过相应的软件才能将其显示出来。二进制文件一般是可执行程序、图形、图像、声音等。

  设计目录文件的主要目的是用于管理和组织系统中的大量文件。它存储一组相关文件的位置、大小等与文件有关的信息。目录文件往往简称为目录。

  设备文件是Linux系统很重要的一个特色。Linux系统把每一个I/O设备都看成一个文件,并与普通文件一样处理,这样可以使文件与设备的操作尽可能统一。从用户的角度来看,对I/O设备的使用和一般文件的使用一样,不必了解I/O设备的细节。设备文件可以细分为块设备文件和字符设备文件。前者的存取是以一个个字符块为单位的,后者则是以单个字符为单位的。
2.树型目录结构

  在电脑系统中存有大量的文件,如何有效地组织与管理它们,并为用户提供一个使用方便的接口是文件系统的一大任务。Linux系统以文件目录的方式来组织和管理系统中的所有文件。所谓文件目录就是将所有文件的说明信息采用树型结构组织起来,即我们常说的目录。也就是说,整个文件系统有一个“根”(root),然后在根上分“杈”(directory),任何一个分杈上都可以再分杈,杈上也可以长出“叶子”。“根”和“杈”在Linux中被称为是“目录”或“文件夹”。而“叶子”则是一个个的文件。实践证明,此种结构的文件系统效率比较高。

  如前所述,目录也是一种类型的文件。Linux系统通过目录将系统中所有的文件分级、分层组织在一起,形成了Linux文件系统的树型层次结构。以根目录为起点,所有其他的目录都由根目录派生而来。一个典型的Linux系统的树型目录结构如图10-1所示。用户可以浏览整个系统,也可以进入任何一个已授权进入的目录,访问那里的文件。


图10-1 目录树结构

  上图中,我们只给出了目录节点名称,而没有给出各个目录之下的每一个文件。实际上,各个目录节点之下都会有一些文件和子目录。并且,系统在创建每一个目录时,都会自动为它设置两个目录文件,一个是“.”,代表该目录自己,另一个是“..”,代表该目录的父目录。对于根目录,“.”和“..”都代表其自己。

  Linux目录提供了一个管理文件的方便途径。每个目录里面都包含文件。用户可以为自己的文件创建自己的目录,也可以把一个目录下的文件移动或复制到另一目录下,而且能移动整个目录,并且可以和系统中的其他用户共用目录和文件。也就是说。我们能够方便地从一个目录切换到另一个目录,而且可以设置目录和文件的管理许可权,以便允许或拒绝其他人对其进行访问。同时文件目录结构的相互关联性使分享资料变得十分容易,几个用户可以访问同一个文件。因此允许用户设置文件的共享程度。

  需要说明的是,根目录是Linux系统中的特殊目录。Linux是一个多用户系统,操作系统本身的驻留程序存放在以根目录开始的专用目录中,有时被指定为系统目录。在图10-1中那些根目录下的目录就是系统目录。

3.工作目录、用户主目录与路径

  如前所述,目录是Linux系统组织文件的一种特殊文件。为使用户更好地使用目录,我们介绍有关目录的一些基本概念。

  (1)工作目录与用户主目录

  从逻辑上讲,用户在登录到Linux系统中之后,每时每刻都处在某个目录之中,此目录被称做工作目录或当前目录(Working Directory)。工作目录是可以随时改变的。用户初始登录到系统中时,其主目录(Home Directory)就成为其工作目录。工作目录用“.”表示,其父目录用“..”表示。

  用户主目录是系统管理员增加用户时创建起来的(以后也可以改变),每个用户都有自己的主目录,不同用户的主目录一般互不相同。

  用户刚登录到系统中时,其工作目录便是该用户主目录,通常与用户的登录名相同。

  用户可以通过一个~字符来引用自己的主目录。

  例如命令

  /home/WANG$ cat ~/class/software_1

  和下面的命令

  /home/WANG$ cat /home/WANG/class/software_1

  意义相同。Shell将用用户主目录名来替换~字符。目录层次创建好之后,用户就可以把有关的文件放到相应的目录中,从而实现对文件的组织。

  (2)路径

  顾名思义,路径是指从树型目录中的某个目录层次到某个文件的一条道路。此路径的主要构成是目录名称,中间用“/”分开。任一个文件在文件系统中的位置都是由相应的路径决定的。

  用户在对文件进行访问时,要给出文件所在的路径。 路径又分相对路径和绝对路径。 绝对路径是指从“根”开始的路径,也称为完全路径;相对路径是从用户工作目录开始的路径。

  应该注意到,在树型目录结构中到某个确定文件的绝对路径和相对路径均只有一条。绝对路径是确定不变的,而相对路径则随着用户工作目录的变化而不断变化。这一点对于我们以后使用某些命令如cp和tar等大有好处。

  用户要访问一个文件时,可以通过路径名来引用,并且可以根据要访问的文件与用户工作目录的相对位置来引用它,而不需要列出这个文件的完整路径名。例如,用户WANG有一个名为class的目录,该目录中有两个文件:software_1和hardware_1。若用户WANG想显示出其class目录中的名为software_1的文件,可以使用下列命令:

  /home/WANG$ cat /home/WANG/class/software_1

  用户也可以根据文件software_1与当前工作目录的相对位置来引用该文件。这时命令为:

  /home/WANG$ cat class/software_1

文件和目录操作相关命令

  1.显示文件内容命令

  用户需要查看一个文件的内容时,可以根据显示要求的不同选用以下的命令。

  (1)cat命令

  功能1:在标准输出上显示文件。

  语法:cat [ - 选项 ]文件

  说明:该命令功能之一是用来显示文件。它依次读取其后所指文件的内容并将其输出到标准输出。

  cat命令中各个选项的含义为:

  - v 用一种特殊形式显示控制字符,LFD与TAB除外。加了- v选项后,- T和- E选项将起作用。其中:

  - T 将TAB显示为 ^I,该选项需要与- v选项一起使用,即如果没有使用- v选项,则这个选项将被忽略。

  - E 在每行的末尾显示一个$符,该选项需要与- v选项一起使用。

  - u 输出不经过缓冲区。

  - A 等于- vET。

  - t 等于- vT。

  - e 等于- vE。

  功能2:连接两个或多个文件。

  说明:该命令功能之二是用来将两个或多个文件连接起来。

  $ cat file1 file2 > file3

  这样就把文件filel和文件file2的内容合并起来,放入文件file3中。(此时在屏幕上并不能直接看到该命令执行后的结果。若想看到连接后的文件内容,可以再使用cat file3。)

  需要说明的是,当文件内容过多时,就带来一个问题,因为文本在屏幕上迅速地闪过,用户来不及看清其内容。因此,当文件内容较大时,一般可用more命令分屏显示,以免因屏幕滚动太快而无法看清。

  (2)more命令

  功能:在终端屏幕按屏显示文字文件。

  语法:more [ - 选项 ]文件

  说明:该命令一次显示一屏文本,显示满之后,停下来,并在终端底部显示出- - More- - ,系统还将同时显示出已显示文本占全部文本的百分比。若要继续显示,按输入或空白键即可。

  more命令中各个选项的含义为:

  - p 显示下一屏之前先清屏。

  - c 作用同- p基本一样。

  - d 在每屏的底部显示更友好的提示信息:

  - - More- - (XX%)[Press space to contiune , ‘q’ to quit . ]

  而且若用户输入了~个错误命令,则显示出错信息,而不是简单地鸣响。

  - l 不处理< Ctrl+l >(换页符)。如果没有给出这个选项,则more命令在显示了一个包含有< Ctrl+l >字符的行后将暂停显示,并等待接收命令。

  - s 文件中连续的空白行压缩成一个空白行显示。

2.执行中的命令

  在more命令的执行过程中,用户可以使用more自己的一系列命令动态地根据需要来选择显示的部分。more在显示完一屏内容之后,将停下来等待用户输入某个命令。下面列出了more命令在执行中用到的一些常用命令,而有关这些命令的完整内容,可以在more执行时按h查看。这些命令的执行方法是先输入i(行数)的值,再输入所要的命令,不然它会以默认值来执行命令。

  i空格 若指定i,显示下面的i行;否则,显示下一整屏。

  i输入键 若指定i,显示下面的i行;否则,显示下一行。

  iÙ D 按【Ctrl+D】,若指定i,显示下面的i行;否则,往下显示半屏(一般为11行)。

  id 同iÙ D 。

  iz 同“i空格”类似,只是i将成为以下每个满屏的默认行数。

  is 跳过下面的i行再显示一个整屏,默认值为1。

  if 跳过下面的i屏再显示一个整屏,默认值为1。

  iÙ B 按【Ctrl+B】,往回跳过(即向文件首回跳)i屏,再显示一个满屏,默认值为1。

  b 与iÙ B相同。

  ’ 回到上次搜索的地方

  q或Q 退出more。

  = 显示当前行号。

  v 在当前行启动/usr/bin/vi对之进行编辑修改。

  h 显示各命令的帮助信息。

  i/pattern 查找匹配该模式的第i行,默认值为1。

  in 查找符合运算式的倒数i行,默认值为1。

  !或! 在子Shell中执行命令。

  i:n 在命令行中指定了多个文件名的情况下,可用此命令使之显示第i个文件,若i过大(出界),则显示文件名列表中的最后一个文件。

  i:p 在命令行中指定了多个文件名的情况下,可用此命令使之显示倒数第i个文件。若i过大(出界),则显示第一个文件。

  i:f 显示当前文件的文件名和行数。

  · 重复上次键入的命令。

  例10-10:用分页的方式显示一个文件的内容。

  $ more example1.c

  /*-------------------------------------------*/

  /* example1.c */

  /*-------------------------------------------*/

  /* author f opus.BBS@BBS.cs.nthu.edu.tw */

  /* target f BBS main/login/top-menu routines */

  /* create f 99/10/23 */

  /* update f 99/12/15 */

  /*-------------------------------------------*/

  #define _MAIN_C_

  #inc1ude < BBS. h >

  jmp_buf byebye;

  int talkrequest=NA;

  static uschar Enter_uflag i

  #ifdef SHOW_IDLE_TIME

  --More- (3%)

3.less命令

  less命令的功能几乎和more命令一样,也是用来按页显示文件,不同之处在于,less命令在显示文件时允许用户既可以向前又可以向后翻阅文件。

  less命令的使用与more命令类似,在此就不赘述了,用户如有不清楚的地方可直接查看帮助。

  用less命令显示文件时,若需要在文件中往前移动,按【b】键;要移动到用文件的百分比表示的某位置,则指定一个0~100之间的数,并按【p】键即可。

  例如,需要按页显示test文件:

  $ less test

4.head命令

  如果用户希望查看一个文件究竟保存的是什么内容,可以只查看文件的头几行,而不必浏览整个文件。用head命令只显示文件或标准输入的头几行。

  语法:head [- n ] 文件

  功能:显示指定文件的前n行。

  说明:该命令显示每个指定文件的前面n行。如果没有给出n值,默认为10。如果没有指定文件,head就从标准输入读取。

  例如,显示文件example.c的前3行:

  $ head - 3 example.c

  /*-------------------------------------------*/

  /* example1.c */

  /*-------------------------------------------*/

5.tail命令

  同样,如果用户想查看文件的尾部,可以使用tail命令。

  语法:tail [+ / - num ] [参数] 文件

  说明:该命令显示一个文件的指定内容。它把指定文件的指定显示范围内的内容显示在标准输出上。如果没有给定文件名,则使用标准输入文件。

  tail命令中各个选项的含义为:

  +num 从第num行以后开始显示。

  - num 从距文件尾num行处开始显示。如果省略num参数,系统默认值为10。

  l 以文本行为num的计数单位。与参数选项+num或- num选项同时使用时,num表示要显示的文本行行数。

  c 以字节为num的计数单位。与参数选项+num或- num选项同时使用时,num表示要显示的字符数。

  L, c选项可以省略,系统默认值为l,即按行计数。
6 . od命令

  用户通常使用od命令查看特殊格式的文件内容。通过指定该命令的不同选项可以以十进制、八进制、十六进制和ASCII码来显示文件。

  语法:od [选项] 文件

  命令中各选项的含义:

  - A 指定地址基数,包括:

  d(十进制);o(八进制,系统默认值);x(十六进制)。

  n 不显示位移值。

  - t 指定资料的显示格式,主要的参数有:

  c ASCII字符或反斜杠序列;

  d 有符号十进制数字;

  f 浮点数;

  o 八进制(系统默认值为02);

  u 无符号十进位数字;

  x 十六进位数;

  除了选项c以外的其他选项后面都可以跟一个十进制数字n,指定每个显示值所包含的字节数。

  说明:od命令系统默认的显示方式是八进制,这也是该命令的名称由来(Octal Dump)。但这不是最有用的显示方式,用ASCII码和十六进制组合的方式能提供更有价值的信息输出。
7.grep、fgrep和egrep命令

  这组命令以指定模式搜索文件,并通知用户在什么文件中搜索到与指定的模式匹配的字串,并显示出所有包含该字串的文本行,在该文本行的最前面是该行所在的文件名。grep命令一次只能搜索一个指定的模式;egrep命令检索扩展的正则运算式(包括运算式组和可选项);fgrep命令检索固定字串,它不识别正则运算式,是快速搜索命令。

  这组命令在搜索与定位文件中特定的主题方面非常有用。要搜索的模式可以被认为是一些关键字,您可以用它们来搜索文件中包含的这些关键字。编写程序时,可以用它来寻找某一个函数或相关的片段。grep命令的搜索功能比fgrep强大,因为grep命令的搜索模式可以是正则运算式,而fgrep却不能。

  该组命令中的每一个命令都有一组选项,利用这些选项可以改变其输出方式。例如,可以在搜索到的文本行上加入行号;只输出文本行的行号;输出所有与搜索模式不匹配的文本行;只简单地输出已搜索到指定模式的文件名,并且可以指定在查找模式时忽略大小写。

  这组命令在指定的输入文件中查找与模式匹配的行。如果没有指定文件,则从标准输入中读取。正常情况下,每个匹配的行被显示到标准输出。如果要查找的文件是多个,则在每一行输出之前加上文件名。

  语法:

  grep [选项] [查找模式] [文件名1, 文件名2, …]

  egrep [选项] [查找模式] [文件名1, 文件名2, …]

  fgrep [选项] [查找模式] [文件名1, 文件名2, …]

  这组命令各选项的含义为:

  - E 每个模式作为一个扩展的正则运算式对待。

  - F 每个模式作为一组固定字串对待(以新行分隔),而不作为正则运算式。

  - b 在输出的每一行前显示包含匹配字串的行在文件中的字节偏移量。

  - c 只显示匹配行的数量。

  - i 比较时不区分大小写。

  - h 在查找多个文件时,指示grep不要将文件名加入到输出之前。

  - l 显示首次匹配串所在的文件名并用换行符将其隔开。当在某文件中多次出现匹配串时,不重复显示此文件名。

  - n 在输出前加上匹配串所在行的行号(文件首行行号为1)。

  - v 只显示不包含匹配串的行。

  - x 只显示整行严格匹配的行。

  - e expression 指定检索使用的模式。用于防止以“-”开头的模式被解释为命令选项。

  - f expfile 从expfile文件中获取要搜索的模式,一个模式占一行。

  对该组命令的使用还需注意以下方面:

  在命令后键入搜索的模式,再键入要搜索的文件。其中,文件名列表中也可以使用特殊字符,如“*”等,用来生成文件名列表。如果想在搜索的模式中包含有空格的字串,可以用单引号把要搜索的模式括起来,用来表明搜索的模式是由包含空格的字串组成。否则,Shell将把空格认为是命令行参数的定界符,而grep命令将把搜索模式中的单词解释为文件名列表中的一部分。

  在下面的例子中,grep命令在文件example中搜索模式“text file”。

  $ grep ’text file’ example

  用户可以在命令行上用Shell特殊字符生成将要搜索的文件名列表。

  在下面的例子中,特殊字符“*”用来生成一个文件名列表,该列表包含当前目录下所有的文件。该命令将搜索出当前目录下所有文件中与模式匹配的行。

  $ grep data *

  特殊字符在搜索一组指定的文件时非常有用。例如,如果想搜索所有的C程序原始文件中特定的模式,您可以用“*.c”来指定文件名列表。假设用户的 C程序中包含一些不必要的转向语句(goto语句),那么可以用如下的命令来搜索并显示所有包含goto语句的代码行:

  $ grep goto *.c

  用户可以在命令行上键入搜索模式,也可以使用-f选项从指定文件中读取要搜索的模式。在文件中,每个搜索模式占一行。如果经常要搜索一组常见字串时,这个功能非常有用。在下面的例子中,用户如要在文件exam中搜索字串editor和create,就把要搜索的模式放置在文件mypats中,然后,grep命令从文件mypats中读取要搜索的模式。

  $ cat mypats

  editor

  create

  $ grep -f mypats exam

8.find命令

  功能:在目录结构中搜索文件并执行指定的操作。此命令提供了相当多的查找条件,功能很强大。

  语法:find 起始目录 寻找条件 操作

  说明:find命令从指定的起始目录开始,递归搜索其各个子目录,查找满足寻找条件的文件并对之采取相关的操作。

  该命令提供的寻找条件可以是一个用逻辑运算符not, and, or组成的复合条件。逻辑运算符and, or, not的含义为:

  (1)and:逻辑与,在命令中用-a表示,是系统默认的选项,表示只有当所给的条件都满足时,寻找条件才算满足。例如:

  $ find –name 'tmp' –xtype c -user 'inin'

  该命令寻找满足3个给定条件的所有文件。

  (2)or:逻辑或,在命令中用-o表示。该运算符表示只要所给的条件中有一个满足时,寻找条件就算满足。例如:

  $ find –name 'tmp' –o –name 'mina*'

  该命令查询文件名为tmp或是匹配mina*的所有文件。

  (3)not:逻辑非,在命令中用!表示。该运算符表示查找不满足所给条件的文件。例如:

  $ find ! –name 'tmp'

  该命令查询文件名不是tmp的所有文件。

  需要说明的是:当使用很多的逻辑选项时,可以用括弧把这些选项括起来。为了避免Shell本身对括弧引起误解,在括号前需要加转义字符“\”来去除括弧的意义。如:

  $ find \(–name 'tmp' –xtype c -user 'inin' \)

  寻找条件有以下选项:

  首先,下列各个选项中的n值可以有3种输入方式,假设n为20,则:

  +20 表示20以后(21, 22, 23等)

  -20 表示20以前(19, 18, 17等)

  20 表示正好是20

  (1)以名称和文件属性查找。

  - name '字串' 查找文件名匹配所给字串的所有文件,字串内可用万用字符*, ?, [ ]。

  - lname '字串' 查找文件名匹配所给字串的所有符号链接文件,字串内可用万用字符*, ?, [ ]。

  -gid n 查找属于ID号为n的用户组的所有文件。

  -uid n 查找属于ID号为n的用户的所有文件。

  -group '字串' 查找属于用户组名为所给字串的所有文件。

  -user '字串' 查找属于用户名为所给字串的所有文件。

  -empty 查找大小为0的目录或文件。

  -path '字串' 查找路径名匹配所给字串的所有文件,字串内可用万用字符*, ?, [ ]。

  -perm 许可权 查找具有指定许可权的文件和目录,许可权的表示可以如711, 644。

  -size n[bckw] 查找指定大小的文件,n后面的字符表示单位,默认为b,代表512字节的块。

  -type x 查找类型为x的文件,x为下列字符之一:

  b 块设备文件;

  c 字符设备文件 ;

  d 目录文件;

  p 具名管道(FIFO);

  f 普通文件;

  l 符号链接文件(symbolic links);

  s socket文件。

  -xtype x 与-type基本相同,但只查找符号链接文件。

  (2)以时间为条件查找。

  - amin n 查找n分钟以前被访问过的所有文件。

  - atime n 查找n天以前被访问过的所有文件。

  - cmin n 查找n分钟以前文件状态被修改过的所有文件。

  - ctime n 查找n天以前文件状态被修改过的所有文件。

  - mmin n 查找n分钟以前文件内容被修改过的所有文件。

  - mtime n 查找n天以前文件内容被修改过的所有文件。

  (3)可执行的操作。

  - exec 命令名称 {} 对符合条件的文件执行所给的Linux 命令,而不询问用户是否需要执行该命令。{}表示命令的参数,即所找到的文件;命令的末尾必须以“ \;”结束。

  - ok 命令名称 { } 对符合条件的文件执行所给的Linux 命令,与exec不同的是,它会询问用户是否需要执行该命令。

  - ls 详细列出所找到的所有文件。

  - fprintf 文件名 将找到的文件名写入指定文件。

  - print 在标准输出设备上显示查找出的文件名。

  - printf 格式 格式的写法请参考有关C语言的图书。

  例10-11:查找当前目录中所有以main开头的文件,并显示这些文件的内容。

  $ find . - name 'main*' - exec more {} \;

  例10-12:删除当前目录下所有一周之内没有被访问过的a .out或*.o文件。

  $ find . \(- name a.out - o - name '*.o'\)\

  > - atime +7 - exec rm {} \;

  说明如下:

  命令中的“.”表示当前目录,此时find将从当前目录开始,逐个在其子目录中查找满足后面指定条件的文件。\(和\)表示括弧(),其中的“\”称为转义符。之所以这样写是由于对Shell而言,(和)另有不同的含义,而不是这里的用于组合条件的用途。- name a.out是指要查找名为a.out的文件;- name '*.o'指要查找所有名字以 .o结尾的文件。这两个- name之间的- o表示逻辑或(or),即查找名字为a.out或名字以 .o结尾的文件,find在当前目录及其子目录下找到这样的文件之后,再进行判断,看其最后访问时间是否在7天以前,若是,则对该文件执行命令(- exec rm{ }\;)。其中{ }代表当前查到的符合条件的文件名,“\;”则是语法所要求的。上述命令中第一行的最后一个“\”是续行符。当命令太长而在一行写不下时,可输入一个“\”,之后系统将显示一个“>”,指示用户继续输入命令。

 9.locate命令

  locate命令用于查找文件,它比find命令的搜索速度快,需要一个资料库,这个资料库由每天的例行工作(crontab)程序来创建。当我们创建好这个资料库后,就可以方便地来搜寻所需文件了。

  该命令的一般形式为:

  locate 相关字

  例如,查找相关字issue:

  $ locate issue

  /etc/issue

  /etc/issue.net

  /usr/man/man5/issue.5

  /usr/man/man5/issue.net.5
10.Sort命令

  sort命令的功能是对文件中的各行进行排序。sort命令有许多非常实用的选项,这些选项最初是用来对资料库格式的文件内容进行各种排序操作的。实际上,sort命令可以被认为是一个非常强大的资料管理工具,用来管理内容类似资料库记录的文件。

  Sort命令将逐行对文件中的内容进行排序,如果两行的首字符相同,该命令将继续比较这两行的下一个字符,如果还相同,将继续进行比较。

  语法:

  sort [选项]文件

  说明:sort命令对指定文件中所有的行进行排序,并将结果显示在标准输出上。如不指定输入文件或使用“-”,则表示排序内容来自标准输入。

  sort排序是根据从输入行抽取的一个或多个关键字进行比较来完成的。排序关键字定义了用来排序的最小的字符序列。默认情况下以整行为关键字按ASCII字符顺序进行排序。

  改变默认设置的选项主要有:

  - m 若给定文件已排好序,合并文件。

  - c 检查给定文件是否已排好序,如果它们没有都排好序,则显示一个出错信息,并以状态值1退出。

  - u 对排序后认为相同的行只留其中一行。

  - o 输出文件将排序输出写到输出文件中而不是标准输出,如果输出文件是输入文件之一,sort先将该文件的内容写入一个暂存文件,然后再排序并写输出结果。

  改变默认排序规则的选项主要有:

  - d 按字典顺序排序,比较时仅字母、数位、空格和跳位字符有意义。

  - f 将小写字母与大写字母同等对待。

  - I 忽略非显示字符。

  - M 作为月份比较。

  - r 按逆序输出排序结果。

  +posl - pos2 指定一个或几个栏位作为排序关键字,栏位位置从posl开始,到pos2结束(包括posl,不包括pos2)。如不指定pos2,则关键字为从posl到行尾。栏位和字符的位置从0开始。

  - b 在每行中寻找排序关键字时忽略前导的空白(空格和跳位字符)。

  - t separator 指定字符separator作为栏位分隔符号。

  下面通过几个例子来讲述sort的使用。

  用sort命令对text文件中各行排序后输出其结果。请注意,在原文件的第2, 3行上的第1个单词完全相同,该命令将从它们的第2个单词vegetables与fruit的首字符处继续进行比较。

  $ cat text

  vegetable soup

  fresh vegetables

  fresh fruit

  lowfat milk

  $ sort text

  fresh fruit

  fresh vegetables

  lowfat milk

  vegetable soup

  用户可以保存排序后的文件内容,或把排序后的文件内容输出至打印机。下例中用户把排序后的文件内容保存到名为result的文件中。

  $ sort text>result

  以第2个栏位作为排序关键字对文件example的内容进行排序。

  $ sort +1-2 example

  对于file1和file2文件内容反向排序,结果放在outfile中,利用第2个栏位的第一个字符作为排序关键字。

  $ sort -r -o outfile +1.0 -1.1 example

  sort排序常用于在管道中与其他命令组合,完成比较复杂的功能。如利用管道将当前工作目录中的文件送给sort进行排序,排序关键字是第6个~第8个栏位。

  $ ls - l | sort +5 – 7

  sort命令也可以对标准输入进行操作。例如,如果您想把几个文件文本行合并,并对合并后的文本行进行排序,您可以首先用命令cat把多个文件合并,然后用管道操作把合并后的文本行输入给命令sort,sort命令将输出这些合并及排序后的文本行。在下面的例子中,文件veglist与文件fruitlist的文本行经过合并与排序后被保存到文件clist中。

  $ cat veglist fruitlist | sort > clist

11.uniq命令

  文件经过处理后,在它的输出文件中可能会出现重复的行。例如,使用cat命令将两个文件合并后,再使用sort命令进行排序,就可能出现重复行。这时可以使用uniq命令将这些重复行从输出文件中删除,只留下每条记录的惟一样本。

  语法:uniq [选项]文件

  说明:这个命令读取输入文件,并比较相邻的行。通常,第二个及以后更多个重复行将被删去,行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“-”表示,则从标准输入读取。

  该命令各选项含义如下:

  - c 显示输出中,在每行行首加上本行在文件中出现的次数,它可取代- u和- d选项。

  - d 只显示重复行。

  - u 只显示文件中不重复的各行。

  - n 前n个栏位与每个栏位前的空白一起被忽略。一个栏位是一个非空格、非跳位字符的字串,彼此由跳位字符和空格隔开(栏位从0开始编号)。

  +n 前n个字符被忽略,之前的字符被跳过(字符从0开始编号)。

  - f n 与- n相同,这里n是栏位数。

  - s n 与+n相同,这里n是字符数。

  例如,显示文件example中不重复的行:

  uniq - u example

  显示文件example中不重复的行,从第2个栏位的第2个字符开始做比较:

  uniq - u - 1 +1 example

12.wc命令

  wc命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显示输出。

  语法:wc [选项] 文件…

  说明:该命令统计给定文件中的字节数、字数、行数。如果没有给出文件名,则从标准输入读取。wc同时也给出所有指定文件的总统计数。字是由空格字符区分开的最大字串。

  该命令各选项含义如下:

  - c 统计字节数。

  - l 统计行数。

  - w 统计字数。

  这些选项可以组合使用。

  输出列的顺序和数目不受选项的顺序和数目的影响。总按下述顺序显示,而且每项最多一列。

  行数、字数、字节数、文件名

  如果命令行中没有文件名,则输出中不出现文件名。如:

  $ wc - lcw file1 file2

  4 33 file1

  7 52 file2

  11 11 85 total

  省略任选项-lcw,wc命令的执行结果与上面相同。

13.comm命令

  如果想对两个有序的文件进行比较,可以使用comm命令。

  语法:comm [- 123 ] file1 file2

  说明:该命令是对两个已经排好序的文件进行比较。其中file1和file2是已排序的文件。comm读取这两个文件,然后生成3列输出:仅在file1中出现的行;仅在file2中出现的行;在两个文件中都存在的行。如果文件名用“-”,则表示从标准输入读取。

  选项1, 2或3抑制相应的列显示。例如comm - 12就只显示在两个文件中都存在的行;comm - 23只显示在第一个文件中出现而未在第二个文件中出现的行;comm - 123则什么也不显示。

 14.diff命令

  该命令的功能为逐行比较两个文字文件,列出其不同之处。它比comm命令完成更复杂的检查。它对给出的文件进行系统的检查,并显示出两个文件中所有不同的行,不要求事先对文件进行排序。

  语法:diff [选项] file1 file2

  说明:该命令告诉用户,为了使两个文件file1和file2一致,需要修改它们的哪些行。如果用“-”表示file1或fiie2,则表示标准输入。如果file1或file2是目录,那么diff将使用该目录中的同名文件进行比较。例如:

  diff /usr/xu mine

  把目录/usr/xu 中名为mine的文件与当前目录中的mine文件进行比较。

  通常输出由下述形式的行组成:

  n1 a n3, n4

  n1, n2 d n3

  n1, n2 c n3, n4

  这些行类似ed命令把filel转换成file2。字母(a, d和c)之前的行号(n1, n2)是针对file1的,其后面的行号(n3, n4)是针对file2的。字母a, d和c分别表示附加、删除和修改操作。

  在上述形式的每一行的后面跟随受到影响的若干行,以“<”打头的行属于第一个文件,以“>”打头的行属于第二个文件。

  diff能区别块和字符设备文件以及FIFO(管道文件),不会把它们与普通文件进行比较。

  如果file1和file2都是目录,则diff会产生很多信息。如果一个目录中只有一个文件,则产生一条信息,指出该目录路径名和其中的文件名。

  diff各选项的含义如下:

  - b 忽略行尾的空格,而字串中的一个或多个空白字符都视为相等。

  - c 采用上下文输出格式(提供三行上下文)。

  - C n 采用上下文输出格式(提供n行上下文)。

  - e 产生一个合法的ed脚本作为输出。

  - r 当file1和file2是目录时,递归作用到各文件和目录上。

  

没有评论: