当前位置:首页 >> 脚本专栏

Linux shell编程中IO和条件及循环处理的细节问题讨论

> 與 < 差在哪?
谈到I/O redirection,不妨先让我们认识一下File Descriptor(FD)。程序的运算,在大部份情况下都是进行数据(data)的处理,这些数据从哪读进?又,送出到哪里呢?这就是File descriptor(FD)的功用了。

在shell程序中,最常使用的FD大概有三个,分别为:

  • 0: Standard Input(STDIN)
  • 1: Standard Output(STDOUT)
  • 2: Standard Error Output(STDERR)

在标准情况下,这些FD分别跟如下设备(device)关联:

  • stdin(0):keyboard
  • stdout(1):monitor
  • stderr(2):monitor

我们可以用如下下命令测试一下:

$ mail -s test root
this is a test mail.
please skip.

^d(同时按crtl跟d键)
很明显,mail程序所读进的数据,就是从stdin也就是keyboard读进的。不过,不见得每个程序的stdin都跟mail一样从keyboard读进,因为程序作者可以从档案参数读进stdin,如:

$ cat /etc/passwd

但,要是cat之后没有档案参数则又如何呢?哦,请您自己玩玩看啰….^_^

$ cat

(请留意数据输出到哪里去了,最后别忘了按^d离开…)至于stdout与stderr,嗯…然后,让我们继续看stderr好了。

事实上,stderr没甚么难理解的:说穿了就是“错误信息”要往哪边送而已…比方说,若读进的档案参数是不存在的,那我们在monitor上就看到了:

$ ls no.such.file
ls: no.such.file: No such file or directory

若,一个命令同时产生stdout与stderr呢?那还不简单,都送到monitor来就好了:

$ touch my.file
$ ls my.file no.such.file
ls: no.such.file: No such file or directory
my.file

okay,至此,关于FD及其名称、还有相关联的设备,相信你已经没问题了吧?那好,接下来让我们看看如何改变这些FD的预设数据信道,我们可用<来改变读进的数据信道(stdin),使之从指定的档案读进。我们可用>来改变送出的数据信道(stdout,stderr),使之输出到指定的档案。比方说:

$ cat < my.file

就是从my.file读进数据

$ mail -s test root < /etc/passwd

则是从/etc/passwd读进…

这样一来,stdin将不再是从keyboard读进,而是从档案读进了…严格来说,<符号之前需要指定一个FD的(之间不能有空白),但因为0是<的预设值,因此<与0<是一样的!okay,这个好理解吧?

那,要是用两个<<又是啥呢?这是所谓的HERE Document,它可以让我们输入一段文本,直到读到<<后指定的字串。比方说:

$ cat <<FINISH
first line here
second line there
third line nowhere
FINISH

这样的话,cat会读进3行句子,而无需从keyboard读进数据且要等^d结束输入。

okay,又到讲古时间~~~当你搞懂了0<原来就是改变stdin的数据输入信道之后,相信要理解如下两个redirection就不难了:1> 2> 。前者是改变stdout的数据输出信道,后者是改变stderr的数据输出信道。两者都是将原本要送出到monitor的数据转向输出到指定档案去。

由于1是>的预设值,因此,1>与>是相同的,都是改变stdout。用上次的ls例子来说明一下好了:

$ ls my.file no.such.file 1>file.out
ls: no.such.file: No such file or directory

这样monitor就只剩下stderr而已。因为stdout给写进file.out去了。

$ ls my.file no.such.file 2>file.err
my.file

这样monitor就只剩下stdout,因为stderr写进了file.err。

$ ls my.file no.such.file 1>file.out 2>file.err

这样monitor就啥也没有,因为stdout与stderr都给转到档案去了…

呵~~~看来要理解>一点也不难啦﹗是不?没骗你吧?^_^ 不过,有些地方还是要注意一下的。
首先,是同时写入的问题。比方如下这个例子:

$ ls my.file no.such.file 1>file.both 2>file.both

假如stdout(1)与stderr(2)都同时在写入file.both的话,则是采取“覆盖”方式:后来写入的覆盖前面的。让我们假设一个stdout与stderr同时写入file.out的情形好了:

  • 首先stdout写入10个字元
  • 然后stderr写入6个字元

那么,这时候原本stdout输出的10个字元就被stderr覆盖掉了。那,如何解决呢?所谓山不转路转、路不转人转嘛,我们可以换一个思维:将stderr导进stdout或将stdout导进sterr,而不是大家在抢同一份档案,不就行了﹗bingo﹗就是这样啦:

  • 2>&1就是将stderr并进stdout作输出
  • 1>&2或>&2就是将stdout并进stderr作输出

于是,前面的错误操作可以改为:

$ ls my.file no.such.file 1>file.both 2>&1


$ ls my.file no.such.file 2>file.both >&2

在Linux档案系统里,有个设备档位于/dev/null。许多人都问过我那是甚么玩意儿?我跟你说好了:那就是“空”啦﹗没错﹗空空如也的空就是null了….请问施主是否忽然有所顿误了呢?然则恭喜了~~~ ^_^ 这个null在I/O Redirection中可有用得很呢:

  • 若将FD1跟FD2转到/dev/null去,就可将stdout与stderr弄不见掉。
  • 若将FD0接到/dev/null来,那就是读进nothing。

比方说,当我们在执行一个程序时,画面会同时送出stdout跟stderr,

假如你不想看到stderr(也不想存到档案去),那可以:

$ ls my.file no.such.file 2>/dev/null
my.file

若要相反:只想看到stderr呢?还不简单﹗将stdout弄到null就行:

$ ls my.file no.such.file >/dev/null
ls: no.such.file: No such file or directory

那接下来,假如单纯只跑程序,不想看到任何输出结果呢?哦,这里留了一手上次节目没讲的法子,专门赠予有缘人﹗…^_^ 除了用>/dev/null 2>&1之外,你还可以如此:

$ ls my.file no.such.file &>/dev/null

(提示:将&>换成>&也行啦~~!)

okay?讲完佛,接下来,再让我们看看如下情况:

$ echo "1" > file.out
$ cat file.out
1
$ echo "2" > file.out
$ cat file.out
2

看来,我们在重导stdout或stderr进一份档案时,似乎永远只获得最后一次导入的结果。那,之前的内容呢?呵~~~要解决这个问提很简单啦,将>换成就好:

$ echo "3"  file.out
$ cat file.out
2
3

如此一来,被重导的目标档案之内容并不会失去,而新的内容则一直增加在最后面去。easy?呵…^_^

但,只要你再一次用回单一的>来重导的话,那么,旧的内容还是会被“洗”掉的﹗这时,你要如何避免呢?----备份﹗yes,我听到了﹗不过….还有更好的吗?既然与施主这么有缘份,老纳就送你一个锦囊妙法吧:

$ set -o noclobber
$ echo "4" > file.out
-bash: file: cannot overwrite existing file

那,要如何取消这个“限制”呢?哦,将set -o换成set +o就行:

$ set +o noclobber
$ echo "5" > file.out
$ cat file.out
5

再问:那…有办法不取消而又“临时”盖写目标档案吗?哦,佛曰:不可告也﹗啊~开玩笑的、开玩笑的啦~ ^_^唉,早就料到人心是不足的了﹗

$ set -o noclobber
$ echo "6" >| file.out
$ cat file.out
6

留意到没有:在>后面再加个“|”就好(注意:>与|之间不能有空白哦)… 呼…(深呼吸吐纳一下吧)~~~ ^_^再来还有一个难题要你去参透的呢:

$ echo "some text here" > file
$ cat < file
some text here
$ cat < file > file.bak
$ cat < file.bak
some text here
$ cat < file > file
$ cat < file

嗯?!注意到没有?!!----怎么最后那个cat命令看到的file竟是空的?﹗why?why?why?当当当~上课啰~ ^_^
前面提到:$ cat < file > file 之后原本有内容的档案结果却被洗掉了﹗要理解这一现像其实不难,这只是priority的问题而已:

在IO Redirection中,stdout与stderr的管道会先准备好,才会从stdin读进数据。也就是说,在上例中,> file会先将file清空,然后才读进< file,但这时候档案已经被清空了,因此就变成读不进任何数据了…哦~原来如此~~ ^_^

那…如下两例又如何呢?

$ cat <> file
$ cat < file  file

嗯…同学们,这两个答案就当练习题啰,下节课之前请交作业﹗好了,I/O Redirection也快讲完了,sorry,因为我也只知道这么多而已啦~嘻 ^_^ 不过,还有一样东东是一定要讲的,各位观众(请自行配乐~!#@!$%):----就是pipe line也!

谈到pipe line,我相信不少人都不会陌生:我们在很多command line上常看到的“|”符号就是pipe line了。不过,究竟pipe line是甚么东东呢?别急别急…先查一下英汉字典,看看pipe是甚么意思?没错﹗它就是“水管”的意思…那么,你能想像一下水管是怎么一根接着一根的吗?又,每根水管之间的input跟output又如何呢?嗯??灵光一闪:原来pipe line的I/O跟水管的I/O是一模一样的:上一个命令的stdout接到下一个命令的stdin去了!的确如此…不管在command line上你使用了多少个pipe line,前后两个command的I/O都是彼此连接的﹗(恭喜:你终于开窍了﹗^_^)

不过…然而…但是……stderr呢?好问题﹗不过也容易理解:若水管漏水怎么办?也就是说:在pipe line之间,前一个命令的stderr是不会接进下一命令的stdin的,其输出,若不用2>导到file去的话,它还是送到摄像头上面来﹗这点请你在pipe line运用上务必要注意的。那,或许你又会问:有办法将stderr也喂进下一个命令的stdin去吗?(贪得无厌的家伙﹗)方法当然是有,而且你早已学过了﹗^_^ 我提示一下就好:请问你如何将stderr合并进stdout一同输出呢?若你答不出来,下课之后再来问我吧…(如果你脸皮真够厚的话…)

或许,你仍意尤未尽﹗或许,你曾经碰到过下面的问题:

在cm1 | cm2 | cm3…这段pipe line中,若要将cm2的结果存到某一档案呢?

若你写成cm1 | cm2 > file | cm3的话,那你肯定会发现cm3的stdin是空的﹗(当然啦,你都将水管接到别的水池了﹗)聪明的你或许会如此解决:cm1 | cm2 > file; cm3 < file 是的,你的确可以这样做,但最大的坏处是:这样一来,file I/O会变双倍﹗在command执行的整个过程中,file I/O是最常见的最大性能杀手。凡是有经验的shell操作者,都会尽量避免或降低file I/O的频率。那,上面问题还有更好方法吗?有的,那就是tee命令了。

所谓tee命令是在不影响原本I/O的情况下,将stdout复制一份到档案去。因此,上面的命令行可以如此打:

cm1 | cm2 | tee file | cm3

在预设上,tee会改写目标档案,若你要改为增加内容的话,那可用-a参数达成。
基本上,pipe line的应用在shell操作上是非常广泛的,尤其是在text filtering方面,
凡举cat,more,head,tail,wc,expand,tr,grep,sed,awk,…等等文字处理工具,搭配起pipe line来使用,你会惊觉command line原来是活得如此精彩的﹗常让人有“众里寻他千百度,蓦然回首,那人却在灯火阑珊处﹗”之感…^_^

你要 if 還是 case 呢?
放了一个愉快的春节假期,人也变得懒懒散散的…只是,答应了大家的作业,还是要坚持完成就是了~~~

还记得我们在第10章所介绍的return value吗?是的,接下来介绍的内容与之有关,若你的记忆也被假期的欢乐时光所抵消掉的话,那,建议您还是先回去温习温习再回来…

若你记得return value,我想你也应该记得了&&与||是甚么意思吧?用这两个符号再配搭command group的话,我们可让shell script变得更加聪明哦。比方说:

comd1 && {
  comd2
  comd3
  :
} || {
  comd4
  comd5
}

意思是说:假如comd1的return value为true的话,然则执行comd2与comd3,否则执行comd4与comd5。

事实上,我们在写shell script的时候,经常需要用到这样那样的条件以作出不同的处理动作。
用&&与||的确可以达成条件执行的效果,然而,从“人类语言”上来理解,却不是那么直观。
更多时候,我们还是喜欢用if….then…else…这样的keyword来表达条件执行。在bash shell中,我们可以如此修改上一段代码:

if comd1
then
  comd2
  comd3
else
  comd4
  comd5
fi

这也是我们在shell script中最常用到的if判断式:只要if后面的command line返回true的return value(我们最常用test命令来送出return value),然则就执行then后面的命令,否则执行else后的命令;fi则是用来结束判断式的keyword。

在if判断式中,else部份可以不用,但then是必需的。(若then后不想跑任何command,可用:这个null command代替)。当然,then或else后面,也可以再使用更进一层的条件判断式,这在shell script设计上很常见。

若有多项条件需要“依序”进行判断的话,那我们则可使用elif这样的keyword:

if comd1; then
  comd2
elif comd3; then
  comd4
else
  comd5
fi

意思是说:若comd1为true,然则执行comd2;否则再测试comd3,然则执行comd4;倘若comd1与comd3均不成立,那就执行comd5。

if判断式的例子很常见,你可从很多shell script中看得到,我这里就不再举例子了…接下来要为大家介绍的是case判断式。

虽然if判断式已可应付大部份的条件执行了,然而,在某些场合中,却不够灵活,尤其是在string式样的判断上,比方如下:

QQ() {
  echo -n "Do you want to continue"
  read YN
  if [ "$YN" = Y -o "$YN" = y -o "$YN" = "Yes" -o "$YN" = "yes" -o "$YN" = "YES" ]
  then
    QQ
  else
    exit 0
  fi
}
QQ

从例中,我们看得出来,最麻烦的部份是在于判断YN的值可能有好几种式样。聪明的你或许会如此修改:

if echo "$YN" | grep -q '^[Yy]\([Ee][Ss]\)*$'

也就是用Regular Expression来简化代码。(我们有机会再来介绍RE)只是…是否有其它更方便的方法呢"htmlcode">

QQ() {
  echo -n "Do you want to continue"
  read YN
  case "$YN" in
    [Yy]|[Yy][Ee][Ss])
      QQ
      ;;
    *)
      exit 0
      ;;
  esac
}
QQ

我们常用case的判断式来判断某一变量在不同的值(通常是string)时作出不同的处理,比方说,判断script参数以执行不同的命令。若你有兴趣、且用Linux系统的话,不妨挖一挖/etc/init.d/*里那堆script中的case用法。如下就是一例:

case "$1" in
  start)
    start
    ;;
  stop)
    stop
    ;;
  status)
    rhstatus
    ;;
  restart|reload)
    restart
    ;;
  condrestart)
    [ -f /var/lock/subsys/syslog ] && restart || :
    ;;
  *)
    echo $"Usage: $0 {start|stop|status|restart|condrestart}"
    exit 1
  esac

(若你对positional parameter的印像已经模糊了,请重看第9章吧。)okay,十三问还剩一问而已,过几天再来搞定之….^_^

for what?while与until差在哪?

最后要介绍的是shell script设计中常见的“循环”(loop)。所谓的loop就是script中的一段在一定条件下反复执行的代码。bash shell中常用的loop有如下三种:for while until

for loop是从一个清单列表中读进变量值,并“依次”的循环执行do到done之间的命令行。例:

for var in one two three four five
do
  echo -----------
  echo '$var is '$var
  echo
done

上例的执行结果将会是:

for会定义一个叫var的变量,其值依次是one two three four five。
因为有5个变量值,因此do与done之间的命令行会被循环执行5次。
每次循环均用echo产生三行句子。而第二行中不在hard quote之内的$var会依次被替换为one two three four five。
当最后一个变量值处理完毕,循环结束。
我们不难看出,在for loop中,变量值的多寡,决定循环的次数。然而,变量在循环中是否使用则不一定,得视设计需求而定。倘若for loop没有使用in这个keyword来指定变量值清单的话,其值将从$@(或$*)中继承:

for var; do
…
done

(若你忘记了positional parameter,请温习第9章…)

for loop用于处理“清单”(list)项目非常方便,其清单除了可明确指定或从positional parameter取得之外,也可从变量替换或命令替换取得…(再一次提醒:别忘了命令行的“重组”特性!)

然而,对于一些“累计变化”的项目(如整数加减),for亦能处理:

for ((i=1;i<=10;i++))
do
  echo "num is $i"
done

除了for loop,上面的例子我们也可改用while loop来做到:

num=1
while [ "$num" -le 10 ]; do
  echo "num is $num"
  num=$(($num + 1))
done

while loop的原理与for loop稍有不同:它不是逐次处理清单中的变量值,而是取决于while后面的命令行之return value:

若为ture,则执行do与done之间的命令,然后重新判断while后的return value。
若为false,则不再执行do与done之间的命令而结束循环。
分析上例:

  • 在while之前,定义变量num=1。
  • 然后测试(test)$num是否小于或等于10。
  • 结果为true,于是执行echo并将num的值加一。
  • 再作第二轮测试,此时num的值为1+1=2,依然小于或等于10,因此为true,继续循环。
  • 直到num为10+1=11时,测试才会失败…于是结束循环。

我们不难发现:若while的测试结果永远为true的话,那循环将一直永久执行下去:

while : ;do
  echo looping…
done

上例的:是bash的null command,不做任何动作,除了送回true的return value。因此这个循环不会结束,称作死循环。死循环的产生有可能是故意设计的(如跑daemon),也可能是设计错误。若要结束死循环,可透过signal来终止(如按下ctrl-c)。(关于process与signal,等日后有机会再补充,十三问暂时略过。)

一旦你能够理解while loop的话,那,就能理解until loop:

与while相反,until是在return value为false时进入循环,否则结束。
因此,前面的例子我们也可以轻松的用until来写:

num=1
until [ ! "$num" -le 10 ]; do
  echo "num is $num"
  num=$(($num + 1))
done

或是:

num=1
until [ "$num" -gt 10 ]; do
  echo "num is $num"
  num=$(($num + 1))
done

okay,关于bash的三个常用的loop暂时介绍到这里。在结束本章之前,再跟大家补充两个与loop有关的命令:break continue

这两个命令常用在复合式循环里,也就是在do…done之间又有更进一层的loop,当然,用在单一循环中也未尝不可啦…^_^

break是用来打断循环,也就是“强迫结束”循环。若break后面指定一个数值n的话,则“从里向外”打断第n个循环,预设值为break 1,也就是打断当前的循环。
在使用break时需要注意的是,它与return及exit是不同的:

  • break是结束loop
  • return是结束function
  • exit是结束script/shell

而continue则与break相反:强迫进入下一次循环动作。若你理解不来的话,那你可简单的看成:在continue到done之间的句子略过而返回循环顶端…与break相同的是:continue后面也可指定一个数值n,以决定继续哪一层(从里向外计算)的循环,预设值为continue 1,也就是继续当前的循环。