find中的-print0和xargs中-0的奥妙
默认情况下, find 每输出一个文件名, 后面都会接着输出一个换行符 (‘\n’), 因此我们看到的 find 的输出都是一行一行的:
1 2 3 4 5 6 7
| $ ls -l total 0 -rw-r--r-- 1 root root 0 2010-08-02 18:09 file1.log -rw-r--r-- 1 root root 0 2010-08-02 18:09 file2.log $ find -name '*.log' ./file2.log ./file1.log
|
比如我想把所有的 .log 文件删掉, 可以这样配合 xargs 一起用:
1 2 3 4 5
| $ find -name '*.log' ./file2.log ./file1.log $ find -name '*.log' | xargs rm $ find -name '*.log'
|
嗯, 不错, find+xargs 真的很强大. 然而:
1 2 3 4 5 6 7 8 9 10 11 12
| $ ls -l total 0 -rw-r--r-- 1 root root 0 2010-08-02 18:12 file 1.log -rw-r--r-- 1 root root 0 2010-08-02 18:12 file 2.log $ find -name '*.log' ./file 1.log ./file 2.log $ find -name '*.log' | xargs rm rm: cannot remove `./file': No such file or directory rm: cannot remove `1.log': No such file or directory rm: cannot remove `./file': No such file or directory rm: cannot remove `2.log': No such file or directory
|
原因其实很简单, xargs 默认是以空白字符 (空格, TAB, 换行符) 来分割记录的, 因此文件名 ./file 1.log 被解释成了两个记录 ./file 和 1.log, 不幸的是 rm 找不到这两个文件.
为了解决此类问题, 聪明的人想出了一个办法, 让 find 在打印出一个文件名之后接着输出一个 NULL 字符 (‘\0’) 而不是换行符, 然后再告诉 xargs 也用 NULL 字符来作为记录的分隔符. 这就是 ** find 的 -print0 和 xargs 的 -0 **的来历吧.
1 2 3 4 5 6
| $ ls -l total 0 -rw-r--r-- 1 root root 0 2010-08-02 18:12 file 1.log -rw-r--r-- 1 root root 0 2010-08-02 18:12 file 2.log $ find -name '*.log' -print0 | xargs -0 rm $ find -name '*.log'
|
你可能要问了, 为什么要选 ‘\0’ 而不是其他字符做分隔符呢? 这个也容易理解: 一般的编程语言中都用 ‘\0’ 来作为字符串的结束标志, 文件的路径名中不可能包含 ‘\0’ 字符.