纸上得来终觉浅,绝知此事要躬行。
1. 文件查找
在文件系统上查找符合条件的文件
1.1 简述 locate 命令
非实时查找(数据库查找)
- 依赖于事先构建的索引,索引的构建是在系统较为空闲时自动进行(周期性任务)
- 手动更新数据库(
updatedb
),索引构建过程需要遍历整个根文件系统,极消耗资源
格式:
locate KEYWORD
工作特点:
- 查找速度快
- 模糊查找
- 非实时查找
1.2 简述 find 命令
实时查找
- 实时查找工具,通过遍历指定路径下的文件系统完成文件查找
工作特点:
- 查找速度略慢
- 精确查找
- 实时查找
2. find 命令
格式:
find [OPTION]... [查找路径] [查找条件] [处理动作]
查找路径:
- 指定具体目标路径
- 默认为当前目录
查找条件:
- 指定的查找标准,可以文件名、大小、类型、权限等标准进行
- 默认为找出指定路径下的所有文件
处理动作:
- 对符合条件的文件做什么操作
- 默认输出至屏幕
2.1 根据文件名查找
-name <范本样式>
- 支持使用 glob(
*
/?
/[]
/[^]
)
- 支持使用 glob(
-iname <范本样式>
- 效果和指定“-name”参数类似,不区分字母大小写
-regex "PATTERN"
- 以 PATTERN 匹配整个文件路径字符串,而不仅仅是文件名称
-iregex "PATTERN"
- 效果和指定“-regexe”参数类似,但忽略字符大小写的差别
-prune
- 不寻找字符串作为寻找文件或目录的范本样式;
2.2 根据属主/属组查找
-user USERNAME
- 查找属主为指定用户的文件
-group GRPNAME
- 查找属组为指定组的文件
-uid UserID
- 查找属主为指定的 UID 号的文件
-gid GroupID
- 查找属组为指定的 GID 号的文件
-nouser
- 查找没有属主的文件
-nogroup
- 查找没有属组的文件
2.3 根据文件类型查找
-type TYPE
f
: 普通文件d
: 目录文件l
: 符号链接文件s
:套接字文件b
: 块设备文件c
: 字符设备文件p
: 管道文件
2.4 组合条件
- 与:
-a
- 或:
-o
- 非:
-not
/!
2.5 根据文件大小来查找
-size [+|-]#UNIT
- 常用单位:k, M, G
#UNIT
:(#-1, #]
-#UNIT
:[0,#-1]
+#UNIT
:(#,oo)
2.6 根据时间戳
以“天”为单位
-atime [+|-]#
#
:[#,#+1)
+#
:[#+1,oo]
-#
:[0,#)
-mtime [+|-]#
#
:[#,#+1)
+#
:[#+1,oo]
-#
:[0,#)
-ctime [+|-]#
#
:[#,#+1)
+#
:[#+1,oo]
-#
:[0,#)
以“分钟”为单位
-amin [+|-]#
#
:[#,#+1)
+#
:[#+1,oo]
-#
:[0,#)
-mmin [+|-]#
#
:[#,#+1)
+#
:[#+1,oo]
-#
:[0,#)
-cmin [+|-]#
#
:[#,#+1)
+#
:[#+1,oo]
-#
:[0,#)
时间查找的高级用户
-daystart
- 从本日开始计算时间
-newer <参考文件或目录>
- 查找其更改时间较指定文件或目录的更改时间更接近现在的文件或目录
-anewer <参考文件或目录>
- 查找其存取时间较指定文件或目录的存取时间更接近现在的文件或目录
-cnewer <参考文件或目录>
- 查找其更改时间较指定文件或目录的更改时间更接近现在的文件或目录
2.7 根据权限查找
-perm [/|-]MODE
MODE
: 精确权限匹配/MODE
: 任何一类(u,g,o)对象的权限中只要能一位匹配即可-MODE
: 每一类对象都必须同时拥有为其指定的权限标准
2.8 符号链接
-follow
- 排除符号连接
-links <连接数目>
- 查找符合指定的硬连接数目的文件或目录
-inum <inode编号>
- 查找符合指定的 inode 编号的文件或目录
-noleaf
- 不去考虑目录至少需拥有两个硬连接存在
2.9 查找深度
-path <范本样式>
- 指定字符串作为寻找目录的范本样式
-ipath <范本样式>
- 此参数的效果和指定“-path”参数类似,但忽略字符大小写的差别
-mindepth <目录层级>
- 设置最小目录层级
-maxdepth <目录层级>
- 设置最大目录层级
-depth
- 从指定目录下最深层的子目录开始查找
2.10 处理动作
-print
- 默认的处理动作,显示至屏幕
-print0
- 将文件或目录名称列出到标准输出,格式为全部的名称皆在同一行
-printf <输出格式>
- 将文件或目录名称列出到标准输出,格式可以自行指定
-ls
- 类似于对查找到的文件执行“ls -l”命令
-delete
- 删除查找到的文件
-fls /path/to/somefile
- 查找到的所有文件的长格式信息保存至指定文件中
-ok COMMAND {} \;
- 对查找到的每个文件执行由 COMMAND 指定的命令
- 对于每个文件执行命令之前,都会交互式要求用户确认
-exec COMMAND {} \;
- 对查找到的每个文件执行由 COMMAND 指定的命令
- {}用于引用查找到的文件名称自身
Note:
find
传递查找到的文件至后面指定的命令时,查找到所有符合条件的文件一次性传递给后面的命令- 有些命令不能接受过多参数,此时命令执行可能会失败;另一种方式可规避此问题:
find | xargs COMMAND
3. 实战演示
- 基础用法
# 1.找出/home下不是以.txt结尾的文件
find /home ! -name "*.txt"
# 2.查找/var目录下属主为root,且属组为mail的所有文件或目录
find /var -user root -group mail
# 3.查找/usr目录下不属于root/bin或hadoop的所有文件或目录
find /usr -not -user root -a -not -user bin -a -not -user hadoop
find /usr -not \( -user root -o -user bin -o -user hadoop \)
# 4.查找/etc目录下最周一周内其内容修改过,同时属主不为root,也不是hadoop的文件或目录
find /etc -mtime -7 -a -not -user root -a -not -user hadoop
find /etc/ -mtime -7 -a -not \( -user root -o -user hadoop \)
# 5.查找/etc目录下大于1M且类型为普通文件的所有文件
find /etc -size +1M -type f
# 6.查找/etc目录下所有用户都没有写权限的文件
find /etc -not -perm /222
# 7.查找/etc目录下至少有一类用户没有执行权限的文件
find /etc -not -perm -111
# 8.查找当前系统上没有属主或属组,且最近一个周内曾被访问过的文件或目录
find / -nouser -a -nogroup -a -atime -7
- 中级用法
# 1.向下最大深度限制为3
find . -maxdepth 3 -type f
# 2.搜索出深度距离当前目录至少2个子目录的所有文件
find . -mindepth 2 -type f
# 3.找出比file.log修改时间更长的所有文件
find . -type f -newer file.log
# 4.查找当前目录或者子目录下所有.txt文件,但是跳过子目录sk
find . -path "./sk" -prune -o -name "*.txt" -print
# 5.要列出所有长度为零的文件
find . -empty
- 高级用法
# 1.删除当前目录下所有.txt文件
find . -type f -name "*.txt" -delete
# 2.找出当前目录下所有root的文件,并把所有权更改为用户tom
find . -type f -user root -exec chown tom {} \;
find . -type f -user root -exec chown tom {} \; > all.txt
# 3.找出自己家目录下所有的.txt文件并删除
find $HOME/ -name "*.txt" -ok rm {} \;
# 4.找出/tmp目录下,属主不是root,且文件名不是fstab的文件
find /tmp \( -not -user root -a -not -name 'fstab' \) -ls
find /tmp -not \( -user root -o -name 'fstab' \) -ls
# 5.将30天前的.log文件移动到old目录中
find . -type f -mtime +30 -name "*.log" -exec cp {} old \;
# 6.只保留对应目录下最新的一个文件并将其他文件删除
find /data/ -type f -name "db_log_*" | sort -nr | awk '{if (NR>=2){print $1}}' | xargs rm -f
4. 思维导图
下面是自己画了一个流程图,有助于快速理解和复习对应知识!