#python之Shutil文件、文件夹高级操作
复制操作
copyfileobj
1 | shutil.copyfileobj(fsrc, fdst[, length=16\*1024]) |
copy文件内容到另一个文件,可以copy指定大小的内容。这个方法是shutil模块中其它拷贝方法的基础,其它方法在本质上都是调用这个方法。
让我们看一下它的源码:
1 | def copyfileobj(fsrc, fdst, length=16*1024): |
代码很简单,一看就懂。但是要注意,其中的fsrc,fdst都是使用open()方法打开后的文件对象。
1 | import shutil |
copyfile
1 | shutil.copyfile(src, dst) |
拷贝整个文件。同样看下它的源码,忽略前面一些检测用的代码,该方法的核心在最后几行,我们可以很清楚地看到copyfile()
方法对copyfileobj()
进行了调用。
1 | def copyfile(src, dst, *, follow_symlinks=True): |
copymode
1 | shutil.copymode(src, dst) |
仅拷贝权限。内容、组、用户均不变。
copystat
1 | shutil.copystat(src, dst) |
仅复制所有的状态信息,包括权限,组,用户,时间等。
copy
1 | shutil.copy(src,dst) |
同时复制文件的内容以及权限,也就是先copyfile()然后copymode()。
copy2
1 | shutil.copy2(src, dst) |
同时复制文件的内容以及文件的所有状态信息。先copyfile()后copystat()。
ignore_patterns
1 | shutil.ignore_patterns(*patterns) |
忽略指定的文件。通常配合下面的copytree()方法使用。
copytree
1 | shutil.copytree(src, dst, symlinks=False,ignore=None,copy_function=copy2, |
递归地复制目录及其子目录的文件和状态信息
- symlinks:指定是否复制软链接。小心陷入死循环。
- ignore:指定不参与复制的文件,其值应该是一个ignore_patterns()方法。
- copy_function:指定复制的模式
1 | # 典型用法 |
移动删除操作
rmtree
1 | shutil.rmtree(path[, ignore_errors[, onerror]]) |
递归地删除目录及子目录内的文件。注意!该方法不会询问yes或no,被删除的文件也不会出现在回收站里,请务必小心!此函数与类似os.removedirs
,但是os.removedirs
不能删除非空文件夹
下面的例子在碰到只读文件时,尝试清除只读属性,然后再删除。
1 | import os, stat |
move
1 | shutil.move(src, dst) |
递归地移动文件,类似mv命令,其实就是重命名。
which
1 | shutil.which(cmd) |
类似linux的which
命令,返回执行该命令的程序路径。Python3.3新增
disk_usage
检测磁盘使用信息
1 | shutil.disk_usage("d:/") |
解压缩
get_archive_formats
1 | shutil.get_archive_formats() |
获取当前系统已注册的归档文件格式(后缀)
[(‘bztar’, “bzip2’ed tar-file”),
(‘gztar’, “gzip’ed tar-file”),
(‘tar’, ‘uncompressed tar file’),
(‘xztar’, “xz’ed tar-file”),
(‘zip’, ‘ZIP file’)]
make_archive
1 | shutil.make_archive(base_name, format[, root_dir[, base_dir[, verbose[, dry_run[, owner[, group[, logger]]]]]]]) |
创建归档或压缩文件。
base_name
:压缩后的文件名。如果不指定绝对路径,则压缩文件保存在当前目录下。这个参数必须指定。format
:压缩格式,可以是“zip”, “tar”, “bztar” ,“gztar”,“xztar”中的一种。这个参数也必须指定。root_dir
:设置压缩包里的根目录,一般使用默认值,不特别指定。base_dir
:要进行压缩的源文件或目录。owner
:用户,默认当前用户。group
:组,默认当前组。logger
:用于记录日志,通常是logging.Logger
对象。
范例:
1 | import shutil |
get_unpack_formats
获取当前系统已经注册的解包文件格式(后缀)
[(‘bztar’, [‘.tar.bz2’, ‘.tbz2’], “bzip2’ed tar-file”),
(‘gztar’, [‘.tar.gz’, ‘.tgz’], “gzip’ed tar-file”),
(‘tar’, [‘.tar’], ‘uncompressed tar file’),
(‘xztar’, [‘.tar.xz’, ‘.txz’], “xz’ed tar-file”),
(‘zip’, [‘.zip’], ‘ZIP file’)]
unpack_archive
1 | shutil.unpack_archive(filename[, extract_dir[, format]]) |
解压缩或解包源文件。
- filename是压缩文档的完整路径
- extract_dir是解压缩路径,默认为当前目录。
- format是压缩格式。默认使用文件后缀名代码的压缩格式。
范例:
1 | import shutil |
shutil模块的压缩和解压功能,在后台是通过调用zipfile和tarfile两个模块来进行的。