程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

詳解Python壓縮包處理模塊zipfile和py7zr

編輯:Python

        目前對文件的壓縮和解壓縮比較常用的格式就是zip格式和7z格式,今天就以一篇文章來融會貫通會該兩個壓縮文件格式的操作。

一:zipfile的常用操作

1,壓縮文件

 zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])

         參數file表示文件的路徑;參數mode指示打開zip文件的模式,有三種mode

  • 解壓:r
  • 壓縮:w
  • 追加壓縮:a 

        默認值為'r',表示讀已經存在的zip文件,也可以為'w'或'a','w'表示新建一個zip文檔或覆蓋一個已經存在的zip文檔,‘a’表示追加壓縮

        下面我們創建一個壓縮文件result.zip,並壓縮test文件夾下的所有文件

import zipfile
import os
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
z = zipfile.ZipFile(filename, 'w')
for d in os.listdir(testdir):
z.write(d)
z.close

當然上面還可以用with的方法打開

import zipfile
import os
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'w') as z:
for d in os.listdir(testdir):
z.write(d)
z.close

2,解壓縮文件

import zipfile
import os
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'r') as z:
z.extractall(testdir)

需要注意的是有些壓縮包解壓是有密碼,這時候調用extractall的時候也支持輸入密碼,在python3中,解壓文件的密碼參數 pwd 接收的是二進制的值,所以要在前面加一個 b

z.extractall(testdir,pwd=b"ftz")

3,列出壓縮包裡的所有文件

import zipfile
import os
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'r') as z:
files = z.namelist()
print(files)

運行結果如下,返回的是一個列表:

 4,其他常用的方法

import zipfile
import os
testdir = "D:\\ftz\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'r') as z:
z.setpassword(b'ftz1') #設置zip文檔的密碼。
z.printdir() #將zip文檔內的信息打印到控制台上。
data = z.read('file.yaml') #獲取zip文檔內指定文件的二進制數據
print(data)
info = z.getinfo('file.yaml') #方法返回的是一個ZipInfo對象,表示zip文檔中相應文件的信息。它支持如下屬性
print("獲取文件名稱:",info.filename)
print("獲取文件最後修改時間:",info.date_time)
print("獲取壓縮類型:",info.compress_type)
print("獲取壓縮後的大小:",info.compress_size)
print("獲取未壓縮的文件大小:",info.file_size)
print("判斷是否是壓縮文件:",zipfile.is_zipfile(filename))

運行結果如下:

File Name Modified Size
data_yaml.yaml 2022-06-25 10:50:42 198
file.yaml 2022-06-25 10:13:46 123
vnfname.txt 2022-01-14 11:27:56 9320
b'\xe4\xb8\x80\xe7\xba\xa7\xe6\xa0\x87\xe9\xa2\x98:\n \xe4\xba\x8c\xe7\xba\xa7\xe6\xa0\x87\xe9\xa2\x981:\n b:1\n c:2\n a:3\n \xe4\xba\x8c\xe7\xba\xa7\xe6\xa0\x87\xe9\xa2\x982:\n f:7\n t:8\n z:9'
獲取文件名稱: file.yaml
獲取文件最後修改時間: (2022, 6, 25, 10, 13, 46)
獲取壓縮類型: 0
獲取壓縮後的大小: 123
獲取未壓縮的文件大小: 123
判斷是否是壓縮文件: True
[Finished in 0.2s]

當然getinfo也支持其他的屬性,下面給出比較全的屬性和方法

ZipInfo.filename: 獲取文件名稱。

ZipInfo.date_time: 獲取文件最後修改時間。返回一個包含6個元素的元組:(年, 月, 日, 時, 分, 秒)

ZipInfo.compress_type: 壓縮類型。

ZipInfo.comment: 文檔說明。

ZipInfo.extr: 擴展項數據。

ZipInfo.create_system: 獲取創建該zip文檔的系統。

ZipInfo.create_version: 獲取 創建zip文檔的PKZIP版本。

ZipInfo.extract_version: 獲取 解壓zip文檔所需的PKZIP版本。

ZipInfo.reserved: 預留字段,當前實現總是返回0。

ZipInfo.flag_bits: zip標志位。

ZipInfo.volume: 文件頭的卷標。

ZipInfo.internal_attr: 內部屬性。

ZipInfo.external_attr: 外部屬性。

ZipInfo.header_offset: 文件頭偏移位。

ZipInfo.CRC: 未壓縮文件的CRC-32。

ZipInfo.compress_size: 獲取壓縮後的大小。

ZipInfo.file_size: 獲取未壓縮的文件大小。

 二:py7zr的常用操作

 1,壓縮文件

import py7zr
with py7zr.SevenZipFile('target.7z', 'w') as archive:
archive.writeall('/path/to/base_dir', 'base')

如果想設置密碼壓縮

import py7zr
with py7zr.SevenZipFile('target.7z', 'w', password='secret') as archive:
archive.writeall('/path/to/base_dir', 'base')

2,解壓縮文件

import py7zr
archive = py7zr.SevenZipFile('sample.7z', mode='r')
archive.extractall(path="/tmp")
archive.close()

也支持with模式

import py7zr
with py7zr.SevenZipFile('sample.7z', mode='r') as z:
z.extractall()
with py7zr.SevenZipFile('target.7z', 'w') as z:
z.writeall('./base_dir')

py7z也支持提取某個文件或者符合正則匹配的文件

import py7zr
import re
filter_pattern = re.compile(r'<your/target/file_and_directories/regex/expression>')
with SevenZipFile('archive.7z', 'r') as archive:
allfiles = archive.getnames()
selective_files = [f for f in allfiles if filter_pattern.match(f)]
archive.extract(targets=selective_files)

支持解壓縮加密的7z文件

import py7zr
with py7zr.SevenZipFile('encrypted.7z', mode='r', password='secret') as z:
z.extractall()

  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved