程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 更多編程語言 >> Python >> Python中使用pickle持久化對象

Python中使用pickle持久化對象

編輯:Python

Python中可以使用 pickle 模塊將對象轉化為文件保存在磁盤上,在需要的時候再讀取並還原。具體用法如下:

pickle.dump(obj, file[, protocol])

這是將對象持久化的方法,參數的含義分別為:
obj: 要持久化保存的對象;
file: 一個擁有 write() 方法的對象,並且這個 write() 方法能接收一個字符串作為參數。這個對象可以是一個以寫模式打開的文件對象或者一個 StringIO 對象,或者其他自定義的滿足條件的對象。
protocol: 這是一個可選的參數,默認為 0 ,如果設置為 1 或 True,則以高壓縮的二進制格式保存持久化後的對象,否則以ASCII格式保存。

對象被持久化後怎麼還原呢?pickle 模塊也提供了相應的方法,如下:

pickle.load(file)

只有一個參數 file ,對應於上面 dump 方法中的 file 參數。這個 file 必須是一個擁有一個能接收一個整數為參數的 read() 方法以及一個不接收任何參數的 readline() 方法,並且這兩個方法的返回值都應該是字符串。這可以是一個打開為讀的文件對象、StringIO 對象或其他任何滿足條件的對象。

下面是一個基本的用例:

# -*- coding: utf-8 -*-

import pickle
# 也可以這樣:
# import cPickle as pickle

obj = {"a": 1, "b": 2, "c": 3}

# 將 obj 持久化保存到文件 tmp.txt 中
pickle.dump(obj, open("tmp.txt", "w"))

# do something else ...

# 從 tmp.txt 中讀取並恢復 obj 對象
obj2 = pickle.load(open("tmp.txt", "r"))

print obj2

 

不過實際應用中,我們可能還會有一些改進,比如用 cPickle 來代替 pickle ,前者是後者的一個 C 語言實現版本,擁有更快的速度,另外,有時在 dump 時也會將第三個參數設為 True 以提高壓縮比。再來看下面的例子:

# -*- coding: utf-8 -*-

import cPickle as pickle
import random
import os

import time

LENGTH = 1024 * 10240

def main():
d = {}
a = []
for i in range(LENGTH):
a.append(random.randint(0, 255))

d["a"] = a

print "dumping..."

t1 = time.time()
pickle.dump(d, open("tmp1.dat", "wb"), True)
print "dump1: %.3fs" % (time.time() - t1)

t1 = time.time()
pickle.dump(d, open("tmp2.dat", "w"))
print "dump2: %.3fs" % (time.time() - t1)

s1 = os.stat("tmp1.dat").st_size
s2 = os.stat("tmp2.dat").st_size

print "%d, %d, %.2f%%" % (s1, s2, 100.0 * s1 / s2)

print "loading..."

t1 = time.time()
obj1 = pickle.load(open("tmp1.dat", "rb"))
print "load1: %.3fs" % (time.time() - t1)

t1 = time.time()
obj2 = pickle.load(open("tmp2.dat", "r"))
print "load2: %.3fs" % (time.time() - t1)


if __name__ == "__main__":
main()

在我的電腦上執行結果為:

dumping…
dump1: 1.297s
dump2: 4.750s
20992503, 68894198, 30.47%
loading…
load1: 2.797s
load2: 10.125s

可以看到,dump 時如果指定了 protocol 為 True,壓縮過後的文件的大小只有原來的文件的 30% ,同時無論在 dump 時還是 load 時所耗費的時間都比原來少。因此,一般來說,可以建議把這個值設為 True 。

另外,pickle 模塊還提供 dumps 和 loads 兩個方法,用法與上面的 dump 和 load 方法類似,只是不需要輸入 file 參數,輸入及輸出都是字符串對象,有些場景中使用這兩個方法可能更為方便。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved