萬盛學電腦網

 萬盛學電腦網 >> 網絡編程 >> 編程語言綜合 >> 淺析Python中的序列化存儲的方法

淺析Python中的序列化存儲的方法

   這篇文章主要介紹了Python中的序列化存儲的方法,序列化存儲主要針對的是內存和硬盤之間的寫入操作,需要的朋友可以參考下

  在程序運行的過程中,所有的變量都是在內存中,比如,定義一個dict:

  ?

1 d = dict(name='Bob', age=20, score=88)

  可以隨時修改變量,比如把name改成'Bill',但是一旦程序結束,變量所占用的內存就被操作系統全部回收。如果沒有把修改後的'Bill'存儲到磁盤上,下次重新運行程序,變量又被初始化為'Bob'。

  我們把變量從內存中變成可存儲或傳輸的過程稱之為序列化,在Python中叫pickling,在其他語言中也被稱之為serialization,marshalling,flattening等等,都是一個意思。

  序列化之後,就可以把序列化後的內容寫入磁盤,或者通過網絡傳輸到別的機器上。

  反過來,把變量內容從序列化的對象重新讀到內存裡稱之為反序列化,即unpickling。

  Python提供兩個模塊來實現序列化:cPickle和pickle。這兩個模塊功能是一樣的,區別在於cPickle是C語言寫的,速度快,pickle是純Python寫的,速度慢,跟cStringIO和StringIO一個道理。用的時候,先嘗試導入cPickle,如果失敗,再導入pickle:

  ?

1 2 3 4 try: import cPickle as pickle except ImportError: import pickle

  首先,我們嘗試把一個對象序列化並寫入文件:

  ?

1 2 3 >>> d = dict(name='Bob', age=20, score=88) >>> pickle.dumps(d) "(dp0nS'age'np1nI20nsS'score'np2nI88nsS'name'np3nS'Bob'np4ns."

  pickle.dumps()方法把任意對象序列化成一個str,然後,就可以把這個str寫入文件。或者用另一個方法pickle.dump()直接把對象序列化後寫入一個file-like Object:

  ?

1 2 3 >>> f = open('dump.txt', 'wb') >>> pickle.dump(d, f) >>> f.close()

  看看寫入的dump.txt文件,一堆亂七八糟的內容,這些都是Python保存的對象內部信息。

  當我們要把對象從磁盤讀到內存時,可以先把內容讀到一個str,然後用pickle.loads()方法反序列化出對象,也可以直接用pickle.load()方法從一個file-like Object中直接反序列化出對象。我們打開另一個Python命令行來反序列化剛才保存的對象:

  ?

1 2 3 4 5 >>> f = open('dump.txt', 'rb') >>> d = pickle.load(f) >>> f.close() >>> d {'age': 20, 'score': 88, 'name': 'Bob'}

  變量的內容又回來了!

  當然,這個變量和原來的變量是完全不相干的對象,它們只是內容相同而已。

  Pickle的問題和所有其他編程語言特有的序列化問題一樣,就是它只能用於Python,並且可能不同版本的Python彼此都不兼容,因此,只能用Pickle保存那些不重要的數據,不能成功地反序列化也沒關系。

copyright © 萬盛學電腦網 all rights reserved