這篇文章主要介紹了Python多線程下的變量問題,由於GIL的存在,Python的多線程編程問題一直是開發者中的熱點話題,需要的朋友可以參考下
在多線程環境下,每個線程都有自己的數據。一個線程使用自己的局部變量比使用全局變量好,因為局部變量只有線程自己能看見,不會影響其他線程,而全局變量的修改必須加鎖。
但是局部變量也有問題,就是在函數調用的時候,傳遞起來很麻煩:
?
1 2 3 4 5 6 7 8 9 10 11 12 13 def process_student(name): std = Student(name) # std是局部變量,但是每個函數都要用它,因此必須傳進去: do_task_1(std) do_task_2(std) def do_task_1(std): do_subtask_1(std) do_subtask_2(std) def do_task_2(std): do_subtask_2(std) do_subtask_2(std)每個函數一層一層調用都這麼傳參數那還得了?用全局變量?也不行,因為每個線程處理不同的Student對象,不能共享。
如果用一個全局dict存放所有的Student對象,然後以thread自身作為key獲得線程對應的Student對象如何?
?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 global_dict = {} def std_thread(name): std = Student(name) # 把std放到全局變量global_dict中: global_dict[threading.current_thread()] = std do_task_1() do_task_2() def do_task_1(): # 不傳入std,而是根據當前線程查找: std = global_dict[threading.current_thread()] ... def do_task_2(): # 任何函數都可以查找出當前線程的std變量: std = global_dict[threading.current_thread()] ...這種方式理論上是可行的,它最大的優點是消除了std對象在每層函數中的傳遞問題,但是,每個函數獲取std的代碼有點丑。
有沒有更簡單的方式?
ThreadLocal應運而生,不用查找dict,ThreadLocal幫你自動做這件事:
?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 import threading # 創建全局ThreadLocal對象: local_school = threading.local() def process_student(): print 'Hello, %s (in %s)' % (local_school.student, threading.current_thread().name) def process_thread(name): # 綁定ThreadLocal的student: local_school.student = name process_student() t1 = threading.Thread(target= process_thread, args=('Alice',), name='Thread-A') t2 = threading.Thread(target= process_thread, args=('Bob',), name='Thread-B') t1.start() t2.start() t1.join() t2.join()執行結果:
?
1 2 Hello, Alice (in Thread-A) Hello, Bob (in Thread-B)全局變量local_school就是一個ThreadLocal對象,每個Thread對它都可以讀寫student屬性,但互不影響。你可以把local_school看成全局變量,但每個屬性如local_school.student都是線程的局部變量,可以任意讀寫而互不干擾,也不用管理鎖的問題,ThreadLocal內部會處理。
可以理解為全局變量local_school是一個dict,不但可以用local_school.student,還可以綁定其他變量,如local_school.teacher等等。
ThreadLocal最常用的地方就是為每個線程綁定一個數據庫連接,HTTP請求,用戶身份信息等,這樣一個線程的所有調用到的處理函數都可以非常方便地訪問這些資源。