乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      分布式進(jìn)程

       阿甘ch1wn8cyc3 2019-03-28

      在Thread和Process中,應(yīng)當(dāng)優(yōu)選Process,因為Process更穩(wěn)定,而且,Process可以分布到多臺機(jī)器上,而Thread最多只能分布到同一臺機(jī)器的多個CPU上。

      Python的multiprocessing模塊不但支持多進(jìn)程,其中managers子模塊還支持把多進(jìn)程分布到多臺機(jī)器上。一個服務(wù)進(jìn)程可以作為調(diào)度者,將任務(wù)分布到其他多個進(jìn)程中,依靠網(wǎng)絡(luò)通信。由于managers模塊封裝很好,不必了解網(wǎng)絡(luò)通信的細(xì)節(jié),就可以很容易地編寫分布式多進(jìn)程程序。

      舉個例子:如果我們已經(jīng)有一個通過Queue通信的多進(jìn)程程序在同一臺機(jī)器上運行,現(xiàn)在,由于處理任務(wù)的進(jìn)程任務(wù)繁重,希望把發(fā)送任務(wù)的進(jìn)程和處理任務(wù)的進(jìn)程分布到兩臺機(jī)器上。怎么用分布式進(jìn)程實現(xiàn)?

      原有的Queue可以繼續(xù)使用,但是,通過managers模塊把Queue通過網(wǎng)絡(luò)暴露出去,就可以讓其他機(jī)器的進(jìn)程訪問Queue了。

      我們先看服務(wù)進(jìn)程,服務(wù)進(jìn)程負(fù)責(zé)啟動Queue,把Queue注冊到網(wǎng)絡(luò)上,然后往Queue里面寫入任務(wù):

      # taskmanager.py
      
      import random, time, Queue
      from multiprocessing.managers import BaseManager
      
      # 發(fā)送任務(wù)的隊列:
      task_queue = Queue.Queue()
      # 接收結(jié)果的隊列:
      result_queue = Queue.Queue()
      
      # 從BaseManager繼承的QueueManager:
      class QueueManager(BaseManager):
          pass
      
      # 把兩個Queue都注冊到網(wǎng)絡(luò)上, callable參數(shù)關(guān)聯(lián)了Queue對象:
      QueueManager.register('get_task_queue', callable=lambda: task_queue)
      QueueManager.register('get_result_queue', callable=lambda: result_queue)
      # 綁定端口5000, 設(shè)置驗證碼'abc':
      manager = QueueManager(address=('', 5000), authkey='abc')
      # 啟動Queue:
      manager.start()
      # 獲得通過網(wǎng)絡(luò)訪問的Queue對象:
      task = manager.get_task_queue()
      result = manager.get_result_queue()
      # 放幾個任務(wù)進(jìn)去:
      for i in range(10):
          n = random.randint(0, 10000)
          print('Put task %d...' % n)
          task.put(n)
      # 從result隊列讀取結(jié)果:
      print('Try get results...')
      for i in range(10):
          r = result.get(timeout=10)
          print('Result: %s' % r)
      # 關(guān)閉:
      manager.shutdown()
      

      請注意,當(dāng)我們在一臺機(jī)器上寫多進(jìn)程程序時,創(chuàng)建的Queue可以直接拿來用,但是,在分布式多進(jìn)程環(huán)境下,添加任務(wù)到Queue不可以直接對原始的task_queue進(jìn)行操作,那樣就繞過了QueueManager的封裝,必須通過manager.get_task_queue()獲得的Queue接口添加。

      然后,在另一臺機(jī)器上啟動任務(wù)進(jìn)程(本機(jī)上啟動也可以):

      # taskworker.py
      
      import time, sys, Queue
      from multiprocessing.managers import BaseManager
      
      # 創(chuàng)建類似的QueueManager:
      class QueueManager(BaseManager):
          pass
      
      # 由于這個QueueManager只從網(wǎng)絡(luò)上獲取Queue,所以注冊時只提供名字:
      QueueManager.register('get_task_queue')
      QueueManager.register('get_result_queue')
      
      # 連接到服務(wù)器,也就是運行taskmanager.py的機(jī)器:
      server_addr = '127.0.0.1'
      print('Connect to server %s...' % server_addr)
      # 端口和驗證碼注意保持與taskmanager.py設(shè)置的完全一致:
      m = QueueManager(address=(server_addr, 5000), authkey='abc')
      # 從網(wǎng)絡(luò)連接:
      m.connect()
      # 獲取Queue的對象:
      task = m.get_task_queue()
      result = m.get_result_queue()
      # 從task隊列取任務(wù),并把結(jié)果寫入result隊列:
      for i in range(10):
          try:
              n = task.get(timeout=1)
              print('run task %d * %d...' % (n, n))
              r = '%d * %d = %d' % (n, n, n*n)
              time.sleep(1)
              result.put(r)
          except Queue.Empty:
              print('task queue is empty.')
      # 處理結(jié)束:
      print('worker exit.')
      

      任務(wù)進(jìn)程要通過網(wǎng)絡(luò)連接到服務(wù)進(jìn)程,所以要指定服務(wù)進(jìn)程的IP。

      現(xiàn)在,可以試試分布式進(jìn)程的工作效果了。先啟動taskmanager.py服務(wù)進(jìn)程:

      $ python taskmanager.py 
      Put task 3411...
      Put task 1605...
      Put task 1398...
      Put task 4729...
      Put task 5300...
      Put task 7471...
      Put task 68...
      Put task 4219...
      Put task 339...
      Put task 7866...
      Try get results...
      

      taskmanager進(jìn)程發(fā)送完任務(wù)后,開始等待result隊列的結(jié)果。現(xiàn)在啟動taskworker.py進(jìn)程:

      $ python taskworker.py 127.0.0.1
      Connect to server 127.0.0.1...
      run task 3411 * 3411...
      run task 1605 * 1605...
      run task 1398 * 1398...
      run task 4729 * 4729...
      run task 5300 * 5300...
      run task 7471 * 7471...
      run task 68 * 68...
      run task 4219 * 4219...
      run task 339 * 339...
      run task 7866 * 7866...
      worker exit.
      

      taskworker進(jìn)程結(jié)束,在taskmanager進(jìn)程中會繼續(xù)打印出結(jié)果:

      Result: 3411 * 3411 = 11634921
      Result: 1605 * 1605 = 2576025
      Result: 1398 * 1398 = 1954404
      Result: 4729 * 4729 = 22363441
      Result: 5300 * 5300 = 28090000
      Result: 7471 * 7471 = 55815841
      Result: 68 * 68 = 4624
      Result: 4219 * 4219 = 17799961
      Result: 339 * 339 = 114921
      Result: 7866 * 7866 = 61873956
      

      這個簡單的Manager/Worker模型有什么用?其實這就是一個簡單但真正的分布式計算,把代碼稍加改造,啟動多個worker,就可以把任務(wù)分布到幾臺甚至幾十臺機(jī)器上,比如把計算n*n的代碼換成發(fā)送郵件,就實現(xiàn)了郵件隊列的異步發(fā)送。

      Queue對象存儲在哪?注意到taskworker.py中根本沒有創(chuàng)建Queue的代碼,所以,Queue對象存儲在taskmanager.py進(jìn)程中:

      分布式進(jìn)程

      Queue之所以能通過網(wǎng)絡(luò)訪問,就是通過QueueManager實現(xiàn)的。由于QueueManager管理的不止一個Queue,所以,要給每個Queue的網(wǎng)絡(luò)調(diào)用接口起個名字,比如get_task_queue。

      authkey有什么用?這是為了保證兩臺機(jī)器正常通信,不被其他機(jī)器惡意干擾。如果taskworker.pyauthkeytaskmanager.pyauthkey不一致,肯定連接不上。

      小結(jié)

      Python的分布式進(jìn)程接口簡單,封裝良好,適合需要把繁重任務(wù)分布到多臺機(jī)器的環(huán)境下。

      注意Queue的作用是用來傳遞任務(wù)和接收結(jié)果,每個任務(wù)的描述數(shù)據(jù)量要盡量小。比如發(fā)送一個處理日志文件的任務(wù),就不要發(fā)送幾百兆的日志文件本身,而是發(fā)送日志文件存放的完整路徑,由Worker進(jìn)程再去共享的磁盤上讀取文件。

        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多