Python如何發(fā)送與接收大型數(shù)組
問題
你要通過網(wǎng)絡(luò)連接發(fā)送和接受連續(xù)數(shù)據(jù)的大型數(shù)組,并盡量減少數(shù)據(jù)的復(fù)制操作。
解決方案
下面的函數(shù)利用 memoryviews 來發(fā)送和接受大數(shù)組:
# zerocopy.pydef send_from(arr, dest): view = memoryview(arr).cast(’B’) while len(view): nsent = dest.send(view) view = view[nsent:]def recv_into(arr, source): view = memoryview(arr).cast(’B’) while len(view): nrecv = source.recv_into(view) view = view[nrecv:]
為了測試程序,首先創(chuàng)建一個通過socket連接的服務(wù)器和客戶端程序:
>>> from socket import *>>> s = socket(AF_INET, SOCK_STREAM)>>> s.bind((’’, 25000))>>> s.listen(1)>>> c,a = s.accept()>>>
在客戶端(另外一個解釋器中):
>>> from socket import *>>> c = socket(AF_INET, SOCK_STREAM)>>> c.connect((’localhost’, 25000))>>>
本節(jié)的目標(biāo)是你能通過連接傳輸一個超大數(shù)組。這種情況的話,可以通過 array 模塊或 numpy 模塊來創(chuàng)建數(shù)組:
# Server>>> import numpy>>> a = numpy.arange(0.0, 50000000.0)>>> send_from(a, c)>>># Client>>> import numpy>>> a = numpy.zeros(shape=50000000, dtype=float)>>> a[0:10]array([ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])>>> recv_into(a, c)>>> a[0:10]array([ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])>>>
討論
在數(shù)據(jù)密集型分布式計(jì)算和平行計(jì)算程序中,自己寫程序來實(shí)現(xiàn)發(fā)送/接受大量數(shù)據(jù)并不常見。 不過,要是你確實(shí)想這樣做,你可能需要將你的數(shù)據(jù)轉(zhuǎn)換成原始字節(jié),以便給低層的網(wǎng)絡(luò)函數(shù)使用。 你可能還需要將數(shù)據(jù)切割成多個塊,因?yàn)榇蟛糠趾途W(wǎng)絡(luò)相關(guān)的函數(shù)并不能一次性發(fā)送或接受超大數(shù)據(jù)塊。
一種方法是使用某種機(jī)制序列化數(shù)據(jù)——可能將其轉(zhuǎn)換成一個字節(jié)字符串。 不過,這樣最終會創(chuàng)建數(shù)據(jù)的一個復(fù)制。 就算你只是零碎的做這些,你的代碼最終還是會有大量的小型復(fù)制操作。
本節(jié)通過使用內(nèi)存視圖展示了一些魔法操作。 本質(zhì)上,一個內(nèi)存視圖就是一個已存在數(shù)組的覆蓋層。不僅僅是那樣, 內(nèi)存視圖還能以不同的方式轉(zhuǎn)換成不同類型來表現(xiàn)數(shù)據(jù)。 這個就是下面這個語句的目的:
view = memoryview(arr).cast(’B’)
它接受一個數(shù)組 arr并將其轉(zhuǎn)換為一個無符號字節(jié)的內(nèi)存視圖。這個視圖能被傳遞給socket相關(guān)函數(shù), 比如 socket.send() 或 send.recv_into() 。 在內(nèi)部,這些方法能夠直接操作這個內(nèi)存區(qū)域。例如,sock.send() 直接從內(nèi)存中發(fā)生數(shù)據(jù)而不需要復(fù)制。 send.recv_into() 使用這個內(nèi)存區(qū)域作為接受操作的輸入緩沖區(qū)。
剩下的一個難點(diǎn)就是socket函數(shù)可能只操作部分?jǐn)?shù)據(jù)。 通常來講,我們得使用很多不同的 send() 和 recv_into() 來傳輸整個數(shù)組。 不用擔(dān)心,每次操作后,視圖會通過發(fā)送或接受字節(jié)數(shù)量被切割成新的視圖。 新的視圖同樣也是內(nèi)存覆蓋層。因此,還是沒有任何的復(fù)制操作。
這里有個問題就是接受者必須事先知道有多少數(shù)據(jù)要被發(fā)送, 以便它能預(yù)分配一個數(shù)組或者確保它能將接受的數(shù)據(jù)放入一個已經(jīng)存在的數(shù)組中。 如果沒辦法知道的話,發(fā)送者就得先將數(shù)據(jù)大小發(fā)送過來,然后再發(fā)送實(shí)際的數(shù)組數(shù)據(jù)。
以上就是Python如何發(fā)送與接收大型數(shù)組的詳細(xì)內(nèi)容,更多關(guān)于Python發(fā)送接收大型數(shù)組的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. 使用python tkinter開發(fā)一個爬取B站直播彈幕工具的實(shí)現(xiàn)代碼2. Python 用NumPy創(chuàng)建二維數(shù)組的案例3. ThinkPHP6使用JWT+中間件實(shí)現(xiàn)Token驗(yàn)證實(shí)例詳解4. Python使用oslo.vmware管理ESXI虛擬機(jī)的示例參考5. 解決Python中報錯TypeError: must be str, not bytes問題6. 不使用XMLHttpRequest對象實(shí)現(xiàn)Ajax效果的方法小結(jié)7. python安裝sklearn模塊的方法詳解8. Python如何解決secure_filename對中文不支持問題9. Python類成員繼承重寫的實(shí)現(xiàn)10. ASP基礎(chǔ)入門第二篇(ASP基礎(chǔ)知識)
