文章詳情頁

python 下載文件的幾種方式分享

瀏覽：7日期：2022-06-23 09:39:42

1 、一般同步下載

示例代碼：

import requestsimport osdef downlaod(url, file_path): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0' } r = requests.get(url=url, headers=headers) with open(file_path, 'wb') as f: f.write(r.content) f.flush()2、使用流式請求，requests.get方法的stream

默認情況下是stream的值為false，它會立即開始下載文件并存放到內存當中，倘若文件過大就會導致內存不足的情況，程序就會報錯。當把get函數(shù)的stream參數(shù)設置成True時，它不會立即開始下載，當你使用iter_content或iter_lines遍歷內容或訪問內容屬性時才開始下載，需要注意一點：文件沒有下載之前，它也需要保持連接。

iter_content：一塊一塊的遍歷要下載的內容iter_lines：一行一行的遍歷要下載的內容

使用上面兩個函數(shù)下載大文件可以防止占用過多的內存，因為每次只下載小部分數(shù)據(jù)。

示例代碼:

3 、異步下載文件

由于request的請求是阻塞式的，所以要用aiohttp模塊來發(fā)起請求。

示例代碼：

import aiohttpimport asyncioimport osasync def handler(url, file_path): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0' } async with aiohttp.ClientSession() as session: r = await session.get(url=url, headers=headers) with open(file_path, 'wb') as f: f.write(await r.read()) f.flush() os.fsync(f.fileno())loop = asyncio.get_event_loop()loop.run_until_complete(handler(url, file_path))4、異步拆分下載文件

上面用的是一個協(xié)程下載一個文件，下面的方法是將文件分成幾部分，每個部分用一個協(xié)程下載，最后再寫入文件。

下面這個例子用的是流式寫入，即把內容寫入到磁盤里面。

import aiohttpimport asyncioimport timeimport osasync def consumer(queue): option = await queue.get() start = option['start'] end = option['end'] url = option['url'] filename = option['filename'] i = option['i'] print(f'第{i}個任務開始運行') async with aiohttp.ClientSession() as session: headers = {'Range': f'bytes={start}-{end}'} r = await session.get(url=url, headers=headers) with open(filename, 'rb+') as f: f.seek(start) while True:chunk = await r.content.read(end - start)if not chunk: breakf.write(chunk)f.flush()os.fsync(f.fileno())print(f'第{i}個任務正在寫入中ing') queue.task_done() print(f'第{i}個任務寫入成功')async def producer(url, headers, filename, queue, coro_num): async with aiohttp.ClientSession() as session: resp = await session.head(url=url, headers=headers) file_size = int(resp.headers['content-length']) # 創(chuàng)建一個文件 with open(filename, 'wb') as f: pass part = file_size // coro_num for i in range(coro_num): start = part * i if i == coro_num - 1:end = file_size else:end = start + part info = {'start': start,'end': end,'url': url,'filename': filename,'i': i, } queue.put_nowait(info)async def main(): # 需要填的有url，filename，coro_num url = '' filename = '' coro_num = 0 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0' } queue = asyncio.Queue(coro_num) await producer(url, headers, filename, queue, coro_num) task_list = [] for i in range(coro_num): task = asyncio.create_task(consumer(queue)) task_list.append(task) await queue.join() for i in task_list: i.cancel() await asyncio.gather(*task_list)startt = time.time()loop = asyncio.get_event_loop()loop.run_until_complete(main())end = time.time() - starttprint(f'用了{end}秒')5、注意

以上的示例都是介紹思路，程序并不健壯，健壯的程序需要加入錯誤捕獲和錯誤處理。

以上就是python 下載文件的幾種方式分享的詳細內容，更多關于python 下載文件的資料請關注好吧啦網(wǎng)其它相關文章！

Python 編程

上一條：python如何在word中存儲本地圖片下一條：完美處理python與anaconda環(huán)境變量的沖突問題

相關文章：

1. Python使用oslo.vmware管理ESXI虛擬機的示例參考2. Jsp servlet驗證碼工具類分享3. ASP.NET MVC實現(xiàn)區(qū)域或城市選擇4. Laravel?Eloquent的九個實用特性詳解5. Intellij IDEA 2018配置Java運行環(huán)境的方法步驟6. 淺談PHP設計模式之門面模式Facade7. python實現(xiàn)自動打卡的示例代碼8. 利用 Python ElementTree 生成 xml的實例9. python 調用js的四種方式10. python 生成xml文件,以及美化的實例代碼

排行榜

					
					Python使用oslo.vmware管理ESXI虛擬機的示例參考
Jsp servlet驗證碼工具類分享
ASP.NET MVC實現(xiàn)區(qū)域或城市選擇
Laravel?Eloquent的九個實用特性詳解
python實現(xiàn)自動打卡的示例代碼
解決Django提交表單報錯:CSRF token missing or incorrect的問題
JS數(shù)據(jù)類型判斷的幾種常用方法
python 生成xml文件,以及美化的實例代碼
python 調用js的四種方式
利用 Python ElementTree 生成 xml的實例
Matrix Java 大講壇之 JVM移植研究