文章詳情頁
javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。
瀏覽:81日期:2022-08-04 16:42:25
問題描述
因為在爬取的網站需要賬號登陸,不方便公開。因此我只能這樣大致性的咨詢,實在抱歉。
我需要爬一個目標網站的數據,發現在點擊下一頁時候,網址并沒有改變.通過源碼確定是使用了js外加ajax的樣子.通過chrome的控制臺,捕獲到點擊下一頁時候,向指定地址發送了一條帶多個參數的get指令。
原先采用selenium+phantomjs的方式暴力無腦方式爬取,一個頁面大概5S左右就能獲取,實際用瀏覽器打開也是這個速度。為了爬取大量的數據,準備改用多線程+直接requests.get目標地址的方式來采集,但是發現采集速度非常的慢,從5S降到的20s左右。
請教下,出現這樣現象的原因可能是什么?我該如何解決?請指教
問題解答
回答1:抱歉 浪費了各位的時間- -是我開始測試的時候,周圍有人再下迅雷,網絡炸了。抱歉 抱歉
相關文章:
1. javascript - 如何使用loadash對[object,object,object]形式的數組進行比較2. 這種數據怎么合并啊?3. 請教各位大佬,瀏覽器點 提交實例為什么沒有反應4. javascript - 如何清除向可編輯的(contenteditable)元素里粘貼的文本的標簽和樣式?5. mysql優化 - 關于mysql分區6. 如何分別在Windows下用Winform項模板+C#,在MacOSX下用Cocos Application項目模板+Objective-C實現一個制作游戲的空的黑窗口?7. angular.js - 百度支持_escaped_fragment_嗎?8. javascript - ionic2 input autofocus 電腦成功,iOS手機鍵盤不彈出9. nlp - python如何對一篇文章自動分段?10. css3 - 這個形狀使用CSS怎么寫出來?
排行榜
