文章詳情頁

PC端訪問卻變成移動端地址問題#python#scrapy

瀏覽：148日期：2022-06-27 08:35:16

問題描述

用scrapy 爬取喜馬拉雅，爬取PC端地址，入口鏈接的response沒問題，但后面response看到的是移動端地址。。。。

spider 代碼如下：

class SpxmlySpider(scrapy.Spider): name = ’ximalaya’ allowed_domains = ['ximalaya.com'] # 保存每頁鏈接 start_urls = [’http://www.ximalaya.com/dq/all/{}’.format(num) for num in range(2, 3)] #先改為第二頁試試 def parse(self, response):# 取出專輯鏈接print(response)mainurls = response.xpath(’//p[@class='albumfaceOutter']/a/@href’).extract()# for url in mainurls:# yield Request(url = url, callback=self.parse_details)print(mainurls[0])yield Request(url = mainurls[0], dont_filter=True, callback = self.parse_details)# TODO 為什么PC端訪問會變成移動地址問題！！！！！！！！！！！！！！！！！ def parse_details(self, response):item = XimalayaItem()print(response)......以下省略

控制臺輸出：

PC端訪問卻變成移動端地址問題#python#scrapy

已經寫了一個 middlewares.RotateUserAgentMiddleware，是生效的，輸出內容也可以看出來。

是不是觸發什么反爬機制？

問題解答

回答1：

應該是你的headers沒有設置user-agent的原因

回答2：

request headers 好好配置一下, 判斷是不是移動端一般是靠user-agent啥都沒有也能訪問到數據，也說明目標網站沒怎么在意防盜鏈

Python 編程

上一條：python - Django操作數據庫遇到問題，無法查詢更新后的數據下一條：python - scrapy抓取知網response的內容重復

相關文章：

1. 如何解決docker宿主機無法訪問容器中的服務？2. angular.js - 輸入郵箱地址之后，如何使其自動在末尾添加分號？3. javascript - 如何使用nodejs 將.html 文件轉化成canvas4. javascript - html5的data屬性怎么指定一個function函數呢？5. docker-compose中volumes的問題6. 在mac下出現了兩個docker環境7. python - Scrapy存在內存泄漏的問題。8. javascript - 后臺管理系統左側折疊導航欄數據較多，怎么樣直接通過搜索去定位到具體某一個菜單項位置，并展開當前菜單9. java如何生成token？10. mysql - 記得以前在哪里看過一個估算時間的網站

排行榜

					
					如何解決docker宿主機無法訪問容器中的服務？
angular.js - 輸入郵箱地址之后， 如何使其自動在末尾添加分號？
javascript - 如何使用nodejs 將.html 文件轉化成canvas
javascript - html5的data屬性怎么指定一個function函數呢？
docker-compose中volumes的問題
在mac下出現了兩個docker環境
javascript - 后臺管理系統左側折疊導航欄數據較多，怎么樣直接通過搜索去定位到具體某一個菜單項位置，并展開當前菜單
python - Scrapy存在內存泄漏的問題。
java如何生成token？
angular.js - ionic2 瀏覽器跨域問題
docker  下面創建的IMAGE 他們的 ID 一樣？這個是怎么回事？？？？
				

熱門標簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

PC端訪問卻變成移動端地址問題#python#scrapy