文章詳情頁

python - Scrapy中xpath用到中文報錯

瀏覽：156日期：2022-06-27 08:01:12

問題描述

問題描述

links = sel.xpath(’//i[contains(@title,'置頂')]/following-sibling::a/@href’).extract()

報錯：ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters

問題解答

回答1：

參見文章：解決Scrapy中xpath用到中文報錯問題

解決方法

方法一：將整個xpath語句轉成Unicode

links = sel.xpath(u’//i[contains(@title,'置頂')]/following-sibling::a/@href’).extract()

方法二：xpath語句用已轉成Unicode的title變量

title = u'置頂'links = sel.xpath(’//i[contains(@title,'%s')]/following-sibling::a/@href’ %(title)).extract()

方法三：直接用xpath中變量語法($符號加變量名)$title, 傳參title即可

links = sel.xpath(’//i[contains(@title,$title)]/following-sibling::a/@href’,).extract()回答2：

整個字符串前加個u試試

Python 編程

上一條：求大神解讀一段神級的Python代碼，謝謝！！下一條：python for循環中的函數只能運行一次？

相關文章：

1. javascript - [js]為什么畫布里不出現圖片呢？在線等2. sql語句 - mysql中關聯表查詢問題3. javascript - 如何將一個div始終固定在某個位置；無論屏幕和分辨率怎么變化；div位置始終不變4. html5 - 有可以一次性把所有 css外部樣式轉為html標簽內style=" "的方法嗎?5. javascript - vscode alt+shift+f 格式化js代碼，通不過eslint的代碼風格檢查怎么辦。。。6. html - vue項目中用到了elementUI問題7. javascript - 有什么比較好的網頁版shell前端組件？8. javascript - iframe 為什么加載網頁的時候滾動條這樣顯示？9. javascript - 求解答：實例對象調用constructor，此時constructor內的this的指向？10. javascript - 原生canvas中如何獲取到觸摸事件的canvas內坐標?

排行榜

					
					docker gitlab 如何git clone？
debian - docker依賴的aufs-tools源碼哪里可以找到啊？
docker內創建jenkins訪問另一個容器下的服務器問題
golang - 用IDE看docker源碼時的小問題
如何解決Centos下Docker服務啟動無響應，且輸入docker命令無響應？
javascript - 求解答：實例對象調用constructor，此時constructor內的this的指向？
javascript - vscode alt+shift+f 格式化js代碼，通不過eslint的代碼風格檢查怎么辦。。。
angular.js - Angular-Strap  模態框(Modal) 報錯
java - 如何寫一個intellij-idea插件，實現編譯時修改源代碼的目的
IntelliJ IDEA無法解析導入javax.servlet。*;
javascript - iframe 為什么加載網頁的時候滾動條這樣顯示？
				

熱門標簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

python - Scrapy中xpath用到中文報錯