文章詳情頁(yè)

Python request中文亂碼問題解決方案

瀏覽：111日期：2022-07-11 08:07:16

Python request獲取網(wǎng)頁(yè)中文亂碼問題

r = requests.get(“http://www.baidu.com“)

**r.text返回的是Unicode型的數(shù)據(jù)。

使用r.content返回的是bytes型的數(shù)據(jù)。

也就是說(shuō)，如果你想取文本，可以通過r.text。

如果想取圖片，文件，則可以通過r.content。**

方法1：使用r.text

Requests 會(huì)自動(dòng)解碼來(lái)自服務(wù)器的內(nèi)容。大多數(shù) unicode 字符集都能被無(wú)縫地解碼。請(qǐng)求發(fā)出后，Requests 會(huì)基于 HTTP 頭部對(duì)響應(yīng)的編碼作出有根據(jù)的推測(cè)。當(dāng)你訪問 r.text 之時(shí)，Requests 會(huì)使用其推測(cè)的文本編碼。你可以找出 Requests 使用了什么編碼，并且能夠使用 r.encoding 屬性來(lái)改變它.

但是Requests庫(kù)的自身編碼為: r.encoding = ‘ISO-8859-1’

可以 r.encoding 修改編碼

url=’http://music.baidu.com’r=requests.get(url)r.encoding=’utf-8’print(r.text)

方法2：使用r.content

使用r.content，得到的是bytes型，再轉(zhuǎn)為str

url=’http://music.baidu.com’r = requests.get(url)html=r.contenthtml_doc=str(html,’utf-8’) #html_doc=html.decode('utf-8','ignore')print(html_doc)

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持好吧啦網(wǎng)。

Python 編程

上一條：Python繪制組合圖的示例下一條：python如何使用騰訊云發(fā)送短信

相關(guān)文章：

1. 告別AJAX實(shí)現(xiàn)無(wú)刷新提交表單2. 小技巧處理div內(nèi)容溢出3. chat.asp聊天程序的編寫方法4. 使用XSL將XML文檔中的CDATA注釋輸出為HTML文本5. 讀寫xml文件的2個(gè)小函數(shù)6. PHP循環(huán)與分支知識(shí)點(diǎn)梳理7. 低版本IE正常運(yùn)行HTML5+CSS3網(wǎng)站的3種解決方案8. JavaWeb Servlet中url-pattern的使用9. ASP 信息提示函數(shù)并作返回或者轉(zhuǎn)向10. XML入門的常見問題(一)

排行榜

					
					教你在 IntelliJ IDEA 中使用 VIM插件的詳細(xì)教程
低版本IE正常運(yùn)行HTML5+CSS3網(wǎng)站的3種解決方案
在Android中查看當(dāng)前Activity是否銷毀的操作
axios和ajax的區(qū)別點(diǎn)總結(jié)
Android PC端用ADB抓取指定應(yīng)用日志實(shí)現(xiàn)步驟
idea設(shè)置自動(dòng)導(dǎo)入依賴的方法步驟
IntelliJ IDEA 2020常用配置設(shè)置大全(方便干活)
IntelliJ IDEA2021.2.3破解，IDEA 2021.2.x激活破解，2022激活持續(xù)更新
Spring Cloud Feign 自定義配置(重試、攔截與錯(cuò)誤碼處理) 代碼實(shí)踐
Java DriverManager.getConnection()獲取數(shù)據(jù)庫(kù)連接
基于idea把maven工程轉(zhuǎn)換為web項(xiàng)目