久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - Python:爬蟲的中文編碼問題?

瀏覽:177日期:2022-08-26 10:56:16

問題描述

爬取中文網頁后正則匹配出中文,得打UTF-8的編碼字符網頁爬蟲 - Python:爬蟲的中文編碼問題?

將其輸出為.csv文件網頁爬蟲 - Python:爬蟲的中文編碼問題?

在.CSV中顯示為亂碼網頁爬蟲 - Python:爬蟲的中文編碼問題?

用記事本打開.csv又可以正常顯示為中文網頁爬蟲 - Python:爬蟲的中文編碼問題?

有沒有大神指點是怎么一回事?怎樣才能在Excel里直接看到中文?

問題解答

回答1:

簡單地方法是用pandas的to_excel方法轉化成.xlsx文件,因為.xlsx默認編碼是默認支持Excel的,區別當然是無法用記事本打開。

import pandas as pda = pd.read_csv(’./test.csv’)a.to_excel(’./test_output.xlsx’, index=False)a.to_excel(’./test_output.csv’, index=False)

我這里沒有windows可以測試,可以嘗試寫入編碼為gb2312或者gbk試試。

表格文件類I/O的話其實pandas更方便一點。

回答2:

abs1=abs1.decode().encode(’gbk’)

回答3:

excel默認使用的是GBK編碼。

回答4:

新建一個excel文件,然后點 數據 自文本,導入csv文件

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 锡林郭勒盟| 郧西县| 县级市| 新津县| 扎赉特旗| 京山县| 田林县| 清丰县| 淄博市| 庄河市| 扎赉特旗| 晋宁县| 兰溪市| 孟连| 乐昌市| 翼城县| 玛多县| 义乌市| 金昌市| 宣武区| 神农架林区| 九台市| 张家口市| 峡江县| 富顺县| 凭祥市| 两当县| 盘山县| 蚌埠市| 孟州市| 和龙市| 五莲县| 横山县| 杂多县| 五家渠市| 普定县| 四川省| 安龙县| 新余市| 千阳县| 阳东县|