Python爬蟲實現(xiàn)百度翻譯功能過程詳解
首先,需要簡單的了解一下爬蟲,盡可能簡單快速的上手,其次,需要了解的是百度的API的接口,搞定這個之后,最后,按照官方給出的demo,然后寫自己的一個小程序
打開瀏覽器 F12 打開百度翻譯網(wǎng)頁源代碼:
我們可以輕松的找到百度翻譯的請求接口為:http://fanyi.baidu.com/sug
然后我們可以從方法為POST的請求中找到參數(shù)為:kw:job(job是輸入翻譯的內(nèi)容)
下面是代碼部分:
from urllib import request,parseimport jsondef translate(content): url = 'http://fanyi.baidu.com/sug' data = parse.urlencode({'kw':content}) # 將參數(shù)進行轉(zhuǎn)碼 headers = { ’User-Agent’: ’Opera/9.80 (Android 2.3.4; Linux; Opera Mobi/build-1107180945; U; en-GB) Presto/2.8.149 Version/11.10’ } req = request.Request(url,data=bytes(data,encoding='utf-8'),headers=headers) r = request.urlopen(req) # print(r.code) 查看返回的狀態(tài)碼 html = r.read().decode(’utf-8’) # json格式化 html = json.loads(html) # print(html) for k in html['data']: print(k['k'],k['v'])if __name__ == ’__main__’: content = input('請輸入您要翻譯的內(nèi)容:') translate(content)
結(jié)果如下
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. Python安裝并操作redis實現(xiàn)流程詳解2. ASP基礎(chǔ)入門第八篇(ASP內(nèi)建對象Application和Session)3. Django如何使用asyncio協(xié)程和ThreadPoolExecutor多線程4. django實現(xiàn)模型字段動態(tài)choice的操作5. 部署vue+Springboot前后端分離項目的步驟實現(xiàn)6. AJAX實現(xiàn)數(shù)據(jù)的增刪改查操作詳解【java后臺】7. AspNetCore&MassTransit Courier實現(xiàn)分布式事務(wù)的詳細過程8. idea設(shè)置自動導(dǎo)入依賴的方法步驟9. vue組件庫的在線主題編輯器的實現(xiàn)思路10. 如何用 Python 制作一個迷宮游戲
