久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

文章詳情頁

Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里？

瀏覽：149日期：2022-07-15 16:32:54

問題描述

我想把房屋概況分別抓出來并分別作為獨(dú)立的列存儲進(jìn)字典里，但是行內(nèi)元素沒有辦法直接用for循環(huán)摳出來。這是我的代碼：

soup.select(’.house-info li’)[1].text.strip()

這是網(wǎng)頁html代碼：

<li><span class='info-tit'>房屋概況：</span>住宅<span class='splitline'>|</span>1室1廳1衛(wèi)<span class='splitline'>|</span><span>46m2</span><span class='splitline'>|</span> (高層)/共18層<span class='splitline'>|</span>南北<span class='splitline'>|</span> 豪華裝修 </li>

問題解答

回答1：

其實還是很有簡單的，你看這個還是有規(guī)律的，規(guī)律在于有分隔符|，我寫了個DEMO

something = ’’’<li><span class='info-tit'>房屋概況：</span>住宅 <span class='splitline'>|</span>1室1廳1衛(wèi)<span class='splitline'>|</span><span>46m2</span><span class='splitline'>|</span> (高層)/共18層<span class='splitline'>|</span>南北<span class='splitline'>|</span> 豪華裝修 </li>’’’;soup = BeautifulSoup(something, ’lxml’)plaintext = soup.select(’li’)[0].get_text().strip()

通過get_text()得到內(nèi)在所有內(nèi)容，然后去除空格。后面你就用split進(jìn)行分割吧，后面的不寫了。如果有問題再交流。

回答2：我感覺這個html代碼寫錯了呢,標(biāo)簽的內(nèi)容文本在標(biāo)簽外面

Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里？

正確的標(biāo)簽內(nèi)容就兩個:

房屋概況：

46m2

回答3：

innerText

回答4：

你這種情況，我覺得用 for 循環(huán)加上正則表達(dá)式是最方便的，如果所有模版都是這樣固定的話

回答5：

用pyquery吧

from pyquery import PyQuery as Q

Q(text).find(’.house-info li’).text()

Python 編程

上一條：python文檔怎么查看？下一條：python class嵌套怎么訪問父類

相關(guān)文章：

1. javascript - 有什么工具可以自動給css3的樣式加前綴要最簡單的不會sass less2. javascript - history.replaceState()無法改變query參數(shù)3. python小白問關(guān)于類里面屬性的問題4. html5 - vue 里的Elemen UI的時間怎么轉(zhuǎn)化為時間戳嗎5. javascript - 圖片請求失敗怎么去掉左上角的小圖標(biāo)?6. update方法不能更新字段值為0的數(shù)據(jù)7. ios - 類似微博首頁，一張圖的時候是如何確定圖大小的？8. 老哥們求助啊9. html5 - 如何解決bootstrap打開模態(tài)modal窗口引起頁面抖動?10. css - 怎么實現(xiàn)一個圓點在一個范圍內(nèi)亂飛

排行榜

					
					html - 移動端radio無法選中
ios - 類似微博首頁，一張圖的時候是如何確定圖大小的？
javascript - 移動端，當(dāng)出現(xiàn)遮罩層的時候，遮罩層里有div是超出高度scroll的，怎么避免滑動div的時候，body跟隨滑動？
java - Spring Mvc全局異常處理器@ControllerAdvice不起作用？
css - 怎么實現(xiàn)一個圓點在一個范圍內(nèi)亂飛
javascript - 有什么工具可以自動給css3的樣式 加 前綴   要最簡單的  不會sass  less
css - 關(guān)于偽類背景問題
java - 以當(dāng)前時間戳命名File 為什么生成的名字不一樣？
android - java 泛型不支持?jǐn)?shù)組，那么RxJava的Map集合有什么方便的手段可以定義獲得一串共同父類集合數(shù)據(jù)呢？
老哥們求助啊
javascript - 圖片請求失敗怎么去掉左上角的小圖標(biāo)?
				

熱門標(biāo)簽

數(shù)據(jù)庫

主站蜘蛛池模板：武胜县| 马关县| 莆田市| 中方县| 宁蒗| 远安县| 古丈县| 五莲县| 南乐县| 安远县| 全南县| 苏尼特左旗| 隆子县| 榆中县| 重庆市| 通许县| 大田县| 嘉义市| 丰顺县| 长丰县| 玉田县| 河南省| 葫芦岛市| 安康市| 吉林市| 内乡县| 桐梓县| 肇州县| 沙坪坝区| 江都市| 宁安市| 岢岚县| 句容市| 永年县| 灯塔市| 白城市| 富阳市| 饶河县| 巴林左旗| 烟台市| 德清县|