文章詳情頁

Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里？

瀏覽：82日期：2022-07-15 16:32:54

問題描述

我想把房屋概況分別抓出來并分別作為獨(dú)立的列存儲(chǔ)進(jìn)字典里，但是行內(nèi)元素沒有辦法直接用for循環(huán)摳出來。這是我的代碼：

soup.select(’.house-info li’)[1].text.strip()

這是網(wǎng)頁html代碼：

問題解答

回答1：

其實(shí)還是很有簡單的，你看這個(gè)還是有規(guī)律的，規(guī)律在于有分隔符|，我寫了個(gè)DEMO

通過get_text()得到內(nèi)在所有內(nèi)容，然后去除空格。后面你就用split進(jìn)行分割吧，后面的不寫了。如果有問題再交流。

回答2：我感覺這個(gè)html代碼寫錯(cuò)了呢,標(biāo)簽的內(nèi)容文本在標(biāo)簽外面

Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里？

正確的標(biāo)簽內(nèi)容就兩個(gè):

房屋概況：

46m2

回答3：

innerText

回答4：

你這種情況，我覺得用 for 循環(huán)加上正則表達(dá)式是最方便的，如果所有模版都是這樣固定的話

回答5：

用pyquery吧

from pyquery import PyQuery as Q

Q(text).find(’.house-info li’).text()

Python 編程

上一條：python文檔怎么查看？下一條：python class嵌套怎么訪問父類

相關(guān)文章：

1. python - beautifulsoup獲取網(wǎng)頁內(nèi)容的問題2. Docker for Mac 創(chuàng)建的dnsmasq容器連不上/不工作的問題3. docker鏡像push報(bào)錯(cuò)4. docker - 如何修改運(yùn)行中容器的配置5. docker-machine添加一個(gè)已有的docker主機(jī)問題6. fragment - android webView 返回后怎么禁止重新渲染？7. dockerfile - [docker build image失敗- npm install]8. angular.js - 在終端中用yeoman啟用angular-generator報(bào)錯(cuò)，求解？9. Android "1"=="1" 到底是true還是false10. android studio總是在processes running好久

排行榜

					
					Docker for Mac 創(chuàng)建的dnsmasq容器連不上/不工作的問題
docker鏡像push報(bào)錯(cuò)
python - beautifulsoup獲取網(wǎng)頁內(nèi)容的問題
docker - 如何修改運(yùn)行中容器的配置
docker-machine添加一個(gè)已有的docker主機(jī)問題
fragment - android webView 返回后怎么禁止重新渲染？
怎么用css截取字符？
dockerfile - [docker build image失敗- npm install]
docker不顯示端口映射呢？
Android "1"=="1" 到底是true還是false
angular.js - 在終端中用yeoman啟用angular-generator報(bào)錯(cuò)，求解？
				

熱門標(biāo)簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里？

Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里？