文章詳情頁

python - beautifulsoup獲取網頁內容的問題

瀏覽：106日期：2022-06-30 08:43:35

問題描述

我要的是這個里面的內容<p class='talk-article__body talk-transcript__body'>

PYTHON代碼：

neirong=soup.find(’p’,{’class’:’talk-article__body talk-transcript__body’})

但是返回的結果是空。這個選擇器是不是寫錯了？

問題解答

回答1：

neirong=soup.find_all(’p’,class_=’talk-article__body talk-transcript__body’)

https://www.crummy.com/softwa...

回答2：

參照：https://www.crummy.com/softwa...中給出的說明，正確的使用方式是：neirong=soup.find(’p’,class_=’talk-article__body talk-transcript__body’)

為了獲取p包含的內容，進一步調用neirong.contents即可

回答3：

neirong = soup.select(’.talk-article__body.talk-transcript__body’)回答4：

你從瀏覽器看到的內容有js動態生成的,用bs匹配不到,我發現看到的比較奇怪的class名基本都是js生成的

回答5：

使用find_all吧,find不能用于class

回答6：

個人覺得用BeautifulSoup來解析網頁的時候，如果樓主打算通過css特性來進行元素的定位的話，最好還是使用soup.select()，這個方法可以用class的value當參數也可以用標簽的的attribute當參數，很方便，用于搜索單一標簽最好用，同時參數支持css選擇器字符串，比如：soup.select('#id > .class a.title').

soup.find()方法目前好像用的不多，不知道是不是BeautifulSoup4棄用了。現在一般只要出現find，就是find_all()等方法。以上詳細參考“超級湯”的中文文檔：http://beautifulsoup.readthed...

Python 編程

上一條：python - 編碼問題求助下一條：python - 版本號對比方法優化

相關文章：

1. python - 獲取到的數據生成新的mysql表2. javascript - js 對中文進行MD5加密和python結果不一樣。3. mysql里的大表用mycat做水平拆分，是不是要先手動分好，再配置mycat4. window下mysql中文亂碼怎么解決？？5. sass - gem install compass 使用淘寶 Ruby 安裝失敗，出現 4046. python - （初學者）代碼運行不起來，求指導，謝謝！7. 為啥不用HBuilder?8. python - flask sqlalchemy signals 無法觸發9. python的文件讀寫問題？10. 為什么python中實例檢查推薦使用isinstance而不是type？

排行榜

					
					java - 關于 controller層與service層如何傳值？
為什么python中實例檢查推薦使用isinstance而不是type？
html5 - H5 SSE的本質是什么？
算法 - 如何不用遞歸 列出 樹（多叉） 中根節點到葉節點的所有路徑（Java）
怎么用css截取字符？
java - 異步上傳圖片無法即時回顯
你們是如何避免transform:scale屬性影響字體的？
前端 - 請問display: -webkit-flex;是什么意思？
視頻 - html5 video的autoplay 在智能手機上不運作？
javascript - js 對中文進行MD5加密和python結果不一樣。
sass - gem install compass 使用淘寶 Ruby 安裝失敗，出現 404
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

python - beautifulsoup獲取網頁內容的問題