文章詳情頁

xpath - python怎么用lxml處理

瀏覽：62日期：2022-09-22 09:54:52

問題描述

例如：

沒aa沒aa沒aa沒

就是在p標簽里可能會出現同樣的em標簽，而且數量不定，那我怎么獲取p的內容，包括em里的內容。例如第二個p獲取輸出是‘沒aa沒aa’

或者獲取到p節點之后，怎么把里面的內容轉換為字符串

問題解答

回答1：

今天偶然學到處理這個問題的方法，特意翻出來這個問題回答。題主你可以看一下xpath的軸，比如你要取得第二個標簽的“沒aa沒aa”，實際是取得它全部后代節點的文本內容，可以使用element_dom.xpath('//p[2]//descendant::text()')來取得，拿到的結果是一個這樣[’沒’, ’aa’, ’沒’, ’aa’]的list,然后自己手動拼接成字符串就可以了，比如''.join(list)。同理，如果你需要進行其他操作，也可以使用類似的方法。

回答2：

換bs4，string和text之間的異同就在這里。

回答3：

lxml.html的.text_content()方法，可以獲取當前節點和所有子節點的文本內容。

Python 編程

上一條：python - 如何爬取豆瓣電影的詳細信息下一條：python - [Errno 2] No such file or directory: ’我為什么是一個文件，為什么返回值是這樣的呢？

相關文章：

1. javascript - 可以DIY的頁面是如何實現的？2. mysql - SQL問個基礎例子,書上的,我怎么看都看不懂..誰幫我解釋一下第2個為什么和第1個一樣?3. python - 請問matplotlib.pyplot.save的路徑如何更改4. mysql服務無法啟動1067錯誤，誰知道正確的解決方法？5. 數據庫 - mysql boolean型無法插入true6. python - Django問題 ’WSGIRequest’ object has no attribute ’user’7. javascript - ajax 圖片文件與文本框數據一起提交上傳處理8. python - Django前臺url未能正確訪問方法求助？9. 無法遠程連接mysql10. javascript - js 對中文進行MD5加密和python結果不一樣。

排行榜

					
					mysql - SQL問個基礎例子,書上的,我怎么看都看不懂..誰幫我解釋一下第2個為什么和第1個一樣?
無法遠程連接mysql
數據庫 - mysql boolean型無法插入true
算法 - 如何不用遞歸 列出 樹（多叉） 中根節點到葉節點的所有路徑（Java）
javascript - jquery選擇的dom元素如何更新？
javascript - js 對中文進行MD5加密和python結果不一樣。
視頻 - html5 video的autoplay 在智能手機上不運作？
node.js - 如何用nodejs寫一個接口，隨便寫一個就好
html - hotcss.js  使用過程中 border:.02133rem solid #000;在安卓不顯示，iphone正常
javascript - ajax 圖片文件與文本框數據一起提交上傳處理
mysql服務無法啟動1067錯誤，誰知道正確的解決方法？
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

xpath - python怎么用lxml處理