文章詳情頁

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素，請問各位大神哪里出了問題？

瀏覽：90日期：2022-09-17 10:49:15

問題描述

用scrapy爬了圖書館書籍的書名和評論，用Chrome的檢查拔下來的Xpath，但是運行爬蟲返回的是空元素，請問各位哪里出了問題，謝謝大家。截圖：

附上我的Scrapy源碼，請大家多指教，謝謝！

from scrapy import Spiderfrom scrapy.selector import Selectorfrom CommentCrawl.items import CommentcrawlItemclass commentcrawl(Spider): name = 'commentcrawl' allowed_domains = ['http://opac.lib.bnu.edu.cn:8080'] start_urls = ['http://opac.lib.bnu.edu.cn:8080/F/S9Q2QIQV5D9R9HBHPI2KNN8JH11TRIRSIEPKYQLTAQQ17LA6B6-16834?func=full-set-set&set_number=010408&set_entry=000001&format=999', ] def parse(self,response):item = CommentcrawlItem()item[’name’] = Selector(response).xpath(’//*[@id='details2']/table/tbody/tr[1]/td[2]/a/text()’).extract()item[’comment’] = Selector(response).xpath(’//*[@id='localreview']/text()’).extract()yield item

問題解答

回答1：

頁面需要登錄才能訪問，缺少登錄操作。

回答2：

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素，請問各位大神哪里出了問題？

頁面被登錄攔截了。

回答3：

你把你實際獲得的內容打印或者保存完了，看看是什么內容。估計是返回的內容跟你的 Xpath 匹配不上，該登錄的登錄啊。

Python 編程

上一條：python - 類對象函數(shù)后面的參數(shù)問題，勉強看懂但是要自己寫出來就感覺很困難下一條：python3 正則表達式，在交互模式下和編程模式下運行結果不同

排行榜

					
					javascript - 這種布局該怎么實現(xiàn)最自然？
javascript - 在top.jsp點擊退出按鈕后，right.jsp進行頁面跳轉，跳轉到login.jsp
java - 白盒加密源碼或者庫
python - 關于beautifulsoup獲取文檔內容
android - WebView偶爾無法加載，沒有發(fā)起請求
關于Mysql聯(lián)合查詢
mysql里的大表用mycat做水平拆分，是不是要先手動分好，再配置mycat
Docker for Mac 創(chuàng)建的dnsmasq容器連不上/不工作的問題
為什么我ping不通我的docker容器呢？？？
docker gitlab 如何git clone？
docker內創(chuàng)建jenkins訪問另一個容器下的服務器問題
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素，請問各位大神哪里出了問題？

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素，請問各位大神哪里出了問題？