文章詳情頁

python - scrapy 爬取pages比實際進入items的多得多？

瀏覽：69日期：2022-07-23 10:55:26

2017-05-12 23:39:52 [scrapy.extensions.logstats] INFO:Crawled 3000 pages (at 61 pages/min), scraped 454 items (at 10 items/min)

為什么我使用scrapy爬取的時候訪問pages要比實際進入items的的多的多?就是爬了半天items里沒有幾條數據入庫的有什么辦法解決么？

問題解答

回答1：

重定向了，你看到了吧，重定向就得請求兩個頁面啊。還有就是看有不有頁面解析發生了錯誤。

Python 編程

上一條：算法 - python ahocorasick 從本地文件讀取文本，進行關鍵字匹配，匹配失敗下一條：運行python程序時出現“應用程序發生異常”的內存錯誤？

相關文章：

1. python - django 里自定義的 login 方法，如何使用 login_required()2. android-studio - Android 動態壁紙LayoutParams問題3. sql語句如何按or排序取出記錄4. angular.js - 不適用其他構建工具，怎么搭建angular1項目5. 主從備份 - 跪求mysql 高可用主從方案6. python如何不改動文件的情況下修改文件的修改日期7. mysql優化 - mysql count(id)查詢速度如何優化?8. css3 - [CSS] 動畫效果 3D翻轉bug9. mysql主從 - 請教下mysql 主動-被動模式的雙主配置和主從配置在應用上有什么區別？10. node.js - node_moduls太多了

排行榜

					
					sql語句如何按or排序取出記錄
css3 - [CSS] 動畫效果 3D翻轉bug
主從備份 - 跪求mysql 高可用主從方案
mysql優化 - mysql count(id)查詢速度如何優化?
angular.js - 不適用其他構建工具，怎么搭建angular1項目
python - django 里自定義的  login 方法，如何使用 login_required()
android-studio - Android 動態壁紙LayoutParams問題
angular.js - angularjs 用ng-reapt渲染的dom  怎么獲取上面的屬性
node.js - node_moduls太多了
python如何不改動文件的情況下修改文件的 修改日期
mysql主從 - 請教下mysql 主動-被動模式的雙主配置 和 主從配置在應用上有什么區別？
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

python - scrapy 爬取pages比實際進入items的多得多？