文章詳情頁

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。

瀏覽：42日期：2022-08-04 16:42:25

問題描述

因為在爬取的網站需要賬號登陸，不方便公開。因此我只能這樣大致性的咨詢，實在抱歉。

我需要爬一個目標網站的數據，發現在點擊下一頁時候，網址并沒有改變.通過源碼確定是使用了js外加ajax的樣子.通過chrome的控制臺，捕獲到點擊下一頁時候，向指定地址發送了一條帶多個參數的get指令。

原先采用selenium+phantomjs的方式暴力無腦方式爬取，一個頁面大概5S左右就能獲取，實際用瀏覽器打開也是這個速度。為了爬取大量的數據，準備改用多線程+直接requests.get目標地址的方式來采集，但是發現采集速度非常的慢，從5S降到的20s左右。

請教下，出現這樣現象的原因可能是什么？我該如何解決？請指教

問題解答

回答1：

抱歉浪費了各位的時間- -是我開始測試的時候，周圍有人再下迅雷，網絡炸了。抱歉抱歉

Python 編程

上一條：python - 使用pandas的resample報錯下一條：python - 相當于分組數據的合并，兩個列表生成dataframe，但長度不同

相關文章：

1. mysql優化 - mysql count(id)查詢速度如何優化?2. angular.js - 不適用其他構建工具，怎么搭建angular1項目3. mysql主從 - 請教下mysql 主動-被動模式的雙主配置和主從配置在應用上有什么區別？4. python - django 里自定義的 login 方法，如何使用 login_required()5. 主從備份 - 跪求mysql 高可用主從方案6. java8中，邏輯與 & 符號用在接口類上代表什么意思7. python如何不改動文件的情況下修改文件的修改日期8. angular.js - angular-ui-bootstrap 報錯無法使用？9. node.js - node_moduls太多了10. python - 關于ACK標志位的TCP端口掃描的疑惑？

排行榜

					
					主從備份 - 跪求mysql 高可用主從方案
java8中，邏輯與 & 符號用在接口類上代表什么意思
mysql優化 - mysql count(id)查詢速度如何優化?
angular.js - angular-ui-bootstrap 報錯無法使用？
angular.js - 不適用其他構建工具，怎么搭建angular1項目
python - django 里自定義的  login 方法，如何使用 login_required()
node.js - node_moduls太多了
python如何不改動文件的情況下修改文件的 修改日期
mysql主從 - 請教下mysql 主動-被動模式的雙主配置 和 主從配置在應用上有什么區別？
javascript - nodemailer連接超時，怎么解決？
java - 計算機圖像表示方法？
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。