文章詳情頁
java - QQ空間爬蟲總是被封號
瀏覽:90日期:2022-09-24 17:58:56
問題描述
抓取QQ空間說說但是 總是被封號 可以給提出一些解決方案嗎?如何既可以快速 又可以不封號!謝謝啦!
代碼在github上地址https://github.com/20100507/Q...
問題解答
回答1:反爬蟲策略:
1、識別請求頭,判斷是否是爬蟲2、記錄請求頻率、路徑和訪問ip,判斷是否是爬蟲3、請求參數中進行加密或復雜加密,增加爬蟲開發的難度(如淘寶的ua算法)4、復雜驗證碼
應對反爬蟲策略:
1、在爬取過程中,適當切換代理ip2、適當降低請求頻率3、請求頭模擬成瀏覽器的請求,也就是用戶正常訪問的請求
你的問題,主要可以通過定時切換ip,或一旦被封再切換ip,來解決,可以考慮去“站大爺”等代理ip網站付費獲取,或者去多用幾個電信賬號,用ASDL撥號來切換ip。
標簽:
qq
相關文章:
1. linux - 【已解決】fabric部署的Python項目Apache啟動之后提示403Forbidden該如何解決?2. python - (初學者)代碼運行不起來,求指導,謝謝!3. mysql里的大表用mycat做水平拆分,是不是要先手動分好,再配置mycat4. window下mysql中文亂碼怎么解決??5. python - flask sqlalchemy signals 無法觸發6. nginx - pip install python庫報錯7. python - 獲取到的數據生成新的mysql表8. python的文件讀寫問題?9. javascript - js 對中文進行MD5加密和python結果不一樣。10. 為什么python中實例檢查推薦使用isinstance而不是type?
排行榜
