亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術(shù)文章
文章詳情頁

python - 除了代理ip,香港的服務(wù)器爬取國內(nèi)網(wǎng)站還有更好的方法嗎?

瀏覽:87日期:2022-09-22 11:38:38

問題描述

我在做一只淘寶的爬蟲,但是用的是香港的服務(wù)器,但是比較困惑:因?yàn)槊看闻捞詫毜氖醉摃r(shí)候,就自動(dòng)給我跳轉(zhuǎn)到香港淘寶~~導(dǎo)致源代碼和內(nèi)容都不一樣~請(qǐng)問如果遇到這種情況要怎么處理呢?

簡單來說,比如采集58同城如果我是泉州的,我想采集北京的,要怎么采集?

因?yàn)槲矣梦业膇p打開會(huì)總跳轉(zhuǎn)到北京,但是直接想采集58首頁的

python - 除了代理ip,香港的服務(wù)器爬取國內(nèi)網(wǎng)站還有更好的方法嗎??![圖片上傳中...]

問題解答

回答1:

禁止重定向,以requests為例子:

r = requests.get(’http://github.com/’, allow_redirects=False)r.status_code # 302r.url # http://github.com, not https.r.headers[’Location’] # https://github.com/ -- the redirect destination回答2:

如果是想采集的北京的,就去打子城名,不過有PGTID保護(hù)

http://bj.58.com/?PGTID=0d000...

建義使用selenium

回答3:

有時(shí)候服務(wù)器會(huì)根據(jù)你的ip對(duì)應(yīng)的地理位置信息作重定向的,這個(gè)你除了找代理應(yīng)該沒有別的方法了。。

標(biāo)簽: Python 編程
主站蜘蛛池模板: 春色视频一区二区三区 | 国产精品久久天天影视 | 拍拍视频免费观看网站在线观看 | 婷婷综合网 | 国产福利一区二区在线精品 | 亚洲图欧美日韩色综合图 | 欧美大片天天免费看视频 | 激情综合网婷婷 | 久久精品爱 | 国产尤物在线播放 | 东京不太热在线新视频 | 天天色踪合合 | 1769国内精品视频在线观看 | 亚洲欧洲一区二区 | 一级特黄色 | 中文字幕专区在线亚洲 | 国产精品久久久久久麻豆一区 | 日韩一区二区免费视频 | 综合色久 | 在线观看三级视频 | 亚洲午夜久久久久久91 | 久久午夜一区二区 | 91精品国产高清久久久久久io | 在线一区二区观看 | 91热久久免费精品99 | 国产成人精品日本亚洲麻豆 | 无码免费一区二区三区免费播放 | 亚洲欧美一区二区久久香蕉 | free性欧美chinese乱子 | 在线不卡一区二区 | 亚洲色视频在线播放网站 | 狠狠亚洲婷婷综合色香五 | 亚洲人成激情在线播放 | 国产原创一区二区 | 久久er国产精品免费观看8 | 高清欧美不卡一区二区三区 | 内地自拍 | 国产三级在线免费 | 97精品国产高清自在线看超 | 欧美高清在线精品一区 | 永久免费影院 |