亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

瀏覽:141日期:2022-07-24 08:56:37

問題描述

想用urllib抓取上交所股票列表的xls下載鏈接,如下圖紅色小框:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

發現抓下來的xls只有報錯信息:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

請問要怎樣才能把有內容的xls抓下來?

代碼如下

from urllib import requestfrom datetime import datetime# -*- coding:utf-8 -*-url = ’http://query.sse.com.cn/security/stock/downloadStockListFile.do?’ ’csrcCode=&stockCode=&areaName=&stockType=1’myheaders = [(’User - Agent’, ’Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13’ ’ (KHTML, like Gecko) Version/3.1 Safari/525.13’),]opener = request.build_opener()opener.addheaders = myheadersrequest.install_opener(opener)local = '/Users/Mty/Downloads/data/' + str(datetime.now().date()) + ' .xls'request.urlretrieve(url, local)

問題解答

回答1:

可以在標紅線的url上看到返回的公司信息,剩下的就是模擬瀏覽器請求這個url了,request header中的refer一定不能省略,不然會報403

記住要模擬 refer 這一項的值。

http://blog.csdn.net/ssshen14...這個是已有的解決方案

回答2:

查看cookie,referer

標簽: Python 編程
主站蜘蛛池模板: 国产成人久久精品二区三区牛 | 中文字幕亚洲第一 | 尹人香蕉久久99天天拍欧美p7 | 俄罗斯一级成人毛片 | 欧美日韩免费一区二区在线观看 | 国产在线一区在线视频 | 欧美人妖xxx | 国产51自产区在线 | 国产夫妻啪啪 | 久草在线观看首页 | 中国黄色一级片 | 国产jav| 97视频在线观看免费 | 日本欧美不卡一区二区三区在线 | 国内在线视频 | 日韩高清在线不卡 | 狠狠色成人综合网图片区 | 午夜国产精品免费观看 | 91日本在线| 中文字幕成人乱码在线电影 | 成人嗯啊视频在线观看 | 91久久国产 | 欧美精品一区在线看 | 在线观看免费视频片 | 欧美丰满丝袜videossex | 一级全黄毛片 | 免费人成网址在线观看国内 | 国产最新精品视频 | 哪个网站能看毛片 | 国产永久福利 | 91精品国产亚洲爽啪在线观看 | 免费视频一区 | 亚洲精品视 | 久久99精品久久久久子伦小说 | 国产短视频精品一区二区三区 | 久久综合九色综合97飘花 | 91久久精品国产亚洲 | 欧美黄色性| 国产亚洲精品热视频在线观看 | 久草在线精品 | 内地精品露脸自拍视频香蕉 |