文章詳情頁

python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，里面只有一句報錯信息，求幫助。

瀏覽：141日期：2022-07-24 08:56:37

問題描述

想用urllib抓取上交所股票列表的xls下載鏈接，如下圖紅色小框：

發現抓下來的xls只有報錯信息：

python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，里面只有一句報錯信息，求幫助。

請問要怎樣才能把有內容的xls抓下來？

代碼如下

from urllib import requestfrom datetime import datetime# -*- coding:utf-8 -*-url = ’http://query.sse.com.cn/security/stock/downloadStockListFile.do?’ ’csrcCode=&stockCode=&areaName=&stockType=1’myheaders = [(’User - Agent’, ’Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13’ ’ (KHTML, like Gecko) Version/3.1 Safari/525.13’),]opener = request.build_opener()opener.addheaders = myheadersrequest.install_opener(opener)local = '/Users/Mty/Downloads/data/' + str(datetime.now().date()) + ' .xls'request.urlretrieve(url, local)

問題解答

回答1：

可以在標紅線的url上看到返回的公司信息，剩下的就是模擬瀏覽器請求這個url了，request header中的refer一定不能省略，不然會報403

記住要模擬 refer 這一項的值。

http://blog.csdn.net/ssshen14...這個是已有的解決方案

回答2：

查看cookie,referer

Python 編程

上一條：python - 關于樹模型是否需要對離散型變量作onehot？下一條：cookies - python用cookie登錄網站失敗

排行榜

					
					css3 - [CSS] 動畫效果 3D翻轉bug
主從備份 - 跪求mysql 高可用主從方案
mysql優化 - mysql count(id)查詢速度如何優化?
angular.js - 不適用其他構建工具，怎么搭建angular1項目
python - django 里自定義的  login 方法，如何使用 login_required()
angular.js - angularjs 用ng-reapt渲染的dom  怎么獲取上面的屬性
node.js - node_moduls太多了
angular.js - Angular路由和express路由的組合使用問題
python如何不改動文件的情況下修改文件的 修改日期
mysql主從 - 請教下mysql 主動-被動模式的雙主配置 和 主從配置在應用上有什么區別？
java - 計算機圖像表示方法？
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，里面只有一句報錯信息，求幫助。