亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

python - 爬蟲獲取網站數據,出現亂碼怎么解決。

瀏覽:67日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報錯UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個問題:1、str是內置關鍵字必須更改為其他變量名2、查看網頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應解碼

小建議這種小程序寫個函數會比用類來更加方便,無論是使用還是實現

回答2:

推測用的是sublime text?參考這個

回答3:

這兒應該是encode不是decode,而且你的變量名居然是跟內置關鍵字名字一樣

回答4:

應該是encode吧

標簽: Python 編程
主站蜘蛛池模板: 国产男女野战视频在线看 | 丝袜足交在线播放 | 亚洲欧美日韩在线精品2021 | 国产酒店视频 | 国产综合精品日本亚洲777 | 国产亚洲精品aa在线观看 | 亚洲一区二区三区高清不卡 | 日本乱人伦片中文字幕三区 | 美女一级毛片免费观看 | 国产精品久久久久影院色老大 | 中文字幕在线永久在线视频2020 | 国产午夜亚洲精品久久www | 国产成人精品999在线观看 | 成人免费体验区福利云点播 | 黄色一级片美国 | 91摄影师与白嫩模特观看 | 免费又色又爽的视频国产 | 中文字幕日本在线视频二区 | 福利二区 | www.黄色网| 成人自拍偷拍 | 一级毛片在线免费观看 | 午夜在线社区视频 | 免费观看性欧美一级 | fc2成人免费人成在线观看播放 | 真人毛片 | 久久久久女人精品毛片九一 | 麻豆视频传媒 | 一本色道久久88亚洲综合 | 日韩在线中文字幕 | 国产大战女模特在线视频 | 亚洲国产精品久久久久久网站 | 黄色网址 在线播放 | 国产综合精品久久亚洲 | 国产高清精品在线 | 国产精品免费一级在线观看 | 一道本不卡免费视频 | 国产成人精品三区 | 欧美成人xx禁片在线观看 | 色九九视频 | 亚洲综合国产精品 |