python3.5 urllib.parse.unquote 亂碼
問題描述
使用
urllib.parse.unquote(from_ur)
解碼
%E7%8E%8B%E7%90%BC%E8%8C%B6%E8%89%BA%E5%B0%8F%E7%BD%90%E8%8C%B6%E8%83%8C%E6%99%AF%E6%AD%8C%E6%9B%B2%C2%BD%D3%F0%CD%BC%C6%AC%E5%B0%8F%E7%BD%90%E8%8C%B6%E8%83%8C%E6%99%AF%E9%9F%B3%E4%B9%90%C2%CC%B2%E8 %C2%CC%B2%E8%CD%BC%C6%AC%B4%F3%C8%AB %BB%B1%BB%A8%B2%E8%E7%8E%8B%E7%90%BC%E8%A1%8C%E8%8C%B6%E5%8D%81%E5%BC%8F%E5%B0%8F%E7%BD%90%E8%8C%B6%E7%9A%84%E5%85%AB%E4%B8%AA%E5%A4%A7%E5%B8%88%E9%BE%99%E4%BA%95%E8%8C%B6%E5%A5%BD%E5%9D%8F%E5%9B%BE%E7%89%87%E9%9B%80%E8%88%8C%E8%8C%B6%E5%8F%B6%E5%B1%9E%E4%BA%8E%E4%BB%80%E4%B9%88%E8%8C%B6%E7%9B%96%E7%A2%97%E8%8C%B6%E6%AD%A3%E7%A1%AE%E7%9A%84%E5%96%9D%E6%B3%95%E5%9B%BE%E8%A7%A3%E7%A2%A7%E6%BD%AD%E9%A3%98%E9%9B%AA%E7%9A%84%E5%8A%9F%E6%95%88%E4%B8%8E%E4%BD%9C%E7%94%A8%E8%8C%B6%E9%81%93%BA%DA%BF%E0%DC%F1%E8%8C%B6%E7%9A%84%E5%B9%BF%E5%91%8A%E6%AD%8C%E6%9B%B2%E4%BF%A1%E9%98%B3%E6%AF%9B%E5%B0%96%E5%AE%89%E5%90%89%E7%99%BD%E8%8C%B6%E5%9B%BE%E7%89%87%E6%80%8E%E6%A0%B7%E5%8A%A0%E7%9B%9F%E5%B0%8F%E7%BD%90%E8%8C%B6%E5%AE%89%E6%BA%AA%E8%8C%B6%E5%8F%B6%E6%89%B9%E5%8F%91%E5%B8%82%E5%9C%BA%E7%A2%A7%E8%9E%BA%E6%98%A5%E8%8B%A6%E8%8D%9E%BA%DA%BF%E0%DC%F1%B2%E8
部分亂碼
有什么好的解決方法嗎
問題解答
回答1:>>> unquote(s, encoding='utf-8')’王瓊茶藝n小罐茶背景歌曲n?????n小罐茶背景音樂n???n????????n??????n王瓊行茶十式n小罐茶的八個大師n龍井茶好壞圖片n雀舌茶葉屬于什么茶n蓋碗茶正確的喝法圖解n碧潭飄雪的功效與作用n茶道n?????n茶的廣告歌曲n信陽毛尖n安吉白茶圖片n怎樣加盟小罐茶n安溪茶葉批發(fā)市場n碧螺春n苦蕎n??????’>>> unquote(s, encoding='gbk')’鐜嬬惣鑼惰壓n灝忕綈鑼惰儗鏅?姝屾洸n陸羽圖片n灝忕綈鑼惰儗鏅?闊充箰n綠茶n綠茶圖片大全n槐花茶n鐜嬬惣琛岃尪鍗佸紡n灝忕綈鑼剁殑鍏?涓?澶у笀n榫欎簳鑼跺ソ鍧忓浘鐗?n闆?鑸岃尪鍙跺睘浜庝粈涔堣尪n鐩栫?楄尪姝g‘鐨勫枬娉曞浘瑙?n紕ф江椋橀洩鐨勫姛鏁堜笌浣滅敤n鑼墮亾n黑苦蕎n鑼剁殑騫垮憡姝屾洸n淇¢槼姣涘皷n瀹夊悏鐧借尪鍥劇墖n鎬庢牱鍔犵洘灝忕綈鑼?n瀹夋邯鑼跺彾鎵瑰彂甯傚満n紕ц灪鏄?n鑻﹁崬n黑苦蕎茶’>>>
可以看到,亂碼的那部分編碼為 gbk,我也不知道為啥兩種編碼會混合。
解決方案:
s = ’’’%E7%8E%8B%E7%90%BC%E8%8C%B6%E8%89%BA%E5%B0%8F%E7%BD%90%E8%8C%B6%E8%83%8C%E6%99%AF%E6%AD%8C%E6%9B%B2%C2%BD%D3%F0%CD%BC%C6%AC%E5%B0%8F%E7%BD%90%E8%8C%B6%E8%83%8C%E6%99%AF%E9%9F%B3%E4%B9%90%C2%CC%B2%E8 %C2%CC%B2%E8%CD%BC%C6%AC%B4%F3%C8%AB %BB%B1%BB%A8%B2%E8%E7%8E%8B%E7%90%BC%E8%A1%8C%E8%8C%B6%E5%8D%81%E5%BC%8F%E5%B0%8F%E7%BD%90%E8%8C%B6%E7%9A%84%E5%85%AB%E4%B8%AA%E5%A4%A7%E5%B8%88%E9%BE%99%E4%BA%95%E8%8C%B6%E5%A5%BD%E5%9D%8F%E5%9B%BE%E7%89%87%E9%9B%80%E8%88%8C%E8%8C%B6%E5%8F%B6%E5%B1%9E%E4%BA%8E%E4%BB%80%E4%B9%88%E8%8C%B6%E7%9B%96%E7%A2%97%E8%8C%B6%E6%AD%A3%E7%A1%AE%E7%9A%84%E5%96%9D%E6%B3%95%E5%9B%BE%E8%A7%A3%E7%A2%A7%E6%BD%AD%E9%A3%98%E9%9B%AA%E7%9A%84%E5%8A%9F%E6%95%88%E4%B8%8E%E4%BD%9C%E7%94%A8%E8%8C%B6%E9%81%93%BA%DA%BF%E0%DC%F1%E8%8C%B6%E7%9A%84%E5%B9%BF%E5%91%8A%E6%AD%8C%E6%9B%B2%E4%BF%A1%E9%98%B3%E6%AF%9B%E5%B0%96%E5%AE%89%E5%90%89%E7%99%BD%E8%8C%B6%E5%9B%BE%E7%89%87%E6%80%8E%E6%A0%B7%E5%8A%A0%E7%9B%9F%E5%B0%8F%E7%BD%90%E8%8C%B6%E5%AE%89%E6%BA%AA%E8%8C%B6%E5%8F%B6%E6%89%B9%E5%8F%91%E5%B8%82%E5%9C%BA%E7%A2%A7%E8%9E%BA%E6%98%A5%E8%8B%A6%E8%8D%9E%BA%DA%BF%E0%DC%F1%B2%E8’’’from urllib.parse import unquote_to_bytes_list = unquote_to_bytes(s).split(b’n’)result = []for line in _list: try :result.append(line.decode(’utf-8’)) except UnicodeDecodeError:result.append(line.decode(’gbk’))print('n'.join(result))
運行結(jié)果
=================== RESTART: C:/Users/Zhang/Desktop/tmp.py ===================王瓊茶藝小罐茶背景歌曲陸羽圖片小罐茶背景音樂綠茶 綠茶圖片大全 槐花茶王瓊行茶十式小罐茶的八個大師龍井茶好壞圖片雀舌茶葉屬于什么茶蓋碗茶正確的喝法圖解碧潭飄雪的功效與作用茶道黑苦蕎茶的廣告歌曲信陽毛尖安吉白茶圖片怎樣加盟小罐茶安溪茶葉批發(fā)市場碧螺春苦蕎黑苦蕎茶>>> 回答2:
建議用requests試試
回答3:輸入的問題吧,找個在線的URL解碼頁面試試,可以看到也是有亂碼的http://www.convertstring.com/...
相關(guān)文章:
1. python - beautifulsoup獲取網(wǎng)頁內(nèi)容的問題2. Docker for Mac 創(chuàng)建的dnsmasq容器連不上/不工作的問題3. docker鏡像push報錯4. docker - 如何修改運行中容器的配置5. docker-machine添加一個已有的docker主機問題6. fragment - android webView 返回后怎么禁止重新渲染?7. docker不顯示端口映射呢?8. android studio總是在processes running好久9. dockerfile - [docker build image失敗- npm install]10. angular.js - Angular 2 + Django構(gòu)建的Web應用, 如何合理搭配 ?
