python 實現(xiàn)有道翻譯功能
打開有道翻譯界面—F12—Network—在翻譯框中輸入’hello’—在Network下面發(fā)現(xiàn)名為’translate_o?smartresult......’返回翻譯之后的數(shù)據(jù)
分析參數(shù)把所有的Request Headers、params都寫上嘗試爬蟲,可以得到結(jié)果。
然后Request Headers中Headers、Host、Origin、Referer三項留下,Cookie一項經(jīng)嘗試只有 OUTFOX_SEARCH_USER_ID=-1927650476@223.97.13.65;會驗證而且嘗試多次之后我這里是沒有變化的。
Accept: application/json, text/javascript, */*; q=0.01Accept-Encoding: gzip, deflateAccept-Language: zh-CN,zh;q=0.9Connection: keep-aliveContent-Length: 252Content-Type: application/x-www-form-urlencoded; charset=UTF-8Cookie: OUTFOX_SEARCH_USER_ID=-1927650476@223.97.13.65; OUTFOX_SEARCH_USER_ID_NCOO=1897197670.972445; JSESSIONID=aaalvPunK-sv2fyR-UjEx; ___rl__test__cookies=1612924426799Host: fanyi.youdao.comOrigin: http://fanyi.youdao.comReferer: http://fanyi.youdao.com/User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36X-Requested-With: XMLHttpRequest
再就是params參數(shù),變化的是salt、sign、lts,嘗試后發(fā)現(xiàn)lts可有可無,所以變化的只有salt、sign兩項。
i: 你好from: AUTOto: AUTOsmartresult: dictclient: fanyideskwebsalt: 16129244361391sign: 2820759b6e54f25e0aa94e185e2265e3lts: 1612924436139bv: 3da01a09873456cfb5dba05f2124b148doctype: jsonversion: 2.1keyfrom: fanyi.webaction: FY_BY_REALTlME分析salt、sign
全局搜索sign,結(jié)果中有fanyi.min.js文件,雙擊進入,然后右鍵選擇’Open in Source panel’,搜索’sign’,找到如下代碼:
define('newweb/common/service', ['./utils', './md5', './jquery-1.7'], function(e, t) { var n = e('./jquery-1.7'); e('./utils'); e('./md5'); var r = function(e) { var t = n.md5(navigator.appVersion) , r = '' + (new Date).getTime() , i = r + parseInt(10 * Math.random(), 10); return { ts: r, bv: t, salt: i, sign: n.md5('fanyideskweb' + e + i + 'Tbh5E8=q6U3EXe+&L[4c@') } };
可以看出salt是13位時間戳加了一個10以內(nèi)的隨機數(shù),而sign是’固定字符串+e+i+固定字符串’,其中i就是salt,而e經(jīng)過斷點調(diào)試(我選擇在var t = n.md5(navigator.appVersion)這一行加斷點,然后輸入你好,會出現(xiàn)e=’你好’)可以得知e為我們要翻譯的字符串。這樣整個分析過程就結(jié)束了。
之后通過爬蟲可以得到我們想要的數(shù)據(jù),因為返回的是json數(shù)據(jù),我們使用.json()來獲得返回值更加方便。
Python代碼import hashlibimport randomimport timeimport requestsdef get_data(): r = str(round(time.time() * 1000)) salt = r + str(random.randint(0, 9)) content = ’你好’ data = 'fanyideskweb' + content + salt + 'Tbh5E8=q6U3EXe+&L[4c@' sign = hashlib.md5() sign.update(data.encode('utf-8')) sign = sign.hexdigest() # print(len(sign)) # print(sign) return content, salt, signdef send_request(content, salt, sign): url = ’http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule’ headers = { ’Cookie’: ’OUTFOX_SEARCH_USER_ID=-1927650476@223.97.13.65;’, ’Host’: ’fanyi.youdao.com’, ’Origin’: ’http://fanyi.youdao.com’, ’Referer’: ’http://fanyi.youdao.com/’, ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.146 Safari/537.36’, } data = { ’i’: str(content), ’from’: ’AUTO’, ’to’: ’AUTO’, ’smartresult’: ’dict’, ’client’: ’fanyideskweb’, ’salt’: str(salt), ’sign’: str(sign), # ’lts’: ’1612879546052’, # ’bv’: ’6a1ac4a5cc37a3de2c535a36eda9e149’, # ’doctype’: ’json’, ’version’: ’2.1’, ’keyfrom’: ’fanyi.web’, ’action’: ’FY_BY_REALTlME’, } res = requests.post(url=url, headers=headers, data=data).json() print(’翻譯后:’, res[’translateResult’][0][0][’tgt’]) print(’翻譯前:’, res[’translateResult’][0][0][’src’])if __name__ == ’__main__’: content, salt, sign = get_data() send_request(content, salt, sign)運行效果
以上就是python 實現(xiàn)有道翻譯的詳細內(nèi)容,更多關于python 有道翻譯的資料請關注好吧啦網(wǎng)其它相關文章!
相關文章:
