亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

python實現模擬器爬取抖音評論數據的示例代碼

瀏覽:7日期:2022-06-30 11:42:35
目標:

由于之前和朋友聊到抖音評論的爬蟲,demo做出來之后一直沒整理,最近時間充裕后,在這里做個筆記。提示:大體思路 通過fiddle + app模擬器進行抖音抓包,使用python進行數據整理

安裝需要的工具:

python3 下載fiddle 安裝及配置手機模擬器下載

抖音部分:

模擬器下載好之后, 打開模擬器在應用市場下載抖音

python實現模擬器爬取抖音評論數據的示例代碼

對抖音進行fiddle配置,配置成功后就可以當手機一樣使用了

一、工具配置及抓包:

我們隨便打開一個視頻之后,fiddle就會刷新新的數據包

python實現模擬器爬取抖音評論數據的示例代碼

在json中找到視頻地址:

python實現模擬器爬取抖音評論數據的示例代碼

二、fiddler中添加下載視頻評論代碼

在fiddler中添加下載視頻代碼:注意兩點:(1)get后面的路徑要隨時看進行更換(2)下載的路徑要在fiddler下面自己新建

if (m_Hide304s && oSession.responseCode == 304) { oSession['ui-hide'] = 'true'; }if (oSession.uriContains('https://aweme.snssdk.com/aweme/v1/general/search/single/')){ var strBody=oSession.GetResponseBodyAsString(); var sps = oSession.PathAndQuery.slice(-58,); //FiddlerObject.alert(sps) var timestamp=new Date().getTime(); var filename = 'D:抖音評論資料' + '/' + sps + timestamp + '.json'; var curDate = new Date(); var sw : System.IO.StreamWriter; if (System.IO.File.Exists(filename)){ sw = System.IO.File.AppendText(filename); sw.Write(strBody); } else{ sw = System.IO.File.CreateText(filename); sw.Write(strBody); } sw.Close(); sw.Dispose();

此段代碼放到fiddler中的script的response中,如下圖:添加好之后別忘記保存?。?/p>

python實現模擬器爬取抖音評論數據的示例代碼

三、python執行代碼pycharm新建py文件

程序執行代碼:

import osimport jsonimport timeimport requestsimport reimport csvclass Douyin(object): def __init__(self): pass self.url1 = ’https://aweme.snssdk.com/aweme/v2/comment/list/?aweme_id=6885929189950737676&cursor=0&count=20&address_book_access=1&gps_access=1&forward_page_type=1&channel_id=0&city=310000&hotsoon_filtered_count=0&hotsoon_has_more=0&follower_count=0&is_familiar=0&page_source=0&os_api=25&device_type=VOG-AL00&ssmix=a&manifest_version_code=110301&dpi=240&uuid=868594157367551&app_name=aweme&version_name=11.3.0&ts=1603350069&cpu_support64=false&app_type=normal&ac=wifi&host_abi=armeabi-v7a&channel=aweGW&update_version_code=11309900&_rticket=1603350070959&device_platform=android&iid=1758845207590062&version_code=110300&mac_address=b0%3Ac4%3A2d%3Ad0%3Aed%3A38&cdid=7974198e-c4c0-49c2-bfaa-43686052706e&openudid=d0c6cffa7067bedd&device_id=844047245117672&resolution=720*1280&device_brand=HUAWEI&language=zh&os_version=7.1.2&aid=1128&mcc_mnc=46000’ self.url2 = ’https://aweme.snssdk.com/aweme/v2/comment/list/?aweme_id=6885163969477086479&cursor=0&count=20’ self.header = { ’Accept-Encoding’: ’gzip’, ’X-SS-REQ-TICKET’: ’1603350070957’, ’sdk-version’: ’1’, ’Cookie’: ’install_id=1758845207590062; ttreq=1$34f012b99d70a66f681dc3d1f0b438fc1b161af3; d_ticket=77247c94236bf8055c233f8cabb6a5ddf3231; odin_tt=fccb20add45a15f08a2519eadcaaf22cba4b3f8f1fceec300a088407c2daf81ea76b260ef6c81dbc86dfedfea011f68c25238f9b3984fe4f5909441dfd1cc9c2; sid_guard=6de18a966e69dcbbf076f629a2ef6511%7C1603345424%7C5184000%7CMon%2C+21-Dec-2020+05%3A43%3A44+GMT; uid_tt=ba98af780b4e337f01463cf98a8afafd; sid_tt=6de18a966e69dcbbf076f629a2ef6511; sessionid=6de18a966e69dcbbf076f629a2ef6511’, ’x-tt-token’: ’006de18a966e69dcbbf076f629a2ef651189d3f6f73fd3d6319b543d50d2e2e5a4cf3e383f8da81f07e049bcf850de07d331’, ’X-Gorgon’: ’0404d8210000a6a3dca0dbc6b11483a82420c9a94dd050a3e511’, ’X-Khronos’: ’1603350070’, ’Host’: ’aweme.nssdk.com’, ’Connection’: ’Keep-Alive’, ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36’, } self.add = ’D:抖音評論資料’ self.videos_list = os.listdir(’D:抖音評論資料’) def parse(self): ’鏈接,內容,發布人昵稱,發布時間,點贊數,評論數,分享數’ lists = [] for vid in self.videos_list: a = open(’D:抖音評論資料{}’.format(vid),encoding=’utf-8’) content = json.load(a) for con in content[’data’]:meta = {}try: meta[’title’] = con[’aweme_info’][’desc’] meta[’author_name’] = con[’aweme_info’][’author’][’nickname’] meta[’u_name’] = con[’aweme_info’][’author’][’unique_id’] meta[’create_time’] = con[’aweme_info’][’create_time’] timeArray = time.localtime(meta[’create_time’]) meta[’create_time’] = time.strftime('%Y--%m--%d %H:%M:%S', timeArray) meta[’digg_count’] = con[’aweme_info’][’statistics’][’digg_count’] meta[’comment_count’] = con[’aweme_info’][’statistics’][’comment_count’] meta[’share_count’] = con[’aweme_info’][’statistics’][’share_count’] meta[’share_url’] = con[’aweme_info’][’share_url’]except: meta[’title’] = ’’ meta[’author_name’] = ’’ meta[’u_name’] = ’’ meta[’create_time’] = ’’ meta[’digg_count’] = ’’ meta[’comment_count’] = ’’ meta[’share_count’] = ’’ meta[’share_url’] = ’’if meta[’u_name’] == ’’: try: meta[’u_name’] = con[’aweme_info’][’music’][’owner_handle’] except: meta[’u_name’] = ’’if meta[’title’] == ’’: passelse: lists.append(meta) # print(meta) return lists def save_data(self, meta): header = [’share_url’, ’title’, ’author_name’, ’u_name’, ’create_time’, ’digg_count’, ’comment_count’, ’share_count’] print(meta) with open(’test.csv’, ’a’, newline=’’, encoding=’utf-8-sig’) as f: writer = csv.DictWriter(f, fieldnames=header) writer.writeheader() # 寫入列名 writer.writerows(meta) def run(self): meta = self.parse() self.save_data(meta)if __name__ == ’__main__’: douyin = Douyin() douyin.run()

運行代碼后在代碼執行目錄下會生成一個excel

python實現模擬器爬取抖音評論數據的示例代碼

ps:抖音不會一次性返回整個評論數據包,每次往下滑動評論區會多出26條評論數據,我們就可以利用模擬器進行滑動操作。

點擊 更多>鼠標宏

python實現模擬器爬取抖音評論數據的示例代碼

點擊錄屏之后,用鼠標往下滑動一次頁面

python實現模擬器爬取抖音評論數據的示例代碼

點擊停止,就會將你剛才的操作保存下來

python實現模擬器爬取抖音評論數據的示例代碼

點擊設置 可以對剛才的操作進行循環播放,從而達到自動刷新評論區。

python實現模擬器爬取抖音評論數據的示例代碼

到此這篇關于python實現模擬器爬取抖音評論數據的示例代碼的文章就介紹到這了,更多相關python 擬器爬取數據內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: 抖音 Python
相關文章:
主站蜘蛛池模板: 国产97在线观看 | 国产高清美女一级a毛片久久w | 久久国产精品佐山爱 | 美女一级视频 | 小明明看看视频永久免费网 | 国产精品一在线观看 | 黄色ww| 综合久久久久综合体桃花网 | 日本免费不卡一区二区 | 亚洲色图第十页 | 麻豆短视频传媒网站怎么找 | 中国人xxxxx18 | 久热在线视频 | xxxxxx日本护士 | 微拍秒拍99福利精品小视频 | 成人久久18免费软件 | 日本欧美国产精品第一页久久 | 亚洲图片综合区 | 爱爱小视频免费体验区在线观看 | 91porn在线观看国产 | 老头做爰xxxx视频 | 在线观看色视频 | 1024在线视频精品免费播放 | 九九视频在线看精品 | 久久久精品中文字幕 | 在线 你懂的 | 日本黄色美女视频 | 国产成+人欧美+综合在线观看 | 国产72av国片精品jk制服 | 久久婷婷在线 | 全黄性性激高免费视频 | 久久精品一区二区三区不卡牛牛 | 国产一级做a爰片久久毛片 国产一级做a爰片久久毛片99 | 青青青国产依人精品视频 | 日韩美在线 | 五月狠狠亚洲小说专区 | 天天天色| 亚洲美色综合天天久久综合精品 | 911精品国产亚洲日本美国韩国 | 麻豆69堂免费视频 | 国产特级毛片aaaaaa毛片 |