亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

selenium - 請(qǐng)教一下 Python 爬蟲(chóng)工具

瀏覽:103日期:2022-06-27 16:46:59

問(wèn)題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒(méi)寫(xiě)過(guò)爬蟲(chóng),老板明天就要數(shù)據(jù)

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問(wèn)題是:1) 我不知道click 有沒(méi)有執(zhí)行成功, click 的元素對(duì)不對(duì), driver 好像沒(méi)有返回值給我參考2) 即使 click 成功了, 但是他是不是只調(diào)了 js里的 click() 方法,并沒(méi)有觸發(fā) target 怎么辦3)我不知道是先渲染page_source, 還是 應(yīng)該先 click, 假設(shè)執(zhí)行成功了 click, 是不是也不會(huì)再 source 里返回了

啊, 謝各位爬蟲(chóng)大佬了

問(wèn)題解答

回答1:

說(shuō)的是什么意思?百思不得其解啊。。。

selenium自動(dòng)化,click能模仿用戶點(diǎn)擊,就跟你自己在頁(yè)面上點(diǎn)擊一樣,一切都在虛擬瀏覽器驅(qū)動(dòng)中進(jìn)行。

看你的業(yè)務(wù)邏輯啊。。。比如有些數(shù)據(jù)要點(diǎn)擊后才有,那就先click再獲取源代碼。

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 91视频观看免费 | 国产激情在线观看 | 黑人香蕉又粗又大视频免费 | 亚洲另类网 | 在线高清视频18jin观看 | 久久久久久全国免费观看 | 9191国语精品高清在线最新 | 久久一级毛片 | 国产呦精品一区二区三区网站 | avtt加勒比手机版天堂网 | 国产成人高清亚洲一区91 | 成在线人免费视频 | 亚洲福利一区二区精品秒拍 | 欧亚精品一区二区三区 | 国产综合色在线视频区色吧图片 | 国产99精品 | 中国特黄毛片 | 最新国产精品精品视频 | 你懂得2019在线观看网站 | 亚洲黄色影院 | 久久精品国产色蜜蜜麻豆 | 日本乱中文字幕系列 | 九九视频只有精品 | 真实偷清晰对白在线视频 | 精品久久久久久久久久久 | 日韩欧美一区二区久久黑人 | 欧美三级第一页 | 色香婷婷 | 欧美一级毛片aaa片 欧美一级毛片一 | 久久精品国产400部免费看 | 精品中文字幕在线观看 | 全黄毛片| 精品国产一区二区三区成人 | 五月婷婷久 | 国精品一区二区三区 | 久久久久国产精品免费免费不卡 | 99xxoo视频在线永久免费观看 | 日韩高清在线不卡 | 亚洲三级在线看 | 337q日本大胆欧美人术艺术 | 亚洲午夜久久影院 |