亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

html - Python爬蟲,翻頁數據怎么爬,URL不變

瀏覽:81日期:2022-08-09 14:14:12

問題描述

網址:http://quote.eastmoney.com/ce...我想爬所有頁的名稱數據,(這里只有兩頁),判斷有沒有下一頁的條件該怎么寫呢?代碼:

from selenium import webdriverdriver=webdriver.PhantomJS()url=’http://quote.eastmoney.com/center/list.html#28003684_0_2’driver.get(url)usoup = BeautifulSoup(driver.page_source, ’xml’)n=[]while True: t=usoup.find(’table’,{’id’:’fixed’}) utable=t.find_all(’a’,{’target’:’_blank’}) for i in range(len(utable)): if i % 6 ==1: n.append(utable[i].text) if #停止條件怎么寫: break driver.find_element_by_xpath(r’//*@id='pagenav']/a[2]’).click() usoup = BeautifulSoup(driver.page_source, ’xml’)

后面這里就不會寫了。。。

問題解答

回答1:

可以判斷每一頁的條目,每一頁共20條,如果當前頁不足20條的時候,說明此頁是最后一頁了,爬完當前頁就該停止了

回答2:

話說 這個表格不是都有個jsonp的返回接口嗎?為什么還要爬?

回答3:

走的就是jsonp接口,直接拿就好了。

非要抓取的話,只能用selenium + phantomjs 之類的模擬頁面去獲取了。

回答4:

http://nufm.dfcfw.com/EM_Fina...{rank:[(x)],pages:(pc)}&token=7bc05d0d4c3c22ef9fca8c2a912d779c&jsName=quote_123&_g=0.5385195357178545

標簽: Python 編程
主站蜘蛛池模板: 国产日产精品久久久久快鸭 | 狠狠色丁香婷婷综合最新地址 | 麻豆91精品91久久久 | 91精品国产薄丝高跟在线看 | 国产精品黄色大片 | 美国一级特黄 | 九九热精品视频在线观看 | 韩国一级毛片在线高清免费 | 国产伦久视频免费观看 视频 | 免费黄色视屏 | 老人与老人免费a级毛片 | 欧美一级视频在线观看 | 国产一级毛片亚洲久留木玲 | 中文字幕精品视频 | 欧美日韩国产一区三区 | 成人a一级毛片免费看 | 特黄免费| 欧美日韩综合 | 国产色婷婷亚洲99精品小说 | 久久香蕉国产线看观看精品蕉 | 欧美三级影院 | 国产精品三级a三级三级午夜 | 三级大片在线观看 | 免费黄色小视频 | 欧美日韩不卡中文字幕在线 | 正在播放国产精品放孕妇 | 小明成人免费永久性看看 | 37pao成人国产永久免费视频 | 草草线禁成18年在线视频 | 女的被到爽的视频在线观看 | 欧美在线观看一区 | 亚洲va久久久久 | 网友自拍区一区二区三区 | 色你懂的 | 麻豆精品在线观看 | 日韩一区在线播放 | 欧美一区精品 | 久久久99视频 | 国产精选在线 | 黄色成年 | 国产成人一区二区三区影院免费 |