亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

更多QQ空间微信QQ好友腾讯朋友复制链接
您的位置:首頁/技術(shù)文章
文章詳情頁

python中用Scrapy實(shí)現(xiàn)定時(shí)爬蟲的實(shí)例講解

【字号: 作者:豬豬瀏覽:5日期:2022-06-29 15:53:12

一般網(wǎng)站發(fā)布信息會(huì)在具體實(shí)現(xiàn)范圍內(nèi)發(fā)布,我們?cè)谶M(jìn)行網(wǎng)絡(luò)爬蟲的過程中,可以通過設(shè)置定時(shí)爬蟲,定時(shí)的爬取網(wǎng)站的內(nèi)容。使用python爬蟲框架Scrapy框架可以實(shí)現(xiàn)定時(shí)爬蟲,而且可以根據(jù)我們的時(shí)間需求,方便的修改定時(shí)的時(shí)間。

1、Scrapy介紹

Scrapy是python的爬蟲框架,用于抓取web站點(diǎn)并從頁面中提取結(jié)構(gòu)化的數(shù)據(jù)。任何人都可以根據(jù)需求方便的修改。Scrapy用途廣泛,可以用于數(shù)據(jù)挖掘、監(jiān)測(cè)和自動(dòng)化測(cè)試。

2、使用Scrapy框架定時(shí)爬取

import timefrom scrapy import cmdlinedef doSth(): # 把爬蟲程序放在這個(gè)類里 zhilian_spider 是爬蟲的name cmdline.execute(’scrapy crawl zhilian_spider’.split())# 想幾點(diǎn)更新,定時(shí)到幾點(diǎn)def time_ti(h=17, m=54): while True: now = datetime.datetime.now() # print(now.hour, now.minute) if now.hour == h and now.minute == m: doSth() # 每隔60秒檢測(cè)一次 time.sleep(60)time_ti()3、更簡(jiǎn)單的寫法

import timeimport sysimport osimport datetimedef Dingshi():while True:os.system('scrapy crawl lcp')#lcp是我們爬蟲的代碼名字哦time.sleep(60)Dingshi()

知識(shí)點(diǎn)擴(kuò)展:

直接使用Timer類實(shí)例代碼

import timeimport oswhile True: os.system('scrapy crawl News') time.sleep(86400) #每隔一天運(yùn)行一次 24*60*60=86400s或者,使用標(biāo)準(zhǔn)庫的sched模塊import sched#初始化sched模塊的scheduler類#第一個(gè)參數(shù)是一個(gè)可以返回時(shí)間戳的函數(shù),第二個(gè)參數(shù)可以在定時(shí)未到達(dá)之前阻塞。schedule = sched.scheduler ( time.time, time.sleep )#被周期性調(diào)度觸發(fā)的函數(shù)def func(): os.system('scrapy crawl News')def perform1(inc): schedule.enter(inc,0,perform1,(inc,)) func() # 需要周期執(zhí)行的函數(shù)def mymain(): schedule.enter(0,0,perform1,(86400,))if __name__=='__main__': mymain() schedule.run() # 開始運(yùn)行,直到計(jì)劃時(shí)間隊(duì)列變成空為止關(guān)于cmd的實(shí)現(xiàn)方法,本人在單次執(zhí)行爬蟲程序時(shí)使用的是 cmdline.execute('scrapy crawl News'.split())但可能因?yàn)閏mdline是scrapy模塊中自帶的,所以定時(shí)執(zhí)行時(shí)只能執(zhí)行一次就退出了。

到此這篇關(guān)于python中用Scrapy實(shí)現(xiàn)定時(shí)爬蟲的實(shí)例講解的文章就介紹到這了,更多相關(guān)python中使用Scrapy實(shí)現(xiàn)定時(shí)爬蟲內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 欧美一级毛片在线 | 青青草手机在线观看 | 337p粉嫩大胆噜噜噜鲁 | 伊人影院中文字幕 | 日鲁夜鲁鲁狠狠综合视频 | 亚洲乱人伦在线 | 久久久久爽亚洲精品 | 大陆精品自在线拍国语 | 中文字幕 视频一区 | 中国黄色毛片视频 | 久久精品亚洲一区二区三区浴池 | 1000部国产拍拍拍拍在线观看 | 曰韩一级片 | 亚洲免费在线播放 | 亚洲 欧美 精品 中文第三 | 日本特黄特色大片免费播放视频 | 免费a网址| 精品视频69v精品视频 | 亚洲tv成人天堂在线播放 | 精品一区二区三区的国产在线观看 | 国产精品青草久久 | 91精品国产美女福到在线不卡 | 欧美激情级毛片 | 美女一级毛片免费观看 | 超级碰碰碰在线观看 | 亚洲欧美日韩中文v在线 | 欧美日韩一区二区三区在线视频 | 一级特黄录像免费播放冫 | 久久一区二区明星换脸 | 护士精品一区二区三区 | 国产一级视频在线观看 | 久久美女网 | 亚洲精品国产精品国自产观看 | 国产91久久久久久久免费 | 国产成人禁片免费观看视频 | 黄视频网站免费 | 亚洲精品中文字幕乱码影院 | 一级一级人与动毛片 | 在线小视频国产 | 久久精品中文字幕有码日本 | 狠狠综合欧美综合欧美色 |