亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

更多QQ空间微信QQ好友腾讯朋友复制链接
您的位置:首頁/技術(shù)文章
文章詳情頁

node.js - node async寫的爬蟲小程序請求高手指導

【字号: 作者:豬豬瀏覽:128日期:2024-08-03 18:32:21

問題描述

var cnodeUrl = 'https://segmentfault.com/';// 存放所有主題鏈接鏈接var topicUrls = [];/** * 所有的url請求完成后,ep控制異步結(jié)束,進入每一個主題 */ep.after(’topic_html’, topicUrls.length, function(topics) { var concurrencyCount = 0; // 記錄并發(fā)數(shù) /** * 進入主題,取得題目 * @callback topics [{title:’’}] */ var fetchUrl = function(myurl, callback) {var fetchStart = new Date().getTime();concurrencyCount++;console.log(’現(xiàn)在的并發(fā)數(shù)是’, concurrencyCount, ’,正在抓取的是’, myurl);superagent.get(myurl).end(function(err, ssres) { if (err) {callback(err, myurl + ’ error happened!’); } var time = new Date().getTime() - fetchStart; console.log(’抓取 ’ + myurl + ’ 成功’, ’,耗時’ + time + ’毫秒’); concurrencyCount--; var $ = cheerio.load(ssres.text); var reslut = {title: $(’.question__author>a>strong’).text(),answer: $(’#answers-title’).text() }; callback(null, result);}) } // 控制最大并發(fā)數(shù)為5,在結(jié)果中取出callback返回來的整個結(jié)果數(shù)組。 async.mapLimit(topicUrls, 5, function (myurl, callback) {fetchUrl(myurl, callback); }, function (err, result) {console.log(’===== result: ======n’, result);//res.send(result); });})// 獲得所有主題鏈接 topicUrlssuperagent.get(cnodeUrl).end(function(err, sres) { if(err) {return next(err); } var $ = cheerio.load(sres.text); $(’.stream-list’).each(function(idx, element) {var $element = $(element).find(’.title>a’);var href = url.resolve(cnodeUrl, $element.attr(’href’));topicUrls.push(href); }) console.log(’get authorUrls successful!n’, topicUrls); ep.emit(’topic_html’, ’get topicUrls successful’);})

得到的結(jié)果是:

node.js - node async寫的爬蟲小程序請求高手指導

請教一下哪里出了問題?

問題解答

回答1:

重寫了下:

var async = require(’async’);var cheerio = require(’cheerio’);var superagent = require(’superagent’);var url = require(’url’);var cnodeUrl = 'https://segmentfault.com/';// 存放所有主題鏈接鏈接var topicUrls = [];// 獲得所有主題鏈接 topicUrlssuperagent.get(cnodeUrl).end(function(err, sres) { if(err) {return next(err); } var $ = cheerio.load(sres.text); $(’.stream-list__item’).each(function(idx, element) {var $element = $(element).find(’.title>a’);var href = url.resolve(cnodeUrl, $element.attr(’href’));topicUrls.push(href); }) // 控制最大并發(fā)數(shù)為5,在結(jié)果中取出callback返回來的整個結(jié)果數(shù)組。 async.mapLimit(topicUrls, 5, function (myurl, callback) {fetchUrl(myurl, callback); }, function (err, result) {console.log(’===== result: ======’, result); });})function fetchUrl(myurl,callback) { var fetchStart = new Date().getTime(); superagent.get(myurl).end(function(err, ssres) {if (err) { callback(err, myurl + ’ error happened!’);}var time = new Date().getTime() - fetchStart;console.log(’抓取 ’ + myurl + ’ 成功’, ’,耗時’ + time + ’毫秒’);// concurrencyCount--;var $ = cheerio.load(ssres.text);var reslut = { title: $(’.question__author>a>strong’).text(), answer: $(’#answers-title’).text()};callback(null, reslut); })}

你上面的代碼,我感覺你是參考

https://github.com/alsotang/node-lessons/blob/master/lesson4/app.js

這個課程寫的吧,應該是你用的eventproxy方式不正確

相關(guān)文章:
主站蜘蛛池模板: 亚洲美女在线观看 | 97色婷婷成人综合在线观看 | 亚洲欧美一级视频 | 中国美女做爰视频高清 | 国产亚洲精品久久久久久午夜 | 亚洲精品在线免费观看视频 | 日韩精品久久久久久 | 欧美日韩在线播放一区二区三区 | 国产黄色免费在线观看 | 国产亚洲精品热视频在线观看 | 久久99国产这里有精品视 | 黄色片在线免费播放 | 亚洲国产天堂久久综合9999 | 99久久一区 | 亚洲国产精品综合久久20 | 久操视频网站 | 亚洲女同视频 | 国产高清厕所盗摄视频 | 娇喘呻吟福利视频在线观看 | 亚洲人成网国产最新在线 | 毛片在线播放网址 | 在线91色 | 国内精品久久久久久 | 午夜一级毛片免费视频 | 狼人 成人 综合 亚洲 | 中国特级黄一级真人毛片 | 久久精品成人一区二区三区 | 久久综合九色婷婷97 | 黄色综合网站 | 国产精品国产欧美综合一区 | 日韩孕交japanese孕交 | 国产一级内谢a级高清毛片 国产一级毛片大陆 | 久久久久日韩精品免费观看网 | 日本亚洲乱码中文字幕影院 | 免费一级毛片在线播放放视频 | 午夜拍拍福利视频蜜桃视频 | 中文字幕日韩精品一区口 | 日本成人片网站 | 欧美日韩在线第一页 | 亚洲性影院 | 免费精品一区二区三区在线观看 |