亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

基于Python爬取51cto博客頁面信息過程解析

瀏覽:23日期:2022-07-13 09:44:43

介紹

提到爬蟲,互聯網的朋友應該都不陌生,現在使用Python爬取網站數據是非常常見的手段,好多朋友都是爬取豆瓣信息為案例,我不想重復,就使用了爬取51cto博客網站信息為案例,這里以我的博客頁面為教程,編寫的Python代碼!

實驗環境

1.安裝Python 3.7

2.安裝requests, bs4模塊

實驗步驟

1.安裝Python3.7環境

2.安裝requests,bs4 模塊

打開cmd,輸入:pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple/

再安裝bs4, 輸入:pip install bs4 -i https://pypi.tuna.tsinghua.edu.cn/simple/

安裝后面加上-i https://pypi.tuna.tsinghua.edu.cn/simple/ 表示從清華鏡像下載模塊,速度會提高好多!

3.編寫代碼

# 爬取51cto博客頁面import requestsimport bs4import redef open_url(url): # 使用代理 # proxies = {'http': '127.0.0.1:1080', 'https': '127.0.0.1:1080'} headers = { ’user-agent’: ’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) ’ ’Chrome/57.0.2987.98 Safari/537.36’} # res = requests.get(url, headers=headers, proxies=proxies) res = requests.get(url, headers=headers) return resdef find_titles(res): soup = bs4.BeautifulSoup(res.text, ’html.parser’) # 博客名 titles = [] targets = soup.find_all('a', class_='tit') for each in targets: titles.append(each.text.strip()) # 閱讀量 reads = [] read1 = soup.find_all('p', class_='read fl on') read2 = soup.find_all('p', class_='read fl') for each in read1: reads.append(each.text) for each in read2: reads.append(each.text) # 評論數 comment = [] targets = soup.find_all('p', class_=’comment fl’) for each in targets: comment.append(each.text) # 收藏 collects = [] targets = soup.find_all('p', class_=’collect fl’) for each in targets: collects.append(each.text) # 匯總 result = [] length = len(titles) for i in range(length): result.append(titles[i] + ’n’ + reads[i] + ’ ’ + comment[i] + ’ ’ + collects[i] + ’n’) return result# 找出一共有多少個頁面def find_depth(res): soup = bs4.BeautifulSoup(res.text, ’html.parser’) depth = soup.find(’li’, class_=’next’).previous_sibling.previous_sibling.text return int(depth)def main(): host = 'https://blog.51cto.com/13760351' res = open_url(host) depth = find_depth(res) result = [] for i in range(1, depth + 1): #范圍是1到6頁 url = host + ’/p’ + str(i) #網頁鏈接是后面加上/pi res = open_url(url) result.extend(find_titles(res)) # 寫入文本文件中 with open('51cto博客.txt', 'w', encoding='utf-8') as f: for each in result: f.write(each)#主程序入口if __name__ == '__main__': main()

4.運行代碼,查看效果

阿里云服務器安裝postfix--郵箱服務(排坑過程詳解) 薦 置頂閱讀 10000+ 評論 2 收藏 9(教科書式教程?。┰赩Mware Workstation 14 上安裝CentOS 7 【送安裝包】 置頂閱讀 10000+ 評論 10 收藏 0CentOS 7 系統YUM 安裝MySQL 5.7閱讀 136 評論 0 收藏 1Docker 安裝(官方安裝方法)閱讀 153 評論 0 收藏 0運維實用工具推薦閱讀 159 評論 0 收藏 0K8S 部署 Rancher 2.X 版本閱讀 1068 評論 0 收藏 0python 練習題(三)閱讀 260 評論 0 收藏 0DNS--域名解析閱讀 170 評論 0 收藏 0python 練習題(二)閱讀 353 評論 0 收藏 0K8S 使用Dashboard部署nginx群集閱讀 124 評論 0 收藏 0CentOS 7 離線部署K8S群集閱讀 280 評論 0 收藏 0MySQL函數--數學函數閱讀 136 評論 0 收藏 0CentOS 7 安裝SVN閱讀 192 評論 2 收藏 0MYSQL 數據庫索引閱讀 178 評論 0 收藏 0CentOS 8 深入優化 nginx 服務閱讀 509 評論 0 收藏 0CentOS 7 搭建nginx網頁服務閱讀 207 評論 0 收藏 0Linux 文本處理利器--Awk常用命令閱讀 940 評論 0 收藏 0Liunx 文件的查找閱讀 163 評論 0 收藏 0Linux 流編輯--Sed命令及語法閱讀 178 評論 0 收藏 0MYSQL行為閱讀 110 評論 0 收藏 0MYSQL數據庫--連接查詢閱讀 269 評論 0 收藏 0MYSQL 數據庫基本操作閱讀 271 評論 0 收藏 0Ansible 常用模塊閱讀 119 評論 0 收藏 0CentOS 8部署自動化運維工具-- Ansible閱讀 358 評論 0 收藏 0CentOS 7 部署百萬pv項目(高可用架構)閱讀 2139 評論 0 收藏 4MYSQL查詢--子查詢,合并查詢閱讀 242 評論 0 收藏 0MySQL偽事務和性能閱讀 178 評論 0 收藏 0MYSQL數據庫--定義表和字段的別名閱讀 256 評論 0 收藏 0MYSQL查詢--聚合函數查詢閱讀 132 評論 0 收藏 0MYSQL 查詢命令--單表查詢閱讀 205 評論 0 收藏 0ELK 平臺收集Tomcat日志記錄閱讀 316 評論 0 收藏 0CentOS 8 部署ELK日志分析平臺閱讀 730 評論 0 收藏 0Docker 數據管理和網絡通信閱讀 246 評論 0 收藏 0Docker 鏡像創建方法閱讀 143 評論 0 收藏 0Docker 容器操作閱讀 195 評論 0 收藏 0Docker 鏡像操作閱讀 143 評論 0 收藏 0CentOS 8 系統圖形化安裝教程(超詳細)閱讀 4570 評論 0 收藏 0Docker 部署 nginx + tomcat閱讀 501 評論 0 收藏 0Docker 部署war包項目閱讀 2173 評論 0 收藏 1華為云服務器安裝 Docker 容器閱讀 901 評論 0 收藏 0CentOS 8 安裝docker 容器閱讀 4848 評論 0 收藏 0解決 confluence 和 jira 數據包問題閱讀 225 評論 0 收藏 0CentOS 7.6 搭建Gitlab教程閱讀 234 評論 0 收藏 0confluence 配置郵件服務器閱讀 516 評論 0 收藏 0Shell腳本實現 tomcat 日志定時切割閱讀 263 評論 0 收藏 0阿里云服務器Centos7 配置465端口號發送郵件閱讀 774 評論 0 收藏 0MQTT 限制匿名用戶訪問,開啟用戶密碼認證閱讀 640 評論 0 收藏 0CentOS 7.6 部署Redis 數據庫閱讀 150 評論 0 收藏 0CentOS 7.6 破解安裝 Confluence 和 Jira(送安裝包和破解工具)閱讀 5800 評論 0 收藏 0Centos 7 安裝MQTT(EMQ)服務端閱讀 943 評論 0 收藏 0CentOS 7 實現yum安裝最新php版本閱讀 2527 評論 0 收藏 0Python3 對文件操作閱讀 886 評論 0 收藏 0Python3 操作Mysql數據庫閱讀 820 評論 0 收藏 1Selenium 定位元素的8種方法介紹閱讀 1536 評論 0 收藏 0Python Selenium 自動配置zabbix郵箱報警功能閱讀 568 評論 0 收藏 0Zabbix 配置QQ郵箱報警通知閱讀 2043 評論 0 收藏 0CentOS 7 系統搭建私服倉庫Nexus閱讀 664 評論 0 收藏 1解決CentOS 7 最小化安裝后無ifconfig命令閱讀 687 評論 0 收藏 0CentOS 7 安裝禪道并綁定公司內網郵箱閱讀 1161 評論 0 收藏 0Shell 腳本自動安裝公司內部郵箱服務器--Postfix閱讀 7066 評論 0 收藏 4解決虛擬機在橋接模式下設置靜態ip,無法上外網的各種問題閱讀 10000+ 評論 6 收藏 0Shell 腳本自動安裝cobbler(改進+填坑)閱讀 10000+ 評論 3 收藏 0Shell 腳本自動安裝 Cobbler (知識點+踩坑點)閱讀 5292 評論 0 收藏 6CentOS 7.4 系統升級至7.6閱讀 4738 評論 4 收藏 0超實用技能--快速查看windows WiFi密碼閱讀 4518 評論 0 收藏 0Jenkins自動化部署安卓項目閱讀 7574 評論 0 收藏 1記一次阿里云服務器安裝Python的血淚史閱讀 1671 評論 6 收藏 1Jenkins自動化部署nodejs項目(前端項目)閱讀 1445 評論 0 收藏 2Jenkins自動部署發布Java代碼(完整教程)閱讀 9192 評論 0 收藏 1Jenkins自動化打包--war包閱讀 9444 評論 2 收藏 3shell 搭配 python 自動安裝zabbix監控端詳解閱讀 1112 評論 0 收藏 1在CentOS 7系統下升級 Jenkins版本(含排坑過程)閱讀 7223 評論 4 收藏 0Window 10 安裝python 3.7 + selenium (附最新安裝包)閱讀 2984 評論 0 收藏 0CentOS 7 輕松安裝Jenkins閱讀 3259 評論 0 收藏 1腳本安裝Discuz論壇(shell + Python 實現自動化安裝)閱讀 1783 評論 0 收藏 0Shell腳本自動源碼包安裝LA/NMP架構詳解(贈軟件包+腳本)閱讀 3068 評論 0 收藏 0shell腳本一鍵安裝Tomcat服務閱讀 2192 評論 0 贊賞 1【值得收藏!】Vi 文本編輯器細講閱讀 789 評論 4 收藏 1企業應用---部署LAMP平臺 + Discuz論壇【贈安裝包】閱讀 2032 評論 0 收藏 2【高效裝機】PXE實現無人值守安裝CentOS 6閱讀 4144 評論 0 收藏 1在CentOS 7 上安裝Oracle 12c 【贈安裝包】閱讀 4776 評論 0 收藏 1輕松部署MFS分布式文件系統 【內附源碼包】閱讀 3049 評論 0 收藏 1Memcached + LAMP 架構安裝詳解【送源碼包】閱讀 3523 評論 4 收藏 0部署MySQL-MMM 高可用群集閱讀 1123 評論 0 收藏 0搭建 MySQL 讀寫分離(內附源碼包)閱讀 573 評論 2 收藏 1Mysql數據庫主從復制閱讀 716 評論 0 收藏 0mysql數據庫基本命令---多條數據的同時操作閱讀 999 評論 0 收藏 0使用Haproxy 搭建web群集閱讀 496 評論 2 收藏 0MySQL數據庫源碼包安裝(5.7最新版本)閱讀 568 評論 0 收藏 0解決PXE裝機報警----重復安裝系統,無法進入用戶登錄界面閱讀 1521 評論 0 收藏 0解決PXE裝系統報警問題----寫入空間不足閱讀 705 評論 0 收藏 0Nginx 服務語法正確,服務啟動失敗解決方法閱讀 767 評論 0 收藏 0CentOS 7 實現Nginx+Tomcat 負載均衡閱讀 685 評論 0 收藏 0Nginx 構建虛擬主機閱讀 618 評論 0 收藏 0Nginx 服務安全優化---隱藏版本號、網頁緩存、日志分割閱讀 599 評論 0 收藏 0輕松部署Tomcat服務器閱讀 346 評論 0 收藏 0Apache網頁安全優化----設置防盜鏈和隱藏版本信息閱讀 748 評論 0 收藏 0手工編譯安裝Apache網站(贈送源碼包)閱讀 638 評論 0 收藏 1Apache構建虛擬web主機閱讀 747 評論 0 收藏 0CentOS 6 yum 安裝Apache網站閱讀 2072 評論 0 收藏 0搭建AWStats日志分析系統(內附awstats軟件包)閱讀 10000+ 評論 0 收藏 0圖文詳解cobbler 自動裝機教程 (內附epel源)閱讀 10000+ 評論 8 收藏 2DNS分離解析教學 超簡單!閱讀 679 評論 0 收藏 0FTP服務最安全認證模式---虛擬賬戶訪問閱讀 4440 評論 0 收藏 0FTP服務器--實現本地用戶訪問,拒絕匿名用戶閱讀 749 評論 0 收藏 0快速搭建FTP服務器--實現匿名用戶上傳和下載閱讀 1296 評論 2 收藏 0Linux 6.5 服務器上搭建本地yum倉庫閱讀 2206 評論 0 收藏 0【超好用】弱口令掃描工具John the Ripper 圖文教程(附軟件包)閱讀 2669 評論 4 收藏 1詳述在Linux上掛載window共享文件夾閱讀 634 評論 12 收藏 0Redhat Linux 6.5 圖文詳細安裝教程【附安裝包】閱讀 7550 評論 8 收藏 2

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 成人精品一区二区户外勾搭野战 | 国产精品成人观看视频免费 | 免费一级毛片在线播放傲雪网 | 操片免费看 | 国产精品天天看 | 国产精品女上位在线观看 | 一区二区中文字幕在线观看 | 国产一区二区三区影院 | 99久久国产综合精品成人影院 | 丁香六月婷婷精品免费观看 | 国产精品亚洲欧美日韩区 | 久久美| 日本香蕉视频 | 91精品啪国产在线观看免费牛牛 | 中国国产xxxx免费视频 | 欧美成人午夜剧场 | 日韩在线 在线播放 | 三及毛片| 欧美色婷婷 | 久久久久久久999 | 成人午夜在线 | 国产精品视频第一区二区三区 | 免费在线看黄网址 | 中文字幕在线视频网 | 国产污视频在线播放 | 特黄特级毛片免费视 | 久久精品免看国产成 | 午夜精品同性女女 | 精品视频一区二区 | 欧美精品无需播放器在线观看 | 国产一二三区在线 | 日韩 欧美 亚洲国产 | 最新国产精品精品视频 | 国产www在线播放 | 免费小视频网站 | 亚洲一区中文字幕 | 美女黄色毛片 | 国产911情侣拍拍在线播放 | 韩国免费毛片在线看 | 国产一区二区三区在线观看免费 | 欧美综合偷拍在线另类卡通小说 |