杨秀璋的专栏：[Python从零到壹] 六.网络爬虫之BeautifulSoup爬

当前位置博文首页 > 杨秀璋的专栏：[Python从零到壹] 六.网络爬虫之BeautifulSoup爬

杨秀璋的专栏：[Python从零到壹] 六.网络爬虫之BeautifulSoup爬

作者：[db:作者] 时间：2021-08-12 12:14

欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解，真心想把自己近十年的编程经验分享给大家，希望对您有所帮助，文章中不足之处也请海涵。Python系列整体框架包括基础语法10篇、网络爬虫30篇、可视化分析10篇、机器学习20篇、大数据分析20篇、图像识别30篇、人工智能40篇、Python安全20篇、其他技巧10篇。您的关注、点赞和转发就是对秀璋最大的支持，知识无价人有情，希望我们都能在人生路上开心快乐、共同成长。

前一篇文章讲述了BeautifulSoup技术，它是一个可以从HTML或XML文件中提取数据的Python库，一个分析HTML或XML文件的解析器，包括安装过程和基础语法。这篇文章将详细讲解 BeautifulSoup 爬取豆瓣TOP250电影，通过案例的方式让大家熟悉Python网络爬虫，同时豆瓣TOP250也是非常适合入门的案例，也能普及简单的预处理知识。希望对您有所帮助，本文参考了作者CSDN的文章，链接如下：

https://blog.csdn.net/Eastmount
https://github.com/eastmountyxz/Python-zero2one

同时，作者新开的“娜璋AI安全之家”将专注于Python和安全技术，主要分享Web渗透、系统安全、人工智能、大数据分析、图像识别、恶意代码检测、CVE复现、威胁情报分析等文章。虽然作者是一名技术小白，但会保证每一篇文章都会很用心地撰写，希望这些基础性文章对你有所帮助，在Python和安全路上与大家一起进步。

文章目录

一.分析网页DOM树结构
- 1.分析网页结构及简单爬取
- 2.定位节点及网页翻页分析
二.爬取豆瓣电影信息
三.链接跳转分析及详情页面爬取
四.总结

上一篇：weixin_37988176的博客：python基础编程题100-Python 入门编程题

下一篇：没有了

立即下载 - IIS7 站长工具包