当前位置 博文首页 > 杨秀璋的专栏:[Python从零到壹] 六.网络爬虫之BeautifulSoup爬

    杨秀璋的专栏:[Python从零到壹] 六.网络爬虫之BeautifulSoup爬

    作者:[db:作者] 时间:2021-08-12 12:14

    欢迎大家来到“Python从零到壹”,在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解,真心想把自己近十年的编程经验分享给大家,希望对您有所帮助,文章中不足之处也请海涵。Python系列整体框架包括基础语法10篇、网络爬虫30篇、可视化分析10篇、机器学习20篇、大数据分析20篇、图像识别30篇、人工智能40篇、Python安全20篇、其他技巧10篇。您的关注、点赞和转发就是对秀璋最大的支持,知识无价人有情,希望我们都能在人生路上开心快乐、共同成长。

    前一篇文章讲述了BeautifulSoup技术,它是一个可以从HTML或XML文件中提取数据的Python库,一个分析HTML或XML文件的解析器,包括安装过程和基础语法。这篇文章将详细讲解 BeautifulSoup 爬取豆瓣TOP250电影,通过案例的方式让大家熟悉Python网络爬虫,同时豆瓣TOP250也是非常适合入门的案例,也能普及简单的预处理知识。 希望对您有所帮助,本文参考了作者CSDN的文章,链接如下:

    • https://blog.csdn.net/Eastmount
    • https://github.com/eastmountyxz/Python-zero2one

    同时,作者新开的“娜璋AI安全之家”将专注于Python和安全技术,主要分享Web渗透、系统安全、人工智能、大数据分析、图像识别、恶意代码检测、CVE复现、威胁情报分析等文章。虽然作者是一名技术小白,但会保证每一篇文章都会很用心地撰写,希望这些基础性文章对你有所帮助,在Python和安全路上与大家一起进步。

    文章目录

    • 一.分析网页DOM树结构
      • 1.分析网页结构及简单爬取
      • 2.定位节点及网页翻页分析
    • 二.爬取豆瓣电影信息
    • 三.链接跳转分析及详情页面爬取
    • 四.总结
    cs