当前位置 博文首页 > 孤寒者的博客:两万字博文教你python爬虫requests库,看完还不会

    孤寒者的博客:两万字博文教你python爬虫requests库,看完还不会

    作者:[db:作者] 时间:2021-07-14 13:19

    ?👻上一篇博文一篇万字博文带你入坑爬虫这条不归路(你还在犹豫什么&抓紧上车) 【??熬夜整理&建议收藏??】被众多爬虫爱好者/想要学习爬虫的小伙伴们阅读之后,很多小伙伴私信我说——大佬搞爬虫都是用的socket套接字嘛?👻

    ?😬(苦笑)“那肯定不是啊!python为我们封装了那么多伟大而又简单实用的爬虫库,”不过我想说的是,“ 学啥技术都是从底层抓起,万丈高楼平地起,它也是基于地基稳! 所以在入坑文中简单地介绍使用了下底层爬虫库——socket!”😬

    ?😜而本文,本博主就带领小伙伴们认真地学习一下Python中一大广为使用的爬虫库——Requests——专为人类而构建;有史以来下载次数最多的Python软件包之一!😜

    放松放松眼睛!


    ?????????????重点来啦!重点来啦!! 💗💗💗

    ??相信有不少小伙伴已经通过我的上篇博文入坑爬虫,而本篇文讲解的Requests库也是学习爬虫之路的一大最为重要的知识点,在我们日后的爬虫开发中使用的最多的也是它哦!

    学好Requests,你的爬虫之路日后将畅通无阻!!!


    ??两万字Requests库详解??

    • 1.简介
    • 2.发起请求
      • 参数详解:
        • (1)请求方法method:
        • (2)统一资源定位符url
        • (3)传递url参数params
        • (4)传递form表单数据——data
        • (5)传递json数据——json
        • (6)自定义headers
        • (7)自定义cookies
          • ①获取cookies:
          • ②使用Cookie维持登录状态的两种方法:
        • (8)设置代理proxies
        • (9)重定向allow_redirects
        • (10)禁止证书验证vertify
        • (11)设置超时timeout
          • 拓展:
        • (12)文件上传
        • (13)Prepared Request
      • 总结:
    • 3.接收响应
      • (1)响应内容
      • (2)字符编码
      • (3)二进制数据
      • (4)json数据
      • (5)状态码
      • (6)响应报头
      • (7)服务器返回的cookies
      • (8)查看响应的url
      • 总结:
    • 4.使用requests库进行实战:
      • (1)基操 之 实战项目一:进行百度贴吧指定搜索内容获取到的html源码头5页的爬取!
        • ①上代码:
        • ②实现效果:
      • (2)升级版操作 之 实战项目二:使用session实现人人网登录状态维持
        • ①上代码:
        • ②实现效果:
    • 5.In The End!
    cs