当前位置 博文首页 > 通信汪的美好生活的博客:用爬虫分析上热榜涨的600粉,竟发现。

    通信汪的美好生活的博客:用爬虫分析上热榜涨的600粉,竟发现。

    作者:[db:作者] 时间:2021-06-25 21:38

    ?

    目录

    ?

    前言

    下面我就分享一下这次经历!

    1、编程环境及相关库的安装

    1.1、编程环境:

    1.2、第三方库:

    1.3库的安装方法:

    ? ? ?1.3.1、Windows的shell命令安装

    ? ? ?1.3.2、在编程环境内安装

    2、如何通过爬虫获取粉丝数据

    2.1、获取自己待爬的URI

    2.1.1、到这个界面,然后右键检查

    2.1.2、红色圈住的便是待爬的URL?

    2.1.3、记录下"请求URL"和"User-agent"在两个重要的待爬信息?

    2.2、采用requests获取粉丝数据

    2.3粉丝数据的组成

    2.3.1粉丝数据标签的解释

    2.3.2重点要分析的数据

    3、如何合理的分析这些数据

    3.1、把各个分页的数据合并

    3.2、数据预处理,数据信息查看

    3.3、数据的清洗和预处理等步骤

    3.4、数据提取和筛选

    3.5数据处理?

    3.6数据存储

    4、分析粉丝数据得到的结论


    前言

    最近参加了新星计划,在各位老哥们的帮助下成功上了一次热榜。一夜之间涨了600多的粉。但是这些粉丝全部都是通过用户推荐界面加我的。我就特别好奇我现有粉丝的用户画像(数据分析名词),于是就打算通过python爬一下我这600多粉丝的码龄和用户名以及是不是VIP这三项信息。最后竟然发现了。。。好奇就好好学一下吧。下图是博主近7天内的粉丝数据。关注一下我吧,拜托了,看在我这次这么有诚意的份上。。

    博主近七天内的粉丝数据