当前位置 博文首页 > 通信汪的美好生活的博客:用爬虫分析上热榜涨的600粉,竟发现。
?
目录
?
前言
下面我就分享一下这次经历!
1、编程环境及相关库的安装
1.1、编程环境:
1.2、第三方库:
1.3库的安装方法:
? ? ?1.3.1、Windows的shell命令安装
? ? ?1.3.2、在编程环境内安装
2、如何通过爬虫获取粉丝数据
2.1、获取自己待爬的URI
2.1.1、到这个界面,然后右键检查
2.1.2、红色圈住的便是待爬的URL?
2.1.3、记录下"请求URL"和"User-agent"在两个重要的待爬信息?
2.2、采用requests获取粉丝数据
2.3粉丝数据的组成
2.3.1粉丝数据标签的解释
2.3.2重点要分析的数据
3、如何合理的分析这些数据
3.1、把各个分页的数据合并
3.2、数据预处理,数据信息查看
3.3、数据的清洗和预处理等步骤
3.4、数据提取和筛选
3.5数据处理?
3.6数据存储
4、分析粉丝数据得到的结论
最近参加了新星计划,在各位老哥们的帮助下成功上了一次热榜。一夜之间涨了600多的粉。但是这些粉丝全部都是通过用户推荐界面加我的。我就特别好奇我现有粉丝的用户画像(数据分析名词),于是就打算通过python爬一下我这600多粉丝的码龄和用户名以及是不是VIP这三项信息。最后竟然发现了。。。好奇就好好学一下吧。下图是博主近7天内的粉丝数据。关注一下我吧,拜托了,看在我这次这么有诚意的份上。。