大数据AI

csdn学院大数据知乎

背景

这几天,同事都去出差,稍有感冒的我提前在办公室感受到了“孤独终老”的恐惧。

前言

我个人是15年注册知乎,三年过去了,我个人主页数据是:

数据

直接爬取知乎的用户数据,包括ID、粉丝数量、工作信息、回答数量、文章数量等等。

csdn学院大数据知乎

这些用户的分布区域是什么样的

拿到这些数据,我一开始不关注用户的性别,我知道,这个参考价值并不高,因为,我在一些社区都会在性别那一栏填上“女”。

用户分布区域决定这个区域的回答数量吗

其实在做下面这张图之前,我的猜想的答案是肯定的,很明显嘛,哪里人多,自然而然的就会回答多一些,但是我注册知乎后的个人数据又说明存在特例:有的用户都不喜欢回答。带着疑问我做了下面这个分析,看看这些区域的同学是不是平常贡献答案最勤快的。

用户都来自哪些大学

哪个大学的用户贡献的答案最多

我们都知道,知乎是一个问答社区,贡献自己的回答,来帮助他人,从知识的领域,将雷锋精神发扬光大。那么哪个学校的用户总体回答数最高呢?

用户粉丝的多少与哪些因素有关

有意思的专业

谈到写文章,我就想看看这些平常喜欢写作的同学都是学的什么专业

那些经常提问的同学都来自哪个行业领域

还记得开篇的时候让大家思考的那个问题吗,如果你还没来得及思考,你现在可以再回头看一下~

开始我本来想直接查看个用户的职位性质来直接说明这个,但是我觉得单纯以一个在“注册”和“完善资料”步骤中填写的一个职位来说明这个有点牵强和草率,所以后面我换了一种思维,我想从用户关注的点,以及知乎上面的问题和回答所呈现的数据反推“所在的地域决定了大的环境,环境影响人关注的行业和领域”这一点,这样也显得更加严谨和科学。

下面是用户职位的分析(去除空值null后的)

首次发言的潜在寓意是什么

仔细看上面数据 excel 截图的同学应该发现了,其中有个字段是”first_answer”,这个字段很有用

从10年到11年,几乎垂直上升,说明在这个时间段,有大量的用户注册。事实是,知乎是10年末期开放邀请注册的,那么此期间用户剧增,理所当然

从11年到12年,有下降,说明在产品形成初期,有一定的用户基数后,注册遇到了瓶颈,在知乎社区活跃的几乎都是老用户,所以没有新用户,不存在首次回答,于是,出现了下降

从12年到14年,再次出现峰值,说明又有大批用户注册,去翻知乎的发展史可以看到,这个时间段,知乎取消以往的邀请注册,开放公众注册,那自然而然会出现用户暴增了

之后的几年都是下降,如果读者是互联网从业或者关注这块的信息,你应该已经想到这是产品的用户瓶颈到了,一个平台的用户天花板只有这么高,当没有新用户注册并且参与活跃,first_answer 这个字段就没有意义了,所以到了16年,首次回答的用户非常低,说明,这个平台的新用户增长低,甚至没有

这是从 first_answer 得出的分析,那么你能根据 last_answer 得出什么结论呢?

总结

有时候从数据分析去反推事实很有意思,这大概也是数据产品最迷人的地方吧。以后的一段时间,我将爬拉钩、爬新浪、爬大众点评、爬物流等一系列平台的数据,来和大家一起分享数据产品经理的乐趣和日常,感兴趣的朋友,欢迎来我博客做客。

Similar Posts

发表评论

邮箱地址不会被公开。 必填项已用*标注