Hive中文社区数据统计APP

以前一直没有用过ReactJS,最近开始接触。但学习的最好途径就是实战。做个什么呢?最近几个月一直在Hive CN中文社区发帖。那么就统计一下HIVE CN中文社区的各种数据吧。如果有什么我没想到的统计指标,欢迎大家留言,我会在后续版本中改进。

image.png

先上链接:https://hivecnstats.github.io/

数据来源

数据的抓取是用Python写的一个程序,每天定期抓取HIVE CN区的帖子,并保存到数据库中。同时,每天会在指定的时间生成json文件,以便于前端的React使用。

这里需要说明一下:

  • 统计数据和时间有关,这里以我服务器所在的英国时区为准。
  • 前端使用的json数据每天只更新一次。
  • 如果发生API节点故障等问题,抓取的数据可能会有遗漏。(当然,这个是可以解决的,但目前尚未实现)

前端数据的显示

目前显示的统计数据都是近三十天的。后续可以考虑添加近七天,或者其他时间区间的统计。

统计图形

作者活跃度统计

这里统计的是作者在近30天内的发帖数。这里只统计发帖数在前30名的作者,其他的作者会并入'Others'。

image.png

发帖数统计

这里统计在近30天内,HIVE CN社区的每日发帖数:

image.png

这里有个小问题,就是统计当天的数据尚不完全,稍后会做修改。

标签的使用

这里统计在HIVE CN社区中大家发帖时所使用的各种标签,这里把'HIVE CN中文社区/hive-105017'还有‘cn'排除了,因为几乎大家都使用这两个标签。

image.png

发帖时间统计

这里统计的是在每天24个小时中,哪个时段的发帖数最多。可以看到,英国时间下午两点,也就是国内时间晚上九点的时候,大家最为活跃:

image.png

这个程序做的还比较粗糙,有什么需要改进的,请大家多提意见。

Sort:  

牛逼啊 在下佩服20200712%20%E5%8A%A8%E6%BC%AB%E6%8F%92%E7%94%BB%EF%BD%9C591%E7%B4%A0%E6%9D%90_00720.jpg

牛逼啊 在下佩服+1

妹子,你的功夫也太好了.gif

哈哈,还是妹子功夫更厉害

👍 👍 👍

谢谢贺老师