以前一直没有用过ReactJS,最近开始接触。但学习的最好途径就是实战。做个什么呢?最近几个月一直在Hive CN中文社区发帖。那么就统计一下HIVE CN中文社区的各种数据吧。如果有什么我没想到的统计指标,欢迎大家留言,我会在后续版本中改进。

先上链接:https://hivecnstats.github.io/
数据来源
数据的抓取是用Python写的一个程序,每天定期抓取HIVE CN区的帖子,并保存到数据库中。同时,每天会在指定的时间生成json文件,以便于前端的React使用。
这里需要说明一下:
- 统计数据和时间有关,这里以我服务器所在的英国时区为准。
- 前端使用的json数据每天只更新一次。
- 如果发生API节点故障等问题,抓取的数据可能会有遗漏。(当然,这个是可以解决的,但目前尚未实现)
前端数据的显示
目前显示的统计数据都是近三十天的。后续可以考虑添加近七天,或者其他时间区间的统计。
统计图形
作者活跃度统计
这里统计的是作者在近30天内的发帖数。这里只统计发帖数在前30名的作者,其他的作者会并入'Others'。

发帖数统计
这里统计在近30天内,HIVE CN社区的每日发帖数:

这里有个小问题,就是统计当天的数据尚不完全,稍后会做修改。
标签的使用
这里统计在HIVE CN社区中大家发帖时所使用的各种标签,这里把'HIVE CN中文社区/hive-105017'还有‘cn'排除了,因为几乎大家都使用这两个标签。

发帖时间统计
这里统计的是在每天24个小时中,哪个时段的发帖数最多。可以看到,英国时间下午两点,也就是国内时间晚上九点的时候,大家最为活跃:

这个程序做的还比较粗糙,有什么需要改进的,请大家多提意见。
牛逼啊 在下佩服
谢谢
牛逼啊 在下佩服+1
哈哈,还是妹子功夫更厉害
👍 👍 👍
谢谢贺老师