自己动手编写程序,抓取香港六合彩数据

in HIVE CN 中文社区4 years ago (edited)

前阵子尝试做了个小程序,主要是采集和分析香港六合彩数据。

思路比较简单,就是先采集到香港六合彩的历年数据,然后就是根据每期的中奖号码来进行统计分析,来预测下一期的开奖号码,分析号码的奇偶数和大小码。

话不多说,我们直接上正题。

首先先找到一个有六合彩数据的网站:https://kjh.55128.cn/hk6-history-30.htm

image.png

注:kjh.55128.cn 这个网站不但提供最近30期、50期、80期和120期香港六合彩数据,也提供手动输入最近比如300期、600期等数据。我大概看了下,不包括之前的数据,从03年左右调整玩法开始,迄今大概开有2000多期数据。

接下来要做的第一步,就是将这个网站上的六合彩数据采集(抓取)下来。

这次我用了php进行程序的编写,没有别的原因,而是我在搜索组件时,发现一款基于php的网页数据爬虫,所以直接就用php来编写这套程序了。

打开网页源代码,可以看到html如下,

image.png

留意看,数据都存储在table中,其中table又分为两部分,前一部分为thead和tr,后部分则是真正的数据tbody和tr。

这样可以利用 simple-html-dom 这个组件的擅长,将数据先抓取下来。

simple-html-dom 的官方网址为:https://simplehtmldom.sourceforge.io

代码如下,

image.png

抓取到的数据如下,

image.png

image.png

执行程序,如下结果,

image.png

这个就完成第一步抓取到了需要的六合彩数据,接下来就是统计和分析该数据了,这个我们后边再讲。

Sort:  

不明觉厉👍👍👍大佬太厉害了

👍👍👍太厉害,大伟哥编程都会弄!

大伟哥,能不能把下期算出来。
中奖了我请你去东莞

东莞疫情严重,可以来成都。

去成都掏个耳朵也很巴适嘛

还可以尝尝地道的火锅,品一品特色的功夫茶。洗个脚按个摩也挺好。😊

这功夫茶还是老朽泡才地道。
潮汕功夫茶是很有名滴

我试试 :)

🤣正有此意

这个好,分析出来后,还望大伟哥分享,中了,我请你来成都耍。😊

要不要众筹投注,提高中奖面😬😬😁

好厉害,聪明,有智慧👍👍👍

话说当年我可是高手,一晃都十几年不玩了

程序员都是高端的技术活😂

好高大上的感觉,不知道实战怎么样😀

为什么要做这?你能投注香港六合彩?

伟哥,能不能让我中个五百万,我太想发财了😂😂

哇,太厉害了,期待并祝福你发大财:)