前阵子尝试做了个小程序,主要是采集和分析香港六合彩数据。
思路比较简单,就是先采集到香港六合彩的历年数据,然后就是根据每期的中奖号码来进行统计分析,来预测下一期的开奖号码,分析号码的奇偶数和大小码。
话不多说,我们直接上正题。
首先先找到一个有六合彩数据的网站:https://kjh.55128.cn/hk6-history-30.htm

注:kjh.55128.cn 这个网站不但提供最近30期、50期、80期和120期香港六合彩数据,也提供手动输入最近比如300期、600期等数据。我大概看了下,不包括之前的数据,从03年左右调整玩法开始,迄今大概开有2000多期数据。
接下来要做的第一步,就是将这个网站上的六合彩数据采集(抓取)下来。
这次我用了php进行程序的编写,没有别的原因,而是我在搜索组件时,发现一款基于php的网页数据爬虫,所以直接就用php来编写这套程序了。
打开网页源代码,可以看到html如下,

留意看,数据都存储在table中,其中table又分为两部分,前一部分为thead和tr,后部分则是真正的数据tbody和tr。
这样可以利用 simple-html-dom 这个组件的擅长,将数据先抓取下来。
simple-html-dom 的官方网址为:https://simplehtmldom.sourceforge.io
代码如下,

抓取到的数据如下,


执行程序,如下结果,

这个就完成第一步抓取到了需要的六合彩数据,接下来就是统计和分析该数据了,这个我们后边再讲。
不明觉厉👍👍👍大佬太厉害了
👍👍👍太厉害,大伟哥编程都会弄!
大伟哥,能不能把下期算出来。
中奖了我请你去东莞
东莞疫情严重,可以来成都。
去成都掏个耳朵也很巴适嘛
还可以尝尝地道的火锅,品一品特色的功夫茶。洗个脚按个摩也挺好。😊
这功夫茶还是老朽泡才地道。
潮汕功夫茶是很有名滴
我试试 :)
🤣正有此意
这个好,分析出来后,还望大伟哥分享,中了,我请你来成都耍。😊
要不要众筹投注,提高中奖面😬😬😁
好厉害,聪明,有智慧👍👍👍
话说当年我可是高手,一晃都十几年不玩了
程序员都是高端的技术活😂
好高大上的感觉,不知道实战怎么样😀
为什么要做这?你能投注香港六合彩?
伟哥,能不能让我中个五百万,我太想发财了😂😂
哇,太厉害了,期待并祝福你发大财:)