2020年11月3日,威斯康星州的选举工作人员在市政厅点票。
笔者依据11月10日威斯康星州选举数据库的资料进行分析,发现该州数据库存在诸多问题,其中信息缺失、管理混乱,不但没有设置防止重复选票的有效机制,而且连选民人数都可以随时创造。
天价下载费正义公民公开数据库
在本文开篇,笔者先略谈一下这个数据库的来历。
一位威斯康星州公民听说当地选举中有舞弊,他担心自己的选票被篡改,想查查政府的数据库。选举数据库网站是公开的(https://badgervoters.wi.gov/),谁都可以查,但打开网站后,他震惊了,页面上写着:下载选民名单数据需付12,500美元,下载邮寄选票数据需付12,500美元,买下全部数据集共需25,000美元。
威斯康星州选举数据库单份表格下载费用为12,500美元。(威斯康星州选举网站截图)
他愤怒了,在外州免费或最多几十美金就能下载的数据库,在威斯康星却和买辆新车一样贵!如果选民没有这么多钱,就不配查看本州的数据库吗?!这儿不是委内瑞拉、中国、古巴,这儿是美利坚共和国!
他将愤怒转化成了行动,决定维护探寻真相的权利,他真的花了25,000美元下载了全部资料。当他终于打开这个数据库,又一次被震惊了——极度混乱的信息,巨大的数字差距,到底该怎么梳理?于是,他把数据库挂到了网上,供公众免费下载。
笔者因此获得了这份不易得到的数据库。
写到这儿,笔者忽然想到是在向一家新闻媒体投书,得有新闻价值!大时代的风云变化是新闻,那些塑造大时代的小人物,他们的所思所为怎能不是新闻?笔者请编辑让这段描述留在这儿。希望这位公民能知道我们在用他买下的数据库,他的奉献没有白费。在这里,我们向这位公民的奉献精神致敬!
数据库基本信息介绍
下面开始分析这份11月10日的威斯康星州选举数据集快照(dataset snapshot)。
首先是材料的基础数据,数据库提供两个表格,分别是选民投票历史和登记选民名单。
选民选票历史表格含36个属性,其中一个为“选举名称”(Election Name),当被标示为“2020大选”(2020 General Election),就是关于今年大选寄出“邮寄选票”的数据记录。一条一条数下来,共计2,152,453条,说明共寄出了2,152,453份选票。
除去地址有误的、损毁的、没寄回的和重复寄的,其中只有1,949,121人寄回了选票。也就是说有1,949,121人通过邮寄选票投票了。
登记选民名单表格含120个属性,包含约6,994,368名选民(数据库维护不当有错乱,所以只能是个约数)。
选民名单中有一属性叫“2020年11月”(November2020),记录了这次大选中的两种投票方式:邮寄选票(Absentee)共有745,405,而投票站选票(At Polls)数量为485,135。
笔者把两种投票方式所投的票加在一起,得出1,230,540人在这次选举中投了票。
数据库信息不对称数据缺口巨大
选票历史表格显示出的是1,949,121人通过邮寄投了票,而登记选民名单表格显示的是745,405人通过邮寄投了票。即使加上现场投票485,135人加上,登记选民名单表格里也只有1,230,540人在这次选举中投了票!两个表格之间到底哪个投票数字是真的呢?
另外,登记选民名单表格明明显示出的已投票人数为1,230,540人,可是CNBC新闻却在11月4日就报导威斯康星州已有三百一十多万人投了票,拜登赢了!
威斯康星州政府向新闻媒体公布的有效选票数据究竟是多少?笔者在数据库里,根本找不到和CNBC新闻合得上的任何数据,CNBC新闻是从哪里得到威斯康星州已有三百一十多万张选票这个数字的?
笔者建议威斯康星州政府和CNBC新闻媒体公开诚实地向公众做出解释,他们在法律上有责任这样做。
笔者在分析宾州数据库中的舞弊情况时,就曾经详细阐述过,如果数据库算出来的投票人数严重低于同时刻新闻所报的数字,说明数据库“更新投票日”的功能是失效的,无法辨别一个人是否已投票了。
笔者再一次强调这一观点,不具备“更新投票日”功能的数据库就是被有意设计为允许反复投票的。
从数据库得出的数字和新闻所报导的数字的比例来看,威斯康星州这方面比宾州还严重。
数据库中选民人数多于威州总人口
数据库有6,994,368条选民记录,威斯康星州总人口才只有5,860,000人,去除18岁以下的人口(20%),成年人只有4,680,000人,怎么会有6,994,368位选民?
两者相差2,314,368人,也就是说数据库有三分之一的登记选民都是不该存在的。如果用这样一个数据库来选举,威斯康星州是不会再有任何一场选举是公正的。
举个例子:从选民登记表格所算出的这次投票的1,230,540个选民里,笔者看到同一人有两个选民编号,都投了票(注:下面对比的选民资料和地址相同,所以确认为同一人,因隐私问题本文没有在这里列出地址):
同一人有两个选民编号,都投了票。(数据来源:威斯康星州选举数据库)
数据库管理混乱可信度受质疑
在这个数据库里笔者也看到了558位不活跃(Inactive)选民投票了。威斯康星州规定,不投票的选民四年后就会变“不活跃选民”。可是“不活跃选民”要变成“活跃选民”,只需出示身份证件就可以。那么这558位已投票的不活跃选民,实际上应该记入活跃选民。这是随意的添加还是管理的混乱,不得而知。
笔者在把两个表格扩充到数据库时,各有数千个选民资料被解析程序筛出来:有选民编号空白的、乱码的、断行的,还有申请日期空白无法加入等等。花了很多时间才把大部分选民资料成功输入,但还有一部分无法修补。这就是这个昂贵的数据库里真实的不堪的内涵。
这样荒诞的数据库中,已去世的人会来投票吗?是的,来了。看看数据库里这行记录,这位女士使用邮寄选票投了票。
数据库显示,一位在2018年去世的威斯康星州女士在今年大选中参与了邮寄投票。(数据来源:威斯康星州选举数据库)
可是数据库显示她已死亡(Deceased),从网上也可以搜索到,这位女士的确在2018年1月去世了。
笔者还发现在这个数据库里“选民状态原因”(Voter Status Reason)被标明为“死亡”的选民竟然超过五十五万,共559,201人,占整体数据的7.995%。
这个数据库让笔者对威斯康星州能否有一次公正的选举彻底失去信心!没看到设置防止重复选票的有效机制、一个登记选民可以有两个编号、连选民人数都可以随时创造⋯⋯
威斯康星的选民数据库是笔者至今在各州数据库中看到的最莫名其妙的一个。修复起来可能要花很长时间,甚至比重建一个还要花时间。