新闻 > 北美新闻 > 正文

选举盗窃案 专家用大数据查找作弊痕迹

电子计票为选举创造了一个“黑匣子”,在虚拟的后台会发生什么情况?如果今年美国大选中,将六千多张川普票算给拜登是Dominion公司的软件“故障”,那么为何达拉斯2019年选举也出现共和党的票转给了民主党,甚至在CNN开票镜头上留下了证据?

在以前的纸票选举中,如果出现可疑情况,重查选票就可简单地消除人们对结果的疑虑。纸票选举即便出现作弊,所涉的范围也有限。大范围作弊花销很大,也非常显眼。

但在现代技术条件下,选票已经被由字节组成的、匿名的符号所取代,人们无法观察数据的生成。如何对电子计票进行观察?如何识别异常模式或危险信号?连日来,数据分析家、软件工程师、发明家纷纷上阵,并报告他们的惊人发现。

这些数据分析都指向了大规模选举舞弊的可能性。

几乎每个州都有偷票和删票?

11月10日,名为Truman Black的帖子“几乎每个州都有偷票和删票”引起许多人关注。他用软件追踪大选数据,发现软件作弊导致的所有州、所有偷走的选票和丢失票,达到一个相当惊人的数目。

这些数据也引起川普总统的关注,例如总统的一条推文就来自该研究:“Dominion在全国删除了270万川普的选票。数据分析发现,宾州22.1万张(选票)从总统川普转给了拜登;94.1万川普选票被删除了;用Dominion投票系统的各州将43.5万张选票从川普转给了拜登。”

大纪元记者也做了一些研究,试图推敲这些数据的可靠性。首先说明,网民用软件追踪的大选数据来自爱迪生研究中心(Edison Research)用于媒体的选举报导,这不是官方结果。

爱迪生研究中心提供投票计数,但不创建任何可编辑的内容。由ABC、CBS、CNN和NBC组成的美国国家选举库(National Election Pool, NEP)与爱迪生研究中心签订合同,各家电视网和纸媒都用相同的数据,但每家电视网都有自己的决策标准和图表。NEP也是每次选举的预测和分析的来源。

据爱迪生研究中心网站,自2004年以来,他们与NEP进行全美唯一的票站调查(Exit Poll,又常被称做“出口民调”),向媒体组织提供实时投票结果。该中心回复大纪元记者查询说,有兴趣订购数据的,可以购买出口民调交叉表和投票计数,全国调查的起价为1,500美元,每个州的起价也为1,500美元。

根据维基百科,NEP组织者坚持认为,快速收集票站数据的目的不是要确定选举是否存在缺陷,而是要预测谁会赢。尽管曾出过问题,但他们标榜自建立系统以来,从未弄错过竞选赢家。

因此严格地说,媒体在报告中犯的任何错误都不是“官方的”,而是来自第三方公司Edison研究的汇总数据,也叫“出口民调”。美联社和福克斯几年前已离开了NEP。

尽管如此,媒体播出的大选数据,仍是重要的选举调查工具。网民也就是通过软件提取《纽约时报》实时显示的数据,找到软件修改数据的证据。

验证过程

先看11月3日大选夜在密歇根州安特里姆县的案例。原本应该投给共和党候选人的约6000张选票被统计给了民主党候选人。根据安特里姆县的一位共和党工作人员盖伊(Sheryl Guy)说法,之所以发现这一错误,是因为民主党的获胜与该县的保守派倾向不符,所以手动检查并确认了这一错误。

来看看安特里姆县“转换”发生一刻的数据。第27条记录表明:总投票数573,857,川普占57.8%,拜登40.1%,时间是凌晨1点51分26秒。第28条记录表明:总投票数574417,川普占56.8%,拜登40.6%,时间是1点51分52秒。第27条到28条,前后相差26秒。

密歇根州安特里姆县“转换”发生一刻的数据。(网路截图)

这意味着,在这26秒的时间里,总票数增加了560票(574,417-573,857),但是拜登占比却增加了0.5%(40.6%-40.1%),而川普的占比却相应减少了1%(57.8%-56.8%)。换句话说,川普在这26秒内减少约5420票(574,417*56.8%–573,857*57.8%),而拜登增加了约3096票(574417*40.6%–573857*40.1%)票。

观众从宾州今年的总统选举中录制了一段CNN的实时直播镜头,发现2019年肯塔基州州长竞选时发生的事情又再现了,只不过当时共和党候选人少了560张票,民主党候选人增了560张票,而这次规模大得多,川普总统少了1万7千张票,与此同时拜登多了1万7千张票。

观众从宾州今年的总统选举中录制了一段CNN的实时直播镜头,发现2019年肯塔基州州长竞选时发生的事情又再现了,只不过这次规模大得多,川普总统少了1万7千张票,与此同时拜登多了1万7千张票。(网路截图)

来看看宾州“转换”发生一刻的数据。第187条记录表明:总投票数2,984.468,川普占56.6%,拜登42%,时间是凌晨4点07分43秒。第188条记录表明:总投票数2,984,522,川普占56%,拜登42.6%,时间是4点08分51秒。

宾州的开票数据显示,某个时间点总票数只增加了54票,但川普少了1万7千多张票,转给了拜登。(网路截图)

这意味着,在这一分多钟的时间里,总票数只增加了54票(2,984,522-2,984,468),但是拜登占比却增加了0.6%(42.6%-42%),而川普的占比则相应减少了0.6%(56.6%–56%)。换句话来说:川普在此一分多钟内失去17,876(2,984,468*56.6%-2,984,522*56%)票,而拜登增加了17,932(2,984,522*0.466-2,984,468*0.46)票。

用统计学方法“抓作弊”同样数据出现三次?

于是该网民据此原理,使用Python语言制作了一个程序,该程序基本上检查投票数的每个更改,执行上述操作以检查投票是否被转换(switched),然后将它们全部相加,以获得转换后的投票总数。

通过分析,他发现大量川普票被转给拜登,还有更多的选票在计票过程中突然消失(lost)。其中,名列第一的是宾州,转移的选票比其它州的总和都多。

此外还有其它异常数据。例如在威斯康星州的Milwaukee,在11月4日上午11点22分15秒有317,251张票选拜登,同时有134,355张票给川普。当天下午5点29分24秒这组数据又出现两次,一共三次。

也就是说,上午11点半有317,251张票投给拜登,下午5点半又有两次把317,251张票投给拜登。川普则对应每次都是134,355张票。这令人难以置信。

在密歇根州的Wayne县也出现类似一幕,在11月4日夜晚8点55分37秒,拜登的票数增长552,138张,川普票数增长253,255,同样的数据连续计算两次。

MIT博士质疑线型模型背后有算式

另一名美籍印度裔科学家Shiva博士在YouTube频道直播他的数据分析过程(详见大纪元文章《MIT博士挑战拜登:6.9万川普选票被软件篡改》),结果,从随机事件中发现了线型模型,他的分析吸引了很多人观看。

Shiva博士通过展示散点分布图的方式,阐释了他的分析过程。随机事件出现了线型模型。(视频截图)

其他一些专业人士也都根据实时数据,探测一些违反逻辑的变化,也就是作弊痕迹,他们发布的数据也在线供人们下载和验证。让大家见识了统计和数学在反作弊领域是如何应用的。

需要说明的是,每个人根据不同的步骤部署不同的数据分析,还不能最终证明是选票欺诈,但已经揭示了疑点的存在,是这场大选不对头的旁证,和近日来法庭上读到的成百上千选举观察员宣誓证词所指控的相一致。

Shiva博士在视频大约9分27秒提及“加权族裔”(Weighted Race Feature),以及应用程序上出现的分数投票功能,分析类似计算功能是造成他发现的“线型模型”的背后原因。他展示的文件显示,“加权族裔”的概念早在2001年就已经在选举系统中使用,因此并不是凭空臆测。

他展示的文件显示,“加权族裔”的概念早在2001年就已经在选举系统中使用,因此并不是凭空臆测。(文件截图)

“加权”在投票中是什么意思?根据维基百科对Weighted voting的解释,“加权投票是一种投票系统,其基于这样的思想:即并非所有选民都应对选举结果产生相同程度的影响。取而代之的是,希望通过给选民关于结果的不同数量发言权(数学权重)来识别差异。”

“加权族裔”和分数投票功能

选举观察网站“黑匣子选举”(Black Box Voting.org)2016年的一篇文章《分数魔术:投票被计为分数而不是整数》,很好解释了为什么会出现投票总数超过选民登记人数的机制,其中作者Bev Harris和Bennie Smith写道:

“本报告总结了我们对GEMS(Global Election Management System,全球选举管理系统)的审核结果,该系统大约占美国所有选票的25%。这项研究的结果表明,在每个GEMS应用程序中都嵌入了分数投票功能,该功能可通过预先设置所需的投票百分比重新分配选票,来无形地但从根本上改变选举结果。即使选举观察员站在房间里看着电脑,也看不到这种篡改。十进制投票功能的使用不太可能通过审核或检查程序来检测,并且可以在不到60秒的时间内应用于大型辖区。”

“分段投票⋯⋯允许对种族进行‘加权’。对比赛进行加权消除了‘一人一票’的原则,该原则允许将某些票数计为少于一票或多票。不管实际票数是多少,候选人都能获得一定比例的选票。结果可以控制。例如,可以为候选人A分配44%的选票,为候选人B分配51%的选票,为候选人C分配其余的选票。…”

“根据程序员的说明,设计了加权竞选功能,该功能不仅赋予某些选票比其他选票更大的权重,而且还基于选民的身份来这样做。选票与选民相连,权重分配给每个种族的每个选民,并存储在GEMS中看不到的外部表格中。我们的测试显示,一票可以计算25次,而另一票只能计算千分之一,有效地将某些票转换为零。”

从网上能搜到549页的GEMS使用手册,源自2004年美国最大的触摸屏投票机制造商Diebold公司,直接关系到对竞选的加权。这篇文章甚至还展示了2001年的三封电子邮件,主题是“加权结果显示的总票数不带小数点后两位”,证明程序员选择了将系统转换为计数十进制投票数,不是偶然的。

2001年的三封电子邮件,主题是“加权结果显示的总票数不带小数点后两位”,证明程序员选择了将系统转换为计数十进制投票数,不是偶然的。(取自http://instinct.org/diebold/bugtrack.w3archive/200108/msg00100.html)

Diebold公司因一连串的丑闻,在2009年已退出了选举行业,并把相关业务PES售给了ES&S,2010年5月,Dominion从ES&S收购了PES。

Dominion公司否认软件有问题

自从11月3日Dominion出现把川普的6000张选票统计给拜登的“故障”后,Dominion软件和设备备受关注。该公司12日在推特上发声明称:“坚决否认任何关于我们的投票系统存在调换选票或所谓软件问题的说法。”

虽然,Dominion的使用手册没有“加权族裔”这一称法。但网民研究其手册后指出,其设置可能非常有利于针对“共和党风格投票”的计票欺诈,也就是说,很多共和党人喜欢“直选票(straight ticket)”全部投给同一政党候选人,因此很容易鉴别出来。

网民认为,一些复杂的规则可以决定对“直选票”的工作方式,机器上也有一个“删除”(discard)一批选票的按钮,该按钮正常作为卡纸时重新扫描时使用。

其它疑问还包括使用手册上出现的“拆分旋转”(split rotation)功能,称其具有“强制最大偏差”的功能,但没有定义何为“拆分旋转”,因此也不知道“强制最大偏差”是什么意思。

脆弱的投票机

联合安全运营集团(Allied Security Operations Group,ASOG)的拉姆斯兰(Russ Ramsland)曾说,即使没有“锤子打卡”(The Hammer and Scorecard)在计数机中摆弄一些砝码来改变选票结果,也很容易进入投票系统并查看选民信息和计票数据,尽管需要操纵这些数据。

拉姆斯兰指出,尽管许多美国人认为民意测验和投票制表系统是离线的,但事实恰恰相反。Dominion建立为可在线运行,并且在许多入口点都“容易受到攻击”。

在德州,Dominion投票机三次被拒获得州选举认证。其中2019年11月3日的测试报告中指出,“这个系统过于复杂和脆弱,许多令人不安的问题⋯⋯如果Dominion人员(理论上是该软件的最专业用户)可以创建包含这么多明显错误的选举定义,系统很容易出错。”报告还提及,其USB端口应该密封以防止(信息泄漏和密码窃取)。

据了解,很多投票机都有USB端口,所以黑客可通过无线设备实施远程连接。此外,投票操作系统也不那么安全,一些是存储在可移动的芯片上,而黑客可通过移除芯片来改变操作系统,然后在投票机被使用之前重新再安装上芯片。因此,投票机是在编程后是被密封的,一个撕开的封条会表明有人在事后对其进行了篡改。

去年9月费城一起选务设备遭窃事件,就暴露了这一漏洞。一处选举装备仓库被歹徒闯入,用于美国大选投票机编程的一台笔记本电脑及2个U盘被窃。这些USB驱动器是管理员访问设备,用于进入投票机的配置和调试屏幕用的。

事发一周后,一名费城调查记者马林(Max Marin)发推文说,他当天十分随意地进入了一个没有任何警戒的存放大选装备的仓库。“我就在这个仓库里,这里存放着所有的投票机器,”在约一分钟长的视频中,他一边用手机摄像头对着投票机器扫视一边说。

马林在他的另一条推文中,发布了一张在该仓库外拍的照片,并写道,他没有看到任何安全摄像头。

2018年举行的DEF CON黑客会议上,SocialProof安全公司首席执行官托巴克(Rachel Tobac)曾演示了如何在两分钟内就黑入在18个州使用的投票机系统。而通过侵入投票系统访问其管理模式,黑客可轻松地安装不同的操作系统。

因此,电子投票机是进步了还是倒退了?值得思考。

责任编辑: 楚天  来源:大纪元记者蔡溶报导 转载请注明作者、出处並保持完整。

本文网址:https://www.aboluowang.com/2020/1115/1523366.html