生活 > 家庭生活 > 正文

为什么只要勾选“我不是机器人” Google 就知道你不是机器人?

你曾经遇过上面这个验证方式吗?

身为一个编辑,常常在缩短网址时遇到上面这张图。而你是否也跟我一样在心里发出了这个疑问:“为什么只需要点一下,Google就知道我不是机器人呢”?

为了得到答案,我不惜冲到信义区101大楼 Google办公室,附近的咖啡店坐下来搜集资料。

一切的一切,都需要从“验证码”(CAPTCHA)开始讲起。

CAPTCHA验证码:为了不要让黄牛一次买10,000张票

验证码 CAPTCHA原文为下面这串:

Completely

Automated

Public

Turing test to tell

Computers and

Humans

Apart

完全没有达到简称的效果。

CAPTCHA中文俗称为验证码,主要用于区分“人”跟“机器人”。在2003年由卡内基梅隆大学的 Luis Von Ahn与其团队共同开发,这些扭曲的文字用于防止有心人士一次寄送大量的垃圾邮件,以及黄牛用电脑程式抢占演唱会与运输工具的票卷。

而扭曲变形是为了避免被搭载光学识别的电脑程式判别出来,现在你知道为什么验证码总是歪七扭八了吧。

接下来你也许会问:“等等,你跟我解释 CAPTCHA干嘛,图片里面写的是‘reCAPTCHA’唉”?

reCAPTCHA:伟大的读书计划,让全球使用者一起“读书”

这个介面相信大家也已经很熟悉了,右下角写的的确是“reCAPTCHA”。

发明 CAPTCHA的 Luis Von Ahn团队想利用验证码的力量来做一些事情。而他们也顺利想到一个伟大的计划:让全世界的人来协助数位化书本

书本数位化靠的是光学扫描辨识,不过总有些字词是电脑分辨不出来的,只好靠全世界使用电脑的免费劳工 aka你跟我来帮忙。

当一个字词电脑分辨不出来,他们就会将其上传到 reCAPTCHA的资料库。从这时候开始,验证码就不再是随机、无意义的字母组成了。而当一个字词被多个使用者输入相同的答案,该字词就会被确认,重新回传到电子书的数据库。

所以你在 reCAPTCHA的右下角,可以看到他们的宣言:“Stop Spam, Read Books(垃圾机器人走开,大家一起来看书吧)”。

每年都有一亿个 reCAPTCHA字词被输入,等同于每年可以产出250万本书

很棒、很有意义吧,我也这样觉得,Google也这样觉得,然后 Google就把它买下来了。

Google:你很棒,我喜欢,我要买

2009年 Google正式宣布收购 reCAPTCHA,Google持续优化reCAPTCHA,并让它替大家数位化18世纪以来的《纽约时报》,以及 Google Books。

接着,Google将 reCAPTCHA应用到 Google Maps中,让大家替街景上的街道号码牌输入正确的数值。此举除了让 Google Maps更加完善外,对于 Google发展无人车也有不小的帮助。

于是世界就变得更美好了。

并没有。

随着科技的发展,配有先进演算法的光学识别软体开始能辨别验证码,于是开始与 Google展开一段爱与勇气的搏斗。Google先是加深验证码的难度,透过扭曲、加线条、添加背景等。

当然,对手也不是省油的灯,很快地双方在不断切磋之下,Google发现随着验证码的难度越来越难,只有33%的人类能够正确填答,而电脑的正确填答率则超过99%,人类在其中完全呈现黑人问号的状态

noCAPTCHA reCAPTCHA:不需要验证码的验证码

而 Google的新解答就是 noCAPTCHA reCAPTCHA,不需要验证码的验证码,有点像绕口令我头已经开始痛了。

只需要点选“我不是机器人”,你就会传送一组资料到 Google的伺服器中,包含 Google偷偷记录下来的 IP位址、国家、时间,以及你打勾之前的滑鼠轨迹、打勾之前的网页卷动纪录等。

而 Google的人工智慧透过每天一亿笔noCAPTCHA reCAPTCHA的资料,渐渐提升判断准度,到现在已经能够非常精准的判别你到底是不是真人。

不过,总有它偶尔判别不出来的时候,这时候就会跑出额外的挑战,例如:选出跟这张图一样的可爱猫猫。

好了,关于验证码,相信你已经有更广泛的了解。不过在这背后还有许多议题值得探讨,像是对盲人来说验证码的机制与无障碍机制都不够友善、Google所搜集的资料是否侵权等。

最后让我们用一张验证码做为结束:

——

责任编辑: 宋云  来源:techorange 转载请注明作者、出处並保持完整。

本文网址:https://www.aboluowang.com/2017/0915/994194.html