改变世界的重磅产品！ DeepMind 推出 AlphaCode科教频道|科教兴国|教育新闻☀阿波罗新闻网

最近，世界著名的编程竞赛网站Codeforces发布了一篇名为《AlphaCode(DeepMind) Solves Programming Problems on CodeForce》的文章，将 AlphaCode（阿尔法扣）带入人们的视野，更让 DeepMind再次霸榜各大媒体的头条，这也是 DeepMind在2015年成功推出阿尔法狗（AlphaGo），击败人类最强围棋选手之后，再次推出改变世界的重榜产品。

击败一半人类参赛程序员的 AlphaCode

据 DeepMind官网介绍，AlphaCode是由谷歌在英国的 AI部门发明的一种人工智能工具，该工具可以像真实参加竞赛的程序员一样，参加各大编程竞赛，并且还可以结合批判性思维、逻辑、算法、编码和自然语言理解的新问题来提供解决方案。在正式登场之前， DeepMind已在编程竞赛中测试了 AlphaCode的真实“水平”。

Codeforces每周都会举办一到两次算法比赛，并且具有独特的天梯排名上分系统，AlphaCode默默参加 Codeforces最近举行的10场编程比赛之后，获得了超过了一半人类程序员的好成绩，最终排名前54.3%，Elo评分1238。

就连 Codeforces创始人 Mikhail Mirzayanov也亲自下场为 AlphaCode打Call，除了一些 Codeforces的表现远超预期等客套话，Mirzayanov的一个重要观点就是 AlphaCode似乎表现出了比较强的创造性，这点很不寻常。

这次 DeepMind给 AlphaCode选择的编程网站 Codeforces很有必要向大家介绍一下的，与目前日趋商业化的力扣（LeetCode)不同，Codeforces最大的特点就是代码和题解的公开。所有人都可以随意查看其它大牛的代码，非常符合开源的调性，而且 Codeforces题目一般都不是那种传统科班的考察项目，往往会在题目中设置比较多的思维陷阱，而对于数据结构以及经典算法的相对没有那么侧重。

突破辅助编程 AlphaCode还有多远的路要走？

在去年的8月底，微软旗下的两个大牌机构 OpenAI与 GitHub联合，推出了基于 AI技术的自动辅助编程工具 Copilot，并基于 VS Code的 MarketPlace发布了预览版，结果预览版一经问世就取得了惊世效果。

Copilot基于 GPT-3模型，是针对编程任务适配版本，它以部分完成的代码及注释作为输入，输出完整的代码建议。Copilot的官方网站将其定位为“程序员结对编程实践中的AI对手”，笔者看到不少开始使用 Copilot的网友都提到，大多数情况下只要一个简单的函数签名，Copilot就可以完成整个函数的代码编写好，甚至有时只需要一句简单的注释，Copilot就能把整个功能模块全部搞定。

虽然 Copilot和 AlphaCode使用的技术类似，从本质上讲 Copilot是定位于辅助编程的，不过辅助编程技术在前年 GPT-3刚刚推出时就已经比较成熟，比如由界面需求描述，直接转化成代码的 debuild.co，但这些辅助编程工具本质上都是对人类已有的实现进行模仿甚至是照搬。

这些辅助编程工具与 AlphaCode AI程序员的定位是完全不同的，阿尔法扣这位 AI程序员还需要不断完善，但它的出现却提供了一个关于 AI编程未来发展的思路，当 AI学到了足够多的代码之后，是否会展示出相应的创造力，而 AI的这种创造力是否意味着程序员群体将在未来会被 AI取代，这些都引发了笔者深深的思考。

读书破万卷，下笔如有神，代码学多了，是否能质变？

从 DeepMind官方博客上看， AlphaCode的训练集还是基于 GitHub和CodeForce建立的，这与阿尔法狗初始态下也是基于人类棋谱构建训练数据是比较一致的。

我们知道初代的阿尔法狗还没有那么高的统治力，在抛弃人类棋谱，两只阿尔法狗对局，并不断进化之后，人类棋手在面对AI时才会显得那么无能为力。

不过好消息是围棋的规则是长时间不变的，但是在编程方面技术的进步却是日新月异，也就是 AlphaCode所面对的数据集是要动态调整的，这可能使两个 AlphaCode相互结对编程，并取得质变的可能性并没有想象当中那么大，因此 AlphaCode想达到高级程序员的水平在短期看来不太可能，不过随着 AlphaCode能够普遍达到中级程序员的水平之后，IT行业35岁即失业的现象恐怕会更加严重，因为 AI程序员不能独立工作，而带领 AI编程团队需要更加精深的技术实力而非管理能力，这可能会给很多走上技术管理岗的程序员带来一定压力。

跨越之前，问题不少

虽然 AI编程的发展已经形成趋势，但从 AlphaCode的工作原理等方面分析，在 AlphaCode升级成为贝塔扣，伽马扣之前，还有很多坑要老老实实的填平：

错误解答，反而拖后腿：据 DeepMind官方博客显示 Alph aCode首先要进行的工作是通过 NLP系统，试图理解需求的意思，但是与人类的理解不同， Alph aCode的理解的语义虽然大部分时候有效，但也存在一定完全理解不了的可能性，如果你所给出题目的问题描述完全不符合Codeforce之前题目文风的话，那么也很有可能得到一些完全没有意义的代码，也就是说在 Alph aCode能正常给出答案时，它的效率可能比人类程序员高得多，但一旦 Alph aCode不能工作，那么对不起它错的也会比一般人类程序员离谱，因此 Alph aCode至少要搭建一名初级程序员帮助发现这些显尔易见的错误，并递交给高级程序员给出正确答案。

使用 GitHub训练 Alph aCode到底侵不侵权？正如前文所说是基于GitHub和 Codeforce两大编程网络上的公开代码进行的模型训练，而且无论是微软的 Codplite还是 Deepmind的 Alph aCode，都没有按照不同的开源许可证对于代码进行区分对待。

那么如果未来 Alph aCode用于商业用途，那么用那些已经明确不允许用于商业用途的代码来训练 Alph aCode的AI模型是否涉嫌侵权？针对这个问题网上争论的声音很大，笔者认为如果 AI最终给出的建议代码与原先训练集中的代码一模一样的话，那么这种情况肯定会涉嫌侵权，但建议代码与原训练代码的相似度如何判断才是关键所在，当然截止目前这还依旧是个开放性问题，业界尚未形成共识。

引用老旧类库代码，增加安全风险：正如前文所言， Alph aCode的训练集是 GitHub和 Codeforce上已经存在的代码，从实操来讲，Deepmind很难对如此大量的代码进行有效标注，因此 Alph aCode生成的代码，即使有效且能够正常运行，也不能代表这些代码没有安全漏洞，这样的特性就使得开发人员去全面检查 AI生成的代码变得非常重要。

但无论如何未来都将到来，面对会编程的 AI程序员，我们人类程序员们只有顺势而为，快速找到属于自己的生态位才能力于不败之地。