很多华人能在国外异军突起，说明了什么? ＊阿波罗新闻网

微软全球人工智能首席技术官，是位华人，他叫黄学东。在ChatGPT火爆中国之后，我注意到了他。

ChatGPT是一款由OpenAI研发的生成式人工智能模型，微软是它最大的投资方。有关于它的神乎其神，市面上有着各种各样不好确证的传言和解读，而媒体也注意到，在它的研发团队成员中，有不少年轻的华人面孔，其中不少人的大学阶段或研究生教育是在中国国内完成的。

图片由受访者提供

黄学东先后在湖南大学和清华大学读本科和研究生，1987年前往英国爱丁堡大学深造，攻读博士学位，后又前往美国卡内基梅隆大学从事研究工作。1993年，他加入微软公司，一呆就是30年，成为一位全球人工智能领域顶尖的华人工程师。

微软先后走出过多位知名业界的华人高管，如李开复、张亚勤、沈向洋、张宏江、洪小文、陆奇等人，黄学东相对低调很多，早在上世纪90年代，他就推动和策划了微软公司管理层在北京组建微软中国研究院（后来的微软亚洲研究院），于幕后做了不少工作，包括具体到面试研究院的管理者，帮助微软公司引进和面试了李开复、张亚勤、张宏江等业界大牛。

今年，黄学东先后当选了美国国家工程院院士和美国艺术与科学院院士，成为计算机领域大陆改革开放后培养出的第一位美国双院院士。采访他时，我才知道，整个微软的认知服务，从创建到落地到推出，他一直是领导者和灵魂人物，他也是微软公司最接近ChatGPT项目的人之一。

关于ChatGPT与微软现有人工智能产品的关系，黄学东向我解释说，微软认知服务，包括了微软语音，微软计算机视觉、机器翻译和Azure OpenAI services，而Azure OpenAI services就包括ChatGPT、GPT4.0、DALL.E等，它们都是同样的API（Application Programming Interface，微软应用程序），而这些都是黄学东领导的团队在过去几年推出来的。

他说，“微软认知服务是微软从人工智能研究到落地以来一个经典的产品，影响了众多的客户。Azure OpenAI的ChatGPT也是微软认知服务框架下的一个产品”。

一，你只看到ChatGPT一枝独秀，却没有看到另外90%的失败

《科学大师》：ChatGPT在中国大火，各种公司和主体纷纷进入这个研发和投资赛道，我们担心会存在某种非理性的狂热，最终把泡沫吹大吹破。您怎么看这个问题？美国也有这种情况么？

黄学东：我对中国国内的情况不太了解，所以不敢随便发言。在美国，我觉得谷歌、 Meta、微软公司和OpenAI做得都差不太多，美国现有三家大的云平台在做这个事，市场上已经有的是微软和OpenAI合作推出的ChatGPT，谷歌有他们自己的东西，扎克伯格的Meta也做了一个开源的大模型，基本上就是这几家了。那Amazon（亚马逊）也正在开发他们自己的东西。还有一些初创公司，有几家也在做类似的东西，大概总共是10家左右。我觉得这样很好，有竞争才有进步。

至于你关心的最后谁能跑出来，成为王者，现在从技术层面来讲，我觉得微软和谷歌无疑是处在领跑者的位置，两家的优势都是比较明显的。

《科学大师》：为什么微软这么有眼光，它能够下重注来投资OpenAI，甚至马斯克都退出了，在这个阶段，微软却走在了前面？

黄学东：这得要感谢我们的CEO萨提亚·纳德拉，他为什么能做上CEO是有原因的。他有这个眼光，这完全是他的功劳，同时，微软一直有这种前沿探索的眼光和理念、理想，这是一种内驱力，所以才能做出这一类投资决策。

微软一直以来其实也投资了很多东西，不仅仅只是投资了这一个ChatGPT，只不过大家看到的是今天ChatGPT跑出来了，跑在前面了，看到我们在这一阶段的成功，但是还有其他90%的项目是还没有成功，大家没有看到那90%的故事。

《科学大师》：陆奇最近在国内演讲中说到，像GPT这种语言大模型，微软内部也有好几千人在做，但是最终还是不如Open AI做得好，您认同他的看法吗？

黄学东：我们跟Open AI一起合作做的这件事，它是在微软的云平台Azure上，一起做的，所以你不能说微软就没有做好，我们有这个基础，而且创新也是基于这个基础，这是第一点。

第二点，也不能说微软人工智能团队就无所作为，在智能语音、计算机视觉、机器翻译等方面，这些微软现有的认知服务，它的性价比还是业界第一的。

很多人没有看到微软的人工智能研发是一个多维的东西，在这个多维的组合中，微软现有的这个API，它是一个模型可以做一件事情，你要做语音识别，它就是一个语音识别的模型，要做机器翻译，机器翻译就有一个模型，要做文本总结，就有文本总结的模型，你要做计算机视觉，也都有一个这样的大模型，但是目前这个大语言模型，它不一样的地方是，很多事情可以通过提示来做而且做得非常好，这是之前没有的。但随之而来，是它的成本也上去了，它并不是十全十美的，就像一个豪华的汽车和一个很便宜的汽车，这两者都有它的应用价值，你不能说现在有了一个豪华汽车，就把经济实用型的汽车说成是没有什么用。

二，ChatGPT算迈向超级人工智能的一小步，但还没达到这个目标

《科学大师》：GPT出来后，大家试用过觉得这个东西挺不成熟，是在一本正经的胡说八道，比如说，黄学东院士当选美国两院院士的时间，这个知识点它就说得不对，它给出的时间要早于您当选的确切年份，这挺让人尴尬的。

黄学东：这是我们应该关注的问题，当前生成式人工智能还不够成熟。如果一个人的鉴别力不是很好，那他就容易被人工智能忽悠了。这就跟人一样的，人虽然是地球上最高等级的智能体，但有时候也会不可靠，他大部分时间是对的，但是不靠谱的时候也会胡来，而怎么样能够让这种生成式人工智能变得越来越靠谱，这是我们人工智能发展中需要实现的事情。只有把成熟的人工智能用于教育和宣传，才是对社会有益的。

大语言模型在上世纪70年代就有了，IBM当时的语音识别研发团队就已经推出，但当时它的识读能力有限。现在这个大模型，是从机器翻译这个领域抽出来的，用的是机器翻译的一个方法确精准变换器，它没有超越机器翻译实现新的突破，但是它看了很多很多的东西，然后预测下一个词汇怎么样，就相当于把整个搜索引擎所有文本全看了一遍，用更多的数据训练它，并加上了奖励建模和强化学习与人类的预期对齐等技术，然后通过不同的提示可以突然涌现一些令人惊奇的能力。确实能做到一本正经，显得很有智能，但是它还没法做到完全精确精准，不能完全把错误剔除，它的稳定性目前还没有办法实现的。

它用的是深度学习的基础架构，最主要的一个特点就是自学习并加上奖励建模，把所有的数据全拿过来，所有的语言都拿过来，根据这个它可以自己学习，就是说看了一个文章以后你下面要讲什么东西，可以不用标注的数据，它看了前面一段文章（问题），它就能知道后面一段文章，可以翻译出来（给出答案和对策），这是GPT4.0，就是自己跟自己“翻译”。

责任编辑： zhongkang 　来源：网易科技转载请注明作者、出处並保持完整。

很多华人能在国外异军突起，说明了什么?

相关新闻