新闻 > 科教 > 正文

很多华人能在国外异军突起,说明了什么?

微软全球人工智能首席技术官,是位华人,他叫黄学东。在ChatGPT火爆中国之后,我注意到了他。

ChatGPT是一款由OpenAI研发的生成式人工智能模型,微软是它最大的投资方。有关于它的神乎其神,市面上有着各种各样不好确证的传言和解读,而媒体也注意到,在它的研发团队成员中,有不少年轻的华人面孔,其中不少人的大学阶段或研究生教育是在中国国内完成的。

图片由受访者提供

黄学东先后在湖南大学和清华大学读本科和研究生,1987年前往英国爱丁堡大学深造,攻读博士学位,后又前往美国卡内基梅隆大学从事研究工作。1993年,他加入微软公司,一呆就是30年,成为一位全球人工智能领域顶尖的华人工程师。

微软先后走出过多位知名业界的华人高管,如李开复、张亚勤、沈向洋、张宏江、洪小文、陆奇等人,黄学东相对低调很多,早在上世纪90年代,他就推动和策划了微软公司管理层在北京组建微软中国研究院(后来的微软亚洲研究院),于幕后做了不少工作,包括具体到面试研究院的管理者,帮助微软公司引进和面试了李开复、张亚勤、张宏江等业界大牛。

今年,黄学东先后当选了美国国家工程院院士和美国艺术与科学院院士,成为计算机领域大陆改革开放后培养出的第一位美国双院院士。采访他时,我才知道,整个微软的认知服务,从创建到落地到推出,他一直是领导者和灵魂人物,他也是微软公司最接近ChatGPT项目的人之一。

关于ChatGPT与微软现有人工智能产品的关系,黄学东向我解释说,微软认知服务,包括了微软语音,微软计算机视觉、机器翻译和Azure OpenAI services,而Azure OpenAI services就包括ChatGPT、GPT4.0、DALL.E等,它们都是同样的API(Application Programming Interface,微软应用程序),而这些都是黄学东领导的团队在过去几年推出来的。

他说,“微软认知服务是微软从人工智能研究到落地以来一个经典的产品,影响了众多的客户。Azure OpenAI的ChatGPT也是微软认知服务框架下的一个产品”。

一,你只看到ChatGPT一枝独秀,却没有看到另外90%的失败

《科学大师》:ChatGPT在中国大火,各种公司和主体纷纷进入这个研发和投资赛道,我们担心会存在某种非理性的狂热,最终把泡沫吹大吹破。您怎么看这个问题?美国也有这种情况么?

黄学东:我对中国国内的情况不太了解,所以不敢随便发言。在美国,我觉得谷歌、 Meta、微软公司和OpenAI做得都差不太多,美国现有三家大的云平台在做这个事,市场上已经有的是微软和OpenAI合作推出的ChatGPT,谷歌有他们自己的东西,扎克伯格的Meta也做了一个开源的大模型,基本上就是这几家了。那Amazon(亚马逊)也正在开发他们自己的东西。还有一些初创公司,有几家也在做类似的东西,大概总共是10家左右。我觉得这样很好,有竞争才有进步。

至于你关心的最后谁能跑出来,成为王者,现在从技术层面来讲,我觉得微软和谷歌无疑是处在领跑者的位置,两家的优势都是比较明显的。

《科学大师》:为什么微软这么有眼光,它能够下重注来投资OpenAI,甚至马斯克都退出了,在这个阶段,微软却走在了前面?

黄学东:这得要感谢我们的CEO萨提亚·纳德拉,他为什么能做上CEO是有原因的。他有这个眼光,这完全是他的功劳,同时,微软一直有这种前沿探索的眼光和理念、理想,这是一种内驱力,所以才能做出这一类投资决策。

微软一直以来其实也投资了很多东西,不仅仅只是投资了这一个ChatGPT,只不过大家看到的是今天ChatGPT跑出来了,跑在前面了,看到我们在这一阶段的成功,但是还有其他90%的项目是还没有成功,大家没有看到那90%的故事。

《科学大师》:陆奇最近在国内演讲中说到,像GPT这种语言大模型,微软内部也有好几千人在做,但是最终还是不如Open AI做得好,您认同他的看法吗?

黄学东:我们跟Open AI一起合作做的这件事,它是在微软的云平台Azure上,一起做的,所以你不能说微软就没有做好,我们有这个基础,而且创新也是基于这个基础,这是第一点。

第二点,也不能说微软人工智能团队就无所作为,在智能语音、计算机视觉、机器翻译等方面,这些微软现有的认知服务,它的性价比还是业界第一的。

很多人没有看到微软的人工智能研发是一个多维的东西,在这个多维的组合中,微软现有的这个API,它是一个模型可以做一件事情,你要做语音识别,它就是一个语音识别的模型,要做机器翻译,机器翻译就有一个模型,要做文本总结,就有文本总结的模型,你要做计算机视觉,也都有一个这样的大模型,但是目前这个大语言模型,它不一样的地方是,很多事情可以通过提示来做而且做得非常好,这是之前没有的。但随之而来,是它的成本也上去了,它并不是十全十美的,就像一个豪华的汽车和一个很便宜的汽车,这两者都有它的应用价值,你不能说现在有了一个豪华汽车,就把经济实用型的汽车说成是没有什么用。

二,ChatGPT算迈向超级人工智能的一小步,但还没达到这个目标

《科学大师》:GPT出来后,大家试用过觉得这个东西挺不成熟,是在一本正经的胡说八道,比如说,黄学东院士当选美国两院院士的时间,这个知识点它就说得不对,它给出的时间要早于您当选的确切年份,这挺让人尴尬的。

黄学东:这是我们应该关注的问题,当前生成式人工智能还不够成熟。如果一个人的鉴别力不是很好,那他就容易被人工智能忽悠了。这就跟人一样的,人虽然是地球上最高等级的智能体,但有时候也会不可靠,他大部分时间是对的,但是不靠谱的时候也会胡来,而怎么样能够让这种生成式人工智能变得越来越靠谱,这是我们人工智能发展中需要实现的事情。只有把成熟的人工智能用于教育和宣传,才是对社会有益的。

大语言模型在上世纪70年代就有了,IBM当时的语音识别研发团队就已经推出,但当时它的识读能力有限。现在这个大模型,是从机器翻译这个领域抽出来的,用的是机器翻译的一个方法确精准变换器,它没有超越机器翻译实现新的突破,但是它看了很多很多的东西,然后预测下一个词汇怎么样,就相当于把整个搜索引擎所有文本全看了一遍,用更多的数据训练它,并加上了奖励建模和强化学习与人类的预期对齐等技术,然后通过不同的提示可以突然涌现一些令人惊奇的能力。确实能做到一本正经,显得很有智能,但是它还没法做到完全精确精准,不能完全把错误剔除,它的稳定性目前还没有办法实现的。

它用的是深度学习的基础架构,最主要的一个特点就是自学习并加上奖励建模,把所有的数据全拿过来,所有的语言都拿过来,根据这个它可以自己学习,就是说看了一个文章以后你下面要讲什么东西,可以不用标注的数据,它看了前面一段文章(问题),它就能知道后面一段文章,可以翻译出来(给出答案和对策),这是GPT4.0,就是自己跟自己“翻译”。

责任编辑: zhongkang  来源:网易科技 转载请注明作者、出处並保持完整。

本文网址:https://www.aboluowang.com/2023/0605/1910517.html