新闻 > 科教 > 正文

谷歌AI怼微软,不一定只靠搜索

美国当地时间5月10日,一年一度的谷歌 I/O开发者大会如期举行。一直以来,谷歌在 I/O大会上都是以先行者的姿态展示最前沿的 AI技术。但今年这位 AI巨头的姿态却与往昔有些不同了。

虽然本次大会谷歌发布新技术的节奏没变,推出了 PaLM2大模型、Bard升级版,以及 Gemini多模态模型。但在外人看来,这些技术似乎少了一些新奇的创意,多了几分追赶的焦虑。毕竟,在微软OpenAI掀起来的这波 AI大模型浪潮里,只要不是先行者,看起来都像是在追着微软的背影跑。

其实谷歌在 AI赛道上跑的从来都不慢,近两年的谷歌 I/O大会一直没有离开过 AI,今年大会的 AI味儿还更浓了些,不仅是 Bard、Workspace这些微软已经布局的产品赛道,谷歌还将生成式 AI融入了安卓。

一直以来,Bing一直被视为微软发力大模型的一个入口,是一个几乎完美的组合。但对谷歌来说,其杀手锏反而不是用户量更大的搜索,而是安卓系统。生态似乎给了谷歌一道牢固的护城河。不过在 AI竞争中,这种逐鹿输赢(电视剧)如何,随着技术的迭代演变,还需要时间验证。

搜索并非大模型的唯一底牌,生态的优势又能让企业领先多久?

先发优势对谷歌搜索来说有多重要

微软把 GPT能力赋予 Bing的那一刻,就相当于是在对谷歌宣战。而谷歌推出 Bard,自然也就是接下了这挑战书。

本次大会上,发布了 PaLM2大模型,这也被业界广泛认为是对标 GPT-4的产物。

事实上,2022年 I/O大会上展示过的 PaLM模型参数量已经达到5400亿,单看参数量比当时 OpenAI主打的 GPT-3多2倍有余。而今年的进阶版—— PaLM2,更是在数学能力、代码编写、逻辑推理、以及多语言能力等方面都有大幅提升。

随着基础大模型的升级,谷歌搜索引擎里用到的大型语言模型(LLM)对话机器人 Bard,也进行了一番升级,新增了引用功能,使内容更加准确。还有导出功能,可以将结果一键导出到 Gmail或 Docs中。

未来,Bard还将与谷歌的其他应用(Maps、Photos、Messages、Flights、YouTube等)集成,并开放第三方扩展,可以使用 Adobe Firefly完成文生图功能。并结合谷歌最新宣布的 Gemini多模态模型,提供和 GPT-4的识图功能类似的,多模态能力。目前,开发者可以通过谷歌的 PaLM API、Firebase以及 Colab访问 PaLM2。

虽然有进步,但相对于竞品,Bard似乎还是慢了一小步。Bard的这些功能更新在不久前,微软的 New Bing几乎都宣布了一遍。但是,在大模型的争夺中,先发优势能够决定多少?

从微软2023年一季度财报来看,市调公司 Sensor Tower的数据显示,微软宣布将把 ChatGPT纳入搜索6周后,必应的流量飙升了16%。在微软最新公布的2023年第一季度财报中,微软搜索和新闻广告营收同比增长10%,均超出分析师预期。

虽然 Bing的流量大幅上涨,但谷歌同期的财报并未显示搜索业务有明显下滑。作为已经在搜索引擎市场上占据绝对优势的谷歌来说,"打江山易,守江山难",谷歌搜索可能并不像 Bing那样需要靠 AI能力搏出位。对于搜索引擎市场的老大来说,需要的是保守和稳定,尽量少出现 Bard首发时那样的"翻车"问题,可能才是现阶段保住市场地位的关键。

而在搜索引擎领域长久以后的 AI之争,也并不急于一时的产品抢先,更多的还是要看 AI大模型的底层能力,拼的就是 PaLM和 GPT谁进化得更快了。

从开发者的角度看,谷歌的大模型对于中小开发者,以及企业用户更为友好。PaLM2包含了4个不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据上进行了微调,为企业客户执行某些任务。

其中的壁虎模型,甚至可以在手机上直接运行。不仅降低了开发成本,还拓展了应用开发的可能性。不需要绑定云服务的 AI应用,不仅大幅降低了 LLM的使用成本,也可以最大限度地本地数据的安全。

当然,对于企业用户来说,PaLM2模型更易落地,其针对不同场景开发了不同的小模型。目前,谷歌内部已经有超过70个产品团队正在使用 PaLM2构建产品。I/O大会上展示了其中的两款行业模型:安全领域的 Sec-PaLM,聚焦于分析和解释潜在恶意脚本;医疗领域的 Med-PaLM2,可以通过美国医学执照考试,甚至还可以从医学影像中合成患者信息。很快,这两种模型都将通过谷歌云提供给特定客户。

从搜索到企业应用,综合来看,在接下来的 AI竞逐中。谷歌和微软,孰能争先,目前还难有定论。

安卓生态能成谷歌 AI的壁垒吗?

本次大会的亮点之一是谷歌在安卓上融入了 AI功能。

谷歌最新公布的 Android14中,也融入了两项 AI功能:Magic Compose可以用生成式 AI帮用户改写句子;安卓系统还将具备利用生成式 AI制作具有3D效果的个性化壁纸的能力。

安卓短信功能

除应用功能以外,谷歌还推出了专为 Android开发的 AI编码机器人 Studio Bot。不仅可以生成代码、修复 BUG,甚至能够回答关于安卓应用开发的相关问题。同时支持 Kotlin和 Java编程语言,并将直接嵌入到 Android Studio开发工具的工具栏中。

这或许才是谷歌 AI最重要的一步棋。

目前 New Bing和 Bard都围绕搜索引擎开放了插件体系,两家都提到了将和 OpenTable预订餐厅,以及 Instacart订货配送的功能相结合,为用户提供更多可延展的服务。

然而,无论开放多少插件,这种仅可用于搜索引擎的插件功能,存在着一些局限性。

对于用户和服务商来说,插件的模式能够实现的功能有限,跨平台整合能力不足,最后可能导致增加用户的操作复杂度,或者降低服务商的跨平台服务能力。就比如说你在携程可以完成一趟旅行的全部预订,但如果把订机票、订酒店、订餐厅都拆成3个插件,那么操作起来势必会繁琐一些。

此外,还可能会遇到插件的开发者生态问题。一方面搜索引擎作为基础平台的开放性是否能满足开发者需求,另一方面还要基于搜索引擎的 AI平台定义应用场景,培养开发者。这就在无形中给 AI生态创造了一个开发门槛。

而对于谷歌来说,在这方面虽然插件生态也是刚刚起步。但谷歌毕竟拥有安卓生态的庞大开发者社群,如果将 AI能力加成到其中,则能够更快地建立起一套繁荣的 AI生态。基于安卓系统的 AI应用生态体系,可能会先微软一步为谷歌构筑起生成式 AI的护城河。

不过也有人认为,AI大模型未必会形成操作系统级的生态。AI行业分析师仓剑告诉虎嗅,"AI大模型可能更像微信、支付宝这种超级 APP,它是一个应用型平台。"

诚然,在操作系统层面,谷歌具备更强的生态体系,且已经聚拢了一大批优质开发者。但如微信小程序的轻量化应用的崛起,也说明以"超级 App"为入口的插件型应用自有它们的优势。

首先,插件的开发成本更低。在微信推出一款小程序的成本肯定比在应用商店上架 App要低得多,现在有的小程序开发价格甚至比一些 H5(网页)更便宜。其次,小程序在实现单点功能方面更便捷,对于 LLM来说,如果你不需要复杂的操作,只是用自然语言输入,即可获得结果的话,那么确实开发一款复杂应用可能没有什么必要。

而相较于 App来说,搜索引擎作为入口的流量红利,或许也可以在一定程度上覆盖功能简单的不足。由此来看,虽然安卓生态可能为谷歌先一步聚拢 AI开发者人气,但围绕搜索引擎的插件之争,应该也还会在两大巨头,甚至未来的更多入局者中持续发酵。

责任编辑: 夏雨荷  来源:虎嗅科技组 转载请注明作者、出处並保持完整。

本文网址:https://www.aboluowang.com/2023/0513/1901122.html