新闻 > 国际财经 > 正文

英伟达赢麻了!马斯克xAI曝光,10万块H100…

英伟达:尽管建,用的还是我的芯片……

——题记

最近几年,随着大语言模型的飞速发展与迭代,科技巨头们都竞相投入巨额财力打造超级计算机(或大规模 GPU集群)。他们认为,更强大的计算能力是实现更强大 AI的关键。

早在2022年,Meta即宣布与英伟达共同打造大型 AI研究超级计算机“AI Research SuperCluster”(RSC),它由760个英伟达 DGX A100系统组成,共有6080块 GPU,性能非常强大。

如今,马斯克旗下人工智能初创公司 xAI传出了打造超级计算机的消息。

据外媒 The Information报道,最近马斯克向投资者透露,xAI计划建造超级算力工厂“Gigafactory of Compute”,为 AI聊天机器人 Grok的下一个版本提供算力支持。

据悉,xAI计划将10万块 H100专用 GPU串联一台超级计算机,其规模至少是当前最大 AI集群的四倍。如果 xAI的计划能够顺利完成,这台超级计算机将耗费数十亿美元和大量电力。

不过,马斯克似乎很有信心,他的目标是在2025年秋季之前让这台超级计算机“跑”起来,并亲自负责按时交付。

当然,xAI不想单打独斗,其有望与甲骨文公司(Oracle)合作建造超级计算机。我们知道,xAI是 Oracle最大的 H100服务器芯片租赁客户,已经使用了后者超过1.5万块 H100芯片。

届时,xAI超级算力工厂建成之后,10万块 GPU芯片集群将加速 Grok聊天机器人的开发,减少语音限制。目前,Grok的最新版本为 Grok1.5,该版本实现了长上下文理解和高级推理能力,可以处理128K token的长上下文窗口。

而据马斯克此前透露,xAI正在训练的 Grok2已经耗费了约2万块 H100 GPU,未来进阶版本 Grok3可能需要高达10万块 H100 GPU。看来,马斯克已经在为 Grok3未雨绸缪了。

最后,对于超级算力工厂而言,最关键的找到一个电力充沛(可能需要100MW)的位置。因此,AI数据中心位置的选择非常重要。

至于建成的意义是什么?这个规模庞大的超级算力工厂将帮助 xAI追赶 OpenAI微软等资金更为雄厚的竞争对手。

此前同样据 The Information报道,微软和 OpenAI拟投入超1000亿美元打造一个数据中心项目,其中包括一台“星际之门”(Stargate)的 AI超级计算机,配备了数百万个专用服务器芯片,旨在为 OpenAI实现 AGI提供动力。

其实,这也不是马斯克第一次投入超算项目。此前,特斯拉就被曝出到2024年底,投入远超10亿美元打造一台“Dojo项目”的内部超级计算机,用于处理数据和视频,提高自动驾驶能力并最终实现完全自动驾驶。

此次,马斯克又在大语言模型领域斥巨资建造超级计算机。有人表示,如果消息属实的话,这将成为游戏改变者。当然,英伟达是最大的赢家。

责任编辑: 方寻  来源:机器之心 转载请注明作者、出处並保持完整。

本文网址:https://www.aboluowang.com/2024/0527/2059388.html