新闻 > 科教 > 正文

Sora文本转视频功能太强?中国开始复制

Open AI的Sora文本转视频功能,在这段时间一直是热点,引起了全球的关注。Open AI又给全球放了一个超大的卫星,从Sora这个文字转视频的AI功能来看,效果之出色的确出乎所有人的意料。中国用户和从业者无论是有着震惊、羡慕、质疑或者不屑的态度,但在AI应用层面都得承认,海外的确是比中国要强出很多。不过中国从业者现在也开始准备复制Sora的文本转视频功能,而且已经取得了一些成效。

根据中国媒体的报道,北京大学的研究人员和深圳一家名为Rabbitpre的人工智能公司合作,启动了一个名为Open-Sora的项目,这个项目的目标是在开源社区的帮助下创建OpenAI文本转视频模型Sora的一个版本,该版本更易于使用且更具可扩展性。

这显然是中国AI从业者想要跟上国外步伐的一个举措,而且开起来还是个开源项目,这更具有道德的高度以及可操作性,剩下的问题就是能不能成功了。

作为一个开源项目,整个项目当然会放在GitHub页面,不过略显讽刺的是,这虽然是中国AI从业者的项目,但GitHub页面我们都知道不是那么容易被国人访问的,虽然我们自己倒清楚,要玩这类项目的人应该不会被这个问题难住……据悉Open-Sora这个项目开发了一个由三部分组成的框架,并已经展示了四个重组视频的演示,看起来还是有不小的进展。

这个开源项目未来的目标包括完善技术以生成更高分辨率的视频,并通过额外的数据和更多的图形处理单元加强培训,从而为服务提供更多的算力。这些步骤对于提高模型的性能并扩展其生成更详细和更长视频的能力至关重要。也就是说如果这个项目发展下去,依然需要高算力的AI芯片。

除了这个国人发起的开源项目以外,其实中国的几大互联网公司在文本转视频上,也有着自己的动作。根据我们的了解,包括腾讯和字节跳动都涉足了文本转视频的领域。腾讯AI发布了一个名为VideoCrafter2的软件,这是一个开源视频生成和编辑工具箱,能够从文本生成视频,不过时间仅限于两秒;字节跳动的MagicVideo-V2则结合了各种模块来创建端到端视频生成管道。应该说中国的厂商们其实都在努力,但差距的确还是比较大。

对于中国文本转视频这部分的发展,不少人还是抱有期待,一些公司渴望利用文本到视频的人工智能模型,如果有哪家公司推出相应的产品……但更多人还是对中国目前AI发展感到一些担忧,毕竟AI项目需要大量的算力,这部分海外明显强过中国太多,而且由于出口管制的存在,海外的高端AI芯片无法出口到中国,而中国自主研发的AI芯片在性能和产能都无法和海外相比,这可能会大大延缓中国AI技术的发展。

责任编辑: 李冬琪  来源:杰夫视点 转载请注明作者、出处並保持完整。

本文网址:https://www.aboluowang.com/2024/0307/2027019.html