2月27日消息,谷歌DeepMind推出了名为Genie的新型AI基础世界交互模型,该模型拥有110亿个参数,标志着AI领域的一次革命性突破。Genie能够基于用户输入的图片和提示词,生成一款较为完整的2D平台游戏。该模型由三个核心部分构成:潜在动作模型、视频tokenizer以及动态模型。这三个组件的合作使Genie能够创建具有高度交互性和可控性的虚拟世界。
经过超过20万小时的2D游戏视频训练,Genie目前仍处于研究预览版阶段,生成的游戏更贴近于2D平台游戏而非完整的VR游戏。此外,Genie不仅能生成游戏图像和其他资源,还能把用户的草图转化为一个完全实现的开放世界。通过预测玩家操作后的下一像素帧,Genie还可用于设计和创作领域,极大地扩展了创作者的想象空间。