快报内容
当地时间2026年1月30日,谷歌旗下人工智能研究实验室DeepMind正式向美国地区的Google AI Ultra订阅用户开放了名为“Project Genie”的实验性研究原型访问。这一发布活动通过谷歌官方博客及独立项目页面进行,标志着其世界模型Genie 3从技术预览阶段迈入首次可交互实践展示。
DeepMind联合创始人Demis Hassabis将该项目描述为“游戏AI与大脑研究的结合”,概念上类似于电影《盗梦空间》中的“共享梦境”。其核心目标是探索从简单描述中实时创造和体验交互式世界的能力。谷歌CEO Sundar Pichai也对此项目公开表示支持。
Project Genie基于三大技术模型协同工作:Genie 3作为核心世界模型负责环境生成与物理模拟;Gemini语言模型解析用户文本指令;Nano Banana Pro图像模型生成视觉草图。该系统允许用户通过文本提示或图片上传创建虚拟世界,并可通过键盘控制角色进行实时探索,体验时长约60秒,分辨率为720p,帧率约20-24fps。
该工具展现出三大核心功能:世界草绘(World Sketching)支持环境与角色的原型设计;世界探索(World Exploration)实现实时生成与导航;世界重混(World Remixing)允许用户对现有创作进行衍生创新。测试者报告称,系统能维持基本的物理记忆,如雪地痕迹或油漆标记会在用户返回时依然存在。
然而作为早期研究原型,Project Genie存在明显局限性:每次交互被严格限制在60秒内,主要受限于计算成本与模型维持长期逻辑一致性的能力;角色控制存在可感知的延迟;生成世界可能不完全遵循提示词或真实物理规律;此前预告的“可提示事件”功能在此版本中尚未实现。
该发布立即引发行业关注,导致多家游戏公司股价显著下跌。据路透社报道,Take-Two Interactive、Roblox和Unity等公司股价在发布后次日出现7.93%至24.22%不等的跌幅。同时,项目上线后迅速面临版权挑战,用户生成与《超级马里奥》《塞尔达传说》高度相似的内容后,谷歌被迫封锁相关生成能力。
DeepMind明确表示Project Genie定位为“研究原型”而非成熟产品,旨在服务于快速原型设计与新型互动体验探索。其潜在应用场景涵盖教育仿真、机器人训练、自动驾驶测试及创意产业等领域。从战略层面看,该技术被视为构建能够理解和驾驭真实世界复杂性的AI系统、通向通用人工智能(AGI)的关键一步。
总结
谷歌DeepMind于2026年1月30日推出的Project Genie研究原型,首次将世界模型技术以可交互形式向公众展示。尽管存在生成时长限制与控制延迟等技术局限,但其实现从文本描述实时生成可持续虚拟世界的能力,标志着AI从内容生成向环境生成的重要范式转变。这一突破不仅为游戏开发、AI训练等领域带来变革潜力,更被视为通向通用人工智能道路上的关键里程碑。
内容参考来源





没有回复内容