首页 > 行业资讯 > 查看内容

DeepMind再放大招:2D图片可渲染成3D对象

2018-06-15 11:03:25|来源: 青亭网

  谷歌子公司DeepMind今天发布了一种新型计算机视觉算法:the Generative Query Network (GQN),其主要特点是可以让2D照片通过AI转换成3D对象。

  关于这项GQN算法,其以公开在科学杂志上,无需任何人工监督和培训即可生成3D渲染场景。我们只需给出一些场景的图片,例如一个拥有彩色圆形装饰的壁纸的房间,算法通过多个位置和渲染相反侧面,即可生成3D视图,甚至还具有逼真的光影效果。

 

  据了解,这项技术旨在复制人类大脑了解其周围环境和物体之间的交互方式,并大幅降低了AI研究人员进行大量图像数据标注的繁琐过程。大多数计算机视觉系统都需要工作人员提前进行数据标记,每个场景、每个对象、甚至物体的每个表面,都需要标注,这是一个耗时耗力的过程。
 

  DeepMind研究人员在一篇博客文章中写道:“与几岁的孩子和动物一样,GQN算法通过观察周围世界并尝试理解和学习。通过这种做法,GQN大概了解模糊的场景和大致几何属性,而美欧对场景内任何内容进行手动标注。

  为了训练这个系统,DeepMind研究人员给GQN提供不同角度的场景图像,用来自学物体的纹理、颜色、光影,以及他们之间的空间关系等,然后以此预测这些物体从侧面或从后面看起来会是什么样子。

 
 
 

  利用它的空间理解能力,GQN还可以控制这些对象,例如通过虚拟机械臂捡起地上的球。并且还可以通过在场景中移动,来自我纠错、学习。

  GQN并没有明确的限制条件,它只在包含少量对象的简单场景中进行测试,它还不够复杂,不足以生成复杂的3D模型,但DeepMind正在开发更完善和功能更强的系统,但他们对硬件的需求和语料库的需求更少,可以处理更高分辨率的图像。

  研究人员写道,虽然这套方法在落地应用前还有很多需要去完善,但我们相信这项研究对于完全自主的场景理解AI模型来讲,有着重要的意义。
联盟会员
合作伙伴
公众平台