帮助机器人学会在3D中看到

自动机器人可以检查核电站,清理海洋中的石油泄漏,伴随战斗机进入战斗并探索火星表面。

尽管如此,机器人仍然无法制作一杯茶。

那是因为诸如打开炉子,取水壶和找到牛奶和糖等任务需要感知能力,对于大多数机器来说,仍然是一种幻想。

其中之一是能够理解三维物体。虽然机器人用相机和其他传感器“看到”物体相对简单,但从单一的瞥见中解释他们所看到的东西却更加困难。

杜克大学的研究生Ben Burchfiel表示,世界上最先进的机器人还不能做大多数孩子自动做的事情,但他和他的同事可能更接近解决方案。

Burchfiel和他的论文顾问George Konidaris现在是布朗大学计算机科学的助理教授,他开发了一种新技术,使机器能够以更丰富,更像人类的方式理解3D物体。

例如,从桌子上清除餐具的机器人必须能够适应各种尺寸和形状的各种各样的碗,盘子和盘子,在杂乱的表面上留下混乱。

人类可以瞥一眼新物体并直观地知道它是什么,无论是正面朝上,倒置还是侧面,全视图还是被其他物体遮挡。

即使对象被部分隐藏,我们也会精神上填写我们看不到的部分。

他们的机器人感知算法可以同时猜测新物体是什么,以及它是如何定向的,而不是首先从多个角度检查它。它还可以“想象”任何不可见的部分。

例如,使用这种技术的机器人不需要看到茶壶的每一面都知道它可能有一个手柄,一个盖子和一个喷口,以及它是直立还是在炉子上不合适。

研究人员表示,他们的方法于7月12日在马萨诸塞州剑桥举行的2017年机器人:科学与系统会议上提出,它的错误更少,并且比目前最好的方法快三倍。

Burchfiel说,这是朝向机器人迈出的重要一步,这些机器人在家庭和其他现实环境中与人类一起运作,这些机器人比实验室或工厂的高度控制环境更不有序和可预测。

通过他们的框架,机器人被给予有限数量的训练样例,并使用它们来推广到新对象。

Burchfiel说:“假设一个机器人有一个详细的三维模型来预测它可能会遇到的每个可能的物体,这是不切实际的。”

研究人员对他们的算法进行了大约4,000次普通家庭物体三维扫描数据集的训练:各种各样的浴缸,床,椅子,书桌,梳妆台,监视器,床头柜,沙发,桌子和厕所。

每个3-D扫描都被转换成数以万计的小立方体或体素,像乐高积木一样堆叠在一起,使它们更容易处理。

该算法通过结合每个对象的示例并使用称为概率主成分分析的技术版本来确定它们如何变化以及它们如何保持不变来学习对象的类别。

当一个机器人发现一些新东西 - 比如一张双层床 - 它不需要筛选整个心理目录以进行匹配。从先前的例子中,它了解了床的特征。

基于该先验知识,它具有像人一样概括的能力 - 理解两个对象可能不同,但共享属性使它们成为特定类型的家具。

为了测试该方法,研究人员从顶部查看了算法908新的相同10种家居用品的3-D示例。

从这个有利的角度来看,算法正确地猜测了大多数物体是什么,以及它们的整体三维形状应该是什么,包括隐藏部分,大约75%的时间 - 相比之下只有50%以上的状态。最先进的替代方案。

它还能够识别以各种方式旋转的物体,这是最好的竞争方法无法做到的。

Burchfiel说,虽然系统速度相当快 - 整个过程大约需要一秒钟 - 但它与人类视觉相差甚远。

首先,他们的算法和以前的方法很容易被对象所欺骗,从某些角度来看,这些对象在形状上看起来相似。他们可能会从上面看到一张桌子,并将其误认为是梳妆台。

“总的来说,我们犯了一个不到25%的错误,而最好的替代方案几乎占了一半的时间,所以这是一个很大的改进,”Burchfiel说。“但它仍然没有准备好搬进你的房子。你不想把它放在洗碗机里。”

现在,团队正在努力扩展他们的方法,使机器人能够一次区分数千种类型的对象。

“研究人员一直在教机器人识别三维物体,”Burchfield说。他解释说,新的东西是能够识别某些东西并填补其视野中的盲点,重建它看不到的部分。

“在很多机器人应用中,这有可能是非常宝贵的,”Burchfiel说。