根据密歇根大学的研究,机器人可以通过学习房子周围不同物体之间的关系来学习如何更快地找到东西。在本文的一个例子中,一种新的模型为机器人提供了一种视觉搜索策略,当机器人看到冰箱时,可以引导机器人找到附近的咖啡壶。
这项工作由查德詹金斯教授和CSE博士领导。学生曾赠在2020年国际机器人与自动化大会上获得了认知机器人最佳论文奖。
机器人的共同目标是使机器具有在真实环境中导航的能力,例如,我们生活的无序和不完美的家庭。这些环境可能是混乱的,没有两个是完全相同的,机器人会寻找特定的环境。他们从未见过的物体需要从噪音中消除。
“能够在环境中有效地搜索物体对于服务机器人自主执行任务非常重要,”曾说。“我们提供了一种实用的方法,使机器人能够在复杂环境中主动搜索目标物体。”
但是房子并不是完全混乱的。我们围绕不同类型的活动组织空间,通常在彼此附近存储或安装一些项目组。厨房通常配备我们的烤箱、冰箱、微波炉等小炊具。卧室将有我们的梳妆台、床和床头柜;等等。
曾和詹金斯提出了一种利用这些共同空间关系的方法。他们的“SLiM”(语义链接图)模型将机器人记忆中的一些“地标物体”与其他相关物体以及如何在空间中定位它们的数据相关联。他们利用SLiM来考虑目标物体和地标物体的多种功能,让机器人对如何在环境中安排事物有更全面的了解。
他们写道:“当被问及在哪里可以找到目标物体时,人类可以给出与其他物体的空间关系所表达的假定位置。”"机器人应该能够对物体的位置做出类似的推断。"
这个模型不仅仅是硬编码了不同物体通常有多近——一天一天地环视一个房间,你肯定会看到足够多的变化,以至于很快使这项工作徒劳无功。相反,SLiM会考虑物体位置的不确定性。
作者在论文中解释了这个项目:“以前的工作假设地标物体是静态的,因为它们大多数都保持在最后观察到的位置。”为了克服这一局限性,研究人员使用因子图(一种表示概率分布的特殊图形)来建模不同对象之间的概率关系。
在了解了被拖动的物体之间可能存在的关系后,SLiM引导机器人探索可能包含目标或地标物体的有希望的区域。这种搜索方法是基于以前的发现,这些发现表明首先定位地标(间接搜索)比简单地寻找目标(直接搜索)更快。曾氏和曾氏使用的模型是他们的混合体。
图片:密歇根大学
在实验中,该团队在同一模拟环境中测试了五种不同搜索模型的性能。一种是幼稚的直接搜索,不知道对象的空间关系,而另外四种则利用SLiM的空间映射结合不同的搜索策略或初始优势:
直接使用已知的先前位置搜索目标,而不考虑对象可能已经移动的任何可能性。
使用已知的先前位置直接搜索目标,这显示了对象可能已经移动的可能性。
不提前知道物体位置直接搜索。
混合搜索,事先不知道物体的位置。
最后,SLiM结合混合搜索成功找到了每次测试中路线最直接、搜索时间最少的目标对象。
这项工作发表在论文《主动视觉对象搜索的语义链接图》中。