正如司机遵守道路规则一样,大多数行人在走廊或拥挤的通道时遵循一定的社会规范:向右行驶,向左行驶,保持一个可敬的泊位,并准备编织或改变航向以避免迎面而来的障碍,同时保持稳定的步伐。
现在,麻省理工学院的工程师设计了一种具有“社会意识导航” 的自主机器人,可以跟踪人流量,同时遵守这些行人行为的一般规范。
在麻省理工学院斯塔塔中心内部进行的驾驶测试中,机器人类似于车轮上的膝盖式自助终端,成功地避免了碰撞,同时保持了行人的平均流量。研究人员在一篇论文中详细介绍了他们的机器人设计,他们将在9月份的IEEE智能机器人和系统会议上发表这篇论文。
“社交意识导航是移动机器人在需要与行人频繁互动的环境中运行的核心功能,”Yu Fan“Steven”Chen说,他曾担任麻省理工学院前研究生,并且是该研究的主要作者。“例如,小型机器人可以在人行道上进行包装和食品运输。同样,个人移动设备可以在人们拥挤的大空间内运送人员,例如商场,机场和医院。”
Chen的合着者是研究生Michael Everett,前博士后刘淼和Jonathan How,Richard Cockburn Maclaurin麻省理工学院航空航天教授。
社交动力
为了让机器人在交通繁忙的环境中自主地行进,它必须解决四个主要挑战:定位(知道它在世界的哪个位置),感知(识别周围环境),运动规划(确定最佳路径)给定目的地)和控制(物理地执行其所需的路径)。
陈和他的同事使用标准方法来解决本地化和感知问题。对于后者,他们为机器人配备了现成的传感器,如网络摄像头,深度传感器和高分辨率激光雷达传感器。对于本地化问题,他们使用开源算法来映射机器人的环境并确定其位置。为了控制机器人,他们采用了用于驱动自动地面车辆的标准方法。
“我们认为我们需要创新的领域是运动规划,”埃弗雷特说。“一旦你弄明白自己在世界上的位置,并知道如何跟踪轨迹,你应该遵循哪条轨迹?”
这是一个棘手的问题,特别是在人行道较重的环境中,个别路径通常很难预测。作为一种解决方案,机器人专家有时会采用基于轨迹的方法,在这种方法中,他们对机器人进行编程,以计算出能够满足每个人所需轨迹的最佳路径。必须从传感器数据推断出这些轨迹,因为人们没有明确地告诉机器人他们想要去哪里。
“但这需要永远计算。你的机器人将会停下来,弄清楚接下来要做什么,同时这个人已经在它决定'我应该向右走'之前已经过了它,”埃弗雷特说。“所以这种方法不太现实,特别是如果你想要更快地开车。”
其他人使用更快,“基于反应”的方法,其中机器人使用几何或物理学的简单模型编程,以快速计算避免碰撞的路径。
埃弗雷特说,基于反应的方法存在的问题是人性的不可预测性 - 人们很少坚持直线的几何路径,而是编织和徘徊,转向迎接朋友或喝咖啡。在这种不可预测的环境中,这种机器人往往会与人碰撞,或者看起来像是被人过度躲避而被推开。
“在实际情况下对机器人的敲击是他们可能过于谨慎或具有侵略性,”埃弗雷特说。“人们没有发现它们符合社会公认的规则,比如给人们足够的空间或以可接受的速度驾驶,并且他们得到的方式比他们帮助的更多。”
训练日
该团队找到了解决这些限制的方法,使机器人能够适应不可预测的行人行为,同时不断地随着流动而行走并遵循典型的行人行为社会准则。
他们使用强化学习,一种机器学习方法,在这种方法中,他们进行计算机模拟以训练机器人采取某些路径,给定环境中其他物体的速度和轨迹。该团队还将社会规范纳入了这个离线训练阶段,他们鼓励模拟中的机器人向右传递,并在机器人向左传递时惩罚机器人。
埃弗雷特说:“我们希望它能够在人们中间自然地进行,而不是侵入性的。” “我们希望它遵循与其他所有人相同的规则。”
强化学习的优势在于,研究人员可以执行这些训练场景,这些场景需要大量的时间和计算能力,才能脱机。一旦机器人接受了模拟训练,研究人员就可以对其进行编程,以便在机器人识别现实世界中的类似场景时执行模拟中确定的最佳路径。
研究人员使机器人能够每十分之一秒评估一下环境并调整其路径。通过这种方式,机器人可以以1.2米/秒的典型步行速度继续在走廊中滚动,而不会暂停重新编程其路线。
埃弗雷特说:“我们并没有计划完成一条通往目标的道路 - 再也没有意义了,特别是如果你假设世界正在发生变化。” “我们只看看我们看到的东西,选择速度,在十分之一秒内完成,然后再看一遍世界,选择另一个速度,然后再去。这样,我们认为我们的机器人看起来更自然,而且期待人们在做什么。“
维持人群秩序
埃弗雷特和他的同事在麻省理工学院Stata大楼繁忙蜿蜒的大厅里试驾机器人,机器人一次可以自动驾驶20分钟。它与行人流顺畅地滚动,通常保持在走廊的右侧,偶尔会让人们左转,并避免任何碰撞。
埃弗雷特说:“我们希望把它带到人们日常生活,去上课,吃饭的地方,我们表明我们对这一切非常强大。” “有一次甚至有一个旅行团,它完全避开了他们。”
埃弗雷特说,未来,他计划探索机器人如何处理行人环境中的人群。
“人群的动态与个人不同,如果你看到五个人走在一起,你可能需要学习完全不同的东西,”埃弗雷特说。“可能有一种社会规则,'不要让人过分,不要把人分开,把他们视为一个群众。' 这是我们未来的目标。“