您当前的位置:首页 > 指南 > 正文

新的开发框架可以让机器人自主地优化超参数

导读: Ecole Centrale de Lyon的研究人员最近设计了一个受人类长期记忆和推理机制启发的新发展框架。该框架在东京IEEE ICDL-Epirob上发表并在...

Ecole Centrale de Lyon的研究人员最近设计了一个受人类长期记忆和推理机制启发的新发展框架。该框架在东京IEEE ICDL-Epirob上发表并在arXiv上发布的论文中概述,允许机器人自动优化从任何动作和/或视觉模块调整的超参数,这些参数被视为黑盒子。

近年来,研究人员已经建立了可以完成各种任务的机器人。尽管如此,这些机器人运行的环境往往受到一定程度的限制。这是因为在机器人技术中,大多数算法都是由人类专家手动制作和优化的,以预测机器人在给定情况下可能遇到的潜在挑战。

“然而,当处理不确定性时,例如,当机器人在其生命周期中不得不经常处理新物体时,总是依赖于额外的程序和人类工程师的优化是不可行的:机器人必须自己学习,”Dr进行这项研究的研究人员之一Maxime Petit告诉TechXplore。“我们希望为机器人提供学习机制,使他们能够自主并适应各种情况,即使这些情况没有被预料到。”

开发能够自动适应不同情况的机器人可以有许多有用的应用,例如,在工业机器人的背景下,机器人手臂需要从均质散装中拾取未知物体。

“我们希望机器人能够自主优化基于视觉的抓软件(由SiléaneKamido)为每个参数对象在不到几个小时,”佩蒂特解释。“为此,我们使用了一个旨在复制儿童如何了解世界的发展框架。特别是,我们希望通过将一项任务的知识转移到另一项任务来加速学习过程,从而利用对象之间的相似性。 “。

Petit及其同事提出的发展框架旨在通过类似于人类儿童的过程,实现机器人新技能的终身和开放式学习。为了实现这一目标,他们的框架包括一个长期记忆,其中机器人存储他们的经验,以及推理能力,使他们能够识别他们存储的数据中的有用元素。

“贝叶斯优化方法可以作为一种智能'试错'策略:机器人根据先前评估的结果估算出最适合评估的参数集,”Petit解释道。“简而言之,这种方法可以有效地引导机器人探索未尝试过的值的参数,同时也可以探索具有高潜力的值。”

尽管这项技术效率很高,但研究人员希望增加机器人学习的收敛性,以实现更好的优化。传统的贝叶斯优化方法因此是不可取的,因为这些方法对于遇到的每个新对象,机器人的学习从头开始。为了解决这一局限性,研究人员采用了基于视觉相似性的策略。

“我们希望利用以前的机器人经验来完成不同但相似的任务,”佩蒂特说。“因此,当面对一个新物体时,我们迫使机器人最初探索针对类似物体进行优化的解决方案。例如,如果机器人知道如何抓住橙色并且现在要抓住一个苹果,我们就强迫机器人我们通过向视觉相似性模块询问哪些对象与新对象类似,并从长期记忆中提取这些类似对象的最佳解决方案来实现这一目标。

研究人员在模拟环境中评估了他们的框架。他们发现基于视觉相似性的转移学习策略比遗忘学习更有益,其中机器人在每次执行新任务时都从头开始学习策略。

到目前为止,发展框架主要是在社交机器人的背景下进行调查,例如,帮助个性化社交机器人对其用户的需求或偏好的帮助。

“在工业机器人设置中使用这个框架导致令人信服的结果,暗示社会和工业机器人领域有很多可以相互学习,”佩蒂特说。“我们研究的另一个有趣的方面是框架正在优化一个”黑盒子“算法,这意味着我们不知道它是如何工作的。我们为它提供参数,作为交换,我们得到一个分数它们的质量。这意味着它也可以应用于需要经常微调的不同应用和算法(甚至在机器人领域之外)。“

研究人员现在正在探索机器人将关于模拟过程中获得的物体的知识转移到涉及相同物体的实际任务的方法。这将进一步提高机器人的效率,使其能够虚拟地学习新事物,然后在现实生活中应用它们。

“对于共享物理属性的对象的参数优化也可能导致特定机器人出现这种概念,”Petit补充道。“例如,机器人可以知道'平坦','重','长'等对象必须掌握参数子集的特定值。这可以用来增强人机交互和学习例如,使用自然语言,工人通过提供要处理的新对象的小描述来帮助机器人。“


声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,谢谢。

上一篇: 李智恩是不是iu iu李智恩有没有男朋友

下一篇: 验资报告怎么出的 验资报告是哪里出的



推荐阅读