虽然足球运动员已经分配了角色,但是在比赛过程中,或者甚至是单人比赛中,球员都可以交换位置。其他玩家和大多数粉丝都认识到这种情况何时发生,现在,多亏了多代理模仿学习的新工作,计算机也是如此。
迪士尼研究院,加州理工学院和体育数据供应商STATS的研究人员利用深度学习技术开发了一种算法,可以在分析玩家跟踪数据时自动识别团队的形态。
“据我们所知,这是第一次采用模仿学习方法来共同学习大规模的合作多智能体政策,”迪士尼研究的研究科学家Peter Carr说。
他指出,从体育分析的角度来看,这可以使机器更好地分析每个运动员在足球,篮球或其他团体运动中的表现,了解运动员如何相互协调以转变角色。
迪士尼研究副总裁Markus Gross表示,“这项新功能的应用远远超出了体育运动。” “这些包括机器人运动,自动车辆规划和集体动物行为建模。”
该团队于8月8日在澳大利亚悉尼召开的国际机器学习大会上发表了研究结果。
加州理工学院计算与数学科学助理教授Yisong Yue表示,多智能体学习并不是新的,但与传统的监督学习和单一代理强化学习相比,进步是适度的。他补充说,这是可以理解的,因为问题的复杂性和历史上缺乏数据来源和实验性测试平台。
“像STATS这样的组织积累的大量体育跟踪数据现在使得计算机可以通过观察一群人在行动中学习 - 所谓的多智能体模仿学习,”数据科学主任Patrick Lucey表示。 STATS。
在今年早些时候在麻省理工学院体育分析会议上发表的工作中,迪士尼,加州理工学院和STATS团队证明,计算机可以根据攻击团队的行动来指出防守球员的位置,并确定防守队员失控的场合。通过这项最新工作,计算机不再需要人类识别正在使用的地层。相反,该算法能够从跟踪数据中自动识别玩家角色 - 以及他们在游戏过程中如何改变。
为此,Yue解释说,研究人员通过使用深度学习,强大的机器学习技术,使用称为神经网络的大脑启发程序,将单一代理模仿学习方法扩展到多智能体领域。但直接将深度学习应用于问题并不足以解决问题。
“如果我们将原始跟踪数据输入神经网络,它就无法学习一套适当的政策来识别地层,”加州理工学院博士生Hoang Le说。“在每个时间步骤重新索引玩家,以便数据以反映团队基础形成的一致顺序排列,这是我们的主要见解。” 在过去,这是手动处理的,但研究人员能够设计出一种新的学习方法,可以自动执行重新索引,使计算机能够学习基础构造。
在一项涉及45个欧洲职业足球队比赛数据的实验中,研究人员使用该算法来学习每支球队所使用的角色组合,然后推断出哪个球员正在履行每个角色(不包括守门员)。他们发现它大大优于传统的模仿学习方法。
研究人员还在捕食者 - 猎物模拟游戏中进行了实验,其中四个捕食者和一个猎物位于网格上。捕食者必须协调他们的行动,以便在最短的时间内捕获猎物。Le指出,该算法很快就接近了专家的表现,远远超过了非结构化的多智能体模仿学习方法,这种方法往往无法捕获猎物。
作为该出版物的一部分,STATS发布了跟踪数据,以推动多代理学习的进一步研究,Patrick Lucey指出。
结合创意和创新,这项研究延续了迪士尼利用技术来增强未来工具和系统的丰富遗产。