由于不列颠哥伦比亚大学研究人员开发的里程碑算法,计算机角色和最终的机器人可以学习复杂的运动技能,如步行和跑步试验和错误。
UBC 计算机科学教授Michiel van de Panne 今天在SIGGRAPH 2017上展示了这项研究,他是世界上最大的计算机图形和交互设备,他说:“我们正在创造身体模拟的人类,学会通过周围的环境来学习技能和灵活性。” 技术会议。“我们正在教授计算机角色学习如何回应他们的环境而不必手动编写所需的策略,例如如何通过移动障碍来保持平衡或规划路径。相反,这些行为可以被学习。”
这项名为DeepLoco的作品提供了一种在游戏和电影中动画人体运动的替代方法,而不是使用演员和动作捕捉相机或动画师的当前方法。DeepLoco允许角色自动移动,既实际又注意周围环境和目标。将来,两条或四条腿机器人可以学习如何在其环境中导航,而无需手动编写适当的规则。
使用他的算法,模拟人物学会沿着狭窄的路径行走而不会摔倒,以避免撞到人或其他移动的障碍物,甚至将足球运球朝向球门。
该方法深入使用深度强化学习,这是一种机器学习算法,通过反复试验获得经验,并通过奖励获知。随着时间的推移,系统会逐步确定在特定情况下要采取的更好的行动。
“这就像学习一项新运动,”van de Panne说。“在你尝试之前,你不知道你需要注意什么。如果你正在学习滑雪板,你可能不知道你需要在你的脚趾和脚跟之间以特定的方式分配你的体重。这些都是最好学习的策略,因为它们很难以任何其他方式编码或设计。“
人类和动物的运动不仅受物理学的控制,还受制于控制。虽然人类通过反复试验来学习运动控制,但van de Panne说,很难说这种算法模仿了人类的学习过程。毕竟,计算机程序仍然比人类学得慢得多。他有孩子的时候就开始研究这种类型的运动学习问题; 他们现在是17岁和20岁。
“我清楚地记得想知道谁将首先学习敏捷步行和跑步技巧:我的儿子,女儿还是算法?” 他说。“我的儿子和女儿长时间击败了我。”