Robocup3D仿真机器人截球技术的研究
摘 要۵:在Robocup3D仿真机器人世界杯足球比赛中,仿真机器人球员技术动作设计的优劣在很大程度上决定了球队的强与弱,本文研究了Robocup3D仿真机器人截球技术,将BP神经网络技术应用到截球动作中,通过实验发现,采用该方法使得截球成功率大大提高。
关键词:Robocup3D;机器人;截球;BP神经网络
0 引言
机器人世界杯足球比赛简称Robocup,Robocup3D仿真比赛近似于人类足球比赛,克服了机器人硬件的多方面限制,解决了很多现阶段硬件无法实现的功能,所以对多智能体系统(MAS)和分布式人工智能(DAI)的理论研究具有深远的影响。在Robocup3D仿真比赛系统中,每个机器人体系结构包括世界模型、通信、高层决策、动作模型等模块。其中动作模型中截球技术的优劣对整个Robocup3D仿真比赛的结果具有重要的影响。本文将仿真机器人截球技术分为两种情况,一种为远距£离截球,另一种为近距离截球,将BP神经网络应用到远距离截球技术中,采用该方法缩短了截球时间,提高了截球成功率。
1 Robocup3D仿真系统简介
1.1 Robocup3D仿真系统结构
采用Client/Server方式设计RoboCup3D仿真机器人足球比赛系统,由监视器和客户端、服务器端组成该系统。对真实的物理三维世界的模拟可以由Robocup3D仿真环境实现,该系统主要对服务器的通信、基本动作及其决策、对球员的感知等基本功能模块进行了研究。图1为仿真系统结构示意图。
Robocup3D截球技术的研究目标是要确定球员最佳截球点,无论球距离自身距离为多远,球员都可以拦截到球。最佳截球点由仿真足球的当前位置信息以及速度信息确定,接下来使球员以最快的速度运动到该最佳截球点,从而在比赛中获得对球的掌控权。通过一些基本动作指令,例如转身指令、加速指令等,在实时分析球场信息之后,使得球员以最快的速度到达改最佳截球点。因为预测时间对于预测足球位置的精确度影响很大,如果能一两个周期内完成预测则相对精确,如果足球距离自身位置越远,那么球员到达截球点的时间就越长,越不能精确预测足球的位置,下面将机器人截球技术分为两种情况研究,一种为远距离截球技术,另一种为近距离截球技术。
2 近距离截球技术
3 远距离截球
3.1 判断截球点
采用解析法进行远距离截球,预测出第i个周期后足球的位置信息p,然后设计出截球分析函数,对球员到达该位置p所需要的周期数进行计算,如果该周期数小于i,则表示能够截到球,函数输出截球所需周期数i以及截球点。
该方法的算法流程图如图2。
3.2 采用BP神经网络训练截球
截球点确定之后,一般情况下采用尝试的方法来确定采取dash和turn这两个动作指令中的哪一个,这样就导致截球效率低,也就是说即便得到了截球点也可能截不到球。为了避免出现这种情况,在截球技术中使用人工智能技术,其中神经网络技术计算简单,适用于连续空间,采用神经网络训练截球动作能够满足Robo∞cup比赛的实时性要求。BP神经网络是现在比较成熟并且应用较多的神经网络模型,该模型的基本思想是通过对输入信号Xi进行非线形变换得到输出信号Yk,并且是通过隐层点使得输入信号作用于输出信号,由期望输出量t、输入向量X、以及期望输出值t与网络输出值Y之间的差值组成每个网络训练样本,对输出节点与隐层节点之间的联接强度以及阈值、还有隐层节点与输入节点之间的联接强度值进行调节,经过不断的调节使得误差能够沿着梯度方向不断降低,在不断的训练学习之后,得到与最小误差相关的阈值和权值。采用该训练好的神经网络对同类的样本输入信息进行训练,自动得到输出误差最小的信息。训练截球技术选取的是三层BP神经网络,其结构模型如图3所示。
图3中,将球速方向、球的方向、球距自身距离、球员速度方向和大小、球速大小作为截球BP神经网络的输入量。成功截球采取的动作为输出量,可♡采取的动作为dash和36个方向turn。网络传递函数: 。对上述样本数据进行训练,得到训练好的神经网络,用来进行截球。
4 实验结果及分析
4.1 实验环境与条件
4.2 结果分析
设定最小均方误差为0.005,BP神经网络的样本数据为30场Robocup3D足球仿真比赛中的500个截球动作序列。学习训练之后网络逼近均方误差约为0.00532。训练后得到的误差曲线如图4所示:
训练好神经网络之后,将该♥基于BP神经网络的截球算法在RoboCup3D仿真比赛中采用该基于BP神经网络的截球算法。通过编写代码在到仿真机器人截球程序中加入BP神经网络,对100次截球情况进行分析,进行多次仿真比赛后,得到截球效果对比表。
实验结果表明,在截球技术中采用BP神经网络技术,缩短了截球时间,提高了截球成功率。