ShuttleNet: Position-Aware Fusion of Rally Progress and Player Styles for Stroke Forecasting in Badminton
简介
运动建模的需求不断增加,从各种角度激发了一系列富有成效的研究,例如健康状态监测、比赛结果预测。在这篇文章中,作者专注于客观地判断对手回球的动作和位置,这个问题在回合制的运动中还没有被研究过。通过将击球预测建模为序列预测任务,基于现有的模型就可以解决该问题。额外的任务只是根据羽毛球的特点对信息进行建模。为了解决这些限制,作者提出了一种新颖的融合机制,即运动员风格和赛程位置感知融合的深度学习预测模型 ShuttleNet,它通过两个改进的编码解码器将比赛中球的位置信息和运动员的信息结合了起来。作者在羽毛球数据集上进行的大量实验表明,ShuttleNet 明显优于最先进的方法。最重要的是,该文为击球预测问题提供了一个有效的分析场景。
问题形式化
令 R=\{S_r,P_r\}
表示历史上所有的rally,rally 表示每颗球。其中,S_r=((s_1,a_1),...,(s_{|S_r|},a_{|S_r|})
表示一颗球的击球序列,而 P_r=(p_1,...,p_{|S_r|})
表示这颗球的击球者的一个交替序列。如图所示,s_i
表示击球的类型,a_i
表示击球的目标位置。作者将击球预测问题形式化为在已知 S_\tau
和 P_\tau
的情况下,对 (s_i,a_i)_{i\geq\tau+1}
的预测。
预测模型ShuttleNet
如图所示,框架总共包含五个主要部分,分别是:嵌入层、两个信息提取层、信息融合层、输出层。黄色部分中基于 Transformer 的rally提取器 (TRE) 将一颗球的上下文信息串联在一起。绿色的基于 Transformer 的运动言提取器 (TPE) 生成两个远动员各自的上下文并共享同一组参数。rally的上下文信息和两名运动员的信息都被送入位置感知门控融合网络 (PGFN),以预测未来的击球序列。
Embedding Layer
作者将击球的动作类型、区域位置以及双方运动员都嵌入到低维的空间向量中,作为transformer的输入。运动员的embedding相当于一个偏置,会被直接添加到动作和位置上,用于对击球者进行一个区分。
Transformer-Based Rally Extractor (TRE)
TRE的输入是原始的rally序列,也就是它的embedding中不包含运动员信息。并且这里添加了一个注意力机制,用于区分在前面发生的所有击球中,哪一次是重要的。
Transformer-Based Player Extractor (TPE)
TPE的输入是考虑了运动员信息的rally序列,这里主要是帮助模型区分开一个rally中的所有stroke到底属于哪个运动员。
Position-Aware Gated Fusion Network (PGFN)
这个主要就是一个信息融合模型,经过前面的信息提取,我们得到了三个特征,分别是:两个运动员的信息和rally的信息。这个地方主要使用到注意力机制和gated机制,这些其实都是用来对序列化的信息的重要性进行评估的微分手段。
Prediction Layer
输出的层。