公开羽毛球视频的结构化分析
公开羽毛球视频的结构化分析

公开羽毛球视频的结构化分析

数据演示
  几乎每场重大赛事的体育视频数据都会被记录下来,但至今「18年」依然无法用于大规模数据挖掘和分析。因为对羽毛球这项运动中的诸多分析任务打标签实在是太耗时了。在这项工作中,作者提出了一个端到端的框架,用于运动视频的自动属性标记和分析。
  这篇文章针对羽毛球比赛视频,首先分割成不同的rally,也就是将每颗球切分,然后跟踪和识别每个击球帧的球员,并注释他们各自的羽毛球击球动作。文章对 20 名球员的 10 场奥运会比赛的表现进行了评估,取得了 95.44% 的点分割准确率、97.38% 的球员分数预测准确率、97.98% 的球员识别准确率和 80.48% 的击球分割检测分数。
  作者设计实验证明了:仅通过自动注释的视频数据,就可以进行羽毛运动的多种分析,例如球员的反应时间、速度和球场周围的步法等。

end2end框架

框架

bounding box

  模型专注于两名球员的“单打”羽毛球比赛。在比赛视频常见的视角中,一名球员在靠近摄像机的位置,而另一名球员在远处,分别称为底部和顶部球员。在每场比赛中为两名球员随机采样和注释 150 个带有边界框(bounding box)的帧,并将其用于球员检测任务。
boundingbox和stroke

stroke

  stroke是“击球”在运动建模中的术语,这里分成了五个类别:发球(serve)、正手(forehand)、反手(backhand)、高球(lob)、杀球(smasj)。没有在击球的帧则直接标注为react。

自动化分析数据范畴

Point Segmentation

  清理无用数据:镜头特写、回放、非头顶视角等均属于无用视频数据,需要清理掉。以镜头的横移突变为检测特征进行识别。

Player Tracking and Identification

  使用FasterRCNN识别bounding box中的球员。

Player Stroke Segmentation

  识别击球帧,击球帧与非击球帧具有明显的动作上的差别,很好识别,作者设计了encoder-decoder的cnn网络识别这件事。

发表回复

您的电子邮箱地址不会被公开。