基于MLP和LSTM多因素网球比赛中动量波动胜负趋势模型研究

贠欣欣 ,  冯孝周 ,  邢润强 ,  任笑笑 ,  时华 ,  胡凯

内蒙古师范大学学报(自然科学版) ›› 2025, Vol. 54 ›› Issue (02) : 188 -197.

PDF (2749KB)
内蒙古师范大学学报(自然科学版) ›› 2025, Vol. 54 ›› Issue (02) : 188 -197. DOI: 10.3969/j.issn.1001-8735.2025.02.010

基于MLP和LSTM多因素网球比赛中动量波动胜负趋势模型研究

作者信息 +

MLP and LSTM Based Modeling of Momentum-fluctuating Win/Loss Trend in Multi-factor Tennis Matches

Author information +
文章历史 +
PDF (2814K)

摘要

通过深入分析部分温布尔登网球公开赛男子组决赛的比赛数据,探讨网球比赛中势头变化的现象,并创建了一套新的综合胜率指标和发球方优势指标,利用这些指标构建势头模型,预测比赛的胜负并制定更科学合理的战术和训练策略。首先,对数据进行处理并对特征进行筛选和创建,构建Momentum模型评价指标体系;然后,通过分析比赛中的波动与连续成功之间的关系,发现相关性显著;最后,综合考虑多方面因素,提出一种基于多层感知机模型与长短期记忆网络的组合预测模型,结合多层感知机(multilayer perceptron,MLP)的特征学习能力强与长短期记忆网络(long short-term memory,LSTM)预测精度高的优点,对比赛波动趋势进行高效精准预测,构建M⁃LSTM模型预测比赛动态变化和胜负趋势,并使用Shap值方法可视化特征重要性,结果显示模型可以很好捕捉比赛的大体趋势,预测最终结果,对相关科学研究和网球运动的发展具有重要的参考意义。

Abstract

This study delved into the phenomenon of momentum change in tennis matches by analyzing in depth the match data of some Wimbledon men's finals. Further, it created a new set of comprehensive win rate indicators and serve-side dominance indicators and used these indicators to build a momentum model, so as to predict the winners of the matches and formulate more scientific and reasonable tactics and training strategies. First, the momentum model evaluation index system was constructed after data processing and screening and creation of features. Then, analysis was made on the relationship between fluctuation and consecutive success in the matches, revealing a significant correlation. Finally, considering multiple factors, the study proposed a combined prediction model based on a multilayer perceptron (MLP) model and a long short-term memory (LSTM) network. Combining the strong feature learning ability of MLP and high prediction accuracy of the LSTM network, the proposed model realized efficient and accurate prediction of the match fluctuation trend. Besides building the M-LSTM model to predict the dynamic changes of the matches and the trend of winning and losing, this study also used the Shap value method to visualize feature importance. The results showed that the model can capture the general trend of the matches and predict the final results well, which provided significant reference for related research and tennis development.

Graphical abstract

关键词

网球运动 / 深度学习 / 综合胜率指标 / M⁃LSTM模型 / Shap值

Key words

tennis / deep learning / comprehensive win rate indicators / M-LSTM model / Shap value

引用本文

引用格式 ▾
贠欣欣,冯孝周,邢润强,任笑笑,时华,胡凯. 基于MLP和LSTM多因素网球比赛中动量波动胜负趋势模型研究[J]. 内蒙古师范大学学报(自然科学版), 2025, 54(02): 188-197 DOI:10.3969/j.issn.1001-8735.2025.02.010

登录浏览全文

4963

注册一个新账户 忘记密码

网球比赛作为一项全球性的体育运动,不仅在体育竞技层面上吸引着无数观众的目光,同时也因其商业资本的密集性而备受商业界关注1。职业网球每一场比赛都可能涉及巨额的奖金、赞助合同及媒体转播权2,这些都使比赛的胜负预判变得尤为重要。
一个准确的胜负预判可以帮助球员更好地制定比赛策略34,优化训练计划,甚至影响其在比赛中的自信心和士气。因此,预测比赛结果中一个常被讨论的概念是“Momentum”。Momentum的积累能够提升球员的自信心,从而可能改变比赛的走向,也可通过分析球员过往比赛的数据,识别球员在关键时刻的表现57,以及在面对逆境时如何调整心态和战术8,从而帮助球员在比赛中更好地把握Momentum9。因此,通过对Momentum的深入理解和有效训练,教练能够帮助球员在比赛中发挥出最佳状态10,提高获胜的概率,进而取得成功。
基于此,本研究通过对比赛过程的数据分析建模,引入一系列模型,如关于球员获胜的综合评价指标1113、发球方优势以及两者结合的“Momentum率”模型等,深入探讨比赛中Momentum的变化14,理解网球比赛中的动力变化现象15。同时,通过验证Momentum的随机性,本研究将推动对运动动力学的深入理解,并为未来类似研究提供方法学参考16,促进跨学科的合作研究。

1 研究对象与数据处理

1.1 研究对象

以2023年温布尔登网球公开赛男子组决赛的比赛数据为研究对象。

1.2 数据处理

1.2.1 特征的创建及筛选

对原始数据特征的分析后发现数据存在局限性,未能深入捕捉球员表现。通过实验和验证,逐步调整和优化特征,提高模型的预测性能。从发球方优势、技巧能力、得分能力和心理耐力等维度整理特征,并创造新特征以丰富模型的预测维度(表117

在进行特征构建后,需要量化分析特征对模型性能的影响18。通过计算球员1和球员2的Momentum波动值与各特征之间的互信息值,选择互信息值最小的7个特征进行展示和可能的剔除,见表2

表2可知,Sw(P1)Sw(P2)N(P1)N(P2)DfP1)DfP2)、WgP1)WgP2)这几个特征对于模型捕捉玩家1和玩家2的Momentum波动情况帮助不大,因此将这些特征剔除。

1.2.2 Momentum指标的建立

本研究通过回合胜率、局胜率、盘胜率先构建了一个综合胜率指标(comprehensive win index,CWI),可以同时描述每一盘、每一局和每一回合的综合获胜情况,而不局限于单一层面的视角(PnGnSn 分别代表正在进行第几回合,第几局,第几盘)。运动员的综合胜率指标PCWI定义为

PCWI=WnPn+WgGn+WsSn

由于发球的一方赢得比赛的概率要高,所以必须将这一因素考虑到模型中。因此建立了一个发球方优势指标(server⁃side advantage indicator,SAI)。发球方优势是发球员的特有优势,即在该球员发球的情况下,球员才可能会拥有发球方优势指标的加成,在现有的数据中,有三个和球员发球直接相关的评判指标:ACE率、一发得分率、二发得分率。若球员通过这三个指标得分,即可认为发球方优势在这分中起到了正面作用。发球方优势指标定义为

PSAI=ArPn+WoPn+WtPn

最后,本研究构建了一个以综合胜率指标(CWI)和发球方优势指标(SAI)为核心参数的Momentum模型19。公式定义为

PM=S(PCWI+PSAI)

其中,S为sigmoid函数。通过将这两个关键性能指标以加和的形式纳入sigmoid函数,输出范围映射在0~1,可有效量化并凸显出比赛进程中运动员的优势及其对整体胜率的影响20

2 模型的建立与求解

2.1 模型的建立

(1)多层感知机模型(multilayer perceptron,MLP)

MLP是一种基础且广泛应用的前馈型人工神经网络模型,一般包含三个主要部分:输入层、隐藏层和输出层。人工神经网络通过激活函数来转化输出,使其幅度范围缩小到有限值,数学表达式为

yk=φj=1mwkjXj+bk

式中,yk为模型预测值;φ为激活函数;wkj为权重值;m为隐藏层个数;Xj为输入值;bk为模型截距。

多层感知器神经网络不同层之间全连接,在输入层有M个神经元,则第1个隐藏层的输出表达式为

O1,k1=φm=1Mwm,k1Xm,k1=1,2,K1

式中,O1,k1为模型第一个隐藏层的输出值;M为输入层神经元的数量;wm,k1为输入层和隐藏层神经元之间的权重。

该输出可作为下一个隐藏层的输入,隐藏层中任意神经元的输出表达式为

Oh,kh=φh=2NWkh-1Oh-1,kh-1

式中,Oh,kh为模型后面隐藏层的输出值;Wkh-1,kh为第h-1隐藏层和第h隐藏层神经元之间的权重;N为隐藏层个数。

输出层神经元通过对最后一个隐藏层加权求和得到,其表达式为

y1=kN=1KNWkN,lON,kN,l=1,2,L

式中,y1为模型输出值。

(2)长短期记忆网络(long short-term memory model, LSTM)

LSTM由输入门、遗忘门和输出门组成。LSTM的核心创新在于其独特的细胞状态机制以及引入了“门”结构来控制信息流动。通过这些门控机制,LSTM能够在训练过程中精确保留远距离依赖关系的关键信息,同时避免无关或冗余信息的影响,从而解决了梯度消失和梯度爆炸的问题。网络结构如图1所示。

遗忘门ft决定从神经元中丢弃什么信息,该门会读取ht-1xt,输出一个0~1的数值。如果输出值为1,表示完全保留,0表示完全丢弃,遗忘门的公式为

 ft=σWf×ht-1,xt+bf

输入门it决定了xt中哪些新的输入可以存储在神经元中,输入门的公式为

it=σWiht-1,xt+bi
Ct¯=tanhWcht-1,xt+bc
Ct=ft×Ct-1+it×Ct¯

输出门用于控制神经元状态的输出并将状态转移到下一个神经元,输出门的公式为

Ot=σWoht-1,xt+bo

其中,Wobo分别为对应的权重矩阵和偏差向量。

最后,通过运行sigmoid函数来确定神经元状态的输出部分,神经元状态通过tanh进行处理后和sigmoid的输出相乘,最终输出部分计算公式为

ht=Ot×tanhCt

(3)M⁃LSTM综合模型的建立

在时间序列分析中,某些特征可能不具备明显的时间特性。为解决这个问题,在输入数据进入LSTM层前,添加MLP层以捕捉缺乏明显时间特征的特征,以增强模型对非时间相关特征的学习能力21。具体过程如图2所示。

2.2 模型的求解

基于本研究创建的模型,利用Shap(shapley additive explanation)处理模型是模型可解释性的一种方法。Shap将Shapley值表示为一种加性特征归因方法(additive feature attribution method),将模型的预测值解释为二元变量的线性函数:

gz'=0+Mizi'

每个特征的Shap值表示以该特征为条件时预期模型预测的变化。对于每个功能,Shap值说明了贡献,以说明实例的平均模型预测与实际预测之间的差异。当fx_i,1>0,说明该特征提升了预测值,反之,说明该特征使得贡献降低。

Shap值是指在对每个特征进行条件化时,模型预测值的预期变化。可以解释如何从不知道任何特征时预测的基础值Efz到当前输出fx

fxz'=fhxz'=Efz|zs

其中sz'中非零索引的集合,由于大多数模型无法处理任意模式的输入值缺失,用Efz|zs来近似fzs

精确计算Shap值很难,但可以结合加法特征归因方法近似,使用这些方法时,特征独立性和模型线性是两个可选假设22,在Shap解释模型简化输入映射且假设特征独立与模型线性的基础上,可简化预期值的计算:

fhxz'=Efz|zs=Ezs¯zsfzEzs¯fzfzs,E(zs¯)

3 实验及结果分析

3.1 实验过程分析

(1)Momentum指标分析

分析两场具有代表性的比赛,在得到整体趋势后12,进一步具体地确定哪位球员在比赛中的某个特定时间表现更好及程度。具体如图3-4所示。

图3可知,2023 wimbledon⁃1309的比赛分为四盘。第一盘,Quentin Halys先领先,但Jannik Sinner逐渐反超,最终Quentin Halys险胜。第二盘,Jannik Sinner反超并获胜。第三盘,双方势均力敌,但Jannik Sinner在关键时刻取得胜利。第四盘,Jannik Sinner继续领先并最终获胜。整场比赛表现显示,比赛进展与Momentum图表现相符,凸显了Momentum与球员的获胜具有强相关性。

图4可知,2023 wimbledon⁃1316的比赛,其中Novak Djokovic在比赛初期以及整场比赛中始终保持了Momentum上的优势。他在第一盘的表现尤为突出,通过连续的制胜分和高水平的发球表现,成功掌控了比赛节奏,最终以3∶0的比分获胜。通过比赛数据和Momentum图分析,证实了动能与球员获胜之间的密切关系。

(2)Momentum波动分析

为分析运动员在新的比赛中对阵不同球员的差异23,本研究绘制了同一位选手在不同比赛时势头波动的变化图,如图5所示。

图5发现,该选手在比赛中Momentum率基本比较稳定,但会重复出现有规律的Momentum率上下波动。通过对该球员三场比赛数据的分析,发现该球员在发球时,连胜的概率较高,他在连胜时的动量明显上升,导致前一场比赛中动量高于其他比赛的现象。综合分析,该球员在比赛中的Momentum波动与发球稳定性、连胜时的心理状态等因素密切相关。建议球员提升发球技巧,关注连胜时的心理状态,并适应动量的波动,同时重视身体状况管理。

3.2 实验结果分析

(1)M⁃LSTM模型的训练与测试

原始数据的形状为(7 283,46),在进行特征创建、特征筛选、数据切片和数据填充的流程后,得到的数据形状为(62,337,24),表示按照每位球员进行划分,共有62场比赛(match),其中每场比赛在填充后共有337个回合,并且每个回合有24个特征。

首先,数据被划分成训练集和测试集,其中训练集占80%,测试集占20%。模型使用均方误差(MSE)损失函数来衡量预测值与真实值之间的差异。模型采用了深度学习框架Pytorch,包括3个MLP层用于捕捉通用特征,每个MLP层使用relu函数作为激活函数,随后是2个LSTM层,每个包含50个神经元。模型使用Adam优化器进行参数更新,学习率为0.001,总共进行了100个epoch的训练。最后,模型的性能在训练集和测试集上进行了评估。结果如图6所示。

图6可知,模型损失曲线平滑,且都收敛到了一个较低的损失值,说明模型性能很好。同时,模型在训练集和测试集上都有很接近的损失,说明模型未出现过拟合现象。因此,训练后M⁃LSTM是一个性能良好的模型。

(2)基于Shapley值的模型结果分析

根据Shap方法,本研究使用训练集中的数据作为Shap方法的输入,对训练后的M⁃LSTM模型的特征重要性进行可视化,以此判断哪些因素与Momentum波动最相关24。这里使用球员1的数据进行可视化,结果如图7所示。

图7只展示了Shap值前20的特征,其中最显著的与Momentum波动相关的特征是WPWn,他们都表示了球员在某一回合的获胜情况,这说明球员的回合获胜情况与Momentum的波动最相关。其次,与Momentum波动较为相关的特征是WsWgWn/Pn和PCWI,这些特征都反映的是每一盘、每一局或整体的胜率,说明盘和局的胜率也会在一定程度上影响Momentum的波动。

(3)利用案例测试模型

为了进一步测试模型的效果,本研究选择测试集中的几个案例来分析模型预测值与实际值的差异情况25。本研究选择了两个案例,具体结果如图8-10所示。

本研究分别比较2023 wimbledon⁃1308、1404、1501这三场的预测结果,发现模型可以很好地捕捉整体变化趋势,最终的预测结果趋势与真实结果的趋势基本相近。模型预测的精度还存在一定的偏差,本研究认为可能是由于模型本身的学习能力限制所致,特别是LSTM模型更适合处理长期时间序列数据,而当前的比赛数据并不具备长期性。因此,建议在未来采用学习能力更强的模型26,如Transformer模型或引入注意力机制的LSTM模型,以提高预测的准确性和波动性的捕捉能力。

4 结论

世界职业网坛发展迅速,球员在比赛中的表现不断提升,竞争日益激烈。对职业网球比赛过程中的影响因素及胜负的研究,受到越来越多的重视。网球比赛结果的预测与分析领域,以往研究多聚焦于单一变量对比赛结果的潜在影响。如Vaverka等28分析了球员身高对发球效果的具体影响,Cui等26研究了球员的比赛经验如何影响比赛的最终走向。然而,由于网球运动本身的复杂性,单一因素的研究方法往往难以全面解释比赛结果的多样性和复杂性。因此,为更深入理解网球比赛结果的成因,需要采用更为全面和综合性的评估方法23,综合考虑多种因素的相互作用和累积效应。

本文通过研究网球比赛中非技术性因素“动力”的关键作用,提供了针对性的心理与生理准备策略,以帮助球员更好地处理比赛中可能影响进程的关键事件。同时,研究中创建了一个综合胜率和发球方优势的指标,通过可视化和皮尔逊系数等方法分析了其与成功指标的关系。建立了一个模型来预测比赛中的波动,考虑过去比赛Momentum的差异,为球员提供对阵不同对手的建议。模型评价结果与真实结果的趋势呈中高度相关,该模型具有较高的效度,模型以定性和定量评价相结合方法对球员的整体水平进行综合评价,也能够对单一球员的Momentum波动进行图形化表达。因此,运动员Momentum波动评价模型能够为各级运动员选材提供一套可靠的评价工具。研究结果表明,“动力”不仅影响运动员的竞技状态和决策质量,还在比赛关键时刻决定走向。通过科学的动力管理,有助于提高球员在压力环境下的适应能力和竞技表现。

为更好地让球员应对网球比赛中影响比赛进程的事件,建议后续研究过程中增加包括动力培养与维持、动力调控策略、动力与技能结合训练以及动态动力管理等方法。科学合理的动力管理与利用对提升球员竞争力至关重要,建议教练根据团队实际情况制定个性化的动力管理和训练方案。

参考文献

[1]

李国立. 2013年中国网球公开赛女子单打比赛制胜指标的模型建立及评价[J]. 河南师范大学学报(自然科学版)201442(1): 180-184.

[2]

陈国豪. WTA选手比赛技战术应用数据统计研究:以2013、2014、2015年四大满贯为例[D]. 南昌: 江西师范大学, 2016.

[3]

谢相和. 草地女子单打网球运动员制胜指标分析及评价[J]. 成都体育学院学报201238(2): 74-78.

[4]

邢晓圆, 郭开强, 陈万军, . 对2006年澳大利亚网球公开赛女单选手技战术指标的统计分析[J]. 辽宁体育科技200628(6): 59-60.

[5]

邢晓圆, 郭开强, 陈万军, . 对中国女网单打选手参加06、07年“大满贯赛事” 的实力分析[J]. 吉林体育学院学报200824(1): 57-58.

[6]

修霆喆, 于红妍, 黄雯妍. 基于BP神经网络的乒乓球优秀女子单打比赛结果预测模型构建及仿真应用[J]. 哈尔滨体育学院学报202442(2): 89-96.

[7]

黄志颖. 基于BP神经网络的网球比赛成绩预测模型研究[D]. 福州: 福建师范大学, 2022.

[8]

任波. 李娜与世界优秀女子网球运动员的技术统计分析:以2013年四大满贯、中网、WTA年终总决赛为例[J]. 体育科技文献通报201422(3): 66-68.

[9]

芮正斌. 男子职业网球选手单打比赛制胜特征的初步研究[D]. 成都: 成都体育学院, 2018.

[10]

郭立亚, 袁毅, 关晓燕, . 世界顶级网球男子单打比赛制胜技术因素分析[J]. 北京体育大学学报201033(2): 122-124.

[11]

高徐, 田广. 世界优秀红土场女子单打网球运动员制胜指标及实力评价[J]. 西南师范大学学报(自然科学版)201439(4): 198-204.

[12]

刘畅.优秀男子单打网球运动员在三种场地技战术水平评价模型的构建与应用[D]. 北京:北京体育大学,2020.

[13]

张霄飞. 世界优秀男子网球运动员关键分发球落点特征分析[D]. 广州: 广州体育学院, 2019.

[14]

郭文霞. 硬地网球男子单打比赛战术诊断指标体系构建与应用[D]. 北京: 北京体育大学, 2018.

[15]

李晓琨. 优秀男子网球选手硬地比赛每盘前四局与八局以后技术指标研究[D]. 北京: 北京体育大学, 2013.

[16]

罗溢杰. 世界优秀男子网球运动员硬地赛事“关键分” 技战术分析[D]. 长沙: 湖南师范大学, 2012.

[17]

彭浩.世界优秀男子网球运动员在关键分中得失分技战术运用特征研究[D].上海:上海体育学院,2022.

[18]

李奕峰. 2016年澳网前八名男子运动员技战术特征的研究[D]. 苏州: 苏州大学, 2017.

[19]

朱文富. 体育比赛结果预测模型的尝试性研究[J]. 重庆工商大学学报(自然科学版)201128(3): 318-321.

[20]

郭文霞, 赵广涛. 网球比赛技战术效能评估模型构建与应用[J]. 河南师范大学学报(自然科学版)201846(2): 117-124.

[21]

张潮. 影响中国女子网球单打技战术因素的因子分析[J]. 体育科技文献通报201422(11): 51-52.

[22]

付饶, 孙卫星. 硬地女子网球双打比赛三项指标实力评估法的建立与应用[J]. 中国体育科技200844(4): 79-83.

[23]

蒋婷, 李庆. 职业网球赛事男子单打比赛胜负影响因素研究:基于2014—2018年四大满贯赛事[J]. 中国体育科技202157(7): 62-68.

[24]

DEL CORRAL JPRIETO-RODRÍGUEZ J. Are differences in ranks good predictors for Grand Slam tennis matches?[J]. International Journal of Forecasting201026(3): 551-563.

[25]

CROSS RPOLLARD G. Grand Slam men's singles tennis1991-2009: Serve speeds and other related data [J]. ITF Coaching & Sport Science Review200916(49):8-10.

[26]

CUI Y XGÓMEZ M ÁGONÇALVES Bet al. Effects of experience and relative quality in tennis match performance during four Grand Slams[J]. International Journal of Performance Analysis in Sport201717(5): 783-801.

[27]

CUI Y XGÓMEZ M ÁGONÇALVES Bet al. Clustering tennis players' anthropometric and individual features helps to reveal performance fingerprints[J]. European Journal of Sport Science201919(8): 1032-1044.

[28]

VAVERKA FCERNOSEK M. Association between body height and serve speed in elite tennis players[J]. Sports Biomechanics201312(1): 30-37.

基金资助

陕西省社会科学基金资助项目“混合战争视域下人工智能武器的风险评估及治理研究”(2023E012)

陕西省哲学社会科学研究专项青年资助项目“认知战对我国海外利益的威胁及应对研究”(2024QN176)

AI Summary AI Mindmap
PDF (2749KB)

313

访问

0

被引

详细

导航
相关文章

AI思维导图

/