注:本内容由”数模加油站“ 原创出品,虽无偿分享,但创作不易。
欢迎参考teach,但请勿抄袭、盗卖或商用。
E 题 AI辅助智能体测
《国家学生体质健康标准》的颁布,有效地促进了大中小学生关注自身体质健康的发展,激励学生积极进行身体锻炼。通过在体育场地周边安装摄像头,可以对学生的体育动作进行实时捕捉,以便对学生的运动姿态进行分析。例如,在立定跳远教学中,通过记录并分析学生起跳瞬间的腿部发力动作、手臂摆动轨迹、身体腾空姿态以及落地姿势等一系列身体变化的细节数据,可以帮助教师全面了解每个学生动作的优点和不足,从而给出针对性的改进方案。
通过摄像头拍摄的图像,利用AI人体姿态估计技术可以定位复杂场景中小尺度人体的关键点位置。基于AI的人体姿态识别算法,可以对运动者的姿态进行跟踪,获得人体关键节点在运动过程中不同帧的运动视频和位置坐标信息。请建立数学模型,解决以下问题。
问题一、题意重述与数据理解
任务:给定两位运动者的跳远视频与逐帧关键点坐标(共 33 个关键点),判定起跳时刻与落地时刻,并描述滞空阶段(起跳至落地)的运动过程。
数据:附件 1 含“视频 + 位置信息 + 成绩”;位置信息为不同帧的 33 个关键点坐标(附件 2 给出关键点示意编号)。
目标输出:
- 精确帧号/时间的起跳与落地时刻;
- 滞空阶段的质心轨迹、速度/加速度、起跳角、初速度等运动学量及姿态演化(关节角、摆臂/屈髋策略)描述。
二、建模假设与坐标系 - 像素坐标系:视频坐标 ((x,y)) 以右向为正 x、下向为正 y(常见图像坐标),帧间隔 (\Delta t=1/f)((f) 为帧率)。
- 平面近似:以 2D 关键点为主(若有多机位/深度可扩展至 3D,但本题以 2D 为主)。
- 质心(COM)近似:用关键点的加权平均近似人体质心(无体段权重时可先用等权平均,若有体段比例可引入 Dempster/De Leva 权重,作为进阶)。
- 滞空阶段气动阻力忽略:COM 轨迹近似抛物线(像素尺度上仍成立);地面对脚部的接触判定由足部关键点运动学给出。
三、变量定义与数据结构
第 (t) 帧第 (i) 个关键点坐标:((x_{i,t},y_{i,t})),(i=0,\dots,32)。
帧时间:(t=n\Delta t),(n\in\mathbb{Z}{\ge0})。
质心:
等权近似:(\displaystyle x{COM,t}=rac{1}{N}\sum_{i=1}^N x_{i,t},\quad y_{COM,t}=rac{1}{N}\sum_{i=1}^N y_{i,t})((N=33))。
加权近似:(\displaystyle x_{COM,t}=rac{\sum_i w_i x_{i,t}}{\sum_i w_i},\quad y_{COM,t}=rac{\sum_i w_i y_{i,t}}{\sum_i w_i}),(w_i) 为体段质量权重(可按段映射到关键点)。
数值微分:
其中 (s_) 可为 (x_{COM},y_{COM}) 或特定关键点坐标。
四、预处理与信号平滑
为降低关键点抖动与遮挡噪声,建议:
- 置信度筛选(若数据含置信度 (c_{i,t})):低于阈值的点用插值/上次有效值替代。
- 空值插补:分段线性/三次样条。
- 平滑:Savitzky–Golay(窗长 (2k+1)、多项式阶 (d)),或三次样条/双向移动平均,兼顾不滞后与导数稳定。
- 时间同步:如存在多流数据,先对齐至统一帧号。
五、起跳与落地的多源判定策略(核心)
5.1 足部接触离地判据(主判据)
设左右脚关键点为 (\mathcal{F}L,\mathcal{F}R)(通常为“脚/踝/脚尖/脚跟”中的一个或多个;题给 33 点结构可由附件 2 对应到索引)。
组合足高:(\displaystyle y{foot,t}=rac{1}{2}ig(y{\mathcal{F}L,t}+y{\mathcal{F}_R,t}ig))。
像素坐标下 y 越大越靠下(近地)。
起跳(Takeoff):从支撑期转入腾空,表现为
- (y_{foot,t}) 在起跳前出现快速减小(脚上抬)——导数 (dy_{foot}/dt<0) 峰值;
- 与此同时,COM 竖直速度 (v_{y,COM}) 由向下转为向上或达到向上峰值附近;
- 接触指示(如脚部与地面距离增加/脚踝脚趾相对运动指示腾空)。
落地(Landing):从腾空回到接触,表现为 - (y_{foot,t}) 快速增大(脚下落)——导数峰值 (dy_{foot}/dt0);
- (v_{y,COM}) 由上升转为下降并在之后靠近 0;
- 足部与地面距离回到最小、足部速度骤降。
实现上,常用组合指标提高鲁棒性:
在前半段取 (S_t) 的负峰(起跳),在后半段取正峰(落地)。并通过时序约束(落地时刻起跳时刻+最小飞行帧数)避免误检。
5.2 地面参考与阈值化(辅判据)
若能从视频/场地标线估计出地面 y 坐标 (y_{ground}),则以
(\displaystyle d_{foot}(t)=y_{foot,t}y_{ground})
进行阈值化(如 (d_{foot}<arepsilon) 视为接触),接触非接触的边界即为起跳,非接触接触即为落地。
若无显式地面,取跑道/坑边缘等静态像素线自动估计 (y_{ground})(RANSAC 拟合直线)或以脚跟/脚尖最小 y的运行最小值曲线作代理。
5.3 速度/能量一致性校验
起跳帧附近:(v_{y,COM}) 应接近正峰前或从负转正的过零点;
落地帧附近:(v_{y,COM}) 负向且接近谷值后回升;
水平方向:(v_{x,COM})(或髋 (v_{x,hip}))在滞空期近似常值。
六、滞空阶段的动力学与几何量提取
设检测得起跳帧 (t_{to})、落地帧 (t_{ld}),滞空区间 (\mathcal{T}={t\mid t_{to}\le t\le t_{ld}})。
6.1 抛物线拟合(像素域)
对 ((t,y_{COM}(t))) 在 (\mathcal{T}) 内做二次拟合
有效“重力”像素加速度:(\hat g=2a)(像素标度 + 摄影几何嵌入其中)。
飞行时间:(T=(t_{ld}t_{to})\Delta t)。
水平速度:(\displaystyle v_{0x}pprox rac{x_{COM}(t_{ld})x_{COM}(t_{to})}{(t_{ld}t_{to})\Delta t})(或线性拟合 (x_{COM}) 对 (t) 的斜率)。
起跳角(像素域近似):
若能做尺度标定(如已知沙坑刻度/标线长度),将像素/帧米/秒,实现物理量化。
6.2 姿态时序(关节角)
以膝角为例,设髋膝踝三点为 \mathbf{H},\mathbf{K},\mathbf{A}:
滞空期内统计:
( heta_{knee}(t)) 的均值/极值/变化幅度;
手臂(肩–肘–腕)摆动角度与相位;
髋角(肩–髋–膝)反映屈髋抱膝策略。
七、可视化与结果呈现
- 足部 y–t 曲线(左右脚同图),标注起跳/落地竖线;
- COM 高度 y–t 与拟合抛物线;
- COM 竖直/水平速度–t;
- COM 轨迹 x–y(像素平面);
- 关键帧骨架图(起跳瞬间、滞空最高点、落地瞬间);
- 关节角–t(膝/髋/肩/肘)。
课堂演示时,建议将两位运动员的对应曲线同轴对比,便于讲评差异。
八、鲁棒性、边界情形与误差来源
抖动与遮挡:用置信度筛选 + 插值 + 平滑;对于短时遮挡,优先使用相邻关节的几何一致性重建(如胫骨长度近似常数)。
相机倾斜/透视:建议在跑道/沙坑边做单应性标定,把像素映射到“地面参考系”;至少做纵轴倾角校正,提高“高度/角度”解释性。
帧率低:起落时刻可落在两帧之间,报告帧级不确定度 (\pm0.5) 帧,并给出以 (\Delta t) 计的时间误差带。
不同人体比例:若使用等权 COM,会引入系统偏差;引入体段权重可减小误差。
阈值选择:足部接触阈值、导数峰检测阈值应通过留一交叉验证在训练组上确定,报告对阈值的灵敏度分析。
九、算法流程图与代码(可直接实现)
流程:数据读入 置信度/缺失处理 平滑 计算足部/COM 时序量 一致性峰值检测(起跳/落地) 滞空段拟合与参数估计 姿态角计算 可视化与报告。
代码部分:
问题二
-
研究目标与数据概览
目标:基于“纠正前/纠正后的姿态与成绩”和“个体体质特征”,找出显著影响跳远成绩的主要因素,并量化其重要性与边际效应。
数据
附件3:若干运动者纠正前、教练纠正姿势后的视频+关键点坐标+成绩(“成绩提升可较大幅度出现”提供天然干预前后对照)。
附件4:运动者个人体质报告(年龄、身高、体重、体脂率、肌肉/骨骼肌重量、水分、蛋白等体成分指标)。 -
整体方法论路线
- 特征工程(从姿态时序+体质报告中提炼“可生物力学解释”的中间变量);
- 模型建构(多层/半参数/稀疏回归 + 非线性树模),做变量筛选与稳健性对照;
- 因果与对照设计(利用前后纠正的配对结构控制个体固定效应,估计“姿态纠正”的平均处理效应);
- 可解释性(标准化系数、Elastic Net稀疏选变量、GAM平滑项、XGBoost/GBDT的SHAP重要性与PDP曲线);
- 稳健性检验(多重共线、留一被试交叉验证、敏感性分析)。
- 特征工程(核心)
3.1 来自姿态时序(每次试跳,纠正前/后各一条记录)
以问题一的流程为基础(起跳/落地检测、滞空段判定),从每条试跳的33关键点时序中得到运动学要素:
起跳/落地与飞行
滞空时间:
COM 初速度:,起跳角:
COM 抛物线拟合参数 与拟合残差 RMSE(动作稳定性代理)
动力学代理(相对量)
助力摆臂幅度:滞空期上臂(肩–肘–腕)角度的峰谷差、摆动功率代理(角速度/角加速度 RMS)
下肢伸展与抱膝:膝角 、髋角 的最大伸展角、抱膝期的最小角、角度变化速率
身体前倾/躯干角:颈–髋–膝(或肩–髋–脚)构成的躯干俯仰角平均值与峰值
对称与协调:左右臂/腿相位差、协方差(协调性度量)
时序到标量的汇总方式(对每条试跳):
统计量:均值/最大/最小/极差/标准差/RMS/峰度/偏度
频域要素:FFT 第一峰频率与幅值(摆臂频率)、能量分布比
形状匹配:DTW 与“理想模板”的距离(高级但加分项)
以上每项都可明确映射到“力学/技术要点”,便于论文“机制解释”。
3.2 来自体质报告(附件4)
体格:身高、体重、BMI、四肢相对比例(如可由身高估算,或来自姿态静态帧)
体成分:体脂率、肌肉重量、骨骼肌重量、水分、蛋白、去脂体重、内脏脂肪等级等
综合指数:肌脂比(肌肉重量/脂肪重量估计)、相对下肢肌量(若能分段更佳)
将体质指标与技术指标拼接成统一特征向量;对量纲差异做标准化(zscore)。
- 问题建模:两类核心问题
4.1 “成绩水平”的影响因素(横截面/混合效应)
令第 个运动者在第 次试跳(前/后)成绩为 (单位 cm),特征向量为 (包含姿态/运动学与体质),建立:
(a) 多元线性/稀疏回归
标准化系数便于比较影响大小;
用 LASSO/Elastic Net 做变量筛选,处理共线与小样本高维问题;
K 折交叉验证选择 。
(b) 半参数广义可加模型(GAM)
用平滑函数 捕捉非线性(如体脂率与成绩的非线性阈值效应)。
© 非线性集成模型(XGBoost/LightGBM)
获取特征重要性与SHAP 值,可视化边际效应(PDP/ICE);
与线性系对比,验证变量影响的稳健性。
(d) 分层/混合效应模型(控制个体异质性)
为个体随机效应,吸收先天差异与未观测特质。
4.2 “成绩提升”的影响因素(配对/因果角度)
利用纠正前—后的配对结构,分析“姿态改变”带来的成绩增益 。
(a) 配对差分回归(控制个体固定效应)
是纠正后−纠正前的技术变量变化(如 摆臂幅度、抱膝角等);
这样剥离了个体不变的体质与先天差异,直击“技术调整”的边际贡献。
(b) 处理效应(是否被“纠正”+纠正幅度)
若部分被试“纠正强度”不同,可引入二值/强度处理 与交互项:
近似平均处理效应, 则刻画“纠正与关键技术变量的交互”。
5. 候选“主要因素”清单(从理论与实践出发)
技术/姿态(强相关候选)
- 起跳角 与初速度分解 :起跳角过小→垂直滞空不足;过大→水平位移损失;一般存在最优角附近的非线性。
- 摆臂贡献:摆臂幅度与速度(角速度/角加速度),与 的提升相关;
- 下肢伸展与抱膝:起跳瞬间的髋膝踝伸展幅度、滞空期抱膝角度与时机,影响滞空姿态与落地触地点;
- 躯干前倾与身体重心前移策略:影响 与落地区域;
- 动作稳定性:COM 轨迹拟合残差/角度波动(小→稳定)。
体质/体成分(中强相关候选)
6) 身高/下肢比例:影响摆动半径、可实现的 ;
7) 肌肉量/骨骼肌重量:与爆发力、伸髋伸膝能力相关;
8) 体脂率:过高→相对力量下降,过低→不一定劣但可能与肌量不足相关,呈U 形或阈值效应;
9) 体重:以相对力量(如力量/体重或肌肉/体重)更合理;
10) 水分/蛋白/去脂体重:反映肌肉状态与疲劳水合,对当日表现有边际影响。
-
变量选择与可解释性
筛选路径:先用Elastic Net(处理共线)→ 得到一组稀疏主因子;
用 GAM / XGBoost 检查非线性与交互(如 ×体脂率);
重要性报告:
线性:标准化回归系数 排名;
树模:SHAP 值 TopN 排名,给出PDP(边际效应曲线);
配对差分模型: 技术变量系数 的显著性与效应量。 -
统计检验与稳健性
交叉验证:K 折(或留一被试)验证泛化;
多重共线:VIF 检查,必要时做 PCA 降维;
敏感性分析:删去极端样本/低置信度帧重算;改变平滑窗长/阈值看结论是否稳定;
Ablation:仅用体质→仅用技术→二者合并,比较 /MAE/IC(秩相关);
异方差与稳健标准误:White/HC 标准误;
多重比较:必要时 FDR 校正。
8. 结果呈现建议(论文/答辩)
表1:变量定义与物理含义(体质 vs 技术)
表2:主要模型的回归系数/显著性/标准化系数
图1:纠正前后成绩箱线图与提升分布()
图2:SHAP 全局重要性条形图(Top10 因素)
图3:关键变量的 PDP 曲线(、体脂率、摆臂幅度…)
图4: 对 的散点回归(配对差分)
图5:Ablation 对比条形图(仅体质/仅技术/合并)
可复现实现代码
后续都在”数模加油站“…