diff --git a/thesis/chapters/ch6-results.tex b/thesis/chapters/ch6-results.tex index a25857e..224797e 100644 --- a/thesis/chapters/ch6-results.tex +++ b/thesis/chapters/ch6-results.tex @@ -67,6 +67,19 @@ XGBoost模型在三个时间尺度上均取得优异性能,短期预警F1-Macr 基于Flask + ECharts构建的可视化大屏系统(图\ref{fig:dashboard}),包含6个功能面板:温度趋势图、风险等级展示、老年人口饼图、预警时间线柱状图、暴露-反应曲线和历史数据回顾。系统采用深色科技蓝配色方案,支持每30分钟自动刷新数据。 +\section{LSTM训练优化尝试} + +为改善LSTM-Attention模型的性能,本研究进行了以下训练优化尝试: + +\begin{enumerate} + \item \textbf{Focal Loss参数调优}:分别设置$\alpha \in \{0.25, 0.5, 0.75\}$,$\gamma \in \{2.0, 3.0\}$进行实验,模型均收敛至仅预测多数类(低风险)的平凡解。 + \item \textbf{类别加权损失}:尝试反频率加权和平方根反频率加权,权重过强时模型过度预测少数类(准确率降至2.5\%),减弱后模型回归预测多数类。 + \item \textbf{加权随机采样器(WeightedRandomSampler)}:通过平方根反频率权重进行过采样,但仍无法突破94-96\%类别不平衡导致的梯度主导效应。 + \item \textbf{批量大小调优}:分别使用batch\_size=16、32、64进行实验,对模型收敛行为无明显影响。 +\end{enumerate} + +上述实验表明,在极端类别不平衡(低风险样本占比94-96\%)条件下,基于梯度反向传播的深度序列模型难以通过常规的不平衡学习技术有效收敛。XGBoost的梯度提升树结构天然适用于此类数据分布,是其表现优异的重要原因。 + \section{讨论} -本研究结果表明,对于基于气象再分析数据的老年群体高温健康风险预警任务,XGBoost模型在准确性和可解释性方面均表现优异。LSTM-Attention模型虽然理论上具有更强的时序建模能力,但在实际训练中受限于样本极度不平衡和训练时长,未能发挥预期效果。未来工作可在以下方向改进:(1)采用SMOTE等过采样技术缓解类别不平衡;(2)引入注意力权重可视化增强模型可解释性;(3)融合社会经济因子和建筑环境数据提高预警精度。 +本研究结果表明,对于基于气象再分析数据的老年群体高温健康风险预警任务,XGBoost模型在准确性和可解释性方面均表现优异。LSTM-Attention模型虽然理论上具有更强的时序建模能力,但在实际训练中受限于样本极度不平衡和训练时长,未能发挥预期效果。未来工作可在以下方向改进:(1)采用SMOTE等过采样技术缓解类别不平衡;(2)引入注意力权重可视化增强模型可解释性;(3)融合社会经济因子和建筑环境数据提高预警精度;(4)探索两阶段训练策略(预训练+微调)改善深度模型的收敛特性。 diff --git a/thesis/main.pdf b/thesis/main.pdf index 5714343..cd4e930 100644 Binary files a/thesis/main.pdf and b/thesis/main.pdf differ