elderly-heat-warning/thesis/chapters/ch7-conclusion.tex

\chapter{总结与展望}

\section{工作总结}

本研究以河南省焦作市和郑州市为研究区域，针对银发群体高温健康风险预警问题，系统开展了数据获取、特征工程、模型构建与对比、可视化系统开发等工作，取得了以下主要成果：

\begin{enumerate}
    \item \textbf{构建了高质量的ERA5-Land气象数据集}：通过CDS API获取2010-2024年焦作、郑州两市的ERA5-Land网格气象数据（360个月度NetCDF文件），经ZIP解压、日聚合、单位转换后，使用Magnus公式计算相对湿度、NOAA Rothfusz公式计算体感温度，构建了包含19个气象衍生特征的完整数据集。最终生成1,095,758条滑动窗口序列样本，覆盖短期（3天）、中期（7天）和长期（30天）三个预测窗口。

    \item \textbf{设计并实现了LSTM-Attention深度学习预警模型}：模型包含2层双向LSTM（隐藏维度128）、4头自注意力机制和3个独立的多任务输出头，总参数量983,628。采用Focal Loss（$\alpha=0.5, \gamma=2.0$）作为损失函数以缓解极度类别不平衡，配合AdamW优化器、ReduceLROnPlateau学习率调度和早停策略进行训练。

    \item \textbf{进行了系统的模型对比实验}：以XGBoost作为基线模型，在164,365条测试样本上进行了严格对比。XGBoost在三个时间尺度上均取得优异性能——短期F1-Macro 0.9325、中期0.9195、长期0.8576。LSTM-Attention模型（F1=0.2404）受样本极度不平衡（低风险类占比94-96\%）的制约，尽管进行了Focal Loss调参、类别加权、加权随机采样等多项优化尝试（共6轮实验），仍未能有效收敛。这一对比结果为环境健康预测任务中「表格数据+树模型vs序列数据+深度模型」的技术路线选择提供了有价值的实证参考。

    \item \textbf{开发了Web可视化大屏系统}：基于Flask后台（4个RESTful API端点）和ECharts 5.5前端，实现了包含温度趋势、风险实时展示、人口饼图、预警时间线、暴露-反应曲线和历史回溯六个功能面板的深色科技蓝风格数据大屏，为高温健康防护提供了直观的决策支持工具。
\end{enumerate}

\section{研究不足}

本研究存在以下局限：

\begin{enumerate}
    \item \textbf{数据粒度限制}：ERA5-Land数据的空间分辨率为0.1°（约9 km），无法捕捉城市内部的微气候差异（如不同城区的热岛强度差异），对社区级别的精细化预警支持有限。

    \item \textbf{健康终点数据的间接性}：受限于健康数据的可获取性，本研究的风险等级划分基于体感温度阈值和文献暴露-反应曲线，而非直接的个体级健康结局数据（如死亡记录、急诊就诊人次的时间序列）。温度-健康关联存在显著的人群异质性和地域差异，直接使用文献曲线可能引入一定偏差。

    \item \textbf{气象变量范围的有限性}：本研究仅使用了ERA5-Land的6个基础气象变量（温度、露点、气压、风速、降水），未纳入辐射通量、边界层高度、土壤湿度等可能与高温健康效应相关的变量。

    \item \textbf{LSTM模型训练不充分}：深度序列模型在极端类别不平衡条件下的训练是一个公认的难题。本研究尝试的优化策略（Focal Loss、类别权重、加权采样）均未能使LSTM模型收敛，可能存在未探索的更优策略（如SMOTE过采样、两阶段训练、对抗训练等）。

    \item \textbf{系统功能待完善}：当前可视化系统主要为原型版本，尚未集成预警自动推送、多级联动响应、用户认证和操作审计等功能。
\end{enumerate}

\section{未来展望}

基于本研究的成果和经验，未来可从以下方向继续深入：

\begin{enumerate}
    \item \textbf{多源数据融合}：引入地面气象站观测数据（提高时间分辨率和局部精度）、卫星遥感地表温度（LST，捕捉城市热岛空间格局）、社会经济普查数据（建筑年代、空调普及率、社区绿化率等脆弱性因子）以及社交媒体和健康服务大数据，构建更全面的风险画像。

    \item \textbf{深度模型训练策略改进}：针对极度类别不平衡问题，探索SMOTE和ADASYN等合成少数类过采样技术、基于对比学习的预训练策略、以及将XGBoost作为教师模型进行知识蒸馏（Knowledge Distillation），引导深度模型学习有判别力的特征表示。

    \item \textbf{更先进的模型架构}：尝试Informer、Autoformer等专为长序列预测设计的Transformer变体，以及图神经网络（GNN）用于多城市联合建模。同时，探索概率预测方法（如DeepAR、概率Transformer）以提供预测不确定性估计，增强预警的可信度。

    \item \textbf{系统功能增强与部署}：完善预警推送机制（短信、微信小程序、社区广播），建立多级预警响应流程（蓝/黄/橙/红四级联动），添加用户角色管理和操作日志，支持多城市切换和历史预警复盘分析。

    \item \textbf{研究区域推广}：将本研究的管线和方法推广至河南省其他城市乃至整个中原城市群，为更大范围内的银发群体提供高温健康防护服务。
\end{enumerate}