elderly-heat-warning/thesis/chapters/ch7-conclusion.tex

\chapter{总结与展望}

\section{工作总结}

本研究以河南省焦作市和郑州市为研究区域，面向银发群体高温健康风险预警需求，系统开展了从数据获取、特征工程到模型构建、评估对比和可视化系统开发的全流程工作。主要成果总结如下：

\subsection{数据成果}

构建了覆盖2010-2024年、包含1,095,758条高质量序列样本的多时间尺度高温健康风险预测数据集。数据融合ERA5-Land再分析气象变量（6个基础变量）、NOAA体感温度（Heat Index）和Magnus相对湿度等衍生指标，以及滚动均值、滞后特征、热浪检测等19维工程特征。数据集经严格时间序列分割（70/15/15），已保存为标准化NPZ格式，可供后续研究直接使用。

\subsection{模型成果}

构建了两类对比预警模型：（1）LSTM-Attention深度学习模型（983,628参数，2层BiLSTM+4头MHA+3多任务输出头）；（2）XGBoost梯度提升基线模型（200棵树×3分类器）。在164,365条测试样本上的系统对比表明，XGBoost在三个时间尺度上均表现优异——短期（3天）F1-Macro 0.9325、中期（7天）0.9195、长期（30天）0.8576，严重风险事件的召回率达90.7\%。

\subsection{方法论贡献}

进行了6轮LSTM训练优化实验（Focal Loss调参、类别加权、加权采样、批量大小优化），系统记录了每一轮的配置和结果。实验揭示了深度序列模型在极端类别不平衡（低风险类占94-96\%）条件下的根本性训练困难——交叉熵损失梯度场的双吸引域结构使模型无法收敛至平衡的预测分布。这一负面结果为环境健康预测领域的方法选择提供了有价值的实证参考——并非所有场景下深度学习的理论优势都能转化为实际性能提升。

\subsection{工程成果}

开发了基于Flask+ECharts的Web可视化大屏原型系统（6面板、4 API端点、深色科技蓝风格），实现了多时间尺度预警信息的直观呈现。系统支持模型不可用时的自动降级运行，具备良好的鲁棒性和可维护性。

\subsection{与已有研究的比较}

与已有高温健康预警研究相比，本研究的特色在于：（1）同时覆盖三个时间尺度（3d/7d/30d），区别于已有研究多聚焦单一窗口；（2）以银发群体为特定目标人群，在数据驱动的预警框架中融入老龄化率和暴露-反应曲线等脆弱性指标；（3）对深度学习和梯度提升方法进行了系统的同数据集对比；（4）所有核心代码和数据管线已开源，保证了研究结果的可复现性。

\section{研究不足}

本研究存在以下局限：

\begin{enumerate}
    \item \textbf{健康终点数据的间接性}：受限于个体级健康数据的可获取性，本研究的风险等级划分基于体感温度阈值和文献暴露-反应曲线，而非本地的个体级健康结局数据（如逐日死亡记录、急诊就诊数据）。温度-健康关联存在显著的人群异质性、地域适应性和社会经济效应修饰，直接使用文献中的暴露-反应曲线可能引入一定偏差。

    \item \textbf{数据空间分辨率的限制}：ERA5-Land的0.1°（约9 km）空间分辨率无法捕捉城市内部的微气候异质性（不同城区的热岛强度差可达3-5°C），对社区级别的精细化预警支持有限。

    \item \textbf{气象变量的有限性}：仅使用了ERA5-Land的6个基础气象变量，未纳入向下太阳辐射通量（ssrd）、边界层高度（blh）、土壤湿度（swvl1）等可能与高温健康效应机制相关的变量。

    \item \textbf{深度学习训练不充分}：LSTM-Attention模型因类别不平衡未能有效收敛，本研究虽进行了6轮调优但未穷尽所有可能策略（如SMOTE过采样、两阶段训练、知识蒸馏）。

    \item \textbf{系统功能的原型性}：当前可视化系统为原型版本，未集成实时气象数据流、多城市切换面板、预警自动推送和用户认证等功能。

    \item \textbf{缺乏外部验证}：模型仅在焦作和郑州两市数据上进行测试，未在河南省其他城市或邻近省份城市上进行外部验证，泛化性能有待进一步检验。
\end{enumerate}

\section{未来展望}

基于本研究的成果和局限，未来可从以下方向深入：

\subsection{数据层面}

\begin{enumerate}
    \item \textbf{融合多源数据}：引入地面气象站逐小时观测数据（提高时间精度）、卫星遥感地表温度（LST，捕捉城市热岛空间细节）、手机信令人口密度数据（动态评估暴露人口）以及可穿戴设备生理指标数据（皮肤温度、心率变异性），构建多模态风险评估体系。
    \item \textbf{获取健康结局数据}：与地方疾控中心（CDC）和卫生健康部门合作，获取分年龄组（特别是65+）的逐日死亡登记、120急救呼叫和医院急诊就诊数据，建立本地的温度-健康暴露-反应函数，替代文献曲线。
\end{enumerate}

\subsection{模型层面}

\begin{enumerate}
    \item \textbf{合成少数类过采样}：将SMOTE、ADASYN和Borderline-SMOTE等算法引入14天×19维的序列特征空间，生成合成少数类样本以平衡类别分布。需注意序列数据的时序一致性——直接对展平特征应用SMOTE可能破坏时序结构。
    \item \textbf{两阶段训练（预训练+微调）}：第一阶段在平衡后的数据子集上预训练LSTM特征编码器，第二阶段在全数据集上冻结编码器、仅微调输出头。该策略已在计算机视觉的不平衡学习中取得显著成功。
    \item \textbf{知识蒸馏}：以训练好的XGBoost作为教师模型，将其预测概率作为软标签（soft label）指导LSTM学生模型的训练。软标签比硬标签（0/1）携带更丰富的类别间相似性信息，有助于学生在极度不平衡数据上学习。
    \item \textbf{概率预测与不确定性量化}：采用DeepAR、概率Transformer或贝叶斯神经网络实现预测分布（而不仅是点估计）输出，为预警决策提供可信度区间。
    \item \textbf{更先进的时序架构}：尝试Informer（ProbSparse自注意力）、Autoformer（自相关分解）、PatchTST（分块时序嵌入）等Transformer变体，以及图神经网络（GNN）用于多城市联合建模。
\end{enumerate}

\subsection{系统与应用层面}

\begin{enumerate}
    \item \textbf{预警推送与闭环响应}：集成短信/微信小程序推送通道，建立「预测→推送→确认→响应→反馈」的预警闭环，参考法国Plan Canicule的分级响应流程。
    \item \textbf{多城市推广}：将完备的管线（下载→预处理→训练→评估→部署）推广至河南省18个地级市及中原城市群，构建区域性高温健康风险监测网络。
    \item \textbf{季节性预发布}：基于长期预测（30天）能力，在每年5月（高温季前）发布夏季高温健康风险预估报告，辅助政府进行资源预置（如社区降温站布点、应急物资储备）。
\end{enumerate}