feat: 论文大幅扩写 — 42页,完整数学公式+实际数据+系统描述

This commit is contained in:
2026-05-28 13:09:08 +08:00
parent 4e41de3772
commit 2bdafc56bb
8 changed files with 620 additions and 173 deletions
+47 -15
View File
@@ -1,35 +1,67 @@
\chapter{绪论}
\section{研究背景与意义}
\section{研究背景}
全球气候变暖导致极端高温事件频发,对公共卫生构成严峻挑战。老年群体(65岁及以上)由于体温调节功能下降、慢性病患病率高等原因,是高温热浪最脆弱的群体之一。焦作市和郑州市地处中原地区,夏季高温天气频繁,老龄化率分别达12.8\%和11.6\%,亟需建立科学的高温健康风险预警体系
全球气候变化是21世纪人类面临的最重大公共卫生挑战之一。根据世界气象组织(WMO)2024年发布的报告,2023年全球平均气温较工业化前水平上升约1.45°C,创下有记录以来的最高值。政府间气候变化专门委员会(IPCC)第六次评估报告指出,全球平均气温每升高0.5°C,极端高温事件的频率和强度将呈非线性增长。在此背景下,高温热浪已从偶发性气象事件演变为常态化的公共卫生威胁
本研究的意义在于:(1)利用深度学习技术提升高温健康风险预测的精度和多时间尺度覆盖能力;(2)通过可视化大屏为政府和社区提供直观的决策支持工具;(3)为中原地区高温热浪健康防护提供科学依据
中国是全球受高温热浪影响最为显著的国家之一。中国气象局《2023年中国气候公报》数据显示,2023年全国平均高温日数(日最高气温≥35°C)为11.3天,较常年偏多4.1天,为1961年以来第二多。河南省作为中原腹地,夏季受副热带高压控制,高温天气持续时间长、强度大。2022年6月河南省出现持续性高温天气,多地最高气温突破40°C,郑州、焦作等城市连续高温日数超过10天
\section{银发群体的高温脆弱性}
老年群体(65岁及以上)是高温热浪健康效应最敏感的亚群。其脆弱性根植于生理、社会和经济三个层面:
\textbf{生理层面:}老年人皮肤血流量减少、出汗率降低,体温调节功能显著退化;同时心血管疾病、糖尿病、慢性呼吸系统疾病等基础病的患病率随年龄递增,高温应激可诱发或加重这些疾病。研究表明,当体感温度(Heat Index)超过32°C时,65岁以上人群的全因死亡风险开始显著上升;当体感温度超过38°C时,心血管疾病死亡风险增加30\%-50\%
\textbf{社会层面:}空巢老人比例持续上升,独居状态下高温防护意识和应对能力不足。第七次全国人口普查数据显示,中国65岁及以上人口已达1.91亿(占比13.5\%),其中独居老人超过3,000万。
\textbf{经济层面:}老年人收入水平普遍偏低,空调等降温设备的使用率受经济条件制约。农村地区老人面临的降温条件更为有限。
\section{研究区域选择}
本研究选取焦作市和郑州市作为研究区域,理由如下:
焦作市位于河南省西北部,总面积4,071 km$^2$,常住人口约352万(2023年),65岁及以上人口占比约12.8\%。焦作地处太行山南麓,地形以山地丘陵为主,夏季高温叠加地形效应使得城区热环境较为复杂。
郑州市是河南省省会,总面积7,446 km$^2$,常住人口约1,274万(2023年),65岁及以上人口占比约11.6\%。郑州作为国家中心城市和重要的交通枢纽,城镇化率超过78\%,城市热岛效应显著。两市的城镇化率均超过65\%,城市热岛效应与人口老龄化叠加,使得高温健康防护问题尤为突出。
两市同属暖温带大陆性季风气候,年平均气温14-15°C,7月平均气温27-28°C,极端最高气温超过42°C。两市地理邻近(相距约70 km),气象条件相似但城市规模和人口结构差异明显,形成了有价值的对比研究场景。
\section{国内外研究现状}
\subsection{高温热浪健康效应研究}
\subsection{高温-健康关联的流行病学研究}
温度与死亡率的关联通常呈J型或V型曲线,高温端的相对风险显著升高。Gasparrini等(2015)在Lancet发表的多国多城市研究系统揭示了温度-死亡关联的时空特征。Chen等(2018)在Lancet Planetary Health发表了中国城市研究,为中国人群温度健康风险提供了本土化证据
温度与死亡率的暴露-反应关系是环境流行病学的经典议题。Gasparrini等(2015)在\textit{The Lancet}发表的多国多城市研究(涵盖13个国家384个城市)是里程碑式成果,发现温度-死亡关联通常呈J型或V型曲线,最适温度(Minimum Mortality Temperature, MMT)因地理位置而异,高温端的相对风险(Relative Risk, RR)显著升高。Chen等(2018)在\textit{The Lancet Planetary Health}发表了中国272个城市研究,为中国人群提供了本土化的温度-死亡暴露-反应曲线,发现在中国北方城市高温效应更为显著
\subsection{环境健康预警系统研究}
\subsection{高温健康预警系统HHWS}
国际上,多个国家已建立高温健康预警系统(HHWS),如法国国家高温预警计划、美国NOAA高温健康预警等。国内方面,中国气象局发布了高温预警信号体系,上海、深圳等城市开展了高温健康预警试点
国际上,法国在2003年热浪导致约15,000人超额死亡后建立了国家高温健康预警计划(Plan Canicule),采用三色预警体系。美国NOAA开发了HeatRisk原型系统,综合考虑温度、湿度和人口脆弱性。世界卫生组织(WHO)和世界气象组织(WMO)联合发布了HHWS技术指南
\subsection{多时间尺度预测方法}
国内方面,中国气象局建立了高温预警信号体系(黄色、橙色、红色三级),基于日最高气温阈值。上海、深圳等城市开展了高温健康预警试点,初步将健康终点数据纳入预警逻辑。但总体而言,国内HHWS仍以气象指标为主,缺乏对脆弱人群的精细化评估和多时间尺度的前瞻性预测能力。
传统的时间序列预测方法包括ARIMA、指数平滑等。随着深度学习的发展,LSTM等循环神经网络在时序预测中展现出优势。Vaswani等(2017)提出的Transformer架构中的自注意力机制能够有效捕捉长时间依赖关系。
\subsection{深度学习在环境健康预测中的应用}
传统时间序列预测方法(ARIMA、指数平滑、VAR)受限于线性和平稳性假设,难以应对气象-健康关联中的非线性效应。随着深度学习发展,LSTM(Hochreiter \& Schmidhuber, 1997)等循环神经网络在气象时序预测中展现出优势。注意力机制(Vaswani等, 2017)进一步增强了模型对长距离时序依赖的捕捉能力。
在环境健康领域,将深度学习应用于高温健康风险预测的研究尚处于起步阶段。现有工作多聚焦于单一时间尺度的预测,且较少针对银发群体进行特定建模。
\section{研究目的与意义}
本研究旨在构建面向银发群体的多时间尺度(短期3天、中期7天、长期30天)高温健康风险预警模型,并通过Web可视化大屏实现预警信息的直观呈现。
研究意义包括:(1\textbf{方法创新}——将双向LSTM与多头自注意力机制结合,同时引入Focal Loss解决样本极度不平衡问题,探索深度序列模型在环境健康预测中的适用性与局限性;(2)\textbf{实用价值}——XGBoost模型在三个时间尺度上均取得F1>0.85的优异性能,可直接支撑实际预警决策;(3)\textbf{可视化赋能}——Web大屏将复杂模型输出转化为面向政府管理者、社区工作者和公众的可理解信息,降低预警信息的使用门槛。
\section{研究内容与技术路线}
本研究主要内容包括
本研究的工作流程为:数据获取→预处理与特征工程→模型训练与评估→可视化系统构建。具体内容如下
\begin{enumerate}
\item 多源数据获取与预处理:ERA5气象再分析数据、人口普查数据、卫生统计数据
\item 多时间尺度预警模型构建:LSTM-Attention深度学习模型 + XGBoost基线模型
\item 预警可视化系统开发:Flask后端 + ECharts前端大屏
\item 模型评估与对比分析
\item \textbf{多源数据获取}:通过CDS API获取2010-2024年ERA5-Land网格气象数据(2m温度、2m露点温度、地表气压、10m风速U/V分量、总降水量共6变量),结合中国卫生统计年鉴数据构建人口健康基线。
\item \textbf{数据预处理与特征工程}:6小时间隔数据聚合为日尺度→K至°C单位转换→Magnus公式计算相对湿度→NOAA Rothfusz公式计算体感温度→构建19维衍生特征(滚动均值、滞后特征、热浪检测、季节编码)。
\item \textbf{多时间尺度预警模型}:设计LSTM-Attention深度学习模型(983,628参数)和XGBoost基线模型,分别预测短期(3天)、中期(7天)和长期(30天)高温健康风险等级(0-低、1-中、2-高、3-严重)。
\item \textbf{模型评估与对比}:在时间序列分割的测试集(2023-2024年数据,164,365条样本)上系统对比两种模型的性能。
\item \textbf{可视化大屏开发}:基于Flask后端和ECharts前端,实现六大功能面板的Web可视化大屏。
\end{enumerate}
\section{论文组织结构}
本论文共分七章第一章介绍研究背景和现状;第二章阐述相关理论基础;第三章述数据获取和预处理过程;第四章详细介绍预警模型设计;第五章展示可视化系统实现;第六章进行实验结果分析;第七章总结全文并展望未来工作。
本论文共分七章第一章阐述研究背景、国内外现状和研究意义;第二章介绍LSTM、注意力机制、XGBoost等核心理论以及高温健康风险相关概念;第三章述数据来源和预处理管线,包括ERA5数据获取、体感温度计算、特征工程和数据集构建;第四章介绍LSTM-Attention和XGBoost两类预警模型设计细节;第五章展示Flask+ECharts可视化大屏的架构和实现;第六章进行实验结果分析,包括模型性能对比、混淆矩阵分析和LSTM训练优化记录;第七章总结全文并展望未来工作。