这个系统在做什么
TaihuGuard 由扬州立丹科技有限公司开发。它做三件事,按可信度从高到低排:
1. 实时监测(主产品)。接生态环境部太湖流域 61 个国控自动监测站,每
4 小时一轮真实数据,11 个水质参数。这部分是看板的主数据来源。
2. 短期预报。判断未来几天的走势,以 persistence(明天≈今天)为标尺。
多数水质参数上,"明天≈今天"本身已经很强,复杂模型并不更准。
当前在严格回测里相对 persistence 有稳定增量的,主要是氨氮(NH₃-N)7 天预报(详见"短期预报"一节)。
3. 蓝藻告警。按实测的叶绿素a / 藻密度阈值做规则分级,不是模型预测。
太湖实测蓝藻数据约 9% 站点覆盖,样本不足以训练可靠的预测模型,所以这里用规则。
关于精度数字:ST-GAT 已用真实数据重训,但整体未优于 persistence,因此本看板不把 R²/F1/MAE 当作卖点展示,
也不展示包装成"真算"的特征归因。当前真实数据约 4 个月,样本仍在积累,季节覆盖不全,跨季外推不可靠。
监测参数
水温°C
pH-
溶解氧 (DO)mg/L
高锰酸盐 (CODMn)mg/L
氨氮 (NH3-N)mg/L
总磷 (TP)mg/L
总氮 (TN)mg/L
叶绿素a (Chl-a)μg/L
藻密度万cells/L
电导率μS/cm
浊度NTU
数据来源
◎
水质监测数据
来自生态环境部地表水水质自动监测实时数据发布系统,覆盖太湖流域 61 个国控自动监测断面,
包含水温、pH、溶解氧、CODMn、氨氮、总磷、总氮、叶绿素a、藻密度等实时参数。
☁
气象数据
太湖流域 5 个站点的气温、湿度、降水、风速风向、气压、云量等。
气象不是对所有参数都有用——回测里只有氨氮、pH、总氮等少数营养盐类参数能从
未来气象预报里拿到额外增益(下一节有数)。实时用和风天气兜底,
回测用 Open-Meteo 的历史预报(真实 lead-time、免费公开)严格对齐验证。
短期预报:以 persistence 为标尺
做预报先要有标尺。我们用的标尺是 persistence(明天≈今天):直接把今天的值当成未来几天的预测。
对大多数水质参数,在几天的尺度上这个朴素办法已经很难超越,复杂模型并不更准。
persistence 是本项目的基线:只有在回测里相对它有稳定增量的参数,才进入模型预报展示;其余参数直接用 persistence。
当前回测里相对 persistence 有稳定增量的,主要是氨氮(NH₃-N)7 天预报。用免费公开的气象预报(Open-Meteo,真实 lead-time)做驱动,
在严格回测下(walk-forward、lead-time 对齐)整体 skill 约 0.90(约 10% MAE 改善),
按天 block bootstrap 的 95% 置信区间上界 < 1,逐站看 49 站中 37 站(76%)点估计更低。
边界要标清楚:这是单个参数、部分时段的增量,不是"精准预测全湖水质"。
按月份分层看,4 月、6 月赢、5 月不赢,增益依赖水文阶段。pH 3 天、总氮 7 天点估计也赢,但置信区间跨 1、不显著,只能算候选。
其余参数没过门控,就用 persistence。
实测 + 气象预报
→
persistence 基线
→
门控:有增益才上模型
→
短期预报 + 不确定性
ST-GAT(下方"模型技术详情")是把站点连成图、用 Transformer 管时间、GAT 管空间、带不确定性头的时空模型。
它在真实数据上当前未整体优于 persistence,目前保留为实验模型,不作为精度卖点。前端只展示通过门控、
且在物理合理范围内的短期曲线(突出 1-3 天、最多 7 天),越界预测值自动剔除,预报不可用时直接提示。
空间补全 / 虚拟站
预报是"同一站点、未来"的问题;空间补全是"同一时刻、未设站位置"的问题,与时间预报不同。
用 61 个站同一时刻的实测,插值估计湖面其它位置的水质。回测(留一交叉验证)显示:总氮、总磷、电导率、藻密度、
高锰酸盐指数等参数有空间结构,IDW 插值误差低于"全场取一个平均值"的基线(例如总氮 MAE 约为
全场均值法的 0.88、藻密度约 0.77)。水温、溶解氧、浊度、氨氮没有明显空间结构,这里就不补。
全湖总氮(TN)空间补全示例。白点是有实测的国控站,色块是据此插值估计的"虚拟站"读数(超出约 12km 不外推)。
可以看到营养盐有清晰的空间梯度,这正是空间补全能补出盲区的依据。
蓝藻预警分级
蓝藻预警是规则告警,按实测叶绿素a浓度和藻密度阈值给各站分级。
没有用模型预测,是因为太湖实测蓝藻数据只有约 9% 站点有值,不足以训练可靠的预测模型——
与其拿少量数据硬训一个不可信的预测,不如用透明的阈值规则。各级阈值:
无风险
Chl-a < 10 μg/L
轻度
10 ≤ Chl-a < 26 μg/L
中度
26 ≤ Chl-a < 64 μg/L
重度
Chl-a ≥ 64 μg/L
更新频率
每 4 小时
自动采集水质与气象数据,更新实测、规则告警,以及已通过门控的短期预报
更新时间点
0:00 / 4:00 / 8:00 / 12:00 / 16:00 / 20:00
Dashboard 功能
交互式地图
太湖流域监测站点的空间分布,支持按参数切换颜色渲染,点击站点查看详情。
时间轴滑动
通过滑动条查看历史实测与短期预报的水质变化,地图颜色和数据随之动态更新。
水质趋势图
单站点水质参数的实测时间序列 + 短期预报曲线(突出 1-3 天、最多 7 天),含不确定性区间。
蓝藻预警面板
实时蓝藻水华风险预警列表,中度及以上预警高亮显示。
全湖参数对比
所有站点的水质参数横向对比柱状图,快速识别异常站点。
水质评价标准
依据《地表水环境质量标准》(GB 3838-2002),主要参考 CODMn、氨氮、总磷进行水质类别判定:
I 类≤2≤0.15≤0.02
II 类≤4≤0.5≤0.1
III 类≤6≤1.0≤0.2
IV 类≤10≤1.5≤0.3
V 类≤15≤2.0≤0.4