近日,我院张芸教授团队在环境领域权威期刊Environmental Science & Technology上发表了题为“Mapping PFAS Exceedance Risk in China’s Surface Water: A Machine Learning Approach Informed by Source Distribution”的科研论文。

全氟及多氟烷基物质(PFAS)在地表水中的广泛分布已对公共健康构成严重威胁。作为全球含氟化学品的主要生产与消费国,中国长期面临PFAS监测数据稀疏且分布不均的问题,因此,阐明其全国尺度的污染分布格局及潜在风险至关重要。研究团队创新地构建了地理加权随机森林(GWR‑RF)机器学习模型,并将一项包含超过28万个全国尺度潜在PFAS污染源的空间显式清单作为关键预测变量,涵盖含氟化工企业、金属处理厂、污水处理厂、消防训练场地等关键风险来源。模型预测性能优异(Accuracy=0.83,ROC-AUC=0.91),可对无监测区域进行可靠风险外推,并基于预测结果成功绘制了中国1km分辨率的地表水PFAS超标风险空间分布图谱。研究结果表明,中国约3.34%的地表水区域存在 PFAS超标高风险,主要集中于东部沿海平原及内陆重点工业省份;大量中小型工业企业是被低估的PFAS排放主体,暴露出环境监管的薄弱环节。归因分析揭示,年降水量和邻近已知PFAS污染源的距离是导致超标风险升高的主要驱动因素。该研究通过源清单驱动的机器学习方法和高分辨率空间建模,为数据匮乏地区开展新型污染物大尺度风险评估提供了可复制的框架,也为制定更具针对性的PFAS污染防治策略提供了科学依据。

图文导读
(一)全国已知和潜在PFAS污染源分布
通过多源数据挖掘与代码映射,建立了超过28万个PFAS污染源的空间清单,结果表明,我国已知污染源高度集中于山东、江苏、浙江和广东等东部沿海地区;而潜在污染源构成中,中型企业占据主导地位,展现出显著的区域产业结构特异性。

图1 全国已识别已知和潜在PFAS污染源的空间分布
(二)中国地表水PFAS超标风险预测
融合多源异构大数据与跨国行业代码映射污染源清单,构建了耦合空间权重的地理加权随机森林(GWR-RF)机器学习模型,并对全国陆域1km分辨率地表水 PFAS 超标风险进行了预测。研究发现,全国约3.34%的地表水存在超标风险,除东部沿海平原呈现显著连片集聚外,陕西、山西等内陆重工业省份亦是高风险区域。

图2 中国地表水PFAS浓度超标(>100 ng/L)空间概率分布
(三)超标区域居住人口估算
叠加风险预测图谱与高精度人口密度网格数据,引入地区地表水源供水比例作为暴露路径修正因子,系统估算了潜在受威胁的人群规模。结果表明,全国约有8000万至9000万人口居住于潜在PFAS超标高风险区域,且超过80%的暴露人群高度集聚于东南部沿海城市群,定量揭示了PFAS风险分布与密集人群之间的空间分布。

图3 地表水PFAS污染潜在高风险区域人口分布
(四)PFAS超标风险驱动因素解析
综合运用全局特征重要性排序与SHAP分析方法,对自然气候、地理环境与社会经济等变量对PFAS超标概率的贡献进行了解析。研究发现,年降水量与邻近已知PFAS污染源的距离是主导超标风险的核心因子。

图4 PFAS超标高风险部分驱动因素重要性排序
(五)PFAS超标概率与点源之间的空间关系解析
基于宏观空间统计,探究了地表水PFAS超标概率与多类需要重点关注的风险来源及环境保护设施(工业点源、污水处理厂、固废处理场等)物理距离的空间衰减规律。进一步分析得到污染设施的辐射范围存在异质性:常规工业点源影响多局限于20公里以内,而作为持续性环境输入的污水处理厂及大型固废处置设施,其影响半径则可能延伸至40~60公里。

图5 地表水PFAS超标概率与点源之间的空间关系
小结
该研究将中国PFAS管控从数据匮乏和被动应对转向风险导向和主动防控。基于工业源大数据与先进机器学习方法,可以优先布设监测、精准治理,并识别高风险区易感人群。团队强调,风险地图反映的是空间易感性而非实测污染状况,研究采用的欧盟限值严于中国现行国标中单种PFAS管控要求。成果旨在为监管部门优化全国监测网络、制定分源管控政策、保障用水安全提供科学依据。
文章信息
第一作者:王俊钢(硕士研究生)
通讯作者:邵帅(博士后),张芸(教授)
通讯单位:太阳成tyc7111cc
原文链接:https://doi.org/10.1021/acs.est.6c00574