基于多元统计和聚类分析的浙江省水质评价
该论文来源于网络,本站转载的论文均是优质论文,供学****和研究使用,文中立场与本网站无关,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息,如果需要分享,请保留本段说明。
摘 要:为了评价浙江省地表水质情况,根据2017—2020年浙江省地表水日监测数据,分别用多元分析和聚类分析对水质进行多方位、多因素的研究。结果表明,自2017年开始,浙江水质级别、单因子污染情况等都得到了不同程度的好转,到2020年4月水质级别全部控制在5类以内,且没有污染因子。
关键词:水质级别;多元分析;聚类分析;浙江省
中图分类号 ;X824 文献标识码 A 文章编号 1007-7731(2020)22-0145-02
2012年浙江省环境公报数据显示,全省地表水总体水质为良,江河干流总体水质量基本良好,部分支流和径流域镇的局部河段仍存在不同程度的污染。浙江省有32个省控地表水断面劣五类,钱塘江、曹娥江、甬江、椒江、瓯江、飞云江、鳌江、苕溪等8大水系以及京杭运河等均受到了不同程度的污染。为此,浙江省政府先后于2013年和2017年分别提出了“五水共治”和“剿灭劣五类水”等政策,對浙江省水质提出了具体的要求。本文通过多元分析和聚类分析法对浙江省地表水质进行了评价分析,找出同类水质的规律和内在相关因素,以期为浙江省水质的检验提供科学依据。
1 数据来源
本研究采用是浙江省2017—2020年地表水日监测数据,这些数据中每个月都会不同程度的缺失一些日期的数据,2019年1—4月的数据则是完全缺失。数据中包含的水质指标有pH值、溶解氧、化学需氧量、氨氮、总磷等监测数值。监测数值的评价标准按照《地表水环境质量标准》(GB3838-2002)的相关规定执行。
2 研究方法
层次聚类分析法 层次聚类法(HCA)是聚类分析法中使用最多的一种,是把相似或相近的对象归并成类,主要研究如何度量相似性和构造聚类的具体方法,包括“R聚类-指标聚类”和“Q聚类-样本聚类。其中,R聚类可以在某些变量中选择出具有代表性的变量,Q聚类可以在聚类过程中发现具有共同属性的样本[1-4]。本文考虑同一站点的监测指标进行聚类,找出水质的规律和原因。相似程度包括样本间距离和组间距离2类,文中对这2类距离两两组合进行聚类分析,并计算相应的复合相关系数,相关系数越趋于1,说明聚类的效果越好,所以选择相关系数最大的距离组合。本研究采用的是绝对距离(式1)和重心距离(式2)。
3 结果与分析
多元统计水质特征 本文采用的日监测数据包括水质类别、主要污染因子、pH值、溶解氧、化学需氧量、总磷、氨氮、监测日期等指标。数据中水质类别分为1~6类,经过对比和观察发现,水质类别数字越大,水质越差,所以对水质类别为6的监测值进行分析,统计出水质类别为6的站点所占的比例,选择数据比较完整的、6类水质出现频率最高的S1站点做多元统计分析[5-6]和聚类分析[3-5],其中S1站点的水环境功能区划标准为Ⅳ。按年份分别统计出水质级别为6的监测记录,得出2017—2020年劣5类水的比例
基于多元统计和聚类分析的浙江省水质评价 来自淘豆网www.taodocs.com转载请标明出处.