基于线性回归和决策树模型的市政污水除磷药剂投加方法与流程

日期: 2024-06-22 23:11:24|浏览: 88|编号: 75712

友情提醒:信息内容由网友发布,请自鉴内容实用性。

基于线性回归和决策树模型的市政污水除磷药剂投加方法与流程

1.本发明涉及市政污水药剂投加领域,特别涉及一种基于线性回归和决策树模型的市政污水除磷药剂投加方法。

背景技术:

2、市政污水是人们日常生活中排放的污水,包括居民厨房、卫生间等生活设施、公用设施以及工厂产生的污水。这类污水不同于工业废水,其水质、水量的小时变异系数较大,特别是白天和夜间的变化显著,短期内用水量的变化具有周期性。其中,进水流量的变化对污水加药除磷工艺的絮凝沉淀过程将产生很大的影响。当进水流量增大时,会缩短絮体相互碰撞凝聚成大颗粒的时间,导致絮体形成不充分,同时也会减少絮体的沉淀时间,降低杂质的去除率,从而影响出水水质。因此,当进水流量增大时,为保证出水水质,需加大除磷剂的投加量,反之则减小。

3、市政污水处理中,需要根据进水流量的变化正确控制除磷剂的投加量。当水量变化较小时,除磷剂投加量、进水流量与水质参数之间存在较为明显的对应关系;但当水量变化较大时,除磷剂投加量、进水流量与水质参数之间的数据大多呈现非线性。

4、因此,基于上述问题,有必要提出一种新的技术解决方案。

技术实现要素:

5、鉴于此,本发明的目的是提出一种基于线性回归和决策树模型的城市污水除磷剂投加方法,以解决上述除磷剂投加过程中存在的问题。

6、本发明提供如下技术方案:

7.一种基于线性回归与决策树模型的城市污水除磷剂投加方法,包括以下步骤:

8、数据模型建立:利用多个数据采集组件获取包括实时数据和历史数据的加药数据;根据除磷剂投加原理对历史数据进行预处理;计算污水时流量系数;根据污水时流量系数将历史数据分为正负样本和负样本,利用正样本和负样本训练SVM分类器;根据水质参数建立除磷剂投加量预测的线性回归模型和决策树模型,从而完成除磷剂投加量预测模型的建立与训练。

9、数据模型现场部署及运行:将数据模型封装并部署到污水处理工艺现场,将实时数据接入除磷剂投加量预测模型;运行除磷剂投加量预测模型,计算出当前状态下所需的除磷剂投加量。

10、控制系统自动加药:脱磷剂的加药数据传输到控制系统,控制系统根据数据模型的计算结果完成脱磷剂的自动加药。

11、进一步的,所述多个数据采集组件包括:流量计、正磷酸盐在线分析仪、温度计、电磁控制泵、总磷测定仪等;

12.除磷剂投加量预测模型包括线性回归模型和决策树模型,数据模型包括训练好的SVM分类器和除磷剂投加量预测模型。

13、进一步地,加药数据包括:进水流量、正磷酸盐浓度、水温、除磷剂投加量及出口总磷数据,加药数据接入控制系统,方便后续数据预处理、数据模型训练。

14.进一步地,数据预处理包括:根据停留时间计算公式确定历史数据的对应关系;由于仪器维护等因素的影响,采集到的原始历史数据不可避免地会有缺失值、噪声点和离群值,因此需要对原始历史数据的完整性和准确性进行审查,删除原始历史数据中的缺失值、噪声点或离群值,修复原始历史数据中参数间的时间偏差,减少数据模型训练过程中的误差;通过上述数据预处理,提高了数据模型构建的速度和准确性。

15、进一步的,污水小时流量系数计算公式为:

[0016][0017]

其中:k

你好

为污水时流量系数;q

你好

为污水每小时流量;i为时间,i = 1, 2,

,24。

[0018]

假定市政污水流量在1小时内均匀分布,则根据入流流量的小时数据计算污水小时流量系数k,即污水的小时流量。

你好

; 污水时流量系数k

你好

随市政污水流量变化,市政污水流量越大,变化越小,污水小时流量系数k

你好

k 越小

你好

越大。

[0019]

由于市政污水日用水浓度、水量变化趋势具有规律性,且进水流量直接影响后续除磷剂投加量,因此需要根据历史数据计算污水小时流量系数k

你好

,作为判断污水水量变化稳定性的标准。

[0020]

进一步在获取历史数据中污水入流流量的污水小时流量系数范围后,通过对样本进行全局分析,选取合适的污水小时流量系数值k。

你好*

作为划分流入流量正负样本的标准;

[0021]kh,我

为当前进水量与前一小时进水量的变化量,计算公式为:

[0022][0023]

如果

你好

≤k

你好*

,则认为当前的水流量比较稳定,将此时的历史数据归为负样本;若k

你好

》韋

你好*

,认为当前来水流量变化较大、水量不稳定,将此时的历史数据划分为正样本;在此基础上将历史数据划分为正样本和负样本,利用正样本和负样本训练SVM分类器;

[0024]

进一步地,SVM分类器的输出结果w仅取-1和1两个值,当输出结果w取-1时,选用线性回归模型,当输出结果w取1时,选用决策树模型。SVM分类器通过对历史数据的学习,动态地判断当前水量变化是否稳定,从而提高后续根据实时水量选择除磷剂投加量的预测模型的准确性。

[0025]

进一步根据水质参数建立预测除磷剂投加量的线性回归模型和决策树模型,具体方法为:当污水进水流量变化比较平稳时,采用线性回归模型训练相应的历史数据;当污水进水流量变化较大、情况比较复杂时,采用决策树模型训练相应的历史数据;通过这种分类训练方法,可以有效利用数据模型的特点,挖掘数据信息,从而提高数据模型计算速度和除磷剂投加量预测的准确性。

[0026]

进一步将训练好的SVM分类器和除磷剂投加量预测模型封装并部署在污水处理工艺现场,将数据采集设备采集的实时数据接入数据模型。

[0027]

进一步,基于实时数据,SVM分类器首先确定进水流量的变化范围并选择合适的除磷剂投加量预测模型;然后计算出当前市政污水进水流量和水质参数条件下所需的除磷剂投加量。

[0028]

与现有技术相比,本发明至少具有如下一项或多项有益效果:

[0029]

本发明针对不同时刻市政污水入流流量及水质的变化特点,根据不同水量变化特点建立除磷剂投加量的预测算法,不仅可以减少数据模型的计算量,而且可以提高运算速度和预测精度,同时可以实现市政污水处理的自动优化,对于市政污水中除磷剂的投加量具有重要的实际意义,适用性强。

附图的简要说明

[0030]

为了更清楚地说明本发明的实施例或者现有技术中的技术方案,下面将对实施例或者现有技术描述中所需要用到的附图进行简要介绍。图中相同的标号代表相同的部件。显然,下面描述的附图是本发明的一些实施例。对于本领域的普通技术人员来说,在不付出创造性劳动的情况下,可以根据这些附图得到其他的附图。重点在于说明本发明的目的。

[0031]

1为本发明实施例提供的一种基于线性回归和决策树模型的城市污水除磷剂添加方法流程图;

[0032]

图2是根据本发明的实施例的用于区分水量变化的SVM分类器的流程图;

[0033]

图3为本发明实施例提供的决策树模型预测的流程图。

详细方法

[0034]

为了使本发明实施例的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

[0035]

例子

[0036]

为了使本领域技术人员更好地理解本发明的技术方案,下面结合附图及具体实施例对本发明作进一步详细的说明。如图1所示,该方法包括以下步骤:

[0037]

s1:剂量数据收集

[0038]

加药数据采集包括:使用流量计采集市政污水入口流量,使用正磷酸盐在线分析仪检测市政污水中正磷酸盐浓度,使用温度计采集市政污水水温,使用电磁控制泵采集市政污水加入的除磷剂的量,使用总磷计采集市政污水出口的总磷。上述多个数据采集组件每小时采集一次加药数据,采集加药数据的历史数据和实时数据,为后续数据模型构建做准备。实施例中,污水处理工艺现场包括控制系统和多个数据采集组件,多个数据采集组件与控制系统通讯。多个数据采集组件包括流量计、正磷酸盐在线分析仪、温度计、电磁控制泵和总磷计。控制系统安装在上位机中,上位机设置在污水处理工艺现场。

[0039]

根据除磷剂投加原理对原始历史数据进行预处理,数据预处理就是根据停留时间计算公式确定历史数据的对应关系,停留时间是市政污水在污水处理工艺现场进入混凝沉淀池,与除磷剂充分反应,最后流出混凝沉淀池所需的时间。

进入混凝沉淀池的污水流量为进水流量,停留时间计算公式包括估算公式和准确公式,估算公式为:准确计算公式与流量有关,准确停留时间通过CFD流动方程求解。

[0040]

历史数据的对应关系就是历史数据中各个参数的入口和出口数据的对应关系。由于停留时间的存在,混凝沉淀池的入口数据是在当前时刻采集并记录的,经过停留时间之后才到达出口,然后检测出口数据。因此在历史数据库中根据计算出来的停留时间,找到与入口采集数据相对应的出口数据,也就是确定了这样的历史数据的对应关系。确定历史数据的对应关系的目的是为了解决加药数据中各参数间存在时间偏差的问题。

[0041]

由于仪器维护等因素的影响,采集到的原始数据不可避免地会出现缺失值、噪声点及异常值等情况,在根据停留时间计算公式确定加药数据的对应关系时,需要审查加药数据的完整性和准确性,删除加药数据中的缺失值、噪声点或异常值,减少数据模型训练过程中的误差;通过以上数据预处理,可以提高数据模型建立的速度和准确性。

[0042]

s2:计算污水小时流量系数

[0043][0044]

其中:k

你好

为污水时流量系数;q

你好

为污水每小时流量;i为时间,i = 1, 2,

,24.污水小时流量系数作为判断城市污水量变化稳定性的标准。

[0045]

假定市政污水流量在1小时内均匀分布,则根据入流流量的小时数据计算污水小时流量系数k,即污水的小时流量。

你好

; 污水时流量系数k

你好

随市政污水流量变化,市政污水流量越大,变化越小,k

你好

k 越小

你好

越大。

[0046]

在获取历史数据中入流流量的污水小时流量系数范围后,通过全局样本分析选取合适的污水小时流量系数值k。

你好*

作为流入流的正负样本划分标准,k

你好*

为污水小时流量系数标准值;

[0047]kh,

为当前进水量与前一小时进水量的变化量,计算公式为:

[0048][0049]

如果

你好

≤k

你好*

,则认为当前水流量相对稳定。如果k

你好

》韋

你好*

中,认为当前水流量变化较大,市政污水量不稳定;在此基础上将历史数据分为正样本和负样本,即当k

你好

≤k

你好*

,这个历史数据被划分为正样本,当k

你好

》韋

你好*

当 时,将此历史数据划分为负样本,并利用这些正样本和负样本来训练SVM分类器;

[0050]

S3:SVM分类器判断水量变化是否稳定

[0051]

如图2所示,首先将步骤S1中采集的历史数据分为训练数据集和测试数据集。采用无放回的随机抽样方法将训练数据集和测试数据集分为两个互斥的集合。训练数据集和测试数据集中数据分布应保持一致,即类别比例相近。可以采用分层抽样,示例中采用7:3的比例划分训练数据集和测试数据集。训练数据集中的历史数据称为样本数据,训练数据集也称为训练样本。针对训练数据集,选取一个核函数及其相应的参数。SVM分类器中主要有四种核函数:(1)线性核函数:k(x,y)= x

y; (2) 多项式核函数:

k(x,y)=(γx

y+r)d,其中d为多项式核函数的最高阶数;γ为核函数的系数;r为核函数中的常数项。(3)双曲正切核函数:k(x,y)=tanh(γx

y+r),其中d设定多项式核函数的最高阶数;γ设定核函数的系数;r设定核函数中的常数项。(4)高斯径向基核函数:k(x,y)=e-γ‖xy‖2,其中d设定多项式核函数的最高阶数;γ设定核函数的系数;r设定核函数中的常数项。核函数的选择主要通过对不同的核函数和参数组合进行实验,找到最优值。SVM分类器通过在特征空间中建立分类超平面来划分样本数据,分类超平面的函数表达式为:w

x+b=0,计算分类超平面两边的样本数据为w

x+b=1 且 w

x+b=-1,从而将分类超平面两边的样本数据分为正样本数据和负样本数据。因此,SVM分类器是典型的线性二分类机器学习模型。SVM分类器也可以称为SVM模型。当样本数据在二维空间无法线性划分时,需要利用核函数将样本数据映射到三维空间,帮助构建分类超平面。根据核函数的选择不同,其参数也不同。然后将预测因子和污水小时流量系数输入SVM模型,运行SVM模型,得到样本数据的预测值。预测值包括正预测值和负预测值。其中,预测因子可以包括影响污水小时流量系数计算的各种参数。在示例中,输入的预测因子为输入的进水量。通过步骤s2中的标准污水小时流量系数值k

你好*

将样本数据分为正真实值与负真实值,统称为真实值,根据准确率、召回率、F值等SVM模型评价指标对预测值与真实值进行分析,寻找最优分类超平面。

[0052]

根据分类超平面的函数表达式可知,最优分类超平面必须保证分类超平面两侧的正样本数据和负样本数据到分类超平面的距离尽可能间隔最大,以使SVM分类器具有更好的泛化性能,提高分类精度。利用最小二乘法计算样本数据真实值与SVM模型对样本数据的预测值之间的平方损失函数来确定最优分类超平面。平方损失函数的计算表达式为:l(y,f(x))=(yf(x))2,其中,x为SVM模型输入的预测因子,f(x)为SVM模型对样本数据的预测值,y为样本数据的真实值。通过测试数据集计算最小化平方损失函数,利用最小化平方损失函数来判断当前SVM模型的预测精度是否满足要求。 通过计算SVM模型的平方损失函数是否已经最小化来判断是否满足要求,如果不满足要求,则需要重新选择核函数和参数来训练SVM模型,直到SVM模型的平方损失函数最小化,从而得到最优的SVM分类器。

[0053]

经过训练后,svm分类器的输出结果w只取两个值:-1和1。输出结果w可以根据输入的实时数据判断当前进水流量变化的稳定性。当输出结果w为-1时,说明进水流量变化较小,水量比较稳定,后期选用线性回归模型。当输出结果w为1时,说明进水流量变化较大,后期应选用决策树模型。

[0054]

s4:线性回归模型预测除磷剂的投加量。

[0055]

由于城市污水除磷过程中影响参数较多,在选用线性回归建立除磷剂投加量预测模型时,常采用多元线性回归模型。多元线性回归模型定义为:f(x1,x2,

xn)=w0+w1x1+w2x2+

+wnxn,其中 w0 为常数项,xi 为影响目标值 f(x1,x2,

xn),wi为特征参数的权重,wi表示特征参数对目标值f(x1,x2,

xn),其中 i = 1, 2,

若增加一个特征参数值x0=1,则该公式可简化为

矩阵形式 f(x)=w

x,即 f(x) 为 m

×

1 个向量,x 为 m

×

(n+1) 向量,w 为 1

×

(n+1),m表示样本数据个数,n表示样本数据的特征个数,yi为线性回归模型对第i个样本数据给出的预测目标的预测值,其中i=1,2,

,米。

[0056]

确定多元线性回归模型方程后,需要求方程的损失函数。一般线性回归模型方程采用均方误差作为损失函数,损失函数计算公式为:式中表示第i个样本数据预测的目标真实值。这样做是为了将方程组求特征参数问题转化为求最优解的问题,使损失函数最小化。一般采用最小二乘法求解。

[0057]

采用最小二乘法求解该问题,首先对所有w求偏导数,得到代表第i个样本数据的第k个特征参数的n个方程,对特征参数进行求解并矢量化得到x。

xw=x

y,w=(x

x)-1

y,从而求解多元线性回归模型的特征参数的权重,以最小化损失函数。

[0058]

在除磷剂投加量预测中,水质参数和除磷剂投加量均为特征参数xi,它们的波动会影响反应沉淀池的絮凝沉淀过程,进而影响出口总磷目标值f(x)。通过历史数据训练多元线性回归模型后,得到特征参数的常数项w0和权重值wi。然后根据不同的水质参数和除磷剂投加量,对条件下的出口总磷进行预测,判断出口总磷是否满足国家不低于0.5mg/l的指标。对多元线性回归模型进行变形,得到除磷剂投加量xi=(f(x)-w

0-w1x

1-w2x2‑…wi-1

一一一

i+1

i+1

…‑

其中,f(x)设定为污水处理厂出水中总磷排放目标值,其余参数为多元线性回归模型训练过程中计算的结果。在不同水质条件下,可以计算出合理的除磷剂投加量,以降低药剂消耗成本。除磷剂投加量即为线性回归模型的输出结果y1。

[0059]

s5:决策树模型预测除磷剂的投加量。

[0059]

如图3决策树模型预测流程图所示,决策树模型不同于线性回归模型,是典型的针对非线性数据的回归方法,当水量变化较大时,水质参数往往会发生变化,加药数据往往呈现非线性,普通的线性回归模型无法满足除磷剂投加量的预测要求,因此采用复杂度较高、非线性较强的决策树模型方法。

[0061]

假设x和y分别为特征参数和预测目标,训练数据集为d = {(x1,y1),(x2,y2)

(xm,ym)},其中为特征向量,m表示样本数据个数,n表示样本数据的特征个数。决策树模型采用启发式方法,每次划分都会遍历当前训练数据集中所有特征参数的所有值,直到找到一个最优划分点,使得在最优划分点处将整个训练数据集划分为两个子集时,损失函数最小。以样本数据中的第j个特征变量xj及其值s作为分裂变量和分裂点,定义如下两个区域r1(j,s)={x|xj≤s}和r2(j,s)={x|xj》s}。为了找到最优的j和s,要求

解决方案解决方案就是找到使得两个待划分区域的误差平方和最小的j和s,其中c1为划分区域r1内的固定输出值,c2为划分区域r2内的固定输出值。方括号内的两个min表示采用最优的c1和c2,即选取的固定输出值c1使得区域r1内的误差平方和最小,选取的固定输出值c2使得区域r2内的误差平方和最小。使得一维空间中样本均值的误差平方和最小的固定输出值即为最优固定输出值,所以这两个最优固定输出值c1和c2即为y在各自对应区域的均值。上式可以写成在找到最优的j和s之后,将训练数据集中的样本数据依次划分到上述两个区域中,划分在区域中的样本数据构成子集,两个区域又构成两个子集。 还未被划分的样本数据称为叶节点,叶节点内的样本称为元素。

[0062]

然后寻找训练数据集两个子集的最优划分点并继续划分,直至达到预设的终止条件。此时叶子节点所包含的训练数据集的均值即为叶子节点的输出值。当输入新的加药数据时,通过之前训练好的划分准则,将加药数据最终落到的叶子节点的输出值作为加药数据的预测值。在市政污水除磷剂投加量预测中,同样以水质参数和除磷剂投加量作为特征值,以出水口总磷作为该条件下的预测值。在其他条件不变的情况下,调整除磷剂投加量,可以准确计算出当前预测的出水口总磷,从而得到最合适的除磷剂投加量y2,便于污水处理技术人员根据特征参数的变化及时调整除磷剂投加量,对建立节能环保的水厂具有深远的现实意义。

[0063]

s6:数据模型的现场部署和运行。

[0064]

将训练好的SVM分类器和除磷剂投加量预测模型打包部署到污水处理工艺现场,接入实时数据;运行除磷剂投加量预测模型,计算当前状态下所需的除磷剂投加量。除磷剂投加量预测模型包括线性回归模型和决策树模型,当前状态包括当前市政污水入水流量和水质参数。

[0065]

s7:控制系统自动添加。

[0066]

磷去除剂剂量数据被传输到控制系统,控制系统会根据数据模型计算结果自动完成磷去除剂剂量。

[0067]

上面的详细说明了本发明的实施例。

技术特点:

1.一种基于线性回归和决策树模型将磷拆除剂添加到城市污水中的方法,其特征在于它包括以下步骤:使用多个数据获取组件,以获得实时数据和历史数据,并根据原始的历史数据进行量相位的数据,以获取实时数据和历史数据的量。样品和负样品根据污水的流量系数,并培训具有正样本和负样本的SVM分类器; ,将实时数据连接到磷除去剂的添加预测模型; for : the agent data to the , and the the of the agent to the data model . 2. The for agent to based on and tree model to claim 1, in that the data a flow meter, an , a , an pump and a total meter; the agent model a model and a tree model, and the data model a SVM and a agent model. 3. The for agent to based on and tree model to claim 2, in that the data the inlet flow rate, , water , agent and total of , and the with the data is used for data and data model . 4.根据权利要求1的线性回归和决策树模型,将磷去除剂添加到城市污水中的方法,根据数据预处理的特征包括:确定历史数据的相应关系,根据停留时间计算公式,删除缺失值,噪声值,在原始的历史数据中删除缺失值,以及对临时数据的修复偏移的偏移量。基于根据权利要求1的线性回归和决策树模型,其特征在于污水的计算公式小时流量系数如下:其中:k

你好

是污水的流量系数

你好

是污水的小时流量; i = 1,2,...,24;

你好

6.根据权利要求5的线性回归和根据线性树模型将去磷化剂添加到城市污水中的方法是:将历史数据划分为正面和负样品,根据污水量小时流量系数组成的正面和负样品和负样品的特定步骤,构成:选择一个标准的污水处理量的标准污水处理量k,根据污水处理范围,根据污水处理范围,

你好*

计算当前水流率和上一小时的水流量

你好

,计算公式如下:如果k

你好

≤K

你好*

,确定当前的水流入变化相对稳定,目前的历史数据被归类为负样本

你好

> k

你好*

,确定当前的水入口流量发生了很大变化,并且水体积不稳定,并且此时的历史数据分为正样品。

7.根据权利要求6的线性回归和决策树模型,将磷去除剂添加到城市污水中的方法的特征是,训练SVM分类器的输出结果W仅采用两个值:-1和1。当输出结果W采用-1时,选择了-1时,选择了一个线性回归时,将选择量为单位,将其用于单元。根据权利要求1的决策树模型是在线性回归模型和用于预测磷去除剂量的决策树模型根据水质参数而分别建立。 9.根据权利要求1的线性回归和决策树模型,将磷去除剂添加到城市污水中的方法,该模型的特征是,数据模型被部署在网站上:包括训练有素的SVM分类器,以及使用磷量剂量剂量的预测模型,以汇总和现实数据汇总了培训剂量的预测模型模型10.根据权利要求7,根据线性回归和决策树模型将磷去除剂添加到城市污水中M分类器,运行磷去除剂剂量预测模型,并计算当前市政污水流入流量和水质参数条件下所需的磷去除剂剂量。

技术摘要

该发明基于线性回归和决策树模型,将磷的去除剂添加到市政污水中,包括三个步骤:数据模型的建立,现场部署和操作以及控制系统自动添加,包括添加数据模型数据模型的现场部署和操作步骤包括将包装的数据模型部署到市政污水处理地点并访问实时数据,计算当前状态中所需的磷除去剂剂量,并控制系统以自动添加磷酸化剂的方法,根据数据模型的计算方法,将其添加到 量。每天的水量改变了市政污水,可节省计算资源,并提高计算速度和预测速度。

技术研发人员:Zhan ,Zhang ,Cheng ,Yuan Fang,Xu Wei,Li ,Pu Yifan,Lu

保护技术用户:中国环境保护水投资有限公司中国能源保护工程技术研究所有限公司。

技术开发日:2022.04.27

技术发布日期:2022/8/1

提醒:请联系我时一定说明是从浚耀商务生活网上看到的!