首页 > 环保节能

MBR中膜污染的人工神经网络预测研究进展

来源:环保节能网
时间:2022-08-01 10:02:15
热度:

MBR中膜污染的人工神经网络预测研究进展膜生物反应器(MBR)作为一种新型废水处理技术在污水处理方面具有广阔的应用前景。但是,膜污染是制约MBR进一步发展的瓶颈性问题。近年来,随着

膜生物反应器(MBR)作为一种新型废水处理技术在污水处理方面具有广阔的应用前景。但是,膜污染是制约MBR进一步发展的瓶颈性问题。近年来,随着数学算法及计算机技术的发展,将人工神经网络(ANN)等机器学习算法应用于MBR的膜污染预测成为研究的热点。总结了膜污染的影响因素,探讨了基于经典数学模型膜污染预测的优缺点,综述了近年来国内外学者运用简单ANN、优化算法ANN和深度学习ANN对MBR膜污染预测的研究,提出优化算法ANN与深度学习ANN在面对复杂环境下更具优势。此外,还探讨了当前运用ANN机器学习算法进行膜污染预测存在的缺陷,指出ANN模型在中试和工业化规模的MBR膜污染预测中应用较少,并对其未来的发展进行了展望。

膜生物反应器(Membrane bioreactor,MBR)是一种将活性污泥法与膜分离技术相结合的废水处理技术,具有出水水质好、负荷高和占地面积小等优点〔1-2〕。目前,大型(10 000 m3/d)和超大型(100 000 m3/d)MBR污水处理厂在包括中国、美国和欧洲等世界各地相继建成并投入使用。据预测,中国的大型MBR污水处理厂将超过300座,总污水处理规模可达1 500万t/d〔2〕。但是,膜污染会导致跨膜压差(Transmembrane pressure,TMP)的上升和膜通量的下降,增加MBR的运行成本,成为限制MBR广泛应用的瓶颈性问题〔3〕。

机器学习(Machine learning,ML)是一种基于以往经验或数据进行分类与回归的技术,不仅被运用于农业、气候、安全、教育、医学等行业〔4〕,也被广泛运用于污水处理领域。人工神经网络(Artificial neural network,ANN)作为一种机器学习模型,不仅具有参数少、预测性能好、泛化能力强等优点〔5〕,而且具有极强的非线性映射能力、学习能力和黑箱建模能力。因此,应用ANN模型进行膜污染预测无需考虑复杂的膜污染中间过程,只需考虑与膜污染相关的指标即可。石宝强等〔6〕早在2006年就综述了ANN在MBR膜污染预测中的应用研究,但是随着对MBR膜污染机理的深入研究和ANN模型理论与技术的发展,亟需新的综述对近年来的研究进行总结。而F. SCHMITT等〔7-8〕虽然综述了人工智能用于预测膜污染的研究,但是欠缺对传统数学模型与神经网络模型差异的深入分析。基于此,笔者简述了影响膜污染的因素,对比了传统数学模型与人工神经网络模型的差异与优劣,总结了近年来ANN模型在膜污染预测中的应用及优缺点,并对其未来的发展进行了展望。

1 膜污染的影响因素

膜材料、反应器操作条件和污泥混合液特性是与膜污染密切相关的主要因素〔9〕,其涉及到的具体参数见图1。

由图1可知,膜污染的影响因素众多且相互影响,因此很难厘清各自的具体作用。例如,进水水质、污泥停留时间(Sludge retention time,SRT)和水力停留时间(Hydraulic retention time,HRT)等操作条件的改变不仅会直接影响膜污染,而且会导致污泥混合液特性发生变化,进而改变膜污染速率〔10〕。

早期研究人员建立了关于操作条件、膜通量、过滤滤阻等参数的数学模型〔11-15〕。此后,有研究建立了表达污泥混合液特性〔例如混合液悬浮固体浓度(Mixed liquid suspend solids,MLSS)、颗粒粒径(Particle size distribution,PSD)、溶解性微生物产物(Soluble microbial products,SMP)等〕与膜污染关系的数学模型〔16-18〕。但是,这些传统的数学模型一般为指数式经验模型,往往需要通过诸多假设来简化计算,且各参数物理意义不明确,存在预测精度低和通用性差等问题〔6-7〕。因此,开发能够更加精准预测膜污染的模型对膜污染控制及其机理研究有重要意义。

膜污染模型的构建需要选择合适的影响因子作为输入变量,并寻找变量与膜污染之间的关系。因此,厘清各膜污染因素之间的相互作用及其对膜污染的影响是构建膜污染预测模型的前提条件。

1.1 膜材料性质

膜材料的性质包括膜的材质、亲疏水性和粗糙程度等〔19〕,这些性质均会对污染物在膜表面的迁移转化产生显著影响,进而影响膜污染。例如,Y. JEONG等〔20〕比较了Al2O3陶瓷膜与聚偏氟乙烯(Polyvinylidene fluoride,PVDF)膜污染状况,结果发现陶瓷膜具有更低的膜污染速率。膜的亲疏水性也与膜污染密切相关,大量研究通过表面改性和共混改性法提高了膜表面的亲水性能,从而减缓了膜污染〔21〕。此外,膜表面粗糙程度也与膜污染有关,例如有学者发现粗糙的膜表面有利于胶体颗粒在膜上的积聚,引发膜孔堵塞,从而导致严重的膜污染〔19〕。

1.2操作参数

不同的MBR系统操作条件也会影响膜污染,主要包括进水水质、运行温度、SRT、HRT、错流流速和曝气强度等。SRT与HRT是影响MBR处理效能、污泥混合液特性和膜污染的重要因素。一般认为SRT的增加会降低污泥活性和絮体大小,此外较长的SRT促进了内源性衰变和细胞裂解,导致SMP的增加〔22〕。例如,在厌氧MBR的研究中,Zhi HUANG等〔23〕比较了不同SRT(30 d、60 d、∞)对膜污染的影响,结果表明在较长的SRT下厌氧MBR中会积累较多的蛋白质与多糖,MLSS增加,从而增加了膜污染速率。对于HRT而言,较短的HRT会导致有机负荷的增加,从而导致微生物分泌更多的胞外聚合物(Extracellular polymeric substances,EPS)和SMP,从而提升膜污染速率。例如,N. FALLAH等〔24〕比较了不同HRT对膜污染的影响,结果表明随着HRT的降低,EPS和SMP显著增加,污泥混合液的黏度也显著增加,导致了较高的膜污染速率。此外,通过在膜表面增加错流流速和曝气强度等物理剪切方式,减少颗粒物在膜表面的沉积也是减缓膜污染的常见方法。Yingyu AN等 〔25〕在厌氧MBR中发现,一定范围内增加含甲烷生物气曝气强度能够减缓膜污染,但是过高的曝气强度会破坏污泥絮体,导致污泥颗粒平均粒径降低,从而更易形成致密的膜污染层,同时膜污染速率也会提高。

1.3 污泥混合液特性

对膜污染存在影响的污泥混合液特性主要包括MLSS、EPS和SMP等。尽管MLSS并不是影响膜污染的主要因素,但是过高的MLSS(>15 g/L)会增加混合液的黏度,导致膜污染速率的提高,过低的MLSS(<6 g/L)则会降低SRT并增加食物微生物比率,同样导致较高的膜污染速率〔26〕。EPS和SMP主要是由微生物生长代谢和衰败过程中所释放的蛋白质、多糖、核酸、脂类物质以及腐殖酸等有机物组成,其也被证明与膜污染密切相关,有研究表明EPS中多糖和蛋白质的含量与膜污染速率呈正相关关系〔27〕。此外,SMP不仅可以吸附在膜表面,而且可以堵塞膜孔,从而降低膜面积并提高膜污染速率。

2 膜污染预测模型的相关研究

2.1 经典数学模型

在过去几十年里,研究人员相继构建了表达污泥混合液特性和运行条件等与膜污染关系的经验公式,并建立了经典数学模型,其部分代表性成果见表1。

经典串联阻力模型是一种使用达西定律来描述不同膜污染层的过滤滤阻模型,数十年来被广泛用于膜通量的预测〔11〕。基于该模型,B. TANSEL等〔12〕构建了通量模型,在死端过滤与错流过滤初期成功地预测了通量下降到60%所需的时间。S. CHANG等〔13〕结合达西定律与Hagen-Poisenille公式〔14〕构建了膜纤维半径与膜通量关系的模型,描述了中空纤维膜中的膜污染情况。J. HERMIA等〔15〕基于膜通量下降的孔隙阻塞机制,根据膜孔堵塞情况选取不同n值(n=0,1,1.5,2),建立了通量预测模型以解释膜通量与膜污染间的关系。

研究人员还构建了污泥混合液特性与膜污染间的数学模型。例如M. F. R. ZUTHI等〔16〕以滤饼层模型与阻塞模型为基础,构建了SMP与膜污染间的半经验数学模型,对TMP的变化进行了精准的预测。T. SATO等〔17〕建立了MLSS、COD与过滤滤阻之间的关系公式,其预测误差为±24%。此外,Fangang MENG等〔18〕基于MLSS、PSD和EPS,构建了膜污染预测模型,用以阐明污泥混合液特性与膜污染的关系。

尽管经典数学模型在膜污染预测方面取得了一定的成果,但是膜污染是一个受进水特性、微生物活动、过滤模式等多因素影响的复杂动态过程,这些经典数学模型往往为了简化仅考虑部分影响因素或在建立模型过程中设置诸多假设,例如,基于串联阻力定律的预测模型虽然有广泛的应用,但并没有考虑生物膜的生长和不可逆污染物的形成等作用对膜污染的影响〔28〕,因而在实际应用中不可避免会存在一定的误差。

2.2 机器学习常见算法

机器学习能从大量历史数据中挖掘其隐藏的规律,并做出分类或回归预测。机器学习常见算法及优缺点见表2〔29-33〕。

由表2可知,机器学习能够弥补传统的数学模型预测精度低、实际应用效果差等缺点〔29-33〕。目前机器学习已被运用到MBR膜污染的研究中,不少学者使用随机森林、SVM和多元回归等来建立与膜污染相关的预测模型。随机森林是一种以决策树为基学习器的集成算法,李威威等〔31〕采用随机森林算法预测膜通量,通过模型计算得到的预测值与真实值的平均误差仅3.98%。SVM具有的核函数可以解决非线性问题,梁楷〔32〕基于SVM建立的膜污染预测模型有效地预测了膜通量,平均误差仅为2.63%。多元回归能选取自变量的最优组合共同预测因变量,Zhan WANG等〔33〕通过多元回归建立了化学清洗模型,通过模型预测通量恢复率,对减缓膜污染起到了指导性作用。尽管以上机器学习算法能够在膜污染预测方面获得较高的预测精度,但是仍然存在一定的局限性,例如,虽然随机森林对数据集的适应能力很强并具有较快的运算速度,但其往往忽略数据集之间的相关性,导致预测精度下降。

鉴于膜污染过程的复杂性和非线性,简单的机器学习只能粗略表示变量之间的关系,无法取得较高的预测精度。近年来,由于ANN能够通过学习非线性的复杂关系来构建数学模型,并且具有较强的泛化能力,对未知数据具有较好的预测效果,因此,部分学者逐渐将其应用于膜污染的预测。对Web of Science上2006年至2020年运用ANN算法研究膜污染的文献数量进行统计,结果见图2。

由图2可知,从2016年开始,关于ANN在膜污染方面研究的文献数量迅速增加,可见ANN已经成为研究膜污染预测及控制的重要工具。

2.3 人工神经网络算法

ANN是一种模仿动物神经网络行为特征进行分布式并行信息处理的算法。其简单拓扑图见图3。

如图3所示,ANN信息处理功能的实现主要依靠神经节点的输入输出、神经元的阈值及连接权值大小的调整。ANN的预测性能可以通过均方根误差(Root mean square error,RMSE)、决定系数R2、相对误差Error等参数来评估,其计算分别见公式(1)~(3)。

公式(1)~(3)中,yt(i)、y(i)yt(i)、y(i)分别表示第i个预测和输出值,yˆŷ表示所有n个数据所预测的平均值。RMSE被用来衡量模型预测值与真实值的偏离程度,其值越接近于0则表示预测值越接近真实值,决定系数R2越接近于1则表示模型的拟合效果越好。

人工神经网络在MBR的应用中具有诸多功能,其中一种功能是对MBR中水质进行预测。例如,Yuhang CAI等〔34〕运用小波神经网络(Wavelet neural networks,WNN)对船舶废水COD与氨氮去除率进行模拟,其R2分别为0.999与0.997,可为反应器的运行与调控提供良好的参考。此外,A. R. PENDASHTEH等〔35〕成功构建了一种处理含油高盐废水的水质预测模型,采用该模型对水质进行预测,结果表明,废水中COD、总有机碳(Total organic carbon,TOC)和油脂的预测值与真实值较为接近,R2达到0.982。

ANN预测模型的另一个功能是预测膜污染并运用敏感性分析来识别影响膜污染的关键因素。例如A. R. ALKMIM等〔36〕运用多层感知器神经网络(Mutilayer perception neural networks,MLPNN)对膜透水率进行预测,R2可以达到0.964,且计算得出混合液挥发性悬浮固体浓度(Mixed liquid volatile suspended solids,MLVSS)对膜透水率的变化贡献最大。H. HAZRATI等〔37〕利用反向传播神经网络(Back propagation neural networks,BPNN)模型对TMP进行预测,其R2=0.999,且发现MLSS、HRT和运行时间3个变量均对TMP具有较大的影响。

2.4 人工神经网络算法的分类及在膜污染中的应用

对图2所统计的运用ANN算法研究膜污染的文献进行分类并统计,结果见图4。

图4(a)根据不同用法将ANN算法划分为简单人工神经网络、结合优化算法的神经网络和深度学习神经网络(Deep learning neural networks,DLNN)3类。图4(b)展示了不同神经网络文献占比。由图4(b)可知,在统计的82篇文献中,82.93%的研究采用简单神经网络构建输入变量与目标参数的模型,另有13.41%的研究采用了结合优化算法的神经网络,而基于深度学习神经网络的研究所占比例较小,不到5%。

笔者汇总了2016—2020年在MBR中运用不同人工神经网络算法模拟膜污染的部分研究〔36-43〕,结果见表3。

目前在MBR膜污染预测中常用的简单人工神经网络主要有MLPNN、BPNN和径向基函数神经网络(Radical basis function neural networks,RBFNN)等。这些简单神经网络均包括输入层、隐藏层、输出层,但是又各具特点。MLPNN的不同层之间采用全连接的方式传递结果;BPNN的输出结构采用前向传播方式,误差采用反向传播方式进行;RBFNN则采用径向基函数作为激活函数,它的输出是输入的径向基函数和神经元参数的线性组合。大量研究证明基于简单ANN的预测模型具有较高的预测精度,例如F. SCHMITT等〔39〕在AO-MBR中利用MLPNN预测TMP,并构建进水水质(总氮、总磷、硝酸盐)与TMP的模型关系,其R2为0.850。尽管简单人工神经网络在膜污染预测方面具有较高的精度,但是仍存在拟合时间长、参数众多且无法解决某些最优化问题等缺点。

在简单神经网络基础上结合优化算法,能够通过改善训练方式来最小/最大化损失函数,具有加快神经网络训练速度、快速寻找参数最优值以及提高模型预测精度等优点。应用于膜污染预测的常见优化算法包括遗传算法(Genetic algorithm,GA)和粒子群算法(Particle swarm optimization,PSO)等。其中,GA是基于生物体进化规律模型化问题的求解过程,具有优越的优化性能,被广泛运用于机器学习和信号处理等领域〔44〕。S. A. MIRBAGHERI等〔45〕采用MLPNN预测TMP及膜透水率,并用GA算法对权值进行优化,结果证实优化后的模型具有更高的预测精度。PSO则是一种基于智能体的仿生优化算法,在求解全局最优解方面具有较大的优势,可以完成神经网络连接权值的训练、结构设计和特征选择等。刘志峰等〔46〕研究了一种PSO-BPNN,用粒子群算法代替传统的梯度下降算法,结果表明优化后的模型具有更高的预测准确度,平均误差从2.35%下降至0.83%。但是,结合优化算法模型的建立与参数优化过程需要耗费大量的时间,限制了其的广泛应用。

此外,简单ANN和结合优化算法的ANN的预测性能高度依赖于样本量,并且在训练过程中往往会陷入局部最优状态,从而导致模型的预测稳定性较差。近年来,DLNN由于能够有效弥补简单ANN和结合优化算法ANN的不足,并挖掘数据的深度信息而被广泛研究,其主要包括深度置信网络(Deep belief network,DBN)、卷积神经网络(Convolutional neural networks,CNN)、堆叠式自动编码器(Stacked auto-encoders,SAE)网络等。通常,DLNN是一种可以有效而灵活地表达高度变化的非线性的算法,具有强大的学习能力和非线性映射能力〔47〕。Honggui HAN等〔43〕开发了一种基于自组织深度置信网络(Self-organizing deep belief network,SDBN)的膜透水率的预测方法,这种方法可以通过调整模型结构及参数提高模型预测精度,与简单ANN相比,该模型具有更高的精度(RMSE为0.872)。在一些情况下,深度神经网络的预测效果可能比结合优化算法的ANN更佳。Shuai SHI等〔48〕基于堆叠降噪自动编码器(Stacked denoising auto-encoders,SDAE)深度学习神经网络建立了MBR的性能预测模型,结果发现与GA-BPNN模型相比,其具有更高的R2及更低的均方误差(Mean square error,MSE)。尽管深度学习神经网络具有更高的预测精度,但是目前使用深度神经网络在MBR中进行建模的研究相对较少,其原因可能是一方面深度学习神经网络的复杂性较高,模型构建的时间远超简单ANN,另一方面使用简单ANN已经可以满足大多数的研究任务。

综上所述,目前在MBR膜污染预测模型中,简单神经网络因高预测精度与高效性,在短时间内仍然是研究人员运用的主流工具。但是,随着优化算法的运用以及深度神经网络的开发,结合优化算法的ANN与深度学习ANN在面对更复杂环境下更具优势,有望替代简单神经网络成为未来研究膜污染预测模型的主要工具。

2.5 ANN在中试MBR膜污染预测中的应用

虽然研究已经证实ANN在MBR膜污染预测上具有较高的性能,但是由于技术设备规模与废水特性的差异,实验室小试规模反应器的操作参数往往与实际的大规模反应器有明显的区别,因此,推动ANN在中试规模MBR膜污染中的预测研究意义重大。Y. J. CHOI等〔49〕收集了中试规模的浸没式MBR的长期运行数据,并构建了膜化学清洗后的通量、膜过滤时间及进水水质与膜透水率间的ANN模型,该模型R2可达0.950,实现了在中试规模下对MBR膜污染的精准预测。尽管如此,目前相关研究仍大多停留于小试阶段,在针对实际废水的中试MBR以及污水处理厂中应用依然较少。因此亟需根据中试及实际污水处理厂长期运行的数据建立ANN膜污染预测模型,从而更加精准地预测实际污水处理中MBR的膜污染状况。

3 结论与展望

目前,膜污染仍然是阻碍MBR广泛应用的瓶颈性问题,近年来,ANN模型因变量简单、预测精度高等优点被用于MBR膜污染的预测。但是研究表明,ANN模型用于MBR膜污染预测研究仍存在以下缺陷,是未来研究的重要方向:

(1)ANN本质上属于“黑箱”模型,目前由于神经网络结构的特殊性难以对中间过程进行解释。因此,未来的研究可以侧重于通过解析神经网络的复杂结构来厘清影响因子对膜污染的具体作用。

(2)ANN模型存在权值多、建模过程长等缺陷。因此未来膜污染预测模型的发展趋势是优先使用更多优化的线性和非线性数据分析方法对数据进行降维或特征提取,从而减少数据的复杂程度,进而提高模型预测的精度并减少建模时间。

(3)目前ANN模型应用于中试和工业化规模的MBR膜污染预测较少,亟需基于长期实际运行的数据建立ANN膜污染预测模型,构建完备的预测体系,为调整污水处理厂运行操作条件提供技术支持,进而提高其运行效率、减缓膜污染并降低污水处理成本。