亚洲清洁空气中心 | 加入收藏
 
当前位置: 主页 > 你问我答

能否介绍一下源解析受体模型ME模型的基本原理、应用情况?以及Multilinear Engine(ME)与PMF、CMB模型的区别和优势、缺点是什么?

2个回答 默认排序
  • Philip K. Hopke 克拉克森大学

    Multilinear Engine (简称ME)不是一个模型,而是对模型求解的计算程序。在程序里,这些模型写作FORTRAN语言的脚本。正定矩阵因子分析模型(Positive Matrix Factorization,简称PMF)的基本概念是通过最小二乘法拟合双线性模型。双线性模型表达如下:


    式中,xij 是样本i中组分j的测量浓度,g ik 是污染源k对样本i的质量贡献,fkj 是污染源k排放的污染物每单位质量中组分j的浓度,eij 是对不适合模型的样本i中组分j的剩余方差。求解双线性模型的一种方式是使用ME,还有许多其他的求解方法包括PMF2和一些可用的交替最小二乘法(ALS)软件包。ME的优点是能够解决更为复杂的模型,如扩展模型(Expanded model)、多时间同步(Multiple time synchronization)以及多样本数据(Multiple sample type data)。更多细节请参考Hopke((J. Air Waste Manage. Assoc. 66: 237-259, 2016)书中有关“复杂模型(Complex models)”的章节。

    因此, ME与PMF、CMB很难在同一个层面上比较,可以说ME是实现PMF计算的方式之一。实际上,也可以用ME解决CMB问题。PMF和CMB之间的关键区别在于是否知道污染源的数量与性质。如果源成分谱是已知的,就可以使用PMF或CMB中的任意一个。
     
    为解决双线性问题,EPA PMF使用了特别版本的ME。如果想要解决更复杂的问题,可从Dr. Paatero (Pentti.Paatero@helsinki.fi)那儿获取 ME的完整版本,并需要学习如何使用脚本语言以便操作ME。

  • 袁自冰 华南理工大学

    目前,正矩阵因子分解(PMF)在污染物源解析中得到了非常广泛的应用。PMF是基于传统的因子分析方法,对一个数据矩阵(X)中的元素(通常是不同采样时间的污染物组分)按其不确定性给予不同权重,并在一些限定条件下(如所有矩阵元素为非负)通过对目标函数(Q)进行最小二乘法迭代运算,将数据矩阵(X)拆分成两个矩阵(G和F),分别代表不同因子对应的时间序列和组分谱。PMF的运算公式可表达为

    X = G * F + E

    其中E为残差矩阵,其元素可正可负。PMF将数据矩阵拆分成两个,属于双线性(bilinear)模型,其计算结构是固定的。

    PMF虽然得到了广泛的应用,但也存在一些问题。常见的问题就是因子的混合。由于目前尚未有可靠的方法计算数据矩阵中元素的不确定性,我们通常采用一些简单的估算方法,这不可避免地对估算的不确定性带来误差,进而影响解析结果。另外,我国的污染源排放特征较为复杂,污染源叠加传输现象较为显著,而PMF难以对共线性较强的排放源进行有效拆分,使得解析出的因子常常是几类排放源不同程度的混合。因此,除了所有矩阵元素非负以外,研究人员希望对模型计算添加进一步的限制(constraint),如根据因子谱(排放源谱)的已知信息对F矩阵进行限制,而Multilinear Engine (ME)提供了将这些限制信息加入源解析计算的功能。因此,从某种程度上讲,ME集合了PMF(数据矩阵元素非负、通过不确定性对不同元素给予不同权重)和CMB(因子谱已知,可用于限定计算)的优势,也避免了PMF(易产生因子混合)和CMB(主要贡献因子需全覆盖不能有遗漏,无法模拟二次过程)的劣势,能够得到更为可靠的解析结果。

    ME最早由芬兰科学家Pentti Paatero于1999年提出,其结构更为灵活,可用于双线性、三线性甚至多线性模型的计算。对模型计算的进一步限制可通过添加计算目标函数Q的附加项(auxiliary term)得以实现。ME-2应用共轭梯度法(Conjugate gradient algorithm)通过高斯-牛顿迭代计算最小二乘,而PMF应用乔里斯基分解(Cholesky Decomposition)及倒转代换通过高斯-牛顿迭代计算最小二乘(Paatero, 1999)。目前美国环保署推荐使用的EPA PMF v5.0 和之前的版本 EPA PMF v3.0 都是基于ME-2算法对数据矩阵进行双线性计算。ME-2中限定因子谱的功能也已经添加到EPA PMF v5.0中(USEPA,2014)。

    目前有一些研究应用ME-2和PMF对同一套数据矩阵进行源解析并对结果进行比较。总体来讲,两种方法对于贡献较大的因子解析结果基本相同,但PMF-2的解析结果存在较大的不确定性(Ramadan et al., 2003),ME-2对源的分离效果更佳(Kim and Hopke, 2007),也有研究发现ME-2可以解析出一些PMF无法解析的因子(Amato et al., 2009; Amato and Hopke, 2012)。

    参考文献
    Amato, F. et al. Quantifying Road Dust Resuspension in Urban Environment by Multilinear Engine: A Comparison with PMF2, Atmospheric Environment, 2009, 43, 2770-2780.
    Amato, F. and Hopke P.K. Source apportionment of the ambient PM2.5 across St. Louis using constrained positive matrix factorization, Atmospheric Environment, 2012, 46, 329-337.
    Kim, E. and Hopke, P.K. Source Identifications of Airborne Fine Particles Using Positive Matrix Factorization and US Environmental Protection Agency Positive Matrix Factorization, Journal of the Air and Waste Management Association, 2007, 57, 811-819.
    Paatero, P. The Multilinear Engine – A Table-driven, Least Squares Program for Solving Multilinear Problems, Including the n-Way Parallel Factor Analysis Model, Journal of Computational and Graphical Statistics, 1999, 8, 854-888.
    Ramadan, Z. et al. Comparison of Positive Matrix Factorization and Multilinear Engine for the Source Apportionment of Particulate Pollutants. Chemometrics & Intelligent Laboratory Systems, 2003, 66, 15-28.
    U.S. Environmental Protection Agency (USEPA), EPA Positive Matrix Factorization (PMF) 5.0 Fundamentals and User Guide, 2014, available at https://www.epa.gov/sites/production/files/2015-02/documents/pmf_5.0_user_guide.pdf



©2024 亚洲清洁空气中心 京ICP备18042162号-2