电子鼻中信号特征提取与传感器优化检测方案(感官智能分析)

收藏
检测样品: 食用植物油
检测项目: 信号特征提取与传感器优化
浏览次数: 211
发布时间: 2017-10-10
关联设备: 1种 查看全部
获取电话
留言咨询
方案下载

北京盈盛恒泰科技有限责任公司

金牌18年

解决方案总数: 1114 方案总浏览次数:
方案详情
采用PEN2型电子鼻系统对芝麻油的玉米油掺假进行定性鉴别和定量预测,运用主成分分析,逐步判别分析和Fisher线性判别函数变换对原始数据进行预处理,从而降低原始数据空间的维数,并用判别分析与人工神经网络对数据进行进一步分析,考察了不同的数据预处理方法的效果。判别分析结果表明,采用Fisher线性判别函数变换所得到的十个变量判别能力 强,误判率为0.61,仅有1个样品出现误判。在BP神经网络的定量预测中,采用逐步判别分析所筛选出的十个变量作为网络输入,所得的预测结果 为理想,绝对误差个体值的95置信区间 小,为(一4.71,3.38),均方误差为4.75,预测值与实际值之间有极显著的相关性,相关系数R—O.99808。

方案详情

传感技术学报CHINESE JOURNAL OF SENSORS AND ACTUATORSVol.199No.3Jun.2006第19卷 第3期2006年6月 维普资讯 http://www.cqvip.com607海铮,王:俊:电子鼻信号特征提取与传感器优化的研究第3期 Studies on Signal Feature Extraction and Sensor Optimization of an Electronic Nose HAIZheng, WANG Jun (College of Biosystems Engineering and Food Science, Zhejiang University, Hangzhou 310029, China) Abstract: An electronic nose was used to detect the adulteration of sesame oil with corn oil. In order to re-duce the dimension of the data matrix, three different variable selection techniques were employed: PCA,step-LDA and Fisher linear transformation. And then the pattern recognition technique of linear discrimi-nant analysis (LDA) and artificial neural network (ANN) were used to check the effect of the three dimen-sion reduction methods mentioned above. In the process of LDA , the Fisher linear transformation is mosteffective, the error rate was 0.61%,only 1 sample was misclassified; in the process of ANN, the resultsobtained using the ten variables selected by step-LDA were more acceptable than.others, the 95% individu-al confidence interval is (-4.71%,3.38%), the mean square of error was 4. 75, and the correlation be-tween predicted concentration and genuine concentration is 0. 998 08. Key words:electronic nose; principal component analysis; stepwise linear discriminant analysis; BP-neuralnetwork. EEACC:7230L 电子鼻信号特征提取与传感器优化的研究 海 铮,王 俊 (浙江大学生物系统工程与食品科学学院,杭州310029) 摘 要:采用 PEN2 型电子鼻系统对芝麻油的玉米油掺假进行定性鉴别和定量预测,运用主成分分析,逐步判别分析和 Fish-er线性判别函数变换对原始数据进行预处理,从而降低原始数据空间的维数,并用判别分析与人工神经网络对数据进行进一步分析,考察了不同的数据预处理方法的效果。判别分析结果表明,采用 Fisher 线性判别函数变换所得到的十个变量判别能力最强,误判率为0.61%,仅有1个样品出现误判。在 BP神经网络的定量预测中,采用逐步判别分析所筛选出的十个变量作为网络输输,所得的预测结果最为理想,绝对误差个体值的95%置信区间最小,为(一4.71%,3.38%),均方误差为4.75,预测值与实际值之间有极显著的相关性,相关系数R=0.998 08。 关键词:电子鼻;主成分分析;逐步判别分析;BP神经网络 电子鼻是一种由具有部分选择性的气敏传感器阵列和适当的模式识别系统组成,能识别简单或复杂气体的仪器。1982年,英国 Warwick 大学的学者Persuad 和 Dodd 教授用3个商品化的 SnO 气体传感器模拟哺乳动物嗅觉系统中的多个嗅觉感受器细 胞对多种复杂的有机挥发气进行了类别分析,开辟电子鼻研究之先河。此后,随着相关学科的发展,电子鼻的研究迅速发展。目前,在食品品质评价L1-2J、环境监测3以及疾病诊诊4等方面,国内外都作了不少的研究。 ( 收稿日期:2005-07-27 ) ( 基金项目:国家教育部新世纪人才支持计划资助(NCET-04-0544);国家自然科学基金资助(30571706) ) ( 作者简介:海 铮(1980-),男,硕士研究生,研究方向电子鼻的应用技术,sea333355@yahoo.com; ) 电子鼻系统中的气敏传感器阵列一般由8-32个传感器组成,并在多个时刻读入数据,所以,对于每个样品所获得的数据都在几百个以上。在这些数据中,有很多数据之间存在着极其显著的相关性,因而提供的信息也相互重叠;此外,由于某些传感器对样品气体不敏感,或对环境因子过于敏感,造成信号响应紊乱,不能提供有用信息。大量冗余信息的引人,会导致模式识别过程耗费时间长,计算精度低,系统稳定性差。对传感器所获得的原始数据进行适当的特征选择与特征提取是极为重要的,不但有利于去除数据中的冗余信息,减少进行模式识别的计算时间,而且可以省去那些对模式识别效果没有显著影响甚至有负面影响的传感器,从而对降低电子鼻的制造成本,提高系统稳定性都有一定的积极意义。在食用油的品质L5.6]检测方面,国外已有一些成功的范例。本文用电子鼻对芝麻油、大豆油及两者不同比例的混合物进行检测,采用主成分分析、逐步判别和 Fisher 线性函数变换三种方法对原始数据进行预处理,降低数据空间的维数,并用判别分析 和人工神经网络对数据进行进一步分析,以考察和比较数据经不同的预处理后模式识别的效果。 实验材料、仪器与方法 1.1实验材料 本实验采用超市选购的金龙鱼芝麻油和玉米油,并在实验前密封避光贮藏,防止其氧化变质。 1.2实验仪器 在本实验中,采用的电子鼻系统是德国 AIR-SENSE公司的 PEN2便携式电子鼻(Portable Elec-tronic nose)。PEN2 电子鼻包含10个金属氧化物传感器阵列,各个传感器的名称及性能描述见表1。本电子鼻系统所获取的数据是样品气体经过传感器时其电导率G与经活性炭过滤后的标准气体经过传感器时其电导率G。的比值,即 G/Go。系统组成主要包含下面几个部分:传感器阵列、采样通道,内置泵,控制单元和计算机。传感器工作温度为300℃. 表1 PEN2 的各传感器名称及性能特点 阵列序号 传感器名称 性能描述 备注 1 W1C 对芳香成分灵敏 甲苯,10 mL/m 2 W5S 灵敏度大,对氮氧化合物很灵敏 NO2,1 mL/m 3 W3C 对氨水、芳香成分灵敏 苯,10mL/m² 4 W6S 主要对氢气有选择性 H2,100 mL/m 5 W5C 对烷烃,芳香成分灵敏 丙烷,1 mL/m 6 W1S 对甲烷灵敏 CH3,100 mL/m 7 W1W 对硫化物灵敏 HS,1 mL/m’ 8 W2S 对乙醇灵敏 CO,100 mL/m 9 W2W 对芳香成分、有机硫化物灵敏 HS,1 mL/m 10 W3S 对烷烃灵敏 CH3,10 mL/m 1.3 实验方法及数据的获取 芝麻油与玉米油按不同比例混合,并用搅拌器搅拌均匀,其中玉米油所占比例(体积)分别为10%、20%、30%、40%、50%、60%、70%、80%、90%。九类混合样品与芝麻油和玉米油纯样品共 11类样品,每类样品分装于15支相同的带胶塞的玻璃瓶中,每瓶15 mL。盖紧瓶盖,静置1h,使其顶部气体成分稳定后,采用顶空抽样进行测量。图1所示为芝麻油与玉米油的传感器电导率比值随时间变化的曲线图。 1.4 数据获取与特征提取 电子鼻抽样检测时间为60 s,但多数数据之间高度相关,所以只选先较有代表性的15、30和60s的数据作为原始数据进行分析。 1.4.1 主成分分析(PCA) 主成分分析是将多个指标化为较少的几个综合指标的一种统计方法,在回归分析、聚类分析等过程中是一种简化数据结构的有力工具。综合指标,即主成分,是原来多个指标的线性组合。虽然这些综合指标不能直接观察,但它们之间互不相关,能反映原来多指标的信息。通常,对原始的 n 维数据进行主成分分析,可以得到n个主成分,然而在这n个主成分中,只用特征值较大的几个主成分即可反映原始数据中的大部分信息。将特征向量较小,即方差贡献率接近于零的主成分删除,对余下的主成分(通常累计方差贡献率大于85%),进行进一步的分析或处理,便可以在不丢失或很少丢失原始信息的前提下减少分析变量的数目。 1.4.2 逐步判别分析(Step-LDA) 逐步判别与逐步回归的基本思想相似,都采用有进有出的算法,即每一步都进行检验,把一个最重要的变量选入判别式,同时也考虑较早进入判别式的某些变量,如果其重要性也随着其后一些变量的选入而变化,已失去原有的重要性时,应把它及时地从判别式中剔除出去,使判别式中仅仅保留重要的变量,以达到对原有数据向量降维的目的。 1.4.3 Fisher线性函数变换 Fisher判别分析是一种基于线性映射的判别方法。这种方法实际上是致力于寻找一个最能反映组与组之间差异的投影方向,即寻找线性判别函数: 使得所有的样品经线性变换后的函数值Y应满足组内离差平方和最小,而组间离差平方和最大。通常,满足上述条件的线性函数有k(k≤p)个,当组数太大,讨论的指标太多,则一个判别函数是不够的,这时需要寻找第二个,甚至第三个线性判别函数。从而,选取判别效率最大的前 n(≤k)各判别函数,并使累计判别效率≥85%,即可在最大限度地降低映射过程中的数据信息丢失的同时,使组间离差与组内离差的比值达最大,也就使得不同类别的样品更易于区分[8]。本文即借鉴 Fisher 判别分析中这种线性映射方法对原始数据进行线性变换,达到特征提取的目的。 1.5 模式识别方法 用于电子鼻系统的模式识别方法主要有两类, 一类是基于多元统计分析的方法,另一类是基于网络的分析方法。本文分别采用多元统计中线性判别函数分析对样品进行定性判别,采用网络分析中 BP神经网络对样品进行定量预测,从而考察和比较数据经不同的预处理后的判别能力和预测效果。 1.5.1 线性判别函数分析(LDA) 线性判别函数分析是一种常规的模式识别和样品分类方法,在医学诊断、指纹识别等领域都有广泛的应用,同时也是在电子鼻系统的一种重要的模式识别方法,在很多实验中已取得了良好的效果。线性判别函数分析假定数据的条件概率呈正态分布,并且各组样品有相同的协方差矩阵。此方法通过计算未知样品与各类已知样品的马氏距离,并考虑到样品归属的先验概率,针对每一组样品计算出一个以原有变量为基础的线性判别函数,用以计算未知样品归属的后验概率。线性判别函数分析也因此而得名[1. 1.5.22人工神经网络(ANN) 人工神经网络是在人类对其大脑神经网络认识理解的基础上人工构造的能够实现某种功能的神经网络。它是理论化的人脑神经网络的数学模型,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。它实际上是由大量简单元件相互连接而成的复杂网络,具有高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统。基于误差反向传播算法(BP算法)的 BP神经网络是一种多层前向网络,采用 Sigmoid 型函数作为传递函数,可以实现输入和输出间的任意非线性映射,是目前应用最为广泛的一种神经网络,在诸如函数逼近、模式识别、数据压缩等领域有着广泛的应用110]。在电子鼻系统中,BP神经网络也是一种很好的模式识别方法,有着广泛的应用并取得了很好的效果。 2 结果与分析 2.1 特征提取 采用 Matlab 7.0软件对原始数据进行主成分分析,获得样品的各主成分得分值以及各主成分的方差贡献率和累计方差贡献率,对方差贡献率为零或接近于零的主成分予以删除,所余前十个主成分,其累计方差贡献率为99.9%。采用 SAS8.0软件进行逐步判别分析筛选变量,选取判别能力较大的前十个变量,分别为15s时的传感器1、3、4、5、6、8、9,30s时的传感器1、4、6,共涉及到七个传感器。对原始数据进行 Fisher 线性函数变换,取前十个线性函数,使数据空间降至十维,累计判别效率为 100%. 2.2 线性判别分析 交互验证法(cross-validation)是 SAS 软件中提供的一种判别方法,其具体做法是:设资料中共有n个样品,每次留下一个样品作为未知样品,用(n一1)个样品建立判别函数,将留下的样品代人判别函数,判别其归属,这样就有利于消除用全部数据建立的 判别函数再对样品进行回代时所产生的偏性。因此,在本次实验中,采用交互验证法对165个样品进行判别分析。进行分析的变量分别为主成分分析所选入的十个变量(PCA),逐步判别分析所选入的十个变量(SLDA), Fisher 线性判别函数变换后的十个变量(FLT),以及 15 s、30 s、60s时的数据和原始数据。各组数据的判别结果见表2。 表2 各类样品 的 误 判 率 单位:(%) 变量 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% total PCA 0 0 0 0 0 6.67 0 26.67 6.67 6.67 0 4.24 SLDA 0 0 0 0 0 6.67 0 6.67 6.67 6.67 0 2.42 Fisher 0 0 0 0 0 6.67 0 0 0 0 0 0.61 15 s 0 0 0 0 13.33 6.67 0 13.33 6.67 6.67 0 4.24 30 s 6.67 0 0 0 6.67 6.67 0 40 13.33 0 0 6.67 60 s 0 0 0 0 13.33 6.67 6.67 26.67 13.33 0 0 6.06 原始数据 6.67 0 0 0 0 6.67 0 6.67 0 0 0 1.82 由表2中各类样品的误判率可以看出,选用逐步判别法,Fisher 线性判别函数变换以及初始的30个变量进行判别分析所得的结果较为理想。选用初始的30个变量进行判别分析,误判率为1.82%,即有3个样品被判错;选用逐步判别函数法筛选出的10个变量进行判别误判率为2.42%,即有4个样品被判错,与选用全部变量进行判别分析所得的结果相差不多;选用其他的变量组合进行判别分析,误判率均大于4%,被误判的样品个数均在7个以上。而选用 Fisher 线性判别函数变换后的数据进行判别分析,误判率为0.61%,仅有一个样品被判错,效果明显优于其它特征提取方法。这表明采用 Fisher线性判别函数对原始数据进行变换,使得组间离差与组内离差的比值变大,也就使得不同类别的样品之间的马氏距离变大,样品也就更易于区分。 2.3BP神经网络 采用 MATLAB 软件中的神经网络工具箱构建BP神经网络,网络的基本属性见表3。首先对以各 表3神经网络的基本属性 最大迭代次数 5000 网络性能目标 0.001 最长运算时间 Inf 性能函数的最小梯度 1.00E-06 输入层传递函数 TANSIG 输出层传递函数 PURELIN 训练函数 TRAINLM 性能函数 MSE 自适应学习函数 LEARNGDM 隐含层神经元数 15 输出层神经元数 1 种方法所选人的变量进行归一化处理,而后作为网络 输入,以被测样品中芝麻油的百分含量作为输出。由每类样品中随机选取10个,共110个样品作为训练样本,以每类样品中剩下的5个样品,共55个样品作为测试样本。网络经训练样本训练之后,对测试样本进行仿真,得仿真结果,即被测样品的预测值(原始数据此处从略)。由样品的预测值与实际值之差,计算预测的绝对误差,并采用 SAS 软件计算绝对误差个体值的95%置信区间及均方误差,结果见表4。 表4绝对误差个体值的容许区间单位:(%) 变量 区间上限 区间下限 置信度 均方误差 PCA 一6.48 4.30 95 8.48 SLDA -4.71 3.38 95 4. 75 FLT -3.95 7.56 95 11.20 15 s 一9.72 21.05 95 88.89 30 s 一5.55 16.24 95 57.00 60 s -6.98 17.95 95 67.33 原始数据 -6.89 8.48 95 25.54 由表3可见,采用15 s、30 s、60 s 或全部原始数据进行网络预测时,由于蕴含了较多的冗余和干扰信息,预测效果较差。采用主成分分析,逐步判别分析和 Fisher 线性判别函数变换所得到的三组变量组合,作为网络输人时,预测效果较为理想。采用逐步判别函数法筛选出的十个变量进行网络预测,绝对分析和均方误差均最小,预测精度最高。 选用逐步判别分析所筛选的一组变量的预测结果,以被测样品中芝麻油的实际含量作为X轴,以网络对55个预测羊本的预测输出作为Y轴,利用Origin 软件作图(见图2)并进行回归分析。结果表明,实际值与预测值之间存在极显著的相关性(P<0.0001),得回归方程为y=-0.00823+0.98681x,相关系数R=0.998 08。可见,预测值与实际值较 图2 网络预测值与实际值之间的关系 为接近,说明以神经网络作为模式识别方法,用电子鼻对芝麻油的掺假进行检测,结果比较可靠。 3 总 结 (1)采用主成分分析,逐步判别分析,Fisher 线性函数变换将原始数据降至10维,与采用15 s、30 s、60 s以及原始数据的判别分析的结果进行比较,经 Fisher 线性判别函数变换所得的十个变量具有较好的辨别能力,在线性判别函数分析中误判率为0.61%,仅有一个样品出现误判。 (2)采用BP神经网络的预测结果表明,逐步判别分析所筛选出的变量组合预测精度明显高于其他的变量组合,预测值的绝对误差的95%置信区间为(一4.71%,3.38%),均方误差为 4.75。 (3)线性判别函数分析和 BP神经网络分析均取得了较好的效果,说明通过适当的特征提取,基于这两种模式识别方法,采用电子鼻对芝麻油中玉米油的掺假进行检测是十分可行的。 ( (上接第605页) ) ( [3] Frank J, Meixner H. S e nsor S y stem for I n door Air Monito- ring Using Semiconducting M etal O xides and I R -absorption [J]. Sensor and Actuators B. 2001,78:298-302. ) ( [4] Melendez J, J de Castro A, Lopez F, M eneses J. SpectrallySelective Gas Cell f or Electrooptical Infrared Compact Multi- gas Sensor[J]. S ensor and Actuators A. 1 995, 47: 417-421. ) ( [5] Dirk Rossberg, Op t ical Pr o perties of the Integrated Inf r ared Sensor[J]. Sensor and Actuators A . 1996,54:793-797. ) ( [6] Rothman L S, et al. The HITRAN Database[J]. Appl Op t , 1987, 2 6:1 0 51-1097. ) ( [7] S ilveira J P, Anguita J, Briones F, e t al. Micromachined ) ( 参考文献: ) ( [1] Corrado Di Natale, Antonella Ma c agnano, Eugenio Martinelli.The Evaluation of Quality of Post-Harvest Oranges and ApplesBy Means of an Electronic Nose[J]. Sensors and Actuators B, 2001,78:26-31. ) ( [2] 皱小波,赵杰文。电子鼻快速检测谷物霉变的研究[J].农业 工程学报,2004,20(4):121-124. ) ( [3] 张斌,宋维,符若文,章明秋,董先明,赵斌。炭黑/聚苯乙烯复 合材料在环境监测方面的应用[J].环境技术,2004, 22(5): 28-30 ) ( [4] 王平.仿生传感技术的研究进展[J].中国医疗器械杂志, 2004,28(4):235-238. ) ( [5] Rita S tella, Joseph N. B arisci, G iorgio S erra, G ordon G.Wallace, D anilo De R o ssi. C h aracterization of Olive oil by a nElectronic Nose Based o n Conducting Polymer Sensors [J]. Sensors and Actuators B, 2000, 6 3:1 - 9. ) ( [6]CGan H L,C h e Man YB, Tan C P, No r Aini I, Nazimah S A H. Characterisation o f V egetable O i ls b y S u rface AcousticWave Sensing E lectronic Nose[J]. F ood Chemistry, 2005, 89:507-518、 ) ( [7] 袁志发,周静芋.多元统统分析[M].第一版,科学出版社, 2002,188-201. ) ( [8] Ampuero S, Bosset J O. The Electronic Nose Applied to DairyProducts: a Review[J]. S ensors and Actuators B , 2 0 03, 94: 1-12. ) ( [9] Marini F, Balestrieri F, Bucci R, Magri A D, Magri A L, Marini D . S upervised P a ttern Recognition to Au t henticate I-talian Extra Virgin Olive Oil Varieties[J]. Chemometrics andIntelligent Laboratory Systems, 2 004, 73:85 - 93. ) ( [10] 许东,吴铮. 基于 MATLAB6.X的系统分析与设计一神经网络[M].第二版,西安电子科技大学出版社,2002年,19-25. ) ( Methane Sensor Based on Low Resolution Spectral M odulationof IR Absorption Radiation [J]. Sensor and Actuators B. 1998, 4 8:305-307. ) ( [8] Bauer D, Heeger M, Gebhard M, B enecke W. D esign and Fabrication of a Thermal Infrared Emitter[J]. Sensor and Ac- tuators A, 1996, 55:57-63. ) ( [9] Thierry Corman, Edvard Kalvesten, Matti H uiku, et al. NewCO2 Filters Fabricated by Anodic Bonding at Overpressure in CO2 Atmosphere[J]. S e nsor and Actuators A. 1 9 98, 6 9 :166- 171. )
确定

还剩3页未读,是否继续阅读?

不看了,直接下载
继续免费阅读全文

该文件无法预览

请直接下载查看

北京盈盛恒泰科技有限责任公司为您提供《电子鼻中信号特征提取与传感器优化检测方案(感官智能分析)》,该方案主要用于食用植物油中信号特征提取与传感器优化检测,参考标准--,《电子鼻中信号特征提取与传感器优化检测方案(感官智能分析)》用到的仪器有德国AIRSENSE品牌PEN3电子鼻