• Peer Review
  • Non-profit
  • Global Open Access
  • Green Channel for Rising Stars
Volume 10 Issue 2
Mar.  2023
Turn off MathJax
Article Contents

CUI Wenhao, ZHENG Sheng, QIN Xiongjie, ZENG Shuguang. Research on Correlation Analysis Method for Nuclear Power Operation Data Based on Multi-Scale Time Window[J]. SOUTHERN ENERGY CONSTRUCTION, 2023, 10(2): 143-150. doi: 10.16516/j.gedi.issn2095-8676.2023.02.019
Citation: CUI Wenhao, ZHENG Sheng, QIN Xiongjie, ZENG Shuguang. Research on Correlation Analysis Method for Nuclear Power Operation Data Based on Multi-Scale Time Window[J]. SOUTHERN ENERGY CONSTRUCTION, 2023, 10(2): 143-150. doi: 10.16516/j.gedi.issn2095-8676.2023.02.019

Research on Correlation Analysis Method for Nuclear Power Operation Data Based on Multi-Scale Time Window

doi: 10.16516/j.gedi.issn2095-8676.2023.02.019
  • Received Date: 2022-10-18
  • Rev Recd Date: 2022-11-28
  • Available Online: 2023-03-13
  • Publish Date: 2023-03-25
  •   Introduction  Nuclear power operation data is characterized by high dimension and large volume, and the complexity of the internal system of nuclear power plant makes it difficult to build a corresponding mechanism model. Therefore, it is very difficult to manually screen out relevant parameters from nuclear power data, and the introduction of non-relevant parameters will greatly affect the accuracy of the model. By means of improving the model accuracy, the purpose of accurate modeling can be reached.   Method  This paper proposed a correlation analysis method based on multi-scale time window. This method extracted state switch points for target parameters, classifies each sensor according to the characteristics of the data recorded by different sensors, and then designs detection windows for different kinds of sensors that meet their characteristics. The state switch detection was carried out in the corresponding time neighborhood of each sensor, and the correlation matching rate between each sensor and the target sensor was calculated to judge the correlation.   Result  Based on the actual historical operation data of nuclear power plant, the sensor parameters associated with the target sensor are selected successfully by the established correlation matching rate rule.   Conclusion  The experimental results show that the proposed method can screen out the correlation parameters more accurately. Compared with the commonly used Pearson correlation coefficient, the proposed method is more accurate.
  • [1] 荣健, 刘展. 先进核能技术发展与展望 [J]. 原子能科学技术, 2020, 54(9): 1638-1643. DOI:  10.7538/yzk.2020.youxian.0348.

    RONG J, LIU Z. Development and prospect of advanced nuclear energy technology [J]. Atomic Energy Science and Technology, 2020, 54(9): 1638-1643. DOI:  10.7538/yzk.2020.youxian.0348.
    [2] 王海洋, 荣健. 碳达峰、碳中和目标下中国核能发展路径分析 [J]. 中国电力, 2021, 54(6): 86-94. DOI:  10.11930/j.issn.1004-9649.202103141.

    WANG H Y, RONG J. Analysis on China's nuclear energy development path under the goal of peaking carbon emissions and achieving carbon neutrality [J]. Electric Power, 2021, 54(6): 86-94. DOI:  10.11930/j.issn.1004-9649.202103141.
    [3] 蔡绍宽. 双碳目标的挑战与电力结构调整趋势展望 [J]. 南方能源建设, 2021, 8(3): 8-17. DOI:  10.16516/j.gedi.issn2095-8676.2021.03.002.

    CAI S K. Challenges and prospects for the trends of power structure adjustment under the goal of carbon peak and neutrality [J]. Southern Energy Construction, 2021, 8(3): 8-17. DOI:  10.16516/j.gedi.issn2095-8676.2021.03.002.
    [4] 王鑫, 吴继承, 朴磊. “双碳”目标下核能发展形势思考 [J]. 核科学与工程, 2022, 42(2): 241-245. DOI:  10.3969/j.issn.0258-0918.2022.02.001.

    WANG X, WU J C, PU L. Consideration of the development situation of nuclear power under the goal of carbon peaking and carbon neutraulity [J]. Nuclear Science and Engineering, 2022, 42(2): 241-245. DOI:  10.3969/j.issn.0258-0918.2022.02.001.
    [5] 蒋祖跃. 秦山核电厂反应堆保护系统及其相关设备数字化改造规划和实施策略 [J]. 原子能科学技术, 2010, 44(1): 65-69. DOI:  10.7538/yzk.2010.44.01.0065.

    JIANG Z Y. Upgrading planning and executive strategy for reactor protection system and relative equipment in Qinshan nuclear power plant [J]. Atomic Energy Science and Technology, 2010, 44(1): 65-69. DOI:  10.7538/yzk.2010.44.01.0065.
    [6] 高麒瀚, 江德正. 智能化工艺系统设计平台技术在核电工程设计的应用探讨 [J]. 核科学与工程, 2014, 34(1): 125-133+141. DOI:  10.3969/j.issn.0258-0918.2014.01.020.

    GAO Q H, JIANG D Z. Study on application of intelligent process system design platform technology in nuclear engineering [J]. Nuclear Science and Engineering, 2014, 34(1): 125-133+141. DOI:  10.3969/j.issn.0258-0918.2014.01.020.
    [7] AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules in large databases [C]// Anon. Proceedings of the 20th international conference on very large data bases, Santiago de Chile, Chile, September 12-15, 1994. Santiago de Chile: Morgan Kaufmann Publishers Inc, 1994: 487-499.
    [8] 程路明, 楼平, 诸骏豪, 等. 基于APRIORI-贝叶斯优化XGBoost的电力通信网根告警预测 [J]. 电力建设, 2022, 43(1): 113-121. DOI:  10.12204/j.issn.1000-7229.2022.01.013.

    CHENG L M, LOU P, ZHU J H, et al. Root alarm prediction of power communication network applying APRIORI-Bayesian optimization XGBoost [J]. Electric Power Construction, 2022, 43(1): 113-121. DOI:  10.12204/j.issn.1000-7229.2022.01.013.
    [9] 廖孟柯, 樊冰, 李忠政, 等. 基于改进Apriori算法的配电网设备退役信息挖掘 [J]. 科学技术与工程, 2021, 21(24): 10381-10386. DOI:  10.3969/j.issn.1671-1815.2021.24.039.

    LIAO M K, FAN B, LI Z Z, et al. Mining of distribution network equipment decommissioning factors based on improved Apriori algorithm [J]. Science Technology and Engineering, 2021, 21(24): 10381-10386. DOI:  10.3969/j.issn.1671-1815.2021.24.039.
    [10] HAN J W, PEI J, YIN Y W. Mining frequent patterns without candidate generation [J]. ACM SIGMOD Record, 2000, 29(2): 1-12. DOI:  10.1145/335191.335372.
    [11] 肖永立, 刘松, 见伟, 等. 一种基于FP-growth算法的变电站二次设备缺陷分析方法 [J]. 电测与仪表, 2020, 57(12): 83-90. DOI:  10.19753/j.issn1001-1390.2020.12.013.

    XIAO Y L, LIU S, JIAN W, et al. A kind of defects analysis method for secondary device of substation based on FP-growth algorithm [J]. Electrical Measurement & Instrumentation, 2020, 57(12): 83-90. DOI:  10.19753/j.issn1001-1390.2020.12.013.
    [12] 张斌, 滕俊杰, 满毅. 改进的并行fp-growth算法在工业设备故障诊断中的应用研究 [J]. 计算机科学, 2018, 45(增刊1): 508-512.

    ZHANG B, TENG J J, MAN Y. Application research of improved parallel fp-growth algorithm in fault diagnosis of industrial equipment [J]. Computer Science, 2018, 45(Supp. 1): 508-512.
    [13] 方晓洁, 黄伟琼, 叶东华, 等. 分布式并行FP-growth算法在二次设备缺陷监测中的应用 [J]. 电力系统保护与控制, 2021, 49(8): 160-167. DOI:  10.19783/j.cnki.pspc.200715.

    FANG X J, HUANG W Q, YE D H, et al. Application of a distributed parallel FP-growth algorithm in secondary device defects monitoring [J]. Power System Protection and Control, 2021, 49(8): 160-167. DOI:  10.19783/j.cnki.pspc.200715.
    [14] 何望, 林果园. 基于FP-Growth改进算法的云服务器故障数据分析 [J]. 计算机工程与科学, 2020, 42(5): 770-775. DOI:  10.3969/j.issn.1007-130X.2020.05.002.

    HE W, LIN G Y. Analysis of cloud server fault data based on improved FP-Growth algorithm [J]. Computer Engineering & Science, 2020, 42(5): 770-775. DOI:  10.3969/j.issn.1007-130X.2020.05.002.
    [15] 纪德洋, 金锋, 冬雷, 等. 基于皮尔逊相关系数的光伏电站数据修复 [J]. 中国电机工程学报, 2022, 42(4): 1514-1522. DOI:  10.13334/j.0258-8013.pcsee.211172.

    JI D Y, JIN F, DONG L, et al. Data repairing of photovoltaic power plant based on Pearson correlation coefficient [J]. Proceedings of the CSEE, 2022, 42(4): 1514-1522. DOI:  10.13334/j.0258-8013.pcsee.211172.
    [16] 张婧, 任刚. 城市道路交通拥堵状态时空相关性分析 [J]. 交通运输系统工程与信息, 2015, 15(2): 175-181. DOI:  10.16097/j.cnki.1009-6744.2015.02.027.

    ZHANG J, REN G. Spatio-temporal correlation analysis of urban traffic congestion diffusion [J]. Journal of Transportation Systems Engineering and Information Technology, 2015, 15(2): 175-181. DOI:  10.16097/j.cnki.1009-6744.2015.02.027.
    [17] 张华, 龙呈, 胡思洋, 等. 基于层次聚类法与皮尔逊相关系数的配电网拓扑校验方法 [J]. 电力系统保护与控制, 2021, 49(21): 88-96. DOI:  10.19783/j.cnki.pspc.210075.

    ZHANG H, LONG C, HU S Y, et al. Topology verification method of a distribution network based on hierarchical clustering and the Pearson correlation coefficient [J]. Power System Protection and Control, 2021, 49(21): 88-96. DOI:  10.19783/j.cnki.pspc.210075.
    [18] 刘永阔, 谢春丽, 成守宇, 等. 核电站分布式智能故障诊断系统研究与设计 [J]. 原子能科学技术, 2011, 45(6): 688-694.

    LIU Y K, XIE C L, CHENG S Y, et al. Research and design of distributed intelligence fault diagnosis system in nuclear power plant [J]. Atomic Energy Science and Technology, 2011, 45(6): 688-694.
    [19] JUSTUSSON B J. Median filtering: statistical properties [M]//HUANG T S. Two-dimensional digital signal prcessing II: transform and median filters. Berlin Heidelberg: Springer, 1981. DOI: 10.1007/BFB0057597.
    [20] 叶林, 滕景竹, 蓝海波, 等. 变尺度时间窗口和波动特征提取的短期风电功率组合预测 [J]. 电力系统自动化, 2017, 41(17): 29-36. DOI:  10.7500/AEPS20161201016.

    YE L, TENG J Z, LAN H B, et al. Combined prediction for short-term wind power based on variable time window and feature extraction [J]. Automation of Electric Power Systems, 2017, 41(17): 29-36. DOI:  10.7500/AEPS20161201016.
  • 通讯作者: 陈斌, bchen63@163.com
    • 1. 

      沈阳化工大学材料科学与工程学院 沈阳 110142

    1. 本站搜索
    2. 百度学术搜索
    3. 万方数据库搜索
    4. CNKI搜索

Figures(4)  / Tables(4)

Article Metrics

Article views(121) PDF downloads(21) Cited by()

Related

Research on Correlation Analysis Method for Nuclear Power Operation Data Based on Multi-Scale Time Window

doi: 10.16516/j.gedi.issn2095-8676.2023.02.019

Abstract:   Introduction  Nuclear power operation data is characterized by high dimension and large volume, and the complexity of the internal system of nuclear power plant makes it difficult to build a corresponding mechanism model. Therefore, it is very difficult to manually screen out relevant parameters from nuclear power data, and the introduction of non-relevant parameters will greatly affect the accuracy of the model. By means of improving the model accuracy, the purpose of accurate modeling can be reached.   Method  This paper proposed a correlation analysis method based on multi-scale time window. This method extracted state switch points for target parameters, classifies each sensor according to the characteristics of the data recorded by different sensors, and then designs detection windows for different kinds of sensors that meet their characteristics. The state switch detection was carried out in the corresponding time neighborhood of each sensor, and the correlation matching rate between each sensor and the target sensor was calculated to judge the correlation.   Result  Based on the actual historical operation data of nuclear power plant, the sensor parameters associated with the target sensor are selected successfully by the established correlation matching rate rule.   Conclusion  The experimental results show that the proposed method can screen out the correlation parameters more accurately. Compared with the commonly used Pearson correlation coefficient, the proposed method is more accurate.

CUI Wenhao, ZHENG Sheng, QIN Xiongjie, ZENG Shuguang. Research on Correlation Analysis Method for Nuclear Power Operation Data Based on Multi-Scale Time Window[J]. SOUTHERN ENERGY CONSTRUCTION, 2023, 10(2): 143-150. doi: 10.16516/j.gedi.issn2095-8676.2023.02.019
Citation: CUI Wenhao, ZHENG Sheng, QIN Xiongjie, ZENG Shuguang. Research on Correlation Analysis Method for Nuclear Power Operation Data Based on Multi-Scale Time Window[J]. SOUTHERN ENERGY CONSTRUCTION, 2023, 10(2): 143-150. doi: 10.16516/j.gedi.issn2095-8676.2023.02.019
    • 核能作为清洁、低碳和高效的可再生能源,在应对全球气候变化中起到积极的正面作用[1-2]。我国国务院于2021年10月24日印发了《2030年前碳达峰行动方案》,其中重点提到积极安全有序发展核电[3-4]。因此,核电发展在未来的几十年里将是我国能源布局的重要部分。随着科技的发展,核电的发展也迎来了数字化[5]、智能化[6]转型。对核电运行数据进行分析,可实现对核电内部系统模型的构建。然而,由于核电系统内部结构复杂,导致需要分析的数据量非常庞大,通过人工的方式难以快速寻找到关联性参数,给系统建模带来了极大的困难。

      为了解决核电运行数据维度高、体量大、难以找到关联性参数进行建模的难题,需要对海量的核电运行数据进行关联性分析。当前,有一些较为成熟的关联性分析方法已经得到了应用。Apriori算法[7-8]是通过重复地扫描数据集获得频繁项集,再由频繁项集产生关联规则。廖孟柯提出一种基于三维矩阵的Apriori优化算法,减少了传统算法中的计算冗余,挖掘出影响配电网设备提前退役的因素频繁项集[9]。但是Apriori在每次扫描过程中都需要扫描数据集,生成大量的频繁项集,造成内存占用过大。因此韩家炜等[10]于2000年提出了FP-growth算法[11-12],该算法仅需扫描数据集两次并建立FP树,大大提高了挖掘效率。方晓洁等采用分布式并行FP-growth算法挖掘各变电站历史数据库异常信号的频繁项集和强关联关系[13]。何望等利用FP-growth并行算法能够有效地提高云平台虚拟机异常数据的关联分析效率[14]。皮尔逊系数[15]被用来反映两个随机变量之间的相关程度,也是最为常用的寻找变量间相关性的指标之一。张婧等[16]在皮尔逊相关性指标的基础上提出并采用了一种新的分析方法,借助相关性状态变化刻画了拥堵在时空中扩散的定量特征。张华等[17]使用皮尔逊相关系数算法校验同一供电区域内各节点数据的相关性,以此判断模型拓扑连接关系的正确性。

      Apriori算法和FP-growth算法是通过频繁项集来建立关联规则,这两种方法均需要将数据转化为事项,而核电厂是一个非常复杂的过程系统,具有非线性、强耦合性、不确定性、数据维度高[18]、体量大、数据变化复杂、难以将数据变化转化为事项等复杂特性,因此Apriori算法和FP-growth算法无法应用于高维核电运行数据。而皮尔逊系数对于非线性数据具有局限性且对数据中的异常点敏感。为了能够从众多传感器之中筛选出具有强关联性的传感器参数,本文提出了一种基于多尺度时间窗口[19-20]的方法来确定状态切换点,针对不同种类传感器的数据特点,对传感器做出分类,再针对不同种类的传感器,利用不同尺度的时间窗口检索传感器数据出现同步变化的时间段个数,建立基于匹配度的关联规则,有效的从高维时序数据中筛选出具有强关联性的传感器参数,利用筛选得到的关联性参数,可以更为精准地建立系统模型。在真实核电数据集中,通过核电运维人员的判断以及与其他方法的对比,验证了本文提出的算法的准确性和有效性。

    • 本次实验采用的数据集来自于中国某核电厂的真实运行数据,该数据集内含有29个传感器参数,分别为MI(电流传感器),ZV(风机开关),MY(发电机电功率),VE(反应堆热功率),PO(泵开关),MT(温度传感器),MV(电压传感器),KM(一环路平均温度,稳压器压力)。每个传感器均记录了自2019-07-01 T00:00:00至2019-12-30 T 23:59:59的运行数据,采样频率为一秒一次,总数据量高达4亿多条。对于这些传感器参数,可根据其反应的快慢将这些传感器分为3类,分别为瞬变量(MI,MV,PO,ZV),渐变量(MY,VE,KM),缓慢变量(MT)。

      图1所示,该图展示的为RCV002MI传感器所记录的数据(原始数据),该传感器记录了电流变化。图1(a)为原始图像,其中红色圆圈所圈出的部分为工作状态发生变化的时刻,图1(b)为红圈部分的放大图像,可以清楚地看到,这次状态的切换仅耗费了一个时间点(1 s),因此这一类传感器所记录到的数据可以认定为瞬变量,电压传感器、风机开关、泵开关等均划分在此类。

      Figure 1.  RCV002MI sensor data

      图2为GRE012MY传感器所记录的数据(原始数据),该传感器记录了发电机电功率的变化。图2(a)为原始图像,红圈部分为状态切换部分,图2(b)为红圈部分的放大图。可以清楚地看到在放大部分中完成一次状态切换大概需要7 000个时间点,所需时间很长,但是状态值变化比较大,符合这一类特点的可以归类到渐变量,这一类还包括有稳压器压力,反应堆热功率,液位传感器等。

      Figure 2.  GRE012MY sensor data

      图3为RCV200MT传感器所记录的数据,该传感器记录了温度的变化,图3(a)为原始图像,红圈部分为状态切换部分,图3(b)为红圈部分的放大图。可以看到一次状态切换大概需要13 000个时间点,且幅值变化不大,这一类传感器可以归类为缓慢变量,这一类主要是温度传感器。

      Figure 3.  RCV200MT Sensor data

    • 针对核电运行数据的特点,定义状态切换的标准,利用多尺度时间窗口定位状态切换发生的时间点,再通过所搜寻到的时间点在其他传感器数据的相应时间邻域检测是否有状态切换发生,最后通过匹配率大小来判断传感器之间的关联性大小。

    • 状态切换是指当数据在某一时间窗口内出现的振幅,大于或等于数据整体振幅的一定比例时,即可认定在该时间窗口内发生了状态切换。对于数据整体振幅计算如式(1)可见。

      $$ {{\rm{Data}}^*} = {{\rm{Data}}_{\max }} - {{\rm{Data}}_{\min }} $$ (1)

      式中:

      ${{\rm{Data}}_{\max }}$ ——整个时间内的传感器所记录到的最大值;

      ${{\rm{Data}}_{\min }}$ ——整个时间内的传感器所记录到的最小值;

      ${{\rm{Data}}^*}$ ——传感器在一个完整的时间周期内所出现的最大数据振幅。

      时间窗口内振幅的计算如式(2)

      $$ {{\rm{data}}^*} = {{\rm{data}}_{\max }} - {{\rm{data}}_{\min }} $$ (2)

      式中:

      ${{\rm{data}}_{\max }}$ ——窗口内的最大值;

      ${{\rm{data}}_{\min }}$ ——窗口内的最小值;

      ${{\rm{data}}^*}$ ——窗口内的最大振幅。

      对于状态切换的判断:当满足式(3)时,即可认定发生了一次状态切换,$ K $为比例系数。

      $$ {{\rm{data}}^*} \geqslant K \times {{\rm{Data}}^*} $$ (3)

      针对不同种类传感器数据的特点,本文采用不同尺度的时间窗口以及不同的比例系数去检测状态是否发生切换,对于发生状态切换时,数据变化迅速的瞬变量(电流、电压、风机等)这一类传感器,可以用小尺度的时间窗口去判断在该事件区间内是否有发生状态切换。对于渐变量(MY,VE,KM)这一类变化时间长,但是变化数值也较大的传感器,可采用中等尺度的时间窗口去检测。对于缓慢变量(温度)这一类传感器,由于一次温度变化往往会长达好几个小时,且数值变化也不大,这种需要利用更大尺度的窗口作为检测窗口。

    • 为了能够快速地确定状态切换点,本文将采用多尺度时间窗口来检测状态切换时间点,不断地缩小状态切换点出现的时间区间,最终得到发生状态的准确时间点,其基本流程如下所示:

      1)选取目标传感器。

      2)利用大尺度的时间窗口对整体数据进行监测,对检测到有状态切换的窗口予以记录,未检测到状态切换的数据片段不再做进一步检测。

      3)对检测到有状态切换的时间区域利用更小尺度的时间窗口继续检测。

      重复第2步和第3步,直至无法检测到状态切换为止,取最终检测到有状态切换的窗口的起始位置作为状态切换的发生点。

      4)输出状态切换的时间点集。

      目标传感器可选择电流,电压等一类的瞬变量,这一类传感器在系统稳定运行时,其数值虽处于波动状态,但是不会出现突然上升或者下降的情况,只有系统内部状态发生改变时,这一类传感器的数值才会出现突然上升或者下降的情形,且反应最为灵敏,状态切换会在极短的时间内完成,所能定位到的时间点也会更为准确。当目标传感器数据导入以后,先对目标数据进行整体扫描,分别记录数据的最大最小值,从而确定数据在整个时间跨度内的最大波动。先利用较大尺度的时间窗先对数据做第一次分割,对各个时间窗内的数据进行检测,如果检测到存在状态切换,即可将这个窗口内的时间区间予以保留,对不存在状态切换的数据片段可以舍弃。再利用尺度更小的窗口在之前检测到有状态切换点出现的时间片段内继续搜索,重复这一步操作。对出现了状态切换的时间段不断的利用更小的窗口去逼近,直至无法进一步找到状态切换的时间段为止,取最终时段的时间起点为状态切换发生点。

    • 对于如何判断传感器之间的相关性问题,本文提出了计算关联匹配度的解决方法,当两个传感器在系统中存在一定关联度时,其中一个传感器在检测到状态变化时,另一个传感器也会在同一时间区间内受到一定的影响(部分传感器因为所处位置,以及反应速度的问题会存在一定的滞后),那么该传感器所记录到的数据也会在该时间区间内发生一定的变化。各维数据以搜索到的每个时间点为中心点,通过属于自身分类的时间窗口判断该状态切换点的时间邻域内是否发生了状态切换情况,这样可以获得每一个传感器的数据在对应时间点的时间邻域内发生状态切换的次数。若目标传感器在整个时间内发生了n次状态切换,而某一传感器在相同的各个时间段内共出现了m次状态切换,那么可得二者之间的关联匹配度cor如式(4):

      $$ {\rm{cor}} = (m/n) \times 100\text{%} $$ (4)

      由此变量与变量间的关联度大小就转化为了匹配度的大小,对于匹配度大的传感器,可以直接认定为具有强相关性的(关联匹配度大于50%),对于部分具有一定相关性,但是是否纳入建模范围的可以采用人工复核的方式去加以判断(25%<关联匹配度<50%),对于低匹配度的可以忽略这一类传感器,不纳入建模的参数之中。可直接认定个数为A,复核可认定个数为B,实际关联个数为C,对于检测的准确率AR可按式(5)计算:

      $$ {\rm{AR}} = (A + B)/C $$ (5)
    • 为了能够获得准确的窗口取值大小,可对2019-07-01 T 00:00:00至2019-9-30 T 23:59:59这段时间内各传感器中所出现的状态切换做统计。所有传感器在3个月时间里共出现了302次状态切换,统计不同类别传感器每次发生状态切换时的振幅变化大小占整体振幅的比例,当瞬变量这类传感器取时间窗大小为状态切换点的前3 min和后3 min,比例系数取0.1。渐变量取时间窗口大小为状态切换点前3 min和后30 min,比例系数为0.08。缓慢变量取时间窗口大小为状态切换点的前3 min和后1 h,比例系数取0.03。按以上所述取值的时间窗口和系数可以识别2019-07-01 T 00:00:00至2019-9-30 T 23:59:59段内的所有状态切换。以2019-10-01 T 00:00:00至2019-12-30 T 23:59:59的数据作为本次实验数据。利用小波包对数据进行降噪,该步骤有效消除了数据中的尖峰值,有利于寻找数据波动。如图4所示,从降噪数据中挑选了RCV234MV为目标传感器,该传感器为电压传感器,属于瞬变类传感器,具有状态切换迅速且明显的特点,且该传感器最容易观测到整个系统的变化,因此选择该传感器作为目标传感器。获得状态切换时间点集以后,剩余的各维数据以各个时间点为中心,按照传感器的归类利用时间窗口判断该时间点的邻域内是否有状态切换发生,记录发生状态切换的次数并计算匹配率。同时,计算RCV234MV传感器与其他各传感器的皮尔逊相关系数,得出的结果与本文算法做对比。如图4所示,图4(a)为RCV234MV传感器的原始数据图,图4(b)为RCV234MV传感器的降噪后数据图。

      Figure 4.  RCV234MV sensor data

    • 表1所示,为对传感器RCV234MV利用多尺度时间窗口搜寻状态切换时间点,共搜寻到符合状态切换条件的点11个。

      序号时间点序号时间点
      12019-10-03T 11:31:39.0072019-11-23T 10:37:51.00
      22019-10-29T 11:22:42.0082019-11-23T 10:42:56.00
      32019-11-02T 13:45:35.0092019-12-23T 10:50:18.00
      42019-11-02T 13:54:07.00102019-12-27T 21:30:28.00
      52019-11-03T 05:11:15.00112019-12-28T 06:03:17.00
      62019-11-03T 05:14:37.00

      Table 1.  Status switch time point

      在这些时间点中,时间点1,4,6,8,9这5个时间点,为该传感器检测到电压下降的时刻,时间点2,3,5,7,10,11这6个时间点为该传感器检测到电压上升的时刻。将这些时间点以及数据集导入,检测结果如表2所示。

      序号传感器名称匹配度序号传感器名称匹配度
      1RCV202MT81.82%15RCV231MV54.55%
      2RCV203MT81.82%16RCV232MV54.55%
      3RCV205MT81.82%17RCV002MI36.36%
      4RCV206MT81.82%18DVH001ZV9.09%
      5RCV223MT81.82%19DVH002ZV9.09%
      6RCV226MT81.82%20RCV001MI9.09%
      7RCV200MT72.73%21RCV002PO9.09%
      8RCV201MT72.73%22GRE012MY0.00%
      9RCV204MT72.73%23RCP009VE0.00%
      10RCV222MT72.73%24RCP602KM0.00%
      11RCV210MT63.64%25RCP624KM0.00%
      12RCV224MT63.64%26RCV001PO0.00%
      13RCV233MV63.64%27RCV003MI0.00%
      14RCV254MT63.64%28RCV003PO0.00%

      Table 2.  Matching degree of each sensor

      表2可以清楚看到传感器1~16号这16个传感器的匹配度大于或等于50%,这证明了这些传感器与目标传感器具有很强的关联性。传感器17号RCV002MI具有4个同步变化时间段,分别在时间点8、9、10、11。这个4个时间点的领域内检测到存在状态切换的发生,但是在时间点8以前的时间里,数据基本处于平稳状态,从图像来看存在一定的关联性,经运行人员复核,认定该传感器为关联性强的传感器,之所以出现了前半部分平整的情况,原因可能是该传感器在前部分时间内出现了某种故障,没有及时检测到电流的变化,这种情况在核电厂的系统中也是一种较为常见的异常表现,但是综合来看,这个传感器仍然是强关联性的传感器。对于强相关的传感器来看,温度传感器的参数关联性最大,当RCV234MV检测到电压上升时,对于温度传感器该算法可以很好地识别,但是对于电压上升后再维持较短时间后便发生下降的情况,该算法无法准确地识别到这种情况,因为在发生这种情况时,即使电压已经下降,但是温度依然会维持一段时间的增长后再下降,且这段时间的增长会更为的平缓,由此造成了该时间窗内所检测到的温度变化并不明显,且温度增长的时间也远远超过了电压下落时间点的判断窗口区间,从而造成了判定无状态切换情况的发生。算法对于整个数据集中参数的筛选效果达到了运维人员的预期,连同目标参数,整个数据集总共含有29个传感器参数,通过算法筛选,从剩余的28个参数中筛选出了16个具有强关联性的传感器参数,1个疑似参数传感器17号RCV002MI,经过人工复核后将该参数纳入强关联参数之中,运维人员鉴定的实际关联参数为传感器1~17号。为了证明本算法的有效性,计算各个传感器与RCV234MV的皮尔逊相关系数,结果如表3所示。

      序号传感器名称系数值序号传感器名称系数值
      1RCV202MT98.0515RCV231MV96.47
      2RCV203MT97.3616RCV232MV97.78
      3RCV205MT98.3117RCV002MI66.57
      4RCV206MT98.3618DVH001ZV9.09
      5RCV223MT22.8919DVH002ZV9.09
      6RCV226MT81.8220RCV001MI4.40
      7RCV200MT94.5021RCV002PO16.93
      8RCV201MT96.8722GRE012MY17.24
      9RCV204MT97.9923RCP009VE16.84
      10RCV222MT22.4724RCP602KM0.00
      11RCV210MT99.3625RCP624KM16.97
      12RCV224MT16.8626RCV001PO4.56
      13RCV233MV98.3927RCV003MI68.75
      14RCV254MT99.4028RCV003PO49.24

      Table 3.  Pearson coefficient of each sensor %

      表3所示,皮尔逊相关系数大于0.6以上的有15个,0.4~0.6之间的有1个(该区间需人工检查),经运维人员确定,在皮尔逊系数大于0.6的传感器之中,27号传感器应该为不相关传感器,04~0.6之间的28号传感器也为不相关传感器,5号、10号、12号虽关联系数未达到强相关标准,但经过复核可认定为强相关传感器。通过皮尔逊系数准确识别出了14个传感器,误检个数为4个(5号、10号、12号、27号)。造成误检的原因有两个,首先传感器的数据从整体来看属于非线性数据,皮尔逊系数对非线性数据有一定的局限性。其次是因为部分数据中存在异常值,皮尔逊系数对异常值敏感,因此造成了通过皮尔逊系数来判断传感器的关联性时出现误检的状况。

      表4所示,为两种检测方法准确率的对比结果,本文提出的算法的可以准确地寻找到全部的17个关联性参数。与皮尔逊系数法相比,本文算法的误检率更低,更加适用于非线性的高维核电数据,其准确率完全可以满足运维人员的要求。

      方法正确检出数/
      复核认定数/
      误检数/
      实际数/
      准确率/
      %
      本文算法 16 1 0 17 100
      皮尔逊系数 14 0 4 17 82.35

      Table 4.  Accuracy of detection

    • 针对高维核电数据难以靠人工寻找相关变量的难题,本文提出了基于多尺度时间窗口的核电运行数据关联性分析方法,该关联分析方法有效地解决了高维核电数据无法快速准确地寻找到关联性参数的问题。在真实核电数据集中,通过对比实验和核电运维人员的判断,验证了本文提出的算法的准确性和有效性。系统建模可以降低寻找建模参数的难度,提高建模精度。

Reference (20)

Catalog

    /

    DownLoad:  Full-Size Img  PowerPoint
    Return
    Return