权利要求:
1.一种基于数据挖掘的户变关系辨识方法,其特征在于包括以下步骤: 步骤S1,采集台区下各层级设备数据,所述各层级设备数据包括变压器处总表、馈线监测单元LTU与用户处设备的有功电量、无功电量、电压幅值和有功功率; 步骤S2,以电压波动相似度作为距离标准,采用DBSCAN聚类算法对台区内设备进行聚类算法处理,形成相应的聚类中心和噪声点,并将聚类中心和噪声点分别标记为本台区用户设备和疑似非台区用户设备; 步骤S3,首先将标记为本台区用户设备的电量作为整体,然后提取疑似非台区用户设备电量并与本台区用户设备电量进行组合,比较组合后的电量与本台区总体消耗电量的相关程度,进而对提取的疑似非台区用户设备是否为本台区用户设备进行判断确认。 2.根据权利要求1所述基于数据挖掘的户变关系辨识方法,其特征在于:步骤S2所述DBSCAN聚类算法具体步骤包括: 首先,采用电压波动相似度值dist作为各个节点间的距离,并设置与中心点的距离参数E,以及距中心距离为E的空间内点的数量的阈值MinPts,然后导入各节点间电压波动相似度的(电压时间序列)数据集;所述各个节点间的距离dist通过式(1)计算获得: 式中,dist为两个设备节点间电压波动相似度值,Sim为两个向量A和B的夹角余弦值,取值范围在-1~1之间,Ai和Bi分别为向量A和B的各维度分量,n为向量A和B拥有的维度分量数量; 然后,任选数据集中一点统计其E邻域内数据点数n,并与MinPts进行比较,如果当n≥MinPts时,则将其标记为异常点,作为疑似非台区用户设备;否则,将该点标记为高密度点,并对其E邻域内所有点进行相同操作; 最后,根据密度可达关系最大化形成聚类,直至每个点被访问后,输出聚类结果。 3.根据权利要求1所述基于数据挖掘的户变关系辨识方法,其特征在于:步骤S3采用Apriori数据挖掘算法,具体包括以下步骤: (1)将本台区用户设备作为整体,并从步骤S2得到的疑似非台区用户设备中提取任意数量项用户设备,并与本台区用户设备整体进行组合,得到组合t,t={S1,S2,L,Sk,L,Sn},Sk为第k个用户设备S的电量,n为组合t中用户设备个数,称组合t为n项集;进而得到包含不同数量用户设备的组合ti,j的数据集D,D={t1,1,t1,2L t1,n,t2,1,t2,2L t2,nL ti,jL tn,n},ti,j为数据集D下的子集,表示包含i个用户设备的第j个组合,n为所有用户设备总个数; (2)首先,获取初始条件:根据下式(2)的电量上限约束条件,从数据集D中得到所有满足该条件的1项集L1,L1={t1,1,t1,2,L t1,k,L,t1,p},p≤n; AL,k<λAL (2) 式中,AL,1为馈线L下第k个用户设备的电能,AL为馈线L输送的总电能,λ为馈线L的线损系数; (3)对L1中子集和进行两两组合,如果则将两者的元素进行合并,得到新的子集C2, (4)如果C2中子集t2,k′任何一个1项集不在L1中或不满足公式(3)的约束,则将t2,k′从C2中删除得到新的集合L2, 式中,AL,j为馈线L下第j个用户设备的电能,AL为馈线L输送的总电能,λ为馈线L的线损系数; (5)假设k-1项集为Lk-1,将Lk-1组合中子集和进行两两组合,如果满足的条件,则将两者的元素相加,得到新集合Ck,Ck={tk,1′,tk,2′,Ltk,h′,L,tk,q′}; (6)如果Ck中的子集tk,h′的任何一个k项集不在Lk中或不满足公式(4)的约束条件,则将tk,h′从Ck中删除,从而得到Lk,Lk={tk,1,tk,2,L,tk,q}, 式中,AL,j为馈线L下第j个用户设备的电能,AL为馈线L输送的总电能,λ为馈线L的线损系数; (7)重复步骤(5)和(6)直到生成新的项集为空,得到所有项集L1~Lk,停止运算; (8)对得到的L1~Lk项集进行扫描,删除不满足公式(5)下限约束条件的数据集,从而得到满足所有电能约束条件的从属节点集; 式中,AL,j为馈线L下第j个用户设备的电能,AL为馈线L输送的总电能,λ为馈线L的线损系数; (9)最后,对步骤(8)得到的从属节点集设备的电量按公式(1)进行余弦值计算得到夹角余弦值sim,并设置最小余弦相似度阈值min Sim,按下式(6)进行比较: sim>min Sim (6) 式中,sim为从属节点集中设备的电量的夹角余弦值,min Sim为设置的最小余弦相似度阈值; 符合上式(6)的组合为满足强相关且相似度最大的组合方案,即得到正确的户变从属关系关系。 4.根据权利要求3所述基于数据挖掘的户变关系辨识方法,其特征在于:步骤(9)中国所述最小余弦相似度阈值min Sim的取值范围为0.8<min Sim<1.0。 5.根据权利要求3所述基于数据挖掘的户变关系辨识方法,其特征在于:所述馈线L的线损系数为台区存在分布式电源时的综合线损系数。 6.根据权利要求2所述基于数据挖掘的户变关系辨识方法,其特征在于:所述与中心点的距离参数E为0.050~0.060,距中心距离为E的空间内点的数量的阈值MinPts为3。