对象导出三支概念格的矩阵粗糙熵约简

胡凯欣 , 马建敏 , 刘权芳

山西大学学报(自然科学版) ›› 2025, Vol. 48 ›› Issue (04) : 713 -724.

PDF (792KB)
山西大学学报(自然科学版) ›› 2025, Vol. 48 ›› Issue (04) : 713 -724. DOI: 10.13451/j.sxu.ns.2024028
信息科学

对象导出三支概念格的矩阵粗糙熵约简

作者信息 +

Matrix Rough Entropy-based Reductions of Object-induced Three-way Concept Lattices

Author information +
文章历史 +
PDF (810K)

摘要

属性约简是形式概念分析的重要研究问题,寻求高效的属性约简方法也是关注热点。本文在形式背景中引入矩阵粗糙熵,探讨对象导出三支概念格(Object-induced Three-way Concept Lattice,简称OE-概念格)上基于矩阵粗糙熵的属性约简方法。首先将OE-对象粒矩阵与粗糙熵相结合,定义OE-概念格的OE-矩阵粗糙熵,基于OE-对象粒矩阵的相似性提出OE-矩阵相似熵,研究它们的性质;其次在形式背景上定义OE-概念格的矩阵粗糙熵协调集和矩阵粗糙熵约简集,给出基于矩阵粗糙熵的协调集判定定理;利用OE-矩阵相似熵引入属性的重要性度量,进一步给出获取矩阵粗糙熵属性约简的方法和算法;最后在UCI(University of California, Irvine)数据集上进行属性约简实验,对于属性量小于10的数据集和属性量大于10的数据集,约简时间分别平均缩短了69.1%和97.5%,进而验证了该算法更适用于大样本数据。

Abstract

Attribute reduction is an important research issue in formal concept analysis, and seeking efficient attribute reduction methods is also a hot topic of concern. This paper studies attribute reductions of the object-induced three-way concept lattices by introducing matrix rough entropy into the formal context. Firstly, the OE-matrix (object-induced three-way matrix) rough entropy of the OE-concept lattice is defined by combining the OE-object granular matrix with rough entropy, and OE-matrix similarity entropy based on the similarity of OE-object granular matrix is proposed and the related properties of them are discussed. Secondly, the matrix rough entropy consistent set and matrix rough entropy reduction set of the OE-concept lattices are defined. Then the judgment theorems for the matrix rough entropy consistent set are given. The importance measure of attributes applying OE-matrix similarity entropy is proposed, by which the method and corresponding algorithm for obtaining matrix rough entropy attribute reduction are furtherly investigated. Finally, experiments of attribute reduction were conducted on the UCI (University of California, Irvine) dataset. The experimental results showed that for datasets with the count of attribute less than 10 and datasets with the count of attribute greater than 10, the reduction time was reduced by an average of 69.1% and 97.5%, respectively, confirming that the algorithm is more suitable for the large sample data.

Graphical abstract

关键词

形式背景 / 对象粒矩阵 / 矩阵粗糙熵协调集 / 矩阵相似熵 / 属性约简

Key words

formal context / object granular matrix / matrix rough entropy consistent set / matrix similarity entropy / attribute reduction

引用本文

引用格式 ▾
胡凯欣,马建敏,刘权芳. 对象导出三支概念格的矩阵粗糙熵约简[J]. 山西大学学报(自然科学版), 2025, 48(04): 713-724 DOI:10.13451/j.sxu.ns.2024028

登录浏览全文

4963

注册一个新账户 忘记密码

0 引言

由德国数学家Wille提出的概念格理论1(也称为形式概念分析理论),是一种数据处理工具。该理论以序理论和完备格为理论基础,以形式背景和形式概念为研究对象来表达和处理概念与概念间的层次关系2。概念格作为数据分析的一种数学工具,已经被广泛应用于信息检索、知识发现、数据挖掘3-6等领域。

属性约简是简化数据结构,去除数据分析中冗余信息的重要工具,也是形式概念分析的重要研究内容之一。张文修等7首次将辨识属性矩阵引入形式概念分析中,提出了保持概念格整体结构不变的属性约简方法。Qi8将文献[7]的方法进行改进,提出了只需比较上下邻关系的形式概念来构造辨识矩阵的方法。随着发展,概念格属性约简理论框架不断丰富,主要包括基于格结构9-10、基于不可约元11-12以及基于粒计算13-15的属性约简方法。形式概念由外延及内涵构成,外延为对象子集,内涵为属性子集。由于一个形式概念寻找对象共同具有的属性,而未考虑共同不具有的属性,故Qi等16将三分类即三支决策思想17与形式概念分析相结合,提出对象/属性导出概念格(Object-induced/Attribute-induced Three-way Concept Attice,简称OE/AE-概念格)理论。三支概念结合正算子和负算子同时表达共同具有和共同不具有两种语义,蕴含信息更加丰富,更符合实际。三支概念格提出以来,三支概念格的形式背景属性约简也是热点关注问题。Ren等18分别从粒计算、不可约元及格结构等角度研究了OE-概念格和AE-概念格的属性约简问题,分别给出了四种约简方法,并探究了各方法之间的关系。常欣欣等19改进了OE-概念格粒约简中的可辨识函数,改进后的方法可不用构造OE-概念格即可求出粒约简。由于形式背景为二元关系表,可视为布尔矩阵,故张呈玲等20借助布尔矩阵理论,研究了保持OE-概念格对象粒矩阵不变的属性约简问题。

信息熵21作为一种处理不确定性的度量工具,且已被广泛应用于解决形式背景中的属性约简问题。Li等22用信息熵计算属性权重来获得形式背景的属性约简。Singh等23将信息熵加权方法应用于模糊概念格中进行属性约简。粗糙熵24是用以衡量不完备信息系统中知识的不确定性方法。黄兵等25将引入了一般二元关系下的粗糙熵来刻画知识的粗糙性和粗集粗糙性。李美争等26将粗糙熵引入形式背景中,将所有概念的外延看作每个元素的邻域来定义粗糙熵进行概念格的属性约简。接着,陈东晓等27从信息粒的角度出发,提出了基于信息熵研究形式背景属性约简的方法。贺青青等28将布尔矩阵与信息熵相联系,提出了基于矩阵熵的形式背景属性约简方法。将信息熵应用于三支概念格的属性约简研究较少。吴荣等29结合OE-对象粒和信息熵定义了OE-概念格的熵协调集和熵约简。

在当今大数据时代,数据爆炸式增长,对海量数据进行有效处理成为大势所趋,对大数据下属性约简效率的要求也更高。而矩阵能对海量数据进行快速运算,是一种高效的数据处理工具。为解决数据量庞大导致的约简时间长、效率不够高等问题,本文将OE-对象粒矩阵与粗糙熵结合,提出基于矩阵粗糙熵的OE-概念格属性约简新方法,该方法首先将OE-对象粒矩阵引入粗糙熵,提出OE-矩阵粗糙熵,应用OE-矩阵粗糙熵引入形式背景上OE-概念格的矩阵粗糙熵约简,进而给出判定矩阵粗糙熵协调集的方法,最后借助OE-对象粒矩阵的相似性,引入OE-矩阵相似熵,给出属性的重要性度量,由此构造获取OE-概念格矩阵粗糙熵约简的算法。

1 预备知识

定义130 三元组U,A,I称为形式背景,其中U=x1,x2,,xn为非空有限对象集,A=a1,a2,,am为非空有限属性集,二元关系IU×A,对任意xUaAx,aI表示对象x具有属性ax,aI表示对象x不具有属性a。Ganter和Wille30给出了形式背景上的一对算子:对任意XUBA

X*=aAxX,x,aI,B*=xUaB,x,aI,

X*表示X中对象共同具有的属性集合,B*表示共同具有B中所有属性的对象集合。若X*=BB*=X,称X,BU,A,I上的形式概念,XB分别称为X,B的外延和内涵。所有形式概念构成的集合记为LU,A,I

基于公式(1),Qi等定义了U,A,I上的一对补算子16:对任意XUBA

X*¯=aAxX,x,aI,B*¯=xUaB,x,aI,

称其为负算子,称公式(1)中算子为正算子。

S是非空集合,PS为集合S的幂集,DPS=PS×PS。在DPS上定义集合间的运算16:对任意A,BC,DDPS

(1) A,BC,D=AC,BD,A,B (C,D)=(AC,BD);

(2) A,Bc=Ac,Bc

(3) A,BC,DACBD

定义216U,A,I是形式背景。对任意XUB,CA,定义算子

X<=X*,X*¯
B,C>=xUxB*xC*¯=B*C*¯

称算子对<,>为形式背景U,A,I上的对象导出三支算子,简称OE-算子。

X,B,C满足X<=B,CB,C>=X,称X,B,C为OE-概念,XB,C分别称为X,B,C的外延和内涵。所有OE-概念构成的集合记为LOEU,A,IX,B,C,Y,D,E  LOEU,A,ILOEU,A,I上的序关系“”定义为:X,B,CY,D,EXYB,CD,E。其上确界与下确界定义为:

X,B,CY,D,E=XY<>,B,CD,E
X,B,CY,D,E=XY,B,CD,E><

LOEU,A,I,为完备格,称为U,A,I的对象导出三支概念格,简称OE-概念格16

对任意xU,有x<>,x<LOEU,A,I, 称为OE-对象粒概念。对任意BA,称U,B,IBU,A,I的子形式背景,其中IB=I(U×B)。子形式背景U,B,IB上的OE-算子记为<B>B,则XUC,DAX<A=X<X<B=X<(B,B)(C,D)>B=(C,D)>A=C,D>

取值为0或1的矩阵称为布尔矩阵,其运算性质如下:

性质131M=aijn×mN=bijn×mP=cijm×p是布尔矩阵, 则以下性质成立:

(1) MNaijbijinjm

(2) MN=aijbijn×mMN=aijbijn×m

(3) MP=dijn×p,其中dij=1kmaikckj

(4) M-N=aij1-bijn×m

(5) M=1-aijn×m

Mi,:M:,j分别为矩阵M的第i行和第j列,Mi,j为矩阵Mi行第j列所对应的元素。对任意XUX的特征向量为λX=Xx1,Xx2,,Xxn,其中Xxi=1xiX

定义320U,A,I是形式背景。记rij=1xi,ajI。称MI=rijn×mI的关系矩阵。称M+=MIMIT为正对象粒矩阵,称M-=MIMIT为负对象粒矩阵,其中M+i,:=λxi**M-i,:=λxi*¯*¯MITMI的转置。

对任意xU,有x<>=x**x*¯*¯,由正对象粒矩阵和负对象粒矩阵可引入OE-对象粒矩阵。

定义420U,A,I是形式背景。MII的关系矩阵。令M=M+M-,其中Mi,:=λxi<>,称M为OE-对象粒矩阵。对任意BAMB=MB+MB-为子形式背景U,B,IB的OE-对象粒矩阵,其中

MB+=MIRBMIRBTMB-=MIRBMIRBT

RB是任意一行均为λBU×A阶矩阵。显然MBi,:=λxi<B>B

运用定义4可快速求出形式背景及其子背景的所有OE-对象粒概念的外延。

性质2U,A,I是形式背景。对任意B,CAxU

(1)若C=A-Bx<A>A=x<B>Bx<C>CMA=MBMC

(2)若CBAx<A>Ax<B>Bx<C>CMAMBMC

证明 (1)对任意xUBA,由定义2可得,x<B>B=x*B*Bx*¯B*¯B。由公式(1)、(2)可得x*A*A=x*B*Bx*C*Cx*¯A*¯A=x*¯B*¯Bx*¯C*¯C,故有x<A>A=x<B>Bx<C>C。对任意xiU,由定义4知 MAi,:=λxi<A>A=λxi<B>Bxi<C>C=λxi<B>Bλxi<C>C=MBi,:MCi,:,由xi的任意性得MA=MBMC

(2)由定义2知,对任意BA,有x<B>B=x*B*Bx*¯B*¯B。当CBA时,由公式(1)x*A*Ax*B*Bx*C*Cx*¯A*¯Ax*¯B*¯Bx*¯C*¯C。由此可得x<A>Ax<B>Bx<C>C。故对任意xiU

MAi,:MBi,:MCi,:。即MAMBMC

应用正、负算子提出的OE-概念格相较于经典概念格表达的信息更加丰富。针对数据爆炸式增长带来的庞大形式背景,利用矩阵能高效快速处理海量数据,和粗糙熵能用以衡量知识的不确定性的特点,结合OE-对象粒矩阵和粗糙熵提出OE-矩阵粗糙熵,研究基于OE-矩阵粗糙熵的OE-概念格的属性约简理论。通过定义OE-矩阵相似熵引入属性的重要性度量,研究OE-概念格的矩阵粗糙熵属性约简方法。

2 OE⁃概念格的OE⁃矩阵粗糙熵

文献[25]定义了一般二元关系下的粗糙熵。下面由OE-对象粒矩阵引入OE-概念格上的OE-矩阵粗糙熵。

定义5U,A,I是形式背景。对任意BA,定义B的OE-矩阵粗糙熵为

EMRB=-1λUi=1Ulog21MBi,:

其中MBi,:表示行向量MBi,:中非零元的个数。

定理1U,A,I是形式背景。对任意B,CA

(1)CBEMRBEMRC

(2)对任意xiUxi<B>B=xi<C>CEMRB=EMRC

证明 (1)由CB及性质2(2)可知,MBMC,故xiUMBi,:MCi,:,由定义5得EMRBEMRC

(2)若对任意xiUxi<B>B=xi<C>C,则有MBi,:=MCi,:MBi,:=MCi,:。故由定义5得EMRB=EMRC

定理1给出了OE-概念格上OE-矩阵粗糙熵的单调性,以及OE-矩阵粗糙熵与OE-对象粒之间的关系。MMB之间共有的零的基数可以反映属性集AB所对应的OE-对象粒矩阵的相似性,由此给出两属性集合间OE-矩阵相似熵的定义。

定义6U,A,I是形式背景。对任意BA,定义B关于A的OE-矩阵相似熵为

EMSBA=-1λUi=1Ulog2MBi,:MAi,:MAi,:

定理2U,A,I是形式背景。对任意CBA, 有

(1) EMSBC=0;

(2) EMSBAEMSCA

证明 (1)由CB及性质2知MBMC,故对任意xiUMBi,:MCi,:,则MBi,:MCi,:MBi,:MCi,:=MCi,:。由定义6知

EMSBC=-1λUi=1Ulog2MCi,:MCi,:=0

(2)由CB及性质2知MBMC,故对任意xiUMBi,:MCi,:,则MBi,:MCi,:MBi,:MAi,:MCi,:MAi,:, 由定义6得EMSBAEMSCA

3 OE-概念格的矩阵粗糙熵约简

下面讨论形式背景上OE-概念格的矩阵粗糙熵约简方法。

定义7U,A,I是形式背景。对任意BA,若EMRB=EMRA,称B为OE-概念格的矩阵粗糙熵协调集。若B为OE-概念格的矩阵粗糙熵协调集,且对任意aBEMRB-aEMRA,称B为OE-概念格的矩阵粗糙熵约简。

ReA=BABU,A,I中OE-概念格的矩阵粗糙熵约简}。若aReA,称a为核心属性,记所有核心属性所构成的集合为CoreA

定理3U,A,I是形式背景。对任意aAaCoreAEMRA-aEMRA

证明aCoreA,则aReA。若EMRA-a=EMRA,则存在BA-a,使EMRB=EMRA且对任意bBEMRB-bEMRA,这与aReA矛盾。故EMRA-aEMRA

EMRA-aEMRA。若存在BReAaB,则EMRB=EMRA。 由BA-aA及定理1得EMRA-a=EMRA,矛盾。故aCoreA

推论1U,A,I是形式背景。对任意aAaCoreAEMRA-a=EMRA

定理4U,A,I是形式背景。DAE=A-DMDME分别为子形式背景U,D,IDU,E,IE的OE-对象粒矩阵。若MDME,则D为OE-概念格的矩阵粗糙熵协调集。

证明ED=A及性质2(1)可知MDME=MA,故由MDME可得MA=MD。于是EMRD=EMRA,即D为OE-概念格的矩阵粗糙熵协调集。

定理5U,A,I是形式背景。DAD为OE-概念格的矩阵粗糙熵协调集当且仅当EMSDA=0

证明D为OE-概念格的矩阵粗糙熵协调集,由定义7及定理1知,对任意xiU,有MDi,:=MAi,:MDi,:=MAi,:,则(MDi,:)(MAi,:)=MAi,:,故EMSDA=0

EMSDA=0可得,对任意xiU,有(MDi,:)(MAi,:)=MAi,:,则MDi,:MAi,:,即MDMA,由DA及性质2得MDMA,故MD=MA。由定理1和定义7得D为OE-概念格的矩阵粗糙熵协调集。

文献[29]给出了OE-概念格的熵协调集和熵约简。设U,A,I是形式背景,对任意BA,OE-概念格上B的信息熵定义为HB=-1UxUlog2x<B>BU表示集合的基数。若HB=HA,称B为OE-概念格的熵协调集。若HB=HA且对任意CBHCHA,则称B为OE-概念格的熵约简集。

定理6U,A,I是形式背景。对任意BA

(1)B为OE-概念格的矩阵粗糙熵协调集当且仅当B为OE-概念格的熵协调集;

(2)B为OE-概念格的矩阵粗糙熵约简当且仅当B为OE-概念格的熵约简。

证明 (1)设B为OE-概念格的矩阵粗糙熵协调集,则EMRB=EMRA,故对任意xiU,有MBi,:=MAi,:λxi<B>B=λxi<A>Axi<B>B=xi<A>AHB=HA,故B为OE-概念格的熵协调集。

(2)设B为OE-概念格的矩阵粗糙熵约简,则EMRB=EMRA且对任意bBEMRAEMRB-b。由(1)知HB=HA。若存在b0B,使得HB-b0=HA,则EMRA=EMRB-b0,故B-b0为OE-概念格的矩阵粗糙熵协调集,与B为OE-概念格的矩阵粗糙熵约简矛盾。故B为OE-概念格的熵约简。

B为OE-概念格的熵约简集,由(1)知B为OE-概念格的矩阵粗糙熵协调集。若存在b0B,使得EMRB-b0=EMRA,可得对任意xUx<B-b0>B-b0=x<A>A,则HB-b0=HA,与B为OE-概念格的熵约简集矛盾。故B为OE-概念格的矩阵粗糙熵约简集。

定理6说明OE-概念格的矩阵粗糙熵约简与熵约简等价。

定义7U,A,I是形式背景。对任意BAaBa关于B的内重要度定义为:

Sinnera,B=EMSB-aA-EMSBA

对任意BAaA-Ba关于B的外重要度:

Soutera,B=EMSBA-EMSBaA

由定义7知,a关于B的内重要度是将aB中删除时的一致性损失,a关于B的外重要度是将a添加至B中的一致性提高程度。由属性重要度可给出核心属性的判定定理。

定理7U,A,I是形式背景。对任意aAaCoreASinnera,A>0

证明 Sinnera,A=EMSA-aA-EMSAA=EMSA-aA,由于aCoreA,则A-a不是矩阵粗糙熵协调集,由定理5知EMSA-aA>0,故Sinnera,A>0

aCoreA,则至少存在一个矩阵粗糙熵协调集BA-a。由定理2知EMSBAEMSA-aA,由于Sinnera,A=EMSA-aA>0,则EMSBA>0,与B为矩阵粗糙熵协调集矛盾,故aCoreA

定理7说明,核心属性关于A的内重要度均大于零,即CoreA=aASinnera,A>0

推论2U,A,I是形式背景。对任意aAaCoreASinnera,A=0

定理8U,A,I是形式背景。BAB是OE-概念格的矩阵粗糙熵约简集当且仅当EMSBA=0且对任意aB,有Sinnera,B>0

证明 由定理5及定理7可得。

由定理7和定理8可给出OE-概念格的矩阵粗糙熵约简算法:先求出每个属性的内重要度,得到核心属性集,进而判断核心属性集是否为矩阵粗糙熵约简,若不是,则通过计算外重要度给核心属性集中添加外重要度最大的属性,直到得到OE-概念格的矩阵粗糙熵协调集,从粗糙熵协调集中删除冗余属性得到约简。由此给出OE-概念格的矩阵粗糙熵约简算法(Algorithm of Attribute Reduction Based on Matrix-rough Entropy,ARMRE算法):

ARMRE算法 OE-概念格的矩阵粗糙熵约简算法

输入: 形式背景U,A,I

输出: 矩阵粗糙熵约简P

Let CoreA=P=

For aii=1,2,,m in A

If Sinnerai,A>0

Let CoreA=CoreAai

Break

End If

End For

Do //如果P不是约简集,则循环

Let P=CoreAQ=A-P,Get EMRP,Get EMRA

For b in Q

If Souterb,P=maxcQSouterc,P

Let P=Pb

End If

End For

While EMRPEMRA

For ai in P //删除P中的冗余属性

If Sinnerai,P=0

Let P=P-ai

End If

End For

Print(P) //输出约简集P

在算法中,最多计算A次属性重要度,因此找出核心属性的时间复杂度为OU2A2。计算OE-矩阵粗糙熵的时间复杂度为OU2A。判断是否为OE-矩阵粗糙熵约简的时间复杂度为O2A。删除冗余属性的时间复杂度为OU2A2。因此该算法的综合时间复杂度为OU2A2+2A

例1表1给出形式背景U,A,I,其中U=x1,x2,x3,x4,x5A=a,b,c,d,e

表1及定义4可求得

MI=1010101010100011100101110MA=1000001000001000001000001MA-a=1000001000001000001000001

计算得Sinnera,A=EMSA-aA=0。同理Sinnerb,A=-15log2916Sinnerc,A=-15log281256Sinnerd,A=0Sinnere,A=0。由定理6可得,b,c为核心属性,a,d,e为非核心属性。

B=b,c,验证B是否为OE-概念格的矩阵粗糙熵约简。由λB=(0,1,1,0,0)RB=0110001100011000110001100MB=1000001010001000101000001,求得EMRB=-15log214EMRA,故B不是OE-概念格的矩阵粗糙熵约简。计算a,d,e的外重要度:Soutera,B=-15log2916Souterd,B=-15log2916Soutere,B=-15log2916

由于属性a,d,e的外重要度相等,任取一属性添加至B中,如C=a,b,c,由λC=(1,1,1,0,0)RC=1110011100111001110011100MC=1000001000001000001000001,算得EMRC=EMRA,且Sinnera,C=-15log2916Sinnerb,C=-15log2916Sinnerc,C=-15log2916。故C=a,b,c为OE-概念格的矩阵粗糙熵约简。同理可求得b,c,db,c,e也是OE-概念格的矩阵粗糙熵约简。

4 实验分析

为验证形式背景上OE-概念格的矩阵粗糙熵约简的有效性,从UCI公开数据集中选取了10组数据构造形式背景。该10组数据的选取从对象数量增大及属性数量增大的角度进行了考虑,为了验证在大数据量下本文方法的约简效率,选取的数据集中分别包含了对象数量较大或属性数量较大的数据集。其中,离散型数据集为Lung Cancer、Car、Chord Finger和SCADI,连续型数据集为Chemical Composion、Cloud、Gait Classfication和Urban Land,其余为包含离散型数据和连续型数据的混合型数据集,如表2所示。

将选取的UCI数据集中的原始数据转化为形式背景:设U,A,F为信息系统,信息函数f:U×AV,任意属性aA的均值和标准差记为meanastda。对任意xU,定义二元关系IU×A:x,aIfx,a-meana<stda,则信息系统U,A,F对应转化为形式背景U,A,I

表2中的UCI数据集转化为形式背景后进行属性约简实验,得到本文所提算法在各数据集下的约简时间,并与文献[29]中的算法进行约简时间的对比,最后通过绘制约简时间对比图,直观形象的总结出本文所提方法在约简时间上的优势。文献[29]受三支概念格粒约简的启发,基于OE-对象粒提出了基于信息熵的OE-概念格属性约简方法。本文结合OE-对象粒矩阵和粗糙熵提出了基于矩阵粗糙熵的OE-概念格属性约简方法,并用内重要度得到核心属性集,以外重要度对核心属性集增添属性来得到协调集,进而得到约简集的思想设计了算法。将文献[29]中的算法记为AROG(Algorithm of Attribute Reduction Based on Object-induced Granular)算法,用Matlab计算两种方法在以上十组数据集的约简时间,为了排除算法耗时随机性的影响,每个算法重复20次,然后计算其耗时平均值,对比两种算法的约简时间(表3)。

表3实验结果可知,本文所提方法的约简时间更短,因此在处理样本量较大的数据集时,本文所提方法时间成本更低。图1为两算法在表2所示10个数据集上的约简时间对比图。

图1可直观明显的看出本文所提方法的时间运行效率更高,在处理数据量越大的数据集时,特别是属性数量越大时,时间优势越明显。

5 结论

本文将粗糙熵引入OE-概念格中,结合OE-对象粒矩阵提出基于矩阵粗糙熵的OE-概念格的属性约简方法。首先提出OE-概念格的OE-矩阵粗糙熵的定义,利用OE-对象粒矩阵的相似性定义了OE-矩阵相似熵,讨论了它们的性质;引入了形式背景上OE-概念格的矩阵粗糙熵协调集和矩阵粗糙熵约简集,给出矩阵粗糙熵协调集的判定定理;基于OE-矩阵相似熵给出属性的重要性度量,进而给出获取OE-概念格矩阵粗糙熵约简的算法。并通过对比实验得出本文所提方法时间成本更短,更适用于大样本数据。本文所提方法只在形式背景上进行了讨论,未考虑属性权重对约简的影响,且对三支概念格中属性导出三支概念格的属性约简未作研究。下一步可研究加权矩阵粗糙熵的属性约简方法,同时在本文研究基础上探讨属性导出三支概念格的约简方法,和不完备形式背景或决策形式背景的三支概念格属性约简问题。

参考文献

[1]

WILLE R. Restructuring Lattice Theory: An Approach Based on Hierarchies of Concepts[C]//RIVAL I. Ordered Sets. Dordrecht: Springer, 1982: 445-470. DOI: 10.1007/978-94-009-7798-3_15 .

[2]

胡小康. 基于模糊关系的形式概念分析方法研究[D]. 太原: 山西大学, 2017.

[3]

HU X K. Research on Formal Concept Analysis Method Based on Fuzzy Relation[D]. Taiyuan: Shanxi University, 2017.

[4]

ZOU C F, DENG H F, WAN J F, et al. Mining and Updating Association Rules Based on Fuzzy Concept Lattice[J]. Future Gener Comput Syst, 2018, 82: 698-706. DOI: 10.1016/j.future.2017.11.018 .

[5]

HAO F, YANG Y X, MIN G Y, et al. Incremental Construction of Three-way Concept Lattice for Knowledge Discovery in Social Networks[J]. Inf Sci, 2021, 578: 257-280. DOI: 10.1016/j.ins.2021.07.031 .

[6]

ZOU L, LIN H M, SONG X Y, et al. Rule Extraction Based on Linguistic-valued Intuitionistic Fuzzy Layered Concept Lattice[J]. Int J Approx Reason, 2021, 133: 1-16. DOI: 10.1016/j.ijar.2020.12.018 .

[7]

QIN K Y, LIN H, JIANG Y T. Local Attribute Reductions of Formal Contexts[J]. Int J Mach Learn Cybern, 2020, 11(1): 81-93. DOI: 10.1007/s13042-019-00956-z .

[8]

张文修, 魏玲, 祁建军. 概念格的属性约简理论与方法[J]. 中国科学E辑: 信息科学, 2005, 35(6): 628-639. DOI: 10.1360/112004-104 .

[9]

ZHANG W X, WEI L, QI J J. Theory and Method of Attribute Reduction of Concept Lattice[J]. Sci China Ser E, 2005, 35(6): 628-639. DOI: 10.1360/112004-104 .

[10]

QI J J. Attribute Reduction in Formal Contexts Based Onanewdiscernibility Matrix[J]. J Appl Math Comput, 2009, 30(1): 305-314. DOI: 10.1007/s12190-008-0174-9 .

[11]

岳晓威, 彭莎, 秦克云. 基于面向对象(属性)概念格的形式背景属性约简方法[J]. 计算机科学, 2020, 47(1): 436-439. DOI: 10.11896/jsjkx.191100011 .

[12]

YUE X W, PENG S, QIN K Y. Attribute Reduction Method of Formal Background Based on Object-oriented Concept Lattice[J]. Comput Sci, 2020, 47(1): 436-439. DOI: 10.11896/jsjkx.191100011 .

[13]

万青, 马盈仓, 李金海. 基于直观图的三支概念获取及属性特征分析[J]. 计算机科学与探索, 2022, 16(12): 2879-2889. DOI: 10.3778/j.issn.1673-9418.2104120 .

[14]

WAN Q, MA Y C, LI J H. Three-way Concept Acquisition and Attribute Characteristic Analysis Based on Pictorial Diagrams[J]. J Front Comput Sci Technol, 2022, 16(12): 2879-2889. DOI: 10.3778/j.issn.1673-9418.2104120 .

[15]

万仁霞, 李梅, 苗夺谦. 净化属性对偶背景下完全格的形式概念分析[J]. 山西大学学报(自然科学版), 2022, 45(1): 77-86. DOI: 10.13451/j.sxu.ns.2021063 .

[16]

WAN R X, LI M, MIAO D Q. Characterization of Formal Concept Analysis for Complete Lattice in the Clarified Attribute Dual Context[J]. J Shanxi Univ Nat Sci Ed, 2022, 45(1): 77-86. DOI: 10.13451/j.sxu.ns.2021063 .

[17]

CORNEJO M E, MEDINA J, RAMÍREZ-POUSSA E. On the Use of Irreducible Elements for Reducing Multi-adjoint Concept Lattices[J]. Knowl Based Syst, 2015, 89: 192-202. DOI: 10.1016/j.knosys.2015.07.003 .

[18]

WANG Z, QI J J, SHI C J, et al. Multiview Granular Data Analytics Based on Three-way Concept Analysis[J]. Appl Intell, 2023, 53(11): 14645-14667. DOI: 10.1007/s10489-022-04145-4 .

[19]

NIU J J, CHEN D G. Incremental Calculation Approaches for Granular Reduct in Formal Context with Attribute Updating[J]. Int J Mach Learn Cybern, 2022, 13(9): 2763-2784. DOI: 10.1007/s13042-022-01561-3 .

[20]

WANG Z, SHI C J, WEI L, et al. Tri-granularity Attribute Reduction of Three-way Concept Lattices[J]. Knowl Based Syst, 2023, 276: 110762. DOI: 10.1016/j.knosys.2023.110762 .

[21]

QI J J, WEI L, YAO Y Y. Three-way Formal Concept Analysis[C]//International Conference on Rough Sets and Knowledge Technology. Cham: Springer, 2014: DOI: 732-741.10.1007/978-3-319-11740-9_67 .

[22]

YAO Y Y. An Outline of a Theory of Three-way Decisions[C]. Berlin Heidelberg: Springer, 2012: 1-17. DOI: 10.1007/978-3-642-32115-3_1 .

[23]

REN R S, WEI L. The Attribute Reductions of Three-way Concept Lattices[J]. Knowl Based Syst, 2016, 99: 92-102. DOI: 10.1016/j.knosys.2016.01.045 .

[24]

常欣欣, 秦克云. 基于对象导出三支概念格的形式背景粒约简方法[J]. 计算机科学, 2018, 45(10): 225-228. DOI: 10.11896/j.issn.1002-137X.2018.10.041 .

[25]

CHANG X X, QIN K Y.Approach for Granular Reduction in Formal Context Based on Objects-induced Three-way Concept Lattices[J]. Comput Sci, 2018, 45(10): 225-228. DOI: 10.11896/j.issn.1002-137X.2018.10.041 .

[26]

张呈玲, 李进金, 林艺东. 基于OE-概念格的形式背景属性约简[J]. 计算机工程与应用, 2021, 57(15): 82-89. DOI: 10.3778/j.issn.1002-8331.2006-0325 .

[27]

ZHANG C L, LI J J, LIN Y D. Attribute Reduction in Formal Contexts Based on OE-concept Lattices[J]. Comput Eng Appl, 2021, 57(15): 82-89. DOI: 10.3778/j.issn.1002-8331.2006-0325 .

[28]

SHANNON C E. A Mathematical Theory of Communication[J]. Bell Syst Tech J, 1948, 27(3): 379-423. DOI: 10.1002/j.1538-7305.1948.tb01338.x .

[29]

LI J L, HE Z Y, ZHU Q L. An Entropy-based Weighted Concept Lattice for Merging Multi-source Geo-ontologies[J]. Entropy, 2013, 15(12): 2303-2318. DOI: 10.3390/e15062303 .

[30]

SINGH P K, CHERUKURI A K, LI J H. Concepts Reduction in Formal Concept Analysis with Fuzzy Setting Using Shannon Entropy[J]. Int J Mach Learn Cybern, 2017, 8(1): 179-189. DOI: 10.1007/s13042-014-0313-6 .

[31]

LIANG J Y, XU Z B. The Algorithm on Knowledge Reduction in Incomplete Information Systems[J]. Int J Unc Fuzz Knowl Based Syst, 2002, 10(1): 95-103. DOI: 10.1142/s021848850200134x .

[32]

黄兵, 周献中, 史迎春. 基于一般二元关系的知识粗糙熵与粗集粗糙熵[J]. 系统工程理论与实践, 2004, 24(1): 93-96. DOI: 10.3321/j.issn: 1000-6788.2004.01.016 .

[33]

HUANG B, ZHOU X Z, SHI Y C. Entropy of Knowledge and Rough Set Based on General Binary Relation[J]. Syst Eng Theory Pract, 2004, 24(1): 93-96. DOI: 10.3321/j.issn: 1000-6788.2004.01.016 .

[34]

李美争, 李磊军, 米据生, 概念格中基于粗糙熵的属性约简方法[J]. 计算机科学, 2018, 45(1): 84-89. DOI: 10.11896/j.issn.1002-137X.2018.01.013 .

[35]

LI M Z, LI L J, MI J S, et al. Rough Entropy Based Algorithm for Attribute Reduction in Concept Lattice[J]. Comput Sci, 2018, 45(1): 84-89. DOI: 10.11896/j.issn.1002-137X.2018.01.013 .

[36]

陈东晓, 李进金, 林荣德, 基于信息熵的形式背景属性约简[J]. 模式识别与人工智能, 2020, 33(9): 786-798. DOI: 10.16451/j.cnki.issn1003-6059.202009003 .

[37]

CHEN D X, LI J J, LIN R D, et al. Attribute Reductions of Formal Context Based on Information Entropy[J]. Pattern Recognit Artif Intell, 2020, 33(9): 786-798. DOI: 10.16451/j.cnki.issn1003-6059.202009003 .

[38]

贺青青, 马建敏, 丁娜. 形式背景上基于矩阵信息熵的矩阵熵约简[J]. 南京大学学报(自然科学), 2023, 59(1): 98-106. DOI: 10.13232/j.cnki.jnju.2023.01.010 .

[39]

HE Q Q, MA J M, DING N. Matrix Information Entropy Based Matrix Entropy Reduction in Formal Contexts[J]. J Nanjing Univ Nat Sci, 2023, 59(1): 98-106. DOI: 10.13232/j.cnki.jnju.2023.01.010 .

[40]

吴荣, 张文娟, 李进金. 对象导出三支概念格的熵属性约简[J]. 华侨大学学报(自然科学版), 2021, 42(5): 693-700. DOI: 10.11830/ISSN.1000-5013.202106031 .

[41]

WU R, ZHANG W J, LI J J. Entropy Attribute Reduction of Object-induced Three-way Concept Lattice[J]. J Huaqiao Univ Nat Sci, 2021, 42(5): 693-700. DOI: 10.11830/ISSN.1000-5013.202106031 .

[42]

GANTER B, WILLE R. Formal concept analysis: mathematical foundations[M]. Berlin Heidelberg: Springer, 1999.

[43]

张清新. 基于布尔矩阵的概念格属性约简方法[D]. 漳州:漳州师范学院, 2012.

[44]

ZHANG Q X. Attribute Reduction Method for Concept Lattices Based on Boolean Matrices[D]. Zhangzhou: Zhangzhou Normal University, 2012.

基金资助

国家自然科学基金(61772019)

科技部国家重点研发计划项目(2022YFC3303100)

陕西省自然科学基金(2021JQ-2B)

AI Summary AI Mindmap
PDF (792KB)

114

访问

0

被引

详细

导航
相关文章

AI思维导图

/