频繁子图挖掘算法

更新时间：2021-08-11 14:17

频繁子图挖掘算法是一种思路简单，以递归计数为基础，就可以挖掘出所有频繁子图的计算方法。

定义与分类

(1)按照模式挖掘算法的输入数据类型进行分类:分为graph-transaction和single-graph两种类型。graph-transaction型模式挖掘所处理的输入数据是由许多规模相对较小的图构成的集合，每个图可能只包含几十到几百个顶点;而single-graph型模式挖掘的对象则只有-个大图，这个大图包含成千上万个顶点。这两种类型的区别还在于它们计算候选子图频度时所使用的策略。graph-transaction型计算模式在图集合每个图中是否出现，不管它在同-个图中出现了多少次均计数-次，而single-graph型则计算模式在这个大图中不同位置出现的总次数。根据两种类型的特征，解决graph-transaction类型的算法不能用来解决single-graph类型模式挖掘，但是Single-graph类型的算法却能方便应用于graph-transaction类型。

(2)按照采用度量的不同进行分类:分为支持度(support)、支持度-置信度、MDL(minimumdescri-Ptionlength)三种。支持度型挖掘是以子图在输入图中出现的次数来作为度量的，大部分算法都是基于支持度的;MDL型挖掘是以压缩输入数据的程度来度量，-般采用公式valuo(s，g)=dl(g)/(dl(g1)+dl(g2))来计算，其中:是子图，g是输入的图集合，dl(g)表示图集合g的存储空间，dl(g2)表示把g中所有出现:的地方都用同-个顶点替换后的图形所需的存储空间;支持度-置信度型挖掘是以既要满足最小支持度又要满足最小置信度来衡量的。还有其它-些度量方法，这里就不再介绍了。

(3)按照挖掘出的频繁子图的类型进行分类:分为一般子图、连通子图、诱导子图等。

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}