网工干货知识

超全学习笔记
当前位置:首页 > 干货知识

数据挖掘中的多层关联规则

更新时间:2026年03月27日   作者:spoto   标签(Tag):
多层关联规则:从不同层次的信息中提取出的关联规则被称为多层次的关联规则或分阶段关联规则。利用基于置信度系统的推理过程,可以有效地挖掘出这些关联规则。处于较高层次上的关联规则可能有助于做出正确的判断,而处于较低层次上的关联规则则可能并不具有实际价值。为所有级别的用户提供统一的帮助方式:
  • 当使用统一的辅助边缘时,跟踪系统会被重新调整。
  • 这种技术也非常简单,用户只需要指定一个最小支持度即可。
  • 在每一层决策过程中,都会使用类似的最小帮助边缘来进行挖掘。(例如,从“PC”级别开始,逐步向下进行挖掘。)结果发现,“PC”和“PC”都是连续不断的,而“PC”则不是如此。
多维规则的必要性:
  • 有时候,在较低的数据层面,数据本身并没有显示出任何明显的规律或模式,但实际上,其背后隐藏着一些有用的信息。
  • 其目的就是找出那些隐藏在抽象层次之间或其中的信息。
多层次关联规则挖掘的方法:
  1. 统一支持机制(对所有层级都采用统一的最低支持标准)
  2. 降低支持级别(在较低的水平下使用较低的最低支持标准)
  3. 基于组的支持(使用项目或组为基础的支持方式)
让我们逐一来讨论一下吧。
  1. 统一支持/统一援助当使用统一的帮助边缘时,搜索方法就会变得简单起来。 这种技术其实也很简单,因为用户只需要确定一个最低支持阈值即可。 可以根据这样的信息来采用一种推进技术:即认为某个祖先是其后代的超集。 在搜索过程中,应避免分析那些没有任何最小支持的物品集合。 不过,这种统一的支持方法确实存在一些困难。 不太可能的是,那些抽象程度较低的物品会出现的频率与那些抽象程度较高的物品一样高。 如果最低支持阈值设置得过高,那么就会错过那些在较低抽象层次上发生的、具有意义的关联现象。 这为采用以下方法提供了动力。
  2. 减少支持服务——为了挖掘各种与“支持度降低”相关的关系,有以下几种可选的方法。
    • 逐层独立——这是一种全范围搜索方式,在此过程中,不会利用任何关于常规物品集合的基础信息来进行剪枝操作。每个枢纽点都会被逐一检查,无论其父节点是否存在。
    • 水平方向——通过单一元素进行分隔。在I级别上,如果一个节点的父节点处于(I-1)级别且是正常状态的话,那么这个节点也会被检查。总的来说,我们是从更宏观的角度来研究这种关系。如果某个节点经常被访问,那么它的子节点也会被检查;否则,该节点的子节点则会被排除在查询之外。
    • 通过-K项集合来分离水平交叉点在I级别上,只有那些满足特定条件的项集才会被检查。而为了挖掘各种具有较低支持度的关系,还需要采用多种不同的搜索技术。
    • 逐层独立——这是一种全范围搜索方式,在此过程中,不会使用任何关于常规物品集合的基础信息来进行剪枝操作。每个枢纽点都会被逐一检查,无论其父节点是否存在。
    • 水平方向——通过单一元素进行分隔。在一级的情况下,只有当其上级节点处于(I-1)级时,该下级节点才会被检查。总的来说,我们是从更宏观的角度来研究这种关系。如果一个节点频繁出现,那么它的下级节点也会被检查;否则,该节点的下级节点则会被排除在检查范围之外。
    • 通过-K项集来分离水平交叉点如果某个处于I级别的物品集合的对应父级物品集合(即i-1级别的物品集合)也是常见的,那么这个物品集合才会被考虑进去。
  3. 基于群体的支持——关于支持和可信度的阈值,这些数值是由用户或专家来确定的。选择哪个组作为重点对象,通常是基于产品的价格或商品集合来决定的。因为专家们通常能够判断出哪些组比其他组更为重要。例如——例如,专家们对笔记本电脑或电子类商品的购买模式很感兴趣。因此,针对这一类别的商品,我们设定了较低的支持阈值,以便能够关注这些商品的购买模式。
              马上抢免费试听资格
意向课程:*必选
姓名:*必填
联系方式:*必填
QQ:
思博SPOTO在线咨询

相关资讯

即刻预约

免费试听-咨询课程-获取免费资料