优秀的毕业设计论文网
计算机 JAVA 电子信息 单片机 机械机电 模具 土木工程 建筑结构 论文
热门搜索词:网络 ASP.NET 汽车 电气 数控 PLC

基于Apriori算法的关联规则挖掘系统的设计与实现

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
  
资料介绍:
摘??? 要 随着信息时代的发展,信息量呈几何级数增长,人们发现从这些海量信息中获取有用的信息越来越困难,要找出信息背后隐藏的规律更是不可想象。数据挖掘就是从大量数据中获取有用信息的一门新技术,关联规则挖掘是数据挖掘方法中的一种。本文详细论述了基于Apriori算法的关联规则挖掘系统的设计开发过程。系统基于经典的Apriori算法,对事务数据库进行了位图矩阵转换,大大提高了搜索效率,并能分别挖掘频繁项集和关联规则。 论文组织如下:首先介绍了数据挖掘的产生、定义和应用;接着阐述了关联规则挖掘的基本概念;然后对系统的需求进行了分析,并提出设计方案;紧接着是系统的具体实现;最后对系统进行了测试,将系统用于挖掘中药方剂库中的药对药组,验证了系统的正确性和实用性。 关键词:数据挖掘;关联规则;Apriori算法 Apriori经典算法 下面介绍形式最简单的关联规则挖掘方法。这种关联规则是单维、单层、布尔关联规则,如前面讨论的购物篮分析。 关联规则的挖掘分两步: 1) 找出所有频繁项集:根据定义,这些项集出现的频繁性至少和预定义的最小支持计数一样。 2) 由频繁项集产生强关联规则:根据定义,这些规则必须满足最小支持度和最小置信度。 也可以使用附加的兴趣度度量。这两步中,第二步最容易。挖掘关联规则的总体性能由第一步决定。 Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。算法的名字基于频繁项集性质的先验知识,正如我们将看到的。Apriori使用逐层搜索的迭代方法,k-项集用于探索(k+1)-项集。首先,找出频繁1-项集的集合。该集合记作L1。L1用于找频繁2-项集的集合L2,而L2用于找L3,如此下去,直到不能找到频繁 k-项集。找每个Lk需要一次数据库扫描。 为提高频繁项集逐层产生的效率,一种称作Apriori性质的重要性质用于压缩搜索空间。我们先介绍该性质,然后用一个例子解释它的使用。 Apriori性质:频繁项集的所有非空子集都必须也是频繁的。Apriori性质基于如下观察:根据定义,如果项集I不满足最小支持度阈值min_sup,则I不是频繁的,即P(I)