NOVOTS KMS 词汇表 Glossary    联系我们 Contact Us
查询 Search  
   
按类别浏览 Browse by Category
NOVOTS KMS .: 工作心得 .: 几种数据挖掘常用的分析方法

几种数据挖掘常用的分析方法

下面是几种常用的数据分析的方法

1、关联分析

      采用关联挖掘算法可以有效识别出数据中不同字段之间内在的关联关系,经典的算法是Apriori算法。关联挖掘算法一般用以发现交易数据库中不同商品之间的关联关系,用这些规则找出客户的购买行为模式,这种规则可用于超市商品货架设计,货物摆放,以及根据购买的模式对客户进行分类。

2、序列模式分析

      顾名思义,序列模式用于预测一个具有时间先后顺序的动作序列,比如,在购物的交易数据库中,可能会发现用户在购买完电脑的一段时间内一定会购买打印机等诸如类似的规则。再如,通过Web日志分析,我们可以发现,网站浏览者,浏览网页时会有一个特别的页面流,发现了这样的规则,有利于网站进一步提供更人性化的服务。

3、分类分析

      分类方法是一种有指导的学习,类别必须明确,并且必须有一定的已经获取到分类结果的数据,用以创建分类模型(最常用的是决策树和神经网络)然后可以采用这个模型对新的数据进行分类,常用于对客户进行分类,然后针对不同类别的客户采用不同的营销手段。常用的一些经典的分类方法包括CART,CHAID,C4.5,C5.0,Vaive Bayes,神经网络等。

4、聚类分析

      聚类就是将数据对象分组成为多类,在同类的对象之间具有较多的相似度,而不同类的对象之间则差别较大。相异度是根据描述对象的属性值来计算的。距离是经常采用的度量方式

聚类分析和分类分析的不同之处在于,分类分析中,在构建模型的时候,必须有已知的类别,属于一种带监督的学习,而聚类分析则是一种无监督的学习,不要求数据已经有明确的类别,聚类分析的算法自动形成数据的分类类别,

5、预测分析(有的称之为时间序列分析)

      根据已有的一定数量的有时间顺序的连续的历史数据,对于未来一个时间点或者几个时间点的数据进行预测。预测分析是被经常采用的分析手段,对于一些数值型属性,经常采用这种分析手段来获取未来的发展趋势,并且根据预测数据进行预警分析。

6、回归分析

      回归分析用来分析两个或者两个以上的变量相互影响的程度,可以通过一个或者多个属性的值来预测两一个变量的值。比如,在商品流通领域,经常用回归分析来分析商品的价格和商品的需求量之间的关系,以便对商品的价格和需求量进行控制。

     


这篇文章对你多有用?

相关文章

article JDBC连接各种数据库经验技巧
Java数据库连接(JDBC)由一组用 Jav

(No rating)  5-24-2014    Views: 646   
article 两种数据源连接的配置方式:jndi和jdbc
 

(No rating)  7-26-2020    Views: 90   

用户评语

添加评语
当前还没有评语.


.: .: .: .: .:
[ 登陆 ]
北京护航科技有限公司 2006

Novots Technologies Limited