数据挖掘与OLAP
数据挖掘和OLAP都是两种常见的商业智能(BI)技术。商业智能是指基于计算机的方法,从商业数据中识别和提取有用的信息。数据挖掘是计算机科学的一个领域,研究从大量数据中提取有趣的模式。它结合了人工智能、统计学和数据库管理等多种方法。OLAP(online ****ytic processing,联机分析处理)顾名思义是一种查询多维数据库的方法的汇编。
数据挖掘也称为数据中的知识发现(KDD)。如前所述,它是计算机科学的一个领域,研究从原始数据中提取先前未知和有趣的信息。由于数据的指数级增长,特别是在商业等领域,数据挖掘已经成为将大量数据转化为商业智能的非常重要的工具,因为在过去几十年中,人工提取模式似乎变得不可能。例如,它目前被用于各种应用,如社交网络分析、欺诈检测和营销。数据挖掘通常处理以下四个任务:聚类、分类、回归和关联。聚类是从非结构化数据中识别相似的组。分类是可以应用于新数据的学习规则,通常包括以下步骤:数据预处理、建模设计、学习/特征选择和评估/验证。回归是寻找对数据建模误差最小的函数。关联是寻找变量之间的关系。数据挖掘通常被用来回答这样的问题:哪些是可能有助于沃尔玛明年获得高利润的主要产品。
OLAP是一类为多维查询****的系统。通常OLAP用于市场营销、预算、预测和类似的应用程序。不用说,用于OLAP的数据库配置用于复杂的即席查询,并且考虑到了快速的性能。通常,矩阵用于显示OLAP的输出。行和列由查询的维度组成。他们经常使用在多个表上聚合的方法来获得摘要。例如,它可以用来了解沃尔玛今年的销售额与去年相比?对下一季度的销售额有什么预测?从百分比变化来看,对这一趋势有何看法?