什么是数据挖掘软件?(data mining software?)

数据挖掘软件是一种用于识别大型数据集中模式的工具。在过去几年中,随着公司寻找将大量信息转化为有用信息以供决策的方法,计算机软件的这一领域已急剧扩大。清楚地识别因果、人类行为模式、趋势和其他指标的能力对于任何业务的正确管理都至关重要。对于大多数用户来说,数据挖掘软件的好处是显而易见的,但一般商业社区对如何获取所需信息以及该过程的具体工作方式了解甚少。...

数据挖掘软件是一种用于识别大型数据集中模式的工具。在过去几年中,随着公司寻找将大量信息转化为有用信息以供决策的方法,计算机软件的这一领域已急剧扩大。清楚地识别因果、人类行为模式、趋势和其他指标的能力对于任何业务的正确管理都至关重要。对于大多数用户来说,数据挖掘软件的好处是显而易见的,但一般商业社区对如何获取所需信息以及该过程的具体工作方式了解甚少。

Data mining software is a tool used to identify patterns in large sets of data.

描述该过程的数据挖掘软件有三个方面:原始数据转换、挖掘编程脚本和解释。这个过程也称为数据库中的知识发现(KDD),用于描述数据挖掘的所有方面,包括数据的结构、访问数据的方法和系统架构。有许多公司提供数据挖掘软件,对驱动该产品的概念有深入的了解对于成功和适当地使用该技术至关重要。

使用任何数据挖掘软件的第一个要求是将原始数据转换为目标数据集。例如,原始数据是广泛时间范围内处理的所有销售的数据库。目标数据集只有满足特定条件的数据。这可能包括在特定时间范围内处理的事务。数据集规范中包含了各个字段。这可能包括交易日期、付款方式、门店位置、产品说明和购买的物品数量。

一旦确定了数据集规范,则会清理数据以删除多余的信息、噪音或不完整的数据文件。这一过程通常需要使用编程技能、数据管理技术以及对现有主要数据概念的全面理解。数据集市或数据仓库是最常用的工具,用于以数据挖掘软件程序易于访问的方式存储数据表。

可以定制实际的数据挖掘编程脚本,或者程序员可以使用数据挖掘软件包中包含的标准脚本。绝大多数数据挖掘软件程序使用回归分析、模糊逻辑和算法来识别满足用户规范的特定模式。解释结果需要人工干预、时间和统计、模式识别和相关数学技能方面的技能。请务必记住,程序只能根据用户提供的规范返回选项。定义不当的规范和低数据质量将对结果的有效性产生负面影响。

  • 发表于 2021-12-13 12:59
  • 阅读 ( 196 )
  • 分类:互联网

你可能感兴趣的文章

数据挖掘(data mining)和机器学习(machine learning)的区别

数据挖掘(data mining)和机器学习(machine learning)的区别 数据挖掘和机器学习是两个密切相关的领域。作为亲属,他们是相似的,但他们有不同的父母。但目前,两者的生长越来越相似,几乎与双胞胎相似。因此,有人将机器学习...

  • 发布于 2020-10-29 00:13
  • 阅读 ( 236 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

数据挖掘和数据仓库的主要区别在于,数据挖掘是从大量数据中识别模式的过程,而数据仓库是将来自多个数据源的数据集成到一个中心位置的过程。 数据挖掘是在大型数据集中发现模式的过程。它使用各种技术,如分类、回...

  • 发布于 2021-06-30 17:39
  • 阅读 ( 504 )

数据挖掘(data mining)和预测分析(predictive analytics)的区别

数据挖掘和预测分析的主要区别在于,数据挖掘是使用算法和挖掘工具识别数据隐藏模式的过程,而预测分析是将业务知识应用于发现的模式以进行预测的过程。 数据挖掘是在大型数据集中发现模式的过程。它提取数据实体之...

  • 发布于 2021-07-01 00:14
  • 阅读 ( 433 )

如何我选择最好的数据可视化软件?(i choose the best data visualization software?)

数据可视化软件对于用图像和图形表示数据非常有用,根据需要选择合适的程序将有助于实现最佳可视化。大多数数据可视化软件中都内置了预制可视化,而且这些软件越...

  • 发布于 2021-12-06 16:19
  • 阅读 ( 166 )

什么是不同的数据挖掘方法?(the different data mining methods?)

... 在软件选项和理论概念中使用了各种不同的数据挖掘方法。这使得用户能够利用各种工具从个人和公司收集的数据中提取信息。大量数据可用于确定单个受试者或多个受试者的各种因素。这些数据挖掘方法最常用于...

  • 发布于 2021-12-08 14:44
  • 阅读 ( 169 )

什么是数据挖掘算法?(data mining algorithms?)

数据挖掘算法是用于识别数据集中的模式和趋势的编程查询和程序。数据挖掘的主要用途是根据客户的实际活动确定客户需求和偏好。尽管这些信息是基于过去的表现,但...

  • 发布于 2021-12-08 16:46
  • 阅读 ( 140 )

什么是数据挖掘应用?(data mining applications?)

数据挖掘应用程序是能够从存储的数据中提取和识别模式的计算机软件程序或包。这类工具通常是一个软件接口,它与包含客户或其他重要数据的大型数据库进行交互。数...

  • 发布于 2021-12-08 16:47
  • 阅读 ( 181 )

什么是数据挖掘工具?(data mining tools?)

数据挖掘工具是允许用户从数据中提取信息的软件组件和理论。这些工具使个人和公司能够收集大量数据,并使用这些数据确定特定用户或用户组。数据挖掘工具的一些最...

  • 发布于 2021-12-08 16:48
  • 阅读 ( 123 )

什么是数据挖掘分类?(a data mining classification?)

数据挖掘分类是数据挖掘过程中的一个步骤。它用于根据某些关键特征对项目进行分组。有几种用于数据挖掘分类的技术,包括最近邻分类、决策树学习和支持向量机。 ...

  • 发布于 2021-12-10 10:19
  • 阅读 ( 217 )

什么是数据挖掘项目?(a data mining project?)

数据挖掘项目通常由业务经理或分析师发起。数据挖掘的目的是识别大型数据集中的模式或趋势。例如,针对客户购买趋势的数据挖掘项目有助于为围绕新产品发布、客户...

  • 发布于 2021-12-10 10:21
  • 阅读 ( 161 )
fd4pt7gf
fd4pt7gf

0 篇文章