什么是统计数据挖掘?(statistical data mining?)

统计数据挖掘,也称为知识或数据发现,是一种计算机化的信息收集和分析方法。数据挖掘工具获取数据并对信息进行分类,以发现可用于重要应用(如医学、计算机编程、商业推广和机器人设计)的模式或相关性。统计数据挖掘技术使用复杂的数学和复杂的统计过程来创建分析。...

统计数据挖掘,也称为知识或数据发现,是一种计算机化的信息收集和分析方法。数据挖掘工具获取数据并对信息进行分类,以发现可用于重要应用(如医学、计算机编程、商业推广和机器人设计)的模式或相关性。统计数据挖掘技术使用复杂的数学和复杂的统计过程来创建分析。

The information collected during statistical data mining is often presented as charts or graphs.

数据挖掘包括五个主要步骤。第一个数据挖掘应用程序收集统计数据并将信息放在仓库类型的程序中。接下来,对仓库中的数据进行组织并创建一个管理系统。下一步创建一种访问托管数据的方法。然后,第四步开发分析数据的软件,也称为数据挖掘回归,而最后一步便于以实际的方式使用或解释统计数据。

Statistical data mining techniques use complex mathematics and complicated statistical processes to create an analysis.

通常,数据挖掘技术集成了分析和事务数据系统。分析软件使用开放式用户问题对这两种类型的数据系统进行排序。开放式问题允许无数的答案,因此程序员不会影响排序结果。程序员创建问题列表,以帮助使用整体焦点对信息进行分类。

Data mining techniques integrate analytical and transaction data systems.

然后,排序基于数据的开发类和集群、数据中发现的关联,并尝试根据关联定义模式和趋势。例如,谷歌收集用户购买习惯的信息,以帮助投放在线广告。用于对买家数据进行排序的开放式问题侧重于互联网用户的购买偏好或观看习惯。

计算机科学家和程序员专注于分析所收集的统计数据。决策树的创建、人工神经网络、最近邻法、规则归纳、数据可视化和遗传算法都使用统计挖掘的数据。这些分类系统有助于解释分析数据程序发现的关联。统计数据挖掘涉及可以在家用计算机上小规模完成的小项目,但大多数数据挖掘关联集非常大,数据挖掘回归非常复杂,因此需要一台超级计算机或一个高速计算机网络。

统计数据挖掘收集三种一般类型的数据,包括操作数据、非操作数据和元数据。在服装店中,运营数据是用于运营业务的基本数据,如会计、销售和库存控制。与该业务间接相关的非运营数据包括对未来销售额的估计以及有关全国服装市场的一般信息。元数据与数据本身有关。如果收集到数据,使用元数据的程序可能会根据服装购买者的性别或地理位置或顾客最喜欢的颜色对商店顾客进行分类。

数据挖掘应用程序可能非常复杂,统计数据挖掘工具可能具有广泛的实际应用。疾病爆发的研究就是一个例子。2000年的一个数据挖掘项目分析了加拿大安大略省隐孢子虫的疾病暴发,以确定疾病病例增加的原因。数据挖掘的结果有助于将细菌爆发与当地水条件和缺乏适当的市政水处理联系起来。一个名为“生物监视”的领域使用流行病学数据挖掘来识别单一疾病的爆发。

计算机程序员和设计师也利用概率研究和统计数据分析来开发机器和计算机程序。谷歌互联网搜索引擎是使用统计数据挖掘设计的。谷歌继续收集和使用数据挖掘来创建程序更新和应用程序。

Statistical data mining integrates analytical and transaction data systems.

  • 发表于 2021-12-15 08:32
  • 阅读 ( 134 )
  • 分类:互联网

你可能感兴趣的文章

数据挖掘(data mining)和数据仓库(data warehousing)的区别

...用于数据仓库,以发现有用的模式。 覆盖的关键领域 1.什么是数据挖掘–定义,功能2.什么是数据仓库–定义,功能3.数据挖掘和数据仓库的区别–关键区别的比较 关键术语 数据挖掘,数据仓库,数据仓库 什么是数据挖掘(data ...

  • 发布于 2021-06-30 17:39
  • 阅读 ( 524 )

数据挖掘(data mining)和预测分析(predictive analytics)的区别

...释它们,以获得有意义的业务见解。 覆盖的关键领域 1.什么是数据挖掘–定义,用法2.什么是预测分析–定义,用法3.数据挖掘和预测分析之间的区别–关键区别的比较 关键术语 数据挖掘、预测分析 什么是数据挖掘(data mining)...

  • 发布于 2021-07-01 00:14
  • 阅读 ( 441 )

数据挖掘(data mining)和数据仓库(data warehousing)的区别

关键区别:数据挖掘实际上是对数据的分析。它是一种计算机辅助的过程,通过挖掘和分析由计算机编译或输入计算机的大量数据集。数据仓库是将信息或数据编译到数据仓库中的过程。数据仓库是用来存储数据的数据库。 数...

  • 发布于 2021-07-13 06:43
  • 阅读 ( 175 )

什么是不同的数据挖掘方法?(the different data mining methods?)

在软件选项和理论概念中使用了各种不同的数据挖掘方法。这使得用户能够利用各种工具从个人和公司收集的数据中提取信息。大量数据可用于确定单个受试者或多个受试...

  • 发布于 2021-12-08 14:44
  • 阅读 ( 177 )

什么是数据挖掘算法?(data mining algorithms?)

...以满足用户需求的人从事商业智能或数据挖掘工作。这是统计数据的一个非常复杂的扩展,越来越受欢迎,因为各组织试图从所收集的数据中获得更切实的回报。一个高效的开发人员可以创建一组数据挖掘算法,精确地识别行为...

  • 发布于 2021-12-08 16:46
  • 阅读 ( 147 )

什么是数据挖掘应用?(data mining applications?)

数据挖掘应用程序是能够从存储的数据中提取和识别模式的计算机软件程序或包。这类工具通常是一个软件接口,它与包含客户或其他重要数据的大型数据库进行交互。数...

  • 发布于 2021-12-08 16:47
  • 阅读 ( 194 )

什么是数据挖掘工具?(data mining tools?)

数据挖掘工具是允许用户从数据中提取信息的软件组件和理论。这些工具使个人和公司能够收集大量数据,并使用这些数据确定特定用户或用户组。数据挖掘工具的一些最...

  • 发布于 2021-12-08 16:48
  • 阅读 ( 133 )

什么是最重要的数据挖掘概念是什么?(the most important data mining concepts?)

最重要的数据挖掘概念用于分析收集到的信息,尤其是在观察行为时。数据之间的未知交互以各种方式进行研究,以确定主题和聚合信息之间的关键关系。数据挖掘的一个...

  • 发布于 2021-12-09 10:46
  • 阅读 ( 132 )

什么是数据挖掘代理?(a data mining agent?)

...。这些代理有点像烟雾报警器;只有当系统中确实发生了什么事情时,它们才会发出信号。 ...

  • 发布于 2021-12-10 10:19
  • 阅读 ( 104 )

什么是数据挖掘分类?(a data mining classification?)

数据挖掘分类是数据挖掘过程中的一个步骤。它用于根据某些关键特征对项目进行分组。有几种用于数据挖掘分类的技术,包括最近邻分类、决策树学习和支持向量机。 ...

  • 发布于 2021-12-10 10:19
  • 阅读 ( 226 )
nbtmct173951
nbtmct173951

0 篇文章