什么是双聚类?(biclustering?)

双聚类是一种数据挖掘技术,它通过同时指定矩阵的行和列,将信息排序到矩阵中。这项技术的核心是效率,与单一聚类方法相比,它允许计算机在更短的时间内筛选和排序大量数据。双聚类仅仅是一类特殊的数据挖掘技术的总称;有许多不同的算法可以归入这一类,包括块聚类、格子模型、耦合双向聚类和相关双向聚类。...

双聚类是一种数据挖掘技术,它通过同时指定矩阵的行和列,将信息排序到矩阵中。这项技术的核心是效率,与单一聚类方法相比,它允许计算机在更短的时间内筛选和排序大量数据。双聚类仅仅是一类特殊的数据挖掘技术的总称;有许多不同的算法可以归入这一类,包括块聚类、格子模型、耦合双向聚类和相关双向聚类。

Biclustering is a data mining technique which sorts information into a matrix by assigning the rows and columns of the matrix at the same time.

要理解双聚类的重要性,首先必须理解数据挖掘的一般概念。数据挖掘是将大量数据(如从公司主数据库中转储的信息)进行分类,以确定趋势和其他有用的模式。这种类型的分析可用于确定模式,否则,这些模式将不会通过偶然研究变得明显,例如消费者购买趋势和股市波动。数据挖掘可以由人工分析师手动执行,也可以使用一种数据挖掘算法进行电子操作;这就是双集群的作用。

Data mining is taking a large pile of data — such as information dumped from a company's main database — and sorting through it to identify trends and other useful patterns.

在数据挖掘过程中,进行分析的计算机将尝试将相关的信息片段相互排序。这个过程被称为“集群”聚类允许计算机通过识别两条或多条信息何时相互关联,将它们放在一个矩阵中,从而调整其人工智能。通常,矩阵的行或列都会被填充,但一次只能填充一行或一列。

双群集通过允许计算机同时填充行和列来消除这一限制。这提高了聚类过程的效率,但会根据所使用的特定算法产生不同排列的矩阵。例如,一台计算机按行排列具有恒定匹配值的对象,而另一台计算机按列排列具有恒定匹配值的对象,将使用完全相同的值生成不同的外观矩阵。没有一种“正确”的方法来聚类数据;这完全取决于进行数据挖掘的个人的特定情况和偏好。

  • 发表于 2021-12-12 19:31
  • 阅读 ( 190 )
  • 分类:互联网

你可能感兴趣的文章

upgma公司(upgma)和邻接连接树(neighbor joining tree)的区别

...系统进化树的两种主要方法。 目录 1. 概述和主要区别 2. 什么是UPGMA 3. 什么是邻接树 4. UPGMA与邻接树的相似性 5. 并排比较-UPGMA与表格形式的邻居连接树 6. 摘要 什么是upgma公司(upgma)? 在生物信息学中,有不同的聚类技术。UPGMA代...

  • 发布于 2020-10-15 16:37
  • 阅读 ( 938 )

酚类(phenetics)和分支学(cladistics)的区别

...间的关系方面起着重要作用。 目录 1. 概述和主要区别 2. 什么是酚类 3. 什么是分支学 4. 酚类与分支学的相似性 5. 并列比较——以表格形式列出的酚类与分支系统学 6. 摘要 什么是酚类(phenetics)? 酚类是一个研究领域,它根据生...

  • 发布于 2020-10-16 02:54
  • 阅读 ( 364 )

被监督的(supervised)和无监督机器学习(unsupervised machine learning)的区别

...他语言,如java、C++和MATLAB。 目录 1. 概述和主要区别 2. 什么是监督学习 3. 什么是无监督学习 4. 有监督和无监督机器学习的相似性 5. 并列比较-表格形式的有监督和无监督机器学习 6. 摘要 什么是监督学习(supervised learning)? 在基...

  • 发布于 2020-10-19 03:49
  • 阅读 ( 722 )

聚类(clustering)和分类(classification)的区别

...多个特征将对象特征化为组。 目录 1. 概述和主要区别 2. 什么是群集 3.什么是分类 4. 并列比较-聚类与表格形式的分类 5.摘要 什么是聚类(clustering)? 聚类是一种对对象进行分组的方法,使具有相似特征的对象**在一起,而具有不...

  • 发布于 2020-10-28 16:16
  • 阅读 ( 555 )

斐波那契簇

什么是斐波那契簇(fibonacci clusters)? Fibonacci聚类是一组基于不同价格波动的Fibonacci回溯或延伸水平在一个价格区域附近**。集群理论认为,如果多个斐波那契延伸或回溯水平接近一个价格,该价格可能是一个重要的支撑或阻力区...

  • 发布于 2021-06-14 16:39
  • 阅读 ( 132 )

集群(cluster)和分层抽样(stratified sampling)的区别

聚类与分层抽样 调查在市场营销、健康和社会学领域的各种研究中都有应用。他们通常是采取一个人口样本,因为对整个人口进行调查将是昂贵的。除此之外,抽样使数据收集更快,因为它只关注人口的一小部分。保证了采集...

  • 发布于 2021-06-23 21:45
  • 阅读 ( 539 )

聚类(clustering)和分类(classification)的区别

...于通过数据科学解决犯罪、贫困和疾病等全球性问题。 什么是聚类(clustering)? 基本上,聚类涉及到根据相似性对数据进行分组。它主要涉及距离度量和聚类算法,这些算法计算数据之间的差异并对它们进行系统划分。 例如,...

  • 发布于 2021-06-25 04:13
  • 阅读 ( 698 )

如何illumina测序工作(illumina sequencing work)

...析,本文将对此进行进一步描述。   覆盖的关键领域 1.什么是Illumina测序-定义、事实、优势2.Illumina测序如何工作-Illumina测序过程:–文库准备–聚类生成–测序–数据分析 关键词:聚类生成、数据分析、照明测序、库准备、综...

  • 发布于 2021-06-30 14:04
  • 阅读 ( 181 )

upgma公司(upgma)和邻居连接树(neighbor joining tree)的区别

...法,与UPGMA方法相比具有更好的结果。 覆盖的关键领域 1.什么是UPGMA–定义、方法、意义2。什么是邻接树-定义,方法,意义3。UPGMA和邻居连接树之间有什么相似之处——共同特征概述4。UPGMA和邻居连接树的区别是什么?关键区...

  • 发布于 2021-07-02 03:03
  • 阅读 ( 309 )

聚类(clustering)和分类(classification)的区别

...关系。它的目标是定义对象所属的组。聚类与分类比较表什么是聚类(clustering)?聚类是机器学习的一部分,它将数据分组成具有高度相似性的聚类,但不同的聚类可能不同。它是无监督学习的方法,非常常用于统计数据分析。有...

  • 发布于 2021-07-11 17:18
  • 阅读 ( 408 )
t41221855
t41221855

0 篇文章