结构化与非结构化
结构化和非结构化是两种类型的数据或信息,当涉及到它们的概念和含义时,它们显示出它们之间的差异。字段中包含的数据的描述称为结构化信息。另一方面,所有二进制文档都被称为非结构化信息或数据。这就是结构化和非结构化的主要区别。
之所以称之为结构化信息,是因为它的性质和功能是由元数据标记标识的。另一方面,属于非结构化数据或信息类型的文档的一些最佳示例是.pdf和.docx。
重要的是要知道结构化信息与SharePoint有很大关系。据说,所有在SharePoint上或在SharePoint中直接生成或创建的内容都被认为是结构化的。例如,在SharePoint中直接创建或生成的所有区域列表和列表项都属于数据或信息的结构化类型。在定义结构化数据时,这是一个重要的观察。
必须记住,所有使用专有应用程序(如Acrobat或Word)的二进制文档都属于非结构化数据或信息类型。事实上,非结构化信息是通过IFilter或相应的转换器自动提取出来的。这是结构化和非结构化数据之间的另一个重要区别。