\r\n\r\n
構造化・非構造化
構造化されたデータと非構造化されたデータは、その概念と意味において、両者の違いを示しています。フィールドに含まれるデータの記述のことを構造化情報という。一方、すべてのバイナリ文書は、非構造化情報またはデータと呼ばれる。これが構造化と非構造化の大きな違いです。
その性質や機能がメタデータタグによって特定されるため、構造化情報と呼ばれる。一方、非構造化データや情報タイプであるドキュメントの代表例として、.pdfや.docxがあります。
構造化された情報がSharePointと大きく関わっていることを知っておくことは重要です。SharePoint上で、あるいはSharePoint内で直接生成・作成されたコンテンツは、すべて構造化されているとみなされると言われています。例えば、SharePointで直接作成・生成されたエリアリストやリストアイテムは、すべて構造化タイプのデータ・情報である。これは、構造化データを定義する際に重要な観察事項である。
プロプライエタリなアプリケーション(AcrobatやWordなど)を使ったバイナリ文書は、すべて非構造化データまたは情報タイプであることを覚えておく必要があります。実際には、IFilterや対応する変換器によって、非構造化情報が自動的に抽出される。この点も、構造化データと非構造化データの重要な違いである。