Структуриран срещу неструктуриран
Структурирани и неструктурирани са два типа данни или информация, които показват разлики между тях, що се отнася до техните понятия и значения. Описанието на данните, съдържащи се в полетата, се нарича структурирана информация. От друга страна, всички двоични документи се наричат с името неструктурирана информация или данни. Това е основната разлика между структурираното и неструктурираното.
Структурираната информация е така наречена, тъй като нейната същност и функция са идентифицирани чрез метаданни маркери. От друга страна, някои от най-добрите примери за документите, които попадат под неструктуриран тип данни или информация, са .pdf и .docx.
Важно е да знаете, че структурираната информация трябва да прави много с SharePoint. Казано е, че цялото съдържание, произведено или създадено директно в или в SharePoint, се счита за структурирано в природата. Например всички списъци на области и елементи от списъка, които са създадени или произведени директно в SharePoint, попадат под структуриран тип данни или информация. Това е важно наблюдение, което трябва да се направи, когато става въпрос за определяне на структурирани данни.
Трябва да се помни, че всички двоични документи, които използват собствени приложения като Acrobat или Word, попадат под неструктурирания тип данни или информация. Всъщност неструктурираната информация се извлича автоматично чрез прилагане на IFilter или съответния конвертор. Това е друга важна разлика между структурирани и неструктурирани данни.
Трябва разбира се да се помни, че препратките към SharePoint се използват предимно само за индексиране на структурираните данни. Не се използва за други цели. Ясното разбиране на разликата между структурирани и неструктурирани данни или информация е абсолютно необходимо за софтуерния експерт в смисъл, че той ще бъде в състояние да категоризира правилно файловете и данните..