Категорични данни срещу числови данни
Данните са фактите или информацията, събрани за справка или анализ. Често тези данни се събират като атрибут на засегнатия обект. Този атрибут може да варира от един до друг, поради което този променлив атрибут може да се счита за променлива. Променливите могат да приемат различни форми на стойности и те са присъщи в събраните данни.
Променливите могат да бъдат качествени или количествени; т.е., ако променливата е количествена, отговорите са числа и величината на измерения атрибут може да бъде посочена с определена степен на точност. Другият тип, качествените променливи измерват качествените атрибути и стойностите, приети от променливите, не могат да бъдат дадени като размер или величина. Самите променливи са известни като категорични променливи, а данните, събрани с помощта на категорична променлива, са категорични данни.
Повече за цифровите данни
Числовите данни са основно количествените данни, получени от променлива, и стойността има усещане за размер / величина. Получените цифрови данни се разделят на още три категории въз основа на теорията, разработена от Стенли Смит Стивънс. Числовите данни могат да бъдат обикновени, интервални или съотношения. Типът на данните се определя от метода на измерване на стойностите, а видовете са известни като нива на измерване.
Теглото на човек, разстоянието между две точки, температурата и цената на запаса са примери за цифрови данни.
В статистиката повечето от методите са получени за анализ на числови данни. Основни описателни статистически данни и регресия и други инфекциозни методи се използват главно за анализ на числови данни.
Повече за категоричните данни
Категоричните данни са стойности за качествена променлива, често число, дума или символ. Те разкриват факта, че променливата в разглеждания случай принадлежи към един от няколкото налични избора. Следователно те принадлежат към една от категориите; оттук и името категорично.
Политическата принадлежност на човек, националността на човек, любимият цвят на човек и кръвната група на пациент са качествени качества. Понякога число може да се получи като категорична стойност, но самото число не представлява величината на измерения атрибут. Пощенският код е един пример.
Също така, всички категорични стойности принадлежат към номиналния тип данни, който е друг тип, базиран на нивата на измерванията. Методите, използвани за анализиране на категорични данни, са различни от тези на числовите данни, но основният принцип може да бъде същият.
Каква е разликата между категорични и цифрови данни?
• Числовите данни са стойности, получени за количествена променлива и носят усещане за величина, свързано с контекста на променливата (следователно, те винаги са числа или символи, носещи числова стойност). Категоричните данни са стойности, получени за качествена променлива; категоричните данни не носят усещане за величина.
• Числовите данни винаги принадлежат или на порядъчен, съотношение, или на интервален тип, докато категоричните данни принадлежат към номинален тип.
• Методите, използвани за анализ на количествените данни, са различни от методите, използвани за категорични данни, дори ако принципите са еднакви, поне приложението има значителни разлики.
• Числените данни се анализират с помощта на статистически методи в описателната статистика, регресия, времеви серии и много други.
• За категорични данни обикновено се използват описателни методи и графични методи. Използват се и някои непараметрични тестове.