Vous êtes sur la page 1sur 13

 Big Data

Types de données dans


les statistiques |
Données qualitatives vs
quantitatives
introduction

Dans Science des données, notre objectif est de mener différentes expériences avec des données
brutes et de trouver de bonnes informations à partir des données. Pour conduire toute entreprise sur
la bonne voie, les données sont très importantes ou on peut dire que “Les données sont le
carburant”. Vous pouvez au moins fournir des informations utiles qui peuvent aider:

 Stratégies de campagne actuelles,

 Organisez facilement des lancements de nouveaux produits ou

 Essayez différentes expériences.

Dans toutes les choses mentionnées ci-dessus, le seul élément de conduite commun est les données.
Nous entrons dans l'ère numérique où nous produisons chaque jour une grande quantité de
données.

Par exemple, du quotidien, une entreprise comme Flipkart produit plus de 2 To de données.

En raison de la grande importance des données dans notre vie, il devient très important de stocker et
de traiter ces données correctement sans aucune erreur. Lorsque vous traitez des ensembles de
données, le type de données ou la catégorie des données joue un rôle important pour trouver la
réponse aux questions suivantes:

 Quelle stratégie de prétraitement fonctionnerait pour un ensemble particulier pour obtenir


les bons résultats, O

 Quel type d'analyse statistique doit être appliqué pour obtenir les meilleurs résultats.

Ensuite, dans cet article, nous discuterons des différents types de données en statistiques que vous
devez savoir faire L'analyse exploratoire des données (AED), qui est l'un des composants les plus
importants dans le pipeline d'un projet d'apprentissage automatique.
Table des matières

1. Introduction aux types de données en statistique et à leur importance

2. Données qualitatives vs quantitatives

3. Données qualitatives

 Données nominales

 Données ordinales

4. Données quantitatives

 Données discrètes

 Données continues

 Données d'intervalle

 Données de relation

Contenu

1. introduction

2. Table des matières

3. Introduction aux types de données en statistiques

4. Données quantitatives vs qualitatives

1. Données quantitatives

2. Données qualitatives

5. Données qualitatives

1. Données nominales

2. Données ordinales
3. Données quantitatives

4. Données discrètes

5.

6. Données continues

7.

8. Données d'intervalle

9. Données de relation

6. Remarques finales

1. A propos de l'auteur

7. Aashi Goyal

1. En rapport

Cet article a été publié dans le cadre du  Blogathon sur la science des données

introduction

Dans Science des données, notre objectif est de mener différentes expériences avec des données
brutes et de trouver de bonnes informations à partir des données. Pour conduire toute entreprise sur
la bonne voie, les données sont très importantes ou on peut dire que “Les données sont le
carburant”. Vous pouvez au moins fournir des informations utiles qui peuvent aider:

 Stratégies de campagne actuelles,

 Organisez facilement des lancements de nouveaux produits ou

 Essayez différentes expériences.

Dans toutes les choses mentionnées ci-dessus, le seul élément de conduite commun est les données.
Nous entrons dans l'ère numérique où nous produisons chaque jour une grande quantité de
données.

Par exemple, du quotidien, une entreprise comme Flipkart produit plus de 2 To de données.

En raison de la grande importance des données dans notre vie, il devient très important de stocker et
de traiter ces données correctement sans aucune erreur. Lorsque vous traitez des ensembles de
données, le type de données ou la catégorie des données joue un rôle important pour trouver la
réponse aux questions suivantes:

 Quelle stratégie de prétraitement fonctionnerait pour un ensemble particulier pour obtenir


les bons résultats, O

 Quel type d'analyse statistique doit être appliqué pour obtenir les meilleurs résultats.

Ensuite, dans cet article, nous discuterons des différents types de données en statistiques que vous
devez savoir faire L'analyse exploratoire des données (AED), qui est l'un des composants les plus
importants dans le pipeline d'un projet d'apprentissage automatique.
Source de l'image: Google images

Table des matières

1. Introduction aux types de données en statistique et à leur importance

2. Données qualitatives vs quantitatives

3. Données qualitatives

 Données nominales

 Données ordinales

4. Données quantitatives

 Données discrètes

 Données continues

 Données d'intervalle

 Données de relation

Introduction aux types de données en statistiques

Dans les statistiques, les types de données jouent un rôle très crucial et important, ce qu'il faut
comprendre, appliquer correctement des mesures statistiques à vos données afin que nous puissions
conclure correctement certaines hypothèses sur les données.

de la même manière, nous devons savoir sur quelle analyse de données et son type vous travaillez
pour sélectionner la bonne technique de perception, puisque différents types de données sont
considérés comme une approche pour organiser divers types de variables.
Tout en faisant L'analyse exploratoire des données (AED) Dans un projet général de science des
données, une bonne compréhension des différents types de données est cruciale, puisque nous
pouvons utiliser certaines mesures statistiques uniquement pour des types de données spécifiques.

Il est également connu sous le nom de Échelle de mesure.

Lorsque vous traitez avec l'un des types de données, nous devons également savoir quelle méthode
d'affichage correspond au type de données particulier.

Nous pouvons considérer les types de données comme un moyen de catégoriser différents types de
variables.

Données quantitatives vs qualitatives

Données quantitatives

1. Ces types de données semblent être les plus faciles à expliquer. Essayez de trouver les réponses à
des questions comme

 “De nombreux,

 “Combien de” Oui

 “Combien de fois”

2. Peut être exprimé sous forme de nombre, il peut donc être quantifié. En mots simples, peut être
mesuré par des variables numériques.

3. Ceux-ci sont facilement ouverts pour la manipulation statistique et peuvent être représentés par
une grande variété de types statistiques de graphiques et de tableaux tels que graphiques en
courbes, graphiques à barres, nuage de pointsetc.

Exemples de données quantitatives:

 Résultats des tests et des examens, p. Pas. 74, 67, 98, etc.

 Le poids d'une personne.

 La température dans une pièce.

Il y a 2 types généraux de données quantitatives:

 Données discrètes

 Données continues

Données qualitatives

1. Les données qualitatives ne peuvent pas être exprimées sous forme de nombre, donc ils ne
peuvent pas être mesurés. Il se compose principalement de mots, images et symboles, mais pas des
chiffres.

2. Il est également connu sous le nom Données catégorielles puisque les informations peuvent être
triées par catégorie, pas par numéro.

3. Ceux-ci peuvent répondre à des questions comme:

 “Comment est-ce arrivé”, O


 "Pourquoi est-ce arrivé".

Exemples de données qualitatives:

 Couleurs, par exemple, la couleur de la mer.

 Destinations de vacances populaires comme la Suisse, Nouvelle Zélande, Afrique du Sud, etc.

 Ethnicité comme Indien d'Amérique, asiatique, etc.

En général, exister 2 types de données qualitatives:

 Données nominales

 Données ordinales.

Données qualitatives

Données nominales

1. Ce type de données est utilisé uniquement pour étiqueter les variables, sans avoir de valeur
quantitative. Ici, le terme 'nominal’ vient du mot latin “personne” ce qui veut dire 'nom’.

2. Nommez juste une chose sans demander de commande particulière. Les données nominales
parfois appelées “Étiquettes”.

Exemples de données nominales:

 Genre (femmes, Pour des hommes)

 Couleur de cheveux (rubio, châtain, plus non, rouge, etc.)

 État civil (marié, celibataire, veuf)

Comme vous pouvez le voir dans les exemples, il n'y a pas d'ordre intrinsèque pour les variables.

La couleur des yeux est une variable nominale qui a quelques niveaux ou catégories comme le bleu,
Vert, brun, etc. et il n'y a aucun moyen de classer ces catégories hiérarchiquement, c'est-à-dire, du
plus haut au plus bas ou vice versa.
Source de l'image: Google images

Données ordinales

1. La différence cruciale avec les types de données nominaux est que les données ordinales indiquent
où un nombre est présent dans un ordre particulier..

2. Ce type de données est placé dans une sorte d'ordre en fonction de sa position sur une échelle. Les
données ordinales peuvent indiquer une supériorité.

3. Nous ne pouvons pas faire d'opérations arithmétiques avec des données ordinales car elles ne
montrent que la séquence.

4. Les variables ordinales sont considérées comme des variables "intermédiaires" qualitatives et
quantitatives..

5. En mots simples, on peut comprendre les données ordinales comme des données qualitatives pour
lesquelles les valeurs sont ordonnées.

6. Par rapport aux données nominales, la seconde est des données qualitatives dont les valeurs ne
peuvent pas être placées dans un ordre.

7. Selon la position relative, nous pouvons également attribuer des nombres aux données ordinales.
Mais on ne peut pas faire de maths avec ces nombres. Par exemple, “Premier, seconde, troisième …
etc.”

Exemples de données ordinales:

 Classement des utilisateurs dans une compétition: Le premier, deuxième et troisième, etc.

 Cotation d'un produit prise par l'entreprise sur une échelle de 1 Al 10.

 Situation économique: baja, moyen et haut.

Source de l'image: Google images


Données quantitatives

Données discrètes

1. Renvoie le nombre impliquant uniquement des nombres entiers et nous ne pouvons pas subdiviser
les valeurs discrètes en parties.

Par exemple, le nombre d'élèves dans une classe est un exemple de données discrètes, puisque nous
pouvons compter des individus complets mais nous ne pouvons pas compter comme 2.5, 3.75, des
gamins.

2. En mots simples, les données discrètes ne peuvent prendre que certaines valeurs et les variables
de données ne peuvent pas être divisées en parties plus petites.

3. A un nombre limité de valeurs possibles par exemple, jours du mois.

Exemples de données discrètes:

 Le nombre d'élèves dans une classe.

 Le nombre de travailleurs dans une entreprise.

 Le nombre de questions de test auxquelles vous avez répondu correctement.


Source de l'image: Google images

Données continues

1. Représente des informations qui pourraient être décomposées de manière significative à leurs
niveaux les plus fins. Il peut être mesuré sur une échelle ou en continu et peut avoir presque
n'importe quelle valeur numérique.

Par exemple, Nous pouvons mesurer notre taille à des échelles très précises dans différentes unités
comme les mètres, centimètres, millimètres, etc.
2. La principale différence entre les types de données continus et discrets est que dans le premier,
nous pouvons enregistrer des données continues dans autant de mesures différentes que la largeur,
Température, conditions météorologiques, etc.

3. Les variables continues peuvent prendre n'importe quelle valeur entre deux nombres. Par
exemple, entre la gamme de 60 Oui 82 pouces, il y a des millions de hauteurs possibles comme
62.04762 pouces, 79.948376 pouces, etc.

4. Une bonne règle de base pour définir si les données sont continues ou discrètes est de savoir si le
point de mesure peut être divisé par deux et que cela a toujours du sens, les données sont continues.

Exemples de données continues:

 Le temps nécessaire à la réalisation d'un projet.

 Hauteur des enfants.

 Vitesse des voitures.


Source de l'image: Google images

Données d'intervalle

1. Ces types de données peuvent être mesurés et ordonnés avec les éléments les plus proches, mais
ils n'ont pas de zéro significatif.

Comprenons le sens de “Échelle d'intervalle”:

Sur l'échelle des intervalles, le terme « intervalle’ signifie espace au milieu, ce qui est important à
retenir, puisque les échelles d'intervalle non seulement nous renseignent sur l'ordre, mais aussi
fournir des informations sur la valeur entre chaque élément.
2. Essentiellement, nous pouvons afficher les données d'intervalle de la même manière que les
données de rapport, mais ce que nous devons prendre en compte, c'est ses points zéro caractérisés.

3. Donc, à l'aide de données d'intervalle, nous pouvons facilement corréler les degrés des données et
également ajouter ou soustraire les valeurs.

4. Il existe des statistiques descriptives que nous pouvons calculer pour les données d'intervalle
comme:

 Mesures de tendance centrale (médias, médian, mode)

 Rang (le minimum, maximum)

 Diffuser (centiles, intervalle interquartile et écart type).

Ce ne sont pas les seules choses statistiques à calculer, mais on peut aussi calculer plus de choses.

Exemples de données d'intervalle:

 Température (° C o F, mais pas Kelvin)

 Rendez-vous (1055, 1297, 1976, etc.)

 Intervalle de temps sur une horloge 12 Heures (6 une. M., 6 p. M.)

Données de relation

1. Ces données sont également dans les unités ordonnées qui ont la même différence.

2. Les valeurs de rapport sont les mêmes que les valeurs d'intervalle, mais la seule différence est que
les données de rapport ont un zéro absolu. Par exemple, la taille, poids, longueur, etc.

3. Ceux-ci sont mesurés et ordonnés avec des éléments équidistants avec un zéro significatif et ne
seront jamais négatifs comme les données d'intervalle.

Comprenons cela avec un exemple exceptionnel: Mesure de la hauteur.

La hauteur peut être mesurée en unités telles que les centimètres, pouces, mètres ou pieds et il n'est
pas possible d'avoir une valeur de hauteur négative.

4. Il nous éclaire sur l'ordre des variables, les contrastes entre eux, et ils ont absolument zéro.

5. Les données de rapport sont fondamentalement les mêmes que les données d'intervalle, à part
zéro signifie aucun.

6. Les statistiques descriptives que nous pouvons calculer pour les données de ratio sont les mêmes
que les données d'intervalle comme:

 Mesures de tendance centrale (médias, médian, mode)

 Rang (le minimum, maximum)

 Diffuser (centiles, intervalle interquartile et écart type).

Exemple de données de relation:

 Âge (de 0 ans à 100+)

 Température (à Kelvin, mais pas en °C ou F)


 Intervalle de temps (mesuré avec un chronomètre ou similaire)

Pour les exemples ci-dessus de données de ratio, on voit qu'il y a un point zéro réel et significatif
comme l'âge d'une personne, zéro absolu, la distance calculée à partir d'un point ou d'un moment
spécifique, ils ont tous de vrais zéros.

REMARQUE:

Si nous choisissons le point zéro de l'échelle subjectivement, alors à ce stade, les données ne peuvent
pas être des données de rapport et doivent être des données d'intervalle.

Remarques finales

Merci pour la lecture!

J'espère que vous avez apprécié l'article et augmenté vos connaissances sur les types de données
dans les statistiques.

N'hésitez pas à me contacter sur Courrier électronique

Tout ce qui n'est pas mentionné ou voulez-vous partager vos pensées? N'hésitez pas à commenter ci-
dessous et je vous répondrai.

Pour les articles restants, Demande à Relier.

A propos de l'auteur

Aashi Goyal

Actuellement, Je poursuis mon Bachelor of Technology (B.Tech) en génie électronique et des


communications de Universidad Guru Jambheshwar (GJU), Hisar. Je suis très enthousiasmé par les
statistiques et la science des données.

Les supports présentés dans cet article sur les types de données dans les statistiques ne sont pas la
propriété d'Analytics Vidhya et sont utilisés à la discrétion de l'auteur.

Vous aimerez peut-être aussi