Académique Documents
Professionnel Documents
Culture Documents
Dans Science des données, notre objectif est de mener différentes expériences avec des données
brutes et de trouver de bonnes informations à partir des données. Pour conduire toute entreprise sur
la bonne voie, les données sont très importantes ou on peut dire que “Les données sont le
carburant”. Vous pouvez au moins fournir des informations utiles qui peuvent aider:
Dans toutes les choses mentionnées ci-dessus, le seul élément de conduite commun est les données.
Nous entrons dans l'ère numérique où nous produisons chaque jour une grande quantité de
données.
Par exemple, du quotidien, une entreprise comme Flipkart produit plus de 2 To de données.
En raison de la grande importance des données dans notre vie, il devient très important de stocker et
de traiter ces données correctement sans aucune erreur. Lorsque vous traitez des ensembles de
données, le type de données ou la catégorie des données joue un rôle important pour trouver la
réponse aux questions suivantes:
Quel type d'analyse statistique doit être appliqué pour obtenir les meilleurs résultats.
Ensuite, dans cet article, nous discuterons des différents types de données en statistiques que vous
devez savoir faire L'analyse exploratoire des données (AED), qui est l'un des composants les plus
importants dans le pipeline d'un projet d'apprentissage automatique.
Table des matières
3. Données qualitatives
Données nominales
Données ordinales
4. Données quantitatives
Données discrètes
Données continues
Données d'intervalle
Données de relation
Contenu
1. introduction
1. Données quantitatives
2. Données qualitatives
5. Données qualitatives
1. Données nominales
2. Données ordinales
3. Données quantitatives
4. Données discrètes
5.
6. Données continues
7.
8. Données d'intervalle
9. Données de relation
6. Remarques finales
1. A propos de l'auteur
7. Aashi Goyal
1. En rapport
Cet article a été publié dans le cadre du Blogathon sur la science des données
introduction
Dans Science des données, notre objectif est de mener différentes expériences avec des données
brutes et de trouver de bonnes informations à partir des données. Pour conduire toute entreprise sur
la bonne voie, les données sont très importantes ou on peut dire que “Les données sont le
carburant”. Vous pouvez au moins fournir des informations utiles qui peuvent aider:
Dans toutes les choses mentionnées ci-dessus, le seul élément de conduite commun est les données.
Nous entrons dans l'ère numérique où nous produisons chaque jour une grande quantité de
données.
Par exemple, du quotidien, une entreprise comme Flipkart produit plus de 2 To de données.
En raison de la grande importance des données dans notre vie, il devient très important de stocker et
de traiter ces données correctement sans aucune erreur. Lorsque vous traitez des ensembles de
données, le type de données ou la catégorie des données joue un rôle important pour trouver la
réponse aux questions suivantes:
Quel type d'analyse statistique doit être appliqué pour obtenir les meilleurs résultats.
Ensuite, dans cet article, nous discuterons des différents types de données en statistiques que vous
devez savoir faire L'analyse exploratoire des données (AED), qui est l'un des composants les plus
importants dans le pipeline d'un projet d'apprentissage automatique.
Source de l'image: Google images
3. Données qualitatives
Données nominales
Données ordinales
4. Données quantitatives
Données discrètes
Données continues
Données d'intervalle
Données de relation
Dans les statistiques, les types de données jouent un rôle très crucial et important, ce qu'il faut
comprendre, appliquer correctement des mesures statistiques à vos données afin que nous puissions
conclure correctement certaines hypothèses sur les données.
de la même manière, nous devons savoir sur quelle analyse de données et son type vous travaillez
pour sélectionner la bonne technique de perception, puisque différents types de données sont
considérés comme une approche pour organiser divers types de variables.
Tout en faisant L'analyse exploratoire des données (AED) Dans un projet général de science des
données, une bonne compréhension des différents types de données est cruciale, puisque nous
pouvons utiliser certaines mesures statistiques uniquement pour des types de données spécifiques.
Lorsque vous traitez avec l'un des types de données, nous devons également savoir quelle méthode
d'affichage correspond au type de données particulier.
Nous pouvons considérer les types de données comme un moyen de catégoriser différents types de
variables.
Données quantitatives
1. Ces types de données semblent être les plus faciles à expliquer. Essayez de trouver les réponses à
des questions comme
“De nombreux,
“Combien de fois”
2. Peut être exprimé sous forme de nombre, il peut donc être quantifié. En mots simples, peut être
mesuré par des variables numériques.
3. Ceux-ci sont facilement ouverts pour la manipulation statistique et peuvent être représentés par
une grande variété de types statistiques de graphiques et de tableaux tels que graphiques en
courbes, graphiques à barres, nuage de pointsetc.
Résultats des tests et des examens, p. Pas. 74, 67, 98, etc.
Données discrètes
Données continues
Données qualitatives
1. Les données qualitatives ne peuvent pas être exprimées sous forme de nombre, donc ils ne
peuvent pas être mesurés. Il se compose principalement de mots, images et symboles, mais pas des
chiffres.
2. Il est également connu sous le nom Données catégorielles puisque les informations peuvent être
triées par catégorie, pas par numéro.
Destinations de vacances populaires comme la Suisse, Nouvelle Zélande, Afrique du Sud, etc.
Données nominales
Données ordinales.
Données qualitatives
Données nominales
1. Ce type de données est utilisé uniquement pour étiqueter les variables, sans avoir de valeur
quantitative. Ici, le terme 'nominal’ vient du mot latin “personne” ce qui veut dire 'nom’.
2. Nommez juste une chose sans demander de commande particulière. Les données nominales
parfois appelées “Étiquettes”.
Comme vous pouvez le voir dans les exemples, il n'y a pas d'ordre intrinsèque pour les variables.
La couleur des yeux est une variable nominale qui a quelques niveaux ou catégories comme le bleu,
Vert, brun, etc. et il n'y a aucun moyen de classer ces catégories hiérarchiquement, c'est-à-dire, du
plus haut au plus bas ou vice versa.
Source de l'image: Google images
Données ordinales
1. La différence cruciale avec les types de données nominaux est que les données ordinales indiquent
où un nombre est présent dans un ordre particulier..
2. Ce type de données est placé dans une sorte d'ordre en fonction de sa position sur une échelle. Les
données ordinales peuvent indiquer une supériorité.
3. Nous ne pouvons pas faire d'opérations arithmétiques avec des données ordinales car elles ne
montrent que la séquence.
4. Les variables ordinales sont considérées comme des variables "intermédiaires" qualitatives et
quantitatives..
5. En mots simples, on peut comprendre les données ordinales comme des données qualitatives pour
lesquelles les valeurs sont ordonnées.
6. Par rapport aux données nominales, la seconde est des données qualitatives dont les valeurs ne
peuvent pas être placées dans un ordre.
7. Selon la position relative, nous pouvons également attribuer des nombres aux données ordinales.
Mais on ne peut pas faire de maths avec ces nombres. Par exemple, “Premier, seconde, troisième …
etc.”
Classement des utilisateurs dans une compétition: Le premier, deuxième et troisième, etc.
Cotation d'un produit prise par l'entreprise sur une échelle de 1 Al 10.
Données discrètes
1. Renvoie le nombre impliquant uniquement des nombres entiers et nous ne pouvons pas subdiviser
les valeurs discrètes en parties.
Par exemple, le nombre d'élèves dans une classe est un exemple de données discrètes, puisque nous
pouvons compter des individus complets mais nous ne pouvons pas compter comme 2.5, 3.75, des
gamins.
2. En mots simples, les données discrètes ne peuvent prendre que certaines valeurs et les variables
de données ne peuvent pas être divisées en parties plus petites.
Données continues
1. Représente des informations qui pourraient être décomposées de manière significative à leurs
niveaux les plus fins. Il peut être mesuré sur une échelle ou en continu et peut avoir presque
n'importe quelle valeur numérique.
Par exemple, Nous pouvons mesurer notre taille à des échelles très précises dans différentes unités
comme les mètres, centimètres, millimètres, etc.
2. La principale différence entre les types de données continus et discrets est que dans le premier,
nous pouvons enregistrer des données continues dans autant de mesures différentes que la largeur,
Température, conditions météorologiques, etc.
3. Les variables continues peuvent prendre n'importe quelle valeur entre deux nombres. Par
exemple, entre la gamme de 60 Oui 82 pouces, il y a des millions de hauteurs possibles comme
62.04762 pouces, 79.948376 pouces, etc.
4. Une bonne règle de base pour définir si les données sont continues ou discrètes est de savoir si le
point de mesure peut être divisé par deux et que cela a toujours du sens, les données sont continues.
Données d'intervalle
1. Ces types de données peuvent être mesurés et ordonnés avec les éléments les plus proches, mais
ils n'ont pas de zéro significatif.
Sur l'échelle des intervalles, le terme « intervalle’ signifie espace au milieu, ce qui est important à
retenir, puisque les échelles d'intervalle non seulement nous renseignent sur l'ordre, mais aussi
fournir des informations sur la valeur entre chaque élément.
2. Essentiellement, nous pouvons afficher les données d'intervalle de la même manière que les
données de rapport, mais ce que nous devons prendre en compte, c'est ses points zéro caractérisés.
3. Donc, à l'aide de données d'intervalle, nous pouvons facilement corréler les degrés des données et
également ajouter ou soustraire les valeurs.
4. Il existe des statistiques descriptives que nous pouvons calculer pour les données d'intervalle
comme:
Ce ne sont pas les seules choses statistiques à calculer, mais on peut aussi calculer plus de choses.
Données de relation
1. Ces données sont également dans les unités ordonnées qui ont la même différence.
2. Les valeurs de rapport sont les mêmes que les valeurs d'intervalle, mais la seule différence est que
les données de rapport ont un zéro absolu. Par exemple, la taille, poids, longueur, etc.
3. Ceux-ci sont mesurés et ordonnés avec des éléments équidistants avec un zéro significatif et ne
seront jamais négatifs comme les données d'intervalle.
La hauteur peut être mesurée en unités telles que les centimètres, pouces, mètres ou pieds et il n'est
pas possible d'avoir une valeur de hauteur négative.
4. Il nous éclaire sur l'ordre des variables, les contrastes entre eux, et ils ont absolument zéro.
5. Les données de rapport sont fondamentalement les mêmes que les données d'intervalle, à part
zéro signifie aucun.
6. Les statistiques descriptives que nous pouvons calculer pour les données de ratio sont les mêmes
que les données d'intervalle comme:
Pour les exemples ci-dessus de données de ratio, on voit qu'il y a un point zéro réel et significatif
comme l'âge d'une personne, zéro absolu, la distance calculée à partir d'un point ou d'un moment
spécifique, ils ont tous de vrais zéros.
REMARQUE:
Si nous choisissons le point zéro de l'échelle subjectivement, alors à ce stade, les données ne peuvent
pas être des données de rapport et doivent être des données d'intervalle.
Remarques finales
J'espère que vous avez apprécié l'article et augmenté vos connaissances sur les types de données
dans les statistiques.
Tout ce qui n'est pas mentionné ou voulez-vous partager vos pensées? N'hésitez pas à commenter ci-
dessous et je vous répondrai.
A propos de l'auteur
Aashi Goyal
Les supports présentés dans cet article sur les types de données dans les statistiques ne sont pas la
propriété d'Analytics Vidhya et sont utilisés à la discrétion de l'auteur.