Analyse de Données Vocabulaire

Vocabulaire
Étiquettes Vocabulaire
État Not started
Analyse univariée : permet d’examiner la distribution des modalité pour une seule variable
Analyse bivariée : permet de étudier le lien entre deux variables
Analyse multivariée : L'analyse multivariée est une famille de méthodes statistiques qui
regroupe deux catégories : des méthodes descriptives et des méthodes explicatives
Etude qualitative : Une étude qualitative a pour but de comprendre ou d’expliquer un

phénomène elle peut être nominale comme elle peut être ordinale
Etude quantitative : Elle permet d’expliquer ou de comprendre un phénomène en le

quantifiant elle peut être continue comme discrète
Etude descriptive : à pour but de transformer les données collecté en des structures qui
permet la description d’une population cible
Etude explicative : permet de transformer les données en un modèle mathématique

expliquant la relation de cause à effet entre les variables
Etudes prédictives : utilisant à la fois des données actuelles et historiques, permet de créer
hypothèses et prédictions sur des événements futurs.
Occurrences : occurrence d’un évènement définit son apparition dans le temps
Modalité : Les modalités d'une variable qualitative sont les différentes valeurs que peut
prendre celle-ci
Donnée Primaire : Se sont des donnée qui vont être collecté spécialement pour résoudre la
problématique managérial
Donnée Secondaire : Se Sont des donnée qui ont été collecté pour des études précédentes
mais on peut tirer avantage d’eux pour l’étude actuelle sauf que elle sont à faible valeur
ajouté et se sont des données aberrantes
Population : Total d’individu sur lequel porte l’étude
Vocabulaire 1
Echantillon : Sous ensemble de la population
Echantillon représentatif : Pour être représentatif, un échantillon doit avoir une taille
suffisante. En général, plus l'échantillon est grand, plus il est représentatif de la population
cible est vérifier que les caractéristiques de l'échantillon sont similaires à celles de la
population cible.
Recensement : Technique de collecte pour la population
Sondage : Technique de collecte conçu pour l’échantillon
les Technique d’etudes :
Panel : Enquête approfondie réalisée périodiquement sur les mêmes clients taille
d’échantillon entre 2000 et 10000
Marché test : Etude Quanti pour prévoir les ventes et les parts du marché pour un
nouveau produit
Baromètre : Etude réalisé à date fixe avec le même questionnaire pour le compte d’un
ou plusieurs clients
Omnibus : Etude quanti réalisée à date régulière, le questionnaire utilisé regroupe

l'ensemble des questions de différents souscripteurs
Etude Adhoc : Etude Quanti ou Quali pour le compte d’un seul client
Entretien individuelle : recueille de discours individuelles il peut être directif , semi

directif ou non directif
Réunion de groupe : étude qualitatif , libre de 8 à 12 personne conduite par un

animateur
Phénomène : Problématique étudiée
Construit : les construits peuvent être utilisés comme variables d'explication dans des
modèles statistiques pour comprendre comment ils influencent les variables de réponse.
Items: Total des variables qui mesure la même chose
Paramètre : Indicateur qui permet de décrire la population
Composante : Ensemble des éléments qui mesurent la même chose
Description d’une variable qualitative :
Vocabulaire 2
Ordinale : Codifié les variable qualitatives et procéder aux calcules des paramètres
comme en fait pour la variable quanti
Nominal : Présenter les effectifs ,fréquences et les graphiques pour chaque modalité .
Description d’une variable quanti : Indicateur de tendance centrale ; dispersion ;

distribution
Une Variable Muette : c’est une variable utilisé pour expliquer des variables qualitatives
sauf que ils n'ont pas de valeur explicite dans l'étude.
Echelle métrique : Possède les propriété des échelles nominales et ordinales , mais elle
permet aussi de comparer les distances entre les modalité étant séparée par des espaces
équidistants
Régression : prédire des variables à partir d’autres variables qui lui sont corréler
Prémisses RLS : condition de la RLS
1. La linéarité de phénomène mesuré
2. la variance constante du terme d’erreur
3. La Normalité du distribution du termes
4. Vérification anova
Prémisse RLM :
1. La linéarité de phénomène étudie
2. La variance constante en terme d’erreur
3. L’indépendance des termes d’erreurs
4. La normalité de distribution
5. l’indépendances des variables exogène
Régression Logistique : La régression logistique propose de tester un modèle de

régression dont la variable dépendante est dichotomique (codée 0-1) c’est à dire
qualitative , il peut être binomiale comme multinomial quand Y comprend deux
modalité ( les deux sont supervisé )
Régression discriminante : Comme la régression logistique , exige la normalité des

distribution
Vocabulaire 3
Corrélation : Indicateur qui nous permet de voir si il existe un lien entre les variables
Statistique : La statistique est une branche de la mathématique qui s'intéresse à la collecte,

l'analyse, l'interprétation, la présentation et la communication de données. permet de décrire
l’echantillon
Statistique descriptives : calcules des paramètres des variables
Statistique inférentielle : ensemble de méthodes qui permettent l'extrapolation des

résultats
Statistique probabiliste : Utilisation des loi usuelles
Variable dépendante : La valeur recherché c’est Y
Variables indépendante : Les variables qui vont nous aidé a trouvé X
Le modèle théorique : y = β0 + β1x + ε
Résidu ( écart de prévision / erreur empirique ) : Ecart entre valeur observée et valeur
estimée
Méthode des moindres carrés : méthode des moindres carré permet de minimiser les écart
tous en éliminant la compensation des valeurs négatives par les valeurs positives
Relation entre seuil signification et marge d’erreur : En augmentant alpha en nous donne
plus une marge d’erreur plus nos propos sont correctes .
Coefficient de variation : compare la dispersion des sous échantillon par rapport à la

moyenne
Variable modératrice : Une variable qui peut influencer l’intensité ou le sens de relation
entre X et Y en décomposant l’échantillon en sous échantillon
Variable médiatrices : Une variable intermédiaire qui permet de mesurer l’effet de la

variable indépendante sur la variable dépendante
Les échelles de mesure : elle existe plusieurs échelles

⇒ échelle nominales : il utilise les nombres pour coder les variables quali
⇒ échelles Ordinales : échelles de classement , il utilise les nombres pour données un ordre
spécifique
⇒ échelle métrique : dispose des propriété des échelle nominales et ordinal permet de
mesurer les distances entre les modalité étant séparée par des espaces équidistants
Vocabulaire 4
Anova : Probabilité de se tromper en confirmant un lien . ( Analyse de la variance )
Anova à un facteur : elle est utilisé dans la cas d’une variable dépendante est constitué de
plusieurs modalité
Hypothèse nulle : c’est que l’intervalle de confiance de B1 Contient la valeur 0 ; Lorsque

Anova < Alpha on confirme le lien en rejettent H0
Méthode scoring : Une méthode Utilisée dans les différents milieux pour attribué a un
élément un certains score en fonction de plusieurs facteurs
⇒ Par Exemple la banque va procéder à cette méthode pour Octroi de crédit donc elle va
bâtir un score en prenant en considération les impayés , salaire , CSP , Taux d’endettement .
Erreur Type : c’est la dispersion des moyennes des moyennes
Paramètre : ensemble Indicateur qui permet de décrire une variable au niveau de la

population
Erreur aléatoire : erreur provenant de circonstance de mesure comme la fatigue etc …
Erreur systématique : erreur provenant de l’outils de mesure
Analyse Factorielle : l'analyse factorielle est une technique statistique qui permet de réduire
la dimensionnalité de données en créant de nouvelles variables appelées "facteurs". Il existe
plusieurs types d'analyses factorielles, qui diffèrent selon la manière dont les facteurs sont
calculés et selon les hypothèses sur la structure des données. Les types d'analyses
factorielles les plus courants sont l'analyse factorielle en composantes principales (ACP),
l'analyse factorielle discriminante (AFD) et l'analyse factorielle confirmatoire (AFC).
AFE ou ACP : L'analyse en composantes principales (ACP) est une technique

statistique qui permet de réduire la dimensionnalité de données en créant de nouvelles
variables appelées "composantes principales". L'ACP est souvent utilisée lorsqu'on
travaille avec des données qui ont de nombreuses variables, car elle permet de réduire le
nombre de variables tout en préservant le maximum d'informations possible. Elle est
également utile pour visualiser les données et identifier les relations entre les variables.
Corrélation partielle : sert à quantifier et étudier le relation entre X et Y en relevant

l’élément médiateur
Corrélation Multiple : sert à déterminer la force de relation entre une variable dépendante et
plusieurs variable indépendante
Vocabulaire 5
Covariance : Elle sert à quantifier l’écart entre les variances
Droite théorique : passe par tous les points , impossible de la tracer
Droite Empirique : droite qui minimise les écarts entre la valeurs observé et la valeur estimé
Test durbin-watson : le test de Durbin-Watson est utilisé pour détecter l’autocorrélation

entre les résidus d’une régression linéaire.
Test de Fisher : il s'agit d'un test statistique, pour comparer la dispersion deux sous
échantillon
Degré de liberté : font référence au nombre maximum de valeurs logiquement

indépendantes, qui sont des valeurs qui ont la liberté de varier, dans l’échantillon de
données.
Test de Kolmogorov Smirnov : vérifier si une série de données suit une distribution
particulière .
Coefficient standardisée : permet de vérifier le sens de relation entre la variables

dépendantes et indépendantes
Coefficient brut : Le coefficient brut d'une variable dans un modèle de régression est un
nombre qui indique l'impact de la variation de cette variable sur la variable cible.
Extrapolation : L'extrapolation est un processus qui consiste à utiliser un modèle statistique

pour prédire des valeurs au-delà de la plage de valeurs observées dans les données utilisées
pour construire le modèle. Cela peut être utile dans de nombreux contextes, car cela permet
de prévoir ce qui pourrait se passer dans des situations ou des conditions qui n'ont pas été
observées dans les données d'origine. Par exemple, un modèle de prévision de la demande
de produits pourrait être utilisé pour prévoir la demande de produits dans des régions où
l'entreprise n'a pas encore été présente, ou un modèle de prévision du climat pourrait être
utilisé pour prévoir les conditions météorologiques dans des régions où il n'y a pas de
données de mesure.
Question filtre : vise à filtrer les répondants dans un questionnaire
Valeur atypique , aberrantes : Une valeur aberrante est une valeur qui s'écarte fortement
des valeurs des autres observations, anormalement faible ou élevée.
Loi Normal centré réduite : courbe symétrique à l’axe des ordonnées , est une loi à densité
de probabilité avec un moyenne nulle et l’écart type égale a un .
Vocabulaire 6
ANCOVA : l’analyse de covariance pour des variables indépendantes à la fois qualitatifs et
quantitatifs
Variable Latent Mimique : Une variable latente mimique est une variable qui ne peut pas
être observée directement, mais qui peut être inférée à partir de données observées.
Test Shapiro Wilk : Le test de Shapiro-Wilk est un test statistique utilisé pour vérifier si une
série de données suit une distribution normale.
⇒ Si W proche de 1 c’est à dire que le modèle suit une distribution normal

⇒ Si W est Faible c’est à dire le modèle ne suit pas une distribution normal
Distribution d’échantillonnage des moyennes : décrit comment la série des moyennes de
l’échantillon de taille fixe se répartissent autour de la moyenne de la population qu’il est censé
être représentatif
Varimax : Repérer l’association sans déperdition d’information

Critère de concentration :
Vocabulaire 7

Analyse de Données Vocabulaire

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Analyse de Données Vocabulaire

Transféré par

Droits d'auteur :

Formats disponibles

Vocabulaire

État Not started

Analyse bivariée : permet de étudier le lien entre deux variables

Etude qualitative : Une étude qualitative a pour but de comprendre ou d’expliquer un

Etude quantitative : Elle permet d’expliquer ou de comprendre un phénomène en le

Etude explicative : permet de transformer les données en un modèle mathématique

Occurrences : occurrence d’un évènement définit son apparition dans le temps

Population : Total d’individu sur lequel porte l’étude

Recensement : Technique de collecte pour la population

Sondage : Technique de collecte conçu pour l’échantillon

les Technique d’etudes :

Omnibus : Etude quanti réalisée à date régulière, le questionnaire utilisé regroupe

Entretien individuelle : recueille de discours individuelles il peut être directif , semi

Réunion de groupe : étude qualitatif , libre de 8 à 12 personne conduite par un

Phénomène : Problématique étudiée

Items: Total des variables qui mesure la même chose

Paramètre : Indicateur qui permet de décrire la population

Composante : Ensemble des éléments qui mesurent la même chose

Description d’une variable qualitative :

Description d’une variable quanti : Indicateur de tendance centrale ; dispersion ;

Prémisses RLS : condition de la RLS

1. La linéarité de phénomène mesuré

2. la variance constante du terme d’erreur

3. La Normalité du distribution du termes

1. La linéarité de phénomène étudie

2. La variance constante en terme d’erreur

3. L’indépendance des termes d’erreurs

5. l’indépendances des variables exogène

Régression Logistique : La régression logistique propose de tester un modèle de

Régression discriminante : Comme la régression logistique , exige la normalité des

Statistique : La statistique est une branche de la mathématique qui s'intéresse à la collecte,

Statistique descriptives : calcules des paramètres des variables

Statistique inférentielle : ensemble de méthodes qui permettent l'extrapolation des

Statistique probabiliste : Utilisation des loi usuelles

Variable dépendante : La valeur recherché c’est Y

Variables indépendante : Les variables qui vont nous aidé a trouvé X

Le modèle théorique : y = β0 + β1x + ε

Coefficient de variation : compare la dispersion des sous échantillon par rapport à la

Variable médiatrices : Une variable intermédiaire qui permet de mesurer l’effet de la

Les échelles de mesure : elle existe plusieurs échelles

Hypothèse nulle : c’est que l’intervalle de confiance de B1 Contient la valeur 0 ; Lorsque

Erreur Type : c’est la dispersion des moyennes des moyennes

Paramètre : ensemble Indicateur qui permet de décrire une variable au niveau de la

Erreur aléatoire : erreur provenant de circonstance de mesure comme la fatigue etc …

Erreur systématique : erreur provenant de l’outils de mesure

AFE ou ACP : L'analyse en composantes principales (ACP) est une technique

Corrélation partielle : sert à quantifier et étudier le relation entre X et Y en relevant

Droite théorique : passe par tous les points , impossible de la tracer

Test durbin-watson : le test de Durbin-Watson est utilisé pour détecter l’autocorrélation

Degré de liberté : font référence au nombre maximum de valeurs logiquement

Coefficient standardisée : permet de vérifier le sens de relation entre la variables

Extrapolation : L'extrapolation est un processus qui consiste à utiliser un modèle statistique

Question filtre : vise à filtrer les répondants dans un questionnaire

⇒ Si W proche de 1 c’est à dire que le modèle suit une distribution normal

Varimax : Repérer l’association sans déperdition d’information

Vous aimerez peut-être aussi