Vous êtes sur la page 1sur 7

Vocabulaire

Étiquettes Vocabulaire

État Not started

Analyse univariée : permet d’examiner la distribution des modalité pour une seule variable

Analyse bivariée : permet de étudier le lien entre deux variables

Analyse multivariée : L'analyse multivariée est une famille de méthodes statistiques qui
regroupe deux catégories : des méthodes descriptives et des méthodes explicatives

Etude qualitative : Une étude qualitative a pour but de comprendre ou d’expliquer un


phénomène elle peut être nominale comme elle peut être ordinale

Etude quantitative : Elle permet d’expliquer ou de comprendre un phénomène en le


quantifiant elle peut être continue comme discrète

Etude descriptive : à pour but de transformer les données collecté en des structures qui
permet la description d’une population cible

Etude explicative : permet de transformer les données en un modèle mathématique


expliquant la relation de cause à effet entre les variables

Etudes prédictives : utilisant à la fois des données actuelles et historiques, permet de créer
hypothèses et prédictions sur des événements futurs.

Occurrences : occurrence d’un évènement définit son apparition dans le temps

Modalité : Les modalités d'une variable qualitative sont les différentes valeurs que peut
prendre celle-ci

Donnée Primaire : Se sont des donnée qui vont être collecté spécialement pour résoudre la
problématique managérial

Donnée Secondaire : Se Sont des donnée qui ont été collecté pour des études précédentes
mais on peut tirer avantage d’eux pour l’étude actuelle sauf que elle sont à faible valeur
ajouté et se sont des données aberrantes

Population : Total d’individu sur lequel porte l’étude

Vocabulaire 1
Echantillon : Sous ensemble de la population

Echantillon représentatif : Pour être représentatif, un échantillon doit avoir une taille
suffisante. En général, plus l'échantillon est grand, plus il est représentatif de la population
cible est vérifier que les caractéristiques de l'échantillon sont similaires à celles de la
population cible.

Recensement : Technique de collecte pour la population

Sondage : Technique de collecte conçu pour l’échantillon

les Technique d’etudes :

Panel : Enquête approfondie réalisée périodiquement sur les mêmes clients taille
d’échantillon entre 2000 et 10000

Marché test : Etude Quanti pour prévoir les ventes et les parts du marché pour un
nouveau produit

Baromètre : Etude réalisé à date fixe avec le même questionnaire pour le compte d’un
ou plusieurs clients

Omnibus : Etude quanti réalisée à date régulière, le questionnaire utilisé regroupe


l'ensemble des questions de différents souscripteurs

Etude Adhoc : Etude Quanti ou Quali pour le compte d’un seul client

Entretien individuelle : recueille de discours individuelles il peut être directif , semi


directif ou non directif

Réunion de groupe : étude qualitatif , libre de 8 à 12 personne conduite par un


animateur

Phénomène : Problématique étudiée

Construit : les construits peuvent être utilisés comme variables d'explication dans des
modèles statistiques pour comprendre comment ils influencent les variables de réponse.

Items: Total des variables qui mesure la même chose

Paramètre : Indicateur qui permet de décrire la population

Composante : Ensemble des éléments qui mesurent la même chose

Description d’une variable qualitative :

Vocabulaire 2
Ordinale : Codifié les variable qualitatives et procéder aux calcules des paramètres
comme en fait pour la variable quanti

Nominal : Présenter les effectifs ,fréquences et les graphiques pour chaque modalité .

Description d’une variable quanti : Indicateur de tendance centrale ; dispersion ;


distribution

Une Variable Muette : c’est une variable utilisé pour expliquer des variables qualitatives
sauf que ils n'ont pas de valeur explicite dans l'étude.

Echelle métrique : Possède les propriété des échelles nominales et ordinales , mais elle
permet aussi de comparer les distances entre les modalité étant séparée par des espaces
équidistants

Régression : prédire des variables à partir d’autres variables qui lui sont corréler

Prémisses RLS : condition de la RLS

1. La linéarité de phénomène mesuré

2. la variance constante du terme d’erreur

3. La Normalité du distribution du termes

4. Vérification anova

Prémisse RLM :

1. La linéarité de phénomène étudie

2. La variance constante en terme d’erreur

3. L’indépendance des termes d’erreurs

4. La normalité de distribution

5. l’indépendances des variables exogène

Régression Logistique : La régression logistique propose de tester un modèle de


régression dont la variable dépendante est dichotomique (codée 0-1) c’est à dire
qualitative , il peut être binomiale comme multinomial quand Y comprend deux
modalité ( les deux sont supervisé )

Régression discriminante : Comme la régression logistique , exige la normalité des


distribution

Vocabulaire 3
Corrélation : Indicateur qui nous permet de voir si il existe un lien entre les variables

Statistique : La statistique est une branche de la mathématique qui s'intéresse à la collecte,


l'analyse, l'interprétation, la présentation et la communication de données. permet de décrire
l’echantillon

Statistique descriptives : calcules des paramètres des variables

Statistique inférentielle : ensemble de méthodes qui permettent l'extrapolation des


résultats

Statistique probabiliste : Utilisation des loi usuelles

Variable dépendante : La valeur recherché c’est Y

Variables indépendante : Les variables qui vont nous aidé a trouvé X

Le modèle théorique : y = β0 + β1x + ε

Résidu ( écart de prévision / erreur empirique ) : Ecart entre valeur observée et valeur
estimée

Méthode des moindres carrés : méthode des moindres carré permet de minimiser les écart
tous en éliminant la compensation des valeurs négatives par les valeurs positives

Relation entre seuil signification et marge d’erreur : En augmentant alpha en nous donne
plus une marge d’erreur plus nos propos sont correctes .

Coefficient de variation : compare la dispersion des sous échantillon par rapport à la


moyenne

Variable modératrice : Une variable qui peut influencer l’intensité ou le sens de relation
entre X et Y en décomposant l’échantillon en sous échantillon

Variable médiatrices : Une variable intermédiaire qui permet de mesurer l’effet de la


variable indépendante sur la variable dépendante

Les échelles de mesure : elle existe plusieurs échelles


⇒ échelle nominales : il utilise les nombres pour coder les variables quali
⇒ échelles Ordinales : échelles de classement , il utilise les nombres pour données un ordre
spécifique
⇒ échelle métrique : dispose des propriété des échelle nominales et ordinal permet de
mesurer les distances entre les modalité étant séparée par des espaces équidistants

Vocabulaire 4
Anova : Probabilité de se tromper en confirmant un lien . ( Analyse de la variance )

Anova à un facteur : elle est utilisé dans la cas d’une variable dépendante est constitué de
plusieurs modalité

Hypothèse nulle : c’est que l’intervalle de confiance de B1 Contient la valeur 0 ; Lorsque


Anova < Alpha on confirme le lien en rejettent H0

Méthode scoring : Une méthode Utilisée dans les différents milieux pour attribué a un
élément un certains score en fonction de plusieurs facteurs

⇒ Par Exemple la banque va procéder à cette méthode pour Octroi de crédit donc elle va
bâtir un score en prenant en considération les impayés , salaire , CSP , Taux d’endettement .

Erreur Type : c’est la dispersion des moyennes des moyennes

Paramètre : ensemble Indicateur qui permet de décrire une variable au niveau de la


population

Erreur aléatoire : erreur provenant de circonstance de mesure comme la fatigue etc …

Erreur systématique : erreur provenant de l’outils de mesure

Analyse Factorielle : l'analyse factorielle est une technique statistique qui permet de réduire
la dimensionnalité de données en créant de nouvelles variables appelées "facteurs". Il existe
plusieurs types d'analyses factorielles, qui diffèrent selon la manière dont les facteurs sont
calculés et selon les hypothèses sur la structure des données. Les types d'analyses
factorielles les plus courants sont l'analyse factorielle en composantes principales (ACP),
l'analyse factorielle discriminante (AFD) et l'analyse factorielle confirmatoire (AFC).

AFE ou ACP : L'analyse en composantes principales (ACP) est une technique


statistique qui permet de réduire la dimensionnalité de données en créant de nouvelles
variables appelées "composantes principales". L'ACP est souvent utilisée lorsqu'on
travaille avec des données qui ont de nombreuses variables, car elle permet de réduire le
nombre de variables tout en préservant le maximum d'informations possible. Elle est
également utile pour visualiser les données et identifier les relations entre les variables.

Corrélation partielle : sert à quantifier et étudier le relation entre X et Y en relevant


l’élément médiateur

Corrélation Multiple : sert à déterminer la force de relation entre une variable dépendante et
plusieurs variable indépendante

Vocabulaire 5
Covariance : Elle sert à quantifier l’écart entre les variances

Droite théorique : passe par tous les points , impossible de la tracer

Droite Empirique : droite qui minimise les écarts entre la valeurs observé et la valeur estimé

Test durbin-watson : le test de Durbin-Watson est utilisé pour détecter l’autocorrélation


entre les résidus d’une régression linéaire.

Test de Fisher : il s'agit d'un test statistique, pour comparer la dispersion deux sous
échantillon

Degré de liberté : font référence au nombre maximum de valeurs logiquement


indépendantes, qui sont des valeurs qui ont la liberté de varier, dans l’échantillon de
données.

Test de Kolmogorov Smirnov : vérifier si une série de données suit une distribution
particulière .

Coefficient standardisée : permet de vérifier le sens de relation entre la variables


dépendantes et indépendantes

Coefficient brut : Le coefficient brut d'une variable dans un modèle de régression est un
nombre qui indique l'impact de la variation de cette variable sur la variable cible.

Extrapolation : L'extrapolation est un processus qui consiste à utiliser un modèle statistique


pour prédire des valeurs au-delà de la plage de valeurs observées dans les données utilisées
pour construire le modèle. Cela peut être utile dans de nombreux contextes, car cela permet
de prévoir ce qui pourrait se passer dans des situations ou des conditions qui n'ont pas été
observées dans les données d'origine. Par exemple, un modèle de prévision de la demande
de produits pourrait être utilisé pour prévoir la demande de produits dans des régions où
l'entreprise n'a pas encore été présente, ou un modèle de prévision du climat pourrait être
utilisé pour prévoir les conditions météorologiques dans des régions où il n'y a pas de
données de mesure.

Question filtre : vise à filtrer les répondants dans un questionnaire

Valeur atypique , aberrantes : Une valeur aberrante est une valeur qui s'écarte fortement
des valeurs des autres observations, anormalement faible ou élevée.

Loi Normal centré réduite : courbe symétrique à l’axe des ordonnées , est une loi à densité
de probabilité avec un moyenne nulle et l’écart type égale a un .

Vocabulaire 6
ANCOVA : l’analyse de covariance pour des variables indépendantes à la fois qualitatifs et
quantitatifs

Variable Latent Mimique : Une variable latente mimique est une variable qui ne peut pas
être observée directement, mais qui peut être inférée à partir de données observées.

Test Shapiro Wilk : Le test de Shapiro-Wilk est un test statistique utilisé pour vérifier si une
série de données suit une distribution normale.

⇒ Si W proche de 1 c’est à dire que le modèle suit une distribution normal


⇒ Si W est Faible c’est à dire le modèle ne suit pas une distribution normal
Distribution d’échantillonnage des moyennes : décrit comment la série des moyennes de
l’échantillon de taille fixe se répartissent autour de la moyenne de la population qu’il est censé
être représentatif

Varimax : Repérer l’association sans déperdition d’information


Critère de concentration :

Vocabulaire 7

Vous aimerez peut-être aussi