Vous êtes sur la page 1sur 17

5/24/2022

COLLECTE ET ANALYSE DES DONNÉES


QUANTITATIVES

Dr. Rosaine N. Yegbemey

CONTENU

• Objectifs, résultats attendus et mode d’évaluation


• Intro et quelques notions de base (rappel)
• Constitution de la base de données
• Données et collecte de données
• Echantillonnage (rappel)
• Hypothèses de recherche (rappel)
• Outils d’analyse de données
• Logiciels d’analyse quantitative des données et application 2

Objectifs, résultats attendus, et mode


d’évaluation

1
5/24/2022

Objectifs
• Permettre aux apprenants d’acquérir les outils nécessaires à
la collecte et l’analyse des données quantitatives y compris
leurs interprétations.

• Familiariser les apprenants avec les différents tests


d’analyse quantitative.

• Permettre aux apprenants de mieux s’organiser avant même


la collecte des données. 4

Mode d’évaluation

• Examen écrit dont la note constituera la moyenne de l’ECU

Intro quelques notions de base (rappel)

2
5/24/2022

Introduction à la collecte et l’analyse


quantitative de données

• Collecte de données:
• Processus dont l'objectif est d'acquérir ou de faciliter l'acquisition
des données ou information.
• Démarche organisée et systématique permettant d'acquérir ou de
faciliter l'acquisition des données.
• Etape qui précède l’analyse des données

• La collecte de données quantitatives met l’accent sur les données


quantitatives. 7

Introduction à la collecte et l’analyse


quantitative de données

• Analyse de données permet de:


• Présenter de manière claire et succincte les informations
(données) disponibles afin de faciliter:
• la compréhension et plus loin de susciter la réflexion,
• l’interprétation et la prise de décision.

• Utiliser des données brutes (collectées) à des fins de


représentation, d'analyse, ou d'interprétation. 8

Introduction à l’analyse quantitative de


données
Quelques activités préliminaires
• La collecte de données
• Le dépouillement et la codification des variables/données

• L’apurement (nettoyage) de la base de données


• Le traitement des données qui comprend la
• Transformation des variables
• Des changements dans la formulation des données
• Recodification
• Création de nouvelles variables
• Calcul de statistiques diverses et illustrations 9

• Tests divers :

3
5/24/2022

Introduction à la collecte et l’analyse


quantitative de données
• Les méthodes/approches quantitatives et qualitatives se différencies sur
plusieurs points :
• Objectif: quantifier et généraliser les résultats à partir de l’échantillon de
la population concernée VS comprendre, en termes de qualité, les raisons et
motivations sous-jacentes)
• Echantillon (grand VS petit)
• Collecte de données (structurée VS non structurée)
• Analyse de données (statistique VS non statistique)

• Chacune des méthodes/approches présente ses forces et faiblesses selon


le sujet de recherche: Possibilité d’utiliser des méthodes mixtes 10

Définitions diverses

• Données : Informations ou observations consistant généralement en la


mesure d’une ou plusieurs caractéristiques communes sur un ensemble de
personnes ou d’objets équivalents.

• Statistique : Ensemble de méthodes permettant de décrire et d’analyser


les données.

• Une statistique : Grandeur calculée à partir des données (observations)


recueillies (ex : moyenne d’âge des élèves d’une même classe, rendement
moyen des producteurs de maïs, etc.)

11

Définitions diverses
• Base de données : Collection de données organisées de façon à
être facilement accessibles, administrées et mises à jour.

• Population : Ensemble de personnes ou d’objets équivalents


étudié.

• Individu ou unité statistique : Chaque objet d’une population


s’appelle un individu ou unité statistique.

• Variables :
• Désigne un attribut que l’on peut donner à un objet/individu.
• Caractéristique que l’on mesure. 12

4
5/24/2022

Définitions diverses

• Collecte de données : Ensemble des méthodes


utilisées pour rassembler/compiler des données.

• Analyse de données :
• L’analyse des données est un processus qui permet de
transformer une multitude d’informations en information
structurée permettant la prise de décision.
• Elle consiste en effet à décrire, expliquer, contrôler et
prédire en se basant sur diverses informations. 13

Constitution de la base de données

14

Eléments constitutifs d’une base de


données
• Base de données primaires ou secondaires.
• Données primaires: Collectées sur le terrain par le
chercheur lui-même.
• Données secondaires: Recueillies pour d’autres raisons
et/ou par d’autres personnes.

• Principaux éléments d’une base de données:


• Variables et les valeurs
• Codebook
15

5
5/24/2022

Variables et les valeurs

• Variable: Caractère/question spécifique se rapportant au


l’individu/thème général d’une étude ou d’une recherche.

• Les valeurs correspondent aux réponses possibles

• Une variable peut être qualitative ou quantitative


• Variable qualitative: Prend des valeurs non numériques (par exemple, on
étudie sur 1.000 ménages le type d’habitation : terre battue, briques
(ciment), etc.).
• Variable quantitative: Prend des valeurs numériques (par exemple, on
étudie sur 1.000 ménages la taille de l’exploitation agricole : 1 ha, 0,5 ha,
etc.). 16

Variables qualitatives
• Peuvent être :
• Nominales: EX: sexe, couleur, spéculations, etc.
• Ordinales: L’ensemble des catégories est muni d’un
ordre total (très résistant, assez résistant, peu résistant,
etc.).

• Les différents niveaux d’une variable qualitative


s’appellent des modalités (ou catégories).
17

Variables qualitatives

• Variable qualitative = variable catégorielle

• Variable catégorielle qui a uniquement deux catégories est


dite dichotomique (ou binaire).

• Si les deux catégories sont (exemple: OUI et NON) codifiées « 1 »


et « 0 », la variable est généralement appelée dichotomique
muette.
18

6
5/24/2022

Variables quantitatives

• Les valeurs des variables quantitatives peuvent être avoir


des valeurs discrètes et continues.

• Discrètes ou « discontinues »: Ne peuvent prendre que des valeurs


entières (nombre d’enfants du ménage, nombre de houes, etc.).

• Continues : Peuvent prendre que des valeurs dans un intervalle fini


ou infini (taille de l’exploitation, rendement, etc.).
19

Variables quantitatives

• Les variables quantitatives peuvent être transformées en


classes
• Exemple: Classes d’âges : 20-29, 30-39, 40-49, 50-59, 60-79,
80+ ; classes de revenus ; etc.

20

Note
• Par le jeu de codification des variables, les variables
qualitatives peuvent être transformée en variables discrètes
(couleur : bleu = 1, jaune = 2, rouge = 3, etc.).

• En fonction de leur nature, toute variable qui ne peut être


qualifiée de quantitative est par défaut une variable
qualitative car peut être transformée en valeurs discrètes.
21

7
5/24/2022

Codebook (livret de codes)


• Documente les instructions permettant de désigner les
variables et les valeurs en « chiffres».

• En consignant les instructions dans un code book à disposition


de tous les membres d’une équipe de recherche, on s’assure
que:
• toutes les données seront entrées selon une procédure uniforme,
• les décisions ne seront pas « oubliées »,
• la base de données peut être utilisée par d’autres équipes de
recherche.
22

Exemple

SEXE AGE ETHNIE SUPCOT PROD


1 0 52 1 5.5 2500
2 1 25 2 2 6000
3 1 30 3 6 4500
. 1 65 3 1.5 1200
. 1 50 2 3 1000
n 1 45 2 4 3500

Base de données…..

SEXE : Sexe de l’enquêté


0 = Féminin
1= Masculin
AGE : Age de l’enquêté en nombre d’années
ETHNIE : ethnie de l’enquêté
1=Bariba
2= Peulh
3= Dendi
SUPCOT : Superficie de coton emblavée par l’enquêté pendant la campagne 2015-2016
23
PROD : Quantité de coton produite l’enquêté pendant la campagne 2015-2016

Démarche de constitution d’une base de


données primaires en sciences sociales

Les principales sont :

• Définition du thème, des objectifs et hypothèses de la recherche

• Elaboration d’outils de collecte de données (guides d’entretien


et questionnaire)

• Collecte de données 24

8
5/24/2022

Démarche de constitution d’une base de


données primaires en sciences sociales

• Dépouillement des questionnaires et codification des


données

• Confection du masque de saisie et saisie des données

• Validation de la saisie
25

Note sur les tablettes

• Permettent de gagner du temps pendant la collecte de données

• Permettent d’économiser le temps de saisie

• Plus fiables si bien utilisées.

26

Echantillonnage (rappel)

27

9
5/24/2022

Collecte de données

28

Collecte de données secondaires

• Se base sur un corpus de données existantes :


• typiquement des documents écrits:
• site web
• articles de journaux
• documents internes : mémos, archives administratives, etc.

• mais aussi :
• des bases de données existantes
• des documents audiovisuels
29

Collecte de données primaires

• En sciences sociales, la collecte s’organise généralement sous


forme d’enquêtes (ex : enquêtes de ménages).

• Il est recommandé de conduire la collecte de données en


deux étapes :
• L’exploration ou phase exploratoire
• L’enquête fine.

30

10
5/24/2022

L’exploration ou phase exploratoire

• Consiste à :

• Prendre connaissance du milieu d’étude


• Collecter certaines données vous permettant de parfaire
le questionnaire.
• Tester (pré-test) le questionnaire dans le but d’intégrer
les éventuelles omissions.

31

L’enquête fine ou phase de collecte de


données proprement dite

• Se fait sur la base du questionnaire corrigé.

• La méthode de sélection des enquêtés est un élément


méthodologique important à considérer pendant cette
phase.

32

Etapes clés d’une collecte de données


proprement dite

• Lancement de la collecte
• Suivi de la collecte et relances
• Contrôle de cohérence et corrections éventuelles
• Validation finale

33

11
5/24/2022

Quelques précautions/recommandations

Avant la collecte

• Définir clairement les unités d’observations


• Savoir s’introduire dans le milieu pour ne pas avoir des
résistances ou des données biaisées
• Si possible avoir un manuel de l’enquêteur
• Organiser des séances de formations des enquêteurs et
même des tests pour sélectionner les meilleurs

34

Quelques précautions/recommandations

Pendant la collecte

• Savoir motiver les enquêtés surtout si le questionnaire est long


• Prévoir des superviseurs de collecte de données
• Si questionnaires papiers, organiser la saisie en parallèle avec la
collecte
• Organiser des tests de logique sur les données au fur et a mesure
qu’elles sont saisies

35

Hypothèses de recherche

36

12
5/24/2022

Définition et caractéristique d’une


hypothèse

• L’un des objectifs principaux de l’analyse de données est de tester des


hypothèses.

• Hypothèse: Proposition à propos des rapports de causalité ou


corrélations entre les phénomènes à expliquer.

• Elle est une réponse provisoire à une question préalablement posée.

37

Définition et caractéristique d’une


hypothèse
Exemples
• Le revenu des paysans augmente avec le niveau d’instruction.
• Le rendement du producteur dépend de son sexe OU les producteurs
hommes ont des rendements moins élevés (ou inferieurs) que les producteurs
femmes.

• Une hypothèse bien formulée permet d’identifier les variables en jeu

38

Tester une hypothèse

• Différentes étapes doivent être suivies pour tester une hypothèse :


• Définir l’hypothèse nulle (notée H0) à contrôler et son alternative H1,
• Choisir un test statistique pour vérifier H0 (Voir section outils d’analyse de
données),
• Définir la distribution de la statistique sous l’hypothèse « H0 est réalisée »,
• Calculer, à partir des données fournies par l’échantillon, la valeur de la
statistique
• Définir le niveau de signification du test ou région critique notée α,
• Prendre une décision concernant l’hypothèse posée et faire une
interprétation. 39

13
5/24/2022

Tester une hypothèse


• L’hypothèse nulle notée H0 est l’hypothèse que l’on désire contrôler :

• Elle consiste à dire qu’il n’existe pas de différence entre les paramètres
comparés ou que la différence observée n’est pas significative et est due
aux fluctuations d’échantillonnage.

• L’hypothèse alternative notée H1 est la négation de H0, elle est équivalente


à dire « H0 est fausse ». La décision de rejeter H0 signifie que H1 est
réalisée ou H1 est vraie.

• Le test d’une hypothèse se fait donc sur la base d’une Hypothèse nulle (H0)
et hypothèse alternative (H1). 40

Tester une hypothèse

• Avec les logiciels statistiques, la décision d’acceptation ou de rejet se fait


sur la base de la valeur de la probabilité de signification (p) et du seuil
de décision (α). Trois valeurs de α sont généralement utilisées en sciences
sociales :

• 1% (p < 0,01)
• 5% (p < 0,05)
• 10% (p < 0,10)

41

Tester une hypothèse

• Plus la valeur de α petite, plus rigoureux/fiable est le test. Quel que soit
la valeur de α retenue, la décision d’acceptation ou de rejet se prend
comme suit :

• Si p < α, on rejette H0 (et donc accepte H1) au seuil de α.


• Si p > α, on rejette H1 (et donc accepte H0) au seuil de α.

42

14
5/24/2022

Outils d’analyse de données

43

Etapes de l’analyse de données


• L’analyse se déroule généralement en deux étapes :

• La première étape consiste à donner une description résumée de la


distribution de chacune des variables principales. Par exemple, à la suite
d’une enquête sur un échantillon représentatif, on donne une estimation de
la proportion de producteurs de maïs ou une estimation de la consommation
moyenne de la spéculation par semaine dans la population.

• La deuxième étape consiste à comparer la distribution observée d’une


variable dans un échantillon par rapport à sa distribution attendue dans la
population ou à comparer la distribution observée dans plusieurs groupes.
Les comparaisons peuvent se faire aussi entre plusieurs variables pour
apprécier les liens d’indépendance, de corrélation ou de causalité.
44

Analyse univariée
• L’objectif de cette première application pratique est d’explorer les quelques
variables qui ont été sélectionnées, afin, si nécessaire, de les transformer ou
de les corriger.

• L’analyse univariée permet aussi de préparer les données qui seront utilisées
ultérieurement dans les analyses bi- et multivariées. Les principaux outils
d’analyse univariée sont :
• La fréquence
• La moyenne
• L’écart-type
• Le minimum
• Le maximum
• Le mode
• La médiane 45

15
5/24/2022

Analyse bivariée

• Comme l’indique son non, ce type d’analyse s’utilise lorsqu’on est en


présence de deux variables.

• Il existe plusieurs types de tests bivariés selon la nature des deux


variables en jeu.

46

Notes importantes
• Les tests statistiques sont regroupés en deux catégories :

• les tests paramétriques


• les tests non-paramétriques.

47

Récapitulatif

48

16
5/24/2022

Logiciels d’analyse quantitative des


données et application

49

Logiciels
• EXCEL
• SPSS
• MINTAB
• STATA
• R
• SAS
• SPHINX
• GRETL
• XLSTAT
• ETC.
50

17

Vous aimerez peut-être aussi