Vous êtes sur la page 1sur 107

2ème année Ingénieur:

Sciences de la Production Végétale


&
Phytiatrie

Séquence 1:
02 Septembre 2019 – 21 Octobre 2019

20 Heures de cours
10 Heures de TD
Dr. Karmous Chahine
karmouschahine@yahoo.fr 2019-2020
Plan
• Chapitre 1: Introduction & Définitions
• Chapitre 2: Rappels
• Chapitre 3: Dispositif Complètement Aléatoire (Modèle statistique
DCA, ANOVA)
• Chapitre 4: Les contrastes orthogonaux (Construction des
contrastes)
• Chapitre 5: Dispositif Bloc Complètement Aléatoire (Modèle
statistique DBCA, ANOVA)
• Chapitre 6: Le Carré Latin (Modèle statistique, ANOVA)
• Chapitre 7: Analyse Factorielle
• Chapitre 8: Split-Plot (Modèle statistique, ANOVA)
Chapitre 1

Introduction
Introduction:
• Diversité et complexité sont deux réalités du monde
vivant.

• La statistique, en tant que science de la collecte et de


l'interprétation des données, permet d'appréhender
cette diversité et/ou cette complexité.

• Historiquement, les initiateurs de la méthode statistique


en biologie sont des agronomes anglais (K. Pearson,
R.A. Fisher) du début du XXème siècle.

• De l'agronomie, la statistique est passée à la biologie


puis à la psychologie, la médecine etc...
Introduction:
• Statistique : Science qui permet de traiter les
problèmes où intervient la variabilité: « Science de
l’incertain »

Collecter, organiser, traiter et interpréter les données

Biostatistique = Biométrie : Science qui permet


de traiter les problèmes où intervient la
variabilité….dans le domaine du vivant.
Introduction:
Types de statistiques
1. Statistiques descriptives:
utilisées pour construire des tables, des graphiques et des
résumés numériques des données (paramètres de position et
de dispersion).

2. Statistiques inférentielles:
méthodes permettant de généraliser, à l’échelle de la population,
des conclusions (inférences) tirées à partir des données d’un
échantillon.

3. Statistiques prédictives:
Les analyses prédictives peuvent être employées pour prédire
des données numérique ou des données de type catégoriel
(régression ou de classification): modélisation
Introduction:
La démarche scientifique
La démarche scientifique:
applicable pour toutes les
sciences exactes

But des statistiques

Permet de confirmer ou
d’infirmer une hypothèse avec
une marge d’erreur la plus
petite possible et/ou prédire un
événements à l’aide d’outils (les
modèles statistiques)
Introduction:

Ce que les statistiques peuvent et ne peuvent faire

Peuvent: Ne peuvent pas:

• Fournir des critères • dire la vérité


objectifs pour tester des
• compenser pour une
hypothèses.
mauvaise planification
• Aider à optimiser les
• indiquer l’importance
efforts
biologique: la signification
• Aider à l’évaluation statistique ne veut pas dire
critique des arguments la signification biologique
Introduction:
Définitions
• Population: ‫اإلحصاء‬
Ensemble des éléments qui forment le champ d’analyse
d’une étude particulière (personnes, individus, matériels,
actions, situations). Taille notée : N

• Exemples : Ensemble de toutes les voitures


immatriculées en 2018; L’ensemble des cultures dans
le sub-humide VS Semi-aride; l’ensemble de poisson
d’une espèce donnée pêchées dans une région de la
Tunisie
Introduction:
Définitions
• Recensement: ‫التعداد‬
Etude de tous les individus composant une population finie
(pas toujours facile).
Introduction:
Définitions
• Individu: ‫فرد‬
Elément composant la population. C’est l’unité sur
laquelle porte l’observation;
Exemples : Un sol prélevé à Bizerte et un sol à Mateur,
une voiture immatriculée en 2018
Introduction:
Définitions
• Caractère= variable: ‫متغير =الطابع‬
Une caractéristique d’intérêt (et variable) de types,
quantitatives ou qualitatives (Q.S.); Caractéristique propre
à chacun des individus. C’est ce qu’on observe
Exemples : Teneur en Cd de ce sol, sa densité
apparente..., couleur de la voiture, puissance
Introduction:
Définitions

• Paramètre: c’est une valeur numérique qui


caractérise la population comme la moyenne
arithmétique (µ), la variance (δ2), le mode (m)
etc…
Introduction:
Définitions
• Echantillon (sample) : ‫عينة‬
Sous-groupe d’une population
donnée. Taille notée : n

Exemples : 20 sols viticoles


prélevés autour de Morneg; 20
voitures passant devant
l’Institut.

• Echantillon représentatif: un sous


ensemble de la population où
chaque élément a les mêmes
chances que tout autre élément
d’étre inclus dans l’échantillon.
Introduction:
Définitions

• Unité statistique : ‫الوحدة اإلحصائية‬


Membre d'une population. Individu, ou autre (famille,
dosage, etc.)
Introduction:
Définitions
• Les raisons de
l'échantillonnage:
Parmi les raisons justifiant un
échantillonnage plutôt que de
travailler sur la globalité de la
population:

1. Les ressources sont


illimitées...
Il est impossible de pêcher
TOUTES les morues de
l'Atlantique pour en estimer le
poids moyen...
Introduction:
Définitions
2. Les données
disponibles sont limitées...
La reproduction des grands
pandas ne peut être étudiée
qu'en captivité c'est-à-dire sur un
nombre restreint d'individus.

3. L'expérimentation est
destructive...
Impossible de sacrifier la population
de grenadier à l’ISA Chott Meriem
pour étudier le développement
racinaire.
Introduction:
Définitions

4. Manque de temps et de
moyens
Même dans le cas où la population est
limitée, on n'a pas le temps ni les
moyens d'effectuer toutes les mesures:
par exemple, demander l'avis des
consommateurs à propos d'un
nouveau produit prendrait trop de
temps et nécessiterait des moyens
financiers trop importants.
Introduction:
Définitions
• Évènement aléatoire: ‫حدث‬
‫عشوائي‬
Tout événement qui peut ou non se
réaliser au cours d’une
expérience/observation
Exemples : pile ou face d’une
pièce de monnaie lancée;
survenue d’un cancer du
poumon chez un fumeur
Introduction:
Définitions
• Probabilité: ‫احتمال‬
Quantification de la "chance de réalisation" de l'événement
aléatoire cad valeur limite de la fréquence avec laquelle
l’événement se réalise au cours d’un nombre croissant
d’expériences (observations)

nombre de cas favorables


Lim
nombre de cas possibles
- Nombre fictif (limite…)
- Nombre compris entre 0 et 1
- Chiffre la « chance » de survenue de l’événement lors de toute expérience à
venir
Introduction:
Définitions
• Exemple :
La probabilité de tirer un as dans un jeu de 52 cartes est
le quotient de 4 (nombre de cas favorables) par 52
(nombres des cas possibles), soit environ 8%. Que je
tire une carte rouge a une probabilité de 26/52 soit 50
%, c’est encore incertain, mais c’est plus probable.
Introduction:
Les types de variables
Le choix de la méthode statistique se fait suivant la nature
de la variable.
Introduction:
Les types de variables

Observables VARIABLES Mesurables

Ordinales Discrètes Continues


Nominales
-N. d’enfants
- Sexe -Taille
-Situation -N. de
-Couleur -Poids
socioprof bactéries
-Ville d’origine -Taux de
-Niveau d’étude -N. d’assurés
-Type de glucose
-Appréciation -N. de salariés
Culture -Durée de vie
-…etc. -N. de patients
-…etc. -.
-…etc.
Introduction:
Expression de la variabilité
Variabilité = Mesure + Incertitude

Variabilité biologique: Erreur de mesure:


inhérente à la donnée, ne peut résulte de la précision des
pas être réduite en augmentant appareillages et de l’effort
l’effort de mesure (inter-individuel d’échantillonnage.
et intra-individuel). Exemple: la précision d’une
Exemple: la variation du nombre de balance,...
loges des capsules de
coquelicot
Introduction:
Expression de la variabilité
• La variabilité peut être réduite par des procédés
expérimentaux, mais non supprimée.
Introduction:
Expression de la variabilité

•l’habitude est de choisir le


risque de 5%. Pourquoi ?
– il est petit
– il conduit dans le calcul à
une formule simple
– c’est un chiffre rond
– on a longtemps exprimé
l’erreur en terme de paris,
et admettre le risque 5 %
revient à parier 20 contre 1.
Chapitre 2

Rappel:
Les paramètres
Statistiques
Descriptives &
Méthodes graphiques
1. Les paramètres statistiques
1. Les paramètres statistiques
1. Classement des données
• La classification des données xi est obtenue en créant
artificiellement des classes (ou catégories) d'individus.
• Le nombre de classes dépend du nombre d'individus

Exemple 1: tri des poissons en fonction de leur poids dans


plusieurs classes
Les paramètres statistiques
1. Classement des données
La représentation graphique ou distribution des données sera
différente en fonction du dénombrement des poissons
effectué par classe.
L'axe des ordonnées peut être:
1. Fréquence: nombre d'individus appartenant à une classe.
Il est généralement noté ni. La somme des fréquences de
toutes les classes est la taille de l'échantillon N.
1. Les paramètres statistiques
1. Classement des données
1. Les paramètres statistiques
1. Classement des données
2. Fréquence cumulée: somme des fréquences de la classe étudiée et
des fréquences des classes qui lui sont inférieures. La fréquence
cumulée de la dernière classe vaut N (c'est-à-dire la somme des ni).

3. La fréquence relative: rapport entre la fréquence de la classe étudiée


et la taille de l'échantillon. Nous étudions dans ce cas l'importance de la
classe par rapport à la globalité de l'échantillon (exemple: 20% des
individus de l'échantillon présenté dans la figure ci-dessus ont une
envergure comprise entre 380 et 400 mm). La somme de toutes les
fréquences relatives est égale à 1. Elle est notée et souvent exprimée
en %.
1. Les paramètres statistiques
1. Classement des données
1. Les paramètres statistiques
1. Classement des données
4. La fréquence relative cumulée: somme des fréquences relatives de
la classe étudiée et des classes qui lui sont inférieures. La fréquence
relative cumulée de la dernière classe vaut 1 (ou 100%).

5. La densité de fréquences relatives : souvent employée pour que la


surface de chaque rectangle de l'histogramme corresponde à la
fréquence relative de la classe:

Surface d'un rectangle = hauteur x base = ou encore, après


simplification des Li, la fréquence relative: .
1. Les paramètres statistiques
1. Classement des données
1. Les paramètres statistiques
2. Moyenne Arithmétique

Population N Echantillon x
(average)
(mean)

– Paramètre central qui concerne uniquement des


variables quantitatives.
– Calculable quelque soit la loi qui régit la distribution.

Somme des valeurs (T) divisée par le nombre de


mesures (n).
1. Les paramètres statistiques
2. Moyenne Arithmétique
• Propriétés :
– Centre de gravité de la distribution.
– La moyenne contrairement à la médiane est très
sensible aux valeurs extrêmes.
– La moyenne d'un groupe résultant de la fusion
d'autres groupes n'est égale à la moyenne des
moyennes que si tous les groupes ont le même
effectif.
– La moyenne de l'échantillon est le meilleur estimateur
de la moyenne de la population.
1. Les paramètres statistiques
2. Moyenne Arithmétique
Exemple:, la moyenne de la taille de 9 poissons, qui vaut ici
65 cm :
1. Les paramètres statistiques
2. Moyenne Arithmétique

Exemple 1:
• Soit la série correspondant aux tailles en cm de 6
étudiants : 160,170,180,180, 190, 200.

n = 6 ; T = 160+170+180+180+190+200 = 1080

1080
x= = 180 cm
6
1. Les paramètres statistiques
2. Moyenne Arithmétique
Exemple 2:
• Le nombre de familles
nombre nombre de enquêtées est de 53.
d'enfants familles (ni)
• Le nombre total d’enfants est
(xi) ni*xi
de 77.
0 10 0
1 20 • La moyenne du nombre
20
d’enfants par famille est de
2 15 30 77/53 = 1,45.
3 5 15
• Attention aux arrondis ici si on
4 3 12 arrondit à une décimale la
Total 53 77 moyenne est de 1,5 enfants par
famille.
1. Les paramètres statistiques
2. Moyenne Arithmétique
Exemple 3:
Les étudiants de première année Ingénieurs sont répartis

dans 3 amphithéâtres avec les données ci-dessous. Quelle

est la moyenne de l’âge?

Moyenne de l'âge
Effectifs en années
Amphi 1 1000 18,1
Amphi 2 500 19,5
Amphi 3 1000 18,3
1. Les paramètres statistiques
2. Moyenne Arithmétique
Exemple 3:
Les effectifs étant différents dans les 3 groupes, la moyenne
recherchée n’est pas la moyenne des moyennes.

• On calcule le total de l’âge des 3 groupes réunis : T =


18,1*1000+ 500*19,5+ 18,3*1000 =46 150.
• L’effectif total est de 2 500.
• La moyenne recherchée est 46150/2500 =18,5 ans
1. Les paramètres statistiques
Les autres Moyennes

• Moyenne géométrique d'une série de valeurs positives


est la racine nième du produit des n valeurs. Elle est
toujours inférieure ou égale à la moyenne arithmétique.

• Moyenne harmonique d'une série de valeurs positives


est égale à l'inverse de la moyenne des inverses.

• Moyenne quadratique est la racine carré de la moyenne


arithmétique des carrés.
1. Les paramètres statistiques
3. La médiane

• La médiane notée x (tilde) est telle que la moitié des
observations lui sont inférieure (ou égale) et la moitié
supérieure (ou égale) : xi tel que Fi = 0,5.
– Sur les distributions symétriques unimodales en cloche (normales
par exemple) la médiane est égale à la moyenne et au mode.

– Paramètre peu sensible aux valeurs extrêmes.


1. Les paramètres statistiques
3. La médiane
Exercice:
II. Les paramètres statistiques
3. La médiane
• Sur une distribution non groupée :

– Si n impair, la médiane est l'observation de rang (N+1)/2

– Si n est pair, tout nombre entre xN/2 et xN/2+1


convient. On prend la moyenne entre ces deux valeurs.
1. Les paramètres statistiques
3. La médiane
• Sur une distribution groupée, la classe médiane est celle qui
contient la médiane.
- Détermination graphique.
- En admettant que les observations soient réparties uniformément
dans cette classe, on réalise une approximation linéaire.
1. Les paramètres statistiques
3. La médiane
Exemple 1:

Classe ni Ni Fi
[140-160[ 10 10 0,05
[160-165[ 20 30 0,15
[165-170[ 30 60 0,30 La classe qui contient la
[170-175[ 45 105 0,53 médiane est [170-175[.
[175-180[ 40 145 0,73
[180-185[ 35 180 0,90
[185-190[ 15 195 0,98
[190-200[ 5 200 1,00
Total 200
1. Les paramètres statistiques
4. Mode
• Mode encore appelé valeur dominante :
• Correspond à la valeur la plus fréquente. xi
correspondant au ni (ou fi) maximum.
• Il peut y avoir un ou plusieurs modes.

Rappel :
Dans les distributions en cloche,
unimodales symétriques, mode,
médiane et moyenne sont
confondus.
1. Les paramètres statistiques
4. Mode
Exemple :
{ 1, 2, 2, 3, 4, 7, 9 }

Type Description Exemple Résultat


Moyenne Somme des valeurs / nombre (1+2+2+3+4+7+9) / 4
arithmétique d’observation 7
Médiane Valeur qui divise en moitié les 1, 2, 2, 3, 4, 7, 9 3
max et min des données
Mode Valeur la plus fréquente dans les 1, 2, 2, 3, 4, 7, 9 2
données
1. Les paramètres statistiques
5. Amplitude ou étendue

• Ecart entre la valeur de l'observation maximale et


celle de l'observation minimale.

Amplitude = valeur maximale - valeur minimale


1. Les paramètres statistiques
5. Amplitude ou étendue
Exemple 1:
Valeur maximum x = 174 mm
Valeur minimum x = 140 mm
Etendue de la variation = 174 - 140 = 34 mm

Remarque: On montre que l'écart type est toujours


inférieur ou égal à la moitié de l'amplitude.
1. Les paramètres statistiques
5. Amplitude ou étendue
Exemple 2: Nombre d’enfants par femme
Nombre d’enfants Effectifs Amplitudes ai
[0 – 2 [ 4 2
[2 – 4 [ 10 2
[4 – 6 [ 6 2

Les classes sont d’amplitudes égales


1. Les paramètres statistiques
6. Variance
• La variance est le reflet numérique de la dispersion des valeurs
autour de la moyenne. Elle est obtenue à partir des écarts des
valeurs par rapport à la moyenne.

• La variance d'une série ou d'une distribution de fréquences est la


moyenne arithmétique des carrés des écarts à la moyenne
n

 i
(x − x) 2

S2 = i =1
n
• C'est par rapport à la moyenne que la somme des carrés des écarts
est la plus faible.
1. Les paramètres statistiques
6. Variance
Ecarts à la moyenne :

• La variance de l'échantillon est


souvent notée S2.
• L’estimation de la variance est
notée s^2.
• Pour chaque valeur on calcule
l'écart qui le sépare de sa
moyenne arithmétique :
La somme de ces écarts est nulle. Elle
ne peut donc être utilisée comme un
estimateur mathématique de la
dispersion des valeurs.
1. Les paramètres statistiques
6. Variance
Carrés des Ecarts à la moyenne : Si on additionne tous ces carrés d'écarts :

La somme des carrés des écarts (SCE)


sera d'autant plus grande que les valeurs
seront éloignées de la moyenne.
1. Les paramètres statistiques
6. Variance
Carré moyen ou variance :

A partir des données numériques d'un


échantillon, il est aussi possible d'estimer
la variance de la population d'où
provient cet échantillon. Dans ce cas, la
somme des carrés des écarts est divisée
par n-1 et non par n. Quand le nombre
d'observations est élevé, la division par n-
1 ou par n n'a plus beaucoup
d'importance.
1. Les paramètres statistiques
6. Variance
Propriétés:
• La variance est toujours > ou = à 0,
• La variance est égale à 0 si toutes les valeurs sont
identiques,

• En ajoutant une constante aux données, la variance ne


change pas,

• En multipliant par une constante, on modifie la variance par


un facteur multiplicatif égal au carré de la constante d ’origine
Si Y= aX+b, s2(Y)= a2 × s2(X) et s(Y)= a × s(X)
1. Les paramètres statistiques
7. Ecart Type

• l'écart-type, ou racine carrée de la variance.


• L'écart-type représente l'écart quadratique moyen des
valeurs par rapport à la moyenne.
• Selon que l'on veut simplement décrire l'ensemble des
données ou estimer l'écart-type de la population d'origine,
on utilisera la racine carrée de la variance SCE/n ou
SCE/(n-1)
1. Les paramètres statistiques
Intervalle de confiance
• un intervalle de confiance encadre une valeur réelle que
l’on cherche à estimer.
• Il permet de définir une marge d'erreur entre les
résultats d'un sondage et un relevé exhaustif de la
population totale.
• Un intervalle de confiance doit être associé à un niveau, en
général sous la forme d’un pourcentage,
• L'usage le plus simple des intervalles de confiance
concerne les populations à distribution normale (en forme
de cloche) dont on cherche à estimer la moyenne X.
1. Les paramètres statistiques
Intervalle de confiance = plage de normalité
• Lorsque le caractère statistique a une
distribution normale gaussienne (en forme de cloche):
l'écart type prend son sens.

• L’écart-type sert à mesurer la


dispersion d’une série
statistique autour de sa
moyenne.
• La règle 68-95-99,7 (ou règle
des trois sigmas ou règle
empirique)
1. Les paramètres statistiques
Intervalle de confiance

Lorsqu'une distribution est gaussienne (on


dit aussi "normale") les probabilités de
trouver les valeurs a une distance donnée
de la moyenne sont les suivantes :
• 68.3 % des valeurs sont comprises entre
(x-σx) et (x+σx)
• 95.5 % des valeurs sont comprise entre
(x-2σx) et (x+2σx)
• 99.7 % des valeurs sont comprises entre
(x-3σx) et (x+3σx)
1. Les paramètres statistiques
Remarques: Variance et écart type
1. Les paramètres statistiques
Variance et écart type
Exercice :
1. Les paramètres statistiques
Variance et écart type
1. Les paramètres statistiques
8. Coefficient de variation (CV)
• CV appelé aussi l'écart type relatif est le rapport écart type
divisé par la moyenne.
100sx
C.V . =
x
• Le CV permet de comparer la variabilité de distributions de
variables qui ne sont pas dans les mêmes unités.

• Le CV est l’expression de l’erreur en pourcentage. Plus le


CV est faible, meilleur est la précision de l’essai et moins il y a
d’erreur. Il permet de valider la représentativité d’un résultat (ou
de la moyenne).
1. Les paramètres statistiques
8. Coefficient de variation (CV)
• Si par exemple une distribution a une moyenne de 0,1 et
un écart-type de 1, elle sera beaucoup plus dispersée (CV de
1000%) qu'une distribution de moyenne 1000 et d'écart-
type 10 (CV de 1%).
• Pour comparer deux séries de données d'unités
différentes, l'utilisation du coefficient de variation est
plus judicieuse.
1. Les paramètres statistiques
8. Coefficient de variation (CV)
• Entre 0 et 14,99%: la moyenne est représentative de la distribution,
l’erreur est faible, l’essai est acceptable ce qui permet l’analyse de la
signification globale de l’essai par l’utilisation du test de Fisher (test F)
• Entre 15% et 29,99%: la moyenne est moyennement représentative
de la distribution, l’erreur est plus importante et les résultats sont à
utiliser avec prudence ;
• Supérieur à 30%: la moyenne n’est pas représentative de la
distribution, l’erreur est importante, l’essai est remis en cause et il vaut
mieux refaire l’expérience

Pour les grandes cultures, notamment les blés, le seuil de 12 % de


CV est OK pour valider un essai.
1. Les paramètres statistiques
8. Coefficient de variation (CV)
Exemple 1:
On désire comparer les distributions (groupées) des bénéfices nets
hebdomadaires de 2 magasins, sur 100 semaines comprenant toutes 6
jours d'ouverture.
1. Les paramètres statistiques
8. Coefficient de variation (CV)
Dans ces conditions ou l’écart type n’est pas très
différents entre deux populations, on peut penser recourir
à la mesure de dispersion relative qu'est le coefficient de
variation.

Ces 2 coefficients de variation montrent mieux l'influence


réelle d'un gain ou d'une perte équivalent(e) à l'écart-type
pour chacun des magasins.
1. Les paramètres statistiques
9. Mesure de la dispersion
Deux distributions de fréquence peuvent avoir la même
moyenne, la même médiane et le même mode et présenter
des formes très différentes:

81
1. Les paramètres statistiques
9. Mesure de la dispersion
Paramètres d'aplatissement et de symétrie
1. Les paramètres statistiques
9. Mesure de la dispersion
Paramètres d'aplatissement et de symétrie
2. Tableaux statistiques
Les tableaux statistiques à un caractère:
I. Les tableaux des caractères qualitatifs
a. Cas de caractère à modalités nominales
b. Cas de caractère à modalités ordinales
II. Les tableaux des caractères quantitatifs
a. Cas de caractère quantitatif discret
b. Cas de caractère quantitatif continue
2. Tableaux statistiques
Les tableaux statistiques à deux caractères:
I. Présentation générale des tableaux de
contingence,
II. Propriétés structurelles des tableaux de
contingence,
III. Les différentes distributions statistiques,
IV. Les relations entre les caractères.
III. Tableaux statistiques
1. Tableaux à UN CARACTÈRE qualitatif
Exemple 1 : Enquête d’opinion réalisée auprès de 9
étudiants de premières années d’Horticulture, PA, GSH
• Données recueillies : Nom, Prénom, Age, Nature du
bac, opinion sur l’architecture de l’ISA Chott Meriem
• Matrice des données:= {{"Alaoui", "Fatma", 18, « M", "Très
bonne"}, {"Otmani", "Samira", 19, "S", "Bonne"},……

• Présentation des données dans un tableau:


Nom Prénom Age BAC Opinion
Alaoui Fatma 18 M Très
bonne
Otmani Samira 19 S Bonne
III. Tableaux statistiques
1. Tableaux à UN CARACTÈRE qualitatif
1.1. Modalités nominales
Exemple 1 : Répartition des salariés de l’entreprise
III. Tableaux statistiques
1. Tableaux à UN CARACTÈRE qualitatif
1.2. Modalités ordinales
Exemple : enquête auprès de 9 étudiants de sciences
agronomiques sur leur opinion concernant l’architecture de
III. Tableaux statistiques
2. Tableaux à UN CARACTÈRE quantitatif
2.1. Quantitatif discret
Exemple: Nombre d’enfants (xi) observés dans un
échantillon de 55 familles
III. Tableaux statistiques
2. Tableaux à UN CARACTÈRE quantitatif
2.1. Quantitatif discret
III. Tableaux statistiques
2. Tableaux à UN CARACTÈRE quantitatif
2.2. Quantitatifs Continus
Exemple: Répartition des salaires mensuels d’une
entreprise
III. Tableaux statistiques
2. Tableaux à DEUX CARACTÈRES
• Les tableaux statistiques correspondant à deux
dimensions sont des tableaux de contingence ou
croisés dynamiques ou à double entrées

Exemple 1 : répartition
des salariés d’une
entreprise X selon le sexe
(xi) et le
niveau de formation (yj)
III. Tableaux statistiques
2. Tableaux à DEUX CARACTÈRES
Exemple 2: répartition des salariés d’une entreprise M
selon le sexe (xi) et le niveau de formation (yj)
IV. Méthodes graphiques :
• Les graphiques représentent les distributions.
• Le choix des représentations graphiques dépend de la
nature du caractère statistique étudié;
• Les variables qualitatives peuvent être représentées
graphiquement de différentes manières
• Diagrammes en bâtons,
• Diagrammes en barres (ou en tuyaux d’orgue),
• Diagrammes circulaires (ou en camembert ou en
secteurs (Diagramme sectoriel))
IV. Méthodes graphiques :
1. Données quantitatives discrètes
– Diagramme en bâtons
▪ On trace parallèlement à l'axe des ordonnées, en regard
des xi qui sont portés en abscisse, un segment de
longueur proportionnel à ni

– Polygone des fréquences


▪ Ligne brisée joignant les bâtons.

▪ Fréquences absolues / fréquences relatives.


IV. Méthodes graphiques :
Données qualitatives
Diagrammes en bâtons
Exemple : Répartition des salariés de l’entreprise selon la
CSP
IV. Méthodes graphiques :
Données qualitatives
Diagrammes en bâtons
Exemple : Répartition des salariés de l’entreprise selon la
CSP
IV. Méthodes graphiques :
Variables quantitatives discrètes discontinues

Diagrammes en bâtons (bar Chart)

Variables qualitatives sur une échelle nominale ou ordinale.

fi ni

f i =1 n
i =n
f3 n3
f2 n2

f1 n1

x1 x2 x3 xm x1 x2 x3 xm
99
IV. Méthodes graphiques :
Données qualitatives
Diagrammes en barres (Histogramme)
IV. Méthodes graphiques :
Données qualitatives
Diagramme sectoriel Répartition des groupes
sanguins

A
16
35 B
Groupes sanguins ni fi O
A 35 35% 40 9 AB
B 9 9%
O 40 40%
AB 16 16% AB
100 100% A

O
B
IV. Méthodes graphiques :
Données qualitatives
Diagramme sectoriel VS Histogramme
1400 Nombre de périodes de chômage en une année

1250 ouvriers sondés


1200

1000

800

600
Modalités
contigües Col 2: 1150
Col 2: 50
400 Col 2: 30
Col 2: 20

200
X=1 X=2 X=3 X=4
0
-1 0 1 2 3 4

Nombre de périodes de chômage en une année


Possible mais peu révélateur
car une modalité domine
102
IV. Méthodes graphiques :
Données quantitatives
Distributions cumulées
• Polygone des fréquences :
• Distributions non groupées = escalier.
• Distributions groupées = ligne brisée.

• Histogrammes.
IV. Méthodes graphiques :
Variables quantitatives discrètes

• Modalités discontinues mais suivant un ordre naturel.

• Même règles que pour des variables qualitatives d’échelle


ordinale.

• Tableau statistique, diagramme en bâtons, diagramme


circulaire.

• Dans le diagramme à bâtons, modalités successives


contiguës.

104
IV. Méthodes graphiques :
Variables quantitatives discrètes discontinues
IV. Méthodes graphiques :
Variables quantitatives discrètes discontinues
REMARQUES:
35

•Aucun ordre n’est supposé 30

25
• Souvent les modalités

% frequency
20
ordonnées dans le sens des
fréquences croissantes ou 15

par ordre alphabétique 10

• Sur une échelle ordinale 5

les données sont rangées 0


Accounting Marketing Economics General Other
suivant leur ordre naturel. Management

106
IV. Méthodes graphiques :
Variables quantitatives discrètes discontinues

Polygone des fréquences


25
nombre nombre de
d'enfants familles (ni)
(xi) 20

0 10
1 20 15
2 15
3 5
4 3 10

>4 0
5

0
0 1 2 3 4 >4
IV. Méthodes graphiques :
Variables quantitatives discrètes discontinues

Exemple : Histogramme
90
Densité
Classe ni (*10) 80

[140-160[ 10 5 70

[160-165[ 20 40 60
[165-170[ 30 60 50
[170-175[ 45 90 40
[175-180[ 40 80 30
[180-185[ 35 70 20
[185-190[ 15 30 10
[190-200[ 5 5 0
140 160 170 180 190 200
IV. Méthodes graphiques :
Variables quantitatives discrètes discontinues
Aspects de la distribution 60

• Distribution non cumulée : 50

– en forme de : Cloche, J, 40
U;
– À une seule bosse, à 30

plusieurs bosses ;
20
– …….
• Symétrie – Aplatissement. 10

0
1 2 3 4 5 6 7 8 9 10
IV. Méthodes graphiques :
Variables quantitatives discrètes
Courbes des fréquences cumulées. Il s’agit de courbes en escalier,
c’est-à-dire constantes sur chaque intervalle défini par deux modalités
i
Sur xi , xi +1 la fonction v aut Fi =  f j%
successives, %
j =1

110
IV. Méthodes graphiques :
Variables quantitatives discrètes
La courbe cumulative des fréquences (effectifs)
IV. Méthodes graphiques :
Variables quantitatives
Histogrammes contiguës
A ne pas confondre avec le diagramme baton!
• Tracé aux limites,
9
• Convient aux données quantitatives seulement.
8

7 Contigües
6 car continuité
frequency

0
0.5 2 3.5 5 6.5 8 9.5 11 12.5 14 15.5 17 18.5 2O 21.5
call duration in minutes
Poids des fragments de poteries trouvés sur un site néolithique (g) 112
IV. Méthodes graphiques :
Variables quantitatives
Polygones de fréquences cumulées
35 Tracé aux limites supérieures
Convient aux données quantitatives seulement
30

25
cumulative frequency

20

15

10

0
2 5 8 11 14 17 20
call durtion in minutes 113
Poids des fragments de poteries trouvés sur un site néolithique (g)
IV. Méthodes graphiques :
Caractères à deux dimensions: Qualitatif
IV. Méthodes graphiques :
Caractères à deux dimensions: Quantitatif
Remarque: Barre à moustache - Box
Plot
• Une "boîte à moustaches" (Box and Whiskers Plot", ou en
abrégé "Box Plot") est une représentation graphique de
quelques paramètres de distribution d'une variable.
• C’est une représentation graphique d’une variable
quantitative qui permet d’appréhender (résumer une
distribution empirique) la dispersion d’un échantillon.
Remarque: Barre à moustache - Box
Plot

Vous aimerez peut-être aussi