Vous êtes sur la page 1sur 18

Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie

2iér année ST Département : Sciences et Technologie


Module : probabilités et statistique :

Chapitre 1 : vocabulaires de base

1- Statistiques descriptives.

L’objectif de la Statistique Descriptive est de décrire de façon synthétique et parlante des


données observées pour mieux les analyser. On ne fait pas de comparaisons et on s'intéresse en
général à un seul groupe, échantillon ou population. Exemple : Lorsqu'on calcule la fréquence
des mots dans un texte, on fait de la statistique descriptive.
2- Population

Un ensemble d’éléments homogènes auxquels on s’intéresse. Par exemple, les étudiants d’une
classe, les contribuables de longue, les ménages lillois . . .,
Les éléments de la population sont appelés les individus ou unités statistiques.
3- Echantillon

Lorsque la population est trop importante, on étudie un échantillon, c'est-à-dire un sous-


ensemble, beaucoup plus petit, de la population. L'échantillon doit être bien choisi pour pouvoir
représenter la population.
4- Variables ou caractères statistiques

Un individu donné de la population peut être étudié selon certaines propriétés. Ces propriétés
sont appelées caractères ou variables statistiques. Exemple : une étude sur les étudiants de
l'université d’Adrar peut porter sur les différentes variables : leur âge, leur sexe, leur nationalité,
leur moyenne de l'année, etc.
On distingue deux types de variables statistique.
4. a- Une variable qualitative est une variable qui ne prend pas de valeur numérique.
Exemple : sexe, nationalité. Chaque variable qualitative a plusieurs modalités.
Exemple
Pour la variable état matrimonial, les modalités sont célibataire, marié, veuf, divorcé.
On distingue deux types de variables qualitatives : les variables qualitatives ordinales et les
variables qualitatives nominales.
4. a.1- une variable qualitative ordinale, lorsque ses modalités peuvent être classées dans un
certain ordre naturel mais on ne peut pas dire à partir de cet ordre de "combien" (c’est par
exemple le cas de la variable Mention au Bac) ;

1
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

4. a.2- une variable qualitative nominale, lorsque ses modalités ne peuvent être classées de
façon naturelle (c’est par exemple le cas de la variable Couleur des Yeux ou la variable Sexe,
ou la variable état matrimonial).
4. b- Une variable quantitative est une variable qui est de la forme d'une variable numérique.
Exemple : âge, moyenne de l'année.
On distingue 2 types de variables quantitatives : les variables quantitatives discrètes et les
variables quantitatives continues
4. b.1- Une variable quantitative discrète peut prendre des valeurs dénombrables. Exemple :
le nombre d'enfants par ménage, le nombre des pièces de production..
4. b.2- variable quantitative continue peut prendre toutes les valeurs à l'intérieur d'un
intervalle. Exemple : la taille. L’Age, le poids. Les chiffres d’affaires des entreprises
L’amplitude d’une classe (a) est alors la différence entre la borne supérieure et la borne
inférieure de l’intervalle défini :
soit [a; b[ une classe d’une variable quantitative, on dit que b − a est l’amplitude de cette
𝒂+𝒃
classe, et Ci= la centre de classe dans le cas de variable discrète an appelle
𝟐

On peut résume des déférents variables statistique par l’organigramme suivant

Variables
statistiques

Quantitative Qualitative

Discrète Continue Ordinale Nominale

5- Effectif et le fréquence
5.1- L'effectif (ni ) d'une valeur donnée d'une variable est l'ensemble des individus présentant
cette valeur. L'effectif total (N) est la somme de tous les effectifs d'une variable.

2
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

5.2- La fréquence (fi ) d'une valeur donnée est le rapport de l'effectif correspondant à l'effectif
total. La fréquence totale (F) est toujours égale à 1.
Exemple : une étude sur l'état matrimonial des dix (10) salariés de la société X.
Population : dix(10) salariés de la société X.
Unité statistique (individu) : chaque salarié de la société X.
Variable (caractère) étudiée : état matrimoniale.
Modalités : célibataire, marié, veuf, divorcé.
Effectif : n1=2 célibataires ; n2=5 mariés ; n3=2 veufs : n4=1divorcé.
Effectif total : N = n1 + n2 + n3 + n4=10
Fréquence : fréquence de la modalité (fi) : célibataire = n1/N=0.2 ; marié = n2/N=0.5 : veuf =
n3/N=0.2 ; divorcé = n4/N=0.1 et la fréquence totale = F=1.

6- Effectifs cumulés croissants et décroissants


Quand les modalités ou les classes d'une variable sont rangées dans l'ordre croissant
(décroissant), les effectifs cumulés croissants (ou décroissants) d'une valeur s'obtient en
ajoutant à chaque effectif les effectifs des valeurs qui la précédent.
et les fréquences cumulées s'obtiennent en divisant les effectifs cumulés par l'effectif total.
Exemple : voire le tableau suivant 6.1
Note sur 20 [0 ; 5[ [5 ; 10[ [10 ; 12[ [12 ; 15[ [15 ; 17[ [17 ; 20[
Effectif (ni) 2 3 7 5 3 1
Centre de classe [a ; b[ 2.5 7.5 11 13.5 16 18.5
𝑎+𝑏
Ci= …
2
Fréquence (fi) 0.09 0.14 0.33 0.24 0.14 0.05
Effectif cumulé 2 5 12 17 20 21
croissant
Effectif cumulé 21 19 16 9 4 1
décroissant
fréquence cumulé 0.09 0.23 0.56 0.80 0.94 0.99=1
croissant
fréquence cumulé 0.99=1 0.90 0.76 0.43 0.19 0.05
décroissant

7- Représentations graphiques
Pour obtenir une meilleure compréhension de la répartition des valeurs d’une variable donnée
d’une série, plusieurs types de diagrammes existent. Le choix de quel type de diagramme
utiliser dépend directement du type de variable dont il s’agit.
7.1- Variables qualitatives
Diagramme en barre : dans ce diagramme, les modalités de la variable sont placées sur une
droite horizontale et les effectifs (ou les fréquences) sont placés sur un axe vertical. La
hauteur de la barre est proportionnelle à l’effectif (figure). Les barres ont une certaine

3
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

épaisseur pour qu’il n’y ait pas de confusion avec les diagrammes en bâtons réservés à des
variables quantitatives discrètes.

Figure 7.1.a

Diagramme circulaire ou camembert : L’effectif total est représenté par un disque. Chaque
modalité est représentée par un secteur circulaire dont la surface (pratiquement : l’angle au
centre) est proportionnelle à l’effectif correspondant (figure 4.2).
effectif de la modalité
L’angle de chaque modalité se calcule par : α= ∗ 360
effectif total

Figure 7.1.b

7.2- Variables quantitatives


Diagramme en bâtons : Les valeurs discrètes xi prises par les variables sont placées sur l’axe des
abscisses, et les effectifs (ou les fréquences) sur l’axe des ordonnées. La hauteur du bâton est
proportionnelle à l’effectif (figure).

4
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

Figure7.2.a

Histogramme : on utilise l’histogramme pour les variables classées. C’est un ensemble de


rectangles. Chaque rectangle est associé à une classe et il a une surface proportionnelle à
l’effectif (ou fréquence) de cette classe.
Remarque

 Si les classes ont la même amplitude, on reporte en ordonnée l'effectif (ou fréquence)
des classes (voir figure 2.4 à gauche).
 si les amplitudes sont différentes, on reporte en ordonnée la densité (di ) (effectif
𝑛𝑖
divisé par l'amplitude de la classe) Et nous devenons l’effectif rectifie 𝛼𝑖 = ×𝑎
𝑎𝑖

Sachant que a : représenter Le longueur de classe la plus courante

Figure7.2.b Figure7.2.c

5
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

Exemple :
La répartition suivante montre la répartition des 100 salariés par le salaire quotidien:
𝑛𝑖 𝑛𝑖
𝛼𝑖 = ×𝑎 Densité Amplitude Effectif 𝑛𝑖 Les classes
𝑎𝑖 𝑎𝑖
𝑎𝑖
5 1 5 5 ]25 − 20]
5,5 1,5 11 15 ]35 − 25]
01 4 5 01 ]40 − 35]
3,88 1,11 15 05 ]55 − 40]
5,5 1,5 20 81 ]75 − 55]
5 1 5 5 ]80 − 75]
/ / / 111 La somme

Représentation graphique voir le figure 7.2.c

8- paramètres de position (la tendance centrale)


Les paramètres de position (ou de tendance centrale) permettent de savoir autour de quelles
valeurs se situent les valeurs d'une variable statistique

8.1- Moyenne
La moyenne arithmétique d'une série statistique est la somme des valeurs divisée par le Cas
des valeurs xi avec les effectifs n i
Cas des valeurs xi avec les effectifs n i
1
On désigne par x   ni x i la moyenne arithmétique des valeurs observées. .
 ni
On peut remarquer que x=  f i x i

Cas des classes Ci.


On décide d’appliquer la même formule, dans laquelle xi représente les centres des classes Ci.
1
x  ni c i
 ni
répartition de qualité de service voir le tableau 8.1 suivant

n1x1 +n2x2+n3x3+⋯…..+nnxn 1∗1+3∗2+5∗3+2∗4+1∗1


Donc la moyenne pondérée x̅= =2.9.
n1+n2+n3+⋯…..+nn 1+3+5+2+1

et pour une série continue Voire le tableau 6.1.

6
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

̅̅̅X=2.5∗2+7.5∗3+11∗7+13.5∗5+16∗3+18.5∗1 =
2+3+7+5+3+1

8.2- Médiane(Me)
C'est le nombre qui permet de couper la série statistique classées par ordre croissant (ou
décroissant) en deux sous-groupes égaux (contenant le même nombre des individus).
 Graphiquement : la point d’intersection les deux courbes cumulé croissant et cumulé
décroisant représenter le médian.
Calcul de médiane pour un variable discrète
Si l’effectif total est impair N=2n+1, la médiane est parfaitement déterminée : la modalité
correspondant à la classe de n+1 (Me=x n+1 ).

Exemple : Soit la série statistiques suivante : 15, 7, 22, 4, 12, 30, 9, 18, 6. Pour déterminer la
médiane, il faut ordonner la série : 4, 6, 7, 9, 12, 15,18, 22, 30. Donc l’effectif totale N=2*4+1
La médiane est le Me= X4+1 =X5 = 12 car dans cette série, il y a 4 nombres inférieurs et 4
supérieures de 12.
Si l'effectif total est pair N=2n, on ne peut pas définir précisément la médiane : On définit un

xn + xn+1
intervalle médian. Xn et xn+1 alors Me= 2

Exemple : une série représentant les notes d'une classe : 15, 7, 20, 4, 12, 20, 9, 18, 6, 4 (série
ordonnée :
4, 4, 6, 7, 9, 12, 15, 18, 20, 20), l'interval médian est 9 et 12. Dans ce cas-là, le médian est
9+12
Me= =10.5
2

Calcul de médian pour un variable continue


Pour une variable continue, on détermine la classe médiane
classe de médianne c’est le premier classe qui leur effectif cumulé croissant supérieur ou égal
(N/2)
La valeur de médian se calculé par la relation suivant
N 
 N Me 1
Me  a  2 * (b  a)
nMe .
Sachant que :
a : borne inferieur de classe médian
b : borne supérieur de classe médian

N Me 1 L’effectif cumule croisant de classe avant classe médiane.

7
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

nMe : l’effectif de classe médiane


N : l’effectif total
Exemple : soit il y’ un distribution suivant : calculé le médian (Me)

Poids des étudiants𝑿𝒊 Effectif 𝒏𝒊 effectif cumulé croissant𝑵↑𝒊


[50 55 [ 2 2
[55 60 [ 5 7
[60 65 [ 12 19
[65 70 [ 16 35
[70 75 [ 14 49
[75 80 [ 8 57
[80 85 [ 3 60
N = ∑ 𝑛𝑖 60
Analytiquement
Avant tout il faut déterminer la classe de médian :
N/2=60/2=30 donc d’après les valeurs d’effectif cumulé croissant la classe médiane c’est
[65 70 [.

a=65 ;b=70 ; nMe =16 ;N=60 ; N Me 1 =19 donc
𝑁 ↑
– 𝑁𝑀 𝑒 −1 30−19
𝑀𝑒 = 𝑎 + [ 2 ] × (𝑏 − 𝑎) = 65 + [ ] × 5 = 68,44
𝑛𝑀𝑒 16
Graphiquement :

8.3- Mode
Pour une variable discrète, le mode est la modalité qui représente le plus grand effectif.
Exemple : sur le tableau, le mode est qualité de service 3
Pour une variable quantitative continue nous parlons de classe modale : c'est la classe dont
∆1
l'effectif est maximum. et 𝑀𝑜 = 𝑎 + [∆ ] × (𝑏 − 𝑎)
1+∆ 2

∆1=l’écart absolu entre l’effectif de classe modale et l’effectif de classe précédant


∆2 = l’écart absolu entre l’effectif de classe modale et l’effectif de classe suivant

8
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

a : borne inferieur de classe model


b : borne supérieur de classe model
Exemple : dans le tableau , la classe modale est la classe [65..70[.
Donc ∆1 = 16 − 12 = 4; ∆ 2 16 − 14 = 2 ; a=65 ;b=70
4
𝑀𝑜 = 65 + [ ] × 5 = 68,33
4 +2
graphique ment

65
Mo 70

9- paramètres de dispersion
9.1- Etendue
L'étendue d'une série statistique quantitative est la différence entre la plus grande valeur de la
variable (discrète ou continue) et la plus petite valeur. Exemple, dans le tableau 1.1,.
𝐸 = 𝑀𝑎𝑥 (𝑋𝑖 ) − 𝑀𝑖𝑛(𝑋𝑖 ) = 85 − 50 = 35

9.2- Quartiles
 On appelle premier quartile d'une série Q1 la plus petite valeur des termes de la série
pour laquelle au moins un quart (25%) des données sont inférieures ou égales.
 On appelle troisième quartile d'une série la plus petite valeur Q3 des termes de la série
pour laquelle au moins trois quarts (75%) des données sont inférieures ou égales à Q3.
 On appelle intervalle interquartile l'intervalle [Q1 ; Q3].
 On appelle écart interquartile le nombre Q3-Q1.
Exemple : la série ordonnée par ordre croissant S a 12 termes :
S = [11; 12; 13; 15; 16; 16; 17; 17; 18; 19; 20; 22]
Un quart (25%) des données correspond à : 12 * 0.25 = 3. Donc Le premier quartile est alors,
par définition, la valeur du 3ème terme de la série c'est-à-dire Q1= 13.
Trois quarts (75%) des données correspondent à : 12 * 0.75 = 9. Donc Le troisième quartile
est alors, par définition, la valeur du 9ème terme de la série c'est-à-dire Q3= 18.
L'intervalle interquartile est [13 ; 18]. L'écart interquartile est 18-13 = 5.

Cas de variable continue

9
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

Classe de premier quartile : c’est la première classe que l’effectif cumulé croissant supérieur ou
𝑁 𝑁
égal c’est-à-dire 𝑁𝑄↑ ≥ et Q1 donner par la formule suivant
4 1 4

𝑁
− 𝑁𝑄↑ 1−1
4
𝑄1 = 𝐿𝑖𝑚 𝑖𝑛𝑓𝑄1 + [ ] × 𝐴𝑄1
𝑛𝑄1
Classe de troisième quartile : c’est la première classe que l’effectif cumulé croissant supérieur
𝑁 𝑁
ou égal 3 c’est-à-dire 𝑁𝑄↑3 ≥ 3 et Q1 donner par la formule suivant
4 4
3𝑁
− 𝑁𝑄↑ 3 −1
4
𝑄3 = 𝐿𝑖𝑚 𝑖𝑛𝑓𝑄3 + [ ] × 𝐴𝑄3
𝑛𝑄3
Diagramme de Tukey
Ce type de diagramme est appelé diagramme de Tukey ou boîte à moustaches ou boîte à
pattes. Il représente le 1er et le 3ème quartile, le 1er et le 9ème décile, les valeurs extrêmes et
éventuellement la médiane d'une série

Xmax

Q3

Me
Q1
Xmin

9.3- Variance
La variance est un indicateur de la dispersion d'une série par rapport à sa moyenne. La
définition de la variance d'une série statistique est donnée par la formule :

9.4- Ecart-type
La définition de l'écart-type d'une série est donnée par la formule :
 ( x)  V ( x)

Si l'écart-type est faible, cela signifie que les valeurs sont assez concentrées autour de la
moyenne et si l'écart-type est élevé, cela veut dire au contraire que les valeurs sont plus
dispersées autour de la moyenne.

10- Forme des distributions

10
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

La comparaison des trois valeurs centrales ou l'examen de l'histogramme permettent de définir


la forme des distributions. Selon la forme d'une distribution le meilleur résumé sera fourni par
l'une ou l'autre des trois valeurs centrales.
10.1- Distribution symétriques

Lorsque la distribution est unimodale et symétrique, on va trouver à peu


près moyenne = médiane = mode.
10.2- Distributions unimodales dissymétriques :

Deux cas peuvent se présenter :

 mode < médiane < moyenne : la distribution est dissymétrique à gauche, c'est à dire
qu'il y a concentration pour les valeurs faibles et dispersion pour les valeurs fortes. C'est le cas
le plus fréquent.
 - moyenne < médiane <mode : la distribution est dissymétrique à droite, c'est à dire
qu'il y a concentration pour les valeurs élevées et dispersion pour les valeurs faibles. Ce cas
est plus rare que le précédent.

Exemple 2 : Le tableau ci-dessous permet de suivre l'évolution de l'espérance de vie à la naissance


(en années) en France de 1990 à 1999 pour les femmes:

11
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

Série statistique à deux variables

Une série statistique à deux variables (ou une série double) représente une étude statistique sur
deux variables de la même population.
On considère deux variables statistiques numériques x et y observées sur une même
population de n individus.
On note x1 ; x2 ….x n les valeurs relevées pour la première variable et y1 ; y2 ..; yn les valeurs
relevées pour la deuxième variable. Les couples (x1 ; y1); (x2 ; y2) ..; (xn ; y n) forment une
Série statistique à deux variables.

Exemple : Le tableau montre deux séries mensuelles. La première indique le temps passé par
une personne sur Internet chaque mois (en heures) et la seconde série indique le total de la
somme dépensée sur différents sites marchands

Représentation graphique
Un graphique de dispersion ou nuage de points est un graphique qui met en relation les
valeurs de deux variables sur un repère de coordonnées cartésiennes

12
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

POINT MOYEN
On appelle point moyen de cette serie le point G de coordonnees ( x ; y ) ou x et y sont les
moyennes respectives des séries x1 ; x2 ;…. xn et y1 ; y2 ;….y n .
1 1
x   xi et y   yi
N N

La covariance
Pour mesurer la dispersion des points d'un nuage par rapport au point moyen, on utilise la
covariance.
La covariance est positive si X et Y ont tendance à varier dans le même sens, et négative si
elles ont tendance à varier en sens contraire.

On appelle covariance du couple (X ;Y ) le réel noté Cov(X,Y ) ou σxy , égal à


1 1
Cov(x; y)   ( xi  X )( y i  Y )   xi y i  XY
N N
Coefficient de corrélation linéaire
Le coefficient de corrélation entre deux variables statistiques X et Y sur les mêmes individus
est :

3
Si  r  1 X et Y sont bien corrélées, c'est-à-dire qu'elles sont liées entre elles par une
2
relation presque affine ; le nuage de points est presque aligné le long d'une droite (croissante
si r = +1, décroissante si r = -1).
1 3
Si  r  la corrélation entre X et Y est médiocre
2 2
1
0  r  la corrélation entre X et Y mauvaise ou il n’y a aucun corrélation entre X et Y
2

13
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

Exemple de cas r est approche de 0

La droite d'ajustement
Le coefficient de corrélation mesure la dépendance linéaire des variables. Si cette dépendance
est bonne, on peut exprimer la variable Y comme fonction linéaire de X. C'est à dire que les
valeurs yi peuvent être remplacées par des valeurs calculées qui sont fonctions des xi. Plus
précisément :
y1 = ax1+b, y2 = ax2+b……… . yn= axn+b Il reste donc à déterminer les valeurs des
paramètres a et b,

Graphiquement, cela signifie qu’on cherche une droite qui passe au plus près de tous les
points du nuage. Une telle relation permettrait notamment de faire des prévisions. Il existe de
nombreuses manières d’obtenir un ajustement affine satisfaisant.
Méthode de Mayer
 Etape 1: On commence par « découper » la série statistique double en deux sous-séries
bien distinctes, c’est-à-dire que l’on découpe le nuage des points Mi (xi, yi) en deux sous-
nuages distincts et de même effectif (ou presque : si le nombre de points est pair, pas de souci.
S’il est impair, on peut mettre le point surnuméraire dans n’importe lequel des deux sous-
nuages)
 Etape 2 : On calcule les coordonnées des deux points moyens G1 et G2 associés à ces
deux sous-groupes, et on place ces deux points sur le graphique.
 Etape 3 : On trace la droite (G1 G2)?, appelée droite de Mayer du nuage des points
Mi (xi, yi), qui doit passer par le point moyen G du nuage de points Mi (xi, yi) .C’est cette
droite qui constitue un ajustement affine tout à fait acceptable pour la série double (xi, yi)

14
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

Exemple :
Exemple : Le tableau suivant donne le chiffre d'affaire réalisé au cours des 6 derniers mois par
un site de vente en ligne en fonction du nombre de commandes reçues.

Nombre de 6400 8350 9125 9600 10050 12000


commandes (xi)
Chiffre d’affaire 250 000 320 000 335 000 350 000 370 000 400 000
mensuel (yi)

On partage le nuage de points en deux groupes de même importance suivant les valeurs
croissantes de xi, et on calcule les coordonnées des points moyens G1 et G2 de chaque groupe
des points.
Alors les deux sous-groupes des point comme la suit.

1ere groupe 2eme groupe


Nombre de 6400 8350 9125 9600 10050 12000
commandes (xi)
Chiffre d’affaire 250 000 320 000 335 000 350 000 370 000 400 000
mensuel (yi)

On calcule les coordonnées des deux points moyens G1 et G2 associés à ces deux sous-
groupes,
Coordonnées de G1  x1 ; y1 ) avec x1 moyenne des valeurs xi du premier groupe et
y1 : moyenne des valeurs yi du premier groupe.
6400  8350  9125 250000 320000 335000
x1 =  7960 et y1   310650
3 3
Donc G1 (7960 ; 310650).
Coordonnées de G2  x 2 ; y 2 ) avec x 2 moyenne des valeurs xi du deuxième groupe et
y 2 : moyenne des valeurs yi du deuxième groupe.

9600  10050  12000 350000 370000 400000


x2 =  10550 et y 2   373330
3 3
Donc G2 (10550 ; 373330).
On trace la droite d'ajustement qui passe par les deux points G1 et G2 .

L’équation de droite D1 elle admet de la forme y=a.x+b et dans ce cas passant par les points
y  yG1 373330 310650
G1 et G2 avec a  G 2   24 et
xG 2  xG1 10550  7960
b  yG1  a * xG1  310650 24 * 7960  119700
La droite d'ajustement affine à donc pour équation y=24*x+119700

 Pour tracer la droite d'ajustement D1 , il suffit de placer G1 et G2 puis de tracer la


droite qui les relie..

15
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

Méthode des moindres carrés.


Cette méthode montre que Il existe une unique droite D réalisant un ajustement affine du
co v(x; y )
nuage des points Son coefficient directeur est a = et il passant par le point Moyen
 ( x) 2
G ( x ; y ) et b  yG  a * xG et l‘équation de la droite c’est (D ): y=ax+b
Cette méthode consiste à minimiser la somme des carrés des distances entre les points yi des
points Mi et les valeurs calculées correspondantes yi des point Qi

16
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

La droite d'ajustement corrélant Y à X

Il est alors possible d'en déduire des formules pour a et b :

et

17
Mr :Damba N
Université Ahmed Draya d’Adrar Faculté Sciences et de la Technologie
2iér année ST Département : Sciences et Technologie
Module : probabilités et statistique :

18
Mr :Damba N