Vous êtes sur la page 1sur 6

1/[Notion de Base]

Une étude statistique se base sur des données. Cependant, il est souvent impossible d’avoir les données
complètes surtout s’il y a un grand nombre de possibilités ou si l’analyse des données utilise un test destructif.
Par exemple, il serait impossible de déterminer la résistance moyenne d’un type de contenants en testant
jusqu’à rupture chaque contenant sortant de la ligne de production. Même si on n’est pas dans les situations ci-
dessus, étudier toutes les données serait onéreux en temps et en argent. Un ingénieur qui s’intéresse à vérifier si
un procédé de fabrication respecte les spécifications va inspecter suivant un plan établi un certain nombre
d’unités produites chaque jour. La différence entre toutes les données possibles et un nombre restreint de
données recueillies est important dans la compréhension des statistiques.

*Concepts de base :

 Population : On appelle population un ensemble d’éléments homogènes aux quels on s'intéresse. Par
exemple, les étudiants d'une section, les familles des travailleurs, les enseignants d'une université, les élèves
b- Les éléments de la population sont appelées individus ou unités statistiques.

 Variable : La variable est la caractéristique observée. En génie, en général les variables étudiées sont
quantitatives, c'est-à-dire mesurables. On distingue deux variables quantitatives.

Individu : En statistique un individu, un type est un élément d'un ensemble, généralement appelé « population »,
dont on mesure (ou observe) la valeur qu'il a pour la variable étudiée. Pour une étude sur les catégories
professionnelles.

*Tableau statistique :
Un tableau statistique présente des données chiffrées de façon très condensée. Si ces chiffres étaient donnés
sous forme de texte, la lecture serait tellement indigeste qu’il serait malcommode d’en tirer quelque chose.

Il existe deux types différents des tableaux statistiques :

1-Un tableau à simple entrée ne présente qu’un seul caractère. Il est très facile à transformer en graphique, de
lecture encore plus simple.

2-Le tableau à double entrée présente quant à lui deux caractères, l’un en ligne et l’autre en colonne. Il permet
donc de croiser les modalités de ces deux caractères.

*Représentation graphique :
Le graphique est un mode d’expression qui permet « visuellement » de saisir et de mémoriser un certain
nombre d’informations. C'est pourquoi, lors de la présentation des résultats statistiques et
complémentairement aux tableaux, on utilise souvent une représentation graphique.

Cette représentation graphique peut répondre à deux types d’objectifs :

a)Etre un moyen de communication et permettre de véhiculer une information. C’est ainsi que certains
graphiques figurent dans des articles de magazines et journaux, dans des brochures de présentation de résultats
commerciaux ou (et) comptables et même dans certaines publicités. Ceci prouve qu'un bon graphique est
souvent plus explicite qu'un long discours.

b) Etre un instrument de travail et permettre une vue d’ensemble synthétique du phénomène étudié, ce qui
en facilite l'analyse.
2/[Etude numérique]
*CARACTÉRISTIQUES DE TENDANCE CENTRALE :
Les paramètres de tendance centrale ou « mesures de tendance centrale » sont des grandeurs susceptibles de
représenter au mieux un ensemble de données. L'appellation «tendance centrale » vient du fait que ces
paramètres donnent une idée de ce qui se passe au centre d'une distribution, d'un ensemble de données. On
distingue trois mesures de tendance centrale : La moyenne ; Le mode ; La médiane ; Le Quantile.

Le Mode : Le mode d’une série statistique est la valeur du caractère la plus fréquente ou dominante dans
l'échantillon. Autrement dit, c’est la valeur qui a la fréquence (absolue ou relative) la plus élevée.

La Moyenne : La moyenne constitue l’un des paramètres fondamentaux de tendance centrale mais non
suffisant pour caractériser une distribution. Complémentaire du mode et surtout de la médiane, la moyenne
constitue à n'en point douter, la mesure la plus calculée et la plus utilisée lors de la description de séries
statistiques.

La Médiane : la médiane c'est la valeur qui sépare une série d’observations ordonnées en ordre croissant ou
décroissant, en deux parties comportant le même nombre d'observations.

Le Quantile : Un quantile définit une partie particulière d'un ensemble de données, c'est-à-dire qu'il détermine
combien de valeurs d'une distribution sont supérieures ou inférieures à une certaine limite. Les quantiles
spéciaux sont le quartile (quart), le quintile (cinquième) et les centiles (centième).

*Caractéristique de dispersion :
I) L'ETENDUE : L'étendue est la différence entre la plus grande et la plus petite des valeurs observées. Ce
paramètre est également appelé « intervalle de variation ».

 Cette caractéristique est la plus simple mais aussi la moins significative.

 Sa signification est claire et son calcul extrêmement rapide.

II) Écart-type : L'écart-type sert à mesurer la dispersion, ou l'étalement, d'un ensemble de valeurs autour de
leur moyenne. Plus l'écart-type est faible, plus la population est homogène.

III) Ecart-absolu : L'écart absolue moyen est le paramètre de dispersion le plus simple qui mesure les
fluctuations de la série par rapport à la moyenne.

IV) Coefficient de variation : Le coefficient de variation (CV) est le rapport de l'écart-type à la moyenne. Plus
la valeur du coefficient de variation est élevée, plus la dispersion autour de la moyenne est grande. Il est
généralement exprimé en pourcentage. Sans unité, il permet la comparaison de distributions de valeurs dont les
échelles de mesure ne sont pas comparables. Lorsque l'on dispose de valeurs estimées, le CV rapporte l'écart-
type de l'estimation à la valeur de cette estimation. Plus la valeur du coefficient de variation est faible, plus
l'estimation est précise.
3/[Exemple d’application]
Le nombre de frères sur un ensemble de 24 étudiants est donné
par la liste suivante:
{4 ,3 ,3 ,3 , 2, 5 ,4 ,1 ,2 ,0, 4, 2, 2, 5, 4, 3, 2, 1, 0 , 1, 2, 3, 1, 5}

On voit dans ce cas que la population Ω est définie comme


“l’ensemble de 24 étudiants", les individus sont les étudiant selon
cette population étudiée, le caractère ou variable étudié est “le
nombre de frère de chaque étudiant”, les modalités sont les
différents cas possible d’etat de ce caractère”0,1,2,3,4,5,6”, la nature
de ces modalités est quantitatif (∈ R ) discret (nbr. fini).

Pour pouvoir traiter et calculer les propriétés de cet ensembles


de données on peut utiliser:
1. Tableau Statistique:
qui en base regroupe les caractères dans la colonne
xi et l’effectif dans ni (nbr de répétition):

¿
xi ni ƒi= n ni.xi

0 2 0.083 0

1 4 0.166 4

2 6 0.25 12

3 5 0.2 15

4 4 0.166 16

5 3 0.125 15
totale 24 1 52

2. Représentation graphique:
qui se trouve sous beaucoup de formes différentes
telles que: tuyaux d'orgue, histogramme, répartition
circulaire, courbe cumulative.
-voyons l’option de tuyaux d’orgue:

Alternativement à la représentation graphique on a


d'autres terms statistiques pour mieux exprimer la
dispersion/concentration des données étudiées:
1. Moyenne X :
n
1
X = ∑ ❑∋. xi=52/24=2.16
n i=0

2. Mode M0:
M0= 2
(modalité xi qui a le plus grnd effectif ni)
sign: le plus grand nbr des etd a 2 frères.

3. Médiane Med :

x n/2+ x❑(n /2)+1

Med= ❑ { x❑❑
2
n +1 /2
sin impair }
sin pair

x ❑12+ x ❑13
Med= =(6+5)/2=5.5
2

sign: 50% des étudiants ont ≤ 5.5de frères.


4. Les Quartiles Q0.25-Q0.75 :

x ❑nα +x❑ nα+ 1

Q❑α = ❑ { 2
si nα ∈ N
x ❑E(nα )+ 1 sinα ∉N }
Q0.25:: 𝛼=0.25 , n𝛼 = 6 , Q0.25=(x6+x7)/2
Q0.25=1.5 ; 25% des etd ont ≤ 1.5frères.

Q0.75:: 𝛼=0.75 , n𝛼=18 , Q0.75 = (x18+x19)/2


Q0.75= 4 ; 75% des etd ont ≤ 4 frères.

5. L'étendue e :
e=Max ( x )−Min( x)=6−0=6

6. La variance V (x ) et L'écart type σ ( x):


k
1
V (x )= ∑ ❑n❑i ( x ❑i−X )❑2; σ (x)= √ V ( x )
n i=1

V (x )=1.09; σ (x)=1.04

7. L'écart type absolu:


k
1
e ❑X = ∑ ❑|x❑i− X|=0.415
n i=1

8. Le coefficient de variation CV :
σ
C ❑V = =1.04 /2.16 =0.481
X
Megrah
Nassim
Groupe 03

Vous aimerez peut-être aussi