Vous êtes sur la page 1sur 14

RESUME BIOSTATE 2020

***Notion et Définition :
01-la statistique ; c’est l’art et la science de collecter, analyser, présenter et interpréter des données
(c’est un outil d’aide à la décision), Elle pour objet **l’étude, à l’aide de traitement mathématique,
de nombreux faits correspondants à l’observation d’un phénomène dans le but de rendre compte de
la réalité, d’essayer de l’expliquer et d’aider à la prise de décision.
02-les statistiques ; Résultat numériques
03-la variabilité ; Est un caractère essentiel des êtres vivants
04-Population statistique ; l’ensemble statistique ; univers statistique
C’est la réunion des individus sur lesquels on étudie une ou plusieurs propriétés (ou caractères) ;
Ensemble de référence.
05-L’unité statistique (individu) ; L’objet pour lequel nous sommes intéressées à recueillir de
l’information
06-La série statistique : La suite des valeurs prises par une variable ‘ X ’ sur les unités
d’observation
07-individu : élément de la population
08-Echentillon : sous-ensemble de la population
09-La taille : elle représente le nombre d’individus d’un échantillon ou d’une population symbolisée
Par : n dans une échantillon N dans une population

Descriptive(‫ )وﺻﻔﻲ‬: la sommes des techniques qui permet ;


Objectifs du statistique décrire(‫)وﺻﻒ‬, résumer(‫)ﺗﻠﺨﯿﺺ‬, représenter (‫)ﻋﺮض‬
Inférentielle (‫ )اﺳﺘﺪﻻﻟﻲ‬: à partir d’échantillon on a donné des
Caractère de la population
10-Le caractère : est une propriété des unités statistique permettant de les décrire et de les
distinguer des autres
Nominale (situation familiale ; M, V, C, D)
Qualitative Ordinale (niveau de scolarité ;Primaire ,…)
Binaire ; Dichotomique ; sexe ; ⚥
Variables
(Modalité) Discréte ;Discontinue ; nbre des enfants ;1,2,3,….
Quantitative
Continue ; taille d’arbre, poids du fruit ; 1.5 ,1.25…..
RESUME BIOSTATE 2020
Les paramétrées statistiques
1-Paramétre de position (‫; )ﻗﯿﻢ ﺛﺎﺑﺘﺔ‬ Moyenne Médiane Mode Les Quartiles
2-Parametre de dispersion (‫;)ﻗﯿﻢ ﻣﻨﺘﺸﺮة‬ Variance Ecart-type Covariance
01-La Moyenne
1.1. Série simple :
Ex :10,15,09,08 *************** = 10+15+9+8/04=10.50
1.2. Série Pondérée : ‫اﻋﺪاد ﻣﻜﺮرة‬
Ex :10,10,10,15,15,9 ********** = ((10*3) +(15*2) +9) /6=11.50
1.3. Série Continue :
xi ni Ci :centre ni* Ci
de classe
[05-10[ 3 07,50 22,50 =∑ ni* Ci /n =222.50/11= 20.22
[10-25[ 2 17,50 35,00
[25-30[ 6 27,50 165
[classe[

∑ 11 ----------- 222.50

02- Médiane : Il divise les valeurs en 50 % valeurs sup (‫ )ﻗﯿﻢ ﻋﻠﯿﺎ‬et 50% valeurs infr(‫ )ﻗﯿﻢ دﻧﯿﺎ‬.
*Variable Discrète ;‫ﻻ ﺗﻮﺟﺪ ﻓﻮاﺻﻞ‬
Impaire : ‫ﻓﺮدﯾﺔ‬:20 ;13 ;14 ;07 ;12 || Pair : ‫زوﺟﻲ‬:20 ;13 ;14 ;07
01…classer la série
07 ;12 ;13 ;14 ;20 || 07 ;13 ;14 ;20
02…Rang

∑ ni+1/2=5+1/2 =3 ||| ∑ ni/2 =4/2=2

03…Médiane
Me =13 ||||| Me 13+14/2=13.5
*cas continue :
Salaire Effectifs( ni) ECC ECC ; Effectifs Cumulées Croissante.
Mensuel
Rang = ∑ ni/2=60/2=30
1500-2000 26 26
2000-2500 12 38 26 30 38 Me -2000 30-26
2500-3000 11 49 2000 Me 2500 2500-2000 38-26
3000-3500 06 55 Me =2166,67 50% des effectifs des employées honte
un salaire sup a 2166.67 et 50% honte un salaire
3500-4000 05 60
inferieur a 2166,67.
RESUME BIOSTATE 2020
03-Mode : plus fréquente
3.1. Variable Qualitative (ex : situation familiale ;3 C ;1D ;1V mode =3 R= C)
3.2. Variable Quantitative Discrète ;

Nbre
d’enfants
ni
xi
1 12
2 30
3 05
Répétions Famille

01-Amplitude égale
Salaire mensuel ni L’amplitude égale 500 dans tous les classes
1500-2000 500 26 Lecture de tableau :
2000-2500 500 12 26 personnes honte un salaire compris 1500 et
2500-3000 500 11 2000

Mo = L1+d1/d1+d2 ai = 1500 +(26-0) / (26-0) +(26-12) *500 =1825


(1825 : salaire dominant dans cette association)
REM : Même amplitude : L’effectifs plus élever va donner une classe modale (ds notre ex :ni=26)
L1 : borne inférieure de la classe
02-Amplitude inégale
Salaire ni ai U ni corrigé U = ai / a0
0 - 5 50 05 01 50/1=50
ai : amplitude =
5 - 10 100 05 01 100/1=100
borne sup
10 - 20 400 10 02 400/2=200
-
20 - 30 120 10 02 120/2=60
borne infr
30 - 50 60 20 04 60/4=15
Dans le cas ou l’amplitude inégale on a besoin de corrigé l’amplitude
*a0 =amplitude de base =la plus basse amplitude =’5’
*ai= amplitude de classe
RESUME BIOSTATE 2020
Pour calculer le mode Mo ; dans ni corrigé ; on a choisi l’effectifs le plus élevé, dans notre exemple
c’est :200 ***** la classe c’est 10-20
Mo = 10 + (200-100) / (200-100) +(200-60) *10 =14,166
*********************************************************
Les Quartiles Et Les Déciles :
Les Quartiles : sont les paramétrées de dispersion autour de la Médiane ; Q1 ; Q2 ; Q3
Q1 = ∑ ni 1/4 =80/04=20 Q3 = ∑ ni 3/4=80 3/4 = 60

Tranches 10 20 28
d’investissement
En 1000 DA
ni ECC 300 Q1 400
Q1-300/400-300 =20-10/28-10=355,66
200 - 300 10 10
58 60 70
300 - 400 18 28
500 Q3 600
400 - 500 30 58
Q3-500/600-500 =60-58/70-58
500 - 600 12 70 =516.670 soit 516670 DA.
600 - 700 06 76
700 - 800 04 80
------------------- 80 ----------------------

25%des entreprise honte un investis en 355660 DA et 75% honte un investis sup de 355660 DA
75% des entreprise honte un investissement inf 516670 et 25% sup 516670
************
Les Déciles :
Rang : D1 = ∑ ni 1/10 =80/10=8 D9 = ∑ ni 9/10 = 80 * 9/10 =72
0 8 10 70 72 76
200 D1 300 600 D9 700
D1-200/300-200 = 8-0/10-0 =280 D9 = 633,333 soit 633333 DH
Soit 280 000 DH
D1 :10% des entreprise honte un investissement infre au 280000 DH et 90% des entreprise honte un
invest sup 280000 DH
RESUME BIOSTATE 2020
La Variance : Dispersion du valeur autour du moyenne ; V ou S2 ou σ2
a-Distribution simple :
σ2 =∑ (xi - X̅ )2 /n
Si la variance dispersion autour de la moyenne
EX : Classe A Classe B
Fruits Poids Fruits Poids
01 10 01 03
02 12 02 17
03 08 03 02
04 09 04 18
05 11 05 19
06 01

= ∑ xi/n =10+12+8+9+11/5 = 10 ‫ ﺑﻌﯾدة ﺟدا ﻋن‬2 ‫ﻣﺟﻣوﻋﺔ‬


=10 ‫اﻟﻣﺗوﺳط اﻧﺗﺷﺎر ﻛﺑﯾر‬
σ2 =∑ ((10-10 )2+(12-10 )2+ σ2 = 64,66 g2
(8-10 )2+(9-10 )2+(11-10 )2) /5
= 2 g2
***b-Distribution de fréquence:
Salaires mensuels
En 100 DH ni xi
Ci
ni*xi Xi- (Xi- )2 ni(Xi- )2 22 employées honte
800-1000 da
• 8 - 10 22 09 198 -03,06 09,36 205,92 Vu =515,28/100=5,1528
10 - 12 28 11 308 -01,06 01,12 31,36
12 - 14 30 13 390 00,94 00,88 26,40 =∑ ni*xi/n

14 - 16 15 15 225 02,94 08,64 129,40 =1206/100


16 - 18 05 17 085 04,94 24,40 122,00
=12,06
100 1206 515,28

**** Ecart-type : S ou σ
σ = √vu ►►► σ =√5,1528=02,27
***le coefficient de variation :
Objet : dans certaines situations, on désire comparer le taux de dispersion de distribution alors que
leur échelle de mesure respective n’est pas comparable, l’objectif du coefficient de variation est de
fournir un indice quantitatif permettant cette comparaison.
RESUME BIOSTATE 2020
Def ; note CV, correspond à l’écart-type de la distribution exprimer en % de la moyenne de la
distribution ;

CV= σ/ μ (100%)
******La Loi Normale :
-les propriétés de la loi normale utilisé pour les calculs des probabilités.
-cette loi utiliser dans l’analyse des données soit direct ou indirecte.
Les propriétés :
**Symétrique **tendance centrale (‫**)ﻣﯿﻞ ﻣﺮﻛﺰي‬forme de cloche
**Caractérisé par espérance (moyenne) et écart-type

X~ N (μ, σ) X suit une loi normale de paramétrer μ(mu) et σ sigma


***on dit que :
01-la distribution a centré son espérance (moyenne) μ = 0
02- la distribution est réduite σ = 1.
*calcul du z : z =(xi-m) /s
Tests d’hypothèses ; tests de conformité :
1-Mise en place de tests :
H0 =hypothèse nulle : μ = μ0
La moyenne calculer à partir d’échantillon = la moyenne Norme
H1 =hypothèse ≠ : μ ≠ μ0
2-détermination de la zone d’acceptation ;5%,10%,……….
3-H0 est vraie alors : N (μ0 ; σpop /√n)
4-Decision : si n > 30 [μ0-Zα* σpop /√n ; μ0+Zα* σpop /√n ] ………..01
si n < 30 σ connu ………….1
σ inconnu …………test de student
[μ0-tα* Sc/√n ; μ0+tα* Sc/√n ]
Sc : écart-type corrigé : √n/n-1 * σ z(calculer)= μ- μ0 / σ ou Sc /√n
La cote Z : s’interprété en affirmant que l’unité statistique a une valeurs de variable
étudiée qui se situe a Z écart-type au – dessus ou en dessous de la moyenne un moment
et un lieu donné Z > 0 ou Z < 0
RESUME BIOSTATE 2020
Représentation Graphique :
1- Histogramme :

1-titre des axes X et Y


2-titre d’histogramme le nombre de catégorie ne dépasse pas 7
3-l’échelle choisie -Secteur ou Camembert ou Pie-chart ……Eng
***détermination de la médiane par interpolation graphique :

***détermination du mode sur le graphe :


RESUME BIOSTATE 2020

Remarque 01 : L’étendu de la variation :


Différence entre la plus grande et la plus petite valeur de la distribution
Etendue de X = X max – X min
Remarque 02 :
Dans le cas ou l’exo demander de regrouper les données en classe, il suffit de calculer
L=E/C ; E : Etendue (max-min) ; C : Classe (nbre de classe )
Remarque 03 :
Le nombre de classe ne devrait être ni inf a 5 ni sup a 20 ;
Formule de Sturge : K = 1+(3.3 * log n).
a(amplitude) =E/K E= valeur max – valeur min k :nombre de classe
RESUME BIOSTATE 2020
Les commentaires du CV (coef de variation ; s/m*100 ) :
1-CV < 5 % :très homogène
2- 5 % < CV < 10% : homogène
3-10 % < CV < 15% : Moyennement homogène
4-15 % < CV < 30% : hétérogène
5- CV > 30% très : très hétérogène
Remarque 04 :
Effectif = fréquence absolue (ni) fa ////// fréquence relative (fi)= ni /N

*** Statistique descriptive bivarié :


Covariance : Cov (x,y) = Sxy =1/n ∑ (xi-m)(yi – y)
Coefficient de corrélation (r) : r = Cov (x,y) / Sx * Sy
r > 0 droite croissante
r < 0 droite décroissante
r = 0 il n y a pas de dépendance linéaire
-1 < r < 1 si r est proche de -1 ou 1 ,les variable x et y sont dits ; fortement corrélées
Droite de régression :
Y=ax+b
a = Cov (x, y) / S2X b = ӯ – a m (m ;moyenne de premier paramètre)

***Statistique inférentielles (test de comparaison) :


But : Les statistiques inférentielles, consistant en des tests permettant de confirmer ou infirmer une
hypothèse.

01-test de l’écart réduit (𝜀𝜀 ) (cas de grand échantillon ; n ≥ 30)


𝜀𝜀 = |m1-m2|/ √ (S2X1/n1 + S2X2/n2)
Pour α = 5% ------------la valeur constante = 1,96
Pour α = 1% ------------la valeur constante = 2,58
Pour α = 1‰ ------------la valeur constante = 3,29
Les diffèrent cas résultants :
Si 𝜀𝜀 > 1,96 ou 𝜀𝜀 =1,96 -------------différence significative
Si 𝜀𝜀 < 1,96 -------------différence non significative
Exemple :
Une étude est réservée sur deux échantillons de poussins issus de deux endroits différents. Les résultats sont les
suivants :
RESUME BIOSTATE 2020
Echantillon 1 Echantillon 2
n1= 50 n1= 50
m1 = 51g m2 = 45g
σ2 = 256 g2 σ2 = 144 g2
Ces poussins peuvent-ils appartenir à la même population au seuil de signification α = 5% ?
Solution
Ɛ = 2,12.
On a Ɛ > 1,96 La différence entre les deux échantillons est significative.
Conclusion
Les deux échantillons de poussins sont issus de deux populations différentes au seuil α = 5%.

02 -test t student (n < 30) But : C’est un test permet de compares deux distributions quantitatives.
Principe :
comparer la valeur de t calculé avec une valeur théorique (critique) selon deux critères ;
• Le seuil de signification
• Le dégréé de liberté (ddl = n1+n2-2)
Hypothèses
Hypothèse nulle (H0) : x1 = x2 ou l’existence d’une différence non significative entre
les deux moyennes
Hypothèse alternative (H1) : x1 ≠ x2 l’existence d’une différence significative entre les
deux moyennes

1 1
tcalculé= |m1-m2|/s�� + � S : écart-type. S= √S2X.
n1 n2

𝑆𝑆𝑥𝑥2 = ∑(𝑥𝑥𝑖𝑖1 -m1)+∑ (𝑥𝑥𝑖𝑖2 -m2)/n1+n2-2


La comparaison donne généralement 2 cas :
1- t calculé ≥ t critique il existe une différence significative
2- t calculé < t critique il existe une différence non significative
Exemple : Dans des études d’anesthésie, voulant comparer l’effet de deux somnifères, on a noté les durées de sommeil
qui ont suivi les injections d’une dose bien définie. Les durées étant en minutes :
Somnifère Durées du sommeil (minutes)
1 170 175 187 180 190 165 175 174 173 181
2 155 160 164 150 160 159 154 156 160 167 153 158
Les deux somnifères ont des effets différents ? (au seuil de signification α = 5%).
RESUME BIOSTATE 2020
Solution
m1 = 177,1 m2 = 158. S2X = 38,14 S = 6,18.

Alors tcalculé = 7,2

Nous devons maintenant chercher la valeur critique de t.

1) Au seuil α = 0,05 et d.d.l. = 10 + 12 - 2 = 20 c.-à-d. tcritique = 2,08.


On a tcalculé > tcritique Il existe une différence significative entre les deux somnifères ; acceptation de H1 et rejet
de H0.
Conclusion
Les deux somnifères ont des effets différents pour α = 0,05 ; le premier somnifère provoque une longue durée du
sommeil que le second.

3-Analyse de la variance a un critère de classification (facteur)(ANOVA)


C’est un test permet de cherchée et comparer la différence entre plusieurs échantillons
(moyennes) quantitatifs.
Ex : tester l’effet de 5 types d’engrais (T1, T2, T3, T4, T5) sur l’amélioration du
rendement

Randomisation T1 T3 T4
(Répartition
des traitements T2 T5 T2
en parcelles
T5 T4 T1
élémentaires)
T1 T2 T3
T4

Etape 1 : regrouper les données par traitements et calculer les totaux (Ti), les moyennes (mi) des
traitements et le total général
Rendement de blé (q/ha)
Traitements Rép1 Rép2 Rép3 Ti (total des traitements)
T1 29,00 28,00 29,00 86
T2 33,50 31,50 29,00 94
T3 26,50 30,00 56,50
T4 48,50 46,50 49,00 144
T5 34,50 31,00 65,50
Total générale (G) 446
Etape 2 : Dresser un tableau d’analyse de la variance
RESUME BIOSTATE 2020
Source de Dégrée de Somme des Carré moyenne Valeur calculée de (F *)
variation liberté (ddl) carrés (Variation)
(valeur de Fisher
CM= sc/ddl
snedecor)

Total N-1 SCT ---1 /


Factoriel * SCF ---2 CMF= CMF/CMR
(Traitement)
K-1 scf/k-1

Erreur N-K SCR= CMR = /


1-2 Scr/N-1
T : total /// F : factoriel /// R : résiduel
Principe de l’ANOVA : décomposé la variance totale en deux variances ;
1-la variance interclasse 2- la variance intra-classe (résiduelle)
Et on compare ces deux variances
Etape 3 :
Terme correctif (TC) = G2 /N ;(446)2/13 = 15301,23
SCT =
= [ (29)2+(28)2+……+(31)2] – 15301,23 = 789,27
SCF =
= [(86)2/3+(94)2/3+…………..]-15301,23=762,69
*SCR = SCT – SCF =789,27 – 762,69 = 26,58
Etape 4 : entrer les valeurs dans le tableau
Etape 5 : lire les valeurs de F sur le tableau par V1 et V2 ;
v1=t-1=4 /v2=n-t=8 /f=3,84 a 5% seuil de signification
Etape 6 : f calculé f tab------------------- traitement significative (s)
f calculé f tab------------------- traitement non significative (n s)
Tableau des blocs :
Source de variation ddl SC CM =SC/ddl F calculé
Total rt -1 SCT / /
Bloc r-1 SCB/nbr CMB CMB/CMR
Traitement t–1 SCF/nbr CMF CMF/CMR
Erreur (r-1)( t - 1) SCR CMR /
TC = G2 /rt SCR = SCT – SCB – SCF
** Comparaison d’un effectif observé a un effectif théorique (test khi-deux) (X2) :
C’est un test qui permet de chercher et de comparer la différence entre deux variables
qualitatives.
Principe : comparaison d’une valeur de x2 calculer par rapport à une autre valeur de
x2 théorique on fonction de dégrée de liberté (v)
V = (nbre de colonnes – 1) (nbre de lignes - 1)
Le test Khi-deux est noté par χ2 et donné par formule suivante:
RESUME BIOSTATE 2020
χ
2
calculé = Σ (Effectifs observési – effectif calculési)2 / effectif calculési ou χ2calculé = Σ (Oi - Ci)2 / Ci

Ex : résultat d’un traitement par deux médicaments (A, B) sur un échantillon de 200
patients.
Le nbre de sujets testés est de 100 malades pour chaque médicament

Fréquences observées
///// Guéris Non /////
Guéris
A 75 25 100

B 65 35 100

///// 140 60 /////


*** LES CALCULS ;
Ojk Ejk Ojk-Ejk (Ojk-Ejk)2/ Ejk
75 70 5 0,36
65 70 -5 0,36
25 30 -5 0,83
35 30 5 0,83
200 200 0 2,38
Ejk = (freq colonne * fréq ligne) /N
Fréquence théorique : 100*140/200 =70 -----------------1
Comparaison des résultats :
X2 calculé ≥ X2 théorique -------------------différence significative
Exemple

L’efficacité de deux traitement A et B a été testée vis-à-vis deux lots de 40 animaux,


l’un soumis à A et l’autre à B. les résultats sont les suivants :

Effectifs observés Succès Echec Total


Traitement A 17 23 40
Traitement B 25 15 40
Total 42 38 80

Testez l’efficacité de deux traitements au seuil α = 5%.


Solution
RESUME BIOSTATE 2020
Méthode de calcul des effectifs calculés

Effectif calculé de (17) = somme de ligne (40) × somme de la colonne (42) / la somme
totale (80) = 21

1/ Calculer les effectifs théoriques (appelés également attendus ou calculés)


Effectifs calculés Succès Echec Total
Traitement A 21 19 40
Traitement B 21 19 40
Total 42 38 80

On a χ2calculé = Σ (Oi - Ci)2 / Ci = (17-21)2/21 + ……..+(15-19)2/19 = 3,2.

5/ La valeur de χ2calculé doit être comparée à la valeur critique de Khi-deux (sur la table)
au seuil α = 0,05 : si χ2calculé est supérieur ou égale au χ2théorique, on considère la
différence significative.

Pour α = 0,05 et ddl = (2-1) × (2-1) = 1 on a χ2théorique = 3,84.

Conclusion
Les deux traitements ont la même efficacité au seuil α = 5%.

Vous aimerez peut-être aussi