Académique Documents
Professionnel Documents
Culture Documents
Hourra!!!!!!!!! .
Et maintenant quoi???
•Formulaire de rapport
de cas. • Sur papier •
Électronique
Les variables
•Questionnaires contiennent les valeurs des mesures
•Entretiens
• courrier
• téléphone
Intervalle
Quantitatif
Rapport
Qualitatif Ordinal
non quantifiées
– Pas d'équidistance •
Opérations valides :
– Juger l'égalité/la nonégalité
– Juger les relations supérieures/
inférieures
• Stade de la tumeur
pT • Notes scolaires
• Statut socioéconomique •
Attitudes ( données d'entrevue
typiques) : – « Dans quelle mesure
êtesvous d'accord ou en désaccord
avec les énoncés suivants ... »
Variables quantitatives
Échelle d'intervalle
• Échelle numérique –
Les valeurs variables sont
des nombres – Les unités
sont équidistantes • Le point
zéro est arbitraire • Opérations
valides : – Comme
précédemment – Plus : addition
et soustraction – (La
multiplication et la division
n'ont aucun sens.)
• Température en degrés
Celsius ou Fahrenheit
• Date calendaire
Échelle de rapport
• Échelle numérique
• Zéro absolu (naturel) •
Opérations valides : –
Comparaison, addition,
soustraction, multiplication,
division ... tout est permis !
Continu ou discret
Certaines variables discrètes
prennent un très grand nombre
de valeurs : – Consommation
de cigarettes tout au long de
la vie – Erythrocytes par μl de
sang En pratique, elles sont traitées
en continu.
Objectifs d'apprentissageSection 2
Description des données
Une ligne
par sujet
variables
Escalader
Catégorique
Coefficient de variation
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Tendance centrale
n
X
je
je= 1
X=
n
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Statistiques récapitulatives
n
Moyenne = X
je =1 = X
n
L'écart type (s) est une mesure de l'écart entre les individus et la
moyenne
n
xx je− )
2
( 1=
s =
je
n − 1
Grand écarttype = données très dispersées
Petit écarttype = il y a peu de variation par rapport à la moyenne
l. Chaque ensemble de données mesuré sur un intervalle ou un niveau de rapport a une moyenne.
4. La somme des écarts des nombres d'un ensemble de données par rapport à la moyenne est
zéro
5. La somme des écarts au carré des nombres d'un ensemble de données par
moyenne est une valeur minimale.
Moyenne géométrique
N
Pour les valeurs N :
N N
μgéo = xi = x 1 x2 xN
je=1
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Médian
La valeur numérique au milieu lorsque l'ensemble de
données est organisé dans l'ordre (50 % audessus,
50 % audessous)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Médiane = 3 Médiane = 3
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Trouver la médiane
L'emplacement de la médiane :
n1+
Position médiane = position dans les données ordonnées
2
n +1
Notez que n'est pas la valeur de la médiane, seulement la position de la
2
médiane dans les données classées
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Mode
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0123456
Aucun mode
Mode = 9
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Exemple d'examen :
Statistiques récapitulatives
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Mesures de la variabilité
Variation
Même centre,
Biostats_BCH_4088_Conférence
variation différente
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Gamme
Exemple:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Plage = 14 1 = 13
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Inconvénients de la gamme
7 8 9 10 11 12 7 8 9 10 11 12
Plage = 12 7 = 5 Plage = 12 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Plage = 5 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Plage = 120 1 = 119
quartiles
Les quartiles divisent les données classées en 4
segments avec un nombre égal de valeurs par segment
Q1 Q2 Q3
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
quartiles
(n = 9)
Q1 = est dans la position 0,25(9+1) = 2,5 des données
classées , utilisez donc la valeur à michemin entre les 2e et 3e valeurs,
donc Q1 = 12,5
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Gamme interquartile
Résumé à cinq chiffres – Boîte à moustaches
Exemple:
Médian X
X Q1 Q3 maximum
minimum (Q2)
25% 25% 25% 25%
12 30 45 57 70
Intervalle interquartile
= 57 – 30 = 27
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Gamme interquartile
Peut éliminer certains problèmes de valeurs aberrantes en utilisant l' intervalle interquartile
IQR = Q3 – Q1
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Écart démographique
Variance démographique :
N N
(x m)
je
− 2
(x m)
je
−
2
n
je
je=1 2 je=1
2p = (simple) ou p = (pondéré)
N N
Où m = moyenne de la population
N = taille de la population
Écart d'échantillon
Moyenne (approximativement) des écarts au carré des valeurs par rapport à la moyenne
Écart d'échantillon :
n n
(xx)je
− 2
(xx)
je
− 2
n
je
2s
= je=1
(simple) ou s =
2 je=1
(pondéré)
n1 n1
Où X = moyenne arithmétique
n = taille de l'échantillon
Écarttype de la population
Écarttype de la population :
N N
(x m)
je
− 2
(x m)
je
−
2
n
je
je=1 je=1
p = (simple) ou p = (pondéré)
N N
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
n n
(xx)
je
−
2
(xx)
je
−
2
n
je
je= 1 je= 1
s= (simple) ou s = (pondéré)
n1 n1
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Exemple de calcul :
Ecart type de l'échantillon
Goûter
Données (xi ) : 10 12 14 15 17 18 18 24
n=8 Moyenne = x = 16
2 2 2 2
(10 X)−(12
+ −X)
+− ++
(14 X)−n 1 (24 fois)
s =
−
− 2 2 2 2
= (10 16) (12 16) + − 16) 8 1
(14 +− ++− (24 16)
−
Écart de mesure
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Données A
Moyenne = 15,5 s =
11 12 13 14 15 16 17 18 19 20 21 3,338
Données B
Moyenne = 15,5
11 12 13 14 15 16 17 18 19 20 21 s = 0,926
Données C
Moyenne = 15,5
11 12 13 14 15 16 17 18 19 20 21 s = 4,570
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Coefficient de variation
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Comparer le coefficient
de variation
Stock A :
s 5
CVB = 100% = =
100% 5%
X $ 100 $
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
catégoriel _
Escalader
Survécu?
Survécu
Moyenne 49,4
Médian 26
Écarttype 68,7
Gamme interquartile 46,6 0
Le minimum 512,33
Maximum Décédé 23,4 10,5 34,2 18,2 0 263
a) Y atil une grande différence dans le prix moyen des billets par groupe ?
Graphiquement et tableaux
• Description numérique
– Tableaux de
fréquences • Fréquences
absolues • Fréquences relatives
– Seule mesure de localisation : mode •
Graphique
Diagramme à barres
Camemberts
fi' : la fréquence
Les fréquences absolues sont absolue fi divisée
respectivement de 500, 100 et 400 par le total n est un meilleur
pour les patients atteints de paludisme, comparateur.
diabétiques et tuberculeux.
patients tuberculeux
les tables
• Utile en particulier pour
représenter des variables
catégorielles
Graphiques circulaires
exprimées en centiles et
totaliser 100 %.
Graphiques à barres et
linéaires • Utilisés pour démontrer la relation entre
deux variables.
Graphiques linéaires
Histogrammes
L'axe X est un
quantitatif
Boîtes à moustaches
80
70
60
50
40
partition
lecture
de
30
20
N= 47 95 58
SES
Nuages de points
Représente la
relation d'une
variable
quantitative avec
une autre variable
quantitative .
Faire attention
montrer ?
• Comment puis je le
faire ?
Échantillons vs population
Rappel rapide1
• Distribution asymétrique
vers la gauche
Ou
• Inclinaison négative
• Distribution asymétrique
vers la droite
Ou
• Inclinaison positive
leur valeur.
• Utilisé pour dériver des intervalles de confiance et des valeurs p pour tester
Hypothèse
• Les méthodes statistiques pour les proportions et les taux sont basées sur
des approximations à partir de distributions normales
La distribution normale
• Unimodal
• Moyenne au centre
• Basé sur le
nombre
d'observations
d'écartstypes par
rapport à la moyenne
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Supérieur
Inférieur
Largeur de
l'intervalle de confiance
N>=30
SI vous tirez plusieurs fois un échantillon de la population d'intérêt et calculez la moyenne des
caractéristiques de cet échantillon à chaque fois, la distribution résultante des différentes moyennes
est appelée la distribution d'échantillon de la
moyenne
Cependant, les moyennes que vous obtenez après chaque processus d'échantillonnage ne
correspondent pas toujours exactement à la moyenne de la population. Il y a donc un écart type
d'une moyenne à l'autre qui est l'erreur d'échantillonnage dans le processus.
L'erreur d'échantillonnage =
Intervalles de confiance
Pour les
échantillons (<30)
Biostats_BCH_4088_Conférence 4_5_6_7_Dr. Akindeh
Machine Translated by Google
np≥5
Et
nq≥5
Biostats_BCH_4088_Conférence
4_5_6_7_Dr. Akindeh
Machine Translated by Google
Étape 1 : Soustrayez 1 de la taille de votre échantillon. 10 1 = 9. Cela vous donne des degrés
de liberté, dont vous aurez besoin à l'étape 3.
Étape 3 :
Recherchez vos
réponses aux
étapes 1 et 2 dans
le tableau de
distribution t . Pour
9 degrés de liberté
(df) et α = 0,025,
mon résultat est
2,262.
Biostats_BCH_4088_Conférence 4_5_6_7_Dr. Akindeh
Machine Translated by Google
x ± z* σ / (√n)
(1 – .95) / 2 = .025
Étape 2 : Soustrayez
votre résultat de l'étape 1
de 1, puis regardez cette
zone au milieu de la table
z pour obtenir le score z :
1 – 0,025 = 0,975 score z
= 1,96.
MERCI ET RENDEZ
VOUS aux conférences
8 et 9.