Vous êtes sur la page 1sur 5

TRAVAUX PRACTIQUES 5 – Microsoft Excel

Objectifs d'apprentissage:
Les statistiques descriptives pour une variable, respectivement pour deux variables et l'interprétation des résultats
(exercice 1, 2,3)

Exercice 1
Créez un nouveau fichier Excel nommé Excel5 et l'enregistrez dans le dossier nommé Excel (trouve dans votre partition).
Renommez la première feuille de calcul « Cholestérol » et introduisez les données suivantes qui représentent le niveau du
cholestérol avant et après l'adoption d'un régime végétarien:

a. Dans la colonne Avant-Apres calculez la différence entre les deux niveaux du cholestérol (avant et après l'adoption
d'un régime végétarien).
b. Triez les données du tableau ascendant, choisissant la colonne de l’Age comme première clé et la colonne nomme
Avant-Apres comme seconde clé.
Conseils:
Pour trier des donnes, sélectionnez tous le tableau, choisissez l’option DATA-SORT puis choisissez l'âge comme première clé
et la colonne Avant-Après comme deuxième clé :
c. Calculez la moyenne arithmétique, le minimum le et maximum pour le niveau du cholestérol avant et après l'adoption
d'un régime végétarien, respectivement pour la colonne qui contient les différences du cholestérol.

Conseils:
Créez le tableau suivant (en bas du tableau avec les valeurs du cholestérol)
Cholesterol avant Cholesterol après Differences
Moyenne arithmétique
Min
Max

!!!!!Pour remplir ce tableau utilisez les fonctions suivantes :


AVERAGE –pour calculer la moyenne arithmétique : choisissez le menu INSERT-FUNCTIONS-ALL

Faites la même chose pour calculer les moyennes arithmétiques pour le niveau du cholestérol après et pour les différences entre
les deux niveaux du cholestérol. MIN pour obtenir la valeur minimale, MAX pour calculer la valeur maximale

1
Exercice 2
On considère l'ensemble des données dans le tableau suivant, qui représentent les paramètres biomédicaux pour 19 patients
(nourrissons): pression artérielle systolique (TAS), la pression sanguine diastolique (TAD), âge, taille, poids, score Apgar,
l'âge gestationnel, le sexe (M = masculin, F = féminin).

TAS TAD Age Taille (cm) Poids (gr) Apgar Age gestationnel (semaines) Sexe
(mmHg) (mmHg) (jours) score (M/F)
180 80 43 55 5500 10 40 M
170 70 67 52 4100 9 39 M
175 100 28 56 3700 8 38 F
120 50 49 53 5200 10 41 M
110 65 21 61 4200 9 41 M
140 70 54 50 2800 6 30 F
110 85 72 55 4300 9 36 M
130 95 80 60 4200 9 35 F
140 105 43 51 4900 10 38 F
135 50 51 56 4400 9 37 F
120 55 21 52 5400 10 39 F
100 60 35 55 5600 10 39 M
140 90 34 54 5100 9 36 M
130 75 56 56 5200 10 38 F
160 80 78 59 4000 8 37 M
170 90 45 56 3800 9 39 F
165 85 32 52 4500 10 40 F
150 65 54 49 4200 7 37 M
155 70 76 55 4900 9 38 F

a. Copiez ce tableau sur le deuxième page de calcul du fichier nomme Excel5


b. Copiez le tableau suivant en troisième page de même fichier
Variables Types des variables
TAS
TAD
Age
Taille
Poids
Score Apgar
Age Gestationnel
Sexe
c. Déterminez le type de chaque variable

Conseils pour le point c :


Définition : une variable est une caractéristique qui peut prendre plusieurs des valeurs d’un ensemble d’observations possibles.
Nous travaillons avec deux types des variables : quantitative et qualitative. Chacun de ses types se subdivise en catégories
plus fines :
Variables qualitatives :
Définition : les variables qualitatives contiennent des valeurs qui expriment une qualité.
Elles peuvent être :
 Dichotomiques (qui ont deux catégories) : sexe (M, F), R (positif, négatif), etc.;
 Ordinales (désigne le rang ou la préférence) : le degré de gravité d'une maladie, le score apgar, etc.
 Nominales (ont plusieurs catégories qui ne peuvent être classés) : le nom de personnes, la couleur, etc.
Variables quantitatives :
Par opposition aux précédents, les variables quantitatives contiennent des valeurs mesurables.
Elles peuvent être :
1. Discrètes : nombre de patients, le nombre de personnes, etc. ;
2. Continues : la pression artérielle systolique, la température, etc. ;
d. Calculez les mesures de tendance centrale, l'emplacement et la diffusion (dispersion) utilisant les fonctions statistiques
d'Excel. Interprétez les résultats.

Conseils
Les mesures de tendance centrale sont les suivants: la moyenne, la médiane, le mode, la moyenne géométrique, la moyenne
harmonique, la valeur la centrale ( voir le tableau ci-dessous)
Les mesures de l'emplacement sont: les quartiles, les percentiles, les déciles
Les mesures de dispersion: la variance, l’écart type, le coefficient de variation, l’asymétrie, le coefficient d'aplatissement
2
!!!!!!Pour résoudre le point c. vous pouvez créer un tableau similaire avec le modèle suivant (Attention, les cellules marquées
avec le X doivent être calculé en utilisant les formules Excel. Pour ces mesures vous avez aussi un tableau avec la
signification statistique):

Dans la cellule correspondant à la moyenne arithmétique de la TAS mettez la fonction AVERAGE(MOYENNE): du menu
Insert→ Fonction :

Pour éviter de récrire la même formule pour les prochaines variables, sélectionnez la première cellule contenant la
formule et les cellules qui répondent aux variables suivantes et choisissez l’option : EDIT-FILL-RIGHT
Dans le même mode sera calculés les prochaines fonctions: médiane, mode, VAR, écart_type, AVEDEV, DEVSEQ,
KURT, Max, Min, SKEW.
!!!!!Pour le cœfficient de variation appliquez la formule mathématique :=déviation standard/moyenne arithmétique
Pour les quartiles complétez le tableau suivant comme dans l'image suivante:

Array est le tableau ou la plage de cellules pour laquelle vous voulez obtenir la valeur du quartile.
Quart indique l’ordre du quartile.

Si l’ordre du quartile est égal QUARTILES retourne


0 La valeur minimale
1 Premier quartile (25ème percentile)
2 Valeur médiane (50eme percentile)
3 Troisième quartile (75e percentile)
4 La valeur maximale

3
Interprétation de résultats :
Mean La moyenne arithmétique de la TAS pour 19 patients inclus dans l'étude était
égale à 142.105.
Median Est un nombre qui divise en deux parties l’échantillon tel que chaque partie
contient le même nombre de valeurs
Mode Ou la valeur dominante désigne la valeur la plus représente d’une variable
Standard deviation Mesure la dispersion d’une série de valeurs autour de leur moyenne

Variance Est une mesure arbitraire utilise pour caractériser la dispersion d’une série de
valeurs
Kurtosis =coefficient Mesure si sa distribution est centree autour de sa moyenne ou au contraire
d’aplatissement etallee. Un coefficient d'aplatissement positif correspond à une distribution
pointue et un excès d'aplatissement négatif à une distribution aplatie. Si la valeur
appartient à l'intervalle [-1, 1] pourrait être considéré que les données suivent une
distribution normale.
Skewness =cœfficient de Mesure l’asymétrie de la densité de probabilité d’une variable aléatoire
dissymétrie Un coefficient positif indique que la queue de droite (a valeurs hautes) est plus
longue ou grosse
Un coefficient négatif indique une distribution étalée vers la droite et donc queue
de distribution étalée vers la gauche ;
Si la valeur appartient à l'intervalle [-1, 1] pourrait être considéré que les données
suivent une distribution normale.
Coefficient of variation Est une mesure de la dispersion
Si CV <10% la population peut être considérée comme homogène;
Si CV est comprise entre 10% -20% la population peut être considérée comme
relativement homogène;
Si CV est entre 20% à 30% la population peut être considérée comme
relativement hétérogène;
Si CV> 30% la population peut être considérée comme hétérogène.
Quartile Est chacune des 3 valeurs qui divisent les donnes triées en 4 parts égales, de sorte
chaque partie représente ¼ de l’échantillon.

e. Calculez les statistiques descriptives pour toutes les variables quantitatives (à l'aide de Data Analysis) et
interprétez les résultats.

Conseils
Pour résoudre le point d. utilise l’option TOOLS-DATA ANALYSIS
Si l’option Data Analysis n'apparaît pas dans le menu Tools(Outils), cliquez sur l’option Add-ins dans le menu Tools
pour obtenir la boîte de dialogue représentée ci-dessous:

 Puis cliquez sur OK. Au bas du menu Tools est affichée l’option Data Analysis.
 Dans le Data Analysis boîte de dialogue, sélectionnez la statistique descriptive et cliquez sur OK.
 Pour calculer les statistiques descriptives des paramètres pour la TAS, TAD, l'âge, les poids et la taille, remplissez la
boîte de dialogue comme indiqué ci-dessous:

4
Observations :

1. Input Range: Introduisez les références de cellules qui doivent être analyser.La référence doit être composé de deux
ou plus adjacent plages de données organisées sous forme de colonnes ou des lignes. Dans notre cas: A1: E20.

2. Grouped By : indique si les données introduites sont organisées en lignes ou en colonnes.

3. Labels in First Row/Labels in First Column (Labels en première file / Labels dans la première colonne) : Si la
première ligne de votre plage d'entrée contient des étiquettes, sélectionnez les « Labels in First Row ». Lorsque les
étiquettes sont dans la première colonne de votre plage d'entrée, sélectionnez « Labels in First Column »

4. Kth Largest (K-eme plus grande) : Sélectionnez si vous souhaitez inclure une ligne dans le tableau de sortie pour le
K-eme plus grande valeur pour chaque série de données. Dans la zone, entrez le numéro à utiliser pour k. Si vous
entrez 1, cette ligne contient le maximum de l'ensemble des données.

5. Kth Smallest (Plus petit K-eme) : Sélectionnez si vous souhaitez inclure une ligne dans le tableau de sortie pour le
K-eme plus petite valeur possible pour chaque gamme de données. Dans la zone, entrez le numéro à utiliser pour k. Si
vous entrez 1, cette ligne contient le minimum de l'ensemble des données.

6. Output Range (Plage de sortie) : Entrez la référence de la cellule ou vous voulez le résultat

7. New Worksheet Ply (Nouvelle feuille) : vous donne les résultats dans une nouvelle feuille. Pour nommer la nouvelle
feuille de calcul, tapez un nom dans la boîte.

8. New Workbook (Nouveau fichier d’Excel) : vous donne les résultats dans un nouveau fichier d’Excel

9. Summary statistics (Sommaire des statistiques) : vous donne les paramètres statistiques principaux pour chaque
variable analyse.

Les résultats obtenus pour notre exemple sont indiqués dans l'image ci-dessous:

Vous aimerez peut-être aussi