Vous êtes sur la page 1sur 21

Pr.

Ahmed Tadlaoui Ouafi

Licence Science et Techniques Bio-Analyses


Filière Ingénieurs Industrie et Sécurité des Aliments - 1

Module de Biostatistique

1
Pr. Ahmed Tadlaoui Ouafi

Module de Biostatistique

Filière Ingénieurs : Industrie et Sécurité des Aliments – 1


*Epreuve écrite 75%
*Contrôle continue (TD) 15%
*Appréciation 10%
* Validation Note ≥ 12/20
* Pas de compensation si note < 8 (Réinscription)

Filière Licence : Science et Techniques Bio-Analyses


*Epreuve écrite 65%
*Epreuve sur machine (TP) 20%
*Contrôle continue (TD) 15%
* Validation Note ≥ 10/20
* Rattrapage si 5 ≤ Note < 10 (pas de rattrap. si < 5)
* Réinscription si Note définitive< 7 (sauf dérogation RG 10)

2
Pr. Ahmed Tadlaoui Ouafi

Module de Biostatistique

Filière Ingénieurs : Industrie et Sécurité des Aliments – 1


Filière Licence : Science et Techniques Bio-Analyses

Logiciels sur PC
*Excel (Windows)
*SPSS Statistical Package for Social Sciences (Windows)
*R (langage…)

3
Pr. Ahmed Tadlaoui Ouafi
LST Bio-Analyses - ISA -1
La Statistique
Certaines définitions de la Statistique qui peut être considérée comme :
 Une branche des mathématiques appliquées aux données d’observation . . . La statistique
peut être considérée comme la science de :
(i) l’étude des populations,
(ii) l’étude de la variation,
(iii) l’étude des méthodes de réduction des données. Fisher [1950] •
 La méthode scientifique qui traite les données obtenues en mesurant les propriétés des
phénomènes naturels des populations de. Kendall et Stuart [1963] •
 La science et l’art de traiter la variation de manière à obtenir des résultats
fiables Mainland [1963] •
 La science qui porte sur le processus inférentiel par la planification et l’analyse
d’expériences ou d’enquêtes, et sur la nature des erreurs d’observation et des sources
de variabilité qui brouillent les modèles sous-jacents, et par la synthèse efficace des
ensembles de données. Kruskal [1968] •
 « Statistiques = Incertitude et comportement ». Savage [ 1968)
 . ". . . l’objet principal des statistiques est de faire une inférence sur la probabilité
d’événements à partir de leurs fréquences observées. Von Mises [1957]

 La technologie de la méthode scientifique. » Humeur [1950]

 Il n’y a manifestement pas de consensus complet dans les définitions des statistiques.
Mais certains éléments réapparaissent dans toutes les définitions : Variation,
Incertitude, Inférence, Science.

4
Pr. Ahmed Tadlaoui Ouafi
LST Bio-Analyses / ISA -1
La Statistique selon Wikipédia : Une Bonne lecture
https://fr.wikipedia.org/wiki/Statistique
La statistique est la discipline qui étudie des phénomènes à travers la collecte de données, leur
traitement, leur analyse, l'interprétation des résultats et leur présentation afin de rendre ces données
compréhensibles par tous. C'est à la fois une branche des mathématiques appliquées1, une méthode et
un ensemble de techniques.

Remarquons que la statistique est parfois notée2 « la Statistique » (avec une majuscule), ce qui permet
de différencier ses applications mathématiques avec une statistique (avec une minuscule). Le pluriel
est également souvent utilisé3 pour la désigner : « les statistiques », cela permet de montrer la
diversité de cette science.

La statistique est un domaine des mathématiques et de plus en plus, elle fait partie de ce que l'on
appelle aujourd'hui la science des données (en anglais : Data Science). L'analyse applique des lois
mathématiques plus générales (ensembles, groupes, inclusion, exclusion). Elle possède une composante
théorique ainsi qu'une composante appliquée. La composante théorique s'appuie sur la théorie des
probabilités et forme avec cette dernière, l'analyse de phénomènes aléatoires. La statistique
appliquée est utilisée dans presque tous les domaines de l'activité humaine : Ingénierie ( ex.
agroalimentaire), Biologie (épidémiologie ; Agronomie ; Ressources génétiques )
,management, économie, informatique, la physique (fondamentaux de la physique quantique, par
exemple).

La statistique utilise des règles et des méthodes sur la collecte des données, pour que celles-ci puissent
être correctement interprétées, souvent comme composante d'une aide à la décision. Le statisticien a
pour profession la mise au point d'outils statistiques, dans le secteur privé ou le secteur public, et leur
5
exploitation généralement dans un domaine d'expertise.
Pr. Ahmed Tadlaoui Ouafi
LST Bio-Analyses / ISA -1
La Biostatistique
http://www.info.univ-
angers.fr/~gh/Datasets/datasets.htm

RÉSUMÉ : La Bio-statistique est l’application de la statistique ou méthodes


statistiques aux données (Data) biologiques.

Le domaine de la statistique peut être décomposé en 2 parties


fondamentales: Descriptive (exploratoire) et Inférentielle (confirmatoires).

I - Les méthodes statistiques descriptives sont couramment utilisées pour


Catégoriser (sensibles /resistants …..), Afficher (Représenter par des
courbes, digrammes ….) et Résumer (Réduire : % ; moyennes ….) les
données.
(voir tronc commun : Semestre 1 à 4)

II- Les méthodes statistiques inférentielles peuvent être utilisées pour


faire des prédictions basées sur un échantillon obtenu à partir d’une
population ou d’un grand nombre d’informations. Ce sont ces inférences qui
sont utilisées pour effectuer des tests d’hypothèses en recherche
scientifique.
6
Pr. Ahmed Tadlaoui Ouafi
LST Bio-Analyses / ISA-1

Traitement des Données (Data Analysis)

II- Statistique Inférentielle (prendre


I- Statistique des décisions : Décisionnelle)
Descriptive (décrire)

7
Pr. Ahmed Tadlaoui Ouafi
LST Bio-Analyses ISA -1

Si La statistique peut donc être considérée, dans sa partie descriptive,


comme la science de collecte et de représentation de données,

Question : origine de ces données ?

La collecte des données peut provenir:


- d’étude d’observations (questionnaire ; enquête ; sondage..) où on observe
une réponse spécifique à une variable pour chaque unité statistique
(individu ou objet)
ou
- d’études expérimentales où on recherche l’effet de certaines conditions ou
Facteurs sur les individus ou objet de l’échantillon
8
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses ISA- 1

Après la collecte des données : besoin de les organiser !!!!!

Pratique de la Statistique avec Excel et SPSS

I- Base de Données

Saisie des données et Création de variables

9
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses

I- Excel est un logiciel de la famille des Tableurs, il permet de


faire des représentations graphiques, des calculs et des analyses
statistiques

II - SPSS (Statistical Package for Social Sciences) est un logiciel


de statistiques très utilisé par la communauté scientifique.

III- Statistica, SAS, R ………

10
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses
Création de variables et saisie des données

I- Constitution d’une base de données sur Excel : Exemple de données


propres à la LST-BA/ISA avec des variables de différentes natures

II – Création des mêmes variables sur SPSS ou transfert des données


d’Excel vers SPSS

Variables : Nom ; Prénom, adresse, e-mail, Tél; Ville ou Région d’origine,


Filière, Sexe; Taille, Poids; IMC ; IMC_Catégorie ; Date de naissance,
Age, Vaccination COVID, Bourse d’études; Fratrie; Appartenance
politique, Revenu des parents, groupe sanguins, analyses sanguines (TSH .
Glucose, etc……..
11
Variable chaine de caractères
( variable alphanumérique (non numérique) : nom , prénom , mail, adresse , tél ……) Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses Variable qualitative


à plusieurs modalités Variable qualitative Variable quantitative
binaire continu

Excel : Base de données _LSTBA


Variable quantitative
discontinu
Ex : nombre frères & soeurs

Variable qualitative
ordinale Variable Date

Variable quantitative transformée


Continue (nombre de cas possible très grand)

12
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses
• Sur Excel, il existe plusieurs possibilités de calcul et de création de
variables à partir de celle existantes grâce à fx

Création d’une variable


Quantitative à partir de
2 Var. quantitatives:

IMC= Poids/taille 2

Création d’une variable Qualitative à partir d’une quantitative


=SI(I2<18,5;"IP";SI(I2<24,99;"N";SI(I2<29,99;"SP";"OB"))) 13
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses
SPSS : Base de données _LSTBA

1-Définir la Variable

14
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses

Interface SPSS : - Chaque Colonne est une variable distincte


- Chaque Ligne constitue l’ensemble des observations
(des variables) pour une unité statistique
(étudiant dans notre exemple de BD_LSTBA)

Vecteur d’observations sur une variable

Vecteur d’observations sur un individu

15
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses

6 7 11
1 2 3 4 5 8 9 10

1-Donner un nom succinct à la variable) Lorsque vous nommerez vos variables, évitez
les caractères spéciaux du genre #, $, !..., (leur usage pouvant être réservé pour
SPSS), et les espaces (on peut lier les deux parties du nom par un petit tiret « _ »

16
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses
1-Donner un nom succinct à la 2-Définir le type de la variable :
variable) Lorsque vous nommerez vos -Numérique (nombre) : permet de
variables, évitez les caractères faire des calculs et des analyses
spéciaux du genre #, $, !..., (leur -Date : format date
usage pouvant être réservé pour -chaine : pouvant contenir des lettres
SPSS), et les espaces (on peut lier et des chiffres (dite Alphanumérique
les deux parties du nom par un petit ne permet pas de faire des calculs)
tiret « _ »

3-Largeur : La largeur de la variable 4-Décimales : nombre de


indique le nombre de positions occupées décimales désirées
par les valeurs prises par cette variable
ou nombre de caractères maximum de la
donnée : Par exemple pour une variable
5-Libellé : Champs pour une
meilleure description de la variable
concernant l’âge prendre comme largeur
(caractères permis)
3 car aucune personne ne peut dépasser
999 ans. Pour une variable nom de
famille prendre jusqu'à 40 par exemple.
Attention à ne pas prendre des largeurs 6- Valeurs : Définir les valeurs
inutilement élevées car SPSS va codes Codification de la variable si
réserver une grande mémoire pour la elle est qualitative.
variable ; ce qui va contribuer à alourdir
le fichier
7-Alignemnent : Permet
de spécifier l’alignement
17
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses
9-Colonnes : Pour spécifier le nombre
8-Manquantes : Pour spécifier s’il de caractères définissant la largeur de la
existe des valeurs manquantes dans la variable en question
Banque de Données. Ceci permet
d’affecter une valeur aux individus
statistiques qui n’en ont pas. Par exemple,
pour la variable âge prendre comme
10 - Mesure : Pour spécifier le nature

système manquant le chiffre "999". de la variable mesurée:


Attention :On doit s’assurer que la valeur - Echelle parfois appelé numérique
choisie ne peut en aucun cas se confondre (Quantitative)
à une vraie valeur qu’un individu a donnée - Ordinale (Qualitative avec ordre )
comme réponse. Par exemple pour âge on - Nominale (Qualitative sans ordre)
ne peut pas prendre 99 comme système
manquant car une personne peut avoir "99"
ans. Pour le genre (sexe) coder en 1 =
« féminin" et 2 = " Masculin" on peut 11-Rôle : variable indépendante
prendre 9 comme système manquant. (entrée) ou dépendante (cible) pour les
futurs analyses

18
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses

2-Définir le type de la variable (par défaut c’est numérique)


1-Numérique (nombre) = variables avec des nombres, servant pour des calculs
2-Date (format date)
3-alphanumérique ou chaine (texte) = variables avec nombre et/ou lettres, ne servant pas pour
les calculs

- Dollar = Variable numérique suivi du signe dollars


- Symbole monétaire = Variable numérique suivi du signe monétaire
- Point: Variable numérique affiché avec des virgules toutes les 3 positions et le point
servant de décimales
- virgules : Variable affiché avec des points toutes les 3 positions et la virgule servant de
décimales
- Notation scientifique Variable numérique avec des exposants (E)

19
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses 6-Définir les valeurs la variable : Codification pour


les variables de type qualitative avec des nombres (SPSS
travaille beaucoup plus avec des nombres)

20
Pr. Ahmed Tadlaoui Ouafi

LST Bio-Analyses

10- Mesure :Pour spécifier le nature de la variable mesurée:


- Echelle (Quantitative - Mesurable- (parfois appelée numérique)
- Ordinale (Qualitative – Repérable avec ordre)
- Nominale (Qualitative – Repérable sans ordre)

Il est important de noter que La spécification de la variable a des


conséquences sur les analyses

21

Vous aimerez peut-être aussi