Vous êtes sur la page 1sur 31

2. L’usage de la statistique.

La «fameuse» p

Javier Quesada
Faites un Allez sur le
Pensez à une
design qui terrain pour
question
répond à prendre les
intéressante
votre question données
(OBJECTIF)

Analyse les données


et évaluer vos
résultats
NON
Vos résultats sont-ils
Peut-être ... vous
Reformulez fiables?
avez fait une
votre design
mauvaise (Ex. avez-vous assez
expérimentale
conception ... d’échantillons? ...)

Oui!!!…
Pensez à une
question Hypothèse (Objectif-Idée général)
intéressante
Prédiction: dérivé de l’hypothèse
(OBJECTIF) (sélection de variables)

Faites un -Minimisation de l’erreur


design qui - Pseudo-replicación
répond à - Controle des variables secondaires
votre - Contrôles
question - Pensez au statistique

Allez sur le
terrain pour - Expérience pilot
prendre les
données
… et après…
Analysez les données
et évaluer vos
résultats

NOUS DEVONS
CHOISIR
L’ANALYSE!!!…
Analyse
statistique!!!...
De quoi dépends l’analyse final a choisir?....

1. De notre Descriptive, relations,


prédiction différences

2. De nos Numériques, catégoriques, etc…


variables (type
et distribution)
Distribution normal, binomial,
etc…

3. De les conditions Paramétriques


statistiques
Non paramétriques
1. Type de prédiction

• Statistique descriptive

• Statistique pour voire des différences entre deux ou


plusieurs groupes de données

• Statistique pour voire des relations entre variables

• Statistique pour voir des patrons et résumer des


groupes de variables (ANALYSES MULTIVARIANTE).
2. Variables
C'est tout ce qui varie selon les individus de notre
population et qui peut être mesurés où classifié.
De cette façon, vous pouvez donner un «nom» qu’on
peut mesurer des concepts de l’hypothese (condition
physique, le sexe, la pollution, couleur, taille ...)

C'est la base pour faire des statistiques.

C’est très important que la variable que nous


choisissons soit indicateur du concept que
nous voulons mesurer (productivité=>nr.fruits).
2.1 Types de variables
quantitatives:
Variables Continues

Elles ont des valeurs infinies entre deux points


(celles qu’ont décimales)
Histogram of CPIT
45
40
35
30

No of obs
Poids: 19,87 gr 25
20

Aile =45,8 15
10

Saturation couleur= 5
0
24,5678… 7,10
9,57
12,03 16,97 21,90 26,84 31,77 36,71
14,50 19,44 24,37 29,30 34,24
CPIT
2.1 Types de Variables
Variable discrète

Elles on des valeurs déterminés entre deux points


(celles qu’ont nombre entières)
Histogram of nºous
100

Nº. Exemplaires: 80

(0,1,2,3… 23.459) No of obs 60

Oeuf dans nid: 40

3,4,5,6…. 20

0
2 3 4 5 6 7 8 9 10

nºous
2.2 Types de variables
qualitatives:
Variables catégoriques

Ce sont des valeurs sans ordre, des «catégories


naturelles», que nous ne pouvons pas les changer

Si-Non, presence-absence
Sexe: Male-Femelle
Couleur: vert, rouge, bleu…
Localité: Rabat, Larache,
Casablanca…
2.1. Types de variables
Variable rankerized où semiquantitative

Une variable qui a une valeur quantitative même si


l'ampleur exacte n'a pas d'importance

Catégorisation var. quantitatives:

- Taille: 1,2 3
- Muscle pectoral >1500

Categ. Altura
1001-1500

- Hauteur 501-1000

- Couleur 0-500

0 5 10 15 20 25
Nr de encuentros positivos

DISTR. OBSERVADA DISTR. ESPERADA


2.1 Types de variables
Variable «dérivée»

Les variables sont dérivés à partir de la combinaison


des autres 14

12

Pourcentages 10

No of obs 8
Indexes 6

Ratios 4

0
0 10 20 30 40 50 60 70 80 90 100
% machos con viruela
2.2 Distribution
C’est la façon dont laquelle les donnees sont
réparties tout au long de la variable.
Les différentes variables proviennent des
distributions différentes. Elles sont très
importantes, car ces distributions nous
informent:

De patrons biologiques

Du type d’analyse à considérer


2.2 Types de distributions
Distribution Binomial

La fréquence est typique avec deux résultats


possibles (SI-NO, mâle-femelle)
Valeurs discrètes

% de males en un nid
Predated, Non-predated
Presencia-absencia
2.2. Types de distributions
Distribution de Poisson
Ce sont des fréquences typiques
variables dans le temps ou dans
l’espace
Valeurs discrètes 28

24

Exemples: 20

16

No of obs
Abondance des oiseaux au 12
l’espace 8

Latence en la réponse sur 4

un prédateur 0
0 1 2 3 4 5 6 7 8 9 10 11
ABUNDÀNCIA Passer Domesticus en BCN
2.2 Types de distributions
Distribution Normale

C'est la plus importante parce que de nombreuses


analyses supposent que les variables suivent cette
fréquence
Histogram of nºous
100

Des valeurs continues


(discretes) 80

60

No of obs

Est décrite par la 40

moyenne et la variance 20

0
2 3 4 5 6 7 8 9 10

nºous
Types de distributions
D’autres distributions

- Student
- Chi square
- Binomiale negative
- hypergeometrique
- Gamma
- Rectangulaire
3. Les conditions statistiques

Une des classifications basiques dans la


statistique est basée sur si les données de notre
analyse (descriptifs, des différences ou des
relations) accomplissent certains conditions

Statistique Paramétrique

Statistique Non-Paramétrique
Statistique Paramétrique

- Les variables doivent suivre une distribution


particulière (Normale, binomiale)

-Les données sont indépendantes

- Homoscédasticité (analyse des différences)

- Basé sur des relations linéaires (analyse val.)

Ils sont très robustes et exigeant

S'il n'est pas accomplie quelque notion nous devons


faire l’analyses NON-PARAMETRIQUE (l'équivalent)
Statistique NON Paramétrique

- Les variables NE doivent pas suivre une


distribution particulière

- C'est l'alternative lorsque les hypothèses


paramétriques sont remplies

- Ils sont un peu plus conservateur (+ problèmes


faire une erreur.)
Nous avons dit que si les conditions statistiques
ne s’accomplissent nous devons faire la
statistique NON-paramétrique….

Oui, mais pas toujours ...

Si la condition n'est pas accomplie (normalité), nous


pouvons transformer la variable dep. et «la
normaliser» ...
Transformation de variables

Ils aident que notre variable ressemble à une


distribution normale et ne pas utiliser la non-
paramétrique
Exemple:

V.D = couverture V.D’ = log (couverture+1)


10
10
9
9

8
8

7
7

6 6
No of obs

No of obs
5 5

4 4

3 3

2 2

1 1

0 0
10 15 20 25 30 35 40 45 50 55 60 2,8 3,0 3,1 3,3 3,4 3,6 3,7 3,9 4,0
COBERTURA ARBOL NIDO (m2) COBERTURA ARBOL NIDO (m2)
Les types de de transformation a faire dépendent de
la variable dépendante a transformer
VAR ORIGINAL TRANSFORMATION
ENTIÈRES (cont/discret): log (x+1)

DONNÉ DISCRETS sqrt(x+δ)


(Poisson) δ= 0.5 ó1

ORIENTATION Valeur N-S = Cos α


Valeur E-O = Sen α

POURCENTATGES: arcsen[sqrt(x/100)]
MAIS..COMMENT
FONCTIONNE UN TEST
STATISTIQUE??...
Test pour voire Test pour voire
des des
Différences Relations

CONTRAST
D’HYPÓTHESE

HYPOTHESE NULLE (H0):


• Poids cerf A = Poids cerf B (PAS de différences)

• Relation = 0 (Pas d’association)


p = probabilité que le H0 est vraie
Range (1-0)

Lorsque la probabilité que H0 est très petite l’unique


possibilité est « accepter le contraire »,
L’HYPOTHESE ALTERNATIVE (H1)

H0 =Poids cerf A = Poids cerf B

H1 = Poids cerf A ≠ Poids cerf B OK!


mais ... Existe-t-il une frontière que dise
pour dire que la "p" est «petite»?

Aucun critère mathématique sinon scientifique…

General: p<0.05
Géologie: p<0.10
Toxicologie: p<0.001

Ce “ligne” s’appelle aussi


NIVEAU DE SIGNIFICATION
Mais si le niveau de signification = 0.05 assumons une
probabilité = 5% de nous tromper

Si nous avons une p< 0.05 deux choses peuvent se produire:

• Accepter H1 et la vérité est que H1 est vrai


• Accepter H1 et la vérité est que H0 est vrai

ERREUR TYPE I (α)


Mais… si nous obtenons une p= 0.40?

Aussi deux choses peuvent se produire:

• Accepter H0 et la vérité est que H0 est vrai


• Accepter H0 et la vérité est que H1 est vrai

ERREUR TYPE Il (β)


ANALYSE

ACCEPTER ACCEPTER
H0 H1

Erreur type
VERITÉ

H0 Bien!!
I (α)
Erreur type
H1 Bien!!
II (β)
Les étudiants du master en ce
moment...

Vous aimerez peut-être aussi