Académique Documents
Professionnel Documents
Culture Documents
−λ λx
• Loi de Poisson: X suit une loi P(λ) ssi P ( X = x) = e , ∀x ∈ N
x!
>x=rbinom(100,5,1/3)
> barplot(table(x))
>barplot(dbinom(0:5,5,1/3),add=
T,col=2)
XI- Statistiques
descriptives
XI-1 Caractéristiques d’une série statistique
>quantile(poids,prob=0.25) >quantile(age,probs=c(0.1,0.4))
25% 10% 40%
54.25 13.5 16.0
XI-2 Visualisation d’une série statistique
nombre de x i ≤ x 1 n
Fn ( x) = = ∑1xi ≤ x
n n i =1
>ecdf(essai)
Empirical CDF
Call: ecdf(essai)
x[1:10] = -1.9361, -1.3021, -0.55675, ..., 1.8527,
1.8702
>plot(ecdf(essai))
>essai=rnorm(n);
> plot(ecdf(essai),main="fdre pour n- fdr")
> curve(pnorm, add=T)
XI-3 Exemples: estimation d’une loi discrète
(stem(), barplot())
essai
1345
1261
>stem(essai)
1|0
2|
3 | 00
4 | 000000
5|0
XI-3 Exemples: estimation d’une loi discrète
(stem(), barplot())
>essai=rbinom(n,10,0.3);t=table(essai);
barplot(t/length(essai), main="n=");
x=0:10;
barplot(dbinom(x,10,0.3),col="red"
,add=T);
XI-3 Exemples: estimation de la densité
d’une loi continue (hist(), density())
La densité f d’une variable continue X
ˆf ( x ) = nombre de xi ∈ I j
k
n ∑
j =1 nl j
1x∈I j
Généralement les classes sont choisies de même amplitude, déterminée
par le nombre de classes choisies, R le fait tout seul ou on utilise cut()
ˆ
Au plus l’échantillon et grand au plus f n est proche de f.
XI-3 Exemples: estimation de la densité
d’une loi continue (hist(), density())
- x: série
- breaks: un vecteur donnant les « breakpoints » des classes ou un nombre
donnant le nombre de classes+1 ou une fonction pour calculer le nombre de
classes. Par défaut , la détermination du nombre k de classes se fait par la règle
de Sturges:
k = 1 + 1,322log10 n
- prob : si F, histogramme des fréquences; si T, histogramme des fréquences relatives
(probas). Le défaut est F.
-right : si T les classes de l’histogrammes sont fermées à dte, ouvertes à gauche. F par
défaut
- col=couleur
- main, xlab, ylab: titres.
XI-3 Exemples: estimation de la densité
d’une loi continue (hist(), density())
>x=rnorm(100); hist(x, prob=T,
breaks=12)
> t=hist(x, prob=T,breaks=12)
> names(t)
[1] "breaks" "counts"
"intensities" "density" "mids"
[6] "xname" "equidist"
> t$breaks
[1] -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5
1.0 1.5 2.0 2.5 3.0
> t$density
[1] 0.02 0.08 0.24 0.26 0.40 0.44
[7] 0.22 0.18 0.04 0.08 0.04
> t$counts
[1] 1 4 12 13 20 22 11 9 2 4 2
>essai=rnorm(50);
>hist(essai) #n’estime pas la densité
>hist(essai, prob=T,
main="histogramme des
probabilités")
>essai=rnorm(n);
>hist(essai, prob=T, main="n");
>curve(dnorm,add=T);
XI-3 Exemples: estimation de la densité
d’une loi continue (hist(), density())
Peut être approchée par un estimateur à noyau : l’idée est d’approcher
la densité de X par celle d’un estimateur de la fonction de répartition de
X. La « dérivée » de la fonction de répartition empirique, estimateur
classique de la fonction de répartition n’existe pas. Mais en un point x
de I, elle vaut à peu près avec h petit :
Fˆn ( x + h) − Fˆn ( x − h) nombre de xi tombant dans [ -hx, hx ] 1 n
2h
=
2nh
= ∑ 1 xi − x
2nh i =1 −1< h ≤1
d=density(x, bw = , kernel =, …)
- x: série
- bw: taille de la fenêtre de lissage. Définie par un chiffre ou
une règle. Automatique par défaut.
- kernel: une chaine de caractères donnant le noyau utilisé
(gaussien, rectangulaire…). Gaussien par défaut.
L’output sort des statistiques sur la série x ainsi que des statistiques sur les
valeurs y de la densité estimée en ces points.
>plot(density(essai, bw=0.1))
>plot(density(essai, bw=0.5))
XI-3 Exemples: estimation d’une densité
x y
Min. :-3.80115 Min. :0.0001951
1st Qu.:-1.91420 1st Qu.:0.0167786
Median :-0.02725 Median :0.1253643
Mean :-0.02725 Mean :0.1323521
3rd Qu.: 1.85970 3rd Qu.:0.2431201
Max. : 3.74665 Max. :0.2861070
>essai=rnorm(n);
>plot(density(essai), main="n" ,ylim=c(0,0.4));
>curve(dnorm,add=T);
XI-3 Exemples: estimation de la densité
d’une loi continue (hist(), density())
>plot(density(essai),
main="n=10000");
>hist(essai, prob=T, add=T);
XI-3 Exemples: caractéristiques d’une série
(boxplot(),qqnorm())
Le boxplot permet de visualiser La fonction qqnorm( ) permet de
les caractéristiques d’une série comparer la distribution d’une série à
(points aberrants, symétrie, la distribution gaussienne standard.
dispersion)
>x=c(1,1,2,2,2,3,4); summary(x)
>boxplot(formula) Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 1.500 2.000 2.143 2.500 4.000
>boxplot(x)
Formula : série x ou formule
y~ grp, avec y série à diviser en
groupe selon la variable grp
(donne 1 boxplot par groupes )
XI-3 Exemples: caractéristiques d’une série
(boxplot(),qqnorm())
XI-3 Exemples: caractéristiques d’une série
(boxplot(),qqnorm())