Vous êtes sur la page 1sur 32

13

Chapitre Chapitre 13.


Statistiques
et probabilits

Les statistiques et les probabilits occupent une place importante dans lenseignement de certaines
classes prparatoires. Les principales fonctions ncessaires pour travailler dans ce domaine se trouvent
dans les applications Calculs et Tableur & listes. Lapplication Donnes & statistiques permet
deffectuer des reprsentations graphiques de donnes statistiques, lapplication Graphiques &
gomtrie ne permettant que la reprsentation de nuages de points. Des fonctions dfinies dans ce
chapitre vous permettront dtendre les possibilits de votre unit nomade.

Sommaire
1. Les fonctions disponibles ................................................................................... 2
1.1 O trouver ces fonctions............................................................................. 2
1.2 Remarque importante sur les calculs de variance et dcart type........ 3
2. Lcriture de quelques fonctions utiles ............................................................. 5
2.1 Tableau de calcul, esprance, variance, cart type
dune variable alatoire discrte................................................................ 5
2.2 Texte des fonctions tab et espvar................................................................ 6
3. Utilisation en Statistiques : rgression linaire ............................................... 7
4. Lois discrtes usuelles........................................................................................ 9
4.1 Les diffrentes fonctions prsentes sur la TI-Nspire.............................. 9
4.2 Ajout de fonctions ...................................................................................... 11
4.3 Exemple de calcul utilisant les lois gomtriques................................. 12
5. Lois continues usuelles..................................................................................... 13
5.1 Utilisation directe de lunit nomade TI-Nspire...................................... 13
5.2 Lois continues prsentes sur la TI-Nspire.............................................. 14
5.3 Quelques rsultats classiques sur les lois normales............................ 15
5.4 Approximations usuelles ........................................................................... 16
5.5 Estimations et intervalles de confiance .................................................. 20
5.6 Tests ............................................................................................................ 24

Roland Poms (Lyce Ren Cassin Bayonne)


2 TI-Nspire CAS en prpa

1. Les fonctions disponibles


1.1 O trouver ces fonctions
Vous aurez accs aux fonctions utilisables dans le catalogue (k) page 2, dans les rubriques :
Probabilit, Statistiques mais aussi dans Listes. On peut y accder aussi directement page 1 (taper la
premire lettre de la fonction cherche).

La syntaxe de la fonction slectionne se trouve affiche au bas gauche de lcran.


Dans lapplication Calculs, on accde ces fonctions dans les menus Probabilit et Statistiques
(touches b5 ou 6) :

Le symbole ! permettant le calcul des factorielles est disponible laide du raccourci clavier
/* et galement dans la palette de symboles (/k) ligne 4.
n
Le nombre Cnp , que lon note , se calcule par nCr(n, p), Anp par nPr(n, p) (resp. b53 et
p
b52).

T France 2008 / Photocopie autorise


Statistiques et probabilits 3

Vous trouverez dautres fonctions utiles : calcul de la moyenne (mean), du maximum, du minimum, de
la variance, ou encore de lcart type des lments dune liste dans le menu Liste Maths accessible
partir du menu Statistiques (b63).

Certaines fonctions statistiques sont galement utilisables partir de lapplication Tableur & listes, on
accde ces fonctions dans le menu Statistiques/Calculs statistiques (touches b41).

1.2 Remarque importante concernant le calcul de la variance


et de lcart type
Attention, il existe deux fonctions pour le calcul de lcart type : stdDevPop et stdDevSamp et deux
fonctions pour le calcul de la variance varPop et varSamp. Lune des deux ne donnant pas le rsultat
classiquement attendu en classes prparatoires.
La formule usuelle de calcul de la variance de la liste { x1 , x2 ,, xn } est :
n
( xi - x )
2

i =1
v=
n
Elle est donne par la fonction varPop.
La fonction varSamp effectue le calcul partir de la relation :
n
( xi - x )
2

i =1
v=
n -1
qui donne un estimateur sans biais de s 2 , variance de la population do est tir lchantillon
{ x1 , x2 ,, xn } (voir page 20).

T France 2008 / Photocopie autorise


4 TI-Nspire CAS en prpa

On utilise donc varPop et stdDevPop lorsque { x1 , x2 ,, xn } reprsente la population entire, et


varSamp et stdDevSamp lorsque { x1 , x2 ,, xn } est un chantillon tir dune population dont on veut
estimer les paramtres.
Prenons par exemple la liste {1, 2,3, 4,5} . La moyenne est 3. La variance est la moyenne des valeurs

{(-2) ,(-1) ,0,1 , 2 } , c'est dire 10 / 5 = 2 . Lcart type est gal


2 2 2 2
2.

La situation est identique dans lapplication Tableur & listes. La valeur affiche Sx correspond la
valeur 10 / 2 , et la valeur de x correspond la valeur 2 . Ajoutez une page (/I), choisissez
lapplication Tableur & listes (b3). Entrez ensuite la liste dans la premire colonne, puis ouvrez
le menu Statistiques une variable (b411)

Validez en cliquant sur OK.

Validez en cliquant sur OK, les rsultats saffichent.

T France 2008 / Photocopie autorise


Statistiques et probabilits 5

Il est possible de redimensionner les colonnes afin de les rendre plus lisibles. Slectionnez une cellule
de la colonne largir, puis choisissez Redimensionner, Largeur des colonnes dans le menu contextuel
accessible par /b. Dplacez ensuite la limite droite laide du curseur validez par .
Les fonctions statistiques travaillent ici en mode approch, alors que les fonctions varPop, stdDevPop,
varSamp, stdDevSamp font des calculs exacts.

2. Lcriture de quelques fonctions utiles


Une bibliothque de programmes proba.tns facilite certains calculs classiques, elle est tlchargeable
sur le site www.univers-ti-nspire.fr. Lien direct : http://www.univers-ti-nspire.fr/files/tns/proba.tns.

2.1 Tableau de calcul, esprance, variance, cart type dune variable alatoire
discrte
1
Considrons par exemple la variable alatoire dfinie par X (W) = {1,3,6,10} , p ( X = 1) = ,
6
1 1 1
p ( X = 3) = , p ( X = 6) = , p ( X = 10) = .
3 4 4
Nous allons placer les lments dfinissant cette variable alatoire dans une matrice x. La premire
colonne contiendra les valeurs xi , la seconde les probabilits pi .

Lutilisation de sum (b635) faite dans le deuxime cran montre que la somme des
probabilits est gale 1. Jusque-l, tout va bien. Construisons prsent la matrice contenant
galement la colonne forme par les pi xi et celle forme par les pi xi2 .
Pour cela on peut utiliser une fonction tab dont vous trouverez la dfinition page 6 :

Une ligne contenant la somme des termes de chaque colonne a t ajoute la matrice. Cela peut
faciliter la construction du tableau de calcul de lesprance et de la variance.

T France 2008 / Photocopie autorise


6 TI-Nspire CAS en prpa

31 223
On peut, par exemple, y lire que E ( X ) =
6
( )
et E X 2 =
6
.

Pour calculer ces deux dernires, il suffit dutiliser la fonction espvar, que vous trouverez galement
au paragraphe suivant, qui utilise la fonction prcdente pour retourner une liste forme par
lesprance, la variance, et lcart type. Vous pouvez retrouver ces rsultats laide de lapplication
1 1 1 1
Tableur & listes, entrez dans la colonne A la liste {1,3,6,10} , dans la colonne B, la liste
, , , .
6 3 4 4

b411, nombre de listes : 1, Liste des x1 : a[ ], Liste des frquences : b[ ], on valide (voir
cran ci-dessous gauche).

2.2 Texte des fonctions tab et espvar


Lcriture de ces deux fonctions utilise des fonctions de calcul matriciel, ce qui en fait lintrt. Si
vous ntes pas familiaris avec ces dernires, cela risque de vous paratre un peu mystrieux. Voici
quelques explications permettant den suivre le fonctionnement. Ces explications sont beaucoup plus
longues que la fonction tab !
Ces calculs peuvent tre galement faits de faon trs simple dans lapplication Tableur & listes.
1. x [ i ] forme le vecteur ligne obtenu partir de la i-ime colonne de la matrice x passe en
argument. Cette matrice comporte les valeurs de xi sur la premire colonne, et celle de pi dans la
seconde.
2. La fonction mat list permet de convertir ce vecteur ligne en liste. On obtient les listes l x et l p des
valeurs et probabilits utiliser pour les calculs suivants.
3. partir des quatre listes, l x , l p , l x * l p , l x ^ 2 * l p , il est possible de construire une matrice de quatre
lignes contenant les valeurs de xi , de pi , de pi xi et de pi xi2 .
4. En la transposant, on obtient la matrice m reprsentant le tableau dans sa prsentation classique
avec ses quatre colonnes.
5. La fonction sum permet de faire la somme de chacune de ces colonnes et dobtenir la matrice
n n n n
xi pi pi xi pi xi2 .

i=1 i =1 i =1 i =1
6. On empile ensuite cette matrice et la matrice m pour former le tableau dont la dernire ligne
comporte les sommes de chaque colonne. Cela se fait en utilisant la fonction colAugment.
7. Enfin, on modifie le terme situ sur la premire colonne de la dernire ligne. Il correspond au
cumul des valeurs de xi , et n'est pas utile pour la suite. On utilise la fonction rowDim pour
connatre le nombre de lignes de la matrice.
Loprateur de transposition sobtient dans le menu k2 Matrice.

T France 2008 / Photocopie autorise


Statistiques et probabilits 7

Define LibPub tab(mat)=Func


mat:tableau de calcul proba/stat
Local lx,lp,u,v,m
lx:=matlist(mat[1])
lp:=matlist(mat [2])
m:=({lx,lp,lx*lp,lx^2*lp})
m:=colAugment(m,sum(m))
m[rowDim(m),1]:="-"
m
EndFunc
Lutilisation de la syntaxe
Define LibPub =

permet de faire apparatre cette fonction dans le catalogue, voir chapitre 15.

La fonction espvar est beaucoup plus simple comprendre.

On pourrait lcrire directement, mais on peut aussi utiliser la fonction tab prcdente. Il suffit de
construire la matrice prcdente et daller y chercher les informations utiles, cest--dire les valeurs de
n n
pi xi et de pi xi2 , dsignes par e x et e x 2 dans cette fonction.
i =1 i =1

Define LibPub espvar(x)=Func


mat:calcul de esp et var
Local m,k,ex,ex2,v
m:= tab(x)
k:=rowDim(m)
ex:=m[k,3]
ex2:=m[k,4]
v:=ex2-ex^2
{ex,v,(v)}
EndFunc

3. Utilisation en Statistique : rgression linaire


La statistique suivante donne lvolution des stocks dune entreprise :

Anne 2000 2001 2002 2003 2004 2005


Stock Qi 6 400 7 200 8 700 10 400 12 600 15 000

Effectuer un ajustement laide dune rgression linaire, puis un ajustement laide dune fonction
exponentielle. Que peut-on en conclure ? Donner une estimation du stock en 2009.
Solution
On entre dans lditeur la liste des numros des annes et la liste des Qi.
lx = {1, 2,3, 4,5,6} , ly = {6400,7200,8700,10400,12600,15000} .

Pour reprsenter le nuage de points, on peut le faire sur la mme page laide de Graphe rapide que
vous trouverez dans le menu contextuel accessible par /b.
On peut aussi ajouter une page Graphiques & gomtrie en utilisant c2, puis slectionner Nuage
de points dans le menu contextuel. Il suffit ensuite dentrer les deux listes : appuyer sur , choisir la
liste et valider, e pour passer lautre liste.

T France 2008 / Photocopie autorise


8 TI-Nspire CAS en prpa

On valide, d, pour sortir de la ligne de saisie, /b49 pour choisir un zoom adapt aux
donnes. Effectuons une rgression linaire, / pour revenir la page prcdente, puis
b413.

Lajustement linaire donne un coefficient de corrlation r 0,987 .


La troisime rubrique Enregistrer RegEqn dans : permet dindiquer le nom de la variable dans
laquelle sera mmorise lquation de la fonction servant effectuer lajustement (f1 pour
lajustement linaire et f2 pour lexponentiel).
b41A. Lajustement par une fonction de la forme Q = a * bt donne un meilleur rsultat
comme lindique la reprsentation graphique et le coefficient de corrlation r 0,998 .

T France 2008 / Photocopie autorise


Statistiques et probabilits 9

Pour avoir lestimation du stock en 2009, il suffit de calculer f2(10), ce qui donne approximativement
29 926, alors que lajustement linaire aurait donn 21 360 (f1(10)).

4. Lois discrtes usuelles


4.1 Les diffrentes fonctions prsentes sur la TI-Nspire
Les lois discrtes usuelles : loi binomiale, loi gomtrique, loi de Poisson sont directement intgres. Il
sera de plus trs simple de dfinir dautres lois lorsque vous en aurez lutilit, voir par exemple la loi
hypergomtrique.
Vous trouverez les fonctions correspondantes dans le menu Distributions du menu Statistiques
(touches b65) de lapplication Calculs, et dans le menu Distributions du menu Statistiques
(touches b42) de lapplication Tableur & listes.
Vous aurez aussi accs ces fonctions dans le catalogue (k) page 2, dans les rubriques : Probabilit,
et Statistiques sous-menu Distributions.
On peut soit utiliser lassistant (voir crans ci-dessous), soit entrer directement les paramtres.

Loi binomiale de paramtres n et p, n * , p ]0,1[

n
On a p ( X = k ) = p k (1 - p )
n-k
pour tout k 0, n .
k

syntaxe : binomPdf(n, p [, k]) 1 donne P ( X = k )

1
Si k est omis, binomPdf(n, p) (resp. binomCdf(n, p)) donne la liste des probabilits P X k (resp.
P X k ) pour k 0, n .

T France 2008 / Photocopie autorise


10 TI-Nspire CAS en prpa

fonction de rpartition : binomCdf(n, p [, k]) donne P ( X k ) et binomCdf (n, p, a, b) donne


P (a X b) .

Il est possible de calculer par exemple la probabilit davoir 4 pile lorsquon lance 10 fois une pice
de monnaie, et de vrifier que la somme des probabilits lorsque k varie de 0 n est bien gale 1.
Dans le second cran, on calcule la probabilit dobtenir au plus 57 pile au cours de 100 lancers
( 0,93 ) et la probabilit dobtenir au moins 57 pile au cours de 100 lancers ( 0,097 ).

Loi gomtrique de paramtre p ( p ]0,1[ )

Soit une exprience lmentaire dont lissue est un succs ou un chec avec des probabilits
respectives p et q = 1 - p . On renouvelle cette exprience jusqu' lobtention dun succs.
Cette loi caractrise le nombre dexpriences ncessaires pour obtenir le premier succs.
P ( X = k ) = p (1 - p ) k -1 , k *

1 q
E(X ) = et V ( X ) = 2
p p
syntaxe : geomPdf(p, k)
fonction de rpartition : geomCdf(p,[ a,] b) donne P (a X b) , (par dfaut a est gal 1).

La fonction geomPdf permet par exemple de calculer la probabilit dobtenir un 6 ou bout de 3


lancers dun d (non pip). La fonction geomCdf permet dans lexemple ci-dessous de calculer la
probabilit dobtenir un 6 en au plus 10 lancers, puis en au plus 20 lancers et au moins 10.
Remarque : pour calculer la probabilit P ( X > k ) , on peut utiliser la formule :
P ( X > k ) = 1 - P ( X k ) = 1 - geomCdf ( p, k ) .

Le deuxime cran montre le calcul de lesprance mathmatique de la loi gomtrique de paramtre


p, lutilisation de geomPdf ne permet pas ici dobtenir le rsultat, les valeurs donnes par cette fonction
sont des valeurs approches, il faut donc entrer la 0 ci-dessus valeur formelle de la probabilit et de
plus prciser que 0 < p < 1 laide de loprateur sachant que *. On peut calculer de mme
( )
E X 2 et en dduire la variance :

1 1- p
E(X )= et V ( X ) = 2 .
p p

T France 2008 / Photocopie autorise


Statistiques et probabilits 11

Loi de Poisson de paramtre l *+

lk
syntaxe : poissPdf(, k) donne P ( X = k ) = e-l , pour k
k!
fonction de rpartition : poissCdf(,[ a,] b) donne P (a X b) . Par dfaut a est gal 0.

On peut vrifier que lesprance mathmatique et la variance sont gales au paramtre .

4.2 Ajout de fonctions


Comme on la vu dans les exemples ci-dessus les fonctions considres donnent des rsultats en valeur
approche. Si vous avez besoin de rsultats formels sur une TI-Nspire CAS, comme on le voit dans les
deux derniers exemples, vous pouvez rcrire ces fonctions comme ci-dessous pour la loi
hypergomtrique. Vous retrouverez ces fonctions dans la bibliothque proba, tlchargeable sur le
site www.univers-ti-nspire.fr. Lien direct : http://www.univers-ti-nspire.fr/files/tns/proba.tns.
Loi hypergomtrique N, n et p :
Define LibPub lhyp(m,n,p,k)=nCr(m*p,k)*nCr(m*(1-p),n-k)/nCr(m,n)
Define LibPub fhyp(m,n,p,k)=(nCr(m*p,i)*nCr(m*(1-p),n-i),i,0,k)/nCr(m,n)
On a utilis m car N et n sont interprts de la mme faon par lunit nomade TI-Nspire. De plus,
dans la dfinition des fonctions de rpartition, on a manuellement fait la mise en facteurs
ncessaire pour diminuer le temps ncessaire au calcul.

Voici les dfinitions des fonctions donnant la loi de probabilit (l) et la fonction de rpartition (f) des
trois lois usuelles prcdentes : binomiale, gomtrique et Poisson :
Define LibPub lbinom(n,p,k)=nCr(n,k)*p^k*(1-p)^(n-k)
Define LibPub fbinom(n,p,k)=(lbinom(n,p,i),i,0,k)
Define LibPub lgeom(p,k)=p*(1-p)^(k-1)
Define LibPub fgeom(p,k)=(lgeom(p,i),i,1,k)

T France 2008 / Photocopie autorise


12 TI-Nspire CAS en prpa

Define LibPub lPoisson(,k)=^()*^k/(k!)


Define LibPub fPoisson(,k)= ( ^i/(i!),i,0,k)*^()

4.3 Exemple de calcul utilisant les lois gomtriques


On considre une variable alatoire X suivant une loi gomtrique de paramtre p = 1/10 .

Nous allons calculer les probabilits P ( X = 2) et P ( X > 3) , puis calculer lesprance et la variance.
Cela ne pose aucun problme en utilisant les fonctions dcrites dans ce chapitre.
1. Calcul de P ( X = 2) et de P ( X > 3) = 1 - P ( X 3) (avec vrification).

(On a galement fait un calcul direct de cette probabilit : X > 3 , ou encore X 4 signifie que
les trois premiers essais ont t des checs.)
3. Calcul de lesprance.

T France 2008 / Photocopie autorise


Statistiques et probabilits 13

4. Calcul de la variance et vrification.

5. Lois continues usuelles


5.1 Utilisation directe de lunit nomade TI-Nspire
Rappelons pour commencer la dfinition de deux lois continues classiques, non existantes dans les
menus, mais facilement programmables.
1
t [ a, b ]
1. La loi uniforme sur [ a, b ] : d (t ) = b - a .

0 t [ a, b ]

a e-a t t 0
2. La loi exponentielle de paramtre a : d (t ) = .
0 t <0

La dtermination des fonctions de rpartition des deux premires ne pose pas de problme :
0 t ]-, a ]

t -a
1. La loi uniforme sur [ a, b ] : F (t ) = t [ a, b ] .
b - a

1 t [ b, + [

0 t ]-, 0]
2. La loi exponentielle de paramtre a > 0 : F (t ) = .
1 - e-a t t [ 0, + [

On peut vrifier ce dernier rsultat avec la calculatrice. On peut de la mme faon calculer lesprance
et la variance de cette loi, condition de bien prciser le signe de a (cran de droite).

T France 2008 / Photocopie autorise


14 TI-Nspire CAS en prpa

Des calculs de ce type pourront tre faits de la mme faon avec dautres lois que vous rencontrerez
dans des exercices.
Vous retrouverez les fonctions concernant la loi uniforme et la loi exponentielle dans la bibliothque
proba, tlchargeable sur le site www.univers-ti-nspire.fr.
Lien direct : http://www.univers-ti-nspire.fr/files/tns/proba.tns.

5.2 Lois continues prsentes sur la TI-Nspire


Loi normale de moyenne et dcart type
normPdf (densit de probabilit de la loi normale)
calcule la valeur de la densit de probabilit de la loi normale de moyenne et dcart type , en un
rel x spcifi. Les valeurs par dfaut sont m = 0 et s = 1 . La densit de probabilit est dfinie par :
( x-m ) 2
-
1 2 s2
f ( x) = e ,(s > 0)
s 2p

syntaxe : normPdf(x [, , ])
fonction de rpartition : normCdf(a, b, [, , ]) donne la probabilit P (a X b) .

InvNorm permet de calculer la valeur x telle que P ( X x ) = a , a [ 0,1] , lorsque X suit la loi normale
de moyenne et dcart type .
Syntaxe : invNorm( [, , ]).
Loi de Student df degrs de libert ( df * ).
tPdf (densit dune loi de Student)
calcule la densit de probabilit de la loi de Student df degrs de libert en en un rel x spcifi. La
densit de probabilit est dfinie par :
-( df +1) 2

f ( x) =
(2
G((df +1) 2) 1 + x df )
G(df 2) p df
+
o G( x) = t x-1e-t dt
0

df
E ( X ) = 0 et V ( X ) = si df > 2
df - 2
syntaxe : tPdf(x, df)
fonction de rpartition : tCdf(a, b, df) donne la probabilit P (a X b) .

Loi de Fisher df1 et df 2 degrs de libert ( (df1 , df 2 ) *2 )


FPdf (densit dune loi de Fisher)
calcule la densit de probabilit de la distribution de Fisher en un rel x *+ spcifi. La densit de
probabilit sexprime sous la forme :

G((n + d ) 2) n n 2 n 2-1
f ( x) = x (1 + nx d )-( n+d ) 2

G ( n 2) G ( d 2) d

avec : n = df1 et d = df 2 .

T France 2008 / Photocopie autorise


Statistiques et probabilits 15

df 2
E(X ) = si df 2 > 2 et
df 2 - 2
df 2 2 2(df1 + df 2 - 2)
V ( X ) = si df 2 > 4 .
df 2 - 2 df1 (df 2 - 4)

syntaxe : FPdf(x, df1 , df 2 )

fonction de rpartition : FCdf(a, b, df1 , df 2 ) donne la probabilit P (a X b) .

Loi du Khi 2 ( c 2 ) (ou de Pearson) df degrs de libert ( df * )


chi2Pdf (densit de probabilit dune loi du Khi 2)
calcule la densit de probabilit de la loi du Khi 2, en une valeur spcifie x *+ . La densit de
probabilit est dfinie par :
1 df 2 2-1 -x 2
f ( x) = (1 2) x df e , x>0
G(df 2)

E ( X ) = df et V ( X ) = 2 df

syntaxe : chi2Pdf(x, df)


fonction de rpartition : chi2Cdf(a, b, df) donne la probabilit P (a X b) .

Exemple : reprsentation de la loi normale centre rduite (trait pais) et des lois de Student de,
respectivement, 1 (trait fin) et 10 (en pointills gras) degrs de libert.

5.3 Quelques rsultats classiques sur les lois normales


On considre une loi normale de paramtres m et .
1. On demande de calculer P (m - s X m + s ) et P (m - 2s X m + 2s ) .

2. On demande galement de dterminer, en fonction de , la valeur de a telle que


P (m - a X m + a ) = 85 /100 .

Pour la question 1, il suffit dutiliser les fonctions normCdf, avec les bornes -1 , 1 puis -2 , 2 et les
paramtres m = 0 et s = 1 , car :
X -m
P (m - a.s X m + a.s ) = P -a a
s

T France 2008 / Photocopie autorise


16 TI-Nspire CAS en prpa

Deuxime question.
X -m a a
P (m - a X m + a ) = 85 /100 quivaut P ( X - m < a ) = P ( < ) 2 F -1 = 0.85
s s
s
o F est la fonction de rpartition de la loi normale centre rduite. La fonction invNorm permet
dobtenir le rsultat : a 1.44 s .

5.4 Approximations usuelles


On peut visualiser laide de la calculatrice les approximations usuelles des diverses lois.
n 30

Si np 15 la loi binomiale B (n, p ) peut tre approxime par la loi normale N (np, npq ) .

npq > 5
p 0,1

Si n 30 la loi binomiale B (n, p ) peut tre approxime par la loi de Poisson P (np ) .

np < 15

Si l 15 la loi de Poisson P (l ) peut tre approxime par la loi normale N (l, l ) .


Si df 30 la loi de Student df degrs de libert peut tre approxime par la loi normale centre
rduite (voir reprsentation graphique page 15).
Les graphiques suivants illustrent ces problmes dapproximation. On travaille avec lapplication
Tableur & listes, dans la colonne A on place les entiers de 0 100 (= seq(i,i,0,100)), on la nomme x.
Dans la colonne B, on place les probabilits de la loi binomiale de paramtres n = 100 et p = 0, 4 ,
B (100;0, 4) (= binomPdf(100,0.4)), on la nomme p, et dans la colonne C les probabilits de la loi de
Poisson de paramtre 40, P (40) (= poissPdf(40,a[])), on la nomme q.

T France 2008 / Photocopie autorise


Statistiques et probabilits 17

On slectionne les deux premires colonnes. /b8 (Graphe rapide) permet de reprsenter la
premire loi, /#51 permet de modifier le partage dcran et /b11 de rgler la
fentre.

b49 permet de tracer la courbe reprsentative de la densit de la loi normale de paramtres


np = 40 et npq = 24 . Pour obtenir lcran de droite, on clique sur la lettre p reprsentant laxe
des ordonnes, et on choisit la variable q.

On voit bien que, pour ces valeurs des paramtres, lapproximation par la loi normale N (40, 24)
est bonne, alors quelle ne lest pas par la loi de Poisson.
On peut galement tudier un cas o la loi de Poisson donne une bonne approximation de la loi
binomiale. On colle dans la premire colonne la liste lx dfinie par seq(x,x,0,100) (seq sobtient dans le
catalogue, ou si lon connat la syntaxe peut tre tap directement), puis dans lr : binomPdf(100, 0.05) et
dans ls : poissPdf(5, lx). Plutt que dutiliser comme ci-dessus Graphe rapide, on insre une nouvelle
page avec lapplication Graphiques & gomtrie, ce qui permet davoir des reprsentations plus
lisibles et on dfinit les deux nuages de points (lx, lr), (lx, ls).

T France 2008 / Photocopie autorise


18 TI-Nspire CAS en prpa

Ils se superposent presque parfaitement ( p = 0,05 0,1 , n = 100 30 et np = 5 < 15 ).

Exemple 1

On lance une paire de ds non pips, X i reprsente la somme des deux nombres obtenus au i-ime
lancer. Dterminer le nombre de lancers pour que la moyenne des rsultats X i diffre de 7 de moins
de 0,1 avec une probabilit suprieure 0,95.

Les X i constituent une suite de variables indpendantes, de mme loi de moyenne 7 et dcart type
35
.
6

Le thorme central limite permet de dire que la variable reprsentant la moyenne


X + X 2 + + X n F -7
Fn = 1 centre, rduite, Yn = n converge en loi vers la variable normale
n 35
6n
centre rduite, quand n tend vers + .
En utilisant cette approximation, nous avons donc :

6n 6n
P ( Fn - 7 < 0,1) = P ( Yn < 0,1 ) 2 F0,1 -1
35 35

o F est la fonction de rpartition de la loi normale centre rduite. Nous voulons donc trouver n tel
que :
6n 6n
2 F0,1
-1 0,95 , soit F0,1 0,975
35 35

6n
On doit avoir 0,1 1,96 , il suffit donc de
35
prendre n 2241 .

T France 2008 / Photocopie autorise


Statistiques et probabilits 19

Exemple 2 : Approximation de la loi hyper-gomtrique par une loi binomiale, puis par une loi
normale
Un jour dlections, dans une ville comptant 25 000 votants, 12 800 votent pour la municipalit
sortante. On dpouille 50 bulletins tirs au hasard parmi les 25 000. Quelle est la probabilit que, sur
cet chantillon, la majorit sortante soit minoritaire ? (Au maximum 24 bulletins favorables.)
On se trouve ici en prsence dune variable alatoire suivant une loi hypergomtrique de paramtres
N 25 000 , p 12 800 / 25 000 et n = 50 .

Attention, si vous demandez un calcul exact, vous risquez dobtenir un rsultat totalement
inutilisable et un temps de calcul important. Il est prfrable soit de valider par /, soit de
mettre un point la fin dun des nombres (comme le montre lcran prcdent) pour que le
calcul se fasse en mode approch.
On peut comparer avec le rsultat que lon obtiendrait en prenant une loi binomiale de paramtres
n = 50 et p 12 800 / 25 000 :

Le rsultat obtenu est trs proche du prcdent, ce qui est conforme la thorie sur lapproximation
par une loi binomiale dans le cas o N > 10n .
On peut enfin effectuer une nouvelle approximation, en utilisant prsent une loi normale de
paramtres m = n p et s = np (1 - p ) , et en utilisant une correction de continuit.

On calcule P ( X 24,5) :

On peut voir que cette approximation est galement satisfaisante, ce qui tait prvisible puisque les
trois conditions que lon impose en gnral pour ce type dapproximation : n 30 , n p 15 ,
n p (1 - p ) > 5 taient bien toutes vrifies.

Vous remarquerez que dans les conditions de lexercice, un sondage sur un aussi petit nombre de
personnes risque de donner un rsultat faux plus dune fois sur trois.

T France 2008 / Photocopie autorise


20 TI-Nspire CAS en prpa

Reprenons rapidement le calcul avec un chantillon de 1 000 personnes :

Cette fois, il ny a plus quenviron une chance


sur cinq de se tromper.
(Ce qui nest pas totalement ngligeable)

5.5 Estimations et intervalles de confiance


Estimateur sans biais
Soient (moyenne) et (cart type) les paramtres dun caractre X dans une population P de taille
N. On prlve tous les chantillons de taille n, on note (n, xi , si ) les paramtres de X.

Si (n, x , s ) sont les paramtres dun chantillon pris au hasard, x est un estimateur sans biais de , par
n 2
contre s nest pas un estimateur sans biais de , il faut prendre pour cela S dfini par S 2 = s ,
n -1
1 n
soit S =
n -1 j =1
( x j - x ) 2 (les x j tant les valeurs de X dans lchantillon).

Distribution dchantillonnage des moyennes


On note X la variable qui suit la loi de probabilit dtermine par la distribution dchantillonnage
des moyennes {x1 , x2 ,, xk } (k est le nombre dchantillons, N = n k ).

E( X ) = E( X ) = m

s
sX = dans le cas dun tirage non exhaustif (avec remise)
n

s N -n
sX = dans le cas dun tirage exhaustif (sans remise)
n N -1

N -n
Si N est grand 1 , on peut supposer le tirage non exhaustif,
N -1
si est inconnu on le remplace dans le calcul par son estimateur S.
Distribution dchantillonnage des frquences (ou proportions)
On se place dans le cas o le caractre X ne peut prendre que les valeurs 0 et 1 avec respectivement les
probabilits p et q = 1 - p . Soit F la variable prenant pour valeur la frquence fi dapparitions de
lvnement favorable dans le i-ime chantillon.
E(F ) = p

pq
sF = dans le cas dun tirage non exhaustif (avec remise)
n

T France 2008 / Photocopie autorise


Statistiques et probabilits 21

pq N -n
sF = dans le cas dun tirage exhaustif (sans remise)
n N -1

pq
Si N est grand s F , on peut supposer le tirage non exhaustif. Si p est inconnue on la
n
remplace par son estimation f, frquence observe sur un chantillon, et n par n1, si n petit.

Intervalle de confiance dune moyenne


Si n 30 , que la population mre soit normalement distribue ou non, on peut supposer que la
X -m
variable centre rduite T = suit approximativement une loi normale centre rduite.
s n
s s
Si P ( T ta 2 ) = P m - ta 2 X m + ta 2 = 1 - a
n n

ce qui revient dire que la probabilit quune valeur x de X appartienne lintervalle


s s s s
m - ta 2 , m + ta 2 est gale 1 - a , ou encore que m x - ta 2 , x + ta 2 avec la
n
n
n n
probabilit 1 - a ou le risque derreur .
s s
Lintervalle x - ta 2 , x + ta 2 est appel intervalle de confiance de lestimateur de au
n n
niveau de confiance 1 ou au risque derreur .
s s N -n
Si le tirage est exhaustif on remplace par
n n N -1
si est inconnu on le remplace par son estimateur S.
Si n < 30 , si la population mre est normalement distribue et si lchantillon est non exhaustif, on
X -m
peut supposer que la variable centre rduite T = (S estimateur de voir page 20) suit une loi
S n
de Student n -1 degrs de libert, les calculs sont les mmes que ci-dessus. Seuls changent les ta 2
qui sont donns ici par une loi de Student au lieu de la loi normale. Dans la pratique on utilise la
fonction zInterval (b661) dans le premier cas : connu ; tInterval (b662) dans
le second cas : inconnu.

T France 2008 / Photocopie autorise


22 TI-Nspire CAS en prpa

Exemple. On peut contrler le rsultat de lexemple du paragraphe prcdent. On utilise zInterval avec
35
loption Stats et les paramtres s = , x = 7 , n = 2241 et C.Level = 0,95 . On retrouve bien
6
lintervalle [ 6,9;7,1] .

Intervalle de confiance dune frquence (ou proportion)


Avec les notations vues page 20, on appelle intervalle de confiance de lestimateur de p au niveau de
pq pq
confiance 1 ou au risque derreur lintervalle f - ta 2 , f + ta 2 . Utiliser
n n
zInterval_1Prop (b665).

pq pq N -n
Si le tirage est exhaustif on remplace par
n n N -1
pq f (1 - f )
si p est inconnue on remplace par son estimateur .
n n -1
Calcul des t

Si T suit la loi normale centre rduite N (0,1) , notons ta 2 le rel positif tel que
P ( T ta 2 ) = 1 - a .

T France 2008 / Photocopie autorise


Statistiques et probabilits 23

ta 2 peut tre donn par la fonction InvNorm (b553) en prenant pour valeur de Area
1 - a 2 , voir le graphique ci-dessous.

On peut ainsi dresser le tableau suivant :

Risque 0,5 % 1% 5% 10 %
Seuil
99,5 % 99 % 95 % 90 %
de confiance
1
ta 2 2,81 2,58 1,96 1,645

Pour un effectif faible ( n < 30 ) on peut procder de la mme faon pour calculer ta 2 en utilisant la
loi de Student. Par exemple au risque derreur de 5 % et pour 5 degrs de libert ta 2 2,57 (voir
calcul ci-dessous).

vrification

La valeur est suprieure celle donne par la loi normale, ceci vient du fait que la distribution de
Student est plus aplatie.

T France 2008 / Photocopie autorise


24 TI-Nspire CAS en prpa

Dans le menu Intervalles de confiance il existe dautres fonctions, par exemple :


zInterval_2Samp et tInterval_2Samp (b663 et 4) qui calculent un intervalle de confiance
pour la diffrence de deux moyennes lorsque respectivement les carts types sont connus, ou ne le sont
pas ; zInterval_2Prop (b666) calcule un intervalle de confiance pour la diffrence de deux
proportions.

5.6 Tests

Tests de conformit dun chantillon une population


Comparaison dune moyenne (resp. frquence) observe une moyenne (resp. frquence) thorique.
X - m0
Sous lhypothse nulle H0 : m = m0 , la variable peut tre assimile une variable normale
sX
centre rduite ou une variable suivant une loi de Student, suivant la taille de lchantillon (voir page
21).
Test bilatral : on teste lhypothse nulle H0 : m = m0 et lalternative m m0 . Au seuil de
signification la zone de rejet est la partie grise.

Zone de rejet ( /2) Zone de rejet ( /2)

t/2
X - m0
Si la valeur de est infrieure ta 2 on accepte lhypothse H0 ;
sX
sinon on rejette lhypothse H0.
ta 2 est donn par la loi normale centre rduite quand n 30 et par la loi de Student n -1 degrs
de libert dans le cas contraire.
Test unilatral droite : on teste lhypothse nulle H0 : m = m0 et lalternative m > m0 . Au seuil de
signification la zone de rejet est la partie grise :

Zone de rejet ()
t
X - m0
Si la valeur de est infrieure ta on accepte lhypothse H0 ; 2
sX
sinon, on rejette lhypothse H0 (avec les mmes remarques que ci-dessus).
Test unilatral gauche : on teste lhypothse nulle H0 : m = m0 et lalternative m < m0 . La zone de
rejet est gauche, symtrique de celle droite et la condition dacceptation de H0 :
X - m0
la valeur de est suprieure -ta .
sX

2
t est directement donn par invNorm (b653) ou invt (Student b656).

T France 2008 / Photocopie autorise


Statistiques et probabilits 25

Pour effectuer ce genre de test, on dispose de la fonction zTest (b671 ou b441)


lorsque lcart type est connu, et de la fonction tTest (b672 ou b442) dans
le cas contraire. Lchantillon peut tre reprsent soit sous forme de liste (Data), soit par sa moyenne
( x ) et sa taille (n), (Stats).
Pour une proportion on utilisera, de faon analogue ce que lon a vu pour une moyenne, la variable
F - p0
, voir page 20.
sF

zTest_1Prop (b675 ou b445) effectue le test dune proportion de russites


inconnue (prop). Elle utilise comme donnes dentre le nombre de russites dans lchantillon
(Successes, x) et la taille (n) de lchantillon. Lhypothse nulle H0 : prop = p0 est teste contre lune
des hypothses alternatives suivantes : prop p0 , prop < p0 , prop > p0 .

Prenons par exemple lexercice 1 de la page 30 : p0 = 0,5 , lhypothse nulle H0 : prop = 0,5 , on
effectue un test bilatral, Successes, x = 104, n = 200.

La valeur z tant infrieure 1,96, au seuil de confiance de 95%, lhypothse H0 ne peut tre rejete.

Tests dhomognit de deux chantillons


Il sagit de comparer deux moyennes, ou deux proportions, observes. Le premier chantillon
caractris par (n1 , x1 , s1 ) est prlev dans une population P1 de paramtres (m1 , s1 ) , le second
caractris par (n2 , x2 , s2 ) est prlev dans une population P2 de paramtres (m2 , s2 ) .
Considrons le cas des moyennes ; le principe est le mme que pour les tests de conformit en
D
utilisant la variable o D = X 1 - X 2 , ( X 1 et X 2 sont indpendantes).
sD

T France 2008 / Photocopie autorise


26 TI-Nspire CAS en prpa

s12 s2 2
Si n1 30 et n2 30 , s D = + , les si ventuellement remplacs par leur estimateur Si ,
n1 n2
D
sous lhypothse nulle H0 : m1 = m2 , la variable peut tre assimile une variable normale
sD
centre rduite.
1 1
Sinon, en supposant que s1 = s2 = s , s D = s + , pouvant tre remplac par son estimateur
n1 n2

(n1 -1) s12 + (n2 -1)s2 2


S= , la variable sous H0 suit, dans ce cas, une loi de Student n1 + n2 - 2
n1 + n2 - 2
degrs de libert.
Deux fonctions permettent deffectuer des tests de comparaison des moyennes de deux chantillons
indpendants : zTest_2Prop (b676 ou b446) lorsque les carts types s1 et s2
sont connus ; zTest_2Samp (b673 ou b443) dans le cas contraire.

Pour les proportions : lhypothse nulle H0 est p1 = p2 (= p0 ) , D = F1 - F2 , et pour des chantillons


1 1 n f + n2 f 2
de grande taille s D p0 (1 - p0 ) + , p0 est estim par 1 1 , les fi tant les
n1 n2 n1 + n2
frquences observes.
La fonction zTest_2Prop (b676 ou b446) permet deffectuer un tel test, elle
utilise comme donnes dentre le nombre de russites (x1 et x2 ) et la taille des chantillons (n1 et n2).
Citons de plus un test de comparaison de deux carts types (test de Fisher) ; FTest_2Samp
(b679) teste lhypothse nulle H0 : s1 = s2 . La moyenne des populations et les carts
types sont tous inconnus.

Exemple 1. Une machine remplit des sachets dont le poids thorique moyen est de 170 mg. On
prlve un chantillon de 20 sachets de la production de cette machine, on obtient les rsultats
suivants :
178, 170, 173, 173, 172, 172, 165, 173, 165, 169,
175, 170, 173, 168, 175, 171, 165, 174, 168, 180 ;
Cette fabrication est-elle conforme aux exigences au seuil de signification de 5% ?
Un sachet est refus si son poids diffre du poids moyen de plus de 5 mg, la machine est considre
comme tant bien rgle si la proportion de sachets refuss est infrieure 10%.
La machine est-elle bien rgle ?
Vu les remarques faites prcdemment on effectue un test bilatral laide de tTest
(b672), on choisit pour Mthode de saisie : Donnes, la liste des valeurs est contenue dans
L1, laide de la fonction invt on calcule ta correspondant au seuil de signification de 5%.

ta 2,093 comme lindique le calcul ci-dessous.

T France 2008 / Photocopie autorise


Statistiques et probabilits 27

On entre la liste dans la variable L1. tTest (b672) permet dobtenir Sx qui donne une
estimation de lcart type de la production. De plus, on a bien PVal > 0,05 , donc au seuil de
signification de 5% on accepte lhypothse H0 que la moyenne des sachets est bien 170 mg.

On suppose donc que le poids suit la loi normale N (170, 4.084) . La fonction normCdf permet de
calculer la probabilit que le poids soit compris entre 165 et 175 mg.

La probabilit que le paquet soit rejet est donc de 22%. Conclusion : la machine est mal rgle.

T France 2008 / Photocopie autorise


28 TI-Nspire CAS en prpa

Exemple 2. 20% des piles provenant dune certaine fabrication peuvent fonctionner plus de 100
heures. Un traitement spcial appliqu un chantillon de 100 piles a permis dobtenir un
fonctionnement de plus de 100 heures pour 30 dentre elles. Lamlioration apparente est-elle
significative au seuil de 5%, de 10% ?
Il sagit de comparer deux proportions, on suppose que les valeurs sont normalement distribues,
n = 100 > 30 , on utilise la loi normale, donc la fonction zTest_2Prop (b676 ou
b446).
Lhypothse H0 : le nouveau traitement na pas amlior la dure de vie des piles ( p1 = p2 ), est teste
contre lhypothse alternative p1 > p2 (test unilatral droite).

Au seuil de 5%, z est lgrement infrieur t0,05 1,645 (ce qui quivaut dire que p > 0,05 ), on ne
peut donc pas rejeter lhypothse H0, par contre au seuil de signification de 10% on peut la rejeter et
donc admettre que le nouveau traitement a amlior la vie des piles.

Test du Khi 2
Il sagit de comparer une distribution dun caractre observ sur un chantillon donn et une
distribution thorique base sur un modle probabiliste. Lhypothse nulle H0 consiste supposer que
lon a concordance des deux distributions.
2
r
(nk - npk )
On calcule cc = 2
, o nk est leffectif observ possdant le caractre k, pk la
k =1 npk
probabilit thorique dobtenir ce caractre, npk tant alors leffectif thorique. La valeur de cc 2 sera
dautant plus grande que les deux distributions diffrent. Le nombre de degrs de libert est gal
r -1 .

T France 2008 / Photocopie autorise


Statistiques et probabilits 29

Un seuil de signification tant fix les tables usuelles du Khi 2 donne le nombre ca2 tel que
( ) ( )
P c 2 ca2 = a . Par exemple pour 5 degrs de libert si ca2 = 9, 236 , P c 2 ca2 0,1 (voir ci-
dessous).

Si cc 2 ca2 , lhypothse H0 est acceptable.

Si cc 2 > ca2 , lhypothse H0 est rejeter.

Pour obtenir ca2 directement partir de laide de la calculatrice, on utilise la fonction Inv 2
(b659), mais attention il faut entrer comme premier paramtre 1 - a et non , car Area
(
correspond la probabilit P c 2 ca2 . )

T France 2008 / Photocopie autorise


30 TI-Nspire CAS en prpa

Exercices

1 Sondage et loi normale


Lors dune lection, la sortie des urnes on interroge 200 lecteurs choisis au hasard. 52% dentre eux
ont vot pour un candidat A. Peut-on en conclure que A va tre lu, en admettant un risque derreur de
5% ? Mme question avec un risque derreur de 1%. Quelle devrait tre la taille de lchantillon pour
pouvoir affirmer que A sera lu avec un niveau de confiance de 0,95 ?

2 Suivi d'une production


Une machine automatique produit des pices dont le diamtre thorique est de 100 mm. On suppose
que les diamtres des pices produites sont distribus suivant une loi normale. On prlve au hasard un
chantillon de 20 pices. On obtient les dimensions suivantes :
92, 95, 106, 96, 100, 91, 96, 89, 104, 91,
92, 92, 94, 98, 96, 103, 105, 95, 107, 94.
Au seuil de confiance de 95% peut-on affirmer que le diamtre moyen de la production est de 100
mm ?

3 Recherche d'une ville test


Un rfrendum, lchelon national, a donn 55% de oui, 40% de non, 5% de blancs ou nuls. On
recherche une ville test pour les lections futures. On en trouve une qui, sur 10 000 votants, a donn
56,5% de oui, 39% de non, 4,5% de blancs ou nuls. Peut-on dire que cette ville reflte la physionomie
de la nation au risque de 1% ? et au risque de 1%O ?

Solutions des exercices

1 Sondage et loi normale


La population est suppose normalement rpartie, nous sommes en prsence de grands
chantillons, on cherche estimer une proportion. On utilise ici la loi normale, la fonction est :
zInterval_1Prop (b665).

On obtient lintervalle [ 0.45,0.59] , donc au risque derreur de 5%, (ou au niveau de confiance de
0.95), il nest pas possible de dire que A sera lu, il en sera videmment de mme au risque de 1%, car
plus on diminue le risque plus lintervalle est important, ici : [ 0.429,0.611] .

T France 2008 / Photocopie autorise


Statistiques et probabilits 31

Pour tre sr que la borne infrieure de lintervalle soit suprieure 50% il suffit de prendre n tel que
0.52 0.48
0.52 - ta 2 0.5 , ta 2 = 1.96 pour a = 5% . Ce qui donne une taille dchantillon de
n
2 400 personnes...

2 Suivi d'une production


La distribution est normale et lon a un chantillon de petite taille ; on utilise donc ici la loi de Student.
La fonction tInterval permet dobtenir un intervalle de confiance dans ce cas. On saisit la liste des
valeurs dans lditeur, b662, on choisit loption Donnes, on remplit la bote de dialogue :

La rponse la question est non car 100 [94.22,99.38] .

3 Recherche d'une ville test


Hypothse H0 : la ville reflte la physionomie de la nation.
On effectue un test du c 2 . Chi2 GOF...

Liste Observe = {5650,3900, 450} , Liste attendue= {5500, 4000,500} (liste thorique), Deg de
libert = 2 . On valide.

T France 2008 / Photocopie autorise


32 TI-Nspire CAS en prpa

Le calcul du Khi 2 donne 11.59, le nombre de degrs de libert est gal 2.


La probabilit P Value = P (c 2 11.59) = 0.003 , est infrieure 0.01, donc au seuil de 0.01
lhypothse H0 doit tre rejete, par contre au seuil de 0.001 elle peut tre accepte
2
( c0,01 = 9.21 < cc 2 < c0.001
2
= 13.82 ).

T France 2008 / Photocopie autorise