Académique Documents
Professionnel Documents
Culture Documents
Les statistiques et les probabilits occupent une place importante dans lenseignement de certaines
classes prparatoires. Les principales fonctions ncessaires pour travailler dans ce domaine se trouvent
dans les applications Calculs et Tableur & listes. Lapplication Donnes & statistiques permet
deffectuer des reprsentations graphiques de donnes statistiques, lapplication Graphiques &
gomtrie ne permettant que la reprsentation de nuages de points. Des fonctions dfinies dans ce
chapitre vous permettront dtendre les possibilits de votre unit nomade.
Sommaire
1. Les fonctions disponibles ................................................................................... 2
1.1 O trouver ces fonctions............................................................................. 2
1.2 Remarque importante sur les calculs de variance et dcart type........ 3
2. Lcriture de quelques fonctions utiles ............................................................. 5
2.1 Tableau de calcul, esprance, variance, cart type
dune variable alatoire discrte................................................................ 5
2.2 Texte des fonctions tab et espvar................................................................ 6
3. Utilisation en Statistiques : rgression linaire ............................................... 7
4. Lois discrtes usuelles........................................................................................ 9
4.1 Les diffrentes fonctions prsentes sur la TI-Nspire.............................. 9
4.2 Ajout de fonctions ...................................................................................... 11
4.3 Exemple de calcul utilisant les lois gomtriques................................. 12
5. Lois continues usuelles..................................................................................... 13
5.1 Utilisation directe de lunit nomade TI-Nspire...................................... 13
5.2 Lois continues prsentes sur la TI-Nspire.............................................. 14
5.3 Quelques rsultats classiques sur les lois normales............................ 15
5.4 Approximations usuelles ........................................................................... 16
5.5 Estimations et intervalles de confiance .................................................. 20
5.6 Tests ............................................................................................................ 24
Le symbole ! permettant le calcul des factorielles est disponible laide du raccourci clavier
/* et galement dans la palette de symboles (/k) ligne 4.
n
Le nombre Cnp , que lon note , se calcule par nCr(n, p), Anp par nPr(n, p) (resp. b53 et
p
b52).
Vous trouverez dautres fonctions utiles : calcul de la moyenne (mean), du maximum, du minimum, de
la variance, ou encore de lcart type des lments dune liste dans le menu Liste Maths accessible
partir du menu Statistiques (b63).
Certaines fonctions statistiques sont galement utilisables partir de lapplication Tableur & listes, on
accde ces fonctions dans le menu Statistiques/Calculs statistiques (touches b41).
i =1
v=
n
Elle est donne par la fonction varPop.
La fonction varSamp effectue le calcul partir de la relation :
n
( xi - x )
2
i =1
v=
n -1
qui donne un estimateur sans biais de s 2 , variance de la population do est tir lchantillon
{ x1 , x2 ,, xn } (voir page 20).
La situation est identique dans lapplication Tableur & listes. La valeur affiche Sx correspond la
valeur 10 / 2 , et la valeur de x correspond la valeur 2 . Ajoutez une page (/I), choisissez
lapplication Tableur & listes (b3). Entrez ensuite la liste dans la premire colonne, puis ouvrez
le menu Statistiques une variable (b411)
Il est possible de redimensionner les colonnes afin de les rendre plus lisibles. Slectionnez une cellule
de la colonne largir, puis choisissez Redimensionner, Largeur des colonnes dans le menu contextuel
accessible par /b. Dplacez ensuite la limite droite laide du curseur validez par .
Les fonctions statistiques travaillent ici en mode approch, alors que les fonctions varPop, stdDevPop,
varSamp, stdDevSamp font des calculs exacts.
2.1 Tableau de calcul, esprance, variance, cart type dune variable alatoire
discrte
1
Considrons par exemple la variable alatoire dfinie par X (W) = {1,3,6,10} , p ( X = 1) = ,
6
1 1 1
p ( X = 3) = , p ( X = 6) = , p ( X = 10) = .
3 4 4
Nous allons placer les lments dfinissant cette variable alatoire dans une matrice x. La premire
colonne contiendra les valeurs xi , la seconde les probabilits pi .
Lutilisation de sum (b635) faite dans le deuxime cran montre que la somme des
probabilits est gale 1. Jusque-l, tout va bien. Construisons prsent la matrice contenant
galement la colonne forme par les pi xi et celle forme par les pi xi2 .
Pour cela on peut utiliser une fonction tab dont vous trouverez la dfinition page 6 :
Une ligne contenant la somme des termes de chaque colonne a t ajoute la matrice. Cela peut
faciliter la construction du tableau de calcul de lesprance et de la variance.
31 223
On peut, par exemple, y lire que E ( X ) =
6
( )
et E X 2 =
6
.
Pour calculer ces deux dernires, il suffit dutiliser la fonction espvar, que vous trouverez galement
au paragraphe suivant, qui utilise la fonction prcdente pour retourner une liste forme par
lesprance, la variance, et lcart type. Vous pouvez retrouver ces rsultats laide de lapplication
1 1 1 1
Tableur & listes, entrez dans la colonne A la liste {1,3,6,10} , dans la colonne B, la liste
, , , .
6 3 4 4
b411, nombre de listes : 1, Liste des x1 : a[ ], Liste des frquences : b[ ], on valide (voir
cran ci-dessous gauche).
permet de faire apparatre cette fonction dans le catalogue, voir chapitre 15.
On pourrait lcrire directement, mais on peut aussi utiliser la fonction tab prcdente. Il suffit de
construire la matrice prcdente et daller y chercher les informations utiles, cest--dire les valeurs de
n n
pi xi et de pi xi2 , dsignes par e x et e x 2 dans cette fonction.
i =1 i =1
Effectuer un ajustement laide dune rgression linaire, puis un ajustement laide dune fonction
exponentielle. Que peut-on en conclure ? Donner une estimation du stock en 2009.
Solution
On entre dans lditeur la liste des numros des annes et la liste des Qi.
lx = {1, 2,3, 4,5,6} , ly = {6400,7200,8700,10400,12600,15000} .
Pour reprsenter le nuage de points, on peut le faire sur la mme page laide de Graphe rapide que
vous trouverez dans le menu contextuel accessible par /b.
On peut aussi ajouter une page Graphiques & gomtrie en utilisant c2, puis slectionner Nuage
de points dans le menu contextuel. Il suffit ensuite dentrer les deux listes : appuyer sur , choisir la
liste et valider, e pour passer lautre liste.
On valide, d, pour sortir de la ligne de saisie, /b49 pour choisir un zoom adapt aux
donnes. Effectuons une rgression linaire, / pour revenir la page prcdente, puis
b413.
Pour avoir lestimation du stock en 2009, il suffit de calculer f2(10), ce qui donne approximativement
29 926, alors que lajustement linaire aurait donn 21 360 (f1(10)).
n
On a p ( X = k ) = p k (1 - p )
n-k
pour tout k 0, n .
k
1
Si k est omis, binomPdf(n, p) (resp. binomCdf(n, p)) donne la liste des probabilits P X k (resp.
P X k ) pour k 0, n .
Il est possible de calculer par exemple la probabilit davoir 4 pile lorsquon lance 10 fois une pice
de monnaie, et de vrifier que la somme des probabilits lorsque k varie de 0 n est bien gale 1.
Dans le second cran, on calcule la probabilit dobtenir au plus 57 pile au cours de 100 lancers
( 0,93 ) et la probabilit dobtenir au moins 57 pile au cours de 100 lancers ( 0,097 ).
Soit une exprience lmentaire dont lissue est un succs ou un chec avec des probabilits
respectives p et q = 1 - p . On renouvelle cette exprience jusqu' lobtention dun succs.
Cette loi caractrise le nombre dexpriences ncessaires pour obtenir le premier succs.
P ( X = k ) = p (1 - p ) k -1 , k *
1 q
E(X ) = et V ( X ) = 2
p p
syntaxe : geomPdf(p, k)
fonction de rpartition : geomCdf(p,[ a,] b) donne P (a X b) , (par dfaut a est gal 1).
1 1- p
E(X )= et V ( X ) = 2 .
p p
lk
syntaxe : poissPdf(, k) donne P ( X = k ) = e-l , pour k
k!
fonction de rpartition : poissCdf(,[ a,] b) donne P (a X b) . Par dfaut a est gal 0.
Voici les dfinitions des fonctions donnant la loi de probabilit (l) et la fonction de rpartition (f) des
trois lois usuelles prcdentes : binomiale, gomtrique et Poisson :
Define LibPub lbinom(n,p,k)=nCr(n,k)*p^k*(1-p)^(n-k)
Define LibPub fbinom(n,p,k)=(lbinom(n,p,i),i,0,k)
Define LibPub lgeom(p,k)=p*(1-p)^(k-1)
Define LibPub fgeom(p,k)=(lgeom(p,i),i,1,k)
Nous allons calculer les probabilits P ( X = 2) et P ( X > 3) , puis calculer lesprance et la variance.
Cela ne pose aucun problme en utilisant les fonctions dcrites dans ce chapitre.
1. Calcul de P ( X = 2) et de P ( X > 3) = 1 - P ( X 3) (avec vrification).
(On a galement fait un calcul direct de cette probabilit : X > 3 , ou encore X 4 signifie que
les trois premiers essais ont t des checs.)
3. Calcul de lesprance.
a e-a t t 0
2. La loi exponentielle de paramtre a : d (t ) = .
0 t <0
La dtermination des fonctions de rpartition des deux premires ne pose pas de problme :
0 t ]-, a ]
t -a
1. La loi uniforme sur [ a, b ] : F (t ) = t [ a, b ] .
b - a
1 t [ b, + [
0 t ]-, 0]
2. La loi exponentielle de paramtre a > 0 : F (t ) = .
1 - e-a t t [ 0, + [
On peut vrifier ce dernier rsultat avec la calculatrice. On peut de la mme faon calculer lesprance
et la variance de cette loi, condition de bien prciser le signe de a (cran de droite).
Des calculs de ce type pourront tre faits de la mme faon avec dautres lois que vous rencontrerez
dans des exercices.
Vous retrouverez les fonctions concernant la loi uniforme et la loi exponentielle dans la bibliothque
proba, tlchargeable sur le site www.univers-ti-nspire.fr.
Lien direct : http://www.univers-ti-nspire.fr/files/tns/proba.tns.
syntaxe : normPdf(x [, , ])
fonction de rpartition : normCdf(a, b, [, , ]) donne la probabilit P (a X b) .
InvNorm permet de calculer la valeur x telle que P ( X x ) = a , a [ 0,1] , lorsque X suit la loi normale
de moyenne et dcart type .
Syntaxe : invNorm( [, , ]).
Loi de Student df degrs de libert ( df * ).
tPdf (densit dune loi de Student)
calcule la densit de probabilit de la loi de Student df degrs de libert en en un rel x spcifi. La
densit de probabilit est dfinie par :
-( df +1) 2
f ( x) =
(2
G((df +1) 2) 1 + x df )
G(df 2) p df
+
o G( x) = t x-1e-t dt
0
df
E ( X ) = 0 et V ( X ) = si df > 2
df - 2
syntaxe : tPdf(x, df)
fonction de rpartition : tCdf(a, b, df) donne la probabilit P (a X b) .
G((n + d ) 2) n n 2 n 2-1
f ( x) = x (1 + nx d )-( n+d ) 2
G ( n 2) G ( d 2) d
avec : n = df1 et d = df 2 .
df 2
E(X ) = si df 2 > 2 et
df 2 - 2
df 2 2 2(df1 + df 2 - 2)
V ( X ) = si df 2 > 4 .
df 2 - 2 df1 (df 2 - 4)
E ( X ) = df et V ( X ) = 2 df
Exemple : reprsentation de la loi normale centre rduite (trait pais) et des lois de Student de,
respectivement, 1 (trait fin) et 10 (en pointills gras) degrs de libert.
Pour la question 1, il suffit dutiliser les fonctions normCdf, avec les bornes -1 , 1 puis -2 , 2 et les
paramtres m = 0 et s = 1 , car :
X -m
P (m - a.s X m + a.s ) = P -a a
s
Deuxime question.
X -m a a
P (m - a X m + a ) = 85 /100 quivaut P ( X - m < a ) = P ( < ) 2 F -1 = 0.85
s s
s
o F est la fonction de rpartition de la loi normale centre rduite. La fonction invNorm permet
dobtenir le rsultat : a 1.44 s .
On slectionne les deux premires colonnes. /b8 (Graphe rapide) permet de reprsenter la
premire loi, /#51 permet de modifier le partage dcran et /b11 de rgler la
fentre.
On voit bien que, pour ces valeurs des paramtres, lapproximation par la loi normale N (40, 24)
est bonne, alors quelle ne lest pas par la loi de Poisson.
On peut galement tudier un cas o la loi de Poisson donne une bonne approximation de la loi
binomiale. On colle dans la premire colonne la liste lx dfinie par seq(x,x,0,100) (seq sobtient dans le
catalogue, ou si lon connat la syntaxe peut tre tap directement), puis dans lr : binomPdf(100, 0.05) et
dans ls : poissPdf(5, lx). Plutt que dutiliser comme ci-dessus Graphe rapide, on insre une nouvelle
page avec lapplication Graphiques & gomtrie, ce qui permet davoir des reprsentations plus
lisibles et on dfinit les deux nuages de points (lx, lr), (lx, ls).
Exemple 1
On lance une paire de ds non pips, X i reprsente la somme des deux nombres obtenus au i-ime
lancer. Dterminer le nombre de lancers pour que la moyenne des rsultats X i diffre de 7 de moins
de 0,1 avec une probabilit suprieure 0,95.
Les X i constituent une suite de variables indpendantes, de mme loi de moyenne 7 et dcart type
35
.
6
6n 6n
P ( Fn - 7 < 0,1) = P ( Yn < 0,1 ) 2 F0,1 -1
35 35
o F est la fonction de rpartition de la loi normale centre rduite. Nous voulons donc trouver n tel
que :
6n 6n
2 F0,1
-1 0,95 , soit F0,1 0,975
35 35
6n
On doit avoir 0,1 1,96 , il suffit donc de
35
prendre n 2241 .
Exemple 2 : Approximation de la loi hyper-gomtrique par une loi binomiale, puis par une loi
normale
Un jour dlections, dans une ville comptant 25 000 votants, 12 800 votent pour la municipalit
sortante. On dpouille 50 bulletins tirs au hasard parmi les 25 000. Quelle est la probabilit que, sur
cet chantillon, la majorit sortante soit minoritaire ? (Au maximum 24 bulletins favorables.)
On se trouve ici en prsence dune variable alatoire suivant une loi hypergomtrique de paramtres
N 25 000 , p 12 800 / 25 000 et n = 50 .
Attention, si vous demandez un calcul exact, vous risquez dobtenir un rsultat totalement
inutilisable et un temps de calcul important. Il est prfrable soit de valider par /, soit de
mettre un point la fin dun des nombres (comme le montre lcran prcdent) pour que le
calcul se fasse en mode approch.
On peut comparer avec le rsultat que lon obtiendrait en prenant une loi binomiale de paramtres
n = 50 et p 12 800 / 25 000 :
Le rsultat obtenu est trs proche du prcdent, ce qui est conforme la thorie sur lapproximation
par une loi binomiale dans le cas o N > 10n .
On peut enfin effectuer une nouvelle approximation, en utilisant prsent une loi normale de
paramtres m = n p et s = np (1 - p ) , et en utilisant une correction de continuit.
On calcule P ( X 24,5) :
On peut voir que cette approximation est galement satisfaisante, ce qui tait prvisible puisque les
trois conditions que lon impose en gnral pour ce type dapproximation : n 30 , n p 15 ,
n p (1 - p ) > 5 taient bien toutes vrifies.
Vous remarquerez que dans les conditions de lexercice, un sondage sur un aussi petit nombre de
personnes risque de donner un rsultat faux plus dune fois sur trois.
Si (n, x , s ) sont les paramtres dun chantillon pris au hasard, x est un estimateur sans biais de , par
n 2
contre s nest pas un estimateur sans biais de , il faut prendre pour cela S dfini par S 2 = s ,
n -1
1 n
soit S =
n -1 j =1
( x j - x ) 2 (les x j tant les valeurs de X dans lchantillon).
E( X ) = E( X ) = m
s
sX = dans le cas dun tirage non exhaustif (avec remise)
n
s N -n
sX = dans le cas dun tirage exhaustif (sans remise)
n N -1
N -n
Si N est grand 1 , on peut supposer le tirage non exhaustif,
N -1
si est inconnu on le remplace dans le calcul par son estimateur S.
Distribution dchantillonnage des frquences (ou proportions)
On se place dans le cas o le caractre X ne peut prendre que les valeurs 0 et 1 avec respectivement les
probabilits p et q = 1 - p . Soit F la variable prenant pour valeur la frquence fi dapparitions de
lvnement favorable dans le i-ime chantillon.
E(F ) = p
pq
sF = dans le cas dun tirage non exhaustif (avec remise)
n
pq N -n
sF = dans le cas dun tirage exhaustif (sans remise)
n N -1
pq
Si N est grand s F , on peut supposer le tirage non exhaustif. Si p est inconnue on la
n
remplace par son estimation f, frquence observe sur un chantillon, et n par n1, si n petit.
Exemple. On peut contrler le rsultat de lexemple du paragraphe prcdent. On utilise zInterval avec
35
loption Stats et les paramtres s = , x = 7 , n = 2241 et C.Level = 0,95 . On retrouve bien
6
lintervalle [ 6,9;7,1] .
pq pq N -n
Si le tirage est exhaustif on remplace par
n n N -1
pq f (1 - f )
si p est inconnue on remplace par son estimateur .
n n -1
Calcul des t
Si T suit la loi normale centre rduite N (0,1) , notons ta 2 le rel positif tel que
P ( T ta 2 ) = 1 - a .
ta 2 peut tre donn par la fonction InvNorm (b553) en prenant pour valeur de Area
1 - a 2 , voir le graphique ci-dessous.
Risque 0,5 % 1% 5% 10 %
Seuil
99,5 % 99 % 95 % 90 %
de confiance
1
ta 2 2,81 2,58 1,96 1,645
Pour un effectif faible ( n < 30 ) on peut procder de la mme faon pour calculer ta 2 en utilisant la
loi de Student. Par exemple au risque derreur de 5 % et pour 5 degrs de libert ta 2 2,57 (voir
calcul ci-dessous).
vrification
La valeur est suprieure celle donne par la loi normale, ceci vient du fait que la distribution de
Student est plus aplatie.
5.6 Tests
t/2
X - m0
Si la valeur de est infrieure ta 2 on accepte lhypothse H0 ;
sX
sinon on rejette lhypothse H0.
ta 2 est donn par la loi normale centre rduite quand n 30 et par la loi de Student n -1 degrs
de libert dans le cas contraire.
Test unilatral droite : on teste lhypothse nulle H0 : m = m0 et lalternative m > m0 . Au seuil de
signification la zone de rejet est la partie grise :
Zone de rejet ()
t
X - m0
Si la valeur de est infrieure ta on accepte lhypothse H0 ; 2
sX
sinon, on rejette lhypothse H0 (avec les mmes remarques que ci-dessus).
Test unilatral gauche : on teste lhypothse nulle H0 : m = m0 et lalternative m < m0 . La zone de
rejet est gauche, symtrique de celle droite et la condition dacceptation de H0 :
X - m0
la valeur de est suprieure -ta .
sX
2
t est directement donn par invNorm (b653) ou invt (Student b656).
Prenons par exemple lexercice 1 de la page 30 : p0 = 0,5 , lhypothse nulle H0 : prop = 0,5 , on
effectue un test bilatral, Successes, x = 104, n = 200.
La valeur z tant infrieure 1,96, au seuil de confiance de 95%, lhypothse H0 ne peut tre rejete.
s12 s2 2
Si n1 30 et n2 30 , s D = + , les si ventuellement remplacs par leur estimateur Si ,
n1 n2
D
sous lhypothse nulle H0 : m1 = m2 , la variable peut tre assimile une variable normale
sD
centre rduite.
1 1
Sinon, en supposant que s1 = s2 = s , s D = s + , pouvant tre remplac par son estimateur
n1 n2
Exemple 1. Une machine remplit des sachets dont le poids thorique moyen est de 170 mg. On
prlve un chantillon de 20 sachets de la production de cette machine, on obtient les rsultats
suivants :
178, 170, 173, 173, 172, 172, 165, 173, 165, 169,
175, 170, 173, 168, 175, 171, 165, 174, 168, 180 ;
Cette fabrication est-elle conforme aux exigences au seuil de signification de 5% ?
Un sachet est refus si son poids diffre du poids moyen de plus de 5 mg, la machine est considre
comme tant bien rgle si la proportion de sachets refuss est infrieure 10%.
La machine est-elle bien rgle ?
Vu les remarques faites prcdemment on effectue un test bilatral laide de tTest
(b672), on choisit pour Mthode de saisie : Donnes, la liste des valeurs est contenue dans
L1, laide de la fonction invt on calcule ta correspondant au seuil de signification de 5%.
On entre la liste dans la variable L1. tTest (b672) permet dobtenir Sx qui donne une
estimation de lcart type de la production. De plus, on a bien PVal > 0,05 , donc au seuil de
signification de 5% on accepte lhypothse H0 que la moyenne des sachets est bien 170 mg.
On suppose donc que le poids suit la loi normale N (170, 4.084) . La fonction normCdf permet de
calculer la probabilit que le poids soit compris entre 165 et 175 mg.
La probabilit que le paquet soit rejet est donc de 22%. Conclusion : la machine est mal rgle.
Exemple 2. 20% des piles provenant dune certaine fabrication peuvent fonctionner plus de 100
heures. Un traitement spcial appliqu un chantillon de 100 piles a permis dobtenir un
fonctionnement de plus de 100 heures pour 30 dentre elles. Lamlioration apparente est-elle
significative au seuil de 5%, de 10% ?
Il sagit de comparer deux proportions, on suppose que les valeurs sont normalement distribues,
n = 100 > 30 , on utilise la loi normale, donc la fonction zTest_2Prop (b676 ou
b446).
Lhypothse H0 : le nouveau traitement na pas amlior la dure de vie des piles ( p1 = p2 ), est teste
contre lhypothse alternative p1 > p2 (test unilatral droite).
Au seuil de 5%, z est lgrement infrieur t0,05 1,645 (ce qui quivaut dire que p > 0,05 ), on ne
peut donc pas rejeter lhypothse H0, par contre au seuil de signification de 10% on peut la rejeter et
donc admettre que le nouveau traitement a amlior la vie des piles.
Test du Khi 2
Il sagit de comparer une distribution dun caractre observ sur un chantillon donn et une
distribution thorique base sur un modle probabiliste. Lhypothse nulle H0 consiste supposer que
lon a concordance des deux distributions.
2
r
(nk - npk )
On calcule cc = 2
, o nk est leffectif observ possdant le caractre k, pk la
k =1 npk
probabilit thorique dobtenir ce caractre, npk tant alors leffectif thorique. La valeur de cc 2 sera
dautant plus grande que les deux distributions diffrent. Le nombre de degrs de libert est gal
r -1 .
Un seuil de signification tant fix les tables usuelles du Khi 2 donne le nombre ca2 tel que
( ) ( )
P c 2 ca2 = a . Par exemple pour 5 degrs de libert si ca2 = 9, 236 , P c 2 ca2 0,1 (voir ci-
dessous).
Pour obtenir ca2 directement partir de laide de la calculatrice, on utilise la fonction Inv 2
(b659), mais attention il faut entrer comme premier paramtre 1 - a et non , car Area
(
correspond la probabilit P c 2 ca2 . )
Exercices
On obtient lintervalle [ 0.45,0.59] , donc au risque derreur de 5%, (ou au niveau de confiance de
0.95), il nest pas possible de dire que A sera lu, il en sera videmment de mme au risque de 1%, car
plus on diminue le risque plus lintervalle est important, ici : [ 0.429,0.611] .
Pour tre sr que la borne infrieure de lintervalle soit suprieure 50% il suffit de prendre n tel que
0.52 0.48
0.52 - ta 2 0.5 , ta 2 = 1.96 pour a = 5% . Ce qui donne une taille dchantillon de
n
2 400 personnes...
Liste Observe = {5650,3900, 450} , Liste attendue= {5500, 4000,500} (liste thorique), Deg de
libert = 2 . On valide.