Académique Documents
Professionnel Documents
Culture Documents
6,1;
11,7;
Se cere:
a) S se determine durata medie a unei convorbiri telefonice i s se studieze dac valoarea obinut este
reprezentativ;
b) S se analizeze asimetria distribuiei;
c) Calculai cuartilele acestui set de date i interpretai rezultatele obinute;
d) S se grupeze datele pe 6 intervale de mrime egal i s se reprezinte grafic rezultatul gruprii;
e) S se determine ponderea cazurilor care se gsesc n intervalul:
x s; x s
x 2 s; x 2 s
x 3s; x 3s
Rezolvare:
a) Notm cu X variabila durata unei convorbiri telefonice, iar xi reprezint valorile variabilei X pentru cele
n=30 observaii.
Pentru calculul mediei se va utiliza formula mediei aritmetice simple:
30
xi
x i 1
n
10,26
minute.
Verificarea reprezentativitii mediei se face cu ajutorul coeficientului de variaie:
s
v x 100
x
Calculm abaterea medie ptratic:
30
xi x
s x s x2 i 1
4 ,29
minute.
Coeficientul de variaie este:
s
4 ,29
v x 100
100 41,8%
x
10,26
>35%, ceea ce nseamn c seria de date are un grad redus
de omogenitate i deci media are o reprezentativitate sczut.
b) Analizm asimetria seriei cu ajutorul coeficientului de asimetrie Pearson:
x Mo
Cas
sx
, unde Mo este valoarea modal i reprezint valoarea cel mai des ntlnit ntro serie statistic.
Dac analizm seria de date observm c fiecare valoare apare o singur dat i deci putem afirma nu
exist mod. n acest caz vom analiza asimetria seriei folosind o formul alternativ a coeficientului de
asimetrie, formul bazat pe ipoteza c ntr-o repartiie moderat asimetric ntre indicatorii tendinei centrale
Mo x 3 Me x
exist relaia
.
3( x Me )
Cas1
sx
, unde Me reprezint mediana seriei.
Pentru determinarea valorii medianei procedm astfel:
Ordonm cresctor seria de date:
2,3
3,6
4,8
5,5
6,1
6,2
8,9
9,1
9,6 10,2 10,4 11,2
14,5 15,3 15,9 16,6 18,7 19,5
6,8
11,4
7,2
11,7
7,7
11,8
8
12,1
8,3
12,3
8,5
13,5
15,5
2
2
. Aceast valoare arat c mediana se gsete ntre termenul al 15lea, respective al 16-lea ai seriei ordodate cresctor/descresctor, adic mediana este o valoare cuprins ntre
9,6 i 10,2.
Determinm mediana ca fiind media aritmetic simpl a celor dou valori:
9 ,6 10,2
Me
9 ,9
2
minute.
Aceasta nseamn c 50% dintre convorbirile telefonice au o durat mai mic de 9,9 minute, respective 50% au
o durat mai mare.
3( x Me ) 3 10 ,26 9 ,9
Cas1
0 ,25
sx
4 ,29
Cas1 3 ,3
Observaie:
.
Valoarea coeficientului arat o uoar asimetrie pozitiv, n serie predominnd valorile mici.
c) Cuartilele sunt indicatori de poziie care impart seria n patru pri egale. Din categoria acestor indicatori face
parte i mediana determinat la punctul b).
n mod similar vom determina Q1 i Q3.
n 1 31
locQ1
7 ,75
4
4
.
Deci Q1 este o valoare cuprins ntre termenii al 7-lea i al 8-lea ai seriei, adic ntre 6,8 i 7,2. Determinm
prima cuartil ca fiind media aritmetic simpl a celor dou valori:
6 ,8 7 ,2
Q1
7
2
minute.
Aceasta nseamn c 75% dintre convorbirile telefonice au o durat mai mare de 7 minute.
locQ3
3 n 1 93
23,25
4
4
.
Deci Q3 este o valoare cuprins ntre termenii al 23-lea i al 24-lea ai seriei, adic ntre 12,3 i 13,5.
Determinm cuartila a treia ca fiind media aritmetic simpl a celor dou valori:
Q3
12,3 13,5
12,9
2
minute.
Aceasta nseamn c 25% dintre convorbirile telefonice au o durat mai mare de 12,9 minute.
a) Ax = xmax - xmin = 19,1 - 2,3 = 16,8 minute
r=6
h Ax r 16,8 6 2,8 3
minute
Rezultatele gruprii sunt prezentate n tabelul urmator:
Intervale de variaie a duratei convorbirilor telefonice (minute)
2-5
5-8
8-11
11-14
14-17
17-20
Total
Not: limita inferioar inclus n interval.
2-5
5-8
x s; x s
d)
x 2s; x 2 s
= (1,68; 18,84)
Tabelul 3.2
Interval
x s; x s
= (5,97; 14,55)
Regula empiric
68%
x 2 s; x 2 s
95%
= (1,68; 18,84)
Se observ c procentele calculate pe baza datelor iniiale sunt foarte apropiate de cele corespunztoare
regulii empirice. n ultimul interval,
x 3s; x 3s
2. Distribuia celor 54 de ageni comerciali ai unei firme ce comercializeaz produse cosmetice de dup
numrul de zile lucrate n luna iulie este urmtoarea:
Tabelul 3.3
Zile lucrate
21
22
23
24
25
26
27
Total
Numr vnztori
6
7
14
11
9
4
3
54
Se cere:
a) S se reprezinte grafic distribuia vnztorilor dup numrul de zile lucrate;
b) S se determine numrul mediu de zile lucrate i s se studieze dac valoarea obinut este
reprezentativ;
c) Care este numrul de zile lucrate peste care se situeaz:
c1) trei sferturi dintre vnztori?
c2) 50% din vnztori?
c3) o ptrime din vnztori?
d) S se analizeze asimetria distribuiei.
Rezolvare:
a) n tabelul 3.3 avem o serie de distribuie de frecvene pe variante, variabila analizat X fiind numr zile
lucrate. Pentru reprezentarea grafic se folosete diagrama cu coloane nelipite centrate pe variant.
16
14
12
10
nr.lucratori
8
6
4
2
0
21
22
23
24
25
26
27
zile lucrate
xi ni
ni
1276
23,6
54
zile.
Tabelul 3.4
Zile lucrate
(xi)
Numr vnztori
(ni)
xi ni
xi x 2 ni
Fci
0
21
22
23
24
25
26
27
Total
1
6
7
14
11
9
4
3
54
2
126
154
322
264
225
104
81
1276
3
40,56
17,92
5,04
1,76
17,64
23,04
34,68
140,64
4
6
13
27
38
47
51
54
-
Aadar, un vnztor din cei 54 luai n studiu a lucrat, n medie, aproximativ 23 de zile i jumtate.
Pentru a verifica reprezentativitatea mediei obinute, trebuie calculat coeficientul de variaie, pe baza
abaterii medii ptratice:
s
v x 100
x
s x s x2
Dispersia variabilei este:
s x2
xi x
ni
ni
140,64
2 ,6044
54
.
Calculele intermediare necesare n determinarea dispersiei sunt prezentate n coloana 3 a tabelului 3.4.
Abaterea medie ptratic va fi:
s x 2 ,6044 1,61
zile.
iar coeficientul de variaie:
s
1,61
v x 100
100 6 ,8%
23,6
x
< 35%, ceea ce nseamn c media calculat este reprezentativ,
colectivitatea fiind omogen.
c) Se cer calculai urmtorii indicatori medii de poziie:
c1) prima cuartil (Q1):
Pentru calculul ei se procedeaz astfel:
se calculeaz frecvenele absolute cumulate cresctor (Fci)-vezi coloana 4 a tabelului 3.4
se determin locul primei cuartile:
ni 1 55
locQ1
13,75
4
4
Q1 este acea valoare a variabilei corespunztoare primei frecvene cumulate cresctor mai mare dect locQ1,
deci Q1=23 zile.
Aadar, 75% dintre vnztori au lucrat mai mult de 23 de zile n luna iulie.
c2) Mediana (Me)
ni 1 55
locMe
27 ,5
2
2
Me = 24 zile.
Deci, 50% din vnztori au lucrat mai mult de 24 de zile, iar 50% mai puin.
c3) Cuartila a treia (Q3)
3( ni 1 ) 3 55
locQ3
41,25
4
4
Q3 = 25 zile.
Aadar, 25% din vnztori au lucrat mai mult de 25 de zile.
d)
0 ,37
sx
1,61
Mo = 23 zile (nivelul variabilei cu frecvena cea mai mare).
Valoarea coeficientului de asimetrie indic fapul c seria este moderat asimetric la dreapta (predomin
valorile mici ale variabilei).
3. Procentul din profit cheltuit de 70 de firme pentru reclam i publicitate n anul 2005 a avut urmtoarea
distribuie:
Tabelul 3.5
% pentru reclam i
Nr. firme cu % pentru reclama mai mic
publicitate
dect limita superioar a intervalului
0,6-1,0
14
1,0-1,4
32
1,4-1,8
56
1,8-2,2
64
2,2-2,6
68
2,6-3,0
70
Total
Not: limita inferioar inclus n interval.
Se cere:
a) S se reprezinte grafic distribuia de frecvene absolute;
b) S se determine procentul mediu cheltuit pentru reclam i publicitate i s se studieze dac valoarea
obinut este reprezentativ;
c) Care este procentul din profit cheltuit pentru reclam i publicitate peste care se situeaz:
c1) trei sferturi dintre firme?
c2) 50% din firme?
c3) o ptrime din firme?
d) S se analizeze asimetria.
e) S se calculeze media i dispersia firmelor care au cheltuit mai mult de 2,2% din profit pentru reclam
i publicitate.
Rezolvare:
a)
Se observ c n tabelul 3.5 sunt date frecvenele absolute cumulate cresctor. Pentru a determina
frecvenele absolute, trebuie s decumulm frecvenele date n tabelul iniial (coloana 2). Rezultatele
prelucrrilor intermediare necesare pentru calcularea indicatorilor solicitai vor fi redate n tabelul 3.6.
Tabelul 3.6
% cheltuit
pentru
reclam i
publicitate
0
0,6-1,0
1,0-1,4
1,4-1,8
1,8-2,2
2,2-2,6
2,6-3,0
Total
Frecvenele
absolute
cumulate
cresctor
1
14
32
56
64
68
70
-
Frecvene
absolute
(nr. firme)
(ni)
2
14
18
24
8
4
2
Centre de
interval
(xi)
3
0,8
1,2
1,6
2,0
2,4
2,8
-
70
xi ni
xi x
4
11,2
21,6
38,4
16
9,6
5,6
102,
4
5
-0,66
-0,26
0,14
0,54
0,94
1,34
x i x 2 n i x i x 4 ni
6
6,098
1,217
0,470
2,333
3,534
3,591
7
2,656
0,082
0,009
0,680
3,123
6,448
17,244
13,000
Distribuia de frecvene absolute este reprezentat grafic n figura 3.3, prin histogram.
30
25
20
Numr de firme
15
10
5
0
0,6-1,01,0-1,41,4-1,81,8-2,22,2-2,62,6-3,0
procentul pt. reclama si publicitate
Figura 3.3 Distribuia firmelor dup procentul cheltuit pentru reclam i publicitate
b) Se calculeaz media aritmetic ponderat a procentului cheltuit pentru reclam i publicitate, pe baza
frecvenelor absolute (coloana 4):
x
xi ni
ni
102,4
1,4628 1,46
70
%
Aadar, o firm din cele 70 luate n studiu a cheltuit, n medie, 1,46% din profit pentru reclam i
publicitate.
Pentru a verifica reprezentativitatea mediei obinute, trebuie calculat coeficientul de variaie, pe baza
abaterii medii ptratice:
s
v x 100
x
s x s x2
Dispersia variabilei n eantion este:
s x2
xi x
ni
ni
17 ,244
0 ,2463
70
se gsete intervalul n care se afl prima cuartil (primul interval a crui frecven cumulat cresctor
depete locul primei cuartile), acesta este 1,0-1,4;
se calculeaz prima cuartil, cu formula:
loc Q1 FcQ1 1
17 ,75 14
Q1 x0 k
1 0 ,4
1,08
nQ1
18
%.
unde:
x0 = limita inferioar a intervalului primei cuartile;
k = mrimea intervalului cuartilic;
FcQ1-1 = frecvena cumulat a intervalului anterior celui cuartilic;
nQ1 = frecvena absolut a intervalului primei cuartile.
Aadar, 75% dintre firme au cheltuit pentru reclam i publicitate mai mult de 1,08 % din profit.
c2) Mediana (Me)
ni 1 71
locMe
35,5
2
2
Me x0 k
loc Me FcMe 1
35,5 32
1,4 0 ,4
1,458
nMe
24
%.
Deci, 50% din firme au cheltuit pentru reclam i publicitate mai mult de 1,458 % din profit, iar 50% mai
puin.
c3) Cuartila a treia (Q3)
3( ni 1 )
locQ3
53,25
4
Mo x0 k
1
1 2
unde:
x0 = limita inferioar a intervalului modal;
k = mrimea intervalului modal;
Intervalul modal este intervalul cu frecvena maxim: [1,4-1,8)
1 = nMo nMo-1 = frecvena intervalului modal minus frecvena intervalului anterior celui modal;
2 = nMo - nMo+1 = frecvena intervalului modal minus frecvena intervalului urmtor celui modal;
24 18
Mo 1,4 0 ,44
1,52%.
( 24 18 ) ( 24 8 )
Se obine
Cele mai multe firme au cheltuit pentru reclam i publicitate 1,52% din profit.
Cas
1,46 1,52
0 ,12
0 ,4963
<0 ceea ce arat o asimetrie uoar, negativ, n serie predomin valorile mici.
d) Se creeaz o caracteristic alternativ cu o stare favorabil (firmele care au cheltuit peste 2,2%) i o stare
nefavorabil (firmele care au cheltuit mai puin de 2,2%).
Media caracteristicii alternative este:
m 6
w
0 ,086 0 ,09
n 70
(n medie, 9% din firme au cheltuit peste 2,2%)
iar dispersia:
4. Se cunosc urmtoarele date referitoare la distribuia celor 3569 structuri de primire turistic cu funciuni de
cazare turistic, pe categorii de confort n anul 2003:
Categorii de confort
Neclasificate
Categorii de confort
1 stea
2 stele
3 stele
4 stele
5 stele
TOTAL
Sursa: www.insse.ro
S se determine indicatorii tendinei centrale pentru aceast serie.
Rezolvare:
Datele prezentate n tabel reprezint o serie de distribuie de frecvene pe variante, iar variabila
analizat (categoria de confort) este calitativ, msurat pe o scal ordinal. Din categoria indicatorilor ce
caracterizeaz tendina central, pentru aceast serie pot fi determinate valoarea modal (modul) i mediana.
Modul (Mo) este valoarea variabilei cu frecvena cea mai mare, deci nivelul Mo este 2 stele (nimax
=1467).
Pentru determinarea medianei (Me) procedm astfel:
0
Neclasificate
1 stea
2 stele
3 stele
4 stele
5 stele
TOTAL
1
448
1080
1479
427
125
10
3569
2
448
1528
3007
3434
3559
3569
-
ni 1
locMe i 1
n 1 3570
1785
2
2
Determinm mediana:
Mediana reprezint acel nivel al variabilei analizate corespunztor primei frecvene cumulate cresctor mai
mare dect locMe. Deci i nivelul Me este 2 stele (Fc3=3007>locMe=1785).
5. Dou grupe de studeni, cu efective de 25 i, respectiv, 32 de per soane, au susinut un test de cultur
general. Prima grup a obinut media 7,8, iar a doua 8,4. Cercettorul este interesat n a determina nota medie
pe ansamblul celor dou grupe.
Rspuns:
Nota medie pe ansamblul celor dou grupe se poate determina ca o medie de medii pariale. S notm:
10
x 1 7 ,8
n1 = 25
x 2 8 ,4
n2 = 32
x n
n
i
i
i
Atunci:
x 1 n1 x 2 n 2 7 ,8 25 8 ,4 32 195 268 ,8
8 ,14
n1 n 2
25 32
57
puncte.
4.
2
2
Seria avnd un numr impar de termeni, mediana este egal cu valoarea termenului central (al patrulea), deci
Me = 5.
Mediana este un indicator potrivit pentru a studia tendina central n acest set de date, deoarece valoarea 20
este o valoare extrem, ce afecteaz, prin magnitudine, nivelul total al variabilei i deci valoarea mediei. ase
dintre cele apte valori se situeaz sub valoarea mediei aritmetice, ceea ce face ca indicatorul median s
exprime mai corect tendina central.
b) Noile valori sunt: 4, 4, 5, 5, 6, 7, 8.
x 5 ,57
, Me = 5.
Valoarea medianei rmne neschimbat, ea innd cont numai de numrul valorilor mari, nu i de valoarea lor
efectiv.
c) Valorile sunt: 55, 57, 54, 55, 70, 56, 54.
x'i 401
x'
57 ,28 x 50
n
7
.
Se verific proprietatea mediei aritmetice de a se modifica () cu a uniti, dac fiecare valoare se modific
() cu cte a uniti.
11