Vous êtes sur la page 1sur 26

C.2.

Analiza unei serii statistice


Prezentarea datelor statistice
unidimensionale
 Variabilă discretă  Prezentarea datelor statistice se poate realiza
 Prezentarea seriei statistice (frecvenţe absolute şi sub formă:
relative cumulate)
 Tabelară (serie statistică)
 Analiza seriei folosind indicatori ai statisticii descriptive:  Grafică
• mărimi medii
• indicatori ai dispersie
 Indicatori statistici de sinteză
• indicatori ai formei  Prezentarea datelor statistice se face pe tipuri
 Analiza seriei folosind procedee grafice de variabile:
 Categoriale (nenumerice)
Bibliografie:
 Cantitative (numerice)
Jaba, Elisabeta, Statistica, Ediţia a treia, Editura Economica,
Bucureşti,
1 2002, pp. 62-84; 105-206 2

Serie statistică după o Tabelul de frecvenţă


variabila cantitativă discretă
 Tabelul de frecvenţă  Tipuri de frecvențe
• Frecvenţe absolute şi relative simple 1. Frecvenţa absolută simplă (ni) = numărul de unităţi
• Frecvenţe absolute şi relative cumulate care poartă simultan nivelul xi al variabilei X.
 Indicatori specifici Efectivul total: ∑ ni = n
• Indicatori ai tendinţei centrale
2. Frecvenţa relativă simplă (fi sau fi%) = ponderea
• Indicatori ai dispersiei (variaţiei)
unităţilor care poartă simultan nivelul xi al variabilei X
• Indicatori ai formei
Diagrame specifice ni ni
 fi = sau f i (%) = ⋅100
• Diagrama în batoane sau în bare (Bar Chart) ∑ ni ∑ ni
∑ f i = 1 sau ∑ f i (%) = 100%
3 4
Tabelul de frecvenţă Tabelul de frecvenţă

 Tipuri de frecvențe  Frecvenţa absolută cumulată


3. Frecvenţa absolută cumulată (Ni) = numărul de unități
cumulate “până la” sau “peste” un nivel xi considerat al  crescător (Ni ↓) sau descrescător (Ni ↑)
caracteristicii, adică valori ≤ xi, respectiv ≥ xi.
i

 N i ↓= N i −1 ↓ + ni = ∑ nh
h =1

4. Frecvenţa relativă cumulată (Fi sau Fi%) = ponderea m

unităților cumulate “până la” sau “peste” nivelul xi  N i ↑= N i +1 ↑ + ni = ∑ nh


considerat al caracteristicii h =i

5 6

Tabelul de frecvenţă Tabelul de frecvenţă

 Frecvenţa relativă cumulată  Tabelul de frecvenţă


 Exemplu: E. Jaba, Statistica, p. 109 (Exemplul 5.2.)
 crescător (Fi ↓) sau descrescător (Fi ↑)
 Distribuţia familiilor dintr-un bloc după numărul de
copii este prezentată în tabelul de mai jos:
i X – Numărul de Numărul Numărul
 Fi ↓= Fi −1 ↓ + f i = ∑ f h copii
h =1 (
copiilor
xi )
de familii
( ni )
fi
0 6 0,067
X – variabilă 1 18 0,200
2 23 0,255
m cantitativă 3 20 0,222
 Fi ↑= Fi +1 ↑ + f i = ∑ f h discretă 4 14 0,160
h =i 5 6 0,070
6 2 0,020
7 1 0,010
n=90 familii
Total 90 1,000
7 8
Tabelul de frecvenţă Tabelul de frecvenţă

 Distribuția angajaților după numărul de ani de școală  Distribuția angajaților după numărul de ani de școală
Valorile Frecvența
variabilei abolută simplă
(xi) (ni)

Educational Level (years)

Cumulative Cumulative
Frequency Percent Valid Percent Percent Frequency Percent Valid Percent Percent
8 53 11.2 11.2 11.2 8 53 11.2 11.2 11.2
12 190 40.1 40.1 51.3 12 190 40.1 40.1 51.3
14 6 1.3 1.3 52.5 14 6 1.3 1.3 52.5
15 116 24.5 24.5 77.0 15 116 24.5 24.5 77.0
16 59 12.4 12.4 89.5 16 59 12.4 12.4 89.5
17 11 2.3 2.3 91.8 17 11 2.3 2.3 91.8
18 9 1.9 1.9 93.7 18 9 1.9 1.9 93.7
19 27 5.7 5.7 99.4 19 27 5.7 5.7 99.4
20 2 .4 .4 99.8 20 2 .4 .4 99.8
9 21 1 .2 .2 100.0 10 21 1 .2 .2 100.0
Total 474 100.0 100.0 Total 474 100.0 100.0

Tabelul de frecvenţă Tabelul de frecvenţă

 Distribuția angajaților după numărul de ani de școală  Distribuția angajaților după numărul de ani de școală
Frecvența Frecvența relativă
relativă simplă cumulată
(fi) (Fi ↓)

Cumulative Cumulative
Frequency Percent Valid Percent Percent Frequency Percent Valid Percent Percent
8 53 11.2 11.2 11.2 8 53 11.2 11.2 11.2
12 190 40.1 40.1 51.3 12 190 40.1 40.1 51.3
14 6 1.3 1.3 52.5 14 6 1.3 1.3 52.5
15 116 24.5 24.5 77.0 15 116 24.5 24.5 77.0
16 59 12.4 12.4 89.5 16 59 12.4 12.4 89.5
17 11 2.3 2.3 91.8 17 11 2.3 2.3 91.8
18 9 1.9 1.9 93.7 18 9 1.9 1.9 93.7
19 27 5.7 5.7 99.4 19 27 5.7 5.7 99.4
20 2 .4 .4 99.8 20 2 .4 .4 99.8
11 21 1 .2 .2 100.0 12 21 1 .2 .2 100.0
Total 474 100.0 100.0 Total 474 100.0 100.0
Variabila cantitativă discretă Indicatori ai tendinţei centrale

 Indicatori statistici descriptivi


1. Media aritmetică (media)
1. Indicatori ai tendinţei centrale
• Media aritmetică  Media aritmetică = valoarea pe care ar purta-o
• Mediana fiecare unitate statistică dacă distribuţia ar fi perfect
omogenă
• Modul
2. Indicatori ai dispersiei (variaţiei)  Media = o mărime medie fundamentală, de calcul
• Varianţa  Media = punctul de echilibru al tuturor valorilor unei
• Abaterea standard distribuţii
• Coeficientul de variaţie  Media = o mărime uşor de calculat
• Intervalul mediu de variaţie
3. Indicatori ai formei
• Asimetria
13
• Boltirea 14

Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

1. Media aritmetică (media)  Media aritmetică (media) simplă

 Simboluri:  Media se calculează ca sumă a valorilor individuale


xi , i = 1,… , n împărţită la numărul de observări:
• x – media variabilei X la nivelul unui eşantion
x1 + x2 + x3 + ... + xn
• x=
• µ – media variabilei X la nivelul unei populaţii n
n


∑x
i =1
i
pentru un eşantion volum n
x=
n
15 16
Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

 Media aritmetică simplă  Media aritmetică (media) ponderată


 Se calculează pentru o serie simplă  Se calculează pentru o distribuţie
X – Numărul de
copii Exemplu: prezentată pe variante de variaţie:
 Numărul de copii observat pe un X : ( xi , ni ) , i = 1,… , m
X – variabilă eşantion de 5 familii este: 2, 1, 3, 2, 0
cantitativă
m
discretă  Care este numărul mediu de copii pe o ∑ xi ni m
familie?
 x = i =m1 sau x = ∑ xi f i
n=5 familii 2 +1+ 3 + 2 + 0 8 i =1
x= = = 1,6 ≅ 2copii ∑ ni
5 5 i =1
Numărul mediu de copii observat pe o familie este de
17 2 copii. 18

Indicatori ai tendinţei centrale


Indicatori ai tendinţei centrale

 Media aritmetică ponderată  Media aritmetică ponderată


 Exemplu: E. Jaba, Statistica, p. 109 (Exemplul 5.2.) m

 Distribuţia familiilor dintr-un bloc după numărul de ∑ xi ni 229


copii este prezentată în tabelul de mai jos: x= i =1
= = 2,544 ≈ 3
X – Numărul de Numărul Numărul
m
90
copii
(
copiilor
xi )
de familii
( ni )
xi ni fi xi f i ∑ ni
i =1
0 6 0 0,067 0,00 În medie, o familie are 3 copii.
X – variabilă 1 18 18 0,200 0,20
2 23 46 0,255 0,50 m
cantitativă 3 20 60 0,222 0,66
discretă 4
5
14
6
56
30
0,160
0,070
0,64
0,35
∑ xi fi m
i =1
6 2 12 0,020 0,12 x= m
= ∑ xi f i = 2,54 ≈ 3
7 1 7 0,010 0,07 i =1
n=90 familii
Total 90 229 1,000 2,54 ∑ fi
i =1
19 20
Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

 2. Modul (Dominanta)
 Modul = valoarea variabilei cea mai frecvent
 întâlnită într-o distribuţie.
 Modul = valoarea xi care corespunde frecvenţei
dominante (nmax).
  Modul se poate determina doar în cazul seriilor cu
frecvenţe diferite.
 O distribuţie poate avea una, două sau mai multe
valori modale (serii unimodale, bimodale,
plurimodale).

21 22

Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

 Determinarea modului 3. Mediana


 Mediana este valoarea caracteristicii unei serii
1. se găseşte frecvenţa maximă (ni = nmax)
ordonate până la care şi peste care sunt distribuite
2. se citeşte, în dreptul frecvenţei maxime, valoarea în număr egal unităţile colectivităţii observate.
corespunzătoare caracteristicii care este egală cu
 Mediana este valoarea centrală a unei serii
modul (xi = M0) ordonate.
Numărul Numărul
copiilor de familii  Mediana este o mărime medie fundamentală, de
( x i ) ( n i ) poziţie.
Cele mai multe familii au 2 copii. 0 6 n3 = nmax = 23
1 18
Numărul de copii cel mai frecvent 2 23
întâlnit este egal cu 2 copii.  Simbol: Me
3 20
4 14
5 6 x3 = M0 = 2
6 2
7 1
23 24
Total 90
Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

 Exemplu:
 Determinarea medianei
A. Serie simplă cu număr impar de
termeni
1. se ordonează, crescător sau descrescător,
termenii seriei
2. se calculează locul medianei (unitatea
mediană)
n +1
U Me =
2
3. se citeşte valoare xi egală cu Me Jumătate din companiile de curierat (50%) livrează zilnic cel mult
(pînă la) 32 de colete, iar jumătate din companiile de curierat (50%)
25 livrează
26 zilnic cel puțin (peste) 32 de colete.

Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

 Exemplu:

 Determinarea medianei
B. Serie simplă cu număr par de termeni
1. se ordonează, crescător sau descrescător,
termenii seriei
2. se calculează locul medianei (unitatea
mediană)
n +1 n
U Me = sau U Me = , n ≥ 100
2 2
3. se calculează Me ca medie aritmetică a celor
Jumătate din companiile de curierat (50%) livrează zilnic cel mult
doi termeni centrali ai seriei (pînă la) 31 de colete, iar jumătate din companiile de curierat (50%)
xi −1 + xi
27 Me = livrează
28 zilnic cel puțin (peste) 31 de colete.
2
Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

 Exemplu
 Determinarea medianei
C. Serie cu frecvenţă 1. Se calculează unitatea mediană
1. Se calculează UMe
Nr. comenzi Număr de Frecvenţe n + 1 10 + 1
efectuate clienţi cumulate U Me = = = 5,5
(xi) (ni) (Ni ↓) 2 2
2. Se determină frecvenţele cumulate (Ni ↓) 4 1 1 2. Se calculează frecvenţele cumulate
5 2 3 crescător (Ni ↓)
3. Se găseşte locul UMe în şirul frecvenţelor cumulate,
6 0 3
după condiţia N i ≥ U
Me 3. Se găseşte locul UMe în şirul frecvenţelor Ni

4. În dreptul frecvenţei cumulate N i ≥ U Me se citeşte,


7
8
2
4
5
9 ( ) (
N 5 (↓) = 9 > U M e = 5,5 )
9 1 10 4. În dreptul N5 (↓) se citeşte valoarea:
de pe coloana variabilei, valoarea xi egală cu Me.
Total 10 -
x5 = M e = 8
29 30 clienţi au efectuat pînă la 8 comenzi, iar 50% din clienţi au
50% din
efectuat peste 8 comenzi.

Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

 Generalizarea medianei: quantilele  Quartilele (Q1, Q2, Q3)


 Quartile (Q1, Q2, Q3)  Valori ale caracteristicii care împart

 Decile (D1, ...., D9) volumul colectivităţii în 4 părţi egale


1(n + 1)
 Centile (C1, ...., C99) U Q1 =
4
 Q2 = D5 = C50 = Me 2(n + 1) n + 1
U Q2 = =
4 2
3(n + 1)
U Q3 =
4
31 32
Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

 Quartilele (Q1, Q2, Q3)  Decilele (D1, ...,D5, ....D9)


 Q2 – este mediana distribuţiei  Valori ale caracteristicii care împart

 Q1 – este mediana primei jumătăţi a seriei volumul colectivităţii în 10 părţi egale


1(n + 1)
 Q3 – este mediana celei de a doua jumătăţi U D1 =
10
a seriei 
5(n + 1) n + 1
U D5 = =
10 2

9(n + 1)
U D9 =
10
33 34

Indicatori ai tendinţei centrale Indicatori ai tendinţei centrale

 Centilele (C1, ...,C50,..., C99)  Relaţii între mărimile medii fundamentale


 Pentru o distribuţie unimodală perfect simetrică cele 3
 Valori ale caracteristicii care împart mărimi medii fundamentale se suprapun:

volumul colectivităţii în 100 de părţi egale  x = M 0 = Me


 Pentru distribuţii asimetrice cele 3 valori ocupă locuri
1(n + 1)
U C1 = diferite:
100
 distribuţie asimetrică la dreapta
 x > Me > M0
50(n + 1) n + 1
U C50 = =
100 2  distribuţie asimetrică la stânga
 x < Me < M0
99(n + 1)
U C99 =
100
35 36
Care este cea mai semnificativă mărime
medie? Indicatori ai tendinţei centrale

Media Mediana Modul  Indicatori ai tendinţei centrale


Simbolizare
x Me M0  Rezultate SPSS
În ce u.m. se exprimă? u.m. a variabilei X u.m. a variabilei X u.m. a variabilei X
Statistics
Este influenţată de valorile Da Nu Nu Educational Level (years)
extreme (outlieri)? N Valid 474
Ia în calcul toţi termenii seriei ? Da Nu Nu Missing
x = 13 , 49 ≅ 13
0
Poate fi folosită în calcule Da Nu Nu Mean 13.49 Me = 12
algebrice? Median 12.00
M 0 = 12
Mode 12
Percentiles 10 8.00
25 12.00
50 12.00
75 15.00
37 38
90 17.00

Variabila cantitativă discretă Variabila cantitativă discretă

2. Indicatori ai dispersiei (variaţiei)  Indicatori ai dispersiei


 Varianţa (s2)
 Dispersia exprimă gradul de variaţie a
2
valorilor individuale (xi) ale unei variabile faţă ∑( xi − x )
de nivelul mediu.  s2 = i (pentru o serie simplă)
 Aprecierea fenomenului de dispersie a unei n
distribuţii permite identificarea gradului de 2
∑( xi − x ) ⋅ ni
reprezentativitate a mediei distribuţiei.
 s2 = i
(pentru o serie cu frecvenţe)
∑ ni
i

 Varianţa este întotdeauna pozitivă, nu are unitate de


măsură şi nu se interpretează.
39 40
Variabila cantitativă discretă
Variabila cantitativă discretă

  Indicatori ai dispersiei
 Varianţa
 Pentru un eşantion de 5 companii de curierat, s-a
înregistrat numărul coletelor livrate.

∑ ( xi − x ) 2
s2 = i
n
296
s2 =
5
s 2 = 59,2
41 42 x = 24colete

Variabila cantitativă discretă


Variabila cantitativă discretă

 Indicatori ai dispersiei  Indicatori ai dispersiei


 Varianţa  Abaterea standard (s)
 Pentru un eşantion de 10 clienţi ai unei companii s-a
înregistrat numărul comenzilor efectuate lunar.
 s = s2
x = 6,9
∑ ( xi − x ) 2 ni  se mai numeşte şi abatere medie pătratică
s2 = i  se exprimă în aceeaşi unitate de măsură cu cea a
∑ ni variabilei
 arată cu cât variază, în medie, valorile xi ale variabilei
24,9 faţă de nivelul mediu al distribuţiei.
s2 =
10
s 2 = 2,49
43 44
Variabila cantitativă discretă Variabila cantitativă discretă

 Indicatori ai dispersiei  Indicatori ai dispersiei


 Coeficientul de variaţie (v)
 Abaterea standard (s)
s
2
 v= ⋅ 100
 s = s = 59,2 = 7,69 ≅ 8colete x

 se exprimă în procente
 Numărul de colete livrate de o companie  Valori ridicate ale acestui coeficient (v>50%) arată o
variază, în medie, faţă de nivelul mediu, în distribuţie eterogenă
plus sau în minus, cu 8 colete. • se caracterizează printr-o variaţie mare a valorilor xi
faţă de nivelul mediu şi
• o medie nereprezentativă.
45 46

Variabila cantitativă discretă


Variabila cantitativă discretă

 Indicatori ai dispersiei  Indicatori ai dispersiei


 Coeficientul de variaţie (v)  Intervalul interquartilic

IQ= Q3 - Q1

 cuprinde 50% din volumul eşantionului

47 48
Variabila cantitativă discretă Variabila cantitativă discretă

 Indicatori ai dispersiei 3. Indicatori ai formei


 Rezultate SPSS  Asimetria
Statistics
 reprezintă o deviere de la forma simetrică a unei
distribuţii.
Educational Level (years)
N Valid
Missing
474
0
s 2 = 8,32
 Asimetria poate fi apreciată:
Mean
Median
13.49
12.00
s = 2,88 ≅ 3ani  pe cale grafică: poligonul frecvenţelor, diagrama box-
Mode 12
xmin = 8ani plot
Std. Deviation 2.885
Variance 8.322  pe cale numerică: - prin calculul indicatorilor de
Range 13 xmax = 21ani asimetrie (Skewness).
Minimum 8
Maximum 21
Percentiles 25 12.00
50 12.00
49 50
75 15.00

Variabila cantitativă discretă Variabila cantitativă discretă

 Diagrama box-plot (box-and-whiskers)


 se obţine prin reprezentarea umătoarelor 5 valori ale
 Diagrama box-plot
unei distribuţii: D1 (Min), Q1, Me, Q3, D9 (Max).  Avantaje:
- permite aprecierea nivelului mediu (Me), dispersiei şi
asimetriei unei distribuţiei;
- facilitează compararea mai multor distribuţii (prin
reprezentarea simultană a diagramelor).

51 52
Variabila cantitativă discretă Variabila cantitativă discretă

 Diagrama box-plot  Diagrama box-plot

 distribuţie perfect simetrică

 distribuţie asimetrică la dreapta


1
NOTA

 distriuţie asimetrică la stânga

3 4 5 6 7 8 9 10 11

Analysis weighted by NRSTUD


53 54

Variabila cantitativă discretă Variabila cantitativă discretă

 Diagrama box-plot  Indicatori ai asimetriei


 Coeficientul de asimetrie Fisher

µ3
NOTA_1
γ1 =
s3
NOTA_2 µ3 – momentul centrat de ordin 3

55 3 4 5 6 7 8 9 10 11 56
Variabila cantitativă discretă Variabila cantitativă discretă

Coeficientul de asimetrie Fisher  Asimetria


 Pentru un eşantion de 5 companii de curierat, s-a înregistrat numărul
coletelor livrate: 12, 20, 24, 30, 34
 Dacă γ1= 0 - distribuţia este perfect simetrică
µ3 = −115, 2
 Dacă γ1 > 0 - distribuţia este asimetrică la dreapta
s = 7, 69
 Dacă γ1< 0 - distribuţia este asimetrică la stânga
µ3 −115,2 −115,2
γ1 = 3
= 3
= = −0,25 Asimetrie la stânga
s (7,69) 454,76

57 58

Variabila cantitativă discretă Variabila cantitativă discretă

 Indicatori ai formei Poligonul frecvenţelor


 Boltirea
 este definită prin compararea distribuţiei empirice cu  construirea acestuia presupune găsirea
distribuţia normală din punctul de vedere al variaţiei locului geometric al punctelor Ai de
variabilei X şi a frecvenţei ni. coordonate (xi,ni) sau (xi,fi) şi unirea acestora
prin segmente de dreaptă.
 aproximează forma unei distribuţii.
 Boltirea poate fi apreciată:
 pe cale grafică: poligonul frecvenţelor
 pe cale numerică: - prin calculul indicatorilor de boltire
(Kurtosis).

59 60
Variabila cantitativă discretă Variabila cantitativă discretă

 Poligonul frecvenţelor simple  Indicatori de boltire


 Coeficientul de boltire Pearson

µ4
β2 =
s4

 µ4 – momentul centrat de ordin 4

61 62

Variabila cantitativă discretă Variabila cantitativă discretă

 Indicatori de boltire  Indicatori de boltire


 Coeficientul de boltire Fisher
 Dacă γ2>0 distribuţia este leptocurtică
µ4
γ2 = −3
s4  Dacă γ2<0 distribuţia este platicurtică

 Dacă γ2=0 distribuţia este mezocurtică


(boltire medie)

63 64
Variabila cantitativă discretă Variabila cantitativă discretă

 Boltirea  Indicatori ai formei


 Pentru un eşantion de 5 companii de curierat, s-a înregistrat numărul  Rezultate SPSS
coletelor livrate: 12, 20, 24, 30, 34 Statistics

Educational Level (years)


N Valid 474
µ4 = 6457, 6 Missing 0
Mean 13.49
Median
s = 7, 69 Mode
12.00
12
Std. Deviation
Variance
2.885
8.322
γ 1 = −0,114
µ4 6457,6 Distribuţie Skewness -.114
γ2 = −3 = − 3 = 1,84 − 3 = −1,16 Std. Error of Skewness .112
s 4
(59,2) 2 platicurtică Kurtosis
Std. Error of Kurtosis
-.265
.224
γ 2 = −0,265
Range 13
Minimum 8
Maximum 21
Percentiles 25 12.00
65 66 50 12.00
75 15.00

Valori outlier şi valori extreme Valori outlier şi valori extreme


 Pentru un set de date se cunosc:
Q1 = 48
 Valorile outlier şi valorile extreme sunt cele mai 

mici/ cele mai mari valori ale unei distribuţii.  Me = 51


 Q3 = 54
 IQ = Q3 - Q1 = 54 - 48 = 6
 O observaţie este o valoare outlier dacă este
 mai mică decât Q1 – 1,5 x IQ  Valori outlier =valori mai mici decât Q1 – 1,5 x IQ = valori mai mici
 mai mare decât Q3 + 1,5 x IQ decât 48 – 1,5 x 6 = 48 – 9 = 39.
 Valori outlier =valori mai mari decât Q3 + 1,5 x IQ = valori mai mari
 O observaţie este o valoare extremă dacă este decât 54 + 1,5 x 6 = 54 + 9 = 63.
 mai mică decât Q1 – 3 x IQ  Valori extreme =valori mai mici decât Q1 – 3 x IQ = valori mai mici
decât 48 – 3 x 6 = 48 –18 = 30.
 mai mare decât Q3 + 3 x IQ
 Valori extreme = valori mai mari decât Q3 + 3 x IQ = valori mai mari
decât 54 + 3 x 6 = 54 +18 = 72.
 unde IQ = Q3 - Q1 este intervalul interquartilic
 OBSERVAŢIE: Valoare outlier = 35
 OBSERVAŢIE : Valoare extremă: 75
67 68
Valori outlier şi valori extreme Variabila cantitativă continuă

 Pentru setul de date, valorile sunt:  Tabelul de frecvenţă


 Min=42, Q1=48, Me=51, Q3=54 şi Max=60.
 În cazul unei variabile continue, admitem
 Diagrama Box Plot obţinută pentru setul de date.
intervalele de valori:
( x0 , x1 ), ( x1 , x2 ),..., ( xi −1 , xi ),..., ( xk −1 , xk )
 Oricare interval poate fi notat: ji = ( xi −1 , xi )
 Gruparea unităţilor pe intervale de variaţie
duce la pierderea unei părţi a informaţiei
iniţiale.

69 70

Variabila cantitativă continuă Variabila cantitativă continuă

 Tabelul de frecvenţă 1. Indicatori ai tendinţei centrale


 Exemplu: E. Jaba, Statistica, p. 110 (Exemplul 5.3.)  Variabila continuă se discretizează prin
 Pe un eşantion de 200 persoane s-a înregistrat calcularea mijloacelor intervalelor.
timpul de deplasare zilnică de acasa la serviciu.  Mijlocul oricărui interval (xi-1, xi) se notează cu xi‘
Timpul de Număr de
deplasare zilnică persoane
(în min.) unde
( ni )
x
( i −1 − xi ) xi −1 + xi
0 - 30 25 xi' =
30 - 60
60 - 90
50
60
2
90 - 120 45
120 - 150 15  se consideră distribuţia simetrică a valorilor xi în
150 - 180 5 cadrul intervalului.
Total 200
71 72
Variabila cantitativă continuă
Variabila cantitativă continuă

 Indicatori ai tendinţei centrale  Media aritmetică


 Pe un eşantion de 200 persoane s-a înregistrat
 Media aritmetică (media) timpul de deplasare zilnică de acasa la serviciu.
k
Timpul de Număr de k
∑ xx''i ni x +x
unde x' = i −1 i deplasare zilnică
(în min.)
persoane
∑ x'i ni
i =1 xi ' xi ' ni
x= 2 ( ni )
x= i =1
k x
( i −1 −x i) k
∑ ni 0 - 30 25 15 375
∑ ni
i =1 (mijlocul intervalului) 30 - 60
60 - 90
50
60
45
75
2250
4500 i =1
90 - 120 45 105 4725
120 - 150 15 135 2025
14700
150 - 180 5 165 825
x= = 73,5 min
Total 200 --- 14700 200
73 74

Variabila cantitativă continuă


Variabila cantitativă continuă

2. Indicatori ai dispersiei  Abaterea standard


 Varianţa (s2) Timpul de Număr de
deplasare persoane xi ' xi ' − x ( xi ' − x )2 ( xi ' − x )2 ni
2 zilnică (în
∑ ( xi '− x ) ⋅ ni min.) ( ni )
( xi −1 − xi )
s2 = i
0 - 30 25 15 -58,5 3422,25 85556,25
∑ ni 30 - 60 50 45 -28,5 812,25 40612,5
i 60 - 90 60 75 1,5 2,25 135
90 - 120 45 105 31,5 992,25 44651,75
 Abaterea standard (s) 120 - 150 15 135 61,5 3782,25 56733,75
150 - 180 5 165 91,5 8372,25 41861,25

Total 200 --- 269550


s = s2
∑( x ' −x )
i
2
⋅ ni
269550
s= i
= = 1347 ,75 = 36,71 min
75 76
∑n i
i 200
Variabila cantitativă continuă Variabila cantitativă continuă

3. Indicatori ai formei  Histograma


 Asimetria  se ridică dreptunghiuri alăturate cu baza egală cu
mărimea intervalului şi înălţimea proporţională cu
 pe cale grafică: histograma, curba frecvenţa ni
frecvenţelor, diagrama box-plot
 pe cale numerică: - indicatori de asimetrie
(Skewness).

77 78

Variabila cantitativă continuă Variabila cantitativă continuă

 Curba frecvenţelor
 Histograma  se obţine prin ajustarea histogramei
 distribuţie perfect simetrică  părţile curbei pentru cele mai mici şi cele mai mari
x = M 0 = Me valori ale variabilei se numesc cozile distribuţiei

 distribuţie asimetrică la dreapta


x > Me > M0

 distribuţie asimetrică la stânga

x < Me < M0
79 80
Variabila cantitativă continuă Variabila cantitativă continuă

 Diagrama box-plot
 Curba frecvenţelor  se obţine prin reprezentarea umătoarelor 5 valori ale
 distribuţie perfect simetrică unei distribuţii: D1 (Min), Q1, Me, Q3, D9 (Max).
x = M 0 = Me

 distribuţie asimetrică la dreapta


x > Me > M0

 distriuţie asimetrică la stânga


x < Me < M0
81 82

Variabila cantitativă continuă Variabilă categorială nominală

 Diagrama box-plot  Tabelul de frecvenţă


• Frecvenţe absolute simple
• Frecvenţe relative simple
• Frecvenţe relative (%)
 distribuţie asimetrică
la dreapta
 Diagrame specifice
• Diagrama în batoane sau în bare (Bar Chart)
• Cercul de structură (Pie Chart)

 Indicatori specifici
• Modul (Dominanta)

83 84
Variabilă categorială nominală Variabilă categorială nominală

 Tabelul de frecvenţă

85 86

Variabilă categorială nominală Variabilă categorială nominală

 Tabelul de frecvenţă  Tabelul de frecvenţă


 prezintă corespondenţa dintre două şiruri de
date statistice:
• şirul valorilor variabilei (xi)
• frecvenţa de apariţie corespunzătoare
(ni sau fi)

87 88
Variabilă categorială nominală Variabilă categorială nominală

 Tabelul de frecvenţă  Tabelul de frecvenţă


• Frecvenţa absolută simplă (ni) = număr de unităţi
Gender
care poartă simultan nivelul xi al variabilei X.
Frequency Percent
Female 216 45.6 • Frecvenţa relativă simplă (ffi sau fi%) = ponderea
Male 258 54.4 unităţilor care poartă simultan nivelul xi al variabilei X
Total 474 100.0
ni ni
fi = sau f i (%) = ⋅100
 Categoriile variabilei Genul persoanei: xi = {F, M}
∑ ni ∑ ni
Frecvenţa absolută simplă (ni) = Frequency
∑ f i = 1 sau ∑ f i (%) = 100%

 Frecvenţa relativă simplă (fi%) = Percent
 Efectivul total = n = Σni
89 90

Variabilă categorială nominală Variabilă categorială nominală

 Diagrama în batoane (Bar chart)  Cercul de structură (Pie Chart)


• Aria cercului ( 360o ) echivalează cu volumul
colectivităţii (100%)  3,6o ⇔ 1%

91 92
Variabilă categorială nominală Variabilă categorială nominală

 Indicatori ai tendinţei centrale


 Modul (Dominanta)  Determinarea modului
Gender 1. se găseşte frecvenţa maximă (ni = nmax)
Frequency Percent 2. se citeşte, în dreptul frecvenţei maxime, valoarea
Care este categoria Female 216 45.6 corespunzătoare caracteristicii care este egală cu
Male 258 54.4
de gen cea mai modul (xi = M0)
Total 474 100.0
frecvent întâlnită ?
Gender
Cele mai multe persoane sunt de nmax = 258
Frequency Percent
Cele mai multe gen masculin. Female 216 45.6
Male 258 54.4
pesoane, de ce gen Total 474 100.0
sunt? Categoria de gen dominantă este M0=Masculin
categoria masculin.
93 94

Variabilă categorială ordinală Variabilă categorială ordinală

 Tabelul de frecvenţă  Tabelul de frecvenţă


• Frecvenţe absolute simple
Employment Category
• Frecvenţe relative simple
• Frecvenţe absolute/ relative cumulate Cumulative
Frequency Percent Percent
First level managers 363 76.6 76.6
 Diagrame specifice Middle-level managers 84 17.7 94.3
Top-level managers 27 5.7 100.0
• Diagrama în batoane sau în bare (Bar Chart) Total 474 100.0
• Cercul de structură (Pie Chart)
 Categoriile variabilei : xi = {Nivel 1, Nivel 2, Nivel 3}
 Indicatori specifici  Frecvenţa absolută simplă (ni) = Frequency
• Modul (Dominanta)  Frecvenţa relativă simplă (fi%) = Percent
• Mediana  Frecvenţa relativă cumulată (Fi%) = Cumulative percent
95 • Quartilele 96
Variabilă categorială ordinală Variabilă categorială ordinală
 Indicatori statistici descriptivi
 Diagrame specifice:  Modul (Dominanta)
 Diagrama în batoane (Bar chart) Employment Category

 Diagrame de structură (Pie) Cumulative


Frequency Percent Percent
First level managers 363 76.6 76.6
Middle-level managers 84 17.7 94.3
Top-level managers 27 5.7 100.0
Total 474 100.0

Care este categoria de manageri cea mai


frecvent întâlnită ?
nmax=363 M0 = Manager inferior (nivel 1)
97 98

Variabilă categorială ordinală Variabilă categorială ordinală


 Indicatori statistici descriptivi
 Mediana  Determinarea medianei
Employment Category
 Serie cu frecvenţă
n +1
Cumulative 1. Se calculează UMe: U Me =
Frequency Percent Percent
2
First level managers 363 76.6 76.6 2. Se determină frecvenţele cumulate (Ni ↓)
Middle-level managers 84 17.7 94.3
Top-level managers 27 5.7 100.0 3. Se găseşte locul UMe în şirul frecvenţelor cumulate,
Total 474 100.0 după condiţia N i ≥ U
Me

4. În dreptul frecvenţei cumulate N i ≥ U Me se citeşte,


Care este valoarea din centrul seriei? de pe coloana variabilei, valoarea xi egală cu Me.

99 100
Variabilă categorială ordinală Variabilă categorială ordinală

 Determinarea medianei
 Serie cu frecvenţă  Generalizarea medianei: quantilele
Employment Category  Quartile (Q1, Q2, Q3)
Cumulative
Frequency Percent Percent  Decile (D1, ...., D9)
First level managers 363 76.6 76.6
Middle-level managers 84 17.7 94.3
Top-level managers 27 5.7 100.0
 Centile (C1, ...., C99)
Total 474 100.0
 Q2 = D5 = C50 = Me
Me
U = 50%

Me = Manager inferior (nivel 1): 50% din angajați sunt


cel mult manageri nivel 1, iar 50% din angajați sunt cel
101 puțin manageri nivel 1. 102