Académique Documents
Professionnel Documents
Culture Documents
Curso: Especializao em Administrao Financeira Disciplina: Mtodos Quantitativos Aplicados a Finanas Tabelas de frequncias Tabelas de contingncia Grficos Medidas de localizao Medidas de disperso Medidas de assimetria Medidas de achatamento (curtose)
FEAAC-UFC Slvia Pedro Rebouas 2
2. Estatstica Descritiva
Professora Adjunta Slvia Pedro Rebouas smdpedro@gmail.com
2013
TABELAS DE FREQUNCIAS
Estabelecem correspondncias entre os valores observados da varivel estatstica e as respetivas frequncias (distribuio de frequncias). Notao utilizada: ni = frequncia absoluta de ordem i fi = frequncia relativa de ordem i Ni = frequncia absoluta acumulada de ordem i Fi = frequncia relativa acumulada de ordem i n = dimenso da amostra k = nmero de classes ou categorias (k n)
FEAAC-UFC Slvia Pedro Rebouas 3
FEAAC-UFC
Muito boa: no podia ser melhor Boa Mais ou menos: boa e m em partes iguais M Muito m: no podia ser pior
Categoria Muito boa Boa Mais ou menos M Muito m Total
5 FEAAC-UFC
ni 52 32 18 8 110
ni 10 28 47 20 5 110
Ni 10 38 85 105 110
FEAAC-UFC
1 0 4 0 5 4
0 1 0 3 0 3
1 1 2 0 2 0
1 1 4 0 3 7
1 1 0 6 0 2
5 3 0 1 4 0
3 0 3 2 0
FEAAC-UFC
log 2 n =
ln n ln 2
PESTANA, D.; VELOSA, S. Introduo Probabilidade e Estatstica. Volume 1, Lisboa: Fundao Calouste Gulbenkian, 2002.
FEAAC-UFC
FEAAC-UFC
Exemplo
Mediram-se as alturas (em cm) de 20 adolescentes.
Para n = 20, k = 5 (Regra de Sturges) Amplitude de variao amostral = 174 149 = 25 cm Amplitude de cada classe: h = 25/5 = 5 cm Tabela de frequncias:
Classe [149; 154[ [154; 159[ [159; 164[ [164; 169[ [169; 174] Total
11 FEAAC-UFC
ni 4 4 4 3 5 20
Ni 4 8 12 15 20
12
EXEMPLO 2:
TABELAS DE CONTINGNCIA
Usam-se para cruzar a informao de duas variveis. So tabelas de dupla entrada, sendo cada entrada relativa a uma das variveis. Podem conter: frequncias absolutas; frequncias relativas.
FEAAC-UFC Slvia Pedro Rebouas 13
Populao residente em Portugal, segundo o sexo, por distribuio geogrfica (NUTS II)
Sexo Distribuio geogrfica (NUTS II) Masculino Feminino Norte Centro Lisboa e Vale do Tejo Alentejo Algarve Aores Madeira TOTAL 856 627 262 396 195 725 119 486 115 211 925 551 273 357 199 493 122 277 129 800 TOTAL
1 782 931 1 904 362 3 687 293 1 782 178 535 753 395 218 241 763 245 011 1 667 765 1 801 136 3 468 901
Grupos de Complexidade Organizacional Quantidade Baixa complexidade % Mdia baixa complexidade Mdia alta complexidade Quantidade % Quantidade % Quantidade Alta complexidade % Quantidade Total %
Nvel de Governana Corporativa MT 4 16,7% 5 21,7% 3 12,5% 7 N1 1 4,2% 1 4,3% 2 8,3% 11 N2 3 12,5% 3 13,0% 2 8,3% 1 4,2% 9 9,5% NM 16 66,7% 14 60,9% 17 70,8% 5 20,8% 52 54,7%
GRFICOS
Grfico circular ou de setores
Grfico circular da imagem que os clientes tm de uma instituio bancria
Mau Excelente 13,45% Regular 19,34% 8,20%
29,2% 45,8% 19 15
100,0% 95 100,0%
20,0% 15,8%
Bom 37,83%
Fonte: De Luca, M.M.; Assuno, R.R.; Vasconcelos, A.C. & Rebouas, S.P. Complexidade organizacional e governana corporativa nas maiores companhias abertas do Brasil, trabalho no publicado, 2013.
FEAAC-UFC Slvia Pedro Rebouas 15 FEAAC-UFC
16
Histograma
Para o construir, desenham-se barras rectangulares. As bases so iguais aos intervalos de classe e as alturas so as respectivas frequncias (absolutas ou relativas). Histograma do ndice de satisfao dos clientes com a instituio bancria
Diagrama de barras
Utilizam-se para apresentar variveis qualitativas ou quantitativas discretas.
Diagramas de barras dos indicadores da satisfao dos pacientes com uma internao hospitalar, referentes ao pessoal mdico
35 30 25 20 (%) 15 10 5 0 Ateno prestada Disponibilidade ao seu estado de sade Excelente Cuidados e carinho Aspectos tcnicos Informao fornecida Coordenao
Muito Bom
Bom
Regular
Mau
FEAAC-UFC
17
FEAAC-UFC
18
Diagrama de disperso
Frana Holanda Cuba
80
70
China Botswana
60
Camares Somlia
50
R Sq Linear = 0,918
Tanznia Zmbia
10,0
20,0
30,0
40,0
50,0
FEAAC-UFC
Mdia aritmtica
EXEMPLO 1:
x
x=
i =1
EXEMPLO 2:
Pretende-se estimar o tempo mdio de vida (em horas) de determinado tipo de bactrias. Para uma amostra de 9 observaes, obtiveram-se os seguintes dados:
12,4 11,2 12,4 13,5 15,1 14,3 13,6 10,6 113,5
A mdia aritmtica :
x=
FEAAC-UFC
50 + 86 + L + 74 804 = = 67 min 12 12
Slvia Pedro Rebouas 21
x=
FEAAC-UFC
Comentrios:
Todos os valores observados excepo de um, esto no intervalo [10,6; 15,1]. A mdia aritmtica (24,07 horas) est muito afastada deste intervalo. O valor 113,5 horas inflacionou bastante a mdia! Ter sido realmente observado? Ter ocorrido um erro de digitao? Se o valor correcto for 13,5, a mdia passa a ser de 12,96 horas (bastante mais razovel). A mdia uma medida muito sensvel a outliers.
FEAAC-UFC Slvia Pedro Rebouas 23
EXEMPLO 3:
Os dados que se seguem dizem respeito ao nmero de eventos em que participaram, nos ltimos 5 anos, 6 professores:
8 5 7 4 3 6
x=
FEAAC-UFC
8 + 7 + L + 6 33 = = 5,5 eventos 6 6
Slvia Pedro Rebouas 24
EXEMPLO 4: dados organizados numa tabela de frequncias (no agrupados) Registou-se o n. de deslocaes superiores a 100 km realizadas no ltimo semestre pelos funcionrios de uma empresa, representado pela varivel X e caracterizada por: xi ni Ni fi Fi ni xi
3 4 7 8 12 Total
k
di 8 - 5,5 = 2,5 7 - 5,5 = 1,5 3 - 5,5 = -2,5 5 - 5,5 = -0,5 4 - 5,5 = -1,5 6 - 5,5 = 0,5 0
PROPRIEDADE: A soma dos desvios em relao mdia nula (os desvios positivos e os negativos anulam-se).
2 5 8 4 7 26
i i
2 7 15 19 26
6 20 56 32 84 198
(x
i =1
x) = 0
x=
25 FEAAC-UFC
n x
i =1
x=
Mdia ponderada
Utiliza-se quando se pretende atribuir uma ponderao (peso) diferente a cada um dos valores observados.
ni 4 4 4 3 5 20
Ni 4 8 12 15 20
w
x=
i =1 n i =1
xi
i
n m
i
x
FEAAC-UFC
i =1
= f i mi
i =1
3235 = 161,75 cm 20
27
Um exame 3 vezes mais importante do que um teste. Se uma aluno tiver 17 valores no exame e 2 testes de 14 e 15 valores, qual ser a classificao mdia?
x=
FEAAC-UFC
Mediana
A mediana (Me) o valor da observao da varivel estatstica que divide a amostra em dois grupos com igual nmero de elementos. mais resistente do que a mdia face presena de valores anmalos (outliers). O seu clculo requer a prvia ordenao dos valores numricos, seguidamente: se n mpar, a mediana o elemento mdio; se n par, a mediana a mdia aritmtica das duas observaes centrais.
FEAAC-UFC Slvia Pedro Rebouas 29
EXEMPLOS: Considerem-se os seguintes dados: 1, 4, 5, 9, 28. Qual a mediana dos dados? Resposta: A mediana 5. Qual a mediana dos dados: 4, 10, 2, 7? Resposta: Para se calcular a mediana, os dados tm que estar ordenados. Considere-se ento a ordenao crescente: 2, 4, 7, 10. A mediana (4+7)/2 = 5,5.
FEAAC-UFC Slvia Pedro Rebouas 30
Moda
Chama-se moda (Mo) de um conjunto de n observaes de uma varivel estatstica, observao que ocorre com maior frequncia. A moda apenas leva em conta o valor com maior frequncia e no a posio desse valor no conjunto dos dados. Um conjunto de dados pode ser amodal (no tem moda), unimodal (tem 1 moda), bimodal (tem 2 modas) e assim sucessivamente.
FEAAC-UFC Slvia Pedro Rebouas 31
EXEMPLOS: Se tivermos o seguinte conjunto de dados: 1, 4, 1, 0, 2, 1, 1, 3, 2, 9, 1, 2 O elemento que ocorre com maior frequncia o nmero 1, que aparece 5 vezes. A moda o valor 1. Considerem-se os valores observados para o nmero de camas existentes em cada um dos quartos de um hospital: 3, 4, 9, 8, 2, 6, 7, 3, 4, 3, 7, 5, 3 A moda 3 camas.
FEAAC-UFC Slvia Pedro Rebouas 32
onde [np] = caracterstica de np p = 0,25 para o clculo de Q1 p = 0,20 para o clculo de D2 p = 0,75 para o clculo de P75
Quartis - Exemplos
Considere-se a amostra: 2, 5, 6, 9, 10, 13, 15 Q1 = x 2 = 5 (p = 0,25 np = 1,75) Me = Q2 = D5 = P50 = x4 = 9 (p = 0,50 np = 3,5) Q3 = P75 = x6 = 13 (p = 0,75 np = 5,25) Para a amostra: 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 Q1 = (x3+x4)/2 = (2+3)/2 = 2,5 (p = 0,25 np = 3) Q2 = (x6+x7)/2 = (5+6)/2 = 5,5 (p = 0,50 np = 6) Q3 = (x9+x10)/2 = (9+9)/2 = 9 (p = 0,75 np = 9)
MEDIDAS DE DISPERSO
Amplitude de variao amostral
A = max( X i ) min( X i )
EXEMPLO: Para os seguintes nmeros de cotistas de 7 fundos de investimento: {2, 5, 6, 9, 10, 13, 15} A = 15 2 = 13 cotistas
FEAAC-UFC Slvia Pedro Rebouas 36
Amplitude inter-quartil
Varincia amostral
Para medir a disperso dos dados em torno da mdia usa-se, ento, a varincia amostral, que leva em considerao o tamanho da amostra:
(x x)
i
x
=
i =1
s2 =
i =1
x2
Uma vez que a varincia envolve a soma de quadrados, a unidade em que se exprime no a mesma que a dos dados. O desvio padro veio resolver este problema.
FEAAC-UFC Slvia Pedro Rebouas 38
(x x)
i
x
=
i =1
s =
i =1
(x x)
i
x
=
i =1
s=
i =1
x2
EXEMPLO:
d -2 0 -1 -3 4 2 0
(x x)
i
x
=
i =1
s=
FEAAC-UFC
i =1
d 4 0 1 9 16 4 34
x=
1 + 3 + 2 + 0 + 7 + 5 18 = = 3 dias 6 6
s2 =
s=
34 = 5,67 dias 2 6
34 = 2,38 dias 6
40
n (x x)
i i
n x
=
i =1
2 i i
EXEMPLO:
x 55 65 75 85 95 105 115 595
FEAAC-UFC
s=
nx 440 650 1 200 1 190 950 525 230 5 185
i =1
x2
n (m x )
i i
n m
i
2 i
s=
i =1
EXEMPLO:
Classe [0; 30[ [30; 60[ [60; 90[ [90; 120[ [120; 150[ [150; 180[ 0
FEAAC-UFC
n
2
i =1
x2
n 8 10 16 14 10 5 2 65
nx2 24 200 42 250 x= 90 000 101 150 90 250 55 125 s= 26 450 429 425
Slvia Pedro Rebouas
n x
i =1
i i
5185 = 79,769 65
n 3 9 20 22 13 8 75
6 nm ni mi 675 7 335 i =1 x = = = 97,8 18 225 n 75 112 500 242 550 236 925 s = 828 675 97,8 2 = 38,525 75 217 800 828 675
42
Volatilidade
A volatilidade pode ser definida como uma medida de disperso. A forma convencionada para mensurar e comparar a volatilidade das diferentes variveis por meio do clculo dos desvios padro das variveis. Por exemplo, a volatilidade dos diferentes preos unitrios (PUs) de negociao de um ttulo pblico em determinado dia ser o desvio padro das diferentes cotaes do ttulo.
http://www.derivativoserisco.com.br/download/revisaoestatistica.pdf
FEAAC-UFC Slvia Pedro Rebouas 43 FEAAC-UFC
Desvio mdio
| x x | | d
i
Desvio mdio =
EXEMPLO:
xi 8 7 3 5 4 6 33
i =1
n
di |d i | 2.5 1.5 2.5 0.5 1.5 0.5 9
i =1
Desvio mdio =
9 = 1,5 6
44
EXEMPLO 1:
As estaturas apresentam uma disperso relativa ligeiramente menor do que os pesos (o que no se verifica se compararmos a disperso absoluta). Como as duas variveis so expressas em unidades diferentes, a disperso que se deve comparar a relativa e no a absoluta.
FEAAC-UFC Slvia Pedro Rebouas 46
EXEMPLO 2: Imaginem-se dois grupos de empresas: No primeiro grupo, as empresas tm idades: 3, 1 e 5. No segundo grupo, as empresas tm idades: 55, 57 e 53. No primeiro grupo, a mdia de idade 3 anos e, no segundo grupo, a mdia de idade 55 anos. Nos dois grupos a disperso absoluta dos dados, medida pelo desvio padro 2 anos. Mas, as diferenas de 2 anos so muito mais importantes no primeiro grupo, que tem mdia 3, do que no segundo grupo, que tem mdia 55.
FEAAC-UFC Slvia Pedro Rebouas 47
No primeiro grupo: cv = 2/3 = 0,6667 No segundo grupo: cv = 2/55 = 0,0364 Um coeficiente de variao igual a 0,6667 indica que a disperso dos dados em relao mdia muito grande, ou seja, a disperso relativa alta. Um coeficiente de variao de 0,0364 indica que a disperso dos dados em relao mdia pequena. O coeficiente de variao mede em termos relativos a disperso em relao mdia.
FEAAC-UFC Slvia Pedro Rebouas 48
ASSIMETRIA
O mtodo mais simples para se medir o grau de assimetria de uma distribuio consiste na comparao de 3 medidas de tendncia central: a mdia, a mediana e a moda.
FEAAC-UFC
49
CURTOSE
As medidas de achatamento (ou curtose) indicam a intensidade das frequncias na vizinhana dos valores centrais.
FEAAC-UFC
52