Académique Documents
Professionnel Documents
Culture Documents
Estatstica Descritiva
Prof. Luciana Y. Tsuchiya
ConceitosBsicos
Populao: todo o conjunto de elementos que possuam ao menos
umacaractersticacomumobservvel.
Exemplo: Usurios de um plano de sade, membros de uma equipe
de futebol, funcionrios de uma empresa, eleitores de um
municpio,estadooupas,alunosdeumaescola,osassociados
de um sindicato, escolas de uma cidade, lmpadas, salrio
mnimo.
Amostra: uma parte da populao que ser avaliada por um
critriocomum.
Emalgunscasosseriaimpossvelentrevistartodososelementos
de uma populao, pois levaria muito tempo para concluir o
trabalho ou at mesmo seria financeiramente invivel, dessa
forma, o nmero de entrevistados corresponde a uma quantidade
determinadadeelementosdoconjunto,umaamostra.
2
ConceitosBsicos
Varivel: So caractersticas que podem ser observadas ou
medidasemcadaelementodapopulaosobasmesmascondies.
Podemserclassificadasemqualitativasouquantitativas.
Ordinais:obedecemaumarelaodeordem.
Exemplo: conceitos como timo, bom,regular e ruim,
classesocial,graudeinstruo,etc.
Exemplos:Gruposanguneo:O,A,B,AB
Gnero:Masculino,Feminino 3
ConceitosBsicos
Varivelquantitativa:Sodecorrentesdedadosexpressos em
formanumrica.Podemsesubdividiremdiscretasecontnuas.
Discretas:Assumemvaloresinteiros.Normalmenteapuradas
porcontagem
Exemplos:nmerodepeasdefeituosas
nmerodeempregadosemumaempresa
Exemplos:pesolquidodeumprodutoenlatado
teordeferroemumminrio
dimetrodeumparafuso
4
Conceitos Bsicos
Dadosbrutos:Soosdadosiniciaisobtidosapartirdeum
levantamentodeestatstica.Estesdados,pornoestarem
organizadosnofornecemmuitainformaosobreoobjeto
deestudo.
Rol:Organizaodosdadosporordemdevalor,sendoele
crescenteoudecrescente
Exemplo:Relaodosdadosdeanlisedeteordeferroem
umminrioemumaamostrade50lotes(%).
Qualotipodevarivelanalisadanestecaso?
58 34 56 24 34 26 14 16 45 56 11 11 12 12 14 16 19 22 23 23
19 22 34 53 45 23 11 23 32 32 23 23 24 25 26 27 29 29 31 31
25 34 34 38 12 23 34 12 11 45 32 32 32 33 34 34 34 34 34 34
32 37 31 27 46 37 29 45 33 53 37 37 38 41 41 41 43 45 45 45
31 56 29 23 41 56 41 41 43 55
45 46 53 53 55 56 56 56 56 58
5
Dados brutos Rol
Tabelas
umconjuntodedadosestatsticosassociadosaumfenmeno
dispostosemumaordemdeclassificao,emumaorganizao
racionaleprticadeapresentao.
Elementosdatabela:
Ttulo:Ottulodeveconteranatureza(espcie),olocalea
pocadofato.
Corpo:Conjuntodelinhasecolunasquecontmasinformaes.
Cabealho:apartesuperiordatabela(primeiralinha)que
especificaascolunas
Colunaindicadora:aprimeiracolunaqueespecificaas
linhas
Elementoscomplementares(norodap):colocadonoespao
abaixodatabelaepodemconter:
fonte:origemdosdados
notas:soinformaesdenaturezageral
6
Exemplo1
Fonte: Rev. bras. eng. agrc. ambient. vol.17 no.1 Campina Grande Jan. 2013
7
DistribuiodeFrequncias
Definio:atabelaqueindicaasfrequnciascomque
ocorremoscasoscorrespondentesaosvaloresdeuma
populaoouamostra.
Frequnciaabsoluta(fi):afrequnciaabsolutaest
associadaaonmerodevezesqueumvalordavarivel
citado.
Frequnciaacumulada(Fi):onumerodevezesqueuma
varivelassumeumvalorinferiorouigualaessevalor.
Frequnciarelativa(fr):aproporodecertovalorem
umapopulaoouamostra.determinadaemporcentagem,
atravsdarelao(razo)entreafrequnciaabsoluta
davariveleosomatriodosvalorescitados.Emoutras
palavras,afrequnciarelativaaprobabilidade(em
porcentagem)queavariveltemdeassumirumvalor.
8
Exemplo2
Umaamostracom50casaisavaliadaquantoaquantidade
defilhosquecadacasalpossui.Osdadosobtidosesto
organizadosnorolabaixoesquerda.Organizandoa
tabeladefrequnciaabsolutatemos:
10
ContinuaodoExemplo2
ClculodaFrequnciarelativa
A frequncia relativa do nmero de casais que possui 1 filho dada por 13/50 =
0,26 que igual a 26%. A quarta coluna da tabela abaixo exibe as frequncias
relativas do exemplo.
Tabela:Quantidadedefilhosdeumaamostrade50casais
Como calcular a frequncia
N de Freq. abs. Freq. Freq. rel. relativa em porcentagem?
filhos acum. %
Freq . absoluta
0 6 6 12 % Freq. rel .= 100
Total
1 13 19 26 %
13/50=0,26 0,26*100 =26%
2 12 31 24 %
3 10 41 20 %
4 4 45 8%
5 3 48 6%
6 2 50 4%
Qual a porcentagem de casais
total 50 100%
que possuem 6 filhos? 11
Resposta: 4 %
Exemplo3:Distribuiodefrequncia
paravarivelqualitativanominal
Aseguinteamostraqueresultoudeobservaravarivel
Cordosolhosem20alunosdeumaturma
Castanhos,Pretos,Castanhos,Azuis,Castanhos,
Castanhos,Pretos,Castanhos,Verdes,Castanhos,Pretos,
Castanhos,Azuis,Castanhos,Castanhos,Pretos,Pretos,
Castanhos,Pretos,Pretos
podeserresumidanaseguintetabeladefrequncias:
12
Exemplo retirado da pgina http://wikiciencias.casadasciencias.org/wiki/index.php/Tabela_de_frequ%c3%aancias
DistribuiodeFrequnciasporclasses
Emalgumassituaes,aquantidadedeinformaes
diferenciadastornainvivelaconstruodeumatabelade
frequnciascomumalinhaparacadavalordavarivel.Isso
ocorreprincipalmenteparavariveisquantitativas
contnuas.Nessescasosoptamosporagruparosdadosna
tabelaemintervalosdeclasses.
Exemplo:Atabelaabaixomostraadistribuiodaalturade
umaamostrade30alunosdeumaturma.
13
DistribuiodeFrequnciasporclasses
Paraadeterminaodasclassesconsideramososseguintes
elementosdadistribuio:
Classe:cadaumdosgruposdevaloresemquesesubdivide
aamplitudetotaldoconjuntodevaloresobservadosda
varivel.
Amplitudetotal(L):adiferenaentreomaisalto(x max)e
omaisbaixo(xmin)dosvaloresdeumadistribuio.
LimitesdeClasse:Oslimitesdeclassessoseusvalores
extremosouseja,olimiteinferior(L i)eosuperior(L s)da
classe.
Amplitudedointervalodeclasse(h):ocomprimentoda
classe,sendogeralmentedefinidacomoadiferenaentreos
limitessuperioreinferior.
PontoMdiodeClassei(x i):opontoeqidistantedos
limitesdeclasse.x i=(Ls+Li)/2
14
Metodologiaparaaconstruodeuma
tabeladeclasses
1.Organizarosdadosemrol,casonoestejam
organizados
2.Calcularaamplitudetotaldadistribuiodedados
Xmaxxmin
3.Existemvrioscritriosparadeterminaraquantidade
declasses.
Sejakaquantidadedeclassesenonmerodeelementosda
amostra
RegradeSturges(RegradoLogaritmo)
k=1+3,3log(n)
RegradaPotnciade2
k=menorvalorinteirotalque2 k?n
Regradaraizquadrada
Bomsenso!!!DecidaaquantidadedeclassesqueGARANTA
observarcomoosvaloressedistribuem. 15
Metodologiaparaaconstruodeumatabela
declasses
4.Definimosaamplitudehdecadaclasse,dividindoa
amplitudetotalpelonmerodeclassesk.Ouseja,
h=L/k
Frequentementeovalordeharredondado.
5.Constroemseasclassescomointervalossemiabertos,
fechadosesquerdaeabertosdireita,sendoqueolimite
inferiordaprimeiraclasseovalormaisbaixona
distribuiodedados.Cadaclasseteramplitudeh.Desta
forma:
1aclasse:xmnatxmn+h
2aclasse:xmn+hatxmn+2.h
........................
kaclasse:xmn+h.(k1)atxmn+k.h
Notaesparaointervalocomlimiteinferiorxelimite
superiory:
[x,y),[x,y[,x|y,x|y 16
Metodologiaparaaconstruodeuma
tabeladeclasses
6.Construaatabeladefrequncias,atribuindoparaa
frequnciaabsolutadecadaclasseaquantidadede
valoresqueseencaixamnaclasse.
Notequeatabeladedistribuiodefrequnciascom
classesnonica,poisexistemdiversoscritriospara
decidiraquantidadedeclasses.
17
Exerccio1/Exemplo
Atabelaabaixoexibeumarelaodedadosdaanlisede
teordeferroemumminrioemumaamostrade50lotes(%).
11 11 12 12 14 16 19 22 23 23
23 23 24 25 26 27 29 29 31 31
32 32 32 33 34 34 34 34 34 34
37 37 38 41 41 41 43 45 45 45
45 46 53 53 55 56 56 56 56 58
Construaumatabeladedistribuiodefrequnciascomclassesdos
dados
1.Osdadosjestoorganizadosemformaderol?
2.Calculeaamplitudetotal.
3.Determineaquantidadekdeclasses.Qualcritrioutilizar?
4.Calculeaamplitudehdasclasses.
5.Calculeoslimitesdecadaclasse.
18
Continuaoexerccio1/Exemplo
11 11 12 12 14 16 19 22 23 23
23 23 24 25 26 27 29 29 31 31
32 32 32 33 34 34 34 34 34 34
37 37 38 41 41 41 43 45 45 45
45 46 53 53 55 56 56 56 56 58
Completeatabela...
19
Medidasdetendnciacentralou
deposio
Quandotrabalhamoscomvariveisquantitativascomgrande
nmerodeobservaesnecessitamosdeparmetrospara
descreversucintamenteocomportamentodesseconjuntode
informaes.Paraisso,utilizamosasmedidasdetendncia
centralqueexpressamondetendeaseconcentrarum
conjuntodedadosnumricos.
Asmedidasdetendnciacentralmaiscomumso:
Mdiaaritmtica
Mediana
Moda
20
MdiaAritmtica
Mdia Aritmtica(X) o quociente da diviso
da soma dos valores da varivel pela quantidade
ndeelementosdaamostra.Ouseja,
Observao:Quandocalculamosamdiadeumaamostrada
populaodizemosqueumaestimaodamdiada
21
populao.
Exemplos
1) Sabendose que a produo leiteira da vaca A, durante
uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros,
temosqueamdiadaproduodasemana
2)Calculeamdiadosdadosagrupadosporclasses
22
EXERCCIO2
23
EXERCCIOS
3) A tabela abaixo mostra a massa 4) A tabela abaixo mostra a
de um grupo de 88 pessoas. Os quantidade de filhos de uma
dados esto organizados na forma amostra de 34 casais. Calcule a
de intervalos. Calcule a mdia dos mdia aritmtica da quantidade de
dados
aritmtica da massa das 88 filhos por casal.
pessoas
24
Mediana(Md):Amediana,umamedidadelocalizaodo
centrodadistribuiodosdados,definidadoseguinte
modo:
Ordenadososelementosdaamostraemformaderolouem
umatabeladefrequncias,amedianaovalor
(pertencenteounoamostra)queadivideaomeioa
distribuiodedados,isto,50%doselementosda
amostrasomenoresouiguaismedianaeosoutros50%
somaioresouiguaismediana.
Paraasuadeterminaoutilizaseaseguinteregra,
depoisdeordenadaaamostradenelementos:
Senmpar,amedianaoelementodomeio.A
posiodesteelementopodeserencontradautilizandoa
frmula n+1
2
Senpar,amedianadadapelamdiaaritmtica
dosdoiselementosdomeio,ouseja,doselementosque
n n
seencontramnasposiese.
+1
2 2 25
EXEMPLO4
Medianadeumconjuntodedadoscomnmerodeelementosmpar:
Considereoconjuntodedadosabaixo,referentesaosal riodos
funcionriosdeumaempresaemreais.
Salrios:150013001200125016001100145012101980
Observequenesseconjuntodedadostemos9elementos,9
salrios.Primeirodevemosmontarorol:
Rol={1100,1200,1210,1250,1300,1450,1500,1600,1980}
Quandoonmerodeelementosdoconjuntodedadosformpar,a
medianaovalorqueestnaposioquedivideoconjuntoao
meio,portantoMd=1300.Observequeesquerdaedireitade
1300existem4valores.
Usandoafrmula,temosquen=9,logoamedianaoelementoque
estnaposio5,pois
n+1 9+1
= =5
2 2
Ouseja,oelemento1300. 26
EXEMPLO5
Medianadeumconjuntodedadoscomnmerodeelementospar:
Considereoconjuntodedadosabaixo,referenteaosalriodos
funcionriosdeumaempresa.
Salrios:1500130012001250160011001450121019801420
Rol={1100,1200,1210,1250,1300,1420,1450,1500,1600,1980}
Nesseconjuntoexistem10elementos.Nessecasoamedianaseramdia
aritmticadosdoisvalorescentrais.Notequetantodireitacomo
esquerdadosdoisvalorescentraish4elementos.Assim,
1300+1420 2720
Md= = =1360
2 2
Usandoafrmula,temosqueasposiescentraissoa5aea6a
posiespois
Ousejadevemosfazeramdiaaritmticadoselementosqueestona
quintaesextaposies
27
EXEMPLOS6
a) Considere os dados relacionados b) Considere os dados relacionados
s idades de uma amostra de 21 idade de uma amostra de 14
pessoas agrupados na tabela de pessoas agrupados na tabela de
distribuio de frequncias abaixo. distribuio de frequncias abaixo.
28
Moda(Mo):Menosutilizada,amodaamedidade
tendnciacentralqueconsistenovalorobservadocom
maisfrequnciaemumconjuntodedados.Seoconjunto
dedadosnopossuirmodaeleditoamodal.
Exemplo:Emrelaoaonmerodefilhosde50casais
entrevistadosqualquantidadedefilhosamoda?
N de Freq. abs. Freq. Freq. rel.
filhos acum. %
0 6 6 12 %
1 13 19 26 %
2 12 31 24 %
3 10 41 20 %
4 4 45 8%
5 3 48 6%
A moda 1 filho, 6 2 50 4%
pois o valor que total 50 50 100%
mais se repete
29
MdiaxMediana
Amdiaaritmticamuitosensvelavaloresextremosdeumconjuntode
observaes,enquantoamediananosofremuitocomapresenadealguns
valoresmuitoaltosoumuitobaixos.Devemospreferiramedianacomomedida
sintetizadoraquandohpredominnciadevaloreselevadosnosextremosdo
rol.
Exemplo:Considereosseguintesvaloresqueumavarivelassume
{200,250,250,300,450,460,510}
Calculandoamdia(X)eamediana(Md)temos
X=345,7Md=300
Tantoamdiaquantoamedianasoboasmedidasdeposio.
Exemplo:Considereosseguintesvaloresqueumavarivelassume
{200,250,250,300,450,460,2300}
Calculandoamdia(X)eamediana(Md)temos
X=601Md=300
Devidoaovalor2300,preferivelutilizarMd.
30
Exerccios
5)Encontraramedianaea 6)Atabelaabaixomostra
modadosdadosabaixo aquantidadedefilhosde
referentesaumconjuntode umaamostrade34casais.
resultadosdeanlisesda Calculeamedianaeamoda
concentraodeoxigniodeum dosdadosabaixo
determinadorioemfunodo
ms.
Ms [O2] (mg/l)
Janeiro 7,0
Fevereiro 8,0
Maro 7,0
Abril 5,0
Maio 7,0
Junho 5,0
Julho 4,0
Agosto 3,0
Setembro 1,0
Outubro 7,0
Novembro 6,0
31
Dezembro 7,0
Medidasdedisperso
Asmedidasdetendnciacentralapresentadasfornecema
informaodosdadosapenasanvelpontual,semilustrar
outrosaspectosreferentesformacomoosdadosesto
distribudosnaamostra.
Asmedidasdedispersosoutilizadasparaavaliarograude
variabilidade,oudisperso,dosvaloresemtornodamdia
Exemplo:Considereoexemplodeduaslinhadeproduodeumapea.A
medidamdiadocomprimentodapeade75cmeambasaslinhasesto
produzindopeascommdiasprximasdessevalor.Podemosconsiderar
queaspeasproduzidasporambasaslinhassoadequadas?
Aspeasproduzidaspelaprimeiralinhadeproduosomelhoresqueasegunda.
Issoocorreporqueadispersodoselementosemtornodamdiamenor,ouseja,os
32
elementosestomaisconcentradosemtornodamdianaprimeiralinhadeproduo.
Medidasdedisperso
AsMedidasdedispersomaisutilizadasso:
Amplitude
Varincia
DesvioPadro
33
Amplitude:adiferenaentreovalormaisaltoeo
valormaisbaixoqueumavarivelassume.
Exemplo:
Peso(Kg)de6ginastas:
554647465342
Amplitude=maiorvalormenorvalor=5542=13
34
Varinciapopulacional
calculadaparaapopulaotoda.amdiadosquadradosdas
diferenasentrecadavalorqueumavarivelassumeeamdiados
valores.
SendoNotamanhodapopulao,xiparai=1,2,...,n,osvalores
queavarivelassumeeamdiadestesvalores,avarincia
calculadapelafrmula:
Estafrmulaequivalentesfrmulasabaixoquesomaisfceis
deaplicar
Sendonotamanhodaamostra,xiparai=1,2,...,n,osvalores
queavarivelassumeeamdiadestesvalores,avarincia
calculadapelafrmula:
Estafrmulaequivalentesfrmulasabaixoquesomaisfceis
deaplicar
Eleobservouqueotempodealgunsdeseuscorredoresest
apresentandoconsidervelvariao,oquepoderesultarem
derrotaemumacompetiooficial.
Avarinciaumamedidadedispersoquepermitiridentificar
adistnciaemqueostemposdecadaatletaestodamdia
aritmtica.
37
Resoluoemplanilhaeletrnica
38
...Resoluo do mesmo exemplo
Para calcular a varincia, necessrio primeiramente, encontrar a mdia aritmtica (x) dos tempos de
cada atleta.
Joo x J =
63+60+59+55+62 299
= =59,8min
5 5
54+59+60+57+61 291
Pedro x P = = =58,2min
5 5
60+63+58+62+55 298
Marcos x M = = =59,6 min
5 5
A varincia do tempo de cada corredor pode ser calculada atravs da seguinte frmula:
2 2 2 2 2
(dia1x) +(dia2x) +(dia3x) +(dia4x) +(dia5x)
Var=
totaldedias
39
...Continuao do exemplo
2 2 2 2 2
(6359,8) +(6059,8) +(5959,8) +(5659,8) +(6259,8) 10,24+0,04+0,64+23,04+4,84 38,8
Joo Var(J)= = = =7,76min
5 5 5
2 2 2 2 2
Pedro Var(P)=
(5458,2) +(5958,2) +(6058,2) +(5758,2) +(6158,2) 17,64+0,64+3,24+1,44+7,84 30,8
= = =6,16 min
5 5 5
(6059,6)2 +(6359,6)2+(5859,6)2+(6259,6)2 +(5559,6)2 0,16+11,56+2,56+5,76+21,16 41,2
Marcos Var(M )= = = =8,24 min
5 5 5
De acordo com os clculos da varincia, o atleta que apresenta os tempos mais dispersos da mdia o
Marcos. J Pedro apresentou tempos mais prximos de sua mdia do que os demais corredores.
Quanto menor a varincia, mais prximos os valores esto da mdia. Da mesma forma, quanto
maior ela , mais os valores esto distantes da mdia.
40
Desviopadro
ODesviopadroigualaraizquadradadavarincia.
Desviopadropopulacional Desviopadroamostral
Exemplo:Odesviopadrodostemposdecorridadecada
atletadoexemploanteriordadopor:
Joo Var= 7,76 7,76=2,78
8)Atabelaabaixoexibeaquantidadedepeasproduzidaspelos
funcionriosA,B,CeDdeumamicroempresa,aolongodeumasemanade
trabalho.Calculeamdiadeproduodiria,avarinciaeodesvio
padrodaproduodecadafuncionrio.
42
Grficos
Os grficos constituem uma forma clara e objetiva de apresentar dados
estatsticos. A inteno a de proporcionar aos leitores em geral a
compreenso e a veracidade dos fatos.
Orientao da
esquerda para a
direita: isto significa
que esquerda fica
a data mais antiga, e
direita a data mais
recente;
Com o grfico de barras podemos comparar categorias diferentes, como no exemplo abaixo
onde temos no mesmo grfico o desempenho de alunos na disciplina de portugus e
matemtica.
Comparao do desempenho de 80 alunos do primeiro Comparao do desempenho de Matmtica e Portugus
ano nas disciplinas de Matemtica e Portugus 45%
40%
Matemtica Portugus 35%
30%
Matemtica
25%
RUIM 15% 10% Portugus
20%
REGULAR 25% 28% 15%
10%
BOM 35% 39%
5%
TIMO 25% 23% 0%
RUIM REGULAR BOM TIMO
Grfico de pizza
O grfico de pizza, tambm conhecido como grfico de setores ou
grfico circular um diagrama circular onde os valores de cada
categoria estatstica representada so proporcionais s respectivas
frequncias. Este grfico pode vir acompanhado de porcentagens.
utilizado para dados qualitativos nominais. Para construir um grfico
tipo pizza necessrio determinar o ngulo dos setores circulares
correspondentes contribuio percentual de cada valor no total. Isto
pode ser feito utilizando regra de trs.
Grfico de pizza
Uma empresa da rea automobilstica acompanha o nmero de defeitos encontrados nos
equipamentos enviados para a calibrao. Na tabela a seguir apresentamos os dados referentes a um
ms de acompanhamento dos defeitos encontrados nos equipamentos das diversas reas.