Vous êtes sur la page 1sur 46

ESTATSTICA BSICA

A Estatstica (ou cincia Estatstica) um conjunto de tcnicas e mtodos de pesquisa que entre outros tpicos
envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferncia, o
processamento, a anlise e a disseminao das informaes.

Na estatstica trabalhamos com dados, nos quais podem ser obtidos por meio de uma amostra da populao em
estudo. A seguir, definimos esses conceitos bsicos:

Populao: conjunto de elementos que tem pelo menos uma caracterstica em comum. Esta caracterstica deve
delimitar corretamente quais so os elementos da populao.

Amostra: subconjunto de elementos de uma populao, que so representativos para estudar a caracterstica
de interesse da populao. A seleo dos elementos que iro compor a amostra pode ser feita de vrias
maneiras e ir depender do conhecimento que se tem da populao e da quantidade de recursos disponveis.

Vamos apresentar os elementos bsicos da anlise de dados. Veremos as Estatsticas Descritivas utilizadas para
organizar, resumir e descrever os aspectos importantes do comportamento dos dados. A descrio dos dados
tambm pode identificar anomalias, at mesmo resultantes do registro incorreto de valores e valores extremos
(aqueles que no seguem a tendncia geral do restante do conjunto de dados). As ferramentas descritivas so
os muitos tipos de grficos e tabelas, bem como as medidas de sntese: medidas de posio e medidas de
disperso.

Sempre que resumimos um conjunto de dados, perdemos informao sobre o mesmo, pois condensamos as
observaes originais. Entretanto, esta perda de informao pequena se comparada ao ganho que se tem com
a clareza da interpretao proporcionada.
1 - NOES BSICAS DE ESTATSTICA

A Estatstica durante sculos foi usada inconscientemente pelos povos como um carter meramente descritivo e
de registro de ocorrncias. As primeiras atividades foram por volta de 2000 a.C. e foram usados no
recenseamento das populaes agrcolas chinesas. No incio do sculo XIX, os grandes matemticos entraram
em cena, como exemplo, o francs Simon Laplace e o alemo Carl Friedrich Gauss (1777 1855), este ltimo
surge com aplicaes da"distribuio normal" para modelagem de erros de medio. A teoria da distribuio
normal foi usada pelo astrnomo e matemtico belga Adolphe Qutelet (1796 1874), no estudo estatstico de
diversas caractersticas das populaes humanas: altura, peso, natalidade, mortalidade, renda mensal
etc. Ronald Aylmer Fisher (1890 1962), estatstico britnico, foi o gnio que criou a moderna teoria da
estatstica. Na Estatstica trabalhou com ajustes de curvas de frequncias, com coeficientes de correlao, os
chamados coeficientes de Fisher, na anlise de varincia (ANOVA) e nas tcnicas de estimao dos parmetros.
Influenciado pelos trabalhos de Karl Pearson, outro importante estatstico britnico. Fisher utilizou os resultados
que obteve na Estatstica como ferramentas para aplicao nos seus estudos de gentica, sendo hoje
considerado um dos maiores nomes na Teoria de Estatstica e na Estatstica aplicada Biologia.

1.1 - INTRODUO

Em geral, manipulamos um conjunto de dados com o objetivo de extrairmos informao sobre o


comportamento de um processo ou produto. A Estatstica utiliza a variabilidade presente nos dados para obter
tal informao. A variabilidade est presente em todo lugar. Por exemplo, a posio de um carro estacionado
em uma garagem no a mesma ao longo dos dias. Neste caso, a posio do carro apresenta uma variao.
Nossa estratgia consiste em avaliar as variaes e obter informaes atravs dela.

A aplicao de tcnicas estatsticas envolve vrias etapas:

Coleta de dados;

Exposio dos dados;

Modelos Estatsticos.

1.2 - COLETA DE DADOS

A qualidade da soluo est diretamente relacionada com a qualidade dos dados obtidos. Podemos evitar que
alguns problemas ocorram observando fatos como:

No se deve coletar dados sem que antes se tenha definido claramente o problema ou situao a ser
enfrentada, bem como os objetivos com relao aos mesmos;

Os sistemas de medio (instrumento, operadores, mtodo, meio) que sero utilizados devem ser
avaliados e ter capacidade de medio suficiente;

Os clculos e leituras devem ser feitos com muita ateno para evitar distores;

Devem ser utilizados mtodos adequados para coleta de dados de acordo com o problema estudado.
Uma amostra uma parcela de uma populao que pode conter informaes sobre esta populao. Outra
definio importante (para a escolha da tcnica estatstica e das interpretaes dos resultados) a classificao
dos dados.

Planejando a coleta de dados

Para estudarmos adequadamente uma populao atravs de uma amostra, devemos planejar a coleta de dados.
Com este objetivo, formulamos algumas perguntas:

Com que frequncia ocorrem os problemas?

Quais so as causas potenciais do problema?

Um bom planejamento para coleta de dados deve considerar as seguintes perguntas:

Qual a pergunta a ser respondida?

Como comunicar a resposta obtida?

Qual ferramenta de anlise pretendemos usar e como utilizar os resultados?

Qual tipo de dado necessrio para utilizar as ferramentas desejadas e responder a pergunta?

Como coletar esses dados com o mnimo de esforo e erro?

Onde acessar estes dados?

Quem pode nos fornecer os dados?


Qual o perodo em que os dados sero coletados?

Tendo as respostas para estas perguntas, devemos:

Construir uma metodologia para nos certificar de que todas as informaes esto definidas;

Coletar os dados de forma consistente e honesta;

Certificar-se de que existe tempo suficiente para a coleta de dados;

Definir quais informaes adicionais sero necessrias para estudos futuros, referncias
ou reconhecimento.

1.3 - EXPOSIO DOS DADOS

Antes da exposio dos dados coletados necessrio que se faa um trabalho de reviso e correo nos dados
coletados na tentativa de eliminar possveis enganos na elaborao do relatrio. Inicialmente, os dados podem
ser classificados como "qualitativos" ou "quantitativos". Atravs desta classificao, vamos definir algumas
tcnicas para resumir o conjunto de dados.

Dados qualitativos

Os dados qualitativos representam uma caracterstica da qualidade (ou atributo) associado ao item pesquisado.
Por exemplo, podemos classificar um produto em: bom, razovel ou ruim. Os dados qualitativos podem ser
divididos em dois tipos:

Dado qualitativo nominal - Para o qual no existe nenhuma ordenao nas possveis realizaes;

Dado qualitativo ordinal - Para o qual existe uma ordem em seus resultados.

Exemplo 1.3.1:

Uma indstria de calculadoras eletrnicas, preocupada com vrios defeitos que um de seus produtos vem
apresentando, fez um levantamento e constatou os seguintes problemas:

A: Defeito na cobertura plstica;

B: Defeito no teclado;

C: Defeito na fonte de energia;

D: Soldas soltas;

E: Defeito na placa da unidade de processamento;

F: Defeito no visor;

G: Outros.

Este um tpico exemplo de dados qualitativos nominais. Nesta situao, para cada item inspecionado, existe
uma varivel T que representa o tipo de defeito encontrado. Portanto, essa varivel T pode assumir os valores: T
= A, T = B, ... ,T = G. Logo, por exemplo, para uma calculadora com defeito na cobertura plstica, temos que T =
A. A seguir, temos uma Tabela com os valores observados.

Tipo de Problemas (T) Frequncia


A 10
B 20
C 55
D 80
E 25
F 3
G 7
Neste exemplo, todos os defeitos apresentam o mesmo nvel de severidade e portanto, no apresentamos uma
ordem entre os atributos (defeitos). Neste caso, temos um exemplo de dados qualitativos nominal.

Exemplo 1.3.2:

Em um concurso pblico foram contabilizados os nmeros de pessoas inscritas segundo os nveis de


escolaridade: fundamental completo, mdio completo, superior completo e ps-graduao completa. Segue
abaixo a Tabela com os valores observados.

Nvel de escolaridade Inscritos

Fundamental completo 451

Mdio completo 627

Superior completo 292

Ps-graduao completa 95
Neste exemplo, temos uma ordem natural entre os atributos (nvel de escolaridade) e consequentemente,
temos um exemplo de dados qualitativos ordinais.

Dados quantitativos

Neste caso, a caracterstica observada assume valores numricos que podem ser classificados em "discretos" ou
"contnuos".

Dados quantitativos discretos

Os dados quantitativos discretos assumem valores dentro de um conjunto com os nmeros especificados. Por
exemplo, o nmero de produtos produzidos por uma mquina em um determinado perodo de tempo pode ser
0,1,2,3,4,... Neste caso, os dados observados formam um conjunto finito (ou enumervel) de nmeros.
Geralmente, quando contamos defeitos, temos dados quantitativos discretos.
Exemplo 1.3.3:

Em um hospital, foram contabilizados o nmero de pessoas com diabetes em 20 grupos de 1000 pessoas cada.
Neste caso, obtemos os seguintes dados: 10, 12, 9, 11, 10, 8, 9, 10, 7, 10, 8, 9, 9, 10, 10, 11, 9, 11, 10, 10. Um
possvel resumo dos dados desenvolvido na Tabela a seguir

Pessoas com diabetes Apurao dos grupos N de grupos

7 / 1

8 // 2

9 ///// 5

10 //////// 8

11 /// 3

12 / 1
Portanto, a varivel "nmero de pessoas com diabetes" assume valores discretos, isto , inteiros: ...,7,8,9,... .

Dados quantitativos contnuos

Os dados quantitativos contnuos assumem valores em um intervalo contnuo de nmeros. Em geral, este tipo
de dado proveniente de medies de uma caracterstica da qualidade de uma pea ou produto. Os possveis
valores incluem "todos" os nmeros do intervalo de variao da caracterstica medida. Por exemplo, ao
medirmos os dimetros dos eixos de determinados motores com uma clula eletrnica, obtemos dados
quantitativos contnuos.

Exemplo 1.3.4:

Numa fbrica de motores eltricos, o gerente de produo precisa avaliar o problema de rudo excessivo do
motor. Uma das possveis causas est associada com variaes no dimetro do eixo. Assim, o gerente de
produo mediu o dimetro do eixo de 200 motores e o resultado est apresentado na Tabela a seguir. Os
valores esto em milsimos de milmetros.
Dimetro do eixo de 200 motores

4,8 4,2 5,1 5,2 4,8 4,7 4,9 4,5 4,9 4,5 4,9 5,1 4,8

4,9 4,8 5,0 5,3 4,9 5,5 5,2 5,1 4,6 4,9 4,8 5,1 4,6

4,3 4,9 4,7 5,2 4,8 4,4 5,6 5,0 5,0 5,0 4,8 5,2 4,5

5,1 4,9 4,8 4,8 5,0 4,8 5,1 5,4 4,2 5,1 4,9 4,6 5,4

4,9 4,3 4,6 4,7 4,7 5,3 4,4 4,7 4,8 5,2 4,5 5,1 4,6

5,7 4,9 5,2 4,8 4,9 4,9 4,4 4,7 4,8 5,1 5,4 5,0 4,4

5,1 4,9 4,9 5,1 5,2 4,7 4,8 4,6 5,2 5,5 5,2 4,2 4,9

4,9 4,8 4,2 5,2 5,1 4,7 5,5 4,7 4,7 4,4 4,8 4,2 5,2

5,0 5,2 4,2 4,9 5,1 4,6 5,4 4,6 4,8 5,2 5,1 4,7 5,2

4,8 5,1 4,6 4,8 5,2 4,5 4,9 4,5 5,4 4,5 4,9 4,6 4,7

4,8 4,2 5,1 5,2 4,8 4,7 4,9 4,7 4,9 4,5 4,7 5,2 5,5

4,9 5,1 4,8 4,9 4,8 5,0 5,3 4,9 5,5 5,2 5,2 4,7 4,8

5,1 4,6 4,9 4,3 4,9 4,7 5,2 4,8 4,4 5,6 4,9 4,9 4,9

5,0 5,0 5,0 5,1 4,9 4,8 4,8 5,0 4,8 5,1 5,1 4,8 5,1

5,4 4,2 5,1 4,9 4,3 4,6 4,7 4,8 5,3 4,4 4,9 4,4 4,7

5,8 4,9 5,2 4,8 4,9


Podemos fazer a apurao considerando intervalos de medidas, como apresentado na Tabela a seguir

Dimetro do eixo de 200 motores (com apurao)

Dimetro Apurao N de motores apurados

[4,2;4,4) / / / / / / / / / / / / 12

[4,4;4,6) ////////.../ 16

[4,6;4,8) /////////.../// 31

[4,8;5,0) //////////...////// 66

[5,0;5,2) //////////...///// 35

[5,2;5,4) //////////...// 25

[5,4;5,6) / / / / / / / / / / / / 11

[5,6;5,8) //// 4
Ao estabelecermos intervalos de classes, estamos admitindo que o eixo pode assumir qualquer valor entre o
limite inferior (inclusive) e o limite superior (exclusive).

Exemplo 1.4.1:
Considere os dados do Exemplo 1.3.2. Construa o grfico de barras correspondente.
Ento, o grfico de barras correspondente seria um grfico onde os retngulos correspondentes
a cada nvel de instruo teria a altura correspondente ao nmero de inscritos com o respectivo
grau de escolaridade. Podemos resolver este problema utilizando o software Action. O resultado
o seguinte
1.5 - DIAGRAMA DE PARETO

Diagrama de Pareto um grfico de barras que ordena as frequncias das ocorrncias, da maior para a menor,
permitindo a priorizao dos problemas. Mostra ainda a curva de porcentagens acumuladas. Sua maior utilidade
a de permitir uma fcil visualizao e identificao das causas ou problemas mais importantes, possibilitando a
concentrao de esforos sobre os mesmos. utilizado para dados qualitativos.

Como construir um diagrama de Pareto

1. Realize uma reunio com a equipe para selecionar o tpico a ser avaliado. Por exemplo, podemos avaliar
tipos de defeitos, custo de manuteno por equipamento, entre outros.

2. Selecione um padro de comparao com unidade de medida. Geralmente, utilizamos o custo ou frequncia
de ocorrncia como medida de comparao.

3. Especifique o perodo de tempo em que os dados sero coletados. Exemplo: Uma semana, um ms.

4. Elabore uma planilha de dados, com as seguintes colunas: Categorias, Quantidades (totais individuais), Totais
acumulados, Porcentagens, Porcentagens acumuladas.

5. Colete os dados necessrios para cada categoria. Exemplo: Defeito A ocorreu X vezes ou defeito C custou Y.

6. Preencha a planilha de dados, listando as categorias em ordem decrescente com relao unidade de
comparao.
7. Marque o eixo horizontal no lado esquerdo com a escala de zero at o total da coluna Quantidade da planilha
de dados. Identifique o nome da varivel representada neste eixo e a unidade de medida utilizada, caso seja
necessrio.

8. Marque o eixo vertical do lado direito com uma escala de zero at 100%. Identifique este eixo como
"Porcentagem acumulada"(%).

9. Liste as categorias da esquerda para direita no eixo horizontal em ordem decrescente de frequncia ou custo.
Os itens de menor importncia podem ser combinados na categoria Outros, que colocada no extremo direito
do eixo, com a ltima barra.

10. Identifique cada intervalo do eixo horizontal escrevendo os nomes das categorias, na mesma ordem em que
eles aparecem na planilha de dados.

11. Construa um grfico de barras utilizando a escala do eixo vertical do lado esquerdo. Para construir um
grfico de barras, acima de cada categoria, basta desenhar um retngulo cuja a altura representa a frequncia
ou custo daquela categoria.

12. Construa a curva de Pareto marcando os valores da porcentagem acumulada acima e no centro ou lado
direito do intervalo de cada categoria, e ligue os pontos por segmentos de reta.

Exemplo 1.5.1:

Considerando os dados do Exemplo 1.3.1, construmos o diagrama de Pareto, utilizando o Action. Os


resultados obtidos so mostrados a seguir.

Tipos de Frequncia Porcentagem Porcentagem


Problemas Frequncia Acumulada Acumulada
D 80 80 40 40
C 55 135 27,5 67,5
E 25 160 12,5 80
B 20 180 10 90
Outros 10 190 5 95
A 10 200 5 100
O grfico de Pareto correspondente mostrado abaixo.
Diagrama de Pareto relativo a custos

Na construo do grfico de Pareto podemos utilizar como medida de comparao a frequncia de ocorrncia
do atributo ou o custo associado a este atributo. A seguir, apresentamos um exemplo de um grfico de Pareto
com medida de comparao baseada no custo.

Exemplo 1.5.2:

Em uma empresa de carto de identificao, contabilizamos os defeitos nos cartes com medida de comparao
baseada no custo.

Principais defeitos N de embalagens defeituosas Custo por unidade defeituosa Custo do defeito
Nmeros trocados 28 0,05 1,40
Caracteres errados 28 0,05 1,40
Amassado 4 1,00 4,00
Perfurado 3 0,05 0,15
Impresso ilegvel 2 0,05 0,10
Rasgado 2 1,00 2,00
Outros 1 0,05 0,05
Total 68
Ordenando os defeitos pelos seus custos, temos o seguinte diagrama
Principais defeitos Custo do defeito
Amassado 4,00
Rasgado 2,00
Nmeros trocados 1,40
Caracteres errados 1,40
Perfurado 0,15
Impresso ilegvel 0,10
Outros 0,05
O grfico de Pareto correspondente, relativo aos custos dado por
1.6 - HISTOGRAMA

Distribuio de frequncias

A distribuio de frequncias um agrupamento de dados em classes, de tal forma que contabilizamos o


nmero de ocorrncias em cada classe. O nmero de ocorrncias de uma determinada classe recebe o nome de
frequncia absoluta. O objetivo apresentar os dados de uma maneira mais concisa e que nos permita extrair
informao sobre seu comportamento. A seguir, apresentamos algumas definies necessrias construo da
distribuio de frequncias.

Frequncia absoluta (i): o nmero de observaes correspondente a cada classe. A frequncia absoluta ,
geralmente, chamada apenas de frequncia.

Frequncia relativa (ri): o quociente entre a frequncia absoluta da classe correspondente e a soma das

frequncias (total observado), isto , onde n representa o nmero total de observaes.

Frequncia percentual (pi): obtida multiplicando a frequncia relativa por 100%.

Frequncia acumulada: o total acumulado (soma) de todas as classes anteriores at a classe atual. Pode ser:
frequncia acumulada absoluta (Fi), frequncia acumulada relativa (Fri), ou frequncia acumulada percentual
(Pi).

Distribuio de frequncia pontual: dados discretos

A construo de uma tabela de distribuio de frequncia pontual equivalente construo de uma tabela
simples, onde se listam os diferentes valores observados da varivel com suas frequncias absolutas, denotadas
por (i) (o ndice i corresponde ao nmero de linhas da Tabela) como mostrado na Tabela abaixo. Utilizamos a
distribuio de frequncia pontual quando se trabalha com dados discretos. Um grfico utilizado para
representar este tipo de distribuio de frequncia o Grfico de Barras.

Exemplo 1.6.1:

Considere os dados do Exemplo 1.3.3. Construa a distribuio de frequncias para este conjunto de dados e
ogrfico de barras.
Nmero de pessoas com Frequncia(i) Frequncia Frequncia Frequncia
diabetes relativa(ri) percentual acumulada
7 1 0,05 5 5
8 2 0,1 10 15
9 5 0,25 25 40
10 8 0,4 40 80
11 3 0,15 15 95
12 1 0,05 5 100

Distribuio de frequncia em intervalos de classes: Dados contnuos

Para dados quantitativos contnuos, geralmente resultantes de medies de caractersticas da qualidade de


peas ou produtos, dividimos a faixa de variao dos dados em intervalos de classes. O menor valor da classe
denominado limite inferior (li) e o maior valor da classe denominado limite superior (Li).

O intervalo ou classe pode ser representado das seguintes maneiras:

1. (li) (Li), onde o limite inferior da classe includo na contagem da frequncia absoluta, mas o superior no;
2. (li) (Li) , onde o limite superior da classe includo na contagem, mas o inferior no.
Podemos escolher qualquer uma destas opes, mas importante que deixemos claro no texto ou na tabela
qual delas est sendo usada. Embora no seja necessrio, os intervalos so frequentemente construdos de
modo que todos tenham larguras iguais, o que facilita as comparaes entre as classes.

Na tabela de distribuio de frequncia, acrescentamos uma coluna com os pontos mdios de cada intervalo de

classe, denotada por xi. Esta definida como a mdia dos limites da classe . Estes valores so
utilizados na construo de grficos.

Algumas indicaes na construo de distribuio de frequncias so:

Na medida do possvel, as classes devero ter amplitudes iguais.

Escolher os limites dos intervalos entre duas possveis observaes.

O nmero de intervalos no deve ultrapassar 20.

Escolher limites que facilitem o agrupamento.

Marcar os pontos mdios dos intervalos.

Ao construir o histograma, cada retngulo dever ter rea proporcional frequncia relativa (ou
frequncia absoluta, o que d no mesmo) correspondente.

Histograma

Histograma uma representao grfica (um grfico de barras verticais ou barras horizontais) da distribuio de
frequncias de um conjunto de dados quantitativos contnuos. O histograma pode ser um grfico por valores
absolutos ou frequncia relativa ou densidade. No caso de densidade, a frequncia relativa do intervalo i, (fri),
representada pela rea de um retngulo que colocado acima do ponto mdio da classe i. Consequentemente,
a rea total do histograma (igual a soma das reas de todos os retngulos) ser igual a 1. Assim, ao construir o
histograma, cada retngulo dever ter rea proporcional frequncia relativa (ou frequncia absoluta, o que
indiferente) correspondente. No caso em que os intervalos so de tamanhos (amplitudes) iguais, as alturas dos
retngulos sero iguais s frequncias relativas (ou iguais s frequncias absolutas) dos intervalos
correspondentes.

Exemplo 1.6.2:

Considerando os dados do Exemplo 1.3.4, monte a distribuio de frequncias e construa o histograma


correspondente.

Como temos dados quantitativos contnuos, para construir a distribuio de frequncias, vamos separar os
dados em classes. Dividimos os dados em 8 classes de tamanhos iguais. A distribuio de frequncias ento a
seguinte
Classe Frequncia Freq.
Relativa Porcentagem Porc.
Acumulada Densidades Ponto
mdio
[4,2;4,4) 12 0,06 6 6 0,3 4,3
[4,4;4,6) 16 0,08 8 14 0,4 4,5
[4,6;4,8) 31 0,15 15,5 29,5 0,775 4,7
[4,8;5,0) 66 0,33 33 62,5 1,65 4,9
[5,0;5,2) 35 0,17 17,5 80 0,875 5,1
[5,2;5,4) 25 0,12 12,5 92,5 0,625 5,3

[5,4;5,6) 11 0,06 5,5 98 0,275 5,5


[5,6;5,8) 4 0,02 2 100 0,099 5,7
E ento, construmos o histograma correspondente. Podemos utilizar o software Action para resolver este
problema.

Exemplo 1.6.3:

Considerando os dados do Exemplo 1.3.4, construa o histograma de densidades correspondente

Para construir o histograma de densidades, basta que os retngulos tenham altura do tamanho da densidade de
cada classe e largura do tamanho da classe. Neste caso, o histograma ficaria da seguinte forma:
1.7 - GRFICO DE PIZZA

O grfico de pizza, tambm conhecido como grfico de setores ou grfico circular um diagrama circular onde
os valores de cada categoria estatstica representada so proporcionais s respectivas frequncias. Este grfico
pode vir acompanhado de porcentagens. utilizado para dados qualitativos nominais. Para construir um grfico
tipo pizza necessrio determinar o ngulo dos setores circulares correspondentes contribuio percentual de
cada valor no total.

Exemplo 1.7.1:

Uma empresa da rea automobilstica acompanha o nmero de defeitos encontrados nos equipamentos
enviados para a calibrao. Na tabela a seguir apresentamos os dados referentes a um ms de
acompanhamento dos defeitos encontrados nos equipamentos das diversas reas.

Centro de custo Nmero de defeitos


Pr-usinagem 9
Tratamento trmico 12
Fundio 10
Usinagem 45
Tratamento superficial 13
Total 89
Como temos um total de 89 defeitos, o setor circular de 360 ser equivalente a 89. Calculando as propores,
encontramos os ngulos correspondentes aos nmero de defeitos de cada centro de custo. Com isso,
construmos o seguinte grfico de pizza.
2 - ESTATSTICAS DESCRITIVAS

A seguir, apresentamos as medidas bsicas de uma anlise descritiva dos dados: as medidas de posio, de
disperso e algumas outras estatsticas descritivas.

2.1 - MEDIDAS DE POSIO

So as estatsticas que representam uma srie de dados orientando-nos quanto posio da distribuio em
relao ao eixo horizontal do grfico da curva de frequncia. As medidas de posies mais importantes so
mdia aritmtica, mediana e moda. Usaremos as seguintes notaes:

x: valor de cada indivduo da amostra.

: mdia amostral.

n: tamanho amostral.

Mdia populacional

A mdia populacional calculada somando-se todos os valores da populao e dividindo o resultado pelo total
de elementos da populao. Numa populao de elementos, a mdia populacional dada por

Mdia Amostral

A mdia amostral, aritmtica, ou simplesmente mdia, calculada somando-se os valores das observaes da
amostra e dividindo-se o resultado pelo nmero de valores. Assim, a mdia amostral dada por

Exemplo 2.1.1:

Uma amostra de 5 barras de ao foi retirada da linha de produo e seus comprimentos foram medidos. Os
valores foram: 4,5; 4,6; 4,5; 4,4; 4,5.

Desta forma, a mdia dada por

Podemos utilizar o Action para resolver este problema. O resultado obtido foi
Exemplo 2.1.2:

Foram medidos os comprimentos de 5 leitos hospitalares e os valores (em metros) obtidos foram: 2,26; 2,30;
2,31; 2,28; 2,32.

A mdia ento, dada por

Utilizando o Action, temos que

Mediana

Para calcular a mediana devemos, em primeiro lugar, ordenar os dados do menor para o maior valor. Se o
nmero de observaes for mpar, a mediana ser a observao central. Se o nmero de observaes for par, a
mediana ser a mdia aritmtica das duas observaes centrais. Notao: .

Exemplo 2.1.3:

Consideremos os seguintes dados correspondentes aos comprimentos de 8 rolos de fio de ao: 65, 72, 70, 72,
60, 67, 69, 68.

Ordenando os valores temos: 60, 65, 67, 68, 69, 70, 72, 72. Como o nmero de observaes par, a mediana
dada pela mdia dos dois valores centrais que so 68 e 69, isto ,
Tambm resolvemos o problema utilizando o Action. Os resultados so mostrados a seguir

Informao Valor
Mediana 68,5

Moda

A moda de um conjunto de valores o valor que apresenta a maior frequncia.

Exemplo 2.1.4:

Considerando os dados do Exemplo 2.1.3 temos que sua moda 72, pois este o valor do conjunto de dados
que aparece com maior frequncia.

2.2 - MEDIDAS DE DISPERSO

Disperso sinnimo de variao ou variabilidade. Para medir a disperso, duas medidas so usadas mais
frequentemente: a amplitude e o desvio padro.

Amplitude

A amplitude definida como sendo a diferena entre o maior e o menor valor do conjunto de dados.
Denotaremos a amplitude por R.

Exemplo 2.2.1:

Considere o Exemplo 2.1.3. Qual a amplitude deste conjunto de dados?

Como o valor mximo do conjunto 72 e o valor mnimo 60, temos que a amplitude :

R = 72 - 60 = 12.

Utilizando o Action, temos o seguinte resultado

Informao Valor
Amplitude 12

Para definirmos desvio padro necessrio definir varincia. A notao mais comumente usada :

s2 - varincia amostral.
2 - varincia populacional.

s - desvio padro amostral.

- desvio padro populacional.

Varincia populacional

A varincia de uma populao {x1,...,xN} de N elementos a medida de disperso definida como a mdia do
quadrado dos desvios dos elementos em relao mdia populacional . Ou seja, a varincia populacional
dada por:

Varincia amostral

A varincia de uma amostra {x1,...,xn} de n elementos definida como a soma ao quadrado dos desvios
dos elementos em relao sua mdia dividido por (n-1). Ou seja, a varincia amostral dada por:

Ao utilizarmos a mdia amostral como estimador de m para calcularmos a varincia amostral, perdemos 1 grau
de liberdade em relao varincia populacional.

Desvio padro populacional

O desvio padro populacional de um conjunto de dados igual raiz quadrada da varincia populacional. Desta
forma, o desvio padro populacional dado por:

Desvio padro amostral

O desvio padro amostral de um conjunto de dados igual raiz quadrada da varincia amostral. Desta forma, o
desvio padro amostral dado por:
Exemplo 2.2.2:

Considere novamente os dados do Exemplo 2.1.3. Calcule o desvio padro dos dados.

Para calcularmos o desvio padro devemos primeiramente calcular a mdia , isto :

Agora vamos subtrair de cada valor, elevar os resultados ao quadrado e som-los. Ento dividimos o total dos
quadrados pelo nmero de valores menos 1, ou seja, por (n-1) e extramos a raiz quadrada:

65-67,875 = -2,875 (-2,875)2 = 8,265625


72-67,875 = 4,125 (4,125)2 = 17,015625
70-67,875 = 2,125 (2,125)2 = 4,515625
72-67,875 = 4,125 (4,125)2 = 17,015625
60-67,875 = -7,875 (-7,875)2 = 62,015625
67-67,875 = -0,875 (-0,875)2 = 0,765625
69-67,875 = 1,125 (1,125)2 = 1,265625
68-67,875 = 0,125 (0,125)2 = 0,015625
Total = 110,875

Portanto, o desvio padro 3,97986.

Utilizando o Action, temos o seguinte resultado

Informao Valor
Desvio-padro 3,97986

2.3 - OUTRAS ESTATSTICAS DESCRITIVAS


Uma anlise das estatsticas descritivas da amostra fundamental para resumirmos algumas informaes sobre
a populao. Estas informaes so utilizadas para tomada de deciso e formao de modelos estatsticos
paramtricos. Definiremos como:

Mnimo: menor elemento da amostra;

Mximo: maior elemento da amostra;

Quartis (Q1, Q2 e Q3): So valores dados a partir do conjunto de observaes ordenado em ordem crescente,
que dividem a distribuio em quatro partes iguais. O primeiro quartil, Q1, o nmero que deixa 25% das
observaes abaixo e 75% acima, enquanto que o terceiro quartil, Q3, deixa 75% das observaes abaixo e 25%
acima. J Q2 amediana, deixa 50% das observaes abaixo e 50% das observaes acima.

Seja n o nmero total de elementos da amostra e calcule j(n+1)/4, para j=1,2 e 3. Desta forma Qj ser um
elemento entre Xk e Xk+1, onde k o maior inteiro menor que j(n+1)/4 e ser calculado da seguinte forma

Exemplo 2.3.1:

Considere uma amostra de 6 elementos com os seguintes valores: 7,1; 7,4; 7,5; 7,7; 7,8; 7,9.

Deste modo temos que (n+1)/4 = 7/4 = 1,75 e com isso k = 1, logo

Tambm temos que 2(n+1)/4 = 14/4 = 3,5, com isso k = 3, logo

E, temos que 3(n+1)/4= 21/4 = 5,25, com isso k = 5, logo

Podemos utilizar o Action para o clculo dos quartis. Os resultados so dados abaixo
Exemplo 2.3.2:

Considere o Exemplo 2.1.3, calcule os quartis dos dados.

Primeiramente ordenamos os dados, 60, 65, 67, 68, 69, 70, 72, 72.

Deste modo temos que (n+1)/4 = 9/4 = 2,25 e com isso k = 2, logo

Tambm temos que 2(n+1)/4 = 18/4 = 4,5, com isso k = 4, logo

E, temos que 3(n+1)/4= 27/4 = 6,75, com isso k = 6, logo

Os mesmos podem ser calculados no Software Action

Tri-mdia: Escolhemos um valor n entre 5 e 25. Ento, removemos os n% maiores valores e os n% menores
valores, arredondados para o maior inteiro, e ento calculamos a mdia dos valores restantes.

Assimetria: A assimetria permite distinguir as distribuies assimtricas. Um valor negativo indica que a cauda
do lado esquerdo da funo densidade de probabilidade maior que a do lado direito. Um valor positivo para a
assimetria indica que a cauda do lado direito maior que a do lado esquerdo. Um valor nulo indica que os
valores so distribudos de maneira relativamente iguais em ambos os lados da mdia, mas no implica
necessariamente, uma distribuio simtrica.
A frmula da assimetria dada por

Curtose: uma medida de disperso que caracteriza o "achatamento" da curva da funo de distribuio. Um
valor positivo costuma indicar um pico mais agudo, um corpo mais fino e uma cauda mais gorda que a
distribuio normal. Um valor negativo indica um pico mais tnue, um corpo mais grosso e uma cauda mais fina
que a distribuio normal. Para ilustrar a curtose, temos os grficos a seguir, que representam uma curtose
positiva (caudas mais alongadas) e curtose negativa (caudas mais curtas), respectivamente.
A frmula da curtose dada por

Exemplo 2.3.3:

Suponha que uma amostra dos comprimentos de 11 rolos de fio de ao cujos valores foram 72, 70, 77, 60, 67,
69, 68, 66, 65, 71, 69.

Os dados ordenados de forma crescente so: 60, 65, 66, 67, 68, 68, 69, 70, 71, 72, 77. Ento temos que:

Mnimo = 60.

Mximo = 77.

Para calcular a Tri-mdia retiramos o maior e o menor valor do conjunto de dados e calculamos a mdia dos 9
restantes, ento:

Tri-mdia =

Posio do Q1 =

Posio do Q3 =

Assimetria =

Curtose = .

Utilizando o Action, obtemos os seguinte resultados para os valores de mnimo, mximo, posio dos quartis,
assimetria e curtose.

Informao Valor
Mnimo 60
1 Quartil 66
3 Quartil 71
Mximo 77
Assimetria -0,028
Curtose -0,18
Exemplo 2.3.4:

Considere as medidas das alturas de 11 pacientes, dadas abaixo

Altura dos pacientes


1,59 1,79 1,68 1,80
1,58 1,60 1,69 1,73
1,87 1,68 1,85
Ordenando os valores, temos que

Desta forma, temos que o valor mnimo 1,58, o valor mximo 1,87. Para calcular a tri-mdia de 5% da
amostra, retiramos o menor e o maior elemento da amostra e calculamos a mdia dos elementos restantes.
Segue que a tri-mdia dada por

O primeiro quartil dado por 1,60 e o terceiro quartil 1,80, enquanto que a assimetria e a curtose so dadas,
respectivamente, por 0,1350 e -1,5489.

Utilizando o software Action, temos os seguinte resultados.

Exemplo 2.3.5:

Considerando os valores dirios de um retorno do ndice S&P 500, ano de 2010. Encontre os coeficientes de
assimetria e curtose.
Utilizando o Software Action temos os seguintes resultados

Observamos uma curtose alta de 1,35 e assimetria negativa de -0,28. Este um fenmeno tpico de dados
financeiros, que so assimtricos e possuem caudas pesadas.
3 - GRFICOS

Grficos estatsticos so formas de apresentao dos dados estatsticos, cujo objetivo o de produzir, no
investigador ou no pblico em geral, uma impresso mais rpida e viva do fenmeno em estudo. A
representao grfica de um fenmeno deve obedecer a certos requisitos fundamentais para ser realmente til:

Simplicidade: O grfico deve ser destitudo de detalhes de importncia secundria, assim como de traos
desnecessrios que possam levar o observador a uma anlise com erros.

Clareza: O grfico deve possibilitar uma correta interpretao dos valores representativos do fenmeno em
estudo.

Veracidade: O grfico deve expressar a verdade sobre o fenmeno em estudo.

Alguns exemplos de grficos j foram vistos acima, como o histograma e o diagrama de Pareto. A seguir
apresentamos o boxplot e o dotplot.

3.1 - BOXPLOT

O boxplot (grfico de caixa) um grfico utilizado para avaliar a distribuio emprica do dados. O boxplot
formado pelo primeiro e terceiro quartil e pela mediana. As hastes inferiores e superiores se estendem,
respectivamente, do quartil inferior at o menor valor no inferior ao limite inferior e do quartil superior at o
maior valor no superior ao limite superior. Os limites so calculados da forma abaixo

Limite inferior: .

Limite superior: .

Para este caso, os pontos fora destes limites so considerados valores discrepantes (outliers) e so denotados
por asterisco (*). A Figura a seguir apresenta um exemplo do formato de um boxplot.
O boxplot pode ainda ser utilizado para uma comparao visual entre dois ou mais grupos. Por exemplo, duas ou
mais caixas so colocadas lado a lado e se compara a variabilidade entre elas, a mediana e assim por diante.
Outro ponto importante a diferena entre os quartis que uma medida da variabilidade dos dados.

Exemplo 3.1.1:

Na Tabela a seguir temos as medidas da altura de 20 hastes. Faa o boxplot correspondente.

Dados da usinagem
903,88 1036,92 1098,04 1011,26
1020,70 915,38 1014,53 1097,79
934,52 1214,08 993,45 1120,19
860,41 1039,19 950,38 941,83
936,78 1086,98 1144,94 1066,12

O boxplot dado por


Exemplo 3.1.2:

Utilizando os dados do Exemplo 2.3.3, temos

Mnimo 1,58
1 Quartil 1,6
Tri-Mdia 1,714545
3 Quartil 1,8
Mximo 1,87
Assimetria 0,111765
Curtose -1,569809
Amplitude 0,29

Assim, obtemos o seguinte boxplot


3.2 - DOTPLOT

O grfico Dotplot (grfico de pontos) representa cada observao obtida em uma escala horizontal, permitindo
visualizar a distribuio dos dados ao longo deste eixo. No eixo horizontal, dividimos a escala dos valores em
pequenos intervalos, sendo marcado um ponto por observao.

O Dotplot, ou grfico de pontos, muito til para visualizar estratificaes. A estratificao uma tcnica que
agrupa dados em subgrupos, de acordo com determinados critrios, aumentando o poder da anlise.

Exemplo 3.2.1:

Considerando novamente os dados do Exemplo 3.1.1, construa o dotplot correspondente.


Eventualmente, interessante analisar dados estratificados, ou seja, realizar um dotplot em grupos. Podemos
analisar, graficamente, qual grupo (estrato) possui disperso maior e ter uma ideia da localizao da mdia de
cada grupo.

Exemplo 3.2.2:

Uma pequena pesquisa realizada em 4 bairros (A, B, C e D) de uma cidade perguntava sobre o salrio lquido de
32 famlias (8 famlias de cada bairro). Os resultados obtidos (dados em reais) esto na tabela abaixo
A B C D
3620 1910 4900 2800
4010 2100 4100 2400
4560 2210 5520 2900
2760 2030 6200 2950
3480 2090 5800 3400
2930 2230 7200 3200
3070 2060 4700 3150
3200 2050 5600 2770
3.3 - GRFICO DE LINHAS

Grficos de linhas ou pontos so normalmente usados para controlar alteraes ao longo do tempo e para
facilitar a identificao de tendncias ou de anomalias.

Exemplo 3.3.1:

O nmero de manutenes por dia em equipamentos foi acompanhado durante um perodo de 5 semanas, em
uma empresa automobilstica. Na tabela a seguir temos o nmero de manutenes por dia.

N de manutenes Dia Semana

18 1 Semana 1

22 2 Semana 1

28 3 Semana 1

23 4 Semana 1

33 5 Semana 1

23 6 Semana 1

22 7 Semana 1

32 1 Semana 2

14 2 Semana 2

24 3 Semana 2

38 4 Semana 2

14 5 Semana 2

22 6 Semana 2

35 7 Semana 2

24 1 Semana 3

24 2 Semana 3

28 3 Semana 3

25 4 Semana 3

20 5 Semana 3

23 6 Semana 3

14 7 Semana 3

20 1 Semana 4
30 2 Semana 4

27 3 Semana 4

24 4 Semana 4

38 5 Semana 4

27 6 Semana 4

23 7 Semana 4

19 1 Semana 5

18 2 Semana 5

17 3 Semana 5

24 4 Semana 5

27 5 Semana 5

23 6 Semana 5

32 7 Semana 5

Podemos construir o grfico de duas formas: com ou sem meta.

Sem meta

Neste caso, montamos um grfico em duas dimenses onde, colocamos um ponto no par ordenado
correspondente ao dia da semana e o valor observado, em seguida, unimos cada ponto ao seu sucessor por
retas. O grfico dado a seguir:
Com meta

Na anlise com meta, basta determinarmos um valor (meta) para a comparao dos dados e, ento inserimos
uma reta horizontal na altura deste valor. Com isso, todos os pontos que estiverem acima do valor dado,
atingiram a meta, enquanto os que estiverem abaixo no atingiram a meta.

Utilizaremos os mesmos dados acima, estipulando uma meta de 22. O grfico dado a seguir:
Os grficos acima foram obtidos utilizando o software Action.

Exemplo 3.3.2: Na tabela abaixo, temos os dados referentes a evoluo do preo de uma ao ao longo de 20
dias.

Evoluo do preo de uma ao ao longo de 20 dias


Dia 1 103,60 Dia 11 109,21
Dia 2 104,41 Dia 12 108,13
Dia 3 105,21 Dia 13 108,76
Dia 4 106,00 Dia 14 109,45
Dia 5 105,18 Dia 15 110,12
Dia 6 106,80 Dia 16 109,56
Dia 7 104,89 Dia 17 111,67
Dia 8 105,23 Dia 18 112,32
Dia 9 107,60 Dia 19 110,97
Dia 10 108,41 Dia 20 111,34
A seguir, temos a construo do grfico de linhas e pontos para estes dados.
4 - EXERCCIOS

4.1 - As taxas de juros recebidas por 10 aes durante um certo perodo foram (medidas em porcentagens) 2,59;
2,64; 2,60; 2,62; 2,57; 2,61; 2,50; 2,63; 2,64. Calcule a mdia, a mediana, o desvio padro, a varincia,
valor mnimo, valor mximo, os quartis Q1 e Q3, assimetria e curtose.

4.2 - Para facilitar um projeto de ampliao da rede de esgoto de uma certa regio de uma cidade, as
autoridades tomaram uma amostra de tamanho 50 dos 270 quarteires que compem a regio e foram
encontrados os seguintes nmeros de casas por quarteiro:

Casas

2 14 18 22 26 32 45 59 66 80

2 15 18 23 27 36 46 61 66 89

3 15 20 24 29 42 48 61 68 90

10 16 21 25 29 44 52 61 75 92

13 16 22 25 30 45 58 65 78 97
a) Construa uma tabela de frequncias;

b) Determine as medidas de posio e as medidas de disperso;

4.3 - Numa pesquisa realizada com 100 famlias, levantaram-se as seguintes informaes:

Nmero de filhos 0 1 2 3 4 5 Mais de 5


Famlias 17 20 28 19 7 4 5
a) Qual a mediana do nmero de filhos?

b) E a moda?

c) Que problemas enfrentaramos no clculo da mdia de filhos?

4.4 - Considere as informaes contidas na tabela abaixo acerca dos salrios de 20 funcionrios de um hospital.
Faa uma distribuio de frequncias e o grfico histograma correspondente.

Salrios (x salrios mnimos)


5,25 7,39 8,74 9,80
5,73 7,44 8,95 10,53
6,26 7,59 9,13 10,76
6,66 8,12 9,35 11,06
6,86 8,46 9,77 11,59
4.5 - Uma pesquisa de opinio perguntou a 124 pessoas qual o antitrmico preferido entre as marcas A, B, C, D e
E. Os resultados esto representados na tabela abaixo

Marcas N pessoas
A 45
B 32
C 23
D 15
E 9
Construa o grfico de barras correspondente.

4.6 - Em um levantamento realizado em um hospital, 95 pessoas responderam a seguinte questo: Como voc
classifica o atendimento recebido? As possveis respostas estavam classificadas em Pssimo, Ruim, Razovel,
Bom ou Excelente. O nmero de pessoas em cada uma dessas classes pode ser encontrado na tabela abaixo.

Qualidade N pessoas
Pssimo 10
Ruim 23
Razovel 38
Bom 20
Excelente 4
4.7 - Foram contabilizados o nmero de pessoas que foram atendidas em um dia em diversas reas de um
hospital. Os resultados obtidos podem ser encontrados na tabela abaixo.

reas Atendimentos
Pronto-Socorro 364
Pediatria 286
Psicologia 127
Neurologia 86
Ginecologia 176
Total 1039
Construa um grfico de barras correspondente.

4.8 - Um hospital tem o interesse em determinar a altura mdia dos pacientes de uma determinada rea e
relacion-la com a incidncia de determinada anomalia ortopdica. Foram selecionados 80 pacientes e as
alturas (em m) podem ser encontradas na tabela abaixo.
Altura dos pacientes
1,72 1,78 1,87 1,86 1,79 1,79 1,83 1,74 1,64 1,62
1,75 1,65 1,75 1,58 1,63 1,77 1,64 1,68 1,66 1,82
1,68 1,80 1,74 1,76 1,74 1,72 1,75 1,89 1,73 1,76
1,72 1,71 1,63 1,81 1,65 1,58 1,63 1,70 1,73 1,57
1,75 1,64 1,73 1,70 1,75 1,56 1,70 1,68 1,68 1,79
1,75 1,71 1,62 1,83 1,72 1,76 1,67 1,82 1,67 1,60
1,67 1,61 1,61 1,67 1,75 1,80 1,70 1,77 1,73 1,77
1,64 1,66 1,74 1,66 1,66 1,79 1,68 1,79 1,69 1,80
Construa a tabela de distribuio de frequncias por intervalos de classes e o histograma correspondente.

4.9 - Em um hospital foram coletados os salrios (em salrios mnimos) de 36 funcionrios. Os resultados esto
dispostos na tabela abaixo. Construa a distribuio de frequncias em intervalos de amplitude 2 e
o histogramacorrespondente.

Salrios de 36 funcionrios (x salrio mnimo)


4,00 6,86 8,74 10,53 13,23 16,22
4,56 7,39 8,95 10,76 13,60 16,61
5,25 7,59 9,13 11,06 13,85 17,26
5,73 7,44 9,35 11,59 14,69 18,75
6,26 8,12 9,77 12,00 14,71 19,40
6,66 8,46 9,80 12,79 15,99 24,00

REFERNCIAS BIBLIOGRFICAS

[1] Douglas C. Montgomery - Introduction to Statistical Quality Control, John Wiley and Sons, 1985.

[2] Fundamentos do Controle Estatstico do Processo - Manual de Referncia, IQA.

[3] Schmidt, S. R. and Launsby, R. G. - Understanding Industrial Designed Experiments, Air Academic Press,

Colorado Springs, CO, (1997).

[4] Forrest W. Breyfogle (1999) - Implementing Six Sigma: Smarter Solution Using Statistical Methods, John Wiley
& Sons, INC.

[5] M. N. Magalhes e A. C. P. De Lima (2001) Noes de Probabilidade e Estatstica, 3 edio, Editora USP.

[6] P. L. Meyer (1983) - Probabilidade: Aplicaes Estatstica, segunda edio, Livros tcnicos e
Cientficos Editora.

[7] W. O. Bussab e P. A. Morettin (1987) - Estatstica Bsica - 4 Edio, Atual Editora.

[8] Breyfogle, Forrest W. - Implementing Six Sigma: Smarter Solution Using Statistical Methods, John Wiley &
Sons, INC, (1999).

[9] Fundamentos do Controle Estatstico do Processo - Manual de Referncia, IQA.

[10] R. L. Mason, R. F. Gunst, J. L. Hess (1989) Statistical Design and Analysis of Experiments: with applications do

Engineering and Science, John Wiley & Sons.

[11] BIPM, IEC, IFCC, ISO, IUPAC, IUPAP, OIML, Guide to the Expression of Uncertainty in Measurement, 1995.

[12] NBR ISO 10012-1, Requisitos de Garantia da Qualidade para Equipamentos de Medio, 1993.

[13] MSA, Anlise dos Sistemas de medio, terceira edio.

[14] Verso Brasileira do documento de referncia EA-4/02: Expresso da incerteza de medio na calibrao,
INMETRO.

[15] Montgomery, Douglas C., Design and Analysis of Experiments - Fourth Edition - Ed. John Wiley Sons,
1997.

Vous aimerez peut-être aussi