Vous êtes sur la page 1sur 48

ESTATÍSTICA DESCRITIVA

António Lulendo Samuel da Costa 1


ESTATÍSTICA DESCRITIVA

1 ÍNTRODUÇÃO

É hoje em dia pacífico, que a estatística é uma componente importante da


formação geral de base, necessária ao exercício de qualquer actividade
recorrendo a métodos de organização, modelação e decisão. Em particular,
princípios e métodos estatísticos encontram aplicação na generalidade das
áreas ligadas às ciências da natureza e às ciências do homem, devendo fazer
parte dos respectivos planos de estudo universitários.
A estatística actual, como elo de ligação fundamental entre a observação e a
teoria, tornou-se parte essencial do método científico. Ideias e conceitos
estatísticos estão, efectivamente, na base de modernas teorias da biologia, da
química e da física.
De um modo geral, pode afirmar-se que a ciência contemporânea é
caracterizada pela invasão dos métodos matemáticos nos domínios mais
variados da economia à biologia, à linguística, à psicologia, etc.
Tornou-se com orientação o ensino de conceitos e métodos que permitam aos
estudantes o tratamento e a análise crítica de dados, procurando extrair deles
toda a informação pertinente para a resolução de problemas que se põem na
prática científica e profissional.
O desenvolvimento da informática, e em particular dos microcomputadores,
tem tido um forte impacto nas aplicações da Estatística pondo à disposição dos
investigadores um meio auxiliar de cálculo de grande potência e versatilidade.
A possibilidade de evitar a realização de longos e morosos cálculos, permite
um maior investimento de tempo na melhoria da qualidade dos dados e faculta
uma maior liberdade na escolha de modelos de análise e interpretação.
Cálculos que actualmente podem ser feitos em minutos, ou mesmo em
segundos, seriam praticamente impossíveis algumas décadas atrais.
O mundo dos negócios, em qualquer que seja a área, de Recursos Humanos a
marketing, não pode mais embaraçar a tomada de decisões e assumir riscos
simplesmente no feeling e no bom-senso dos executivos e gerentes
organizacionais. A complexidade da sociedade e dos mercados apresentada
actualmente exige estes agentes se utilizem de recursos precisos e poderosos
de forma a minimizar os potenciais recursos da actividade económica. Neste
contexto pode-se destacar a crescente utilização da informática, do método e
dos recursos de estatística nas organizações que almejam destacar-se como
agentes económicos de ponta.
Este curso tem a intenção de oferecer conhecimentos básicos de ferramentas e
métodos relacionados à pesquisa e a análise de dados visando o
aprimoramento da utilização de poderosos recursos com a visão gerencial de
como, e porque explorar a informação e de como enxergar em um “oceano” de
dados aqueles que efectivamente são capazes de promover um diferencial

António Lulendo Samuel da Costa 2


ESTATÍSTICA DESCRITIVA

competitivo à organização. Estatística básica para pesquisa de mercado não


pretende cobrir todas as possibilidades da analise estatística de dados mas sim
de prover uma consistente base sobre a qual novas habilidades podem ser
facilmente construídas e desenvolvidas.

2 ETIMOLOGIA

O termo estatístico surge da expressão em Latim statisticum collegium


palestra sobre assuntos de Estado, de onde surgiu a palavra em língua italiana
statista, que significa “homem de estado”, ou político, e a palavra alemã
statstik, designando a análise de dados sobre o Estado. Adquiriu um
significado de colecta e classificação de dados no início do século XIX.
A palavra Estatística vem do latim STATU que significa estado, uma vez que
desde tempos remotos, eram os estados que organizavam estudos para
conhecerem a sua população, determinarem leis sobre impostos e número de
homens disponíveis para combater.
A Estatística devido a sua contribuição é usada em largas áreas científicas,
económicas, políticas e sociais. Particularmente em Administração e em
Economia, uma grande razão para colectar, analisar, apresentar e interpretar
dados é dar aos gerentes e tomadores de decisão um melhor entendimento do
ambiente administrativo e económico e assim torna-lhes possível tomar
decisões mais fundamentadas e melhores.

3 DEFINIÇÃO DO CONCEITO «ESTATÍSTCA»

O conceito “estatística “ tem duas significações.


A primeira concerne a estatística ao singular e a segunda concerne as
estatísticas ao plural.
3.1 Estatísticas ao plural

São dados numerados relacionados a um fenómeno determinado.


Exemplo: As estatísticas escolares, económicas e militares.

António Lulendo Samuel da Costa 3


ESTATÍSTICA DESCRITIVA

Os números – tais como números de acidentes de trabalho por dia em Angola;


o número de habitantes de Luanda, Uíge, Benguela num dado momento; o
salário médio mensal de um trabalhador; a percentagem de alunos do 3º ciclo
que aprovaram num dado ano; a percentagem de grandes penalidades
convertidas nos jogos do Gira bola de 2017 – que usamos para caracterizar
certas situações ou comportamentos são estatísticas
3.2 Estatística ao singular

Para se ter uma primeira ideia sobre o que é a estatística, citam-se as


definições de alguns Autores:
1ª - Estatística é a arte e a ciência de colectar, analisar, apresentar e interpretar
dados
2ª – Para KACHIGAN (1986), a estatística é a disciplina científica cujo fim
consiste na “recolha, organização e interpretação de dados de acordo com
procedimentos bem definidos”.
3ª – Par MURTEIRA (1993), “a estatística é um repositório de instrumentos
adequados para: recolher – explorar e descrever – interpretar conjunto de
dados numéricos”.
4ª – Estatística é o estudo dos métodos científicos para se operar com
números cujos objectivos se resumem na obtenção analítica e conclusões, a
partir daí, se basear nas “decisões razoáveis” a serem tomadas isto quando for
possível obter informações.
A análise de qualquer uma destas definições revela que na base da estatística,
está um conjunto de dados sendo esta constituída pelos métodos que são
utilizados para recolher, organizar, descrever e interpretar.
Assim podemos então reter-se uma tentativa de definição de estatística:
- É o conjunto de métodos adequados para recolher, explorar, descrever
e interpretar conjunto de dados numéricos;
- Ou ainda é uma área científica cujo objectivo principal é observar um
fenómeno, recolher, analisar e interpretar os dados e auxiliar a
formulação de decisões.
É a ciência que tem por objecto:
- A colecta dos dados prestes a subir uma avaliação numérica;
- A reunião, a organização e apresentação dos dados;
- A análise dos dados, a interpretação dos resultados obtidos;
- A utilização desses resultados em vista da tomada de decisões
concretas.

António Lulendo Samuel da Costa 4


ESTATÍSTICA DESCRITIVA

4 IMPORTÂNCIA DA ESTATÍSTICA

O mundo está repleto de problemas. Para resolvermos a maioria deles,


necessitamos de informações. Mas, que tipo de informações? Que quantidade
de informações? Após obtê-las, que fazer com elas? A Estatística trabalha com
essas informações, associando os dados ao problema, descobrindo como e o
que colectar assim capacitando o pesquisador a obter conclusões a partir
dessas informações, de tal forma que possam ser entendidas por outras
pessoas.
Portanto os métodos estatísticos auxiliam o cientista social, o economista, o
engenheiro, o agrónomo e muitos outros profissionais a realizarem o seu
trabalho com mais eficiência.
A Estatística é uma parte da Matemática que fornece métodos para a colecta,
organização, descrição, análise, e interpretação de dados, viabilizando a
utilização dos mesmos na tomada de decisões.
A estatística é indispensável sobre tudo na investigação científica, na
elaboração de relatórios, teses, etc.

5 TIPOS DE ESTATÍSTICAS

Enquanto disciplina científica, a estatística divide-se em dois ramos: duma


parte há a estatística descritiva ou dedutiva e em outra parte, há a estatística
matemática, inferencial, analítica ou indutiva.
5.1 Estatística Descritiva ou Dedutiva

Ela aponta a descrever e a resumir quantitativamente os dados colectados


sobre um universo (população) ou sobre um pequeno grupo (amostra) concreto
a fim de realçar o essencial e de realizar das sínteses numa linguagem
numérica.
Preocupa-se com a forma pela qual podemos apresentar um conjunto de
dados em tabelas e gráficos e também resumir as informações contidas
nestes dados mediante a utilização de medidas estatísticas (média,
mediana, variação, separação meia, separação padrão, coeficientes de
variação, percentil, coeficiente de correlação e regressão, etc.).
Diz respeito a técnicas sistemáticas de organização, classificação,
sumarização, redução e interpretação de dados.

António Lulendo Samuel da Costa 5


ESTATÍSTICA DESCRITIVA

Ainda de outra forma, é um conjunto de métodos cujo objectivo é


sintetizar e representar de forma compressível a informação contida nos
dados.
Trata-se da estatística que vamos começar a estudar.
Exemplo: Considere os dados sobre a hora de chegada dos professores de
uma Escola do II ciclo representados numa tabela. Facilmente, pode-se obter
algumas considerações sobre as horas de chegada dos professores
recorrendo-se a um gráfico. Pode se observar que a hora de chegada varia de7
à 9 horas, 8:30 a hora em que a maior parte dos professores chega ao
trabalho. É este o papel da estatística descritiva; fazer sumários dos dados.
Tabela 5-1 – Dados das horas de entrada dos professores de uma escola do II
Ciclo
Nome do professor Hora de Nome do professor Hora de
Chegada Chegada
Armindo Michael 7:00 Isidro Ramal 8:30
Belmira Timóteo 8:30 Janete António 8:30
Célia Brito 9:00 Laura Timba 8:00
Carlos Awa 8:00 Mateus Cumbne 8:00
Dionísio Alberto 7:30 Mário Goa 7:30
Domingos Fernandes 7:30 Paula Pintainho 8:00
Elsa Muando 8:30 Rita Ricos 7:00
Elisabeth Dário 8:30 Rui Baltes 9:00
Flórido Marques 7:30 Lucas Boa 8:30
Henriques Sitoe 7:00 Zeca Vica 8:00

0
7:00 7:30 8:00 8:30 9:00

Figura 5-1 Gráfico de barras das horas de entrada dos professores

António Lulendo Samuel da Costa 6


ESTATÍSTICA DESCRITIVA

5.2 Estatística Inferencial ou Indutiva

Ela aponta as características do universo concreto a partir dos dados


estatísticos provenientes ad amostra, tendo em conta das hipóteses
formuladas. Destina-se a interpretação dos dados; assim, podemos considerar
a estatística descritiva como uma introdução à analítica ou mesmo como uma
parte dela.
Em outras palavras a inferência estatística é o processo de utilizar obtidos a
partir de uma amostra para fazer estimativas ou testar hipóteses sobre as
características de uma população. Ou seja, a inferência estatística é um
conjunto de métodos que permite generalizar ou inferir os resultados de um
conjunto de dados (amostra) para um conjunto de dados mais amplos
(população).
De uma forma mais simples, a inferência é o conjunto de métodos que
permite fazer estimativas e tirar conclusões sobre uma população a partir
da informação contida na amostra.

6 CONCEITOS DA ESTATÍSTICA DESCRITIVA

6.1 População

Em estatística, é frequente a necessidade de recolher elementos (dados,


pessoas, objectos, acontecimentos, etc.), com o objectivo de proceder a
análise de determinados fenómenos reais. Para efectuar essa recolha deve ser
definida uma população também designada por universo, que representa o
conjunto de todos os elementos que possuem a característica ou
características em comum e que interessam ao estudo do fenómeno em
causa.
Exemplo: Relativamente à população constituída pelos estudantes do 1º Ano
de Psicologia do ISPEKA, podemos estar interessados em estudar as
características populacionais:
- Altura dos estudantes em centímetro (cm)
Depois de medir a altura de cada aluno, obtemos um conjunto de dados com o
seguinte aspecto: 154, 161, 158, 146, 140, 139, 162, 158, 161, 163, …
- Notas obtidas na primeira prova de psicologia: 10, 15, 13, 16, 11, 10, 18, 11,
13, 8
Relativamente a este exemplo, falamos da:

António Lulendo Samuel da Costa 7


ESTATÍSTICA DESCRITIVA

- População das estaturas dos estudantes do 1º Ano …


- População das notas dos estudantes obtidas em…
Outros exemplos
1 – O conjunto dos professores do ensino médio da sétima classe,
2 – As qualificações alcançadas pelos estudantes da 9ª classe da escola “11
de Novembro”,
3 – Os carros que circulam numa determinada cidade,
4 – Os funcionários de educação da província do Uíge, etc.
Para conhecer de forma completa uma população é necessário analisar todos
os seus elementos, isto é, realizar um senso.
Exceptuando casos em que a população tem dimensão modesta e é acessível,
raramente é possível analisar todos elementos da população por não se dispor
de orçamento, de tempo, e até algumas vezes por observação ser destrutiva.
As populações podem, no que respeita ao tamanho, ser classificadas em
populações finitas ou infinitas. Uma população é finita se o número de
elementos que a constituem é finito. Em caso contrario a população é infinita.
6.2 Amostra

É um subconjunto finito da população (uma parte ou segmento da população)

População Amostra

Figura 6-1 População e amostra

Em muitas situações, há procura de dados para um grande número de


elementos (indivíduos, empresa, eleitores, famílias, produtos, clientes, etc.).
Devido ao tempo, por razões económicas (custos) ou restrições de natureza
física, a logística e outros factores, os dados são colectados a partir de uma
pequena porção do grupo (amostra). Não é conveniente ou não é possível
observar todos elementos de uma dada população. Por outro lado a
observação de toda população poderá levar a que o estudo demore tanto
tempo a ser concluído e que o mesmo perca oportunidade.
Nota: a amostra, precisa de ser
- Representativa: deve conter indivíduos de todos os extractos da população
(para recolher a amostra, tem que ser representativa relativamente a população
onde foi recolhida);

António Lulendo Samuel da Costa 8


ESTATÍSTICA DESCRITIVA

- Não viciada: O número de cada extracto deve ser proporcional a população


desse extracto;
- Aleatória: em cada extracto os indivíduos devem ser escolhidos
aleatoriamente;
- Ampla: deve se bastante larga, para poder apresentar características
semelhantes às da população total que pretendemos representar.
Problema: como seleccionar uma amostra de tal modo que as informações
possam ser expandidas para toda população?
Por exemplo desejamos fazer uma sondagem a cerca da escolha dos
angolanos sobre o seu partido preferido. Achas que esta amostra é
representativa?
Não. Ao seleccionar a nossa amostra devemos considerar alguns critérios de
acordo com o tipo de pesquisa. Exemplo: região, sexo, nível socioeconómico,
idade, etc…
Na recolha de uma amostra é extremamente importante assegurar a sua
representatividade relativamente a população onde foi retirada.
Exemplo1: O conjunto das empresas de angola forma uma população e o
conjunto das empresas de Luanda constituem a amostra;
Exemplo2: Um patrocinador de um programa da televisão pretende conhecer a
popularidade do seu programa e simultaneamente ter uma ideia da
percentagem de espectadores de televisão que vêem o programa. Dada a
impossibilidade de inquerir a toda população – os espectadores – a sua opinião
sobre o programa, o patrocinador resolve escolher um pequeno número de
telespectadores – uma amostra – a quem vai perguntar o que pensam do
programa.
Exemplo3: Uma equipa de médicos dispõe de um novo medicamento para
evitar uma doença infantil muito comum e pretende testar a sua eficiência. Na
impossibilidade de aplicar o novo medicamento a todas as crianças, é recolhido
um grupo de crianças pertencentes aos vários grupos de idade, a quem será
ministrada o medicamento e estudados os resultados.
6.3 Variável

No estudo de uma população, a atenção do estatístico é concentrada num


carácter bem determinado que se chama variável ou característica.
Para fazer possível a medição da realidade social, fazem-se necessárias
observações de caracteres de pessoas ou objectos, estas características
variam de individuo a individuo pelo que recebem o nome de variáveis.
A altura de uma pessoa, o seu peso, o número de acidentes num local, são
exemplos de variáveis. Uma variável pode assumir valores diferentes para
elementos distintos da população. São frequentemente representadas pelas
letras 𝑥, 𝑦 𝑒 𝑧
As variáveis podem ser qualitativas ou quantitativas.

António Lulendo Samuel da Costa 9


ESTATÍSTICA DESCRITIVA

6.3.1 Variável qualitativa, nominal ou categorial

É uma característica não numérica da população isto é, os valores admissíveis


são atributos ou qualidades. Exemplo, a marca de um automóvel, a beleza, a
cor ou o sexo.
6.3.2 Variável quantitativa

É uma característica numérica da população. É todo símbolo (X, Y, …) que


numa dada questão pode tomar como valor qualquer número pertencente a um
conjunto numérico previamente fixado (ou conhecido). Pode ser discreta ou
contínua.
6.3.2.1 Variável quantitativa discreta

É uma variável que pode tomar apenas um conjunto finito ou uma infinidade
numérica de valores. Exemplo, o número de acidentes, o número de
nascimentos, o número de pessoas, etc.
6.3.2.2 Variável quantitativa contínua

É uma variável que toma valores num intervalo real, ou seja é aquele que pode
tomar um número infinito de valores reais diferentes. Exemplo: a temperatura
de um dado material, a altura e o peso de uma pessoa, o peso de pacotes de
farinha numa unidade de produção, o tempo de duração de uma reacção
química, etc.

7 ETAPAS DO MÉTODO ESTATISTICO

Podemos defini-las como sendo um processo utilizado para colectar,


apresentar, descrever, interpretar e até mesmo prever os aspectos
quantitativos dos fenómenos analisados, desde que eles possam conseguir a
forma de contagem ou medida.
Podemos subdividi-las em: identificação do problema ou situação, colecta
de dados, crítica e apuramento de dados, apresentação dos dados,
analise e interpretação dos dados.
7.1 – Identificação do problema ou situação

Deve ser claro, desde o início de estudo, qual o problema a analisar e uma vez
conhecido, qual o tipo de decisão que se pretende tomar. Esta etapa requere já
algum conhecimento estatístico pois os métodos a aplicar não são de modo
nenhum, independentes da informação que se pretende recolher. Uma
identificação incorrecta do problema torna as etapas seguintes inúteis. Ainda

António Lulendo Samuel da Costa 10


ESTATÍSTICA DESCRITIVA

nesta etapa e para tornar a identificação do problema mais fácil, poderá ser
utilizada alguma informação quantitativa já existente.
7.2 – Colecta dos dados

Quando falamos em colecta de dados devemos separa-la em dois métodos ou


fontes: colecta de dados primários (direito) quando o pesquisador colecta os
dados na fonte originária, e colecta de dados secundários (indirecto), no caso
contrario. Exemplificando melhor: quando o Instituto Nacional de Estatística
(INE) faz o levantamento (senso) da população, normalmente utiliza processo
primário ou direito. Caso queira com base nos sensos anteriores, projectar
essa mesma população, estará utilizando o método secundário ou indirecto,
(pois os dados já foram obtidos anteriormente).
No respeitante a periodicidade, a recolha dos dados pode ser classificada
como:
- Contínua: quando realizada permanentemente,
- Periódica: quando feita em intervalos de tempo,
- Ocasional: quando realizada de modo esporádica.
Existem vários métodos para recolher novas informações. As entrevistas
pessoais são uma prática corrente: um entrevistador faz ao entrevistado
perguntas direitas, de preferência, de um questionário estruturado e coloca as
respostas nos espaços a elas reservados. Mas as entrevistas podem também
ser feitas pelo telefone ou, quando por alguma razão se quer evitar a presença
de um entrevistador, pode optar-se por enviar um questionário.
EXEMPLO DE UM QUESTIONÁRIO OPINATIVO USADO PELO
RESTAURANTE ROS –PINTO:
Estamos felizes com sua presença no ROS-PINTO, e queremos estar certos de
que voltará a nos visitar. Assim ficamos muito agradecidos se você responder a
este questionário. Seus comentários e sugestões são muito importantes para
nós. Muito obrigado
Nome do garçon:…………………………………………………………………….
Excelente Boa Satisfatória Insatisfatória
Qualidade da comida
Qualidade do serviço
Rapidez no atendimento
Higiene
Administração

Comentário:……………………………………………………………………………...
..............................................................................................................................
O que o induziu a nos visitar?……………………………........................................
…………………………………………………………………………………………

António Lulendo Samuel da Costa 11


ESTATÍSTICA DESCRITIVA

Por favor deixa este cartão na caixa de sugestões, à entrada. Muito obrigado.

7.3 – Crítica ou apuração de dados

Uma vez os dados recolhidos, quer sejam primários ou secundários é


necessário proceder-se a uma revisão crítica de modo a suprimir valores
estranhos ou eliminar erros capazes de provocar futuros enganos de
apresentação e análise.
Esta crítica é tanto mais necessário quando toda ou parte da informação
provem de fontes secundarias, sujeitas a erros de produção e que nem sempre
explicitam como os dados foram recolhidos ou quais são os limites a sua
utilização.
7.4 – Apresentação dos dados

Após a recolha e a crítica, convém organizar os dados de maneira prática e


racional, para um melhor entendimento do fenómeno que se pretende estudar.
Começa aqui o principal objectivo da Estatística Descritiva: criar os
instrumentos necessários para classificar e apresentar conjunto de dados
numéricos de tal modo que a informação neles contida seja apreendida mais
fácil e rapidamente.
Uma vez classificados os dados, passa a ser possível sintetizar a informação
que ajudem a compreender a situação e a identificar relações importantes entre
as variáveis.
Os métodos estandardizados de descrição e apresentação de dados tornam-se
muito importantes sobre tudo porque aqueles aquém a informação é dirigida
deverão poder compreende-la de forma fácil e rápida.
7.5 – Análise, Interpretação e Conclusão dos dados

Por último é necessário interpretar os resultados encontrados. Esta


interpretação estará tanto mais facilitada quanto se tiverem escolhido, em
etapas anteriores, instrumentos mais apropriados à representação e análise do
tipo de dados recolhidos.
De todas as fases do método estatístico, esta é a que apresenta maiores
dificuldades. Isto porque todo trabalho efectuado até ao momento, deixará de
ter valor devido, se a conclusão não estiver coerente.

António Lulendo Samuel da Costa 12


ESTATÍSTICA DESCRITIVA

8 ORGANIZAÇÃO DOS DADOS, QUADROS E GRÁFICOS

Os dados são os factos e números colectados, analisados e sintetizados para


apresentação e interpretação de conjunto de dados.
Entidades como empresas de marketing, organizações governamentais e
departamentos de educação fazem sondagens constantemente e recolhem
uma quantidade de informação enorme que, na sua forma original, pode conter
grande potencial, mas tem normalmente, pouco interesse, dada a dificuldade
de manuseamento associada ao volume dos dados recolhidos. Precisamos por
isso de sintetizar (ou reduzir) e representar de forma compreensível a
informação contida nesses grandes conjuntos de dados, usando metodologia
(medidas, tabelas ou quadros e gráficos) da estatística descritiva.
Quando se se realiza uma experiência estatística as observações são
registadas, eventualmente, pela ordem em que são efectuadas, sem qualquer
outro tipo de preocupação. Obtêm-se assim os dados brutos ou originais.
- Dados originais (ou brutos), são conjunto de dados na sequência em que
foram registados, antes de terem sido organizados ou tratados. Ou são dados
que ainda não se encontram prontos para a análise, por não estarem
numericamente organizados.
Exemplo: A tabela mostra um conjunto de dados contendo informações
financeiras referentes a 12 empresas, extraídas do banco de dados stock
Investor Pro.

Tabela 8-1 conjunto de dados contendo informações financeiras referentes a 12


empresas
Empresa Bolsa Símbolo Vendas Preço da Relação
de do Painel anuais Acção Preço/
Valores Electrónico (US₴milhõ) (US ₴) ganhos
Award softwar OTC AWRD 15,7 11,500 22,5
Chesapeake energy NYSE CHK 255,5 7,880 12,7
Craig corperation NYSEC CRG 29,4 17,000 7,5
Edisto Resources AMEX EDT 254,6 9,688 6,0
Franklin Elect.Pbls NYSE FEP 88,7 12,880 15,7
Gentia Software OCT GNTIY 27,7 5,750 27,4
Giants Group NYSE GPO 7,2 6,563 2,1
Hot Topic OTC HOTT 48,3 15,750 27,2
Hudson General AMEX HGC 30,2 39,750 11,2
ICU Medical OCT ICUI 26,5 8,500 15,7
Jackpot Interpreses NYSE J 90,6 10,875 17,0
Kentek Informtion OCT KNTK 60,5 9,500 11,4

António Lulendo Samuel da Costa 13


ESTATÍSTICA DESCRITIVA

Como já falamos atrás uma variável é uma característica de interesse para os


elementos. O conjunto de dados na tabela 8-1 apresenta as seguintes cinco
variáveis:
- Bolsa Valores: Onde a acção da empresa é negociada – NYSE (New York
Stock Exchange); AMEX (American Stock Exchange); e OTC (Títulos não
comercializados na bolsa).
-Símbolo do Painel Electrónico: a abreviatura usada para identificar a
empresa na lista da bolsa.
- Vendas Anuais: Vendas totais para os últimos doze meses em milhões de
dólares.
- Preço da Acção: Preço de mercado por acção para as acções da empresa.
- Relação Preço/Ganhos: Preço de mercado por acção dividido pelos ganhos
dos últimos meses por acção.
Os dados são obtidos colectando-se as medidas de cada variável para cada
elemento no conjunto. O conjunto de medidas colectadas para um determinado
elemento, é chamado de observação. Referindo-se a tabela…, vemos que o
primeiro elemento (Award Software) fornece as observações OTC; AWRD;
15,7; 11,500; e 22,5.Com observações; com cinco variáveis para cada
observação, existem 60 valores de dados no conjunto de dados.
De igual modo como as variáveis os dados também podem ser classificados
em qualitativos (discretos) ou quantitativos (discretos ou contínuos).

8.1 – Dados Qualitativos

São obtidos através da observação de uma característica não numérica,


(reflectem qualidades); isto é são rótulos ou nomes usados para identificar um
atributo de cada elemento. Por exemplo: cores das flores, estado civil das
pessoas, etc. Referindo-se ao conjunto de dados da tabela 8-1 vemos que os
valores de dados para a variável Bolsa de Valores (NYSE, AMEX e OTC) são
nomes usados para identificar para identificar onde as acções são
comercializadas. Assim, os dados são qualitativos e a Bolsa de Valores
constitui uma variável qualitativa. O símbolo do painel electrónico é também
uma variável qualitativa, e os valores de dados AWRD, CHR, etc. são os
nomes usados para identificar a empresa correspondente.

8.2 – Dados Quantitativos

Reflectem quantidade; por exemplo nº de trabalhadores de uma empresa,


tempo de duração de uma reacção química, etc. Eles podem ser discretos ou
contínuos.

António Lulendo Samuel da Costa 14


ESTATÍSTICA DESCRITIVA

8.2.1 Dados Quantitativos Discretos

São obtidos de observações de variáveis quantitativas discretas; isto é são


aqueles que só podem tomar um nº finito ou numerável de valores reais
diferentes. Por exemplo: Número de filhos de uma família, nº de peixes de um
aquário, quantidade de árvores frutíferas de uma fazenda.

8.2.2 Dados Quantitativos Contínuos

São obtidos através da observação de uma variável numérica contínua de uma


população; isto é quando podem tomar qualquer valor real de um intervalo de
números reais, ou seja quando podem tomar um número infinito não numerável
de valores reais diferentes. Por exemplo: Estatura de uma pessoa, produção de
um cultivo, tempo de duração de uma reacção química, etc. o valor dos dados
das vendas anuais da tabela 8-1 como 15,7; 255,3; 29,4 etc. são dados
quantitativos contínuos, indicando quantos milhões de dólares em vedas a
empresa obteve durante o período dos últimos doze meses.
8.3 Quadros

O sucesso na utilização de dados estatísticos dependem, em grande parte, do


modo com estes estão apresentados e podem ser utilizados.
Os quadros estatísticos têm a vantagem de conseguir expor, sinteticamente e
em um só local os resultados sobre determinado assunto, de modo a se obter
uma visão global mais rápida daquilo que se pretende analisar.
Exemplo: Preço de 30 habitações vendidas em Luanda de Janeiro a Maio de
2010
Tabela 8-2 Valores de 30 habitações vendidas em Luanda em 2010
18480 18640 17280 18600 16400
16560 14484 14800 18800 17000
15700 19160 14640 17000 17200
17680 16400 21300 17600 18200
21900 21280 17360 18120 17800
16440 18000 14801 16400 18300

Tal como estão apresentados estes dados, dificilmente se retira deles


quaisquer conclusões. Uma primeira solução para este problema será ordenar
os dados de acordo com alguns critérios; por exemplo, por ordem crescente do
valor das vendas.
Quer os quadros, quer os gráficos devem apresentar três partes: cabeçalho,
corpo e rodapé.
O cabeçalho deve dar-nos a informação sobre os dados, em que consistem e a
que se referem;

António Lulendo Samuel da Costa 15


ESTATÍSTICA DESCRITIVA

O corpo é representado por colunas e sub colunas dentro das quais se


apresentam os dados;
O rodapé para além da identificação da fonte dos dados, poderá ainda incluir-
se quaisquer observações pertinentes.
Tabela 8-3 Preço de venda de 30 habitações em Luanda, 2010 (valores por ordem
crescente)
Meses Janeiro Fevereiro Março Abril Maio
15700 14484 14640 16400 16400
Valores 16440 16400 14800 17000 17000
de 16560 18000 14801 17600 17200
Venda 17680 18640 17280 18120 17800
(USD) 18480 19160 17360 18600 18200
21900 21280 21300 18800 18300

Total 89080 107964 85380 88920 104900

Esta nova tabela, permite-nos já retirar algumas conclusões:


- Quais são os maiores e os menores valores atingidos;
- Quais são os valores que se repetem e quantas vezes;
- Qual é o mês que se registou maior ou menor valor de venda; etc.
8.4 Gráficos

Os gráficos assumem papel fundamental em qualquer campo da ciência, seja


na Física, na Química, na Biologia, na Medicina, na Engenharia, na Estatística
e outras.
A representação gráfica dos dados têm por finalidades, dar uma ideia, a mais
imediata possível dos resultados obtidos, permitindo chegar-se a conclusões
rápidas sobre a evolução do fenómeno em estudo ou sobre a relação entre os
diferentes valores apresentados. Para que tal seja conseguido, quando se
constrói um gráfico deverá ter-se em consideração três aspectos:
simplicidade, clareza, e veracidade.
Sua utilização em Estatística é de suma importância, visto que, praticamente,
todo e qualquer relatório analítico, vem acompanhado de gráfico ilustrativo. Isto
facilita a interpretação rápida do fenómeno que ora se analisa.

8.4.1 Tipo de Gráficos

8.4.1.1 Gráfico linear ou de línea

É talvez o mais utilizado de entre todos os tipos de gráficos devido a sua


faculdade de execução e de interpretação. É representado usualmente em

António Lulendo Samuel da Costa 16


ESTATÍSTICA DESCRITIVA

forma de linha (cheia, interrompida), largamente empregada para representar


fenómenos contínuos, mormente em dados dispostos por período de tempo
(semana, mês, ano, hora, etc.) ou por magnitude das ocorrências (distribuição
de frequência). Na sua construção colocam-se, geralmente, no eixo vertical a
variável definida em quantidades, enquanto no eixo horizontal coloca-se uma
escala de tempo.

Preferência na ocupaçao do tempo


livre
50
F
r 40
e
30
q
u 20
ê
n 10
c 0
i Tipo de Leitura TV oucinema Exercício físico
a preferência

Figura 8-1 Gráfico de línea sobre o inquérito realizado a 50 habitantes para


analisar a sua preferência em termos de ocupação de tempo livre

8.4.1.2 Gráfico de Bastão ou Diagrama de bastão

Coloca-se no eixo das abcissas a variável em estudo e no eixo horizontal as


frequências.

Figura 8-2 Notas de História de 20 alunos da 10ª classe de uma escola de


Cacuaco

António Lulendo Samuel da Costa 17


ESTATÍSTICA DESCRITIVA

8.4.1.3 Gráfico de Barras

É uma representação dos dados em que se usam barras separadas ( de igual


largura) cuja altura é proporcional à frequência (absoluta e relativa) da
categoria correspondente.
Constrói-se colocando os valores da variável em observação num dos eixos
(horizontal) e as respectivas frequências no outro eixo (vertical)

Preferência na ocupaçao do tempo


livre
50
F
r 40
e
30
q
u 20
ê
n 10
c 0
i Tipo de Leitura TV oucinema Exercício físico
a preferência

Figura 8-3 Gráfico de barras sobre o inquérito realizado a 50 habitantes para


analisar a sua preferência em termos de ocupação de tempo livre.

8.4.1.4 Gráfico circular, de Sector ou Sectograma ou gráfico de Pizza

É uma representação dos dados num círculo dividido em sectores circulares


cuja área (e consequentemente, ângulo ao centro correspondente) é
proporcional à frequência da categoria que representa. Devemos lembrar que
o gráfico de sectores é ilustrado com valores relativos e não absolutos. Para
isso é preciso transformar os valores absolutos em relativos (%) e, a partir daí,
transforma-los em graus correspondentes.
Para construí-lo, divide-se o circulo em sectores, cujas áreas serão
proporcionais aos valores individuais.

António Lulendo Samuel da Costa 18


ESTATÍSTICA DESCRITIVA

Gráfico de Sector

Outra leitura
14% 8%

Exercício físico
TV ou cinema
32%
46%

Figura 8-4 Preferência na ocupação de tempo livre

8.4.1.5 Histograma

É uma representação gráfica em forma de colunas justapostas


É construído com rectângulos de tal modo que a base de cada rectângulo é
proporcional a amplitude da respectiva classe e a área proporcional à
frequência da classe. No eixo horizontal, colocam-se as classes e no eixo
vertical as frequências absolutas ou relativas.
Exemplo: Um departamento do Ministério das Pescas realizou, recentemente,
um inquérito a 50 pescadores de uma vila piscatória para conhecer melhor a
sua distribuição etária. Classificaram os pescadores em intervalos de 10 anos e
contaram 1 pescador na classe etária de 15 a menos de 25 anos, 5 pecadores
na classe de 25 a menos 35 anos, 9 de 35 a menos de 45 anos, 14 de 45 a
menos de 55 anos, 12 de 55 a menos de 65 anos, 8 de 65 a menos 75 anos, e
finalmente 1 pescador de 75 a menos de 85 anos.
Construa a distribuição de frequência na forma tabular.

Tabela 8-4 Distribuição etário dos pescadores


Classe etária Frequência absoluta Frequência relativa
(%)
(Número de pescadores)
15 a menos de 25 1 2
25 a menos de 35 5 10
35 a menos de 45 9 18

António Lulendo Samuel da Costa 19


ESTATÍSTICA DESCRITIVA

45 a menos de 55 14 28
55 a menos de 65 12 24
65 a menos de 75 8 16
75 a menos de 85 1 2
Total 50 100

Distribuição
35 9 etário dos pescadores
45 9
16
p 45 14
N 14
e 55 14
ú 12
s 55 12
m 10
c 65 12
e 8 65
a 8
r 6 75
d 8
o
o 4 75 1
r 2 85 1
d
e 0 85 0
e
s 0 20 40 60 80 100
Idade (anos)

Figura 8-5 Distribuição etário dos pescadores.

8.4.1.6 Poligonal Característica

Idêntico ao Histograma só que a parte gráfica em destaque é o contorno


poligonal do conjunto das colunas.

António Lulendo Samuel da Costa 20


ESTATÍSTICA DESCRITIVA

Poligonal Característica
16
p 14
N
e
ú 12
s
m 10
c
e
a 8
r
d 6
o
o 4
r 2
d
e 0
e
s 0 20 40 60 80 100
Idade (anos)

Figura 8-6 Distribuição etário dos pescadores

8.4.1.7 Polígono de frequência

É uma representação gráfica dos dados em que se une através de segmentos


de recta, todos os pontos cuja a abcissa é o centro de uma classe e a
ordenada é a frequência dessa classe. Consta de uma poligonal cujos vértices
são obtidos pela intersecção de cada ponto médio da classe e a sua respectiva
frequência absoluta simples correspondente.

Polígono de frequência
16
p 14
N
e
ú 12
s
m 10
c
e
a 8
r
d 6
o
o 4
r 2
d
e 0
e
s 0 20 40 60 80 100
Idade (anos)

Figura 8-7 Polígono de frequência simples da distribuição etária dos pescadores.

António Lulendo Samuel da Costa 21


ESTATÍSTICA DESCRITIVA

8.4.1.8 Polígono de frequência Acumuladas (Ogivas de Galton)

Da mesma maneira que representamos graficamente as frequências absolutas


simples, podemos representar as frequências acumuladas por meio dos
diagramas de frequência, acumulada, no caso a Ogiva de Galton.
Nas Ogivas, podemos representar qualquer tipo de frequência, quer seja
absoluta, relativa ou percentual, crescente (abaixo de), quer decrescente
(acima de), mantendo sempre o eixo das abcissas e alternando a escala do
eixo das ordenadas, conforme o tipo dessa frequência.
Para sua construção, marcamos nas abcissas os valores da variável e nas
ordenadas as frequências acumuladas.

Polígono de frequência Polígono de frequência


Acumuladas "abaixo de" acumilada "a cima de"
60 60
50 50
40 40
30
30
20
20
10
10
0
0 20 40 60 80 100 120 0
0 20 40 60 80 100 120

60

50

40

30

20

10

0
0 20 40 60 80 100 120

Figura 8-8 Polígono de frequências acumuladas composto, “abaixo de” e “acima


de”

António Lulendo Samuel da Costa 22


ESTATÍSTICA DESCRITIVA

9 DISTRIBUIÇÃO DE FREQUÊNCIA

Entende-se por frequência absoluta ou simplesmente frequência, de um


valor x de X, o número de vezes que aquele ocorre num conjunto de
observações (ou medidas).
A distribuição de frequência é uma técnica estatística para apresentar uma
colecção de objectos classificados de modo a mostrar o número existente em
cada classe; ou seja é um arranjo tabular dos dados por classe, juntamente
com as suas respectivas frequências.
Dados Tabulados não agrupados em classe: tabela onde os valores da
variável aparecem individualmente.
9.1 Distribuição de frequência de variáveis discretas

O quadro de distribuição de frequência é construído da seguinte forma: numa


coluna colocam-se todos os valores que a variável apresenta e na segunda
coluna o número de ocorrências correspondentes a cada valor da variável.
Quando se trata de uma variável discreta, a construção do quadro é imediata,
pois, a cada valor da variável, faz-se corresponder o número de ocorrências.
Exemplo de distribuição de frequência: considere-se uma população N ou uma
amostra n de indivíduos com características que apresenta K modalidades
observadas 𝑥1 , 𝑥2 , 𝑥3 , … 𝑋𝑘

Modalidades ou valores Frequência absoluta (𝒇𝒊 )


observados ou variável (𝑿𝒊 )
𝑿𝟏 𝒏𝟏
𝑿𝟐 𝒏𝟐
𝑿𝟑 𝒏𝟑
. .
. .
. .
𝑿𝒌 𝒏𝒌

Tabela 9-1 Exemplo de tabela de distribuição de frequência de variável


qualitativa ou quantitativa discreta.

António Lulendo Samuel da Costa 23


ESTATÍSTICA DESCRITIVA

Exemplo1 Realizou-se um inquérito a 50 habitantes de uma cidade para


analisar a sua preferência em termos de ocupação de tempo livre. Verificou-se
que 4 pessoas preferiam ler, 23 ver televisão ou cinema, 16 praticar exercício
físico e 7 outras actividades. Elabore uma tabela com os dados organizados
por categorias.
Tabela 9-2 Tipo de preferência na ocupação de tempo livre
Tipo de preferência Número de habitantes
Leitura 4
TV ou cinema 23
Exercício físico 16
Outra actividade 7
Total 50

Exemplo 2: Realizou-se um inquérito em 50 habitações da cidade de Luanda,


para se estudar o tamanho dos agregados familiares. Verificou-se que 4
agregados eram constituídos por 1 pessoa, 10 por 2, 15 por 3, 13 por 4, 6 por 5
e 2 por 6. Construa a distribuição de frequência.

Tabela 9-3 Distribuição do tamanho dos agregados familiares


Nº de pessoas do agregado Frequência absoluta
1 4
2 10
3 15
4 13
5 6
6 2
Total 50

9.2 Tipos de frequências

Frequência absoluta (𝒇𝒊 ): Como já falamos atrás é o número de vezes que


cada modalidade da variável se repete na amostra ou população, ou por outras
palavras, número de indivíduos que apresentam o valor (Xi) de característica x.
A partir da frequência absoluta, podem calcular-se as frequências relativas
(𝒇𝒓 ), Percentual (𝒇𝒓 %) e as absolutas acumuladas ( ascendentes ou
descendentes).
Frequência relativa (𝒇𝒓 ) 𝒆 𝒑𝒆𝒓𝒄𝒆𝒏𝒕𝒖𝒂𝒍 (𝒇𝒓 %) : é o quociente entre as
frequências dessa classe e a frequência total, lembrando sempre que a soma

António Lulendo Samuel da Costa 24


ESTATÍSTICA DESCRITIVA

das frequências relativas é igual a um (1), a soma das frequências relativas


percentuais é igual a cem (100) e a soma dos ângulos é igual a 360.

𝒇𝒊 𝒇𝒊
𝒇𝒓 = e 𝒇𝒓 % = × 𝟏𝟎𝟎 onde:
𝑵 𝑵
N = número de dados ou observações a distribuir
O ângulo em graus é obtido pelo produto da frequência relativa percentual pela
divisão do ângulo giro por 100
𝟑𝟔𝟎
∡ = 𝒇𝒓 % × ou ∡= 𝒇𝒓 % × 𝟑, 𝟔
𝟏𝟎𝟎
Frequência Absoluta Acumulada “abaixo de” (fac↓) de uma classe é
obtida através da adição sucessiva das frequências simples absolutas
de cada classe anterior a ela e a frequência absoluta dessa classe.
Exemplo: de acordo com o exemplo2 da tabela 9-3 construa um quadro
de distribuição de frequência e os gráficos de barras e de sector.
Tabela 9-4 Distribuição de frequência do tamanho dos agregados familiares
Variável 𝑓𝑖 𝑓𝑟 𝑓𝑟 % fac↓ fac↑ 𝑓𝑟 %
(X) × 3,6(∡)
1 4 0,08 8 4 50 28,8
2 10 0,2 20 14 46 72
3 15 0,3 30 29 36 108
4 13 0,26 26 42 21 93,6
5 6 0,12 12 48 8 43,2
6 2 0,04 4 50 2 14,4

∑ 𝑓𝑖 ∑ 𝑓𝑟 ∑ 𝑓𝑟 % ∑ 𝑓𝑟 %
= 50 =1 = 100 × 3,6
= 360

16
F 14
r a
12
e b
10
q s
u o 8
ê l 6
n u 4
c t 2
i a 0
António
a Lulendo 1Samuel da
2 Costa 3 4 5 6 25
Nº de pessoas
ESTATÍSTICA DESCRITIVA

9.3 Distribuição de Frequência de Variável Contínua (dados


agrupados em classe)

As variáveis contínuas, por poderem tomar um número infinito não numerável


de valores, que possam ser as modalidades da característica em estudo. Para
definir estas classes é necessário introduzir alguns novos conceitos: o número
de classe, a amplitude, o limite e o ponto médio ou central da s classes.
Número de classe (K)
O bom senso diz-nos que não deverá ser número muito grande para que não
introduza irregularidades que poderão não existir na população, mas também
não deverá ser muito pequeno para que não haja perda de informação. A
selecção do número de classes ou intervalos não constitui nenhum método de
selecção que possa ser considerado o mais correcto. Uma vez que o objectivo
principal de uma distribuição de frequência é de evitar um número muito
pequeno ou muito elevado de intervalos.
Existem algumas regras básicas que deverão ser seguidas na construção dos
intervalos:
1 – Em geral o número de classe (K) deverá estar compreendido entre 4 e 20,
dependendo do número de observações existente;
2 – As classes deverão ter, sempre que possível, amplitudes iguais;
3 – Os pontos médios das classes deverão ser números de cálculo fácil;
4 – Classes abertas deverão ser evitadas embora nem sempre seja possível
faze-lo;
5 – Os limites das classes são definidos de modo a que cada valor da variável
é incluído num e só num intervalo.
Tendo em conta estas regras básicas, por vezes é adoptada uma das
seguintes soluções:

Para N ou n ≤ 25 o número de classe K é 𝑲 = √𝒏 → 𝑲 = √𝟐𝟓 = 𝟓


STURGES sugere uma regra para a determinação do número de classe (desde
que se conheça o número de observações ou informações), que é a seguinte:
𝑲 = 𝟏 + 𝟑, 𝟑 × 𝐥𝐨𝐠(𝒏); onde:
K = número de classes
N ou n = número de dados (observações) a distribuir.

Amplitude Total de Classe ( H, ∆𝑳, ou At)

É diferença entre os valores estremos de um rol; isto é a distância entre o limite


superior e o seu inferior: amplitude = b – a, ou seja:
At = Lim max. – Lim min
Lim max. = maior valor observado entre os dados

António Lulendo Samuel da Costa 26


ESTATÍSTICA DESCRITIVA

Lim min = menor valor observado entre os dados

Amplitude de Intervalo de Classes (I ou h)

É a diferença entre o limite superior e o inferior da mesma classe.


Às vezes, define-se classes de amplitude variável (amplitudes diferentes para
classes diferentes). Isto é o que acontece, normalmente, em estudos que
envolvem rendimentos, em que a ultima classe é aberta (o limite superior é
infinito). No entanto na maioria das situações, é desejável escolher a mesma
amplitude para todas as classes. Neste caso, a amplitude aproximada é obtida
por:
𝒎𝒂𝒊𝒐𝒓 𝒐𝒃𝒔𝒆𝒓𝒗𝒂çã𝒐 −𝒎𝒆𝒏𝒐𝒓 𝒐𝒃𝒔𝒆𝒓𝒗𝒂çã𝒐
𝒂𝒎𝒑𝒍𝒊𝒕𝒖𝒅𝒆 𝒅𝒂 𝒄𝒍𝒂𝒔𝒔𝒆 (𝑰 𝒐𝒖 𝒉) =
𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒍𝒂𝒔𝒔𝒆
isto é:
𝑨𝒕
𝑰=
𝑲
Esta aproximação deve ser arredondada para um número conveniente, o que
pode fazer variar ligeiramente o número de classes inicialmente seleccionado.

Ponto Médio ou Central da Classe (𝑿𝒊 𝒐𝒖 𝑷𝒎 𝒐𝒖 𝒂𝒊𝒏𝒅𝒂 𝑪𝒊 )

É a média aritmética entre o limite superior e o limite inferior, ou ainda a soma


do limite inferior de uma classe com a metade da amplitude de classe.
𝑳𝒊𝒎 𝐬𝐮𝐩 − 𝑳𝒊𝒎 𝒊𝒏𝒇 𝒉
𝑷𝒎 = 𝑿𝒊 = 𝑪𝒊 = ou 𝑷𝒎 = 𝑿𝒊 = 𝑪𝒊 = 𝐥𝐢𝐦 𝒊𝒏𝒇 +
𝟐 𝟐
Limites de Classes

São os números (valores) de cada classe, sendo o da esquerda (menor valor),


limite inferior (Lim inf) e o da direita (maior valor) limite superior (Lim sup).
Exemplo: na tabela 8-4; 15 a menos de 25 ou 15 Ⱶ 25; temos:
15 = limite inferior ou menor valor desta classe
25 = limite superior ou maior valor desta classe
Limites não Definidos

São aqueles em que geralmente deixamos indefinidos seus intervalos (primeira


ou última classe). Sempre que houver condições, devemos evitar esse critério,
pois ele torna difícil e até mesmo prejudica a análise e a representação dos
dados. Exemplo:
Ilustração 9-1 Distribuição dos domicílios da grande São Paulo, segundo a
classe de Renda (1974)
Renda domiciliar – 1,00 u.m Número de domicílios
Até a 800 622.720

António Lulendo Samuel da Costa 27


ESTATÍSTICA DESCRITIVA

801 a 1.600 733.920


1.601 a 2.300 356.265
2.301 a 3.500 256.455
3.501 a 5.900 109.115
Mais que 5.900 83.400
Total 2.171.400

Intervalos

1 – Um intervalo de classe que não tem limite superior ou inferior indicado, é


denominado intervalo de classe aberto; representado por (𝑎 < 𝑥 < 𝑏) ou
]𝑎, 𝑏[ ou ainda por ( 𝑎 − 𝑏), no qual inclui todos os valore intermediários aos
extremos com excepção dos extremos.
Exemplo: ]10, 12[: compreende todos os valores entre 10 e 12 excluindo 10 e 12
2 – Intervalo fechado: representado (𝑎 ≤ 𝑥 ≤ 𝑏) ou (𝑎 𝑏) no qual incluem além
dos valores intermediários, os próprios extremos.
Exemplo: [ 15 ↔ 25 ] compreende todos os valores entre 15 e 25.
3 – Intervalo semiaberto à direita: (𝑎 ≤ 𝑥 < 𝑏) ou (𝑎 Ⱶ 𝑏) inclui todos os valores
intermediários aos extremos inclusive o extremo a esquerda mas não inclui o extremo
a direita.
Exemplo:[15 Ⱶ 25] compreende todos os valores entre 15 e 25 excluindo 25.
4 – Intervalo semiaberto à esquerda: ( 𝒂 < 𝒙 ≤ 𝒃) ou seja ] a,b] ou ainda ( 𝑎 ˧ 𝑏),
inclui todos os valores intermediários aos extremos, inclusive o extremo a direita, mas
não inclui o extremo a esquerda.
Exemplo: ] 15, 25] compreende todos os valores entre 15 e 25 excluindo 15
Classe: Pode ser definida como sendo os sub intervalos da amplitude total de um
variável.
Nota: Rol: é um arranjo de dados numéricos brutos em ordem crescente,
decrescente ou desordenado de uma grandeza.
Exemplo1: Visitaram-se 25 fazendas para revisar a quantidade de árvores
infectadas por um certo viros. Os resultados foram os seguintes:
15 20 15 16 18 17 18 20 18 25 19 18 19
18 18 19 16 17 19 16 17 17 17 18 15
a) Construa uma tabela de distribuição de frequência e agrupe os dados em
classe
b) Represente graficamente os dados através de um histograma.
Resolução:
a) N = 25 logo 𝐾 = √𝑁 → 𝐾 = √25 → 𝐾 = 5;

António Lulendo Samuel da Costa 28


ESTATÍSTICA DESCRITIVA

𝐴𝑡 = 𝐿𝑖𝑚 𝑚𝑎𝑥 − 𝐿𝑖𝑚 inf → 𝐴𝑡 = 25 − 15 → 𝐴𝑡 = 10


𝐴𝑡 10
ℎ= →ℎ= →ℎ=2
𝐾 5
Tabela 9-5 Tabela de distribuição de frequência de 25 fazendas infectadas.

Classes Frequência absoluta (𝒇𝒊 )


15 Ⱶ 17 11
17 Ⱶ 19 11
19 Ⱶ 21 2
21 Ⱶ 23 0
23 Ⱶ 25 1

∑ 𝒇𝒊 = 𝟐𝟓

b)

12

i
n n 10
ú á f
m r e 8
e v c
r o t 6
o r a
e d 4
d s o
e a 2
s
0
0 5 10 15 20 25 30

Figura 9-1 Histograma. Representação gráfica de nº de fazendas infectadas

Eemplo2: Em uma investigação pedagógica sobre o seguimento da saúde em


uma escola se pediram as estaturas de 30 estudantes, obtendo os valores
seguintes (em cm):
138 125 119 135 164 149 142 156 144 163 150 157 135 145 132
176 147 173 150 128 149 142 156 144 163 150 157 135 145 132

António Lulendo Samuel da Costa 29


ESTATÍSTICA DESCRITIVA

a) Construa um quadro de distribuição de frequência começando por


determinar o nº de classe, a amplitude total, e a amplitude do intervalo da
classe
b) Ache as frequências relativas e as acumuladas.
c) Determinar os pontos médios de cada classe.
d) Quantos estudantes têm estaturas entre 159 e menor que 169 cm;
e) Construa o Histograma e o polígono de frequência correspondente.
Resolução:
a) N = 30 → 𝐾 = 1 + 3,3 × log(𝑁); 𝐾 = 1 + 3,3 × 𝑙𝑜𝑔30 → 𝐾 = 5,87 ≅ 6
𝐴𝑡 = 𝐿𝑖𝑚 𝑚𝑎𝑥 − 𝐿𝑖𝑚 𝑖𝑛𝑓 → 𝐴𝑡 = 176 − 119 → 𝐴𝑡 = 57
𝐴𝑡 57
ℎ= →ℎ= → ℎ = 9,9 ≅ 10
𝐾 6
Tabela 9-6 Tabela de distribuição de frequência de estaturas de 30 alunos
investigados numa escola
Classe 𝑓𝑖 𝑓𝑟 𝑓𝑟 % 𝑓𝑎𝑐 ↓ 𝑓𝑎𝑐 ↑ 𝑃𝑚
(Estatura)
119 Ⱶ 129 3 0,1 10 3 30 124
129 Ⱶ 139 6 0,2 20 9 27 134
139 Ⱶ 149 9 0,3 30 18 21 144
149 Ⱶ 159 7 0,233 23,3 25 12 154
159 Ⱶ 169 3 0,1 10 28 5 164
169 Ⱶ 179 2 0,066 6,6 30 2 174

∑ 𝑓𝑖 ∑ 𝑓𝑟 ∑ 𝑓𝑟 %
= 30 = 𝑜, 999 = 99,9
≅1 ≅ 100

10
F
r a 8
e b
q s 6
u o
4
ê l
n u 2
c t
i a 0
a 0 50 100 150 200
Classes

Figura 9-2 Histograma e Polígono de frequência das estaturas de 30 alunos


investigados numa escola

António Lulendo Samuel da Costa 30


ESTATÍSTICA DESCRITIVA

10 EXERCÍCIOS DE APLICAÇÃO

1 – Pretende-se fazer um estudo sobre o número de irmãos dos alunos do 10º


ano de escolaridade de uma Escola Secundária. Para isso, efectuou-se um
inquérito ao qual responderam 60 alunos.
Indique:
a) A população em estudo
b) A amostra em estudo
c) A variável em estudo
Resposta:
População em estudo: todos os alunos do 10º ano
Amostra escolhida: Os 60 alunos que responderam ao inquérito
Variável em estudo: nº de irmãos de cada aluno do 10º ano. Esta variável é
quantitativa discreta.
2 – O gerente de uma fábrica de detergentes pretende lançar um novo produto
para lavar a loiça, pelo que, encarrega uma empresa especialista em estudos
de mercado de “estimar” a percentagem de potenciais compradores desse
produto.
Resposta:
População em estudo: conjunto de todos agregados familiares do país
Amostra: conjunto de alguns agregados familiares, inqueridos pela empresa.
Problema: pretende-se, a partir da percentagem de resposta afirmativas, de
entre os inqueridos sobre a compra do novo produto, obter uma estimativa do
nº de compradores na população.
3 – Num estudo feito numa escola, recolheram-se dados referentes as
seguintes variáveis:
a) Idade
b) Ano de escolaridade
c) Sexo
d) Nota na disciplina de matemática
e) Tempo gasto diariamente no estudo
f) Distância de casa à escola
g) Local de estudo
h) Número de irmãos
i) Género
j) Classe

António Lulendo Samuel da Costa 31


ESTATÍSTICA DESCRITIVA

k) Marca de automóveis
Das variáveis indicadas, quais são as quantitativas e quais são as
qualitativas?
4 – Declara se cada uma das seguintes variáveis é qualitativa ou quantitativa:
a) Vendas anuais
b) Tamanho dos refrigerantes (pequeno, médio, grande)
c) Ganhos por acção
5 – Para realizar um estudo sobre o tempo gasto, em minutos por 60 elementos
de um clube de karting num circuito de 20 voltas, registou-se o tempo gasto por
16 desses elementos. Os resultados foram os seguintes:
14,1 13,5 15,0 16,2 17,6 18,7 13,1 15,5
16,6 17,2 14,8 15,9 18,0 16,3 14,9 14,3

5.1 – Indique:
a) A população
b) A amostra
c) Indique a variável estatística em estudo e classifique-a.
6 – O corpo administrativo de um consultório médico estudou o tempo de
espera dos pacientes que chegavam ao consultório com uma solicitação de
serviço de emergência. Os seguintes dados foram colectados no período de
um mês (os tempos de espera estão em minutos). 2; 5; 10; 12; 4; 4; 5; 17; 11;
8; 9; 8; 12; 21; 6, 8; 7; 13; 18; 3.
Construa um quadro de distribuição de frequência de dados simples
mostrando:
a) A distribuição de frequências absolutas
b) A distribuição de frequências relativas
c) A distribuição de frequências absolutas acumuladas
d) A distribuição de frequências relativas percentuais acumuladas
e) Que proporção de pacientes que necessitam de serviço de emergência
enfrenta um tempo de espera de nove minutos ou menos
f) Construa um gráfico de linha e um gráfico de bastão ou diagrama de
bastão.
7- Os anos de estudo para uma amostra de 50 indivíduos, dividida
equitativamente entre masculino e feminino, estão apresentados na seguinte
tabela:

António Lulendo Samuel da Costa 32


ESTATÍSTICA DESCRITIVA

4 7 6 4 4
12 7 6 8 5
8 5 5 4 8
4 1 3 4 7
5 5 4 4 4
4 2 4 1 4
11 4 8 5 0
7 4 5 8 0
5 6 2 4 5
4 4 4 4 7

a) Agrupar os dados em classes adoptando intervalo semi-aberto a direita e


numero de classes referencial, segundo o processo de Sturgers.
b) Calcule as frequências relativas percentuais acumuladas crescentes e
decrescentes
c) Construir o Histograma e o polígono de frequências absolutas acumuladas
crescente e decrescente.
8 – A seguinte tabela mostra a distribuição de frequência das compras de
refrigerantes:
Tabela 10-1 Tabela de distribuição de frequência das compras de refrigerantes
Refrigerantes 𝑓𝑖
Coca-Cola 19
Coca-Cola Light 8
Dr. Pepper 5
Pepsi cola 13
Sprite 5
Total 50

a) Calcular as frequências: relativas e acumuladas


b) Construir o gráfico de sector
9 – A seguinte tabela, mostra a participação nas vendas de veículos ao
mercado interno por empresa em Março de 1988, no Brasil.
Tabela 10-2 Tabela de distribuição de frequência de vendas de veículos
EMPRESA QUANTIDADE
Volkswagen 22091
General Motors 18681
Ford 12789

António Lulendo Samuel da Costa 33


ESTATÍSTICA DESCRITIVA

Fiat 5830
Mercedes-Bens 3190
Outros 1370
Total 63951

a) Construir o gráfico de pizza.


10– A empresa Brabeck está interessada em conhecer a trajectória (em Km)
efectuadas por seus veículos em 1998.Otiveram os seguintes dados:
10 10 12 14 14 14 14 15 17 17 17 17 17 17 17 17 18 20 20 20 20 20 23 24 24
24 26 26 26 26 27 27 27 27 27 28 28 28 28 28 30 31 31 31 31 31 31 32 34
a) Construir um quadro de distribuição de frequência começando por
determinar o nº de classe, a amplitude total e o intervalo da classe.
b) Determinar os pontos médios de cada classe
c) Construir um Histograma.

António Lulendo Samuel da Costa 34


ESTATÍSTICA DESCRITIVA

António Lulendo Samuel da Costa 35


ESTATÍSTICA DESCRITIVA

11 MEDIDAS DE ESTATISTICA DESCRITIVA

Nos pontos anteriores vimos como é possível sintetizar os dados sob a forma
de quadros ou (tabelas), gráficos e distribuições de frequências. Em seguida
serão apresentadas algumas medidas que nos permitem representar um
conjunto de dados relativos à observação de determinado fenómeno de forma
ainda mais resumida e permitem também a comparação de diferentes
distribuições: são as medidas de estatística descritiva.
Estas medidas descritivas – conhecidas por parâmetros quando analisamos a
população e estatísticas quando se trata da amostra - permitem-nos sumariar
os dados através de um só valor e devem obedecer a algumas propriedades
para serem boas medidas de discrição dos fenómenos em estudo.
Propriedades desejáveis das medidas descritivas
1 – Objectividade para que dois observadores diferentes cheguem a
mesma conclusão
2 - Depender de todas observações para reflectir a informação contida no
conjunto de todas as observações
3 – Ter um significado concreto para ter uma fácil interpretação
4 – Eficiência computacional e algébrica no que respeita à velocidade do
calculo e simplicidade algébrica
5 – Insensibilidade as variações das amostras para que as medidas
sejam estáveis
De entre as medidas descritivas distinguem-se:
- Medidas de localização;
- Medidas de dispersão;
- Medidas de assimetria, etc.
Neste capitulo debruçar-nos-emos sobre as primeiras – as medidas de
localização – deixando para os próximos capítulos o estudo dos restantes tipos
de medidas.
Estas medidas localizam os valores observados da variável no eixo dos
números reais. As mais importantes são as medidas de tendência central pois
representam os fenómenos pelos seus valores médios, em torno dos quais
tendem a concentrar-se os valores observados.

António Lulendo Samuel da Costa 36


ESTATÍSTICA DESCRITIVA

11.1 Medidas de posição ou tendência central

Se pretendermos caracterizar um conjunto numérico de dados por um número,


escolhemos um valor típico que é, um valor a volta do qual se distribuem os
dados. Este número/medida é particularmente interessante quando se
comparam vários conjuntos de dados.
Os mais importantes são a média, a mediana e a moda

11.1.1 Media Aritmética ou Média

A média aritmética é a medida de tendência central mais utilizada, e de mais


fácil interpretação. Quer se trate de um parâmetro da população ou de uma
amostra, a sua definição e calculo são idênticos.
Convém referir que há outras médias que não a aritmética – média geométrica,
média harmónica e média quadrática – no entanto ao longo deste texto,
sempre que nos referirmos a média e não especificarmos, pretendemos dizer
média aritmética.
A média aritmética pode ser simples (dados não agrupados em classe) ou
ponderada (dados não agrupados ou agrupados em classe).
11.1.1.1 Média Aritmética Simples (X)

É a soma de todos os valores observados dividida pelo número de


observações ou a Média aritmética de dois ou mais termos é o quociente do
resultado da divisão da soma dos números dados pela quantidade de números
somados.
a) Valores isolados simples
𝒙𝟏 +𝒙𝟐 +𝒙𝟑 +⋯+𝒙𝒏 𝟏
𝑿= = 𝒏 ∑ 𝒙𝒊 Onde: N = tamanho da população
𝒏

n = tamanho da amostra
Xi = valores individuais observado
Exemplo: Seja X={2, 5, 7, 6} temos:
1 2+5+7+6 20
X = 𝑛 ∑ 𝑥𝑖 → X= = =5
4 4

b) Valores isolados Ponderados


Se por outro lado dispusermos de um conjunto de valores ou fenómenos
𝑋1 , 𝑋1 , 𝑋1,…𝑋2 , 𝑋2 , 𝑋2 , … , 𝑋3 , 𝑋3 , 𝑋3 , … , 𝑋𝑛 , 𝑋𝑛 , 𝑋𝑛 , … , 𝑋𝑛
𝑓1 𝑣𝑒𝑧𝑒𝑠 𝑓2 𝑣𝑒𝑧𝑒𝑠 𝑓3 𝑣𝑒𝑧𝑒𝑠 𝑓𝑛 𝑣𝑒𝑧𝑒𝑠
O calculo da media aritmética será efectuado considerando-se os pesos
(número de vezes com que eles se repetem), que se denominam frequência 𝑓𝑖
Assim, quando as medidas 𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 tiverem respectivamente
frequências ou pesos 𝑓1 , 𝑓2 , 𝑓3 , … , 𝑓𝑛 a média aritmética será:

António Lulendo Samuel da Costa 37


ESTATÍSTICA DESCRITIVA

𝒇𝟏 .𝑿𝟏 +𝒇𝟐 .𝑿𝟐 +𝒇𝟑 .𝑿𝟑 +⋯+𝒇𝒏 .𝑿𝒏 ∑ 𝒇𝒊 𝑿𝒊


𝑿= →𝑿= ∑ 𝒇𝒊
𝒇𝟏 +𝒇𝟐 +𝒇𝟑 +⋯𝒇𝒏
Exemplo: Seja X = {5, 5, 5, 3, 3, 3, 2, 2, 1, 1, } → 𝑋 = {5(3); 3(3); 2(2); 1(2)} então:
∑ 𝒇𝒊 𝑿𝒊 5×3+3×3+2×2+1×2 30
𝑋= ∑ 𝒇𝒊
= = = 3,0
3+3+2+2 10
Geralmente, para o calculo da média aritmética ponderada utilizamos uma
tabela que facilita em muito a visualização dos valores (𝑋𝑖 ) e as respectivas (𝑓𝑖 )
deles.
Assim para o exemplo anterior, termos:Tabela 11-1 Tabela de distribuição de
frequência para dados ponderados não agrupados em classe
𝑋𝑖 𝑓𝑖 𝑋𝑖 𝑓𝑖
1 2 2
2 2 4
3 3 9
5 3 15
∑ 𝑓𝑖 =10 ∑ 𝑋𝑖 𝑓𝑖 =30

∑ 𝒇𝒊 𝑿𝒊 30
𝑿= ∑ 𝒇𝒊
= = 3,0
10

11.1.1.2 Media Aritmética para Dados Ponderados Agrupados em


Classe

É definido como sendo o “quociente entre a soma dos produtos das


frequências, pelos pontos médios de cada classe, e a soma de todas as
frequências”. Assim:
∑ 𝐟𝐢 𝐏𝐦𝐢
𝐗= ∑ 𝐟𝐢
Exemplo: Seja o quadro que representa as estaturas dos estudantes da
Faculdade de Engenharia na UAN em 1997 em Luanda.

Tabela 11-2 Tabela de distribuição de frequência das estaturas dos estudantes


da Faculdade de Engenharia
Estaturas (cm) Nº de alunos (𝑓𝑖 ) 𝑃𝑚𝑖 = 𝑋𝑖 𝑓𝑖 𝑃𝑚𝑖

António Lulendo Samuel da Costa 38


ESTATÍSTICA DESCRITIVA

150 Ⱶ 156 5 153 765


156 Ⱶ 162 4 159 636
162 Ⱶ 168 19 165 3.135
168 Ⱶ 174 18 171 3.078
174 Ⱶ 180 14 177 2.478

180 Ⱶ 186 12 183 2.196


186 Ⱶ 192 4 189 756

∑ 𝑓𝑖 = 76 ∑ 𝑓𝑖 𝑃𝑚𝑖 = 13.044

∑ 𝐟𝐢 𝐏𝐦𝐢 𝟏𝟑.𝟎𝟒𝟒
𝐗= ∑ 𝐟𝐢
= → X ≅ 171,63𝑐𝑚
𝟕𝟔
11.1.1.3 Média Geométrica (Mg) ou (Xg)

Denominamos média geométrica de um conjunto de “n” valores a raiz n-ésima


do produto desses “n” valores.

a) Media Geométrica simples


Seja X={𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 }, a média geométrica será definida pela expressão:
𝟏
𝑴𝒈 = 𝑵√𝑿𝟏 × 𝑿𝟐 × 𝑿𝟑 × … × 𝑿𝒏 ou 𝑿𝒈 = (𝑿𝟏 . 𝑿𝟐 … 𝑿𝒏 )𝒏
Exemplo: Seja Y={3, 5, 7, 9, }, então:
4 4
Mg= √335 × 7 × 9= √945 =5,54
b) Média Geométrica para valores ponderados ou agrupados em classe
Seja X={𝑋1 , 𝑋1 , 𝑋1 … 𝑋2 , 𝑋2 , 𝑋2 … 𝑋3 , 𝑋3 , 𝑋3 … 𝑋𝑛 , 𝑋𝑛 , 𝑋𝑛 , … 𝑋𝑛 } então a média
geométrica desses valores será definida por:
𝐟𝟏 +𝐟𝟐 +⋯𝐟𝐧
𝐌𝐠𝐩 = √(𝐗 𝟏 )𝐟𝟏 × (𝐗 𝟐 )𝐟𝟐 × (𝐗 𝟑 )𝐟𝟑 × … × (𝐗 𝐧 )𝐟𝐧 →
∑ 𝐟𝐢
𝐌𝐠𝐩 = √𝛑(𝐗 𝐧 )𝐟𝐧 ou
𝟏
𝒏𝟏 𝒏𝟐 𝒏𝒄 𝒏
𝑿𝒈 = (𝑿𝟏 × 𝑿𝟐 × … × 𝑿𝒏 )
Exemplo: X={2, 2, 2, 8, 8, 10}
Tabela 11-3
𝑋𝑖 𝑓𝑖 (𝑋𝑖 ) 𝑓𝑖
2 3 8
8 2 64
10 1 10

António Lulendo Samuel da Costa 39


ESTATÍSTICA DESCRITIVA

∑ 𝑓𝑖 =6 𝜋(𝑋𝑛 )𝑓𝑛 =5.120

6 6
𝑀𝑔𝑝 = √8 × 64 × 10 =√5120 = 4,15

11.1.1.4 Média Harmónica

É o inverso da média aritmética dos inversos dos valores

a) Média Harmónica simples


Seja X={𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 }. Então, a média harmónica é definida pela seguinte
expressão:
𝟏 𝒏 𝒏
𝑴𝒉 = 𝟏 𝟏 ou 𝑴𝒉 = 𝟏 ou ainda 𝑿𝒉 = 𝟏
×∑ ∑ ∑
𝒏 𝑿𝒊 𝑿𝒊 𝑿𝒊

Exemplo: 𝑋 = {2, 5, 7, 9}
𝑛 4 4 4×630
𝑀ℎ = 1 =1 1 1 1 = 601 = ≅ 4,193
∑ + + + 601
𝑋𝑖 2 5 7 9 630

b) Média Harmónica ponderada (valores isolados ou agrupados em


classe)
Seja X={𝑋1 , 𝑋1 , 𝑋1 … 𝑋2 , 𝑋2 , 𝑋2 … 𝑋3 , 𝑋3 , 𝑋3 … 𝑋𝑛 , 𝑋𝑛 , 𝑋𝑛 , … 𝑋𝑛 } com as suas
respectivas frequências 𝑓1 , 𝑓2 , 𝑓3 , … , 𝑓𝑛 . Assim a média harmónica será definida
pela seguinte expressão:
∑ 𝒇𝒊 ∑𝒏
𝑴𝒉𝒑 = 𝒇 ou 𝑿𝒉 = 𝒏
∑ 𝒊 ∑ 𝒊
𝑿𝒊 𝑿𝒊

Exemplo 1:
Tabela 11-4
𝑋𝑖 𝑓𝑖 𝑓𝑖
𝑋𝑖
2 3 1,5
3 6 2,0
5 15 3,0
𝑓
∑ 𝑓𝑖 = 24 ∑ 𝑖⁄𝑋 = 6,5
𝑖

António Lulendo Samuel da Costa 40


ESTATÍSTICA DESCRITIVA

∑ 𝒇𝒊 𝟐𝟒
𝑴𝒉𝒑 = 𝒇 = = 𝟑, 𝟔𝟗
∑ 𝒊 𝟔,𝟓
𝑿𝒊

Exemplo 2: De acordo com a tabela 11-2 relativa a estatura dos alunos , temos:
Tabela 11-5 Tabela de distribuição de frequência das estaturas dos estudantes
da Faculdade de Engenharia
Estaturas (cm) (𝑓𝑖 ) 𝑋𝑖 𝑓𝑖
𝑋𝑖
150 Ⱶ 156 5 153 0,032679
156 Ⱶ 162 4 159 0,025157
162 Ⱶ 168 19 165 0,115151
168 Ⱶ 174 18 171 0,105263
174 Ⱶ 180 14 177 0,079096

180 Ⱶ 186 12 183 0,065573

186 Ⱶ 192 4 189 0,021164

𝑓
∑ 𝑓𝑖 = 76 ∑ 𝑖⁄𝑋
𝑖
= 0,4444083

∑ 𝒇𝒊 𝟕𝟔
𝑴𝒉𝒑 = 𝒇 = = 𝟏𝟕𝟏, 𝟏𝟒𝒄𝒎
∑ 𝒊 𝟎,𝟒𝟒𝟒𝟎𝟖𝟑
𝑿𝒊

11.1.1.5 Média Quadrática

É a raiz quadrada da média aritmética do quadrado dos “n” valores

a) Média Quadrática Simples

Seja um conjunto de “n” valores X={𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 }, a média harmónica será


definida pela expressão:

𝐗 𝟏 𝟐 +𝐗 𝟐 𝟐 +𝐗 𝟑 𝟐 +⋯+𝐗 𝐧 𝟐 ∑ 𝐗𝐢 𝟏
𝟐
𝐌𝐪 = √ =√ ou 𝐗 𝐪 = √ ∑ 𝐗 𝐢
𝐧 𝐧 𝐧

Exemplo: Seja 𝑋 = {10, 15, 16, 18}


102 +152 +162 +182 100+225+256+324 905
𝑀𝑞 = √ =√ =√ =√226,25 → 𝑀𝑞 ≅ 15,04
4 4 4

b) Média Quadrática ponderada (valores isolados e ou agrupados em


classe)

António Lulendo Samuel da Costa 41


ESTATÍSTICA DESCRITIVA

Seja: X={𝑋1 , 𝑋1 , 𝑋1 … 𝑋2 , 𝑋2 , 𝑋2 … 𝑋3 , 𝑋3 , 𝑋3 … 𝑋𝑛 , 𝑋𝑛 , 𝑋𝑛 , … 𝑋𝑛 } com as suas


respectivas frequências 𝑓1 , 𝑓2 , 𝑓3 , … , 𝑓𝑛 , a média quadrática será dada pela
seguinte expressão:

𝑿𝟏 𝟐 𝒇𝟏 +𝑿𝟐 𝟐 𝒇𝟐 +𝑿𝟑 𝟐 𝒇𝟑 +⋯+𝑿𝒏 𝟐 𝒇𝒏 ∑ 𝑿𝒊 𝟐 𝒇𝒊


𝑴𝒒𝒑 = √ → 𝑴𝒒𝒑 = √ ∑ 𝒇𝒊
ou ainda 𝐗 𝐪𝐩 =
𝒇𝟏 +𝒇𝟐 +𝒇𝟑 +⋯+𝒇𝒏
𝟏
√ ∑ 𝐧𝐢 𝐱 𝐢 𝟐
𝐧

Exemplo1:
Tabela 11-6
𝑋𝑖 𝑓𝑖 𝑋𝑖 2 𝑋𝑖 2 𝑓𝑖
2 4 4 16
5 6 25 150
7 7 49 343
9 3 81 243
∑ 𝑓𝑖 =20 ∑ 𝑋𝑖 2 𝑓𝑖 =752

∑ 𝑿𝒊 𝟐 𝒇𝒊 𝟕𝟓𝟐
𝑴𝒒𝒑 = √ ∑ 𝒇𝒊
=√ = √𝟑𝟕, 𝟔 =6,132
𝟐𝟎

Exemplo2: De acordo com a tabela 11-2 relativa às estaturas dos estudantes


da Faculdade de Engenharia na UAN em 1997 em Luanda:
Tabela 11-7 Tabela de distribuição de frequência das estaturas dos estudantes
de faculdade de engenharia
Estat (cm) 𝑓𝑖 𝑋𝑖 𝑋𝑖 2 𝑿𝒊 𝟐 𝒇𝒊
150 Ⱶ 156 5 153 23.409 117.045
156 Ⱶ 162 4 159 25281 101.124
162 Ⱶ 168 19 165 27225 517.275
168 Ⱶ 174 18 171 29241 526.338
174 Ⱶ 180 14 177 31329 438.606

180 Ⱶ 186 12 183 33489 401.868

186 Ⱶ 192 4 189 35721 142.884

∑ 𝑓𝑖 = 76 ∑ 𝑋𝑖 2 𝑓𝑖 = 2.245140

António Lulendo Samuel da Costa 42


ESTATÍSTICA DESCRITIVA

∑ 𝑿𝒊 𝟐 𝒇𝒊 𝟐.𝟐𝟒𝟓.𝟏𝟒𝟎
𝑴𝒒𝒑 = √ ∑ 𝒇𝒊
=√ =√29.541=171,88cm
𝟕𝟔

11.1.2 Mediana

A mediana é um valor central de um rol, ou seja, a mediana de um conjunto de


valores ordenados (crescente ou decrescente) é a medida que divide este
conjunto em duas partes iguais, cujo valor esta sucedido 50% e antecedido
50% desse conjunto de observações.
a) Para dados simples isolados
Dado um conjunto de valores, o primeiro passo é ordenar estes valores. Isto
poderá ser feito tanto em ordem crescente quanto decrescente. E como
segundo passo, verificar se o número de elementos que compõe este conjunto
é par ou ímpar.
1) Se o número de elementos for ímpar
O elemento mediano será dado pela seguinte expressão:
𝒏+𝟏
𝑬𝒎 = Onde: 𝑬𝒎 = elemento mediano;
𝟐
n = número de elementos do conjunto.
Exemplo: 𝑋 = {2, 5, 7, 9, 13, 15, 15}
𝑛+ 7+1
𝐸𝑚 = = =4
2 2
As 7 observações deste conjunto estão em ordem crescente, o valor “4” é a
posição ocupada pelo elemento mediano, que em nosso exemplo corresponde
ao valor “9”. Este valor antecede três valores (2, 5, 7) e sucede de três valores
(13, 15, 22); logo:
𝑀𝑒 = 𝑋(4) = 9
2) Se o número de elementos for par
A mediana será dada pela média aritmética, expressa por:
𝒏 𝒏+𝟐
+
𝟐 𝟐
𝑬𝒎 =
𝟐
Exemplo: 𝑋 = {2, 5, 7, 9, 10, 16}
𝒏 𝒏+𝟐 𝟔 𝟔+𝟐
+ +
𝟐 𝟐 𝟐 𝟐
𝑬𝒎 = = = 3,5
𝟐 𝟐
O valor “3,5” Corresponde à posição do elemento mediano dentro do rol.
Portanto a mediana corresponde a média aritmética entre os valores centrais 7
e 9 ou seja:
𝑋3 +𝑋4 7+9
𝑀𝑒 = = =8
2 2
Exercícios: Considere os seguintes conjuntos de observações. Determine, em
cada caso a mediana.

António Lulendo Samuel da Costa 43


ESTATÍSTICA DESCRITIVA

a) {5, 5, 7, 15, 16, 17, 24}


b) {18, 7, 6, 1, −6, −30}

b)Para dados agrupados


b.1) Valores isolados ponderados (não agrupados em classe)
Quando estivemos trabalhando com dados tabulados, mas não agrupados em
classe, ou seja, quando aparecer repetições de valores, o cálculo da mediana
terá um procedimento análogo, lembrando com tudo, que agora temos as
frequências correspondentes a cada variável.
Desta feita, precisamos calcular as frequências absolutas, permitindo, com isto,
localizar o elemento que divide esta observação em duas partes iguais. Para
tal, é preciso verificar se o número de observações é ímpar ou par, para cada
caso aplicar os critérios anteriores.
Exemplo1:
Tabela 11-8
𝑋𝑖 𝑓𝑖 𝑓𝑎𝑐 ↓
2 2 2
4 5 7
⑤ 8 ⑮
7 6 21
8 4 25

∑ 𝑓𝑖 = 25

𝑛+1 25+1
𝐸𝑚 = = = 13
2 2

O elemento mediano ocupa, então, a 13ª posição do conjunto. Dispondo este


conjunto de valores (tabela 11-8) com suas respectivas frequências
isoladamente, temos:
𝑋 = {2, 2, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, ⑤, 5, 5, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, }
Portanto o 13º elemento deste rol corresponde ao valor “5”; logo:
𝑀𝑒 = 5

Exemplo2:
Tabela 11-9

António Lulendo Samuel da Costa 44


ESTATÍSTICA DESCRITIVA

𝑋𝑖 𝑓𝑖 𝑓𝑎𝑐 ↓
2 5 5
4 4 9
⑤ 6 ⑮
7 8 23
8 3 26
∑ 𝑓𝑖 =26

𝑛 𝑛+2 26 26+2
+ +
2 2 2 2
𝐸𝑚 = = → 𝐸𝑚 = 13,5
2 2
O elemento mediano ocupa, então, 13,5ª posição do conjunto. Dispondo este
conjunto de valores (tabela 11-9) com suas respectivas frequências
isoladamente, teremos:
𝑋 = {2, 2, 2, 2, 2, 4, 4, 4, 4, 5, 5, 5, 5│ 5, 5, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8}, assim:
𝑋13 +𝑋14 5+5
𝑀𝑒 = = =5
2 2
b.2) Dados ponderados agrupados em classe
O critério de interpretação é semelhante dos casos anteriores, ou seja,
devemos dividir esta distribuição em duas partes iguais. Para tal recorremos a
uma fórmula (já desenvolvida), o que nos permitirá encontrar o valor desejado.
A expressão a utilizar, será:

𝑬𝒎 −𝒇𝒂𝒄↓𝒂𝒏𝒕
𝑴𝒆 = 𝒍𝒊 + [ ]×𝒉
𝒇𝒊 𝒄𝒍𝒂𝒔𝒔𝒆

Onde: 𝑙𝑖 → 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎


𝑛 ∑ 𝑓𝑖
𝐸𝑚 → 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑚𝑒𝑑𝑖𝑎𝑛𝑜 ( 𝑜𝑢 )
2 2
𝑓𝑎𝑐 ↓ 𝑎𝑛𝑡 → frequência acumulada até a classe anterior à classe mediana.
𝑓𝑖 𝑐𝑙𝑎𝑠𝑠𝑒 → frequência simples ou absoluta da classe mediana
ℎ → amplitude do intervalo da classe mediana
Nota: Para o cálculo do 𝐸𝑚 distribuição de frequência com dados agrupados
em classe, não levamos em consideração se a soma das frequências é par ou
ímpar.
Exemplo: A tabela a seguir retrata o resultado final de uma prova de cálculo
financeiro, aplicada em 110 estudantes do ISPPU
Tabela 11-10

António Lulendo Samuel da Costa 45


ESTATÍSTICA DESCRITIVA

Nota Classes 𝑓𝑖 𝑓𝑎𝑐 ↓


1 Ⱶ 2 27 27
2 Ⱶ 4 16 43
4 Ⱶ 6 34 77
6 Ⱶ 8 17 94
8 Ⱶ 10 16 110
∑ 𝑓𝑖 =110

𝑬𝒎 −𝒇𝒂𝒄↓𝒂𝒏𝒕
𝑴𝒆 = 𝒍𝒊 + [ ]×𝒉
𝒇𝒊 𝒄𝒍𝒂𝒔𝒔𝒆
110
E𝑚 = = 55 (posição do elemento mediano)
2
Classe mediana: 4 Ⱶ 6
Em que 𝒍𝒊 =4; 𝑓𝑎𝑐 ↓ 𝑎𝑛𝑡 =43; 𝑓𝑖 𝑐𝑙𝑎𝑠𝑠𝑒 = 34 e h = 2; logo
55−43
Me = 4 + [ ] × 2 = 4 + 0,7 → Me = 4,7
34
Exercícios: Considere novamente os casos
a) Do estudo do tamanho dos 50 agregados familiares, tabela 9-4 e
b) Da distribuição de frequências de 25 fazendas infectadas, tabela 9-5.

11.1.3 Moda, Norma ou Modo (𝑴𝒐 )

A moda é o valor mais comum ou dominante de um conjunto de observações,


ainda é definida como sendo aquele valor ou valores que ocorrem com maior
frequência em um rol.

Baseando-se neste contexto, um conjunto de valores pode apresentar mais de


uma moda. Neste caso, dizemos plurimodal, multimodal (bimodal, no caso
da observação tiver mais de uma frequência), caso contrario será uni modal
(se a distribuição tiver uma única frequência), ou ainda amoldal (quando todos
os valores das variáveis em estudo apresentarem uma mesma frequência).

a) Para dados simples


Para identificação da moda em um conjunto ordenado de valores simples,
basta verificar no conjunto, aquele valor que aparece com maior frequência.
Exemplo:
𝑋1 = {1, 2, 3, 4, 5, 6} (conjunto amodal)

António Lulendo Samuel da Costa 46


ESTATÍSTICA DESCRITIVA

𝑋2 = {10, 10, 12, 13, 18} 𝑀𝑜 = 10 (conjunto unimodal)


𝑋3 = {100, 100, 200, 200, 300, 600} 𝑀𝑜 = 100 𝑒 𝑀𝑜 = 200 (conjunto bimodal)
b) Para dados ponderados
b.1) Valores isolados não agrupados em classe
Quando os dados estiverem dispostos em uma tabela de frequência não
agrupados em classe, a localização da moda é imediata, bastando, para isso,
verificar na tabela o valor predominante.
Exemplo:
Tabela 11-11
Estatura (m) 𝑋𝑖 Nº de alunos 𝑓𝑖
1,60 3
1,62 8
1,64 12
1,70 20
1,73 10
1,80 7

∑ 𝑓𝑖 = 60

Nesta tabela, o valor modal é 1,70m, isto porque é o resultado que apresenta o
maior número de alunos (20)
b.2) Valores ou dados agrupados em classe
Tratando-se de dados agrupados em classe, a moda não é percebida tão
facilmente como nos casos anteriores. Para tal utilizamos diversos processos
na sua obtenção. Mas qualquer que seja o processo adoptado, o primeiro
passo é identificar a classe que contém a maior frequência. A esta classe
denomina-se Classe-Modal.
1º- Processo de Szuber
O processo utilizado por Szuber leva em consideração as frequências anterior
e posterior a Classe Modal. O ponto correspondente à moda divide o intervalo
em partes proporcionais às diferenças da frequenia da classe modal com as
frequências anterior e posterior, respectivamente.
Assim, Para o cálculo da moda pelo processo de Szuber, é necessário que
identifiquemos os seguintes elementos:
Moc =Moda (Processo de Szuber)
∆1 = 𝑓𝑚á𝑥 − 𝑓𝑎𝑛𝑡 (frequência absoluta simples máxima – frequência absoluta
simples anterior)
∆2 = 𝑓𝑚á𝑥 − 𝑓𝑝𝑜𝑠𝑡 (frequência absoluta simples máxima - frequência absoluta
simples posterior)

António Lulendo Samuel da Costa 47


ESTATÍSTICA DESCRITIVA

H = amplitude do intervalo da classe


𝑙𝑖 = Limite inferior a classe modal (classe que contem a frequência absoluta
simples máxima)
∆1
Assim: Moc=𝑙𝑖 + [ ]×ℎ
∆1 +∆2
Ou

𝑓𝑚á𝑥 −𝑓𝑎𝑛𝑡
Moc=𝑙𝑖 + [ ]×ℎ
2𝑓𝑚á𝑥 −(𝑓𝑎𝑛𝑡 +𝑓𝑝𝑜𝑠𝑡 )

Exemplo: Calcular a Moda pelo processo de Szuber usando os dados da tabela


11.10
∆1 = 34 − 16 = 18
∆2 = 34 − 17 = 17
𝑙𝑖 = 4; ℎ=2 logo
18 36
Moc=4+[ ] × 2 =4+[ ] = 5,03
18+17 35
Ou
34−16 18
Moc=4+[ ]×2=4+[ ] × 2 = 5,03
2×34−(16+17) 68−33

António Lulendo Samuel da Costa 48

Vous aimerez peut-être aussi