Vous êtes sur la page 1sur 29

Unidade II

Unidade II
3 TABELAS DE FREQUNCIA E SEUS GRFICOS

Nesta seo comeamos a anlise dos dados por meio da construo de tabelas de frequncia. As tabelas de dados brutos, embora tragam todas as caractersticas do conjunto, no permitem que tenhamos um entendimento dele, pois os dados assim dispersos somente nos permitem formar uma imagem fragmentada. Tomando a tabela do exemplo da Unidade I, com apenas 12 clientes, verica-se um amontoado de fatos sem signicado, imagine em pesquisas reais, em que podemos ter at mesmo milhes de pessoas entrevistadas, como o caso do censo. Assim sendo, para que os dados possam se converter em informao preciso analis-los. Como saber que espcie de informao uma tabela de dados brutos esconde? A resposta at mesmo intuitiva: contando quantas vezes cada valor aparece. De maneira formal, dizemos que a primeira anlise a ser feita a construo das tabelas de frequncia para cada uma das variveis, as quais agrupam os dados com valores iguais ou similares em uma mesma classe e nos do as frequncias com que cada valor ou intervalo de valores aparece no conjunto estudado. O procedimento para a construo de uma tabela de frequncias simples: tomam-se os valores possveis da varivel e contam-se quantas vezes cada um aparece. Tambm comum calcular a frequncia relativa, ou seja, qual o percentual relativo a cada valor.
3.1 Construo das tabelas

Para melhor compreenso, vamos construir tabelas de frequncia e de frequncia relativa para os dados do exemplo a respeito de vendas de suco. 3.1.1 Varivel sabor Os valores possveis para essa varivel so: caju, maracuj e uva. usual chamar os valores das variveis de x. Utilizando essa notao, teremos: x1 = caju, x2 = maracuj, x3 = uva. Pelo fato de a varivel ser nominal, no h ordem especca a ser seguida pelos valores, mas usual nesses casos, para facilitar sua localizao, ordenar os valores alfabeticamente. Dos diversos clientes, dois compraram suco de caju, seis compraram de maracuj e quatro o de uva. Chamando as frequncias de f, teremos: f1 = 2, f2 = 6, f3 = 4. As frequncias relativas sero os valores percentuais de cada sabor. Ou seja: f1=100 * 2/12, f2 = 100 * 6/12, f3 = 100 * 4/12. Fazendo as contas e apresentando os resultados com aproximao a partir da primeira casa decimal: f1 = 16,7%, f2 = 50,0%, f3 = 33,3%. 26

ESTATSTICA
Alm dos dados anteriores, comum que tenhamos uma linha adicional com a quantidade total de dados. Colocamos, ento, essas informaes na tabela 2, como segue:
xi caju maracuj uva Total 2 6 4 12 (%) 16,7 50 33,3 100

Tabela 2 Frequncias e frequncias relativas para a varivel sabor.

Comparando a tabela acima com os valores dados na tabela de dados brutos, notamos que essa nova organizao nos mostra de maneira muito mais rpida e direta o grau de preferncia dos clientes com relao ao sabor. 3.1.2 Varivel tamanho Fazendo a mesma coisa para a segunda varivel, teremos a tabela 3. Assim como para o caso da varivel sabor, tambm aqui a distribuio de preferncias dos clientes ca muito mais visvel que na tabela de dados brutos. Atente agora para o seguinte detalhe: como a varivel ordinal, a tabela deve seguir a ordem natural dos valores, ou seja, ordeno os valores do menor para o maior, assim: x1 = pequeno, x2 = mdio, x3 = grande.
xi Pequeno Mdio Grande Total 3 5 4 12 (%) 25 41,67 33,33 100

Tabela 3 Frequncias e frequncias relativas para a varivel tamanho.

3.1.3 Varivel preo Empregamos o mesmo procedimento para a varivel preo. Utilizamos os valores existentes para os preos, pois, como a varivel contnua, no possvel determinar antes os valores possveis, pois eles so inmeros. Assim procedendo, teremos construda a tabela 4. Note que no inclumos as frequncias relativas por uma questo de conciso. 27

Unidade II
xi 1,20 1,35 1,50 1,75 2,00 4,80 4,95 5,00 5,30 Total 1 1 2 3 1 1 1 1 1 12

Tabela 4 Frequncias sem perda de informao para a varivel preo.

A tabela feita dessa maneira dita sem perda de informaes, pois cada valor individual est ali representado. No entanto, se olharmos para os dados que h nela, nesse caso constataremos que no h a o mesmo ganho de clareza que nos casos anteriores, pois h muitos valores possveis para a varivel. Isso faz com que haja uma grande disperso dos dados entre todos esses valores. Essa caracterstica nos faz buscar uma nova maneira de construir essa tabela. O procedimento apropriado em casos como esse utilizar intervalos de valores em lugar de valores individuais. Como os valores das variveis oscilam variam entre 1,20 e 5,30, por exemplo, escolho utilizar intervalos que agrupem de 1 em 1 real. Perceba a necessidade de denir o intervalo de maneira que no haja dvidas quanto colocao de certo dado, razo pela qual o nal de cada intervalo refere-se a 99 centavos. Com isso, temos uma nova distribuio de frequncias, conforme dados da tabela 5.
Preo 1,00 1,99 2,00 2,99 3,00 3,99 4,00 4,99 5,00 5,99 Total Frequncia 7 1 0 2 2 12

Tabela 5 Frequncias para a varivel preo, com agrupamento por intervalos.

Olhando para a nova tabela, percebe-se mais claramente haver uma concentrao maior de compras dos artigos mais baratos, o que no cava claro na construo anterior. 3.1.4 Varivel vendas Utilizamos nalmente um procedimento similar para a varivel vendas, sem perdas de informao. Como a varivel discreta, podemos admitir que os valores xi sero os nmeros inteiros entre 1 e 12, que englobam todos os dados coletados. Desse modo construmos a tabela 6. 28

ESTATSTICA
xi 1 2 3 4 5 6 7 8 9 10 11 12 Total 4 0 1 2 0 1 0 2 1 0 0 1 12

Tabela 6 Frequncias sem perda de informao para a varivel vendas.

Novamente, a tabela traz dados muito dispersos pelos valores, no permitindo uma compreenso muito melhor do que a tabela de dados brutos. De novo, buscamos a construo de intervalos de valores em lugar de valores individuais. Note-se que a construo de intervalos requer uma escolha, e diferentes escolhas podem gerar diferentes leituras. Para exemplicar, foram construdas duas tabelas com escolhas diferentes de intervalos: tabelas 7 e 8.
xi 15 6 10 11 15 Total 7 4 1 12

Tabela 7 Frequncias para a varivel vendas, com agrupamento por intervalos de tamanho 5. xi 14 58 9 12 Total 7 3 2 12

Tabela 8 Frequncias para a varivel vendas, com agrupamento por intervalos de tamanho 3.

Para evitar que as diferenas geradas pela escolha dos intervalos possa levar a concluses errneas, h critrios de escolha, mas a discusso desses critrios vai alm do escopo e dos objetivos desta disciplina. Neste momento, basta saber que em estudos reais tomam-se os cuidados necessrios para evitar esse problema, muitas vezes, inclusive, utilizando-se de intervalos de tamanhos diferentes, quando preciso. 29

Unidade II
3.2 Grcos de tabelas de frequncia

A apresentao de dados estatsticos utiliza-se no somente de tabelas, mas tambm de grcos. O objetivo de uma apresentao grca tornar as caractersticas importantes visveis em um tempo bastante curto. Essa caracterstica dos grcos que torna sua utilizao to frequente na apresentao de conjuntos de valores, principalmente quando se discutem aspectos tcnicos, por exemplo, nos cadernos de economia dos jornais. Neste momento, vamos nos ater construo de grcos de colunas e diagramas circulares, pois eles so os mais comumente utilizados para representar frequncias. Um mesmo conjunto de dados pode ser apresentado em diferentes tipos de grcos. Novamente, utilizaremos o exemplo de dados a respeito da venda de sucos e discutiremos a construo de grcos a partir de sua elaborao para as tabelas de frequncia construdas na seo anterior. Aps a construo dos grcos, discutiremos brevemente a convenincia da utilizao de cada um para cada situao.

Observao A escolha apropriada do tipo de grco depender das caractersticas do conjunto que se queira enfatizar. 3.2.1 Grcos de colunas Os grcos de colunas so construdos tendo como eixo horizontal os valores da varivel e na vertical a frequncia. Assim sendo, as colunas sero tanto mais altas quanto maior a frequncia daquele valor. Para a grandeza sabor, apresentada no grco 1, como no h ordenamento natural dos valores, podemos escolher a ordem que nos parea mais adequada. Por coerncia, utiliza-se a mesma ordem j denida na construo da tabela 2.
7 6 5 4 3 2 1 0 caju maracuj uva

Grco 1 Colunas para as frequncias referentes varivel sabor.

30

ESTATSTICA
Seguindo as definies de significado dadas anteriormente, vemos que para os valores caju, maracuj e uva temos colunas de altura 2, 6 e 4, respectivamente, o que corresponde ao nmero de clientes entrevistados que compraram sucos de cada um desses sabores. No caso da varivel tamanho, temos como eixo horizontal os valores pequeno, mdio e grande. Como a grandeza ordinal, o eixo deve seguir o valor crescente de tamanho, definindo a ordem de aparecimento das colunas referentes a cada valor, conforme apresentamos no grfico 2.
6 5 4 3 2 1 0 pequeno mdio grande

Grco 2 - Colunas para as frequncias referentes varivel tamanho.

Para a varivel preo, utilizamos como referncia de cada categoria o centro do intervalo correspondente. Como os valores so contnuos, as colunas foram construdas sem espaamento, de modo a deixar claro o fato de que um elemento que pertena a uma coluna ter valor no intervalo correspondente. Por exemplo, o elemento contado como fazendo parte da coluna 2,5 ter valor entre 1 e 2. Observe como essas informaes so apresentadas no grco 3 a seguir.
8 7 6 5 4 3 2 1 0 1,50 2,50 3,50 4,50 5,50

Grco 3 - Colunas para as frequncias referentes varivel preo.

Por m, trazemos o grco da varivel vendas, para o qual escolhemos a distribuio de intervalos de tamanho 3. Desta vez, optamos por utilizar diretamente o intervalo como rtulo dos dados. Esses valores de frequncia esto apresentados no grco 4. 31

Unidade II
8 7 6 5 4 3 2 1 0 1-4 5-8 9 - 12

Grco 4 - Colunas para as frequncias referentes varivel vendas.

3.2.2 Diagramas circulares Os diagramas circulares so construdos de tal modo que, quanto maior a proporo de uma categoria no conjunto, maior ser a rea do crculo que se refere a ela, sendo que a categoria pode referir-se a um valor ou a um intervalo de valores. Devido aos cortes radiais que denem fatias da circunferncia, esses grcos tambm so conhecidos por grcos de pizza. Por sua natureza, so bastante utilizados nos casos em que mostrar a quantidade especca de cada categoria no importante, mas sim mostrar clara e rapidamente as propores de cada uma. Como exemplo, utilizaremos as mesmas tabelas de frequncia para as quais zemos os grcos de coluna. Para a varivel sabor, temos que o valor maracuj que responde por metade das vendas, logo, ele ser representado por uma fatia correspondente, ou seja, pela metade do crculo; em outras palavras, por uma seo circular de 180, visto que o crculo todo tem 360. O restante ser dividido na proporo de 4 para 2 entre os sabores uva e caju; desse modo, o primeiro ter uma fatia de 120 e o segundo uma de 60, conforme representado no grco 5.

caju maracuj uva

Grco 5 Diagrama circular para a varivel sabor, de acordo com os dados da tabela 2.

32

ESTATSTICA
De maneira equivalente foram construdos os grcos para as variveis tamanho, preo e vendas, os quais esto apresentados nos grcos 6, 7 e 8, respectivamente.

pequeno mdio grande

Grco 6 Diagrama circular para a varivel tamanho, de acordo com os dados da tabela 3.

1,00 - 1,99 2,00 - 2,99 3,00 - 3,99 4,00 - 4,99 5,00 - 5,99

Grco 7 Diagrama circular para a varivel preo, de acordo com os dados da tabela 5.

1-4 5-8 9 - 12

Grco 8 Diagrama circular para a varivel vendas, de acordo com os dados da tabela 6.

33

Unidade II
3.2.3 Escolha do tipo de grco Como dissemos no incio desta seo, o papel de um grco trazer alguma informao de maneira clara e direta, logo, o critrio para se escolher um grco ou outro quando vamos apresentar dados depende de qual o objetivo dessa gura em nossa argumentao. Ou seja, se quisermos enfatizar os valores especcos de cada frequncia para cada varivel, o grco mais apropriado ser o de colunas; no entanto, se for interessante enfatizar a proporo de cada um, devemos utilizar o diagrama circular. Tomemos como exemplo o caso da varivel sabor. No grco 1, a caracterstica mais marcante o fato de maracuj ser o valor mais frequente, mas no ca claro que isso diz respeito metade dos clientes. No grco 5, no entanto, a informao de que um dos sabores responde por metade das vendas salta aos olhos em poucos instantes. Logo, se o objetivo for ressaltar a preferncia por maracuj, melhor usar o diagrama circular, mas se a inteno fazer uma discusso que englobe os trs sabores, pode ser mais interessante utilizar o grco de colunas. Do mesmo modo, se tomamos como exemplo a varivel preo, vemos que o diagrama circular nos d, de maneira imediata, a caracterstica de o artigo mais barato ter um nmero muito maior de vendas. Entretanto, como o diagrama circular no enfatiza a ordem, no se percebe que h uma segunda concentrao das vendas na faixa de maior preo, o que se v facilmente no grco de colunas. Logo, o diagrama circular ser adequado numa discusso em que a informao de qual a faixa de preos mais procurada for mais interessante, mas, se for importante conhecer o comportamento para todas as faixas, ele no apresenta bem os dados. 3.2.4 Comentrios adicionais Apresentamos aqui somente dois tipos de grficos, por consider-los os mais significativos para as discusses de interesse da disciplina. No entanto, existem diversos outros tipos, mas a lgica de construo que os rege geralmente derivada da mesma lgica de construo dos tipos vistos aqui. Portanto, no deve haver dificuldade na compreenso ou na construo de algum outro formato. Note ainda que atualmente raro que tenhamos que construir grcos manualmente, visto que todas as planilhas de dados j possuem ferramentas de elaborao dos grcos em diversos formatos, e ainda h programas especcos de excelente qualidade desenvolvidos para esse m.
4 MEDIDAS DE POSIO

No primeiro passo de transformar dados em informao, construmos as tabelas de frequncia. Mas, para irmos adiante em nossas anlises, preciso encontrar maneiras de encontrar caractersticas que se apresentem de forma ainda mais resumida. Nesta seo apresentaremos trs grandezas que resumem caractersticas de um conjunto em apenas um valor: a moda, a mediana e a mdia. 34

ESTATSTICA
4.1 Moda

A palavra moda utilizada por ns cotidianamente com um signicado parecido com a denio em estatstica. No dia a dia, dizemos que algo est na moda se muita gente o est usando ou o est fazendo. Em estatstica, moda o valor que mais aparece no conjunto, aquele que a caracterstica da maioria. Quando h um valor que se sobressai em frequncia, com relao aos demais valores, dizemos que o conjunto tem uma moda, modal. Tomemos como exemplo os dados da tabela 9. Eles dizem a respeito s vendas mensais de impressoras e multifuncionais em uma loja.
Tipo Impressora jato de tinta Impressora laser monocromtica Impressora laser colorida Multifuncional jato de tinta Multifuncional laser monocromtica Multifuncional laser colorida Total Quantidade 112 263 185 488 124 93 1.265

Tabela 9 Quantidade de impressoras e multifuncionais vendida na loja A.

Vemos que o artigo que mais aparece a multifuncional jato de tinta, com 488 unidades. Um erro comum atribuir moda a frequncia do valor, mas ressalto que a moda ser o valor da varivel e no a quantidade de vezes que o mesmo aparece. Ou seja, a moda desse conjunto ser, portanto, multifuncional jato de tinta. H situaes em que o conjunto tem dois valores mais frequentes em lugar de um. Nesses casos, dizemos que o conjunto tem duas modas. Um conjunto com essa caracterstica tambm chamado de bimodal. Tomando o mesmo tipo de dados que no exemplo anterior, temos na tabela 10 um caso em que o conjunto bimodal.
Tipo Impressora jato de tinta Impressora laser monocromtica Impressora laser colorida Multifuncional jato de tinta Multifuncional laser monocromtica Multifuncional laser colorida Total Quantidade 102 485 183 488 85 92 1.435

Tabela 10 Quantidade de impressoras e multifuncionais vendida na loja A.

35

Unidade II
Nessa ocorrncia, muito embora os valores de vendas no sejam rigorosamente iguais, notase haver dois produtos que so muito mais procurados que os demais, portanto, dizemos que o conjunto bimodal, tendo como modas impressora laser monocromtica e multifuncional jato de tinta. Existe ainda a possibilidade de no haver nenhum valor que realmente se sobressaia com relao aos demais. Quando isso acontece, dizemos que o sistema no tem moda ou, mais formalmente, que o conjunto amodal. Utilizando novamente o tema dos exemplos anteriores, mostramos na tabela 11 um caso em que o conjunto amodal, no havendo nenhum valor que realmente se destaque dos demais em nmero de vezes que aparece.
Tipo Impressora jato de tinta Impressora laser monocromtica Impressora laser colorida Multifuncional jato de tinta Multifuncional laser monocromtica Multifuncional laser colorida Total Quantidade 98 115 121 118 95 72 619

Tabela 11 Quantidade de impressoras e multifuncionais vendida na loja A.

A moda uma grandeza de fcil determinao e de grande utilidade quando interessante vericar se o conjunto tem alguma caracterstica marcante, um valor que seja muito comum. No entanto, essa a nica informao que a grandeza moda pode nos dar. Ela no traz qualquer informao a respeito dos demais valores do conjunto, logo, importante que denamos outras grandezas para podermos aprofundar nossas anlises.
4.2 Mediana

A segunda grandeza que utilizaremos como um resumo do conjunto a mediana, que denimos como sendo o valor que corresponde ao ponto central do conjunto. Ou seja, a mediana o valor que divide o conjunto em duas metades, isto , haver um mesmo nmero de valores inferiores e superiores ao valor da mediana. Tomemos como exemplo um conjunto de pessoas cujas idades esto colocadas na tabela 12.
Nome Ana Bruno Denise Idade 3 32 19

36

ESTATSTICA
Gabriel Jos Maria Pedro 56 12 16 11

Tabela 12 Idades dos integrantes de uma famlia.

A mediana ser a idade que divide o conjunto em dois, ou seja, a idade acima e abaixo da qual haver o mesmo nmero de pessoas. Metaforicamente, podemos imaginar que colocamos essas pessoas em la, da mais nova mais velha. Como temos um nmero mpar de elementos no conjunto, a mediana ser a idade da pessoa que cou no meio da la. Como h 7 elementos no conjunto, a pessoa do meio da la ser a quarta mais velha. Colocando as idades em ordem, temos: 3, 11, 12, 16, 19, 32 e 56. Nesse caso, a mediana 16. Suponhamos, agora, que uma pessoa de 5 anos seja adicionada ao conjunto. Com isso, a sequncia crescente de idades passa a ser 3, 5, 11, 12, 16, 19, 32 e 56. A diviso em dois subconjuntos faria com que o primeiro tivesse as quatro pessoas mais novas e o segundo, as quatro mais velhas. Define-se como mediana, nesse caso, o valor intermedirio entre o maior do primeiro conjunto e o menor do segundo. Para o exemplo teramos as idades de 12 e 16. A mediana seria o valor equidistante de 12 e 16, que 14. Note que a mediana no inuenciada pelos valores no centrais do conjunto. Por exemplo, se Gabriel tivesse 40 anos em lugar de 56, no haveria qualquer mudana no valor da mediana. Vale ainda comentar que essa grandeza s pode ser denida para grandezas quantitativas ou para qualitativas ordinais, visto que no h possibilidade de haver ordenao das variveis qualitativas nominais.

Observao comum o aluno confundir os conceitos de mdia e mediana. Assim, antes de passar ao prximo tpico, tenha certeza de ter assimilado bem o conceito de mediana.
4.3 Mdia

As medidas de posio dadas anteriormente podem traduzir algumas caractersticas interessantes dos conjuntos estudados, mas no permitem um estudo analtico mais profundo. Para que isso seja feito, preciso denir uma terceira medida de posio do conjunto que a mdia. Assim como outros conceitos, tambm o de mdia faz parte de nossa linguagem cotidiana, pois costumamos realizar com bastante frequncia clculos de mdias, ainda que de maneira informal e intuitiva. Por exemplo, quando samos para trabalhar, sabemos aproximadamente quanto tempo
37

Unidade II
demoraremos no trajeto, e assim tambm sabemos quais so, em mdia, os nossos gastos com determinados itens comumente comprados etc. Imagine a seguinte situao: um grupo de amigos organiza um jantar e cada um ca responsvel por realizar parte das compras. Ao nal, cada um deles comunica o valor gasto e eles dividem igualmente as despesas. O valor da contribuio de cada um para a festa justamente a mdia de gastos do grupo. Visto o conceito, passaremos agora a formalizar a maneira de realizar os clculos de mdias e aprofundaremos o conceito discutindo as mdias ponderadas. Em seguida, comentaremos algumas utilizaes de interesse na rea econmica.

Observao As mdias so as grandezas mais comumente utilizadas nas anlises estatsticas. 4.3.1 Mdia aritmtica A chamada mdia aritmtica, ou mdia ou mdia simples, a mais utilizada no cotidiano e estabelece que todos os elementos tm a mesma importncia. Se detalharmos o exemplo citado anteriormente, na tabela 13 teremos listados os gastos individuais. Para saber o valor do gasto efetivo de cada um, temos que somar todos os gastos individuais e dividi-los pelo nmero de pessoas.
Pessoa Alberto Beatriz Carlos Diana Edgar Gasto 25 31 47 19 28

Tabela 13 Gastos efetuados para a realizao do jantar por participante do grupo de amigos.

Nesse caso, teremos: Gasto mdio = 25 + 31+ 47 +19 + 28 = 30 5

Dessa maneira, determinamos que a mdia de gastos foi de R$ 30,00, ou seja, esse o valor correspondente aos gastos de cada um. interessante observar que o valor da mdia no precisa ser um valor encontrado no conjunto.
38

ESTATSTICA
Utilizando o exemplo como guia, vamos agora formalizar o clculo da mdia aritmtica. Em primeiro lugar, utilizaremos a letra N para denotar a quantidade de pessoas, x para indicar a varivel gasto e o ndice i para indicar cada gasto individual. Ou seja, teremos que N = 5, ou seja, o gasto efetuado por Beatriz poderia ser escrito como x2 = 31. Para indicar que estamos falando da mdia, utilizaremos uma barra superior. Com isso, a expresso anterior pode ser reescrita de maneira mais geral como: x= x1 + x2 + x 3 + x 4 + x5 N

Mas, essa notao no ser prtica se tivermos um grande nmero de elementos, assim, utilizamos um indicador de que temos que somar todos os valores de xi. A isso chamamos somatrio de x, ou seja, soma de todos os valores de x. Para indicar tal operao, convencionou-se utilizar a letra grega sigma maiscula, como segue: x=

xi
N

Note que utilizamos aqui a notao mais concisa. Em muitos textos, utiliza-se na expresso a indicao explcita da soma de todos os valores de x entre 1 e N. A notao explcita absolutamente necessria em casos em que pode haver valores no considerados, mas, como no contexto desta disciplina sempre utilizaremos somatrios com todos os elementos, tornou-se mais conveniente usar a notao resumida em lugar da mais explicativa. Passamos agora a discutir o clculo da mdia quando os dados esto apresentados em uma tabela de frequncia. Para isso, comearemos calculando a mdia da mesma maneira utilizada anteriormente, mas agora para uma situao ligeiramente diferente. Suponhamos agora que haja uma mesa com 10 pessoas em uma lanchonete, as quais combinaram dividir igualmente a despesa nal. Os dados a respeito do consumo de cada um dos ocupantes esto apresentados na tabela 14.
Pessoa 1 2 3 4 5 6 7 8 9 10 Gasto 12 15 15 18 13 12 13 15 12 15

Tabela 14 Gastos efetuados por ocupante da mesa da lanchonete.

No difcil perceber que montar a conta da maneira utilizada anteriormente pouco prtico. Assim, vamos inicialmente montar a tabela de frequncias, o que se apresenta na tabela 39

Unidade II
15. Temos aqui como valores xi os gastos individuais e como fi o nmero de pessoas que gastou esse valor.
xi 12 13 15 18 3 2 4 1

Tabela 15 Frequncia para os gastos efetuados por ocupante da mesa da lanchonete.

Para calcular a mdia precisamos, em primeiro lugar, do nmero de pessoas, que o somatrio das frequncias, como segue: N = fi O segundo valor a ser determinado o valor total da conta, o qual calculado considerando o seguinte: 3 pessoas gastaram 12, logo, somam-se 36 conta. 2 pessoas gastaram 13, logo, somam-se 26 conta. 4 pessoas gastaram 15, logo, somam-se 60 conta. 1 pessoa gastou 18, logo, somam-se 18 conta. Formalmente, podemos escrever de maneira geral que se efetua o somatrio do produto do valor da varivel pela sua frequncia. O resultado ser ento dividido pelo nmero de dados N, que o somatrio das frequncias. O clculo da mdia dado, portanto, pela expresso: x=

fi .xi fi

No exemplo, como a soma das frequncias nos d o total de pessoas na mesa, que so 10, temos uma conta de R$ 140,00 a ser dividida por 10 pessoas. A mdia, portanto, ser de R$ 14,00. Na tabela 16 apresentada uma forma prtica de se efetuar a conta. Acrescentamos uma coluna tabela, na qual, para cada valor de x se coloca o resultado do produto xi * fi. Coloca-se tambm uma linha adicional ao nal da tabela, na qual se apresentam os resultados dos somatrios que sero utilizados no clculo da mdia.

Observao Note que estamos calculando exatamente a mesma coisa e que utilizar as frequncias explicitamente apenas muda a maneira de fazer as contas.
40

ESTATSTICA
xi 12 13 15 18 Soma 3 2 4 1 10 xi* 36 26 60 18 140

Tabela 16 Quadro esquemtico para clculo de mdias a partir de tabela de frequncias.

Dessa maneira, o clculo da mdia feito dividindo-se o valor da soma da terceira coluna, R$ 140,00, pela soma da segunda coluna, 10 pessoas. Como vimos anteriormente, a mdia ser de R$ 14,00. Daremos agora um exemplo genrico, em que os dados de frequncias sero apresentados diretamente na tabela. Veja a seguir:
xi 5 6 7 8 5 8 9 3

Tabela 17 Frequncias para os valores de uma varivel x genrica.

Seguindo o procedimento descrito anteriormente, acrescentaremos a coluna com os produtos xi * fi, de modo a obter a soma de todos os valores de x do conjunto (no exemplo, era o total da conta). Uma linha adicional ser utilizada para colocar o resultado dos somatrios de cada coluna, deixando claros os valores da soma anteriormente descrita e o nmero total de dados N (no exemplo, o nmero de pessoas na mesa). Por m, acrescentamos ainda uma ltima linha, que trar o resultado nal, consequncia da diviso do somatrio da terceira coluna pelo somatrio da segunda coluna. O procedimento aqui descrito est colocado na tabela 18. Vemos a que a situao equivale a termos um gasto de R$ 160,00 dividido igualmente por 25 pessoas, obtendo a mdia de 6,4.
xi 5 6 7 8 Soma Mdia 5 8 9 3 25 6,4 xi* 25 48 63 24 160

Tabela 18 Clculo do valor mdio de um conjunto de dados para uma varivel x genrica a partir de sua tabela de frequncias.

41

Unidade II
4.3.2 Clculo da mdia para dados apresentados em intervalos Quando a tabela de frequncias traz classes de dados em intervalos em lugar de valores individuais, assumimos que o valor que melhor representa a classe o valor referente ao meio do intervalo. Tomando como exemplo os intervalos da tabela 7, os intervalos teriam por valores representativos: O intervalo 1-5 tem como valor representativo x1 = 3. O intervalo 6-10 tem como valor representativo x2 = 8. O intervalo 11-15 tem como valor representativo x3 = 13. Para efeito de clculo, remontamos a tabela tendo em lugar dos intervalos os valores centrais e calculamos a mdia da mesma maneira j descrita anteriormente, conforme apresentamos na tabela 19.
Intervalo 1-5 6-10 11-15 xi 3 8 13 Soma Mdia 7 4 1 12 5,5 xi* 21 32 13 66

Tabela 19 Clculo do valor mdio de um conjunto de dados a partir da tabela de frequncias dada por intervalos de valores.

Como os valores tratados dessa maneira no consideram exatamente o valor de cada um dos dados, a mdia ser um valor aproximado. Portanto, quando houver acesso aos dados brutos e tambm necessidade de um clculo preciso, prefervel utilizar os dados brutos para efetuar o clculo da mdia. 4.3.3 Mdia ponderada At aqui tratamos todos os dados como tendo a mesma importncia para o clculo da mdia. No entanto, sabemos que na realidade h gradaes de importncia que fazem com que esse clculo de mdia simples no seja uma descrio apropriada da realidade. Pensemos no seguinte exemplo cotidiano: para avaliar o desempenho de um aluno, usual que se utilize mais de um instrumento de apreciao. Digamos que um professor aplique duas avaliaes no bimestre: a primeira seria um trabalho em grupo a respeito de algum tpico desenvolvido em aula e a segunda uma prova a respeito de todo o contedo. Nesse caso, o segundo instrumento de avaliao traz mais informaes a respeito do desempenho de cada aluno que o trabalho, e necessrio que essa diferena de importncia esteja refletida na nota final, o que se faz estabelecendo pesos para cada nota. 42

ESTATSTICA
O clculo de uma mdia ponderada se faz de maneira similar ao clculo em que so utilizadas tabelas de frequncia. Tomando o exemplo das notas, digamos que o professor assuma que a prova quatro vezes mais importante que o trabalho; ele ento atribuir peso 1 ao trabalho e peso 4 prova. Para o clculo da nota nal, chamaremos de n1 e p1 a nota e o peso do trabalho, respectivamente. Do mesmo modo, chamaremos de n2 e p2 a nota e o peso da prova. Em analogia ao clculo de mdias pela tabela de frequncias, poderamos imaginar que a situao equivalente seria termos 1 trabalho e 4 provas e calcularamos a nota nal como se fossem 5 avaliaes em lugar de duas: um trabalho e quatro provas sendo, as quatro com a mesma nota. O clculo da mdia nal do aluno seria dado, ento, por: M= p1.n1 +p2 .n2 p1 +p2

Com os pesos citados anteriormente, teramos, portanto: M= 1.n1 + 4.n2 1+ 4

Ou, simplesmente: M= n1 + 4n2 5

Na tabela 20 apresentamos alguns exemplos de clculo de mdias para diversos conjuntos de notas considerando os pesos citados acima.
Aluno 1 2 3 4 5 6 n1 0 10 8 2 7 9 n2 10 0 2 8 7 6 n1*p1 0 10 8 2 7 9 n2*p2 40 0 8 32 28 24 N 8 2 3,2 6,8 7 6,6

Tabela 20 Exemplo de clculo de mdias com ponderao: notas de alunos.

A partir do exemplo anterior, podemos agora apresentar a frmula geral para o clculo de mdias ponderadas: x=

pi .xi pi
43

Unidade II
Vejamos agora outro exemplo de interesse, em que trataremos da dinmica de clculo de inao. Os nmeros e os artigos aqui abordados so claramente irreais, uma vez que nosso propsito exclusivamente didtico. Suponhamos que o clculo de inao levasse em conta somente os aumentos de cinco artigos num dado perodo, conforme apresentado na tabela 21.
Artigo 1 2 3 4 5 arroz acar caf feijo uva Aumento (xi) 1 1 1 1 20

Tabela 21 Exemplo de clculo de mdia aritmtica para um conjunto de aumento de preos (em valores percentuais).

Como a uva teve aumento de 20% e os demais artigos somente de 1%, teramos, num clculo sem ponderao: x= 1+1+1+1+ 20 = 4,8 5

O que resulta de uma inao de 4,8% no perodo. imediato pensar, porm, que esse valor no representativo, uma vez que o consumo de uvas geralmente espordico e o valor de 4,8% no reete o impacto que tal aumento traria economia da regio. Em outras palavras, considerar que o aumento do preo da uva tenha o mesmo peso ou importncia do aumento do preo do arroz no razovel e preciso que o valor mdio do aumento de preos leve em conta essas diferenas. Estabelecemos, ento, pesos ctcios para os artigos citados, buscando reetir a importncia atribuda a cada um deles. Clculos reais de inao tm critrios para a escolha dos pesos, os valores aqui escolhidos apenas buscam ilustrar o efeito dos pesos. Segundo nossas estimativas, o arroz seria o item mais relevante, com grau de importncia 50; o acar e o feijo viriam empatados em segundo lugar, ambos com importncia 35; o caf teria importncia 25 e a uva, por ter pequeno impacto, teria apenas importncia 1. Esses valores esto apresentados na tabela 22. Temos, assim, um novo clculo de inao, em que o aumento da uva se torna muito menos importante que os demais aumentos, fazendo a descrio do aumento mdio dos preos ser mais condizente com a realidade. 44

ESTATSTICA
A maneira de realizar o clculo similar utilizada quando tnhamos os dados na tabela de frequncia: Acrescentamos uma coluna onde colocaremos os resultados dos produtos pi.xi, na qual pi o peso do artigo i e xi o aumento de preo do mesmo artigo. Acrescentamos uma linha adicional, na qual sero colocados os somatrios dos valores das colunas pi e pi.xi. Efetuamos os somatrios dos pesos e colocamos o resultado na linha adicional da coluna pi. Efetuamos os somatrios dos produtos pi.xi e colocamos o resultado na linha adicional da coluna pi.xi. Efetuamos a diviso dos dois somatrios para obter a mdia. O procedimento descrito est esquematizado na tabela 22.
Artigo 1 2 3 4 5 arroz acar caf feijo uva Aumento (xi) 1 1 1 1 20 Soma Peso (pi) 50 35 25 35 1 146 Mdia Tabela 22 Exemplo de clculo de mdias com ponderao para aumento de preos (em valores percentuais). pi*xi 50 35 25 35 20 165 1,13

Calculando a mdia dessa maneira, a inao recalculada nesses moldes de 1,13%, o que muito mais condizente do que o valor anterior de 4,8%, pois temos um nmero prximo quele do aumento dos itens importantes. 4.3.4 Propriedades da mdia Para terminar nossa discusso a respeito das mdias, vale comentar duas de suas caractersticas: 1. Se somamos um mesmo nmero a todos os elementos do conjunto, a mdia ser acrescida de mesmo valor. fcil entender essa propriedade se pensarmos em uma mdia de idade. Um conjunto que tenha, por exemplo, uma mdia de idade de 6 anos, passados 3 anos, todos tero envelhecido o mesmo tempo e a idade mdia do conjunto ser acrescida de 3 anos. 2. Se multiplicarmos todos os elementos do conjunto por um mesmo nmero, a mdia ser acrescida de mesmo valor. 45

Unidade II
Podemos compreender essa propriedade facilmente se pensarmos no exemplo da lanchonete. Se todos se reunirem uma vez por semana na mesma lanchonete e consumirem a mesma coisa todas as vezes, o gasto mensal de cada um ser multiplicado por quatro e o gasto mdio ser a soma dos gastos mdios dirios, resultando num gasto mensal 4 vezes maior. 4.3.5 Mdias ponderadas da rea econmica: ndices de inao Os indicadores da rea econmica so calculados levando-se em conta a relevncia dos diversos fatores abordados no universo estudado. Em outras palavras, os ndices econmicos so geralmente uma ponderao de diversos dados com pesos diferentes. Como discutimos anteriormente, o clculo da inao precisa ponderar a importncia dos diversos artigos. Alm disso, tambm h outros fatores a considerar. Por exemplo, mais importante o valor referente a uma regio cuja populao seja maior, dado que haver um nmero maior de pessoas que sentir aquelas variaes de preo. Para que possa haver conabilidade nos resultados, os institutos de pesquisa econmica disponibilizam os detalhes de suas atribuies de peso para que estudiosos que utilizem esses nmeros possam saber como ele foi obtido. interessante notar que existem diversos ndices, cada um com caractersticas prprias, de acordo com o interesse em se conhecer algum aspecto da economia. No quadro abaixo, tabela 23, citamos alguns exemplos de ndices de preos reais.
Smbolo ICV Instituio ndice do Custo de Vida Dieese Variao do custo de vida das famlias com renda de 1 a 30 salrios-mnimos. Municpio de So Paulo. ndice Geral de Preos do Mercado IGP-M FGV ndice de Preos por Atacado (IPA), 60%. ndice de Preos ao Consumidor (IPC), 30%. ndice Nacional de Custo da Construo (INCC), 10%. ndice Nacional do Custo da Construo Mercado INCC-M FGV Evoluo dos custos de construes habitacionais. 18 municpios das maiores capitais de estados do pas. ndice Nacional de Preos ao Consumidor INPC IBGE Pesquisa de preos nas 11 regies de maior produo econmica. Pesquisa de Oramento Familiares (POF), que abrange famlias com renda de 1 a 8 salrios-mnimos. ndice Nacional da Variao de Custos do Transporte Rodovirio de Carga Lotao INCTL Fipe Custos do transporte rodovirio de carga lotao e de carga fracionada. A carga denominada lotao quando a mercadoria suciente para lotar um caminho; nesse caso, a transportadora encaminha um veculo at o depsito, realiza a operao de carregamento e transfere a carga diretamente ao seu destino. Tabela 23 Exemplos de ndices de preos. Descrio sumria

46

ESTATSTICA
Note haver ndices gerais, tais como o IGP-M, e ndices especcos, como o caso do INCTL. A variedade dos ndices reete a prpria variedade da economia, pois setores diferentes precisam ter informaes detalhadas a respeito de sua rea de atuao. Vale ainda comentar que o Brasil no tem um ndice ocial de inao. Alguns dos comumente utilizados so calculados pelo Instituto Brasileiro de Geograa e Estatstica (IBGE), pela Fundao Getlio Vargas (FGV), pela Fundao Instituto de Pesquisas Econmicas (Fipe) e pelo Departamento Intersindical de Estatstica e Estudos Socioeconmicos (Dieese). Indicadores econmicos So geralmente mdias ponderadas que reetem alguma caracterstica ou tendncia da economia de uma regio. Os indicadores econmicos servem de parmetro de compreenso da economia e de aspectos importantes das sociedades e auxiliam na anlise de conjuntura para a tomada de decises. H uma grande variedade de indicadores econmicos. Conhecer os ndices principais de sua rea de atuao pode auxili-lo a tomar decises mais bem embasadas na realidade.

Saiba mais Os portais ociais do Banco Central do Brasil (http://www.bcb.gov.br/) e do Instituto de Pesquisa Econmica Aplicada (http://www.ipea.gov.br/) trazem informaes a respeito de diversos ndices, bem como seus valores em sries histricas. Voc encontrar tambm informaes detalhadas sobre cada ndice.

Observao Utilizar um ndice econmico mais indicado para o caso, ao analisar uma determinada situao importante, demonstra competncia na rea de atuao. Exemplos de aplicao 1) Extrai-se s uma carta de um baralho de 52 cartas. Determine a probabilidade de obter: a) Um valete. b) Uma carta vermelha. c) Um dez de paus.

47

Unidade II
d) Uma gura. e) Uma carta de ouros. f) Um nove vermelho ou um oito preto. 2) Uma urna tem 20 bolas azuis, 15 bolas vermelhas, 10 bolas laranja e 5 bolas verdes. Misturam-se as bolas e escolhe-se uma aleatoriamente. Determine a probabilidade de a bola escolhida ser: a) Verde. b) Azul. c) Azul ou verde. d) No vermelha. e) Vermelha ou verde. f) Amarela. g) No amarela. 3) Dez chas so numeradas de 0 a 9 e colocadas em uma urna. Determine a probabilidade de a cha escolhida ser: a) O nmero 3. b) Um nmero mpar. c) Um nmero menor do que 4. 4) Uma populao consome trs marcas de papel: A, B e C. Feita uma pesquisa de mercado, colheramse os resultados mostrados na tabela abaixo.
A 129 B 146 C 146 AeB 75 BeC 68 AeC 59 A, B e C 23 Nenhum 132

Supondo que esses nmeros sejam signicativos para descrever o consumo dessa populao, determine a probabilidade de um consumidor: a) Comprar papel da marca A. b) Comprar papel da marca B. 48

ESTATSTICA
c) Comprar papel das trs marcas. d) Comprar somente papel da marca C. e) No comprar papel da marca B. f) No comprar nenhuma das marcas. g) Comprar de qualquer das marcas. h) Comprar de apenas uma marca. i) Um consumidor da marca A usar tambm papel da marca B. j) Um consumidor da marca B usar tambm papel da marca A. 5) Utilizando o conceito geral de probabilidades e as propriedades apresentadas, calcule as probabilidades solicitadas. a) A meteorologia prev que probabilidade de chuva de 60%. A probabilidade de Marta receber uma ligao de Joana de 80%. Qual a probabilidade de chover e Joana telefonar? b) Uma prova de mltipla escolha tem 5 alternativas por questo. Qual a probabilidade de um aluno acertar uma questo que no saiba? c) Qual a probabilidade de adivinhar em que dia da semana nasceu Adam Smith? d) Um lme foi bem avaliado por 70% do pblico. Qual a probabilidade de encontrar na plateia algum que o avalia mal? e) Uma revista sorteia brindes para os compradores que enviarem um cupom pelo correio. Apenas 10% dos leitores enviam o cupom. Dos leitores dessa revista, 90% so maiores de 30 anos. Qual a probabilidade de um comprador com menos de 30 anos ser a pessoa sorteada? Resoluo 1) Em todos os casos, temos como espao amostral as 52 cartas do baralho, ou seja: ntot = 52. a) H 4 valetes no baralho, logo, P = 4/52, ou P = 0,08 (valor arredondado). b) Metade das cartas vermelha, metade preta, logo, P = 0,5. c) 1 carta especca, logo, P = 1/52, P = 0,02 (valor arredondado). 49

Unidade II
d) Cada naipe tem 3 guras, e num baralho h 4 naipes, perfazendo 12 guras, logo, P = 12/52, P = 0,23 (valor arredondado). e) H 13 cartas de ouros, logo, P = 13/52, P = 0,25. f) Duas cartas especcas, logo, P = 2/52, P = 0,038. 2) Total de bolas: 50. a) H 5 bolas verdes, logo, P = 5/50, P = 0,1. b) H 20 bolas azuis, logo, P = 20/50, P = 0,4. c) H 5 bolas verdes e 20 bolas azuis, logo, P = 25/50, P = 0,5. d) H 15 bolas vermelhas, portanto as demais so no vermelhas e: P = (50-15)/50 = 35/50, P = 0,7. e) H 15 bolas vermelhas e 5 verdes, logo, P = 20/50, P = 0,4. f) No h bolas amarelas, logo, P = 0/50, P = 0. g) No h bolas amarelas, logo, todas so no amarelas e: P = 50/50, P = 1. 3) a) 1 cha em 10, logo, P = 1/10, P = 0,1. b) Metade dos nmeros mpar, logo, P = 0,5. c) H 4 nmeros menores que 4, logo, P = 0,4. 4) Para resolver as questes, preciso montar o diagrama: A 36 42 23 45 C 26 132 18 52 B

Com isso temos o total de compradores, que de 400. Esse o espao amostral referente aos itens a-h. As contas so indicadas exatamente, mas os resultados nais podem estar arredondados. 50

ESTATSTICA
a) Comprar papel da marca A: P = 129/400, P = 0,32. b) Comprar papel da marca B: P = 146/400, P = 0,37. c) Comprar papel das 3 marcas: P = 23/400, P = 0,06. d) Comprar somente papel da marca C: P = 42/400, P = 0,11. e) No comprar papel da marca B: P = 1 - 0,37, P = 63. f) No comprar nenhuma das marcas P = 132/400, P = 0,33. g) Comprar qualquer das marcas: P = 1 - 0,33, P = 0,67. h) Comprar de apenas uma marca: P = (18 + 26 + 42)/400, P = 0,22. i) Um consumidor da marca A usar tambm papel da marca B: P = 75/129, P = 0,58. j) Um consumidor da marca B usar tambm papel da marca A: P = 75/146, P = 0,51. 5) Utilizando o conceito geral de probabilidades e as propriedades apresentadas, as probabilidades solicitadas so: a) Eventos independentes: P = 0,6 * 0,8, P = 0,48. b) 5 alternativas, apenas 1 certa: P = 0,2. c) 7 dias na semana, nasceu em um deles: P = 0,14. d) Eventos mutuamente excludentes: p = 0,7, q = 1 - p, q = 0,3. e) Envio de cupom e idade so eventos independentes; ter menos de 30 anos evento complementar de ter mais de 30: P = 0,1 * 0,1, P = 0,01.

Resumo Tabelas de frequncia e seus grcos 1. Para a organizao e anlise de dados estatsticos, interessante vericar com que frequncia aparece cada valor, ou intervalo de valores, de uma varivel e constroem-se tabelas de frequncia.

51

Unidade II
2. As tabelas de frequncia podem trazer valores absolutos (nmero de vezes que o valor aparece) ou relativos (qual a porcentagem de cada categoria de dados). 3. Quando queremos apresentar dados estatsticos, de modo a trazer alguma informao de maneira imediata, fazemos isso por meio da utilizao de grcos. 4. Existem diversos tipos de grco, e cada um poder deixar mais claras algumas das caractersticas diferentes do conjunto, logo, a escolha do tipo de grco a ser utilizado em uma situao depende de qual ou quais caractersticas se queira mostrar com maior nfase.

Exerccios Questo 1. Uma agncia de publicidade relacionou o valor das ltimas 119 campanhas publicitrias que realizou at determinada data e representou-as no grco a seguir, agrupando os valores em categorias. Custos das ltimas 119 campanhas realizadas

11% 12%

10% 12%

5 mil a 10 mil 10 mil a 15 mil 15 mil a 20 mil 20 mil a 25 mil 15% 25 mil a 30 mil 30 mil a 35 mil

21% 19%

35 mil a 40 mil

Baseando-se nesses dados, podemos armar que o custo mdio de uma campanha publicitria dessa agncia de: A) R$ 22.290,00 B) R$ 22.920,00

52

ESTATSTICA
C) R$ 23.290,00 D) R$ 24.190,00 E) R$ 21.690,00 Resposta correta: alternativa B. Anlise das alternativas O grco dado apresenta a porcentagem de campanhas para cada categoria de custos. Assim, por exemplo, informa que 10% das campanhas tm custo entre 5 mil e 10 mil reais. Portanto, podemos chegar concluso de que 12 campanhas (10% de 119) apresentaram custos entre 5 mil e 10 mil reais (informaes retiradas da primeira categoria). Raciocnio semelhante podemos fazer com as outras categorias, chegando-se ao quadro abaixo, no qual tambm so feitos clculos acessrios para a determinao da mdia:
Custo das campanhas publicitrias realizadas (em reais) 5 mil 10 mil 15 mil 20 mil 25 mil 30 mil 35 mil a a a a a a a 10 mil 15 mil 20 mil 25 mil 30 mil 35 mil 40 mil Quantidade de campanhas 12 14 18 23 25 14 13 119 Ponto mdio de classe R$ 7.500 R$ 12.500 R$ 17.500 R$ 22.500 R$ 27.500 R$ 32.500 R$ 37.500 Ponto mdio vezes frequncia simples R$ 90.000 R$ 175.000 R$ 315.000 R$ 517.500 R$ 687.500 R$ 455.000 R$ 487.500 R$ 2.727.500

Somatrios

Clculo do custo mdio: x =

pix xi = 2.727.500 = 22.920 119 pi

A alternativa que corresponde a esse resultado a B. Questo 2. O grco a seguir representa a produo, em toneladas, atingida ao longo dos meses por uma empresa em suas trs linhas de produo (A, B, C).

53

Unidade II
Produo mensal

Quantidade de meses

Toneladas produzidas por ms

Com base nesse grco no se pode armar que: A) Em cerca de 20 meses, o volume produzido na linha B de 825 toneladas. B) A produo de 1.825 toneladas foi atingida no mesmo nmero de meses pelas linhas A e B. C) A produo de 1.575 toneladas foi atingida ao longo de um perodo de 10 meses na linha de produo C. D) A produo mais frequente do produto A de 575 toneladas. E) A produo mais rara para o produto B de 2.075 toneladas. Resoluo desta questo na Plataforma.

54

Vous aimerez peut-être aussi