Vous êtes sur la page 1sur 248

KLS

Mtodos
quantitativos
Mtodos
quantitativos

Junior Francisco Dias


2016 por Editora e Distribuidora Educacional S.A.
Todos os direitos reservados. Nenhuma parte desta publicao poder ser reproduzida ou transmitida de qualquer
modo ou por qualquer outro meio, eletrnico ou mecnico, incluindo fotocpia, gravao ou qualquer outro tipo
de sistema de armazenamento e transmisso de informao, sem prvia autorizao, por escrito, da Editora e
Distribuidora Educacional S.A.

Presidente
Rodrigo Galindo

Vice-Presidente Acadmico de Graduao


Mrio Ghio Jnior

Conselho Acadmico
Dieter S. S. Paiva
Camila Cardoso Rotella
Emanuel Santana
Alberto S. Santana
Regina Cludia da Silva Fiorin
Cristiane Lisandra Danna
Danielly Nunes Andrade No

Parecerista
Rogrio Siqueira Chiacchio
Thiago Barroso Fonte Boa

Editorao
Emanuel Santana
Cristiane Lisandra Danna
Andr Augusto de Andrade Ramos
Daniel Roggeri Rosa
Adilson Braga Fontes
Diogo Ribeiro Garcia
eGTB Editora

Dados Internacionais de Catalogao na Publicao (CIP)

Dias, Junior Francisco


D541m Mtodos quantitativos / Junior Francisco Dias. Londrina
Editora e Distribuidora Educacional S.A., 2016.
244 p.

ISBN 978-85-8482-354-3

1. Funes. 2. Pesquisa quantitativa. 3. Estatstica


matemtica. 4. Matemtica aplicada. I. Ttulo.

CDD 518

2016
Editora e Distribuidora Educacional S.A.
Avenida Paris, 675 Parque Residencial Joo Piza
CEP: 86041-100 Londrina PR
e-mail: editora.educacional@kroton.com.br
Homepage: http://www.kroton.com.br/
Sumrio

Unidade 1 | Funo afim e funo quadrtica 7

Seo 1.1 - Funo 9


Seo 1.2 - Funo afim 23
Seo 1.3 - Funo quadrtica 37
Seo 1.4 - Sinal, mnimo e mximo da funo quadrtica 49

Unidade 2 | Estatstica descritiva 61

Seo 2.1 - Amostragem 63


Seo 2.2 - Mtodos tabulares e mtodos grficos 81
Seo 2.3 - Medidas de posio 99
Seo 2.4 - Medidas de disperso 113

Unidade 3 | Estatstica inferencial (parte I) 129

Seo 3.1 - Noes de probabilidade 131


Seo 3.2 - Distribuio dos estimadores 145
Seo 3.3 - Testes de hipteses para a mdia (2 conhecido) 159
Seo 3.4 - Testes de hipteses para a mdia ( desconhecido)
2
173

Unidade 4 | Estatstica inferencial (parte II) 189

Seo 4.1 - Correlao entre variveis quantitativas 191


Seo 4.2 - Teste de significncia 203
Seo 4.3 - Regresso linear 215
Seo 4.4 - Estudando resduos 227
Palavras do autor

Caro aluno, seja bem-vindo!

Nesta unidade curricular estudaremos funes e noes de estatstica. Utilizamos


esses dois temas o tempo todo, mas nem sempre nos damos conta disso. Observe um
exemplo simples com relao funo: no supermercado, ao levarmos os produtos
ao caixa, o atendente passa o cdigo de barras pelo leitor e o computador registra
o preo do item. Nesse caso, o computador desempenha o papel de uma funo,
que recebe a informao de um cdigo de barras e, como resposta, registra o preo
do produto. Essa a ideia bsica de qualquer funo, ou seja, dado certo elemento
(que pode ser um objeto, um nmero, uma pessoa etc.), a funo o relaciona a outro,
podendo este ser to diverso quanto o primeiro.

Exemplos como o anterior podem ser adaptados para mostrar a aplicao das
funes em qualquer relao de comrcio, mas no somente nesse contexto que
as funes so utilizadas. Ao andar de carro voc j deve ter reparado a funcionalidade
do velocmetro. A ao desse mecanismo tambm pode ser associada a uma funo,
pois ele recebe o sinal referente frequncia dos giros da roda do carro, transformando
essa informao em registro de velocidade.

Com relao estatstica, tambm fazemos uso da mesma em nosso cotidiano


com muita frequncia. Ao fazer um levantamento da quantidade de pessoas que
moram em uma regio, estamos construindo uma estatstica. Quando se realiza uma
pesquisa eleitoral, ou ainda ao se comparar preos de itens de supermercado, estamos
usando a estatstica.

Para que seu estudo ocorra de modo organizado, este material didtico foi dividido
em 4 unidades de ensino, cada qual subdividida em 4 sees de autoestudo, totalizando
16 sees. A primeira unidade trata das funes afim e quadrtica. A unidade 2 aborda
a estatstica descritiva. As unidades 3 e 4 abordam a estatstica inferencial. Desejamos-
lhe sucesso nesta empreitada!
Unidade 1

FUNO AFIM E FUNO


QUADRTICA

Convite ao estudo

Ol, aluno! Na Unidade 1 deste livro didtico trataremos das funes afim
e quadrtica. Essas duas classes de funes so muito utilizadas no somente
na Matemtica, mas tambm na Fsica, na Economia, na Engenharia, na
Administrao etc. Na Fsica, por exemplo, a trajetria de um projtil pode ser
descrita por uma funo quadrtica; funo essa tambm utilizada na Engenharia
para modelar a geometria de algumas estruturas, a exemplo da ponte Juscelino
Kubitschek (Figura 1.1), em Braslia, cujos arcos lembram o grfico dessa funo. A
afim, por sua vez, utilizada, por exemplo, na modelagem de alguns problemas
nas reas econmicas e de gesto, em que a utilizao de outro tipo de recurso
tornaria o problema muito complexo para ser resolvido.

Para tornar o assunto desta unidade mais interessante, veja uma situao em
que o emprego de funes pode facilitar a gesto de um negcio.

Imagine que voc seja o dono de uma empresa que fabrica bons. Para
melhor analisar os custos e lucros voc decidiu estudar esses nmeros utilizando
funes e grficos matemticos, buscando uma melhor organizao e maiores
lucros, bem como um planejamento de expanso da empresa.

No decorrer desta unidade voc ser convidado a desempenhar o papel de


dono da empresa e resolver os desafios inerentes administrao dela, mas,
para tanto, precisar relacionar diversas grandezas presentes no dia a dia, bem
como interpretar nmeros e grficos.
U1

8 Funo afim e funo quadrtica


U1

Seo 1.1

Funo

Dilogo aberto

Para gerir melhor sua empresa, voc deve analisar os custos, as receitas e o
lucro, pois sem lucro a empresa no pode ser mantida.

O custo da produo dos bons contabilizado a partir de diversos gastos,


como matria-prima, mo de obra, energia eltrica, entre outros. Com isso, h
uma relao direta entre o custo e a quantidade de bons produzida, ou seja,
quanto mais bons produzidos, maior o custo de produo.

Alm do custo, outro Figura 1.1 | Ponte Juscelino Kubitschek, em Braslia


item importante na gesto
da empresa a receita, que
o valor recebido com a
comercializao dos bons.
Vamos imaginar que o preo
de venda dos bons seja de
R$ 30,00 por unidade. Qual
a receita obtida com a venda
de 10 unidades? Com um
clculo simples podemos
notar que a receita de
R$ 300,00 (10 . R$ 30,00
= R$ 300,00). Mas, e se
quisssemos escrever isso
em uma planilha, de modo Fonte:<https://commons.wikimedia.org/wiki/File:Ponte_JK_-_
que em uma coluna Bras%C3%ADlia.jpg>. Acesso em: 19 out. 2015.

Funo afim e funo quadrtica 9


U1

tivssemos a quantidade vendida e, em outra, a receita correspondente, como


podemos agilizar esse clculo para diversas quantidades comercializadas? Pense
um pouco.

Por fim, o lucro a diferena entre a receita e o custo de produo. Vamos supor
que, a partir de balanos financeiros de anos anteriores, chegou-se concluso
de que, mensalmente, o custo com a produo composto por um custo fixo
de R$ 9000,00 mais um custo varivel de R$ 20,00 por bon. Nesse caso, com a
produo e venda de 750 bons em um ms, tem-se lucro ou prejuzo? E se forem
produzidos e comercializados 1200 bons?

Para responder a essas e outras perguntas, voc deve empregar conceitos de


funes. Vamos l?

No pode faltar!

Conjuntos

Para compreender a ideia de funo, primeiramente necessrio relembrar


alguns conceitos, geralmente trabalhados no ensino mdio, entre eles, conjunto,
elemento e pertinncia. Para uma melhor compreenso, observe os seguintes
exemplos:

Conjunto das vogais: A = {a, e, i, o, u}.

Conjunto dos planetas do sistema solar: B = {Mercrio, Vnus, Terra, ..., Netuno}.

Conjunto dos meses do ano: C = {janeiro, fevereiro, ..., dezembro}.

Lembre-se

e - 2,71828

r - 3,14159

No primeiro exemplo, A o smbolo utilizado para representar o conjunto das


vogais; cada vogal um elemento do conjunto. Podemos dizer inclusive que a vogal
u
pertence ao conjunto A, afirmao que pode ser expressa sinteticamente por
(l-se: u pertence a A). A consoante m no pertence ao conjunto A e escrevemos
(l-se: m no pertence a A). Os exemplos mais conhecidos de conjuntos so:

Nmeros naturais: N = { 1, 2, 3, 4, 5, 6, ..., 99, 100, 101,...};

10 Funo afim e funo quadrtica


U1

Nmeros inteiros: Z = {..., -7, - 6, ..., -1, 0, 1, 2, ..., 5, 6, 7, ...};

Nmeros inteiros, sem o zero: {..., -7, - 6, ..., -1, 1, 2, ..., 5, 6, 7, ...};
a | a d Z e b d Z*
Nmeros racionais: Q = (l-se: Q o conjunto dos nmeros
a tais que pertence a z e bpertence a z*);
a b
b 37 1 1 10
Nmeros reais: {..., -50, ..., - , ..., , ..., -2, ..., - , ..., 0, ..., , ..., 1, ..., ,
e 2 2 9
..., 2, ..., , ..., 4, ..., 7, ...};

Nmeros irracionais: I = {x|x d R e x d Q} (l-se: I o conjunto dos nmeros


x tais que x pertence a R e x no pertence a Q).
Em relao aos conjuntos numricos, temos as seguintes incluses (Figura 1.2):
(l-se: N est contido em .

Figura 1.2 | Conjuntos numricos

Fonte: O autor (2015).

Ainda sobre esses conjuntos numricos, nenhum elemento de Q pertence a I, e


nenhum elemento de I pertence a Q, ou seja, na interseo desses dois conjuntos,
no h elementos, e indicamos isso por Q + I =Q, em que Q o conjunto vazio. Por
fim, ao reunir os dois conjuntos, Q e I, obtemos o conjunto dos nmeros reais, ou
seja, Q U I = R; ambos so subconjuntos de R.

Pesquise mais
Para mais detalhes sobre a teoria de conjuntos, acesse o link disponvel em:
<http://www.uel.br/projetos/matessencial/medio/conjuntos/conjunto.
htm>. Acesso em: 20 out. 2015. Elaborado pelo professor Ulysses
Sodr, da Universidade Estadual de Londrina, esse site possui alguns dos
fundamentos da teoria de conjuntos, notaes mais utilizadas e exemplos
numricos com linguagem bastante acessvel. Vale a pena conferir!

Funo afim e funo quadrtica 11


U1

Produto cartesiano

Outro conceito importante para o entendimento de uma funo o de produto


cartesiano.

Assimile

Dados dois conjuntos A e B, o A#B = {(a,b) | a d A e bd B}

}
produto cartesiano de A por B
o conjunto dos pares ordenados
(a,b) tais que a d A e b d B. Produto cartesiano de A por B.

Veja um exemplo numrico de produto cartesiano:

Exemplificando

Considerando os conjuntos A= {0,2,3} e B = {-2,0,3,7}, escreva o produto


cartesiano de A por B.

Resoluo:

A # B= {(a,b) | ad A e bd B}

Para a = 0, temos: (0, -2); (0,0); (0,3); (0,7);

Para a = 2, temos: (2, -2); (2,0); (2,3); (2,7);

Para a = 3, temos: (3, -2); (3, 0); (3,3) (3,7).

Logo,

Relao

Outro conceito muito importante para o entendimento de uma funo o de


relao.

Assimile

Dados dois conjuntos A e B, uma relao R de A em B qualquer


subconjunto de A # B, ou seja, .

12 Funo afim e funo quadrtica


U1

Exemplificando

Considere os conjuntos A= {0,2,3} e B= {-2, 0, 3, 7} e escreva os elementos


da relao R descrita pela equao y=x2-2x , em que x d A e y d B.

Resoluo:

Para facilitar os clculos dos elementos de R, vamos utilizar um quadro,


como a seguir:

Elementos de A Elementos de B Elementos de R


x y=x2-2x (x,y)
0 y=x2 2x=02 2$0=0 (0,0)
2 y=x2 2x=22 2$2=0 (2,0)
3 y=x2 2x=32 2$3=3 (3,3)

Portanto, R = {(0,0), (2,0), (3,3)}. Compare os elementos de R com os


de A # B e veja que .

Na relao R= {(0,0) (2,0), (3,3)} dizemos que o valor: 0 dA est associado ao


valor 0 dB; 2 dA est associado ao valor 2 dB; 3 dA est associado ao valor 3 dB.

Plano cartesiano

Uma relao R pode ser visualizada graficamente em um diagrama denominado


plano cartesiano. Veja, por exemplo, a representao grfica da relao R = {(0,0)
(2,0), (3,3)} no plano cartesiano da Figura 1.3.

Figura 1.3 | Representao grfica

Fonte: O autor (2015).

Funo afim e funo quadrtica 13


U1

Observe que a representao de R corresponde a trs pontos no plano. Em


relao ao ponto p = (2,0), o par ordenado (2,0) corresponde a suas coordenadas.
O primeiro valor, 2, denominado abscissa de P e o segundo, 0, a ordenada. O
valor x = 2 corresponde distncia a que o ponto P se encontra do eixo vertical,
eixo y (ou eixo das ordenadas), e o valor y = 0 distncia a que o ponto se encontra
do eixo horizontal, eixo x (ou eixo das abscissas). O ponto de coordenadas (0,0)
denominado origem.

Em um plano cartesiano, as:

abscissas so: positivas se estiverem direita da origem; negativas se estiverem


esquerda da origem;

ordenadas so: positivas se estiverem acima da origem; negativas se estiverem


abaixo da origem.

Pesquise mais
Veja mais detalhes sobre a construo de um plano cartesiano e a
localizao de pontos a partir de suas coordenadas no link disponvel
em: <https://pt.khanacademy.org/math/algebra/introduction-to-algebra/
overview_hist_alg/v/descartes-and-cartesian-coordinates>. Acesso em:
22 out. 2015.

Funo

A partir dos conceitos aprendidos at agora, podemos definir funo.

Assimile

Dados dois conjuntos A e B, uma funo f de A em B, denotada ,


uma relao tal que para cada est associado um nico
.

O conjunto A o domnio de f (denotado por D(f)) e o conjunto B o


contradomnio de f (denotado por CD(f)). Convenciona-se utilizar o smbolo x para
representar um elemento qualquer de A e y para representar um elemento qualquer
de B. Alm disso, se x est relacionado a y por meio da funo f, escrevemos y=f(x)
para simbolizar essa associao, e o par ordenado correspondente ser (x,y) ou
(x,f(x)).

Im(f) = {ydB|y=f(x) e xdA} denominado conjunto imagem de f. Alm disso, se

14 Funo afim e funo quadrtica


U1

y=f(x), ento y a imagem de x obtida por meio de f.

Para compreender melhor, considere as relaes R = {(0,0) (2,0), (3,3)} e S = {(0,0),


(2,0), (3,3), (2,3)} de A= {0,2,3} em B={-2,0,3,7}. Temos que R uma funo e S no
uma funo, pois o valor 2dA est associado por meio de S a dois elementos
de B, a saber, 0 e 3. Essa constatao pode ser feita mais facilmente por meio de
um diagrama de Venn, como os apresentados na Figura 1.4.

Figura 1.4 | Diagrama de Venn: (a) da relao R; (b) da relao S

(a) (b)

Fonte: O autor (2015).

Observe que no caso da relao S h duas setas partindo do nmero 2dA, uma
relacionando-o a 0 e outra relacionando-o a 3, e isso no se encaixa na definio
de funo.

Exemplificando

Considerando os conjuntos A={-2, -1, 0, 1, 3} e B= {0,1,2,4,3,9} e e a funo


f: AB, de modo que y = f (x) = x2, identifique o domnio, contradomnio
e a imagem de f.

Resoluo:

Como visto anteriormente, A o domnio de f e B o contradomnio,


logo:
x y = x2 (x,y)
D(f) = A = { -2, -1,0,1,3}; CD(f) =B =
{0,1,2,4,3,9}; 2 y = (-2) = 42
(-2,4)
1 y = (-1) = 12
(-1,1)
Para escrevermos o conjunto imagem
0 y=0 =0 2
(0,0)
precisamos determinar os elementos
(x,y) pertencentes relao (vide 1 y=1 =1 2
(1,1)
quadro ao lado). Logo, Im(f) = {0,1,4,9}. 3 y=3 =9 2
(3,9)

Funo afim e funo quadrtica 15


U1

Faa voc mesmo

Represente graficamente e elabore um diagrama de Venn para a relao


com A={-2,- 1,0,1,3} , B = {0,1,2,4,3,9} e y = f (x) = x2.

Lei de formao e grfico de uma funo

No exemplo anterior, y = f (x) = x2 o que denominamos lei de formao (ou


regra de associao) da funo f: AB. Em alguns problemas conhecemos a lei de
formao da funo e em outros no. Quando no a conhecemos, em alguns casos,
possvel determin-la a partir de informaes do problema. Veja um exemplo:
considere que em determinado posto de combustveis o preo do etanol seja de
R$ 2,40 o litro. Qual a lei de formao da funo que relaciona a quantidade de
etanol abastecida (x) e o valor a pagar (v(x))?
Figura 1.5 | Representao grfica de v = 2,40.x

A B

Fonte: O autor (2015).

A primeira investigao da lei de formao pode Tabela 1.1 | Preo do etanol


ser feita por meio da Tabela 1.1. Observe que, para
encontrarmos o valor a ser pago por determinada Quantidade Valor a pagar
quantidade de combustvel, multiplicamos essa de litros (R$)
quantidade pelo preo de um litro. Logo, ao adquirirmos 0 0,00
x litros de etanol, devemos pagar 2,40.x reais. Portanto, a 1 2,40
funo v: AB, em que A o conjunto das quantidades
2 4,80
de etanol e B o conjunto dos possveis preos, possui
lei de formao v(x) = 2,40.x. 3 7,20
... ...
Os dados apresentados na Tabela 1.1, com
x 2,40 . x
o acrscimo de alguns valores, podem ser
representados de forma grfica, como na Figura 1.5 (a). Observe que todos os pontos
esto alinhados e, se utilizssemos inmeros valores intermedirios para x ou ainda,
se considerssemos x d R, teramos uma linha reta, como na Figura 1.5 (b). Para fazer

16 Funo afim e funo quadrtica


U1

essa constatao de forma mais dinmica, acesse o link disponvel em: <http://tube.
geogebra.org/m/1886475> acesso em: 23 out. 2015. A linha reta da Figura 1.5 (b) o
que denominamos grfico da funo v. Mais formalmente, o grfico de uma funo f:
AB o conjunto G(f) = { (x,y) | x d A, y d B e y = f (x)} .

Exemplificando

Uma empresa de txi cobra pela corrida um valor fixo de R$ 4,85


(bandeirada) mais um valor varivel de R$ 2,90 por quilmetro rodado.
Construa a lei de formao da funo que retorna o preo f(x) para
uma distncia x percorrida. Alm disso, escreva o domnio, a imagem
e esboce o grfico de f . Calcule tambm o valor a ser pago por uma
corrida de 6 km.

Resoluo:

A corrida composta por um valor fixo de R$ 4,85 e um valor varivel de


R$ 2,90 por quilmetro rodado; matematicamente, essas informaes
podem ser traduzidas da seguinte forma: f(x) = 4,85 + 2,90 . x, em que
x a distncia percorrida e f(x) o preo. Essa a lei de formao.

A funo f: AB tal que A (domnio) o conjunto com todos os valores


possveis e adequados ao problema, que pode ser qualquer quantidade
maior ou igual a zero, ou seja, x > 0 . Logo, A = { x d R | x > 0}. A imagem
de f o conjunto Im(f) B que possui todos os possveis preos a serem
pagos, cujo mnimo R$ 4,85; no h valor mximo. Logo, Im(f) = {x
R | x > 4,85}.

Para esboar o grfico de f, montamos uma tabela com alguns valores


de (x, f(x)) e esboamos os pares
Figura 1.6 | Grfico de f
ordenados em um plano cartesiano
(Figura 1.6).

Distncia Preo (R$)


(km)
0 f(0)=4,85+2,90.0=4,85
1 f(1)=4,85+2,90.1=7,75
2 f(2)=4,85+2,90.2=10,65
3 f(3)=4,85+2,90.3=13,55 Fonte: O autor (2015).

Por fim, o valor a ser pago por uma corrida de 6 km f (6) = 4,85 + 2,90.
6 = 22,25 R$ 22,25

Funo afim e funo quadrtica 17


U1

Pesquise mais
Para esclarecer possveis dvidas, leia mais sobre relaes, funes e seus
grficos em : <http://www.uel.br/projetos/matessencial/medio/funcoes/
funcoes.htm>. Acesso em: 23 out. 2015.

Sem medo de errar!

Vamos retomar o problema proposto no incio desta seo. Um dos


questionamentos feitos foi: como agilizar os clculos das receitas para diversas
quantidades de bons comercializados? Como fazer isso em uma planilha, por
exemplo?

Lembre-se de que o preo de venda de cada bon R$ 30,00.

- Se nenhum bon for vendido, no h receita ( );

- Se 1 bon for vendido, a receita R$ 30,00 ( );

- Se 2 bons forem vendidos, a receita R$ 60,00 ( );

- Se x bons forem vendidos, a receita x . R$30,00 = R$30,00 . x. Portanto, a funo


receita R(x) = 30.x. Esse clculo pode ser agilizado em uma planilha, como na Figura 1.7.
Figura 1.7 | Planilha de clculo da receita de bons vendidos a R$ 30,00 por unidade

(a) (b) (c)


Fonte: O autor (2015).

18 Funo afim e funo quadrtica


U1

Observe que na Figura 1.7 os valores de x esto inseridos na coluna A; os valores


de y=R(x) so calculados na coluna B, sendo cada um calculado pela funo R . A
sequncia (a), (b) e (c) da Figura 1.7 apenas ilustra como agilizar os clculos.

Outro questionamento feito foi em relao ao lucro, mas, para isso, precisamos
determinar a funo custo, traduzindo matematicamente a informao: o custo com
a produo composto por um custo fixo de R$ 9000,00 mais um custo varivel de
R$ 20,00 por bon. Observe que esse problema semelhante ao exemplo da corrida
de txi (trabalhado nesta seo). Por analogia, podemos escrever a funo custo da
seguinte forma: C(x) = 9000 + 20 . x, em que x a quantidade de bons produzida.
Como o lucro/prejuzo a diferena entre a receita e o custo, podemos analisar o
lucro/prejuzo na produo e venda de 750 ou 1200 bons em um ms:

750 bons: (receita);


(custo); lucro = receita custo
= 22500 24000 = 1500.

1200 bons: R(x) = 30 . x R(1200) = 30 . 1200 = 36000 (receita); C(x) =


9000 + 20 . x C (1200) = 9000+20 . 1200 = 33000 (custo); lucro = receita custo
= 36000 33000 = 3000.

Portanto, ao produzir e vender 750 bons, o prejuzo de R$ 1500,00; no caso de


1200 bons, o lucro de R$ 3000,00.

Pesquise mais
Veja mais detalhes de como utilizar funes e agilizar clculos no Excel
nos links a seguir:

Viso geral de frmulas no Excel. Disponvel em: <https://support.


office.com/pt-br/article/Vis%C3%A3o-geral-de-f%C3%B3rmulas-no-Excel-
ecfdc708-9162-49e8-b993-c311f47ca173?ui=pt-BR&rs=pt-BR&ad=BR>.
Acesso em: 26 out. 2015.

Preencher dados automaticamente nas clulas da planilha. Disponvel


em: <https://support.office.com/pt-br/article/Preencher-dados-
automaticamente-nas-c%C3%A9lulas-da-planilha-74e31bdd-d993-45da-
aa82-35a236c5b5db?omkt=pt-BR&ui=pt-BR&rs=pt-BR&ad=BR>. Acesso
em: 26 out. 2015.

Funo afim e funo quadrtica 19


U1

Avanando na prtica

Pratique mais
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas situaes
que pode encontrar no ambiente de trabalho. Realize as atividades e depois as compare com as de
seus colegas.

Atualizando preos
Conhecer os conceitos matemticos bsicos e pro-
1. Competncias de Fundamentos de rea porcionar o desenvolvimento do raciocnio logico e
quantitativo.

Aplicar o conceito de funo na atualizao de


2. Objetivos de aprendizagem
preos.

3. Contedos relacionados Funo; Lei de formao de uma funo.

Em determinado supermercado ser realizada uma


remarcao de preos para embutir o aumento da
energia eltrica no preo de venda. Aps alguns
clculos, foi decidido que cada produto deveria
sofrer um aumento de 2% e, para agilizar o trabalho,
os novos preos seriam calculados com a ajuda de
uma planilha. Veja na Figura 1.8 alguns preos a serem
ajustados.

Figura 1.8 | Tabela de preos

4. Descrio da SP

Fonte: O autor (2015).

Qual funo deve ser inserida na clula C2 para que


o preo da clula B2 seja reajustado em 2%? Qual o
preo ajustado de cada produto?

20 Funo afim e funo quadrtica


U1

Suponha que o preo atual de um produto seja


x e que o preo ajustado seja P(x) . O preo atual
corresponde a 100%; j o preo ajustado (+2%)
corresponde a 102%. Logo, por regra de trs:

.
Ao calcular a funo P(x) para determinado preo, ela
o reajusta em 2%. Adaptando a funo para a planilha,
temos que, na clula C2, devemos inserir a funo
=1,02*B2. Para os preos apresentados na Figura 1.8,
temos:
5. Resoluo da SP
Item Preo atual Preo ajustado
Produto R$ 20,00 P(20,00) = 1,02 . 20,00 =
1 20,40R$ 20,40
Produto R$ 22,00 P(22,00) = 1,02 . 22,00 =
2 22,44R$ 22,44
Produto R$ 16,00 P(16,00) = 1,02 . 16,00 =
3 16,32R$ 16,32
Produto R$ 18,00 P(18,00) = 1,02 . 18,00 =
4 18,36R$ 18,36
Produto R$ 25,00 P(25,00) = 1,02 . 25,00 =
5 25,50R$ 25,50

Lembre-se

Uma regra de trs pode ser utilizada quando temos duas grandezas
proporcionais, sendo que de uma delas conhecemos dois valores e,
da outra, um valor. A regra de trs utilizada para determinar o quarto
valor. Veja um breve resumo sobre esse assunto em: <http://educacao.
globo.com/matematica/assunto/matematica-basica/regra-de-tres.html>.
Acesso em: 27 out. 2015.

Faa valer a pena

1. Os conjuntos numricos so de grande importncia para a matemtica,


principalmente no estudo das funes. Os tipos mais utilizados so: nmeros
naturais (N); nmero inteiros (Z); nmeros inteiros, exceto o zero (Z*); nmeros
racionais (Q); nmeros irracionais (I); nmeros reais (R).
Sobre os conjuntos numricos e seus elementos, correto afirmar que:

Funo afim e funo quadrtica 21


U1

a) -1 d N.
b) 2 d I.
c) .
d) 0dQ.
e) 0dZ*.

2. A reunio do conjunto A com o conjunto B definida como o conjunto


C = {x|x d A ou x d B} e a simbolizamos por C = A U B.
Sendo A = {1,2,3,4,6} e B = {0,2,4,5,8} , assinale a alternativa que contm
o conjunto A U B:
a) {0,1,2,3,4,5,6,8}.
b) {1,2,3,4,6}.
c) {0,2,4,5,8}.
d) {0,1,3,4,5,8}.
e) {2,4}.

3) O produto cartesiano de A por B o conjunto dos pares ordenados


(a,b) tais que a d A e b d B .
De acordo com o trecho anterior, assinale a alternativa que contm o
produto cartesiano de A = {1,2,5} por B = {3,4,6}:
a) {(3,1),(4,1),(6,1),(3,2),(4,2),(6,2),(3,5),(4,5),(6,5)}.
b) {(1,3),(1,4),(1,6)}.
c) {(1,3),(1,4),(1,6),(2,3),(2,4),(2,6),(5,3),(5,4),(5,6)}.
d) {(2,3),(2,4),(2,6)}.
e) {(5,3),(5,4),(5,6)}.

22 Funo afim e funo quadrtica


U1

Seo 1.2

Funo afim

Dilogo aberto

Voc se lembra de que na seo anterior estudou o lucro e a receita da sua


fbrica de bons? E que para fazer isso foi necessrio relembrar alguns conjuntos
numricos, compreender a ideia de produto cartesiano, estudar as relaes
(que so subconjuntos dos produtos cartesianos) e as funes (que so casos
especficos de relaes), alm de representar esses conjuntos graficamente no
plano cartesiano e no diagrama de Venn?

Pois bem, tudo isso abriu caminho para outras possibilidades. Imagine que voc
precise construir uma apresentao contendo um estudo sobre as finanas da
empresa, que ser usada para convencer seu scio a aumentar o investimento na
fbrica e expandir o negcio. Um grfico mostrando os possveis lucros com o
aumento da produo poderia ser interessante e deix-lo empolgado. Alm disso,
voc poderia incrementar a apresentao com informaes detalhadas sobre os
lucros (ou prejuzos) e mostrar a ele que voc entende do assunto. Quanto mais
informao, maior o poder de convencimento, concorda?

Pense um pouco: Ser possvel determinar uma funo que relacione a


quantidade produzida e comercializada com o lucro? Ser que independentemente
da quantidade produzida e comercializada h lucro ou para determinadas
quantidades h prejuzo? A partir de que quantidade h lucro? Se aumentarmos
a produo em 200 bons ao ms nos prximos trs meses, indo dos atuais 600
para 1200, quanto lucro teremos no trimestre? Essas so algumas das perguntas
cujas respostas poderiam estar em sua apresentao. Entretanto, para realizar tudo
isso, temos que estudar mais a fundo as funes e, mais especificamente, a funo
afim e suas propriedades. Vamos l?

Funo afim e funo quadrtica 23


U1

No pode faltar!

A funo afim um tipo especfico de funo polinomial e, por este motivo,


tambm denominada funo do 1 grau ou, ainda, funo polinomial de grau 1.
Mais rigorosamente definimos:

Assimile

Uma funo afim uma funo f:RR cuja lei de formao f(x) = ax +
b, em que a d R, no nulo, denominado coeficiente angular e b d R
denominado coeficiente linear.

O domnio e contradomnio de uma funo afim podem ser intervalos de


nmeros reais.

Pesquise mais
Saiba mais sobre intervalos de nmeros reais acessando o site disponvel
em: <http://www.casadasciencias.org/dmdocuments/intervalo10-11.
pdf>. Acesso em: 2 nov. 2015.

Uma caracterstica interessante da funo afim a forma do seu grfico, que


uma reta (IEZZI et al., 1977, p. 96-A). Veja um exemplo.

Exemplificando

Dada a funo afim f(x) = Figura 1.9 | Grfico de f(x) = 2x + 1


2x + 1, escreva os pares
ordenados (x,y) tais que x
d A= {-2,-1,0,1,2}f D(f) e y
= f(x). Em seguida, esboce
o grfico de f.

Fonte: O autor (2015).

24 Funo afim e funo quadrtica


U1

Resoluo: Para escrever os pares ordenados solicitados podemos fazer


uso do quadro a seguir:

x y=f(x) = 2x + 1 (x,y)
-2 y = f(-2) = 2 (-2) + 1 = -3 (-2, -3)
-1 y = f(-1) = 2(-1) + 1 = -1 (-1, 1)
0 y = f(0) = 2 .0 + 1 = 1 (0,1)
1 y = f(1) = 2 .1 + 1 = 3 (1,3)
2 y = f(2) = 2 . 2 + 1 = 5 (2,5)

Para esboar o grfico da funo, primeiramente marcamos os pontos


determinados no quadro e depois traamos uma reta passando por eles,
como mostra a Figura 1.9.

Para uma visualizao mais dinmica da construo do grfico dessa


funo, acesse: <http://tube.geogebra.org/m/1980917>. Acesso em: 4
nov. 2015.

Da geometria, sabe-se que para determinar uma reta bastam dois pontos. Logo,
para esboar o grfico do exemplo anterior (e o de qualquer funo afim) basta
determinarmos dois pares ordenados, e no mais que isso.

Faa voc mesmo

1) Esboce o grfico da funo f(x) = 3x -2 .

Assim como podemos esboar o grfico de uma funo afim a partir de sua lei
de formao, tambm possvel determinar sua lei de formao a partir de seu
grfico. Para executar essa tarefa necessrio determinar a e b, de modo que a
funo f(x) = ax + b possua o grfico desejado. Veja um exemplo:

Funo afim e funo quadrtica 25


U1

Exemplificando

Com base no grfico da funo afim f representado na Figura 1.10,


determine sua lei de formao.

Resoluo:

O primeiro detalhe importante a ser observado que a funo afim,


ou seja, seu grfico uma reta e sua lei de formao f(x) = ax + b. Para
determinar os valores de a e b, em que o grfico dessa funo passe
pelos pontos destacados na Figura 1.10, podemos escolher dois pontos
quaisquer (escolheremos os pontos de coordenadas (1,1) e (1,3)).
Lembre-se de que o grfico de uma funo formado pelos pontos (x,y),
em que y = f(x) e x d D(f). Para o ponto de coordenadas:

(1,1), temos: f(x) = ax + b f(1) = a.1+ b- 1= a+ b;

(1,3), temos: f(x) = ax + b f(- 1) = a.(- 1) + b 3=- a+ b.

Observe que temos duas equaes lineares, com duas incgnitas, ou seja,
um sistema linear. Neste caso, podemos simplificar o sistema somando as
duas equaes, como segue:

Figura 1.10 | Grfico de f

Fonte: O autor (2015).

Como b = 1 temos: a + b = -1 a + 1 = -1 a = -1-1 = -2. Portanto, a


funo procurada f(x) = -2x + 1.

26 Funo afim e funo quadrtica


U1

Faa voc mesmo

2) Determine a lei de formao da funo afim cujo grfico passa pelos


pontos (2,8) e (2,4).

Funo afim crescente e funo afim decrescente

Uma caracterstica interessante de ser observada em uma funo afim se ela


crescente ou decrescente. Como essa caracterstica estudada para qualquer
funo, podemos compreend-la de modo geral e, depois, ver como ela se aplica
funo afim. De acordo com Thomas, Weir e Hass (2012, p. 6):

Assimile

Seja f uma funo definida em um intervalo I e sejam x1 e x2 dois pontos


em I.

1) Se f(x2) > f(x1) sempre que x1<x2, ento f crescente em I.

2) Se f(x2) < f(x1) sempre que x1<x2, ento f decrescente em I.

Essa definio pode ser facilmente visualizada na Figura 1.11. No caso, f(x)
crescente e g(x) decrescente em I. Decorre da definio anterior que, dado x1<x2,
a funo:

f(x) crescente, pois

g(x) decrescente, pois

Figura 1.11 | Funo crescente e funo decrescente

Fonte: O autor (2015).

Funo afim e funo quadrtica 27


U1

Simplificadamente, f(x) crescente porque seus valores aumentam com o


aumento dos valores de x; e g(x) decrescente porque seus valores diminuem
conforme os valores de x aumentam. Observe as inclinaes das funes f(x) e
g(x).

Podemos denotar 3y= f (x2) f(x1) (ou 3y= g(x2) g(x1) , variao de y) e 3x= (x2)
(x1) (variao de x) e utilizar a razo 3y / 3x para avaliar se a funo crescente
ou decrescente.

Uma grande vantagem de utilizar a razo 3y / 3x que ela est diretamente


relacionada lei de formao da funo afim, sendo inclusive muito utilizada para
determinar a lei de formao a partir do grfico. Mais precisamente, dada uma
funo afim f(x) = ax + b, em relao aos seus coeficientes, temos:

Assimile

a = 3y / 3x;

se a > 0 a funo crescente e se a < 0 a funo decrescente;

f (0) = a . 0 + b= b.

Voc pode encontrar a demonstrao da igualdade a = 3y / 3x disponvel


em: <http://www.professores.uff.br/hjbortol/disciplinas/2010.1/gma00116/aulas/
gma00116-aula-12-4-up-color.pdf>. Acesso em: 6 nov. 2015.

Exemplificando

Sabendo que os pontos de coordenadas (1,3) e (2,5) pertencem ao grfico


de uma funo afim, qual a lei de formao dessa funo?

Resoluo:

Primeiramente calculamos as diferenas 3y e 3x e o coeficiente a = 3y/3x:

3y = f(x2) - f(x1) = 5 -3 = 2;

3x = x2 - x1 = 2 - 1 = 1;

a = 3y / 3x = 2/1 = 2.

28 Funo afim e funo quadrtica


U1

Substituindo, f(x) = 2x + b e, alm disso, f (1) = 3 2 . 1 + b= 3 2 + b= 3


b= 1. Portanto, a lei de formao da funo f (x) = 2x + 1

Faa voc mesmo

3) Volte ao exemplo da Figura 1.10 e determine a lei de formao da


funo f utilizando as igualdades a = 3y / 3x e b = f(0).

ngulo associado a uma funo afim Figura 1.12 | ngulo relacionado


a uma funo afim
A toda funo afim podemos associar um ngulo
q que est diretamente relacionado ao seu
grfico. Esse ngulo pode ser medido a partir da
horizontal, no sentido anti-horrio, como ilustra a
Figura 1.12.

Fonte: O autor (2015).

Dica
Para visualizar a localizao desse ngulo de forma mais dinmica, acesse:
<http://tube.geogebra.org/m/1995699>. Acesso em: 06 nov. 2015.

Quando o grfico de uma funo afim, h apenas duas possibilidades para o ngulo
q formado com a horizontal: 0o < q < 90o (a exemplo do ngulo a da Figura 1.12); ou
90o < q < 180o (a exemplo do ngulo b da Figura 1.12). Se q = 0o, ou seja, se o grfico
for horizontal, a funo denominada constante e sua lei de formao f(x) = b, em
que b pertence a R (R conjunto dos nmeros reais). Se q = 90o, ou seja, se o grfico for
vertical, no se trata de uma funo, mas de uma relao.

Zero e sinal da funo afim

Observe na Figura 1.13 que o grfico de f(x) = ax + b cruza o eixo horizontal (eixo x) no
ponto P. perceptvel que a ordenada de P igual a 0, ou seja, y = 0. Mas e a abscissa
de P, qual seu valor? A abscissa de P o que denominamos zero da funo.

Funo afim e funo quadrtica 29


U1

Assimile

O zero de uma funo f(x) o valor x0 tal que f(x0) = 0.

Ateno!

Alguns livros utilizam a denominao raiz no lugar de zero. Contudo, o


mais comum dizer que funes possuem zeros e equaes possuem
razes.

Para uma funo afim, se x0 o seu zero, temos: Figura 1.13 | Ponto de
interseo com o eixo x

Na linguagem matemtica, para f(x) crescente,


temos:

(a) quando x0 < x ou, ainda, f(x)


f(x0) > 0 f(x) > f(x0) = 0;

(b) quando x < x0 ou, ainda, f (x0) Fonte: O autor (2015).


- f (x) > 0 f (x) < f (x0) = 0. Simplificadamente, se
f(x) crescente e f(x0) = 0, f(x) > 0 para x > x0 e f(x)
< 0 para x < x0. A mesma anlise pode ser feita para o caso de f(x) decrescente e
ambos os casos esto ilustrados na Figura 1.14.

De modo mais simples, para a regio do plano cartesiano em que o grfico de


f(x) est acima do eixo das abscissas, isto , f(x) tem valores maiores que zero,
diz-se que o sinal da funo positivo. E para regies em que f(x) < 0 , diz-se que
a funo tem sinal negativo.

Figura 1.14 | Sinal da funo afim: (a) f(x) crescente; (b) f(x) decrescente

Fonte: O autor (2015).

30 Funo afim e funo quadrtica


U1

Exemplificando

Dada a funo f(x) = 5x 10, determine:

a) o zero;

b) os valores de x para os quais f(x) > 0;

c) os valores de x para os quais f(x) < 0.

Resoluo:

Lembre-se de que o zero da funo um valor x0 tal que f(x0) = 0. Alm


disso, se a funo crescente, f(x) > 0 para x > x0 e f(x) < 0 para x < x0.
Aplicando estes conceitos, temos:

a) f (x0) = 0 5x0 - 10 = 0 5x0 = 10 x0 = 10/5 = 2. Logo, 2 o zero


de f(x).

b) Como a funo crescente (pois a = 5 > 0), f(x) > 0 para todos os valores
x > x0 = 2.

c) f(x) < 0 para todos os valores x < x0 = 2.

Dica
Esboce o grfico da funo e verifique as respostas graficamente.

Pesquise mais
Veja mais sobre funes e, em especial, funes afim em:<http://
cejarj.cecierj.edu.br/material_impresso/matematica/ceja_matematica_
unidade_6.pdf>. Acesso em: 10 nov. 2015. E acesse tambm este link:
<http://cejarj.cecierj.edu.br/material_impresso/matematica/ceja_
matematica_unidade_9.pdf>. Acesso em: 10 nov. 2015.

Sem medo de errar!

Vamos retomar o problema proposto no incio desta seo: imagine-se como o


dono da fbrica de bons e suponha que voc deva convencer seu scio a expandir o
negcio. Para isso, voc deve fazer uma apresentao contendo:

a) Um grfico com os lucros/prejuzos para cada quantidade produzida;

Funo afim e funo quadrtica 31


U1

b) Determinar intervalos de produo para os quais h lucro ou prejuzo;

c) O lucro do trimestre com o aumento da produo dos atuais 600 bons para
1200 bons ao ms, com acrscimo de produo de 200 bons mensais.

Primeiramente, para esboar um grfico com o lucro/prejuzo, necessrio


construir a funo lucro L(x) = R(x) C(x), ou seja, a diferena entre a receita e o custo
de produo.

Lembre-se

Na seo anterior (Seo 1.1) voc estudou que a funo receita era R(x)
= 30 . x e a funo custo C(x) = 9000 + 20 . x, em que x a quantidade
de bons.

Logo, dado R(x) = 30 . x e C(x) = 9000 + 20.x, a funo lucro L(x) = 30 . x - (9000
+ 20 . x) = 10x - 9000. Podemos construir uma tabela com alguns valores de x e os
respectivos lucros/prejuzos para esboar o grfico, como na Figura 1.15. Com isso
resolvemos o item (a).

Figura 1.15 | Grfico de L(x) = 10x - 9000

x L(x)

400 5000

600 3000

800 1000

1000 1000

1200 3000

1400 5000

Fonte: O autor (2015).

Foi traada uma linha junto ao grfico de L(x) para melhorar a visualizao.
Entretanto, o correto, nesse caso, seriam somente pontos isolados, pois s faz sentido
para essa funo a atribuio de valores inteiros para x, pois se trata da quantidade de
bons produzida.

Observe que o grfico de L(x) cruza o eixo x no ponto de coordenadas (x0,0), em

32 Funo afim e funo quadrtica


U1

que x0 o zero da funo. Para este problema o zero da funo indica a quantidade
produzida para a qual no h lucro nem prejuzo. Para quantidades maiores que x0 h
lucro e para quantidades menores, prejuzo. Para determinar x0 resolvemos a equao
L(x0) = 0, como segue: L(x0) = 0 10x0 - 9000 = 0 10x0 = 9000 x0 = 9000/10 =
900. Portanto, ao produzir 900 bons o lucro zero, ao produzir menos de 900 h
prejuzo e, ao produzir mais, h lucro, ficando resolvido o item (b).

Para chegar a 1200 bons ao ms, a produo deve aumentar 200 bons por ms
nos prximos trs meses, sendo produzidos um total de: 800 bons no primeiro ms;
1000 bons no segundo ms; 1200 bons no terceiro ms. Logo, o lucro no trimestre
ser dado pela expresso L(800) + L(1000) + L(1200). Temos:

L(800) + L(1000) + L(1200) = 10 . 800 - 9000 + 10 . 1000 - 9000 + 10 . 1200 -


9000 = - 1000 + 1000 + 3000 = 3000

Portanto, respondendo o item (c), haver um lucro de R$ 3000,00 no trimestre.

Dica
Pense no fato de um dia voc estar em uma empresa e ter de convencer
algum a concordar com suas ideias. Uma demonstrao com
embasamento matemtico, como a apresentada, no seria muito mais
convincente? Pense em como mostrar suas ideias na forma de uma
apresentao com dados, tabelas e grficos!

Avanando na prtica

Pratique mais
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas situaes
que pode encontrar no ambiente de trabalho. Realize as atividades e depois as compare com as de
seus colegas.

Melhor Negcio

1. Competncias de Conhecer os conceitos matemticos bsicos e proporcionar o de-


fundamentos de rea senvolvimento do raciocnio logico e quantitativo.

Determinar uma funo cuja anlise de sinal resolva o problema


2. Objetivos de aprendizagem
proposto.

3. Contedos relacionados Sinal da funo afim.

Funo afim e funo quadrtica 33


U1

Uma empresa de aluguel de veculos possui duas opes de locao:


1) R$ 90,00 a diria livre de quilometragem.
2) R$ 40,00 a diria mais R$ 0,50 por quilmetro rodado.
Um cliente vai at essa empresa para saber as seguintes informaes:
4. Descrio da SP a) Para quais distncias mais vantajosa a 1 opo? E a 2 opo?
b) Para qual distncia percorrida no dia ambas as opes geram o
mesmo custo?
Imagine que voc seja o funcionrio dessa empresa. Como orientar
o cliente?

Perceba que h uma semelhana entre esse problema e o da fbrica


de bons. A primeira pergunta que voc deve se fazer : quais
funes relacionam a distncia percorrida e o preo a pagar para
ambas as opes de locao?
Vamos denotar por f e g as funes para a 1 e 2 opes,
respectivamente, e por x a distncia percorrida. Temos:
f(x) = 90,00 (funo constante, pois independe da quilometragem);
g(x) = 40,00 + 0,50x (custo fixo de R$ 40,00 mais custo varivel de
R$ 0,50).
Agora considere a funo diferena d(x) = f(x) - g(x) = 90,00- (40,00+
0,50x) =- 0,50x + 50,00. Se para dado x a diferena for:
- negativa, mais vantajosa a 1 opo, pois d(x) < 0 f(x) g(x) <
0 f(x) < g(x);
- positiva, mais vantajosa a 2 opo, pois d(x) > 0 f(x) g(x) >
0 f(x) > g(x);
- nula, ou seja, igual a zero, ambas as opes geram o mesmo custo,
pois d(x) = 0 f(x) g(x) = 0 f(x) = g(x).
Sendo x0 o zero de d(x), temos: d(x0) = 0 -0,50x0 + 50,00 = 0
0,50x0 = 50,00 Portanto, para 100 quilmetros
percorridos no dia, o custo o mesmo em ambas as opes (ficando
5. Resoluo da SP respondido o item (b)).
Como o coeficiente angular de d(x) a = -0,50 < 0, a funo
decrescente e, como consequncia, positiva esquerda de x0 = 100 e
negativa direita desse mesmo valor. Podemos concluir a partir disso
que para distncias menores que 100 quilmetros (x<x0 = 100) mais
vantajosa a 2 opo, e para distncias maiores (x>x0 = 100) mais
vantajosa a 1 opo (ficando respondido o item (a)). Essa concluso
pode ser observada na Figura 1.16.

Figura 1.16 | Grfico de d(x) = -0,50x + 50,00

Fonte: O autor (2015).

34 Funo afim e funo quadrtica


U1

Faa valer a pena

1. Estimou-se que em 22 dias foram desperdiados 57,2 litros de gua por


uma torneira pingando. A partir dessa estimativa pode ser desejado saber o
quanto desperdiado em 4 dias, em 37 dias ou em x dias. Pensando nisso,
assinale a alternativa que relaciona a quantidade de dias (x) e o volume de
gua (V(x)) desperdiado por essa torneira:
a) V(x) = 4x.
b) V(x) = 22x.
c) V(x) = 2,6x.
d) V(x) = 3,4x.
e) V(x) = 37x.

2. Lembre-se de que funo afim aquela cuja lei de formao f(x) = ax


+ b, em que a e b so os coeficientes. Sendo o coeficiente linear igual a 2, o
coeficiente angular igual a -1 e dado x = 4, assinale a alternativa que contm
as coordenadas de um ponto pertencente ao grfico de f:
a) (4,3).
b) (4,3).
c) (4,1).
d) (4,2).
e) (4,0).

3. O preo de uma corrida de txi composto pelo valor da bandeirada (R$


5,00) mais um valor varivel que depende da distncia percorrida (R$ 3,00/
km). Considerando essas informaes e que por determinada corrida foram
pagos R$ 29,00, qual foi a distncia percorrida?
a) 5 km.
b) 8 km.
c) 9 km.
d) 10 km.
e) 12 km.

Funo afim e funo quadrtica 35


U1

36 Funo afim e funo quadrtica


U1

Seo 1.3

Funo quadrtica

Dilogo aberto

Lembra-se que na aula anterior voc precisava convencer seu scio a aumentar o
investimento na fbrica de bons e ampliar os negcios? Pois , o resultado foi melhor
que o esperado. Vocs saram do prejuzo de quando produziam 600 bons ao ms
e comearam a ganhar dinheiro ao produzir 1200. Seu scio ficou to feliz que vocs
aumentaram ainda mais a produo, chegando a 2400 bons por ms.
Figura 1.17 | Galpo
Com uma boa margem de lucro, agora
seu scio quem quer convenc-lo a ampliar
o negcio ainda mais aumentando o espao
fsico, indo dos atuais 300 m (como mostra a
Figura 1.17) para 750 m futuramente. Devido
aos equipamentos que esto instalados e o
terreno onde o galpo se encontra, o plano
aumentar tanto o comprimento quanto a largura
em um valor x ainda desconhecido, conforme Fonte: O autor
Figura 1.18. Como seu scio no entende tanto do assunto, pediu para que voc
determinasse a medida x que deve ser acrescida e o custo desse investimento,
uma vez que se estima o valor de R$ 725,85 por metro quadrado a ser construdo.
Figura 1.18 | Esboo do projeto Aqui vo algumas dicas: para resolver este
problema voc precisa estudar um novo tipo de
funo, a quadrtica. Alm disso, para facilitar
todo o processo, voc pode se focar em
responder as seguintes perguntas:

a) Que funo relaciona a medida x e a rea


total do galpo, incluindo a atual? E qual funo
relaciona x com o valor do investimento? Quais
Fonte: O autor
os grficos dessas funes?

b) Qual medida x proporcionar uma rea total de 750 m?

Bons estudos e sucesso neste planejamento!

Funo afim e funo quadrtica 37


U1

No pode faltar!
As funes quadrticas so uma classe de funes muito utilizadas em
problemas de clculo de rea, em clculos de erro, no estudo do movimento de
projteis, entre outros. Assim como a funo afim, essa tambm uma funo
polinomial, mas de grau 2, motivo pelo qual conhecida popularmente como de
2 grau. Segundo Iezzi et al. (1977, p. 123):

Assimile

Uma aplicao (ou relao) f de R em R recebe o nome de funo


quadrtica ou do 2 grau quando associa a cada o elemento (ax2 +
bx + c) d R, em que a 0.

Alternativamente, podemos dizer que uma funo quadrtica aquela


cuja lei de formao com a 0. Os valores a, b e c so
denominados coeficientes e ax2 o termo dominante.

Reflita

Por que para definir a funo quadrtica especificado que a 0?

Uma caracterstica importante das funes quadrticas seu grfico, que


apresenta uma curva plana denominada parbola (SODR, 2010, p. 1). Para definir
uma parbola so necessrios dois objetos, uma reta diretriz Figura 1.19 | Parbola
e um ponto que chamamos de foco, conforme Figura
1.19. No abordaremos aspectos formais da construo de
uma parbola, mas voc pode se aprofundar neste assunto
acessando: <http://mathworld.wolfram.com/Parabola.html>.
Acesso em: 14 nov. 2015.

Para compreender melhor o grfico de uma funo


quadrtica, veja o exemplo a seguir.
Fonte: O autor (2015).

Exemplificando

Esboce o grfico da funo f(x) = x2 - 4x + 5. Resoluo:

Primeiramente construmos um quadro com alguns valores de x, os


respectivos y = f(x) e as coordenadas (x,y). Observe:

38 Funo afim e funo quadrtica


U1

x y = f(x) = x2 - 4x + 5 (x,y) x y = f(x) = x2 - 4x + 5 (x,y)


-1 (-1) -4 . (-1) + 5 = 10
2
(-1, 10) 3 3 4.3 + 5 = 2
2
(3,2)
0 0 4.0 + 5 = 5
2
(0,5) 4 4 4.4 + 5 = 5
2
(4,5)
1 1 4.1 + 5 = 2
2
(1,2) 5 5 4.5 + 5 = 10
2
(5,10)
2 2 4.2 + 5 = 1
2
(2,1)

Com base nas coordenadas calculadas, marcamos os pontos e traamos


a parbola, conforme Figura 1.20.

Figura 1.20 | Grfico de f(x) = x2 - 4x + 5

Fonte: O autor (2015).

Observando a Figura 1.20, h alguns elementos importantes: o ponto de


coordenadas (2,1) o vrtice e a linha vertical x = 2 o eixo de simetria
da parbola.

No caso do exemplo anterior, Figura 1.21 | Grficos de f(x) = ax2 - 4x + 5 para


vrios valores de a: (a) a>0 (b) a<0
dizemos que a parbola tem
concavidade para cima, e isso
controlado pelo coeficiente
do termo dominante, ou seja, o
valor de a. Veja a seguir alguns
grficos de funes quadrticas
da forma para
(Figura 1.21 (a)) e para
(Figura 1.21 (b)).

Fonte: O autor (2015).

Funo afim e funo quadrtica 39


U1

Perceba na Figura 1.21 que, quanto mais prximo de zero est o valor de a, mais
aberta a parbola e, quanto mais distante, mais fechada. Alm disso:

Assimile

Se o valor de a :

Positivo, a > 0, a concavidade da parbola voltada para cima;

Negativo, a < 0, a concavidade da parbola voltada para baixo.


Observe ainda na Figura 1.21 que, em todos os casos, o ponto de coordenadas
(0,5) pertence ao grfico de f(x) = ax2 - 4x + 5 e que isso se deve ao fato de o
coeficiente c ser igual a 5. Veja: se x = 0, temos f(0) = a.02 4.0 + 5 = 5, no
importando o valor de a ou b.

Assimile

O coeficiente c igual ordenada do ponto de interseo do grfico de


f(x) = ax2 + bx +c com o eixo y.
Assim como podemos determinar a lei de formao de uma funo afim
observando seu grfico, tambm possvel fazer o mesmo com uma funo
quadrtica. Veja um exemplo.

Exemplificando

Determine a lei de formao da funo quadrtica cujo grfico


apresentado na Figura 1.22.
Figura 1.22 | Grfico de f(x)

Fonte: O autor (2015).

40 Funo afim e funo quadrtica


U1

Resoluo:

Observe que o ponto de interseo do grfico de f(x) = ax2 + bx +c com


o eixo y possui coordenadas (0,3). Logo, c = -3 e f(x) = ax2 + bx -3. Alm
disso, como os pontos de coordenadas (1,0) e (1,2) pertencem ao
grfico de f(x), temos:

f(1)=0a.12 + b.1-3=0a + b-3=0a+b=3;

f(-1)=-2a.(-1)2+b.(-1)-3=-2a-b-3=-2a-b-3=-2a-b=3-2=1.

Segue que a e b so tais que

Adicionando as equaes, temos: (a + b) + (a - b) = 3 + 1 2a = 4 a =


4/ 2 = 2. Com a = 2 obtemos: a + b = 32 + b =3 b =1.

Por fim, conclumos que f(x) = 2x2 +x -3.

Para compreender melhor a relao entre os coeficientes da funo quadrtica e seu


grfico, acesse o objeto disponvel no link: <http://tube.geogebra.org/m/2078515>.
Acesso em: 16 nov. 2015.

Zeros da funo quadrtica

Lembre-se

Na seo anterior voc aprendeu que denominamos zero da funo o


valor da abscissa do ponto de interseo do grfico com o eixo x. No
caso, x0 ser um zero de f(x) se f(x0) = 0. Alm disso, para uma funo afim
f(x) = ax + b, o nico zero era x0= -b/a.

Observe agora na Figura 1.22 que o grfico de f(x) = 2x2 +x -3 corta o eixo em dois
pontos, e no somente em um, como na funo afim. Entretanto, nem sempre isso
ocorre. O grfico de uma funo quadrtica pode tocar o eixo das abscissas em dois,
em um ponto ou at no o tocar, como mostra a Figura 1.23.

Funo afim e funo quadrtica 41


U1

Figura 1.23 | Zeros de uma funo quadrtica: (a) dois zeros; (b) um zero; (c) nenhum zero

Fonte: O autor (2015).

Para obter os zeros de uma funo quadrtica, quando existem, utilizamos a frmula
do discriminante, popularmente conhecida como Frmula de Bhaskara:

Assimile

Dada uma funo quadrtica , os valores de x para os


quais f(x) = 0 so:

ou ainda:

O valor = b2 -4ac denominado discriminante ou delta.

Veja um exemplo de como utilizar a frmula do discriminante:

Exemplificando

Dada as funes a seguir, determine seus zeros, caso existam:

a) f(x) = x2 6x + 5 b) g(x) = 2x2 + 12x +18 c) h(x) = x2 2x + 3

Resoluo:

42 Funo afim e funo quadrtica


U1

a) Para esta funo, os coeficientes so a = 1, b = -6 e c = 5. Logo o


discriminante ser = b2 -4ac = (-6)2 -4 . 1 . 5 = 36 -20 = 16. Substituindo
o valor = 16, temos:

Portanto, os zeros de f so x1 = 5 e x2 = 1.

b) No caso da funo g, os coeficientes so a = 2, b = 12 e c = 18. Assim,


o discriminante ser e:

Portanto, g possui um nico zero e este x=-3.

c) Para a funo h, os coeficientes so a = 1, b = -2 e c = 3. Com isso,


segue que = b2 4ac = (-2)2 4 . 1 . 3 = 4 12 = -8 e:

Como , -8dR, isto , no um nmero real, a expresso anterior


no faz sentido para os nmeros reais e, em consequncia, a funo h
no possui zeros reais.

Ateno!

No exemplo anterior a funo f(x) = x2 6x + 5 possui discriminante


positivo, =16 > 0, e dois zeros. J a funo g(x) = 2x2 + 12x + 18 possui
discriminante nulo, = 0, e um nico zero. Por fim, o discriminante da
funo h(x) = x2 2x + 3 negativo, = -8 < 0, e esta no possui zeros
reais.

Esta observao vlida para toda funo quadrtica e pode ser compreendida
geometricamente com a Figura 1.23. Em: (a) o discriminante positivo; (b) o
discriminante nulo; (c) o discriminante negativo.

Funo afim e funo quadrtica 43


U1

Faa voc mesmo

1) Determine os zeros e esboce o grfico das funes a seguir:

a) f(x) = x2 8x + 12 b) g(x) = x2 + 6x -12

Pesquise mais
Para saber mais sobre as funes quadrticas, acesse o material
disponvel no link: <http://bit.profmat-sbm.org.br/xmlui/bitstream/
handle/123456789/465/2011_00355_FABIO_ANTONIO_LEAO_SOUSA.
pdf?sequence=1>. Acesso em: 17 nov. 2015.

Alm disso, voc pode encontrar uma demonstrao simples da frmula


do discriminante em: <http://www.ufrgs.br/espmat/disciplinas/funcoes_
modelagem/modulo_IV/fundamentos4f.htm>. Acesso em: 17 nov. 2015.

Sem medo de errar!

Agora que j tratamos de vrios detalhes acerca da funo quadrtica, vamos


retomar o problema proposto no incio desta seo?

Uma das perguntas que voc deveria responder era: qual funo relaciona a medida
x e a rea total do galpo, incluindo a atual? Para comear, a rea de um retngulo
obtida multiplicando as medidas de dois lados consecutivos. No caso da rea atual,
a medida 300 m obtida multiplicando 20 m por 15 m. Para calcular a rea futura,
multiplicamos (20 + x) m por (15 + x) m. Logo, a funo que relaciona a medida x, em
metros, e a rea futura, em metros quadrados, :

A(x) = (20 + x) (15 + x) = (20 + x) 15 + (20 + x) x = 20 .15 + x .15 + 20 . x + x .x = x2


+ 35x + 300.

Voc tambm deveria obter a funo que relaciona a medida x com o valor do
investimento. Para construir determinada rea, o investimento realizado pode ser
calculado multiplicando a rea correspondente pelo valor do metro quadrado, que
R$ 725,85. Logo, a funo investimento I(x) obtida multiplicando 725,85 (valor do
metro quadrado) pela rea que ser acrescida. Veja:

44 Funo afim e funo quadrtica


U1

Para esboar os grficos de A(x) e I(x), calculamos alguns pares ordenados, os


marcamos no plano cartesiano e traamos a parbola, como na Figura 1.24.
Figura 1.24 | rea acrescida e investimento: (a) quadro de valores; (b) funo A(x); (c) funo
I(x)
a)
x A(x) I(x)
0 300 0,00
1 336 26130,60
2 374 53712,90
3 414 82746,90
4 456 113232,60
5 500 145170,00

b) c)

Fonte: O autor (2015).

Por fim, a ltima informao que voc deveria obter a medida x que proporcionar
uma rea total de 750 m. Como temos a funo rea A(x), basta igualar:

Se definirmos f(x) x2 + 35x -450, determinar x para o qual A(x) = 450 equivalente
a calcular o zero de f. Logo:

Funo afim e funo quadrtica 45


U1

Observe que f possui dois zeros e, portanto, h tambm dois valores de x para os
quais A(x) = 450. Contudo, para o problema prtico, s faz sentido utilizarmos valores
positivos, pois x uma medida de comprimento.

Conclumos deste modo que, para a rea futura do galpo ser de 750 m, tanto a
largura quanto o comprimento devem ser acrescidos em 10 m.

Faa voc mesmo

2) Para x = 10 m, qual o valor do investimento na reforma do galpo?

Avanando na prtica

Pratique mais
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas situaes
que pode encontrar no ambiente de trabalho. Realize as atividades e depois as compare com as de
seus colegas.

Movimento de projteis

1. Competncias de Conhecer os conceitos matemticos bsicos e proporcionar o de-


fundamentos de rea senvolvimento do raciocnio logico e quantitativo.

Aplicar os conhecimentos sobre funo quadrtica no estudo do


2. Objetivos de aprendizagem
movimento de projteis.

3. Contedos relacionados Funo quadrtica; zero.

Determinado projtil lanado para o alto e para frente, descrevendo


uma trajetria parablica. A equao que fornece a altura do projtil
4. Descrio da SP em funo da distncia horizontal x a que ele se encontra do ponto
de lanamento . Com base nessas informaes, que
distncia horizontal o projtil percorrer at que toque o solo?

46 Funo afim e funo quadrtica


U1

Vamos primeiramente observar o grfico dessa funo na Figura 1.25.

Figura 1.25 | Grfico de f(x)

5. Resoluo da SP Fonte: O autor (2015).

Note que, aps o lanamento, o objeto sobe at certa altura e cai


novamente at atingir o solo num ponto P, sendo a abscissa desse
ponto o zero da funo. Calculando o zero, temos:

O valor de x1 corresponde ao ponto de partida e o valor de x2 a


abscissa do ponto P. Portanto, o projtil percorrer 30 m at atingir
o solo.

Faa valer a pena

1. Um bloco retangular de concreto tem dimenses Figura 1.26 | Bloco


x + 3, x - 2 e x, conforme Figura 1.26. A funo A(x)
que fornece a rea total da superfcie do bloco :
a) A(x) = 4x2 + 4x - 12.
b) A(x) = 6x2 + 4x - 12.
c) A(x) = 6x2 + 4x + 12.
d) A(x) = 4x2 + 4x + 12.
e) A(x) = 8x2 + 4x - 12. Fonte: O autor (2015).

2. Uma caixa de papelo tem suas dimenses Figura 1.27 | Caixa de


representadas na Figura 1.27. A funo V(x) que papelo
relaciona x com o volume da caixa e o respectivo
volume para x = 20 cm so:
a) V(x) = 30x2 + 180x - 1200 e 12400 cm.
b) V(x) = 30x2 + 160x - 1200 e 14400 cm.
c) V(x) = 30x2 + 180x - 1200 e 14400 cm.
d) V(x) = 30x2 + 160x - 1200 e 12400 cm.
Fonte: adaptada de <https://pixabay.
e) V(x) = 30x2 + 180x + 1200 e 14400 cm. com/p-152428>. Acesso em: 17 nov.
2015.

Funo afim e funo quadrtica 47


U1

3. Uma revendedora de cosmticos estima que para um preo de x reais


so vendidas 5000 2x unidades de certo produto mensalmente. Para este
produto h um custo de R$ 10,00 por unidade. Nestas condies, qual o
lucro obtido em um ms em que o preo de venda deste produto era R$
16,00?
a) R$ 28618,00.
b) R$ 16168,00.
c) R$ 50000,00.
d) R$ 29168,00.
e) R$ 48861,00.

48 Funo afim e funo quadrtica


U1

Seo 1.4

Sinal, mnimo e mximo da funo quadrtica

Dilogo aberto

Na seo anterior voc estudou a funo quadrtica, cuja aplicao


proporcionou uma soluo para o problema da ampliao do galpo da empresa.
Dos 300 m que havia de espao fsico, passou-se para 750 m com a ampliao,
sendo acrescidos 10 m tanto no comprimento quanto na largura. O galpo
atualmente possui 30 m de comprimento por 25 m de largura.

Voc ainda pde calcular o investimento com a reforma por meio da funo I
(x) = 725,85 .x2 + 25404,75 . x. Para o valor x acrescido nas dimenses do galpo,
temos: I(10) = 725,85 . 102 + 25404,75 . 10 = 72585 + 254047,5 = 326632,5 R$
326632,50, isto , o investimento com a reforma foi de R$ 326632,50.

Aps todos esses gastos, seu scio quer agora recuperar parte do investimento
aumentando o preo de venda dos bons. Atualmente, so produzidos e
comercializados 2400 bons por ms, vendidos por R$ 30,00 cada. Para que
tudo ocorra de modo planejado, ele se adiantou e fez uma pesquisa junto aos
consumidores estimando que para cada x reais acrescidos no preo de cada bon
so vendidas (2400 - 60x) unidades por ms.

Considerando as informaes anteriores, qual deve ser o preo de cada bon


para que a receita seja a maior possvel?

No pode faltar!

Mximos e mnimos

Voc viu na seo anterior alguns elementos da parbola, entre eles o vrtice,
como ilustrado na Figura 1.28. O ponto A o vrtice do grfico de f(x) = -075x2 +
4,5x -3,75 e o ponto B o vrtice do grfico de g(x) = 3x2 42x + 145. Ambos os
grficos possuem eixo de simetria (linha tracejada) que passa pelo vrtice.

Funo afim e funo quadrtica 49


U1

Figura 1.28 | Grficos de f e g

Fonte: O autor (2015).

O fato de uma parbola ter eixo de simetria significa que o lado direito da curva
o reflexo do lado esquerdo, ou seja, se desenhssemos uma parbola em um
papel e o dobrssemos sobre o eixo de simetria, os lados da curva se sobreporiam.
Observe que o coeficiente do termo dominante de f(x) = -075x2 + 4,5x -3,75
negativo e que o coeficiente do termo dominante de g(x) = 3x2 42x + 145
positivo. Como j abordado na seo anterior, isso influencia na concavidade
da parbola: o grfico de f tem concavidade para baixo e o grfico de g tem
concavidade para cima. Em decorrncia disso, h algo interessante em relao ao
vrtice: no caso do grfico de f, o vrtice A o ponto mais alto da parbola e, no
caso do grfico de g, o vrtice B o ponto mais baixo da parbola. Isso pode ser
observado para toda funo quadrtica e est de acordo com o exposto a seguir:

Assimile

Seja f(x) = ax2 + bx + c uma funo quadrtica. Se:

a > 0, o grfico tem concavidade voltada para cima, e o vrtice seu


ponto mais baixo;

a < 0, o grfico tem concavidade voltada para baixo, e o vrtice seu


ponto mais alto.

Essa percepo grfica em relao funo quadrtica auxilia no entendimento


de um conceito estudado para qualquer funo:

Assimile

Uma funo f(x) possui um mximo em xv pertencente a um intervalo I,


se f(xv) f(x) para todo x d I. Nesse caso, f(xv) ser o maior valor alcanado
(valor mximo) pela funo nesse intervalo.

50 Funo afim e funo quadrtica


U1

De modo semelhante, uma funo f(x) possui um mnimo em xv


pertencente a um intervalo I, se f(xv) f(x) para todo x d I. Nesse caso, f(xv)
ser o menor valor alcanado (valor mnimo) pela funo nesse intervalo.

Em ambos os casos, dizemos que os valores so extremos da funo.

No exemplo da Figura 1.28, A um ponto Figura 1.29 | Simetria da parbola


de mximo e B um ponto de mnimo. Para
uma funo quadrtica, as coordenadas
do vrtice so (xv, yv), em que xv o x do
vrtice e yv, o y do vrtice.

Como a parbola simtrica em relao


ao seu vrtice, segue que f(xv-1) = f(xv+1),
como mostra a Figura 1.29. Com base
Fonte: O autor (2015).
nessa igualdade, temos:

Da ltima igualdade, segue que . Com essa propriedade e as


observaes anteriores, podemos enunciar o seguinte:

Assimile

Dada uma funo quadrtica f(x) = ax2 + bx + c, o vrtice de seu grfico


tem coordenadas (- b/ 2a, f (- b/ 2a).

No entraremos em detalhes, mas pode ser demonstrado que xv = - b/ 2a e yv =


-/ 4a.

Reflita

Como podemos deduzir yv = -/ 4a a partir de xv = -b/2a e f(x) = ax2 +


bx +c?

Funo afim e funo quadrtica 51


U1

Exemplificando

Dada a funo quadrtica f(x) = 2x2 - 4x +8, determine as coordenadas


do vrtice de seu grfico e se este um ponto de mximo ou de
mnimo.

Resoluo:

Para esta funo temos a = 2, b = -4 e c = 8. Logo:

Portanto, as coordenadas do vrtice so (1,6).

Como a = 2 > 0 o grfico de f possui concavidade voltada para cima, o


que implica que seu vrtice um ponto de mnimo. Nesse caso, f(1) =
6 o menor valor (mnimo) assumido pela funo.

Sinal da funo quadrtica

Observe na Figura 1.30 as funes f, g, h, p, q, r. A partir do exposto na seo


anterior e analisando os grficos, segue que as funes f e p possuem dois zeros
reais cada ( > 0), as funes g e q possuem um nico zero cada ( = 0) e as
funes h e r no possuem zeros reais ( < 0). A partir de uma anlise grfica,
podemos ainda afirmar que:

h(x) > 0 ( positiva) no intervalo (-3,+3) = R, pois seu grfico est totalmente
acima do eixo x;

r (x) < 0 ( negativa) no intervalo (-3,+3) = R, pois seu grfico est totalmente
abaixo do eixo x;

g(x) > 0 nos intervalos (-3,x1) e (x1, +3), em que g(x1) = 0 (na Figura 1.30, x1 = 7);

q(x) < 0 nos intervalos (-3,x1) e (x1, +3), em que q(x1) = 0 (na Figura 1.30, x1 = 7);

f(x) > 0 em (-3,x1) e (x2, +3), f(x) < 0 em (x1, x2) e f(x1) = f(x2) = 0 (na Figura 1.30,
x1= 1 e x2= 3);

p(x) > 0 em (-3,x1) e (x2, +3), p(x) < 0 em (x1, x2) e p(x1) = p(x2) = 0 (na Figura
1.30, x1= 1 e x2= 3).

52 Funo afim e funo quadrtica


U1

Figura 1.30 | Funes quadrticas

Fonte: O autor (2015).

Exemplificando

Dada a funo f(x) = -x2 +2x + 3, faa o estudo dos sinais e determine se f
possui um valor mximo ou um mnimo e especifique esse valor.

Resoluo:

Como para esta funo a = -1 < 0, a Figura 1.31 | Esboo


concavidade de seu grfico voltada
para baixo. Em consequncia, o vrtice
o ponto mais alto do grfico, tornando-o
um ponto de mximo. Alm disso, como
b = 2 e c = 3, temos:

= b2 4ac = 22 -4 . (-1) . 3 = 4 (-12) = 16


= 16 > 0.

Como o discriminante positivo, a funo


possui dois zeros reais, alm de seu grfico Fonte: O autor (2015).
interceptar o eixo da ordenadas no ponto
de coordenadas (0,3), pois c = 3. Com essas informaes, podemos
inferir que o grfico da funo semelhante ao esboo da Figura 1.31.
Calculando os zeros de f, temos:

Funo afim e funo quadrtica 53


U1

Logo, f(x) > 0 em (-3, -1) e (3, +3), f(x) < 0 em (-1, 3) e f(-1) = f(3) = 0.

Para determinar o mximo de f, precisamos primeiramente do valor de xv:

Com isso, o valor mximo de f ser f(xv) = f(1) = -12 + 2 . 1 + 3 = -1 +2 + 3


= 4.

Faa voc mesmo

1) Dada a funo f(x) = x2 + 6x + 5, faa o estudo dos sinais e determine


se f possui um valor mximo ou um mnimo e especifique esse valor.

Pesquise mais
Voc pode investigar de forma mais dinmica a relao entre os
coeficientes da funo quadrtica e seu sinal com o objeto disponvel no
link: <https://www.geogebra.org/m/171465>. Acesso em: 24 nov. 2015.

Alm disso, para ver mais sobre as funes quadrticas, principalmente


quanto a mximos e mnimos e ao sinal, acesse: <http://www.fund198.
ufba.br/apos_cnf/funcao4.pdf>. Acesso em: 24 nov. 2015.

Sem medo de errar!

Vamos retomar o problema proposto no incio da seo: atualmente so produzidos


e comercializados 2400 bons por ms e estes so vendidos por R$ 30,00 cada.
Alm disso, seu scio estimou que para cada x reais acrescidos no preo de cada
bon so vendidas (2400 60x) unidades por ms. Com todas essas informaes,
como calcular o preo de cada bon para que a receita seja a maior possvel?

Vamos interpretar o problema: obter a maior receita possvel o mesmo que obter
a receita mxima. Desse modo, se conseguirmos construir uma funo receita
que modele toda essa dinmica, obter a receita mxima o mesmo que calcular
o valor mximo da funo. Considere que o preo do bon, que atualmente de
R$ 30,00, seja acrescido em x reais. O novo preo ser:

54 Funo afim e funo quadrtica


U1

Com o bon nessa faixa de preo, so vendidas (2400 60x) unidades. Lembre-
se de que a funo receita obtida multiplicando a quantidade vendida pelo preo,
logo:

Desenvolvendo os clculos, temos:

R(x) = (2400 - 60x) (30 + x) = (2400 - 60x) 30 + (2400 - 60x) x = 72000 - 1800x
+ 2400x - 60x2

Portanto, R(x) = -60x2 + 600x + 72000.

Depois de interpretar o problema, podemos resolv-lo com o auxlio da funo


receita: para essa funo, temos a = -60 < 0 e, consequentemente, essa funo
possui um valor mximo atingido em xv = b/2a = 600 / (2 .(- 60)) = -600/(-120) =
5. Esse o valor que pode ser acrescido no preo atual do bon para alcanar
a receita mxima. Como o preo atual R$ 30,00, o novo valor ser R$ 35,00,
ficando resolvido o problema.

Faa voc mesmo

2) Qual ser a receita mxima?

Avanando na prtica

Pratique mais
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas situaes
que pode encontrar no ambiente de trabalho. Realize as atividades e depois as compare com as de
seus colegas.

rea mxima

1. Competncias de Conhecer os conceitos matemticos bsicos e proporcionar o de-


fundamentos de rea senvolvimento do raciocnio logico e quantitativo.

Utilizar o conceito de mximo e mnimo de uma funo na resoluo


2. Objetivos de aprendizagem
de problemas de otimizao.

3. Contedos relacionados Mximos e mnimos.

Funo afim e funo quadrtica 55


U1

Uma rea retangular ser cercada com tela em trs lados, sendo que
no quarto lado ser utilizado um muro j existente, conforme Figura
1.32.
Figura 1.32 | rea a ser cercada

4. Descrio da SP

Fonte: O autor (2015).

Se h 40 metros de tela disponvel, quais sero as dimenses do cer-


cado que possui rea mxima?
Observe que este problema possui uma restrio: a quantidade de
tela disponvel, 40 m. Considerando um cercado retangular de x de
largura e y metros de comprimento, sua rea ser A = xy. Utilizando
a restrio do problema, x + y + x = 40 2x + y = 40 y = 40 - 2x,
temos que a funo rea ser:
A = xy A(x) = x(40 - 2x) = -2x2 + 40x.
5. Resoluo da SP
Determinar a rea mxima o mesmo que determinar o mximo da
funo A(x), que atingido em xv = -b/2 = -40 / (2 . (-2)) = -40 / (-4) =
10. Se x = 10, temos y = 40 - 2 .10 = 40 - 20 = 20. Por fim, conclumos
que o cercado com rea mxima ter 20 m de comprimento por 10
m de largura.

Faa valer a pena

1. Um aspecto muito interessante em relao s funes consiste em seus


valores extremos, que podem ser mnimos ou mximos. Para as funes
quadrticas, sabemos se um valor extremo ser um mnimo ou um mximo
apenas observando seus coeficientes.
Em relao aos valores extremos, as funes e
possuem, respectivamente:
a) mximo, mnimo e mximo.
b) mnimo, mximo e mnimo.
c) mximo, mximo e mnimo.
d) mnimo, mnimo e mximo.
e) mnimo, mximo e mximo.

56 Funo afim e funo quadrtica


U1

2. Os grficos das funes Figura 1.33 | Funes f e g

e
possuem o mesmo vrtice,
conforme Figura 1.33. Nesse
caso, qual o valor do
coeficiente c da funo f?
a) 4.
b) 2.
c) 1.
d) 3.
Fonte: O autor (2015).
e) 5.

3. Determinado trecho de uma montanha-russa tem seu trilho a uma altura


f(x) = 0,1x2 2x + 14, com x pertencente ao intervalo (0,20), em metros. Nesse
trecho, qual a altura do trilho no seu ponto mais baixo, considerando o eixo
das abscissas como sendo o solo?
a) 1 m.
b) 2 m.
c) 3 m.
d) 4 m.
e) 5 m.

Funo afim e funo quadrtica 57


U1

58 Funo afim e funo quadrtica


U1

Referncias

ANTON, Howard; BIVENS, Irl; DAVIS, Stephen. Clculo. 10. ed. Porto Alegre: Bookman,
2014.
IEZZI, Gelson et al. Fundamentos de matemtica elementar: conjuntos e funes. 3. ed.
So Paulo: Atual, 1977.
LARSON, Ron. Clculo aplicado: curso rpido. 8. ed. So Paulo: Cengage Learning, 2011.
ROGAWSKI, Jon. Clculo. Porto Alegre: Bookman, 2009.
SIMMONS, George F. Clculo com geometria analtica. So Paulo: McGraw-Hill, 1987.
SODR, Ulysses. Funes quadrticas. 2010. Disponvel em: <http://www.uel.br/
projetos/matessencial/superior/matzoo/quadratica.pdf>. Acesso em: 14 nov. 2015.
STEWART, James. Clculo. 7. ed. So Paulo: Cengage Learning, 2013, 1. v.
THOMAS, George B.; WEIR, Maurice D.; HASS, Joel. Clculo. 12. ed. So Paulo: Pearson,
2012.

Funo afim e funo quadrtica 59


Unidade 2

ESTATSTICA DESCRITIVA

Convite ao estudo

Voc j tomou conhecimento na Unidade 1 de um dos conceitos mais


importantes da Matemtica: o de funo. Dizemos que a funo utilizada
para estabelecer uma relao entre dois conjuntos distintos. Ela determina
uma relao entre os elementos de dois conjuntos.

Dando continuidade em nosso estudo, passaremos agora a estudar


a estatstica. Podemos defini-la, simplificadamente, como a cincia que
cuida da coleta, descrio e interpretao de dados. Contudo, essa no a
nica maneira de se definir estatstica. Segundo Johnson e Kuby (2013), a
palavra estatstica possui significados diferentes para pessoas de diferentes
reas e interesses. Veja, por exemplo, a seguinte definio para estatstica:

Reflita

"A estatstica moderna uma tecnologia quantitativa para


a cincia experimental e observacional que permite avaliar
e estudar as incertezas e os seus efeitos no planejamento
e interpretao de experincias e de observaes de
fenmenos da natureza e da sociedade".

Raul Yukihiro Matsushita, professor assistente do


Departamento de Estatstica da Universidade de Braslia

Sugesto: pesquise outras definies para estatstica e faa um


comparativo.

A partir de agora, estudaremos a estatstica descritiva e a estatstica


inferencial. A primeira, mais frequentemente utilizada, cuida da coleta,
U2

anlise e sintetizao de dados. J a segunda se utiliza dos resultados


obtidos pela primeira para realizar a interpretao das informaes e,
posteriormente, auxiliar na tomada de deciso.

Para iniciar seus estudos em estatstica descritiva, imagine que voc


um funcionrio de uma grande empresa (que denominaremos de M) e foi
incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil
funcionrios. O relatrio final dessa pesquisa dever conter informaes
pessoais como idade, peso, altura, sexo, cor dos olhos, raa e tambm
informaes sobre a satisfao em relao s condies de trabalho
e remunerao. Considere que o prazo estipulado para a realizao
dessa tarefa seja uma semana. Nesse ponto algumas dvidas devem ter
surgido. Entre elas podemos mencionar:

O que exatamente devo pesquisar?

Como fazer essa pesquisa?

O tempo ser suficiente para pesquisar todos os funcionrios? Em


caso negativo, o que fazer?

Como apresentar os resultados obtidos com a pesquisa?

No decorrer dessa unidade, pouco a pouco, algumas dessas perguntas


sero respondidas e voc poder ter uma viso geral de todo o processo.
Ao final, esperamos que voc:

Compreenda as principais tcnicas de amostragem.

Interprete informaes apresentadas em tabelas e grficos.

Entenda as medidas de posio e sua representatividade.

Compreenda as medidas de disperso e sua representatividade.

Ateno!

Observe que o termo peso foi empregado incorretamente.


Nesse contexto, o correto seria massa. O peso uma
grandeza fsica, mais especificamente, uma fora. Apesar
disso, como esse termo de uso frequente no dia a dia,
manteremos o sentido coloquial da palavra peso.

62 Estatstica descritiva
U2

Seo 2.1

Amostragem

Dilogo aberto

Para iniciarmos os estudos em estatstica, vamos retomar a situao proposta


anteriormente: imagine que voc um funcionrio da empresa M e que foi
incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil funcionrios.
O relatrio final dessa pesquisa dever conter informaes pessoais como idade,
peso, altura, sexo, cor dos olhos, raa e tambm informaes sobre a satisfao
em relao s condies de trabalho e remunerao. Considere que o prazo
estipulado para a realizao dessa tarefa seja uma semana.

Para que essa tarefa seja executada, o primeiro passo planejar a coleta de
dados, assunto que ser estudado nesta seo de autoestudo.

No Pode Faltar!

Conceitos bsicos

Antes de iniciar o planejamento da coleta de dados, essencial que voc


consiga identificar alguns objetos de estudo da estatstica, tais como populao
e amostra. Uma populao o conjunto de todos os elementos que possuem
determinada caracterstica em comum. Para o nosso exemplo, a populao
corresponde aos 30 mil funcionrios da empresa M. Alm de pessoas, populaes
podem ser compostas por animais, objetos, substncias qumicas etc.

Exemplificando

Suponha que se queira analisar o:

Comportamento das formigas cortadeiras no Brasil. Nesse caso, a


populao corresponderia totalidade das formigas dessa espcie no pas.

Estatstica descritiva 63
U2

Nmero de peas defeituosas fabricadas por determinada mquina.


Nesse caso, a populao corresponderia a todas as peas fabricadas
por essa mquina.

A populao pode ser finita, quando possvel listar fisicamente todos os seus
elementos, ou infinita, quando no h essa possibilidade. No caso dos funcionrios
da empresa M, a populao finita, pois poderamos, por exemplo, solicitar ao
departamento de pessoal que fornecesse uma lista com os nomes de todos os
funcionrios que constam na folha de pagamento. Para o exemplo do estudo
do comportamento das formigas cortadeiras, apesar de haver um nmero finito
dessas formigas, podemos considerar essa populao como sendo infinita, pois
esse nmero muito grande e jamais conseguiramos observar todas elas.

Uma amostra qualquer subconjunto de uma populao. Geralmente,


amostras so finitas e utilizadas quando a populao muito numerosa ou infinita,
o que dificulta ou at impossibilita a observao de todos os seus elementos.

Assimile

Populao o conjunto de todos os elementos que possuem


determinada caracterstica em comum.

Amostra qualquer subconjunto de uma populao.

Outros objetos de estudo da estatstica so o censo e a amostragem. Um censo


corresponde ao processo de coleta de dados de toda a populao, enquanto que
uma amostragem o processo de coleta de dados de uma amostra, ou seja,
de apenas parte da populao. Censos so raramente feitos, pois so muito
demorados e caros quando comparados a uma amostragem.

Pesquise mais
No Brasil, o IBGE (Instituto Brasileiro de Geografia e Estatstica) se encarrega
de realizar um censo a cada 10 anos. Nele so coletadas diversas
informaes sobre a populao e os domiclios. Para mais informaes,
acesse: <www.ibge.gov.br>. Acesso em: 8 jul. 2015.

64 Estatstica descritiva
U2

Variveis

Quando estudamos uma populao, estamos interessados em suas v e nos


possveis valores que elas podem assumir. Idade, peso, altura, sexo, cor dos olhos
e raa so exemplos de variveis.

Veja na Figura 2.1 algumas informaes a respeito do jogador Pel e mais alguns
exemplos de variveis.

Figura 2.1 | Dados pessoais do jogador Pel em 2015

Nome completo dson Arantes do Nascimento


Posio Meia-atacante
Ano de nascimento 1940
Idade (anos) 74
Nacionalidade Brasileira
Local de nascimento Trs Coraes (MG)
Altura (metros) 1,73
Peso (kg) 75
Formao
Superior completo
acadmica

Fontes: 2010-2015 Graphic Resources LLC. Disponvel em: <http://br.freepik.com/fotos-gratis/pele--jogador-de-


futebol-lendas_566595.htm> e <http://esporte.uol.com.br/futebol/biografias/559/pele>. Acesso em: 28 abr. 2015.

Na Figura 2.1 podemos identificar as variveis nome, posio, ano de


nascimento, idade, nacionalidade, local de nascimento, altura, peso e
formao acadmica. Alm disso, dson Arantes do Nascimento, meia-atacante,
1940, 74, brasileira, Trs Coraes (MG), 1,73, 75 e superior completo so,
respectivamente, os valores que elas assumem para o jogador Pel. Observe que
algumas dessas variveis retornaram valores numricos e outras, no numricos.

Quando uma varivel retorna valores numricos, ns a denominamos varivel


quantitativa. J aquela que retorna valores no numricos, ns a denominamos
varivel qualitativa. Essa diferena fcil de ser assimilada, pois a palavra quantitativa
lembra quantidade, ou seja, nmeros, enquanto a palavra qualitativa lembra
qualidade, isto , atributos. As variveis quantitativas e as qualitativas podem ainda
ser subdivididas em dois subgrupos, conforme ilustra a Figura 2.2.

Estatstica descritiva 65
U2

Figura 2.2 | Tipos de variveis


Discretas
Quantitativas
Contnuas
Variveis
Ordinais
Qualitativas
Nominais
Fonte: O autor (2015).

Uma varivel quantitativa discreta aquela que, em geral, assume valores


inteiros ou um nmero finito de valores bem definidos. Na Figura 2.1 podemos
observar duas variveis com essa caracterstica: ano de nascimento e idade.
J uma varivel quantitativa contnua aquela que pode assumir qualquer valor
(inteiro ou no) dentro de um intervalo. Na Figura 2.1 podemos observar tambm
duas variveis com essa caracterstica: altura e peso.

Uma varivel qualitativa ordinal aquela no numrica que apresenta uma


ordenao entre seus valores, a exemplo da varivel formao acadmica. Veja
que Pel possui ensino superior completo. Entretanto, caso observssemos os
valores dessa varivel para outras pessoas, poderamos ter como resposta ensino
fundamental ou ensino mdio, por exemplo. Uma ordenao natural para ns
que o ensino fundamental antecede o ensino mdio, que, por sua vez, antecede
o ensino superior. Por fim, uma varivel qualitativa nominal aquela no
numrica, que no possui ordenao entre seus valores, como nome, posio,
nacionalidade e local de nascimento.

Assimile

Varivel:

quantitativa discreta: aquela que, em geral, assume valores inteiros


ou um nmero finito de valores bem definidos;

quantitativa contnua: aquela que pode assumir qualquer valor


(inteiro ou no) dentro de um intervalo;

qualitativa ordinal: aquela, no numrica, que apresenta uma


ordenao entre seus valores;

qualitativa nominal: aquela no numrica, que no possui ordenao


entre seus valores.

66 Estatstica descritiva
U2

Para verificar se voc compreendeu as diferenas entre os diversos tipos de


variveis, classifique as da Figura 2.3 em discretas, contnuas, nominais ou ordinais.

Figura 2.3 | Exemplos de variveis

formao nmero de
altura peso cor dos olhos
acadmica filhos

estgio de uma ms de
fumante/ doena (inicial, observao (ja-
doente/sadio sexo
no fumante intermedirio, neiro, fevereiro,
terminal) ..., dezembro)

nmero de nmero de
bactrias por cigarros fu- presso
tempo idade (anos)
litro de leite mados por dia arterial

Fonte: O autor (2015).

Confira sua classificao com a proposta no apndice da Seo 2.1. Quando


aferimos um valor a partir de uma anlise de determinada varivel em uma amostra,
o denominamos estatstica. J se o referido valor obtido a partir de uma anlise
de uma varivel na populao como um todo, o denominamos parmetro. A mdia
de altura dos funcionrios do setor administrativo da empresa M, por exemplo,
corresponde a uma estatstica. Tal estatstica busca estimar a verdadeira mdia da
altura de todos os funcionrios da empresa M, a qual corresponde a um parmetro.

Grande parte das pesquisas feita a partir de amostras. Tais pesquisas obtm
estatsticas que buscam estimar os parmetros da populao.

Tipos de amostragem

Antes de atingirmos o objetivo dessa seo de autoestudo, que o de


planejar a coleta de dados, precisamos ainda compreender os principais tipos de
amostragem. A escolha adequada do mtodo de fundamental importncia para
a confiabilidade dos dados a serem coletados.

Um grande desafio de quem est planejando fazer uma pesquisa saber como
coletar uma amostra confivel, ou seja, como conseguir selecionar na populao
um subconjunto que seja representativo do todo. Observe que essa uma etapa

Estatstica descritiva 67
U2

de grande importncia, j que pode impactar em todo o restante do trabalho.


Uma coleta mal planejada pode provocar impresses erradas acerca da populao,
fornecendo valores que no a representam. A distoro de uma estatstica em
comparao com um parmetro populacional denominada vis. Voc poder
notar um exemplo clssico de amostragens enviesadas na poca das eleies.
Vrios candidatos apresentam resultados de pesquisas de inteno de voto, sendo
que cada uma tem um resultado diferente. Fique atento!

Na literatura sobre o assunto so diversos os mtodos de amostragem. Dentre


eles, os mais conhecidos so:

Amostragem de convenincia. Amostragem sistemtica.

Amostragem voluntria. Amostragem aleatria estratificada.

Amostragem aleatria simples. Amostragem por conglomerado.

Uma amostragem por convenincia geralmente ocorre quando o indivduo


seleciona na populao elementos que considera pertinentes, os quais imagina
serem representativos do todo. Essa conduta, estatisticamente falha, muitas vezes
a causadora de resultados muito divergentes dos verdadeiros parmetros da
populao. Vide exemplo das pesquisas eleitorais.

Na amostragem voluntria a amostra obtida por seleo de voluntrios.


Frequentemente vemos esse tipo de pesquisa sendo feita pela internet ou por
telefone. Pense um pouco... voc j respondeu a alguma enquete realizada por
esses canais? Foi sincero na resposta dada enquete? Se suas respostas foram
sim e no voc acaba de perceber a origem de um dos problemas desse tipo
de amostragem, a saber, o nvel de confiana nos dados coletados. Geralmente
as pessoas no esto dispostas a responder a pesquisas. Portanto, quando estas
so feitas com voluntrios os resultados obtidos devem ser tratados com muito
cuidado. Pode parecer, ento, que esse tipo de amostragem no deve nunca ser
empregado. Contudo, em muitos casos, essa a nica opo. Imagine que uma
empresa farmacutica queira testar um novo frmaco destinado preveno e ao
tratamento do HIV. Voc concordaria em fazer parte da pesquisa (considerando
que no possua a doena)? Imaginamos que no. Portanto, em casos como este,
no h outra opo seno amostragem por voluntrios.

A amostragem aleatria simples aquela realizada por meio de sorteio. Esse tipo
de amostragem tem a vantagem em relao s anteriores de garantir que todos os
elementos da populao tenham a mesma probabilidade de pertencer amostra.
Para realizar uma amostragem desse tipo tambm se pode utilizar uma tabela de
nmeros aleatrios, como a apresentada na pgina 146 do arquivo disponvel em
<http://www.est.ufpr.br/ce003/material/apostilace003.pdf>. (Acesso em: 29 abr.
2015). Para obter orientaes de como utilizar uma tabela de nmeros aleatrios,

68 Estatstica descritiva
U2

assista ao vdeo disponvel em <https://www.youtube.com/watch?v=UxgLkk-XuRQ>.


Acesso em: 23 maio 2016. Outra maneira de realizar uma amostragem aleatria
simples por meio de uma planilha eletrnica. Leia um pequeno tutorial de como gerar
nmeros aleatrios em planilhas no link <http://dicasdeexcel.com.br/2009/05/26/
como-gerar-numeros-aleatorios>. Acesso em: 29 abr. 2015. H ainda a possibilidade
de utilizar uma calculadora cientfica. Para obter orientaes de como gerar nmeros
aleatrios em uma calculadora, assista a um vdeo sobre o assunto em: <https://www.
youtube.com/watch?v=2fW92PRPwfQ>. Acesso em: 29 abr. 2015.

Uma amostra sistemtica pode ser feita facilmente quando h uma ordenao
natural dos elementos da populao, como a ordem alfabtica ou a sequncia
de casas em uma rua. Para retirar uma amostra sistemtica de tamanho n de uma
populao com N elementos, ordenados de 1 at N, seguimos os seguintes passos:

1. Dividimos a populao em n subgrupos de tamanho .

2. No primeiro subgrupo realizamos um sorteio (amostragem aleatria simples)


para determinar o primeiro elemento pertencente amostra. Suponha que
ele esteja na posio p k.

3. A partir do sorteio do passo anterior, os demais n 1 elementos pertencentes


amostra ficam determinados. Sero aqueles que estiverem nas posies:
p + k, p + 2k, p + 3k, ..., p +(n 1)k.

Exemplificando

Considere uma populao de 20 alunos da disciplina de Mtodos


Quantitativos, os quais esto listados a seguir em ordem alfabtica.

1 Alice 8 Isabella 15 Matheus


2 Arthur 9 Jlia 16 Miguel
3 Bernardo 10 Laura 17 Pedro
4 Davi 11 Lucas 18 Rafael
5 Gabriel 12 Luza 19 Sophia
6 Giovanna 13 Manuela 20 Valentina
7 Heitor 14 Maria

Selecione uma amostra sistemtica de tamanho 4 dessa populao.

Estatstica descritiva 69
U2

Resoluo:

Observe que essa populao tem tamanho N = 20 e a amostra


solicitada tem tamanho n = 4. Portanto, devemos dividir a populao
em 4 subgrupos de tamanho k = 20/4 = 5, como segue:

1 Alice 6 Giovanna 11 Lucas 16 Miguel


2 Arthur 7 Heitor 12 Luza 17 Pedro
3 Bernardo 8 Isabella 13 Manuela 18 Rafael
4 Davi 9 Jlia 14 Maria 19 Sophia
5 Gabriel 10 Laura 15 Matheus 20 Valentina

Nessa etapa necessrio que faamos um sorteio no primeiro grupo


para determinar o primeiro a pertencer amostra. Suponha que o
sorteado tenha sido o nmero p = 2, ou seja, Arthur. Desse modo, os
prximos a pertencerem amostra sero:

p + k = 2 + 5 = 7 Heitor
p + 2k = 2 + 2 5 = 12 Luza
p + 3k = 2 + 3 5 = 17 Pedro

A amostragem aleatria estratificada difere das anteriores, principalmente,


por envolver mais de uma etapa. Esse tipo de amostragem utilizado geralmente
nos casos em que a populao possui subgrupos com caractersticas prprias
que podem ser pertinentes pesquisa. Imagine que se queira pesquisar o gnero
musical preferido de uma populao. Convm supor que a preferncia possa
ser diferente de acordo com a idade da pessoa, pois em pocas diferentes as
tendncias musicais so outras e considerar toda a populao como um grupo
homogneo pode ser um erro para a coleta de dados. Desse modo, talvez seja
prudente dividir a populao em vrios grupos por faixa etria, por exemplo, de
0 a 9 anos, de 10 a 19 anos, de 20 a 40 anos e mais de 40 anos. Ateno: essa
apenas uma sugesto. Para determinar quais subdivises da populao devemos
considerar necessrio um estudo mais aprofundado.

Cada subgrupo considerado na amostragem aleatria estratificada recebe o


nome de estrato. A definio desses estratos, primeira etapa da amostragem,
feita de modo a se obter maior homogeneidade entre os seus elementos e maior
heterogeneidade entre os estratos. Na segunda etapa, retira-se uma amostra em
cada estrato, podendo este procedimento ser realizado por amostragem aleatria
simples, sistemtica ou outra que for mais adequada.

70 Estatstica descritiva
U2

Geralmente, na amostragem aleatria estratificada, o tamanho da amostra


retirada de cada estrato correspondente ao percentual que o estrato representa
em relao populao.

Exemplificando

Suponha que para determinada pesquisa seja necessrio dividir


a populao de 100 indivduos em dois estratos: os homens (45
indivduos) e as mulheres (55 indivduos). Se quisermos retirar uma
amostra estratificada de tamanho 20 dessa populao, quantos
homens e quantas mulheres teremos?

Resoluo:

Inicialmente calculamos a porcentagem que cada estrato representa


em relao ao total:

Estrato 1 (mulheres): = 55%


Estrato 2 (homens): = 45%
Desse modo, a amostra deve ser composta em 55% de mulheres e
45% de homens, ou seja:

Amostra do estrato 1: 55% 20 = 11 mulheres

Amostra do estrato 2: 45% 20 = 9 homens

Observe no exemplo anterior que, pelo fato de termos dividido a populao


em dois estratos (homens e mulheres), dentro de cada um os elementos so
homogneos (todos os elementos so do mesmo sexo), e, quando comparamos
os estratos entre si, eles so significativamente heterogneos, pois em um h s
mulheres e no outro, apenas homens.

A amostragem por conglomerado (tambm denominada amostragem por


cluster) um processo que, assim como a amostragem estratificada, envolve mais
de uma etapa. A diferena bsica entre essas duas que, enquanto a estratificada
busca dividir a populao em subgrupos cujos elementos sejam homogneos,
a por conglomerado divide a populao em subgrupos cujos elementos sejam
heterogneos. Cada subgrupo definido nesse tipo de amostragem, denominado
conglomerado (ou cluster), ser semelhante populao, o que implica a
semelhana entre os conglomerados.

Estatstica descritiva 71
U2

Aps definir os conglomerados (primeira etapa), geralmente se utiliza


amostragem aleatria simples para escolher quais faro parte da amostra (segunda
etapa). Em seguida, realiza-se um censo em cada conglomerado selecionado
(terceira etapa).

Exemplificando

A amostragem por conglomerado pode ser utilizada no caso de uma


empresa que possua vrias filiais. Espera-se que as filiais sejam semelhantes
entre si e semelhantes empresa como um todo. Considerando que
dentro de cada filial possa ser observada a mesma heterogeneidade que
no restante da empresa, temos uma situao semelhante teorizada para
esse tipo de amostragem.

Um procedimento padro seria considerar cada filial da empresa como


um conglomerado, realizando-se uma amostragem aleatria simples
para definir quais conglomerados sero recenseados.

Agora que voc j conhece alguns mtodos de amostragem, elabore um roteiro


para realizar a coleta de dados proposta na situao-problema do tpico DILOGO
ABERTO dessa seo de autoestudo. Aps a elaborao do roteiro, compare sua
proposta com a apresentada a seguir.

Roteiro para uma coleta de dados

Uma das etapas mais importantes de toda coleta de dados o planejamento.


Geralmente, ele pode ser feito por meio da determinao de um roteiro ou um
checklist. Para ter eficincia, esse roteiro deve ser elaborado e revisado a fim de
evitar falhas. Ao final, o pesquisador deve conferir se todas as etapas previstas no
roteiro foram concludas. Veja a seguir um possvel roteiro para uma coleta de
dados, exemplificado para o caso da empresa M, apresentada no incio dessa
seo de autoestudo:

1. Definir o objetivo da pesquisa. Exemplo: determinar o perfil dos funcionrios da


empresa M.

2. Definir as variveis e a populao de interesse. Exemplo: idade, peso, altura,


sexo, cor dos olhos, raa, satisfao em relao s condies de trabalho e
remunerao. A populao corresponde aos 30 mil funcionrios da empresa M.

72 Estatstica descritiva
U2

3. Definir o sistema de coleta. Exemplo: ser realizado um censo ou uma


amostragem? No caso de uma amostragem, qual mtodo ser utilizado?
Qual o tamanho da amostra? Quais so os meios de obteno dos dados
(telefonemas, questionrios, entrevistas, etc.)?

4. Coletar os dados. Nessa etapa necessrio que o pesquisador tome o cuidado


de no criar um vis. Exemplo: possvel que se tenha respostas enviesadas
realizando perguntas como: voc NO est feliz com o seu trabalho? Voc
acha que est ganhando POUCO? Perguntas com negativas ou com nfase em
determinados termos podem influenciar as respostas dos entrevistados.

5. Revisar os dados coletados. Essa etapa muito importante para a coleta, pois
possvel que sejam identificados erros que podem impactar todo o restante do
trabalho. Exemplo: determinado funcionrio da empresa M pode ter respondido
que seu nome Joo da Silva e tambm que do sexo feminino. Ser que essa
resposta verdica? Vale a pena conferir o processo para verificar possveis erros
de coleta.

Esperamos que at o momento voc tenha tido uma viso geral de como feita a
amostragem e sua importncia para a realizao de uma pesquisa. Vale ressaltar que
o explicitado aqui apenas uma noo bsica do processo. Existem livros inteiros
dedicados ao estudo desse tema e muitos materiais disponveis na internet.

Pesquise mais
Para se aprofundar nas tcnicas de amostragem, faa uma pesquisa
sobre o assunto. Algumas sugestes so:

Livros

BOLFARINE, Heleno; BUSSAB, Wilton de O. Elementos de


amostragem. So Paulo: Edgard Blucher, 2005.

SILVA, Nilza N. da. Amostragem probabilstica: um curso introdutrio.


2. ed. So Paulo: Editora da Universidade de So Paulo, 2004.

Internet


Receita Federal do Brasil: <http://www.receita.fazenda.gov.
br/manuaisweb/exportacao/topicos/conferencia-aduaneira/
verificacao-fisica/amostragem.htm>. Acesso em: 29 abr. 2015.

Tribunal de Contas da Unio: <http://portal2.tcu.gov.br/portal/pls/


portal/docs/2064402.PDF>. Acesso em: 29 abr. 2015.

Estatstica descritiva 73
U2

Sem Medo de Errar!

Vamos retomar a situao-problema do incio dessa seo de autoestudo e


personalizar um roteiro para a coleta de dados, incluindo detalhes especficos
como os propostos no tpico ROTEIRO PARA UMA COLETA DE DADOS.

1. Definir o objetivo da pesquisa.

O objetivo da pesquisa pode ser identificado na situao-problema proposta no


incio dessa seo de autoestudo: determinar o perfil dos 30 mil funcionrios da
empresa M.

2. Definir as variveis e a populao de interesse.

A tarefa qual voc foi incumbido especificava que o objetivo era determinar
o perfil dos funcionrios da empresa M. Para realizar essa tarefa, voc deveria
pesquisar idade, peso, altura, sexo, cor dos olhos, raa, satisfao em relao
s condies de trabalho e remunerao. Portanto, essas sero as variveis
de estudo. Para cada uma delas voc deve elaborar uma pergunta de forma
imparcial, por exemplo:

a) Qual a sua idade?

b) Qual o seu peso?

c) Qual a sua altura?

d) Qual o seu sexo?

e) Qual a cor de seus olhos?

f) Qual a sua raa?

g) Qual a sua satisfao em relao s condies de trabalho?

h) Qual a sua satisfao em relao sua remunerao?

Observe que algumas das perguntas anteriores deixam espao para respostas
muito amplas, a exemplo do item (g). Alguns funcionrios poderiam responder me
sinto bem, outros poderiam dizer apenas nota 10. Como comparar essas respostas
posteriormente? Nessa etapa do planejamento melhor incluir algumas restries
para as respostas para facilitar a anlise a posteriori. Algumas sugestes so:

74 Estatstica descritiva
U2

a) Qual a sua idade? ____ anos

b) Qual o seu peso? ____ kg (coloque valores inteiros)

c) Qual a sua altura? ____ centmetros

d) Sexo: ( ) Masculino ( ) Feminino

e) Cor dos olhos: ( ) Castanhos ( ) Azuis ( ) Verdes

f) Raa: ( ) Amarela ( ) Branca ( ) Indgena ( ) Parda ( ) Preta

g) De 0 (insatisfeito) a 10 (muito satisfeito), qual a sua satisfao em relao s


condies de trabalho?

( ) 0 ( ) 1 ( ) 2 ( ) 3 ( ) 4 ( ) 5 ( ) 6 ( ) 7 ( ) 8 ( ) 9 ( ) 10

h) De 0 (insatisfeito) a 10 (muito satisfeito), qual a sua satisfao em relao sua


remunerao?

( ) 0 ( ) 1 ( ) 2 ( ) 3 ( ) 4 ( ) 5 ( ) 6 ( ) 7 ( ) 8 ( ) 9 ( ) 10

A populao corresponde aos 30 mil funcionrios da empresa M.

3. Definir o sistema de coleta. Lembre-se de que para a situao proposta no


incio dessa seo de autoestudo o prazo estipulado para a pesquisa de
uma semana. Nesse caso, consideramos que fazer uma amostragem o mais
prudente, pois, devido ao tempo de coleta e quele que ainda ser gasto no
tratamento das informaes, realizar um censo seria invivel. Entretanto, essa
escolha ir depender de quais recursos esto disponveis, ficando a cargo do
pesquisador definir entre amostragem ou censo.

Em relao ao tipo de amostragem, vamos supor que na empresa M, 5% dos


funcionrios sejam gerentes, 15% possuam cargos administrativos e os 80%
restantes, cargos operacionais. Como a pesquisa pode ser influenciada pela
varivel cargo, o mais adequado realizar uma amostragem estratificada em que
os estratos gerentes, cargos administrativos e cargos operacionais possuam a
mesma representatividade na amostra tal qual observada na populao.

No entraremos em detalhes sobre o clculo do tamanho da amostra, pois


ele envolve conceitos ainda no trabalhados. Entretanto, para este exemplo,
vamos utilizar uma sugesto disponvel em <https://pt.surveymonkey.com/mp/
sample-size> com uma margem de erro de 10% para os resultados obtidos.
Voc poder verificar nesse link que o tamanho sugerido para a amostra 96.

Estatstica descritiva 75
U2

Resta ainda definir como sero coletados os dados. Novamente, isso ir


depender de quais recursos esto disponveis. Uma sugesto para pequenas
amostras a utilizao de um formulrio a ser enviado via internet. Um exemplo
de ferramenta gratuita para criao desse tipo de formulrio o Formulrios
Google. Veja mais informaes sobre este recurso em <https://www.google.
com/intl/pt-BR/forms/about>. Acesso em: 23 maio 2016.

4. Coletar os dados. No caso da utilizao da ferramenta sugerida anteriormente,


os formulrios podem ser enviados por e-mail. Entretanto, nessa etapa, o
pesquisador deve ficar atento se os indivduos selecionados para a amostra
realmente esto respondendo pesquisa.

5. Revisar os dados coletados. Com a ferramenta sugerida anteriormente, essa


etapa tende a ser gil, visto tambm que o tamanho da amostra pequeno.

Avanando na Prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com a de seus colegas.
1. Competncia de Conhecer os conceitos matemticos bsicos e proporcionar
fundamentos de rea o desenvolvimento do raciocnio lgico e quantitativo.
2. Objetivos de
Elaborar um roteiro para a realizao de uma pesquisa.
aprendizagem
3. Contedos
Amostragem.
relacionados

Suponha que uma companhia telefnica o contratou para


elaborar uma pesquisa de satisfao com os clientes acerca
4. Descrio da situao
do servio prestado. Elabore um roteiro para coleta de dados
problema
sabendo que a companhia possui 1 milho de clientes e
deseja realizar a pesquisa por amostragem com 1000 clientes.

76 Estatstica descritiva
U2

1. Definir o objetivo da pesquisa. Determinar a satisfao dos


clientes acerca do servio prestado pela companhia telefnica.

2. Definir as variveis e a populao de interesse. Como


no foram indicadas restries e o detalhamento acerca da
pesquisa foi pequeno, assumiremos que a empresa queira
saber apenas a satisfao de seus clientes (varivel de
interesse), sem outras informaes agregadas. A populao
corresponde a um milho de clientes da companhia.

3. Definir o sistema de coleta. Como os clientes devem constar


na base de dados da empresa, podemos considerar que
possvel gerar uma lista em ordem alfabtica com os nomes
e os telefones de cada um. Sendo assim, uma amostragem
sistemtica pode atender s necessidades, e o meio de coleta
5. Resoluo da situao das informaes ser o contato por telefone (algo natural
problema para uma empresa de telefonia). O tamanho da amostra j foi
definido anteriormente (1000 indivduos). Resta determinar o
que ser perguntado aos clientes. Novamente, pela ausncia
de detalhes, assumiremos que uma pergunta como Em uma
escala de 0 a 10, sendo 0 ruim e 10 timo, qual nota o(a)
senhor(a) atribuiria ao servio prestado por esta companhia?
seja suficiente para obter as informaes requeridas.

4. Coletar os dados. Empregar pessoal devidamente treinado


para realizar os contatos por telefone. Nessa etapa
interessante ressaltar que o treinamento dos entrevistadores
muito importante, pois se pode causar um vis.

5. Revisar os dados coletados. Havendo peculiaridade nos dados


coletados, eles podem ser revisados com base nas gravaes
telefnicas das entrevistas, caso esse recurso esteja disponvel.

Lembre-se

Populao: conjunto de todos os elementos que possuem determinada


caracterstica em comum.

Amostra: qualquer subconjunto de uma populao.

Varivel: determinada caracterstica que se deseja estudar em uma


populao ou amostra. Subdivide-se em: quantitativa discreta,
quantitativa contnua, qualitativa ordinal e qualitativa nominal.

Amostragem: processo de coleta de dados em um subconjunto da


populao, denominado amostra. Os principais tipos so: amostragem

Estatstica descritiva 77
U2

de convenincia, amostragem voluntria, amostragem aleatria


simples, amostragem sistemtica, amostragem aleatria estratificada, e
amostragem por conglomerado.

Faa voc mesmo

Rena-se com seus colegas e planejem a criao de uma eleio


(mesmo que fictcia) para presidente de turma. Aps a definio dos
candidatos, elaborem roteiros para pesquisas de inteno de voto,
explorando vrios mtodos de amostragem.

Realizem pelos menos duas pesquisas por amostragem (sistemtica


e aleatria simples, por exemplo) e depois realizem a eleio, em que
todos devem votar.

Ao final, comparem o resultado da eleio com os obtidos nas pesquisas


de inteno de voto, verificando qual mtodo obteve o resultado mais
representativo. Redijam um pequeno texto com as concluses.

Faa Valer a Pena!

1. Assinale a alternativa que apresenta caractersticas de censo.


a) Em uma linha de produo, uma em cada 50 peas inspecionada para
controle de qualidade.
b) A contagem da populao realizada pelo IBGE, em 2007, por questes de
custos, envolveu a coleta de dados em municpios de at 170 mil habitantes
e em mais 21 municpios com populao acima desta quantidade.
c) O Teste Rpido de HIV feito com a retirada de uma gota de sangue
do paciente. O sangue colocado em dois dispositivos de testagem. Em
caso de resultado positivo nos dois, o diagnstico j dado como certo.
d) Nas eleies municipais, a cada quatro anos, todos os eleitores so
obrigados a ir s urnas para votar em dois representantes, um candidato a
vereador e um candidato a prefeito.
e) Ultimamente algumas lojas tm instalado painis eletrnicos ou urnas
para que os clientes, caso queiram, possam deixar suas opinies sobre o
atendimento.

2. Assinale a alternativa que apresenta uma varivel quantitativa discreta.

78 Estatstica descritiva
U2

a) Altura.
b) Sexo.
c) Peso.
d) Velocidade.
e) Nmero de filhos.

3. Assinale a alternativa que apresenta uma varivel qualitativa nominal.


a) Cor dos olhos.
b) Escolaridade (Ensino Fundamental, Ensino Mdio, Ensino Superior).
c) Idade.
d) Classificao em uma corrida (Primeiro, Segundo, Terceiro, ...).
e) Cor da faixa de um judoca (Cinza, Azul, Amarela, Laranja, ...).

4. Para controle de qualidade, 10% das peas que saem de uma linha de
produo so inspecionadas. Para compor a amostra seleciona-se 1 em
cada 10, sempre na ordem em que so produzidas, ou seja, produzem-se 9
peas e retira-se a dcima; produzem-se mais 9 e a vigsima selecionada
para a amostra; e assim por diante. Essa amostragem do tipo:
a) convenincia.
b) aleatria simples.
c) sistemtica.
d) aleatria estratificada.
e) conglomerado.

5. Uma grande rede de lojas pretende consultar os consumidores de


determinada regio para determinar suas preferncias na hora de comprar
roupas. O foco dessa rede o mercado feminino, que corresponde a 70% de
seu faturamento. Os 30% restantes correspondem ao pblico masculino. Para
fazer essa consulta, que tipo de amostragem essa rede de lojas deve utilizar?
a) Amostragem por convenincia.
b) Amostragem aleatria simples.
c) Amostragem sistemtica.
d) Amostragem aleatria estratificada.
e) Amostragem por conglomerado.

Estatstica descritiva 79
U2

6. Conceitue populao e amostra.

7. Descreva as caractersticas de uma amostragem aleatria estratificada.

80 Estatstica descritiva
U2

Seo 2.2

Mtodos tabulares e mtodos grficos

Dilogo aberto

Nessa seo vamos dar continuidade ao estudo da estatstica descritiva. A


primeira etapa foi trabalhada na Seo 2.1, em que voc aprendeu alguns conceitos
bsicos de estatstica e os principais tipos de amostragem. Alm disso, foi abordada
a seguinte situao-problema: imagine que voc um funcionrio da empresa M
e que foi incumbido de realizar uma pesquisa para determinar o perfil dos 30 mil
funcionrios. O relatrio final dessa pesquisa dever conter informaes pessoais
como idade, peso, altura, sexo, cor dos olhos, raa e tambm informaes sobre
a satisfao em relao s condies de trabalho e remunerao. Considere que
o prazo estipulado para a realizao dessa tarefa seja uma semana.

Fizemos um planejamento da coleta de dados para a pesquisa da empresa M


e elaboramos um roteiro para a realizao de tal tarefa. Para continuar o trabalho,
vamos considerar que os dados j foram coletados, sendo a nossa tarefa agora
organiz-los, resumi-los e apresent-los.

Reflita

"Dados so fatos; em si no trazem grande significado; s depois que eles


forem, de alguma forma, agrupados ou processados que poderemos
ver o significado ser revelado".

Marcello Martinelli, professor associado da Universidade de So Paulo

No Pode Faltar!

Dados brutos

A coleta de dados planejada na Seo 2.1 ter como resultado fichas como a
exemplificada na Figura 2.4.

Estatstica descritiva 81
U2

Figura 2.4 | Exemplo de ficha-resposta da coleta de dados

N 1

26 anos.
a) Qual a sua idade? ____

74 kg (coloque valores inteiros).


b) Qual o seu peso? ____

174 centmetros.
c) Qual a sua altura? ____

d) Sexo: ( X ) Masculino ( ) Feminino.

e) Cor dos olhos: ( X ) Castanhos ( ) Azuis ( ) Verdes.

f) Raa: ( ) Amarela ( ) Branca ( ) Indgena ( X ) Parda ( ) Preta.

g) De 0 (insatisfeito) a 10 (muito satisfeito), qual a sua satisfao em relao s


condies de trabalho?

( ) 0 ( ) 1 ( ) 2 ( ) 3 ( ) 4 ( ) 5 ( ) 6 ( ) 7 ( X ) 8 ( ) 9 ( ) 10

h) De 0 (insatisfeito) a 10 (muito satisfeito), qual a sua satisfao em relao sua


remunerao?

( ) 0 ( ) 1 ( ) 2 ( ) 3 ( ) 4 ( ) 5 ( ) 6 ( X ) 7 ( ) 8 ( ) 9 ( ) 10
Fonte: O autor (2015).

Lembre-se de que no planejamento da coleta de dados com os funcionrios da


empresa M o tamanho pretendido para a amostra era 96. Com essa quantidade de
fichas em mos fica difcil inferir algo sobre o perfil dos funcionrios, pois os dados
no esto organizados, ou seja,
Figura 2.5 | Registro da ficha N 1 em uma
esto de forma bruta. Para facilitar planilha eletrnica
a visualizao, precisamos agrupar
os dados que se referem mesma
varivel e dispor as informaes de
um modo mais agradvel e intuitivo
para leitura e apresentao. Fonte: O autor (2015).

Uma maneira interessante de organizar os dados registrados nas fichas em


uma planilha eletrnica, pois ela permite uma manipulao simples e rpida dos
dados. Observe na Figura 2.5 uma possvel maneira de registrar as respostas obtidas
na ficha da Figura 2.1.

Observe na Figura 2.5 que indicamos o nmero da ficha para eventuais con-
ferncias, pois, em caso de dvidas, fica simples localiz-la. Veja tambm que,
para ficar sucinto, indicamos somente as letras para fazer correspondncia s per-

82 Estatstica descritiva
U2

guntas realizadas. Outra ttica utilizada Tabela 2.1 | Respostas recebidas na coleta de
foi registrar apenas as letras M e C para dados
Questo
representar as respostas Masculino e N (a) (b) (c) (d) (e) (f) (g) (h)
Castanhos. Note que na pergunta (f) 1 21 74 174 M C Parda 8 7

no pudemos utilizar essa estratgia, 2 21 93 176 F A Parda 5 4


3 25 86 171 F C Amarela 1 5
pois causaramos confuso entre as res- 4 27 83 179 F C Preta 4 5
postas Parda e Preta. 5 28 88 185 M C Preta 10 7
6 29 63 181 M C Amarela 5 4

Para tornar o processo de aprendiza- 7 31 60 177 M V Parda 5 5


8 35 58 163 F C Branca 5 4
gem mais simples, vamos supor que o ta- 9 37 84 180 F C Preta 4 4
manho da nossa amostra seja apenas 20 10 37 81 165 M C Branca 5 4
11 39 74 175 M C Parda 9 8
indivduos, cujas respostas dadas ao ques-
12 42 85 162 M C Indgena 7 7
tionrio esto apresentadas na Tabela 2.1. 13 43 60 165 M C Parda 3 4
14 47 67 170 M C Parda 4 3
15 48 81 162 M A Branca 2 4
16 51 85 165 F C Preta 5 3

Distribuio de frequncias 17 51 86 170 M A Branca 1 5


18 53 57 170 F C Branca 7 6
19 55 88 179 F C Parda 10 6
Geralmente, quando se estuda deter- 20 59 68 188 F A Branca 9 8
minado problema, procura-se conhecer Fonte: O autor (2015).
o comportamento das variveis envolvi-
das, observando a ocorrncia de seus valores na amostra para poder inferir algo a
respeito da populao. A Tabela 2.1 apresenta os dados de forma bruta, de modo
que no conseguimos extrair muita informao ao observ-la. Dessa maneira, para
podermos fazer algum tipo de inferncia, precisamos organizar os valores obtidos
para cada varivel de forma mais simples e de modo que uma rpida leitura possa
fornecer informaes que ainda esto ocultas.

Uma das maneiras mais utilizadas para organizar dados so as tabelas de dis-
tribuio de frequncias. Tabela 2.2 | Distribuio de frequncias da varivel idade na
Veja na Tabela 2.2 como amostra
podemos dispor os da- Faixa etria Frequncia Proporo Porcentagem
dos relativos idade da 20 | 30 6 0,30 30
amostra de funcionrios 30 | 40 5 0,25 25
da empresa M. 40 | 50 4 0,20 20
50 | 60 5 0,25 25
A notao 20 | 30 Total 20 1,00 100
indica que esto sendo Fonte: O autor (2015).

considerados os valores maiores ou iguais a 20 e menores que 30. Os demais so


interpretados de modo semelhante.

A coluna Frequncia da Tabela 2.2 (tambm denominada frequncia absolu-


ta) construda por contagem direta dos valores dispostos na coluna (a) da Tabela
2.1. As demais colunas exigem alguns clculos. Para calcular as:

Estatstica descritiva 83
U2

Propores (tambm conhecidas como frequncias relativas), dividimos as


frequncias absolutas pela soma de todas as frequncias.

Exemplo: 0,30 =

Porcentagens, multiplicamos as propores por 100%.

Exemplo: 30% = 0,30 100%

Ao observarmos a distribuio de frequncias da varivel idade, conseguimos


obter informaes que antes no estavam visveis. Por exemplo, podemos afirmar
que a faixa etria de 20 anos ou mais e menos de 30 anos corresponde a 30% dos
funcionrios, ou, ainda, que mais da metade dos funcionrios (30% + 25%) tm
menos de 40 anos.

Assimile

Para calcularmos uma proporo, dividimos a frequncia absoluta


correspondente pela soma de todas as frequncias.

Uma porcentagem calculada multiplicando uma proporo por 100%.

A Tabela 2.2 est organizada em intervalos de classe. Essa estratgia bastante


utilizada quando os valores obtidos so muito variados (no h repetio).

Exemplificando

Algumas vezes no Tabela 2.3 | Distribuio de frequncias da varivel


necessrio agrupar os nmero de ttulos em mundiais de futebol
valores obtidos de uma Nmero Frequncia Proporo Porcentagem
varivel em intervalos de de ttulos
1 3 0,375 37,5
classe, como o caso 2 2 0,250 25,0
da varivel nmero de 3 1 0,125 12,5
4 1 0,125 12,5
ttulos em mundiais de 5 1 0,125 12,5
futebol. At 2015, os Total 8 1,000 100,0
campees das 20 edies Fonte: FUTPDIA (2015).
do torneiro eram: Brasil (5 ttulos), Itlia (4 ttulos), Alemanha (4 ttulos),
Uruguai (2 ttulos), Argentina (2 ttulos), Frana (1 ttulo), Inglaterra (1
ttulo) e Espanha (1 ttulo). A distribuio de frequncias dessa varivel
pode ser observada na Tabela 2.3.

84 Estatstica descritiva
U2

Desafio: construa as distribuies de frequncias das demais variveis presentes


na Tabela 2.1 e compare sua resposta com a esperada no apndice da Seo 2.2.

Rol

Voc deve ter tido um pouco mais de trabalho para construir a tabela de
distribuio de frequncias da varivel peso se compararmos com o empenho
que seria necessrio para construir a Tabela 2.2. Isso se deve ao fato de os dados
referentes a essa varivel no estarem organizados do modo como esto os
referentes varivel idade (vide Tabela 2.1).

Como j foi mencionado, quando os dados esto desordenados, dizemos que


eles esto de forma bruta, a exemplo dos dados referentes varivel peso. Quando
os dados esto organizados em uma ordem crescente ou decrescente, dizemos
que eles esto em rol, como o caso dos dados relativos varivel idade.

Exemplificando

Organize o seguinte conjunto de dados em rol crescente e em rol


decrescente:

18 11 35 26 22 16

Resoluo:

Rol crescente: 11 16 18 22 26 35

Rol decrescente: 35 26 22 18 16 11

Assimile

Um rol uma organizao crescente ou decrescente de dados.

Grficos estatsticos

Alm de tabelas, tambm podemos representar informaes em grficos. Esse


tipo de representao tem forte apelo visual, sendo atrativo aos olhos dos leitores,
e, muitas vezes, pode dar uma ideia melhor da variabilidade de um conjunto de
dados do que uma tabela. So inmeros os tipos de representaes grficas tanto

Estatstica descritiva 85
U2

para variveis qualitativas


Figura 2.6 | Cor dos olhos da amostra de
quanto para quantitativas. funcionrios da empresa M
Abordaremos apenas os tipos mais
simples e caber a voc pesquisar
outras representaes e suas
particularidades.

Grficos para variveis


qualitativas

Um tipo particular de grfico


o de barras. Observe na Figura 2.6 Fonte: O autor (2015)

um exemplo desse tipo de grfico,


elaborado a partir da Tabela 2.1.

Num grfico de barras, o eixo horizontal denominado eixo das categorias e


o vertical, eixo das quantidades. Cada barra representa um dos valores assumidos
pela varivel (uma categoria). A altura da barra proporcional frequncia com que
determinada resposta aparece na amostra e a largura constante para todas as barras.

A construo de grficos de barras pode ser facilitada em papel milimetrado


ou em uma planilha eletrnica. Veja um vdeo tutorial de como utilizar uma
planilha para construo de um grfico de barras em <https://www.youtube.com/
watch?v=PrqDotQ7B54>. Acesso em: 23 maio 2016.

Outro tipo bastante utilizado de grfico o de setores, tambm conhecido


como grfico de pizza. So muito teis para visualizar a participao (frequncia)
de determinada categoria em relao ao todo. Esse tipo de grfico construdo
com base em um crculo dividido, a partir de seu centro, em quantas partes for o
nmero de valores possveis para a varivel em questo.

Na Figura 2.7 apresentado um grfico de setores construdo a partir da tabela


de distribuio de frequncias para a varivel raa, cuja construo foi proposta
anteriormente e que consta no apndice da Seo 2.2.

Cada setor de um grfico de pizza Figura 2.7 | Distribuio dosfuncionrios


corresponde a um possvel valor da varivel. da empresa M
Esse setor ter tamanho proporcional
participao desse valor em relao ao todo.
Essa participao fica facilmente visualizvel
quando observamos a coluna Porcentagem
da tabela de distribuio de frequncias. Veja
que os valores percentuais calculados para essa
coluna so apresentados no interior do grfico
de setores. Fonte: O autor (2015).

86 Estatstica descritiva
U2

Em determinadas situaes, a participao de certas categorias em relao ao


todo to pequena que convm agrupar seus valores em um nico setor para
facilitar a visualizao.

Exemplificando

Observe na Tabela 2.4 a quantidade de mandioca (em kg) produzida


pelos estados da regio Nordeste em 2006.

Tabela 2.4 | Produo de mandioca (em kg) na regio Nordeste


em 2006
UF Quantidade (em kg) Porcentagem
Pernambuco 2401684 30%
Alagoas 1479204 18%
Maranho 1315186 16%
Bahia 1246801 15%
Sergipe 685133 8%
Piau 394665 5%
Cear 426183 5%
Rio Grande do Norte 139452 2%
Paraba 82627 1%
Fonte: O autor (2015).

Para construir um Figura 2.8 | Participao dos estados


grfico de setores a partir na produo de mandioca da regio
dessa tabela, teramos Nordeste em 2006
problemas de visualizao,
pois alguns setores ficariam
muito pequenos. Em casos
como este, geralmente,
agrupam-se os setores
menores em um s,
denominado Outros. Veja
um exemplo na Figura 2.8.

Fonte: IBGE - Produo vegetal (2015).

Estatstica descritiva 87
U2

Grficos para variveis quantitativas


Figura 2.9 | Nmero de ttulos em
mundiais de futebol
Grficos de barra tambm so
bastante utilizados para representar
variveis quantitativas. Veja um exemplo
na Figura 2.9, construdo a partir da
Tabela 2.3.

Vale ressaltar que, quando se trata


de variveis quantitativas, a variedade
de representaes grficas maior. A
mesma informao apresentada na Figura Fonte: FUTPDIA (2015).

2.9 tambm poderia ser representada de


outras formas, como mostra a Figura 2.10.

Figura 2.10 | Nmero de ttulos em mundiais de futebol

(a) (b) (c)


Fonte: FUTPDIA (2015).

As representaes Tabela 2.5 | Distribuio de frequncias da varivel altura


da Figura 2.10 (a) e apresentada na Tabela 2.1
da Figura 2.10 (b) Altura Ponto
Frequncia Proporo Porcentagem
so denominadas (em cm) mdio
160 | 165 162,5 3 0,15 15
grficos de disperso.
165 | 170 167,5 3 0,15 15
Nesses exemplos, a 170 | 175 172,5 5 0,25 25
varivel em questo 175 | 180 177,5 5 0,25 25
discreta. Quando 180 | 185 182,5 2 0,10 10
trabalhamos com 185 | 190 187,5 2 0,10 10
variveis quantitativas Total - 20 1,00 100
contnuas precisamos Fonte: O autor (2015).
fazer uma adaptao para construir representaes semelhantes. Considere a
distribuio de frequncias para a varivel altura, cuja construo foi proposta
anteriormente e apresentada na Tabela 2.5 com alguns acrscimos.

Veja na Tabela 2.5 que foi acrescentada a coluna Ponto mdio. Nessa coluna
temos os:

88 Estatstica descritiva
U2

pontos mdios das classes, que so obtidos somando-se os valores


extremos e dividindo-se por 2.

O ponto mdio da classe servir


Figura 2.11 | Altura dos funcionrios da amostra
como representante na hora de da empresa M
construir uma representao
grfica. Veja na Figura 2.11 um
grfico de barras construdo a partir
da Tabela 2.5.

Outra maneira de representar


os dados da Tabela 2.5 por meio
de um histograma, o qual pode ser
Fonte: O autor (2015).
visto na Figura 2.12.

Em um histograma, cada barra possui a largura do intervalo da classe e


altura proporcional frequncia
Figura 2.12 | Altura dos funcionrios da amostra
correspondente. Uma das principais da empresa M
caractersticas do histograma que
suas barras so justapostas, ou seja,
grudadas umas s outras.

Para criar um histograma de


modo rpido e fcil, acesse o site
<http://www.socscistatistics.com/
descriptive/histograms/Default.
aspx> (Acesso em: 23 maio 2016) e
insira os dados relativos s alturas da
amostra, disponveis na Tabela 2.1.
Fonte: O autor (2015).

Ramos-e-folhas

A ideia geral ao se construir um grfico, seja de barras, disperso ou histograma,


determinar como os dados se distribuem. A linguagem simplificada e resumida
de um grfico de grande ajuda nessa tarefa.

Uma grande desvantagem ao construir uma representao grfica a perda de


informao dos dados originais. Para facilitar na visualizao da distribuio dos
dados e ainda no perder muita informao dos dados brutos, podemos utilizar
um diagrama de ramos-e-folhas.

Veja na Figura 2.13 um diagrama construdo a partir da Tabela 2.1 para a varivel
altura.

Estatstica descritiva 89
U2

Para compreender como 162 162 163 165 165 165 170
construdo um diagrama como esse,
170 170 171 174 175 176 177
vamos repetir no quadro ao lado
179 179 180 181 185 188
os dados relativos s alturas dos
funcionrios da amostra, organizados em rol e destacado o ltimo algarismo em cada
observao.
Figura 2.13| Diagrama de
Note que para construir o diagrama, traamos ramos-e-folhas para a varivel
uma linha vertical e: esquerda dessa linha dispo- altura
mos os dois primeiros algarismos das observaes;
16 2,2,3,5,5,5
direita dessa linha dispomos os ltimos algaris- 17 0,0,0,1,4,5,6,7,9,9
mos das observaes, separados por vrgula. 18 0,1,5,8

Analisando o diagrama da Figura 2.13 podemos Fonte: O autor (2015).


observar a distribuio dos valores (h prevalncia
de valores na classe do meio) e ainda mantivemos as informaes originais.

Exemplificando

Observe o diagrama de ramos-e-folhas da Figura


Figura 2.14 | Peso
2.14. de uma amostra
de 15 novilhos
Como poderamos escrever os dados desse
diagrama por extenso? 17 0,3,5,7
18 0,6,9
19 6,7,8
Resoluo: 20 3,4
21 1,5,5
170, 173, 175, 177, 180, 186, 189, 196, 197, 198,
Fonte: O autor (2015).
203, 204, 211, 215, 215

Em estatstica existem diversas normas para apresentao de dados em tabelas


e grficos. Determinados elementos so considerados "essenciais", e, quando
compem um desses objetos, preciso se atentar s normas. H tambm uma
maneira padro para a elaborao de uma tabela de distribuio de frequncias
agrupadas em intervalos de classe. Veja no link <http://www.ee.usp.br/graduacao/
ens435/modulo4/modulo4l.html> (Acesso em: 23 maio 2016) alguns dos elementos
considerados essenciais na apresentao de tabelas e grficos e no link <http://
www.fernandokb.pro.br/?p=201> (Acesso em: 23 maio 2016) a forma padro para a
construo de uma tabela de distribuio de frequncias.

90 Estatstica descritiva
U2

Pesquise mais
Alm dos tipos de grficos apresentados, existem diversos outros,
sendo que cada um possui uma caracterstica prpria que o faz
mais adequado para determinada situao. Para se aprofundar nesse
assunto, segue uma sugesto de leitura:

Suporte Office. Disponvel em: <https://support.office.com/pt-br/


article/Tipos-de-gr%C3%A1ficos-dispon%C3%ADveis-b22a8bb9-a673-
4d7f-b481-aa747c48eb3d?ui=pt-BR&rs=pt-BR&ad=BR>. Acesso em:
15 jul. 2015.

Sem Medo de Errar!

Relembrando a situao-problema proposta no incio da seo, vamos agora


nos preocupar com a apresentao dos dados da amostra apresentada na Tabela
2.1 e, para termos maior riqueza de detalhes,
vamos tratar apenas das variveis sexo e Figura 2.15 | Distribuio dos
funcionrios da empresa M (por sexo)
peso. As demais podem ser trabalhadas
de modo semelhante. Considerando essas
duas variveis, qual seria a melhor forma de
apresent-las? Com um grfico ou uma tabela?
Como seria essa apresentao?

Mtodos tabulares so aplicveis na maioria


das vezes, tanto para variveis qualitativas quanto
para quantitativas. Tm a vantagem de, em
geral, possuir maior riqueza de detalhes do que
uma representao grfica. Contudo, tabelas (a)
podem ser de difcil leitura, trabalho que pode
ser simplificado por meio de um grfico. Como
a construo das tabelas de distribuio de
frequncias para essas variveis j foi proposta Feminino
anteriormente (e consta no apndice dessa 45%
Masculino
seo), vamos apresentar os dados de forma 55%
grfica. Para isso, resta decidir qual tipo de grfico
mais adequado para cada uma.

Primeiramente, vamos tratar da varivel (b)


sexo, que qualitativa nominal. Nessa seo Fonte: O autor (2015).
foram mostrados dois tipos de grficos para
apresentao de dados relativos a esse tipo de varivel: o de barras e o de setores.
Ambos esto representados na Figura 2.15.

Estatstica descritiva 91
U2

Para que a representao grfica seja adequada, sempre devemos considerar


o objetivo do pesquisador. No existe uma rigidez quanto escolha do tipo de
grfico, mas vale observar as sugestes apresentadas nas leituras sugeridas no
Pesquise Mais!. Nesse exemplo, por questes estticas, consideramos como
mais adequado o grfico de setores, pois ele deixa visvel a participao da cada
categoria com relao ao todo.

Dando continuidade, a varivel peso quantitativa contnua. Para escolher uma


entre as representaes grficas apresentadas, so vlidas algumas observaes:

Grfico de barras: para elaborar um grfico desse tipo, temos que considerar a
mesma estratgia utilizada para elaborar o grfico da Figura 2.8, ou seja, determinar
o ponto mdio de cada intervalo de classe. Acreditamos que com isso perderamos
um pouco de informao.

Grfico de disperso: como no h muitos valores repetidos para a varivel


peso, um grfico desse tipo poderia ser de difcil leitura.

Grfico de setores: os dados esto agrupados na tabela de distribuio de


frequncias (veja apndice) em classes justapostas. Logo, um grfico de setores pode
no ser adequado ou pouco
Figura 2.16 | Peso dos funcionrios da empresa M
informativo para esse exemplo.

Considerando as
observaes anteriores e
a semelhana entre esse
exemplo e o apresentado na
Figura 2.12, conclumos que
a representao grfica mais
adequada um histograma,
que est representado na
Fonte: O autor (2015).
Figura 2.16.

AVANANDO NA PRTICA

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.

92 Estatstica descritiva
U2

1. Competncias
Conhecer os conceitos matemticos bsicos e proporcionar o
de fundamentos de
desenvolvimento do raciocnio lgico e quantitativo.
rea
2. Objetivos de
Expor dados da amostra por meio de grficos e tabelas.
aprendizagem
3. Contedos
Mtodos tabulares e mtodos grficos para apresentao de dados.
relacionados

O IMC (ndice de massa corprea) um indicador reconhecido pela


Organizao Mundial da Sade para dimensionar a relao entre
peso e altura de um indivduo. Para calcul-lo, dividimos o peso (em
kg) pela altura (em metros) ao quadrado, ou seja, .
Conhecendo-se o IMC, podemos utilizar a seguinte classificao1:
Menos de 18,5 Abaixo do peso
18,5 | 25,0 Peso adequado
4. Descrio da 25,0 | 30,0 Sobrepeso
situao problema 30,0 ou mais Obeso

De acordo com essas informaes e com base nos dados da


Tabela 2.1, construa:
Um grfico de barras duplas (horizontais) para as
variveis satisfao em relao s condies de
trabalho e remunerao.

Uma tabela de distribuio de frequncias para o IMC.

Estatstica descritiva 93
U2

Para construir o grfico de barras, vamos considerar os dados da


tabela de distribuio de frequncias para as variveis satisfao em
relao s condies de trabalho e remunerao, cuja construo
foi proposta anteriormente e cujos dados constam no apndice da
seo 2.2. Veja esse grfico na Figura 2.17.

Figura 2.17 | Satisfao em relao s condies de


trabalho e remunerao da amostra de funcionrios
da empresa M

5. Resoluo da Fonte: O autor (2015).


situao problema
Para construir a tabela de distribuio de frequncias, primeiro
precisamos calcular os IMCs.

Altura (em Peso (em Altura (em


N Peso (em kg) IMC N IMC
metros) kg) metros)
1 74 1,74 24,4 11 74 1,75 24,2
2 93 1,76 30,0 12 85 1,62 32,4
3 86 1,71 29,4 13 60 1,65 22,0
4 83 1,79 25,9 14 67 1,70 23,2
5 88 1,85 25,7 15 81 1,62 30,9
6 63 1,81 19,2 16 85 1,65 31,2
7 60 1,77 19,2 17 86 1,70 29,8
8 58 1,63 21,8 18 57 1,70 19,7
9 84 1,80 25,9 19 88 1,79 27,5
10 81 1,65 29,8 20 68 1,88 19,2

Agora, a partir desses dados, podemos construir a distribuio de


frequncias apresentada na Tabela 2.6.

Tabela 2.6 | Distribuio de frequncias do IMC


Classificao Frequncia Proporo Porcentagem
Abaixo do peso 0 0,00 0
Peso adequado 9 0,45 45
Sobrepeso 8 0,40 40
Obeso 3 0,15 15
Total 20 1,00 100
Fonte: O autor (2015).

94
96 Estatstica descritiva
U2

Lembre-se

Dados brutos so aqueles que no esto ordenados.

Uma tabela de distribuio de frequncias uma organizao tabular


que busca relacionar os possveis valores de uma varivel s frequncias
com que aparecem numa amostra.

Rol uma organizao crescente ou decrescente dos dados de uma


amostra.

Faa voc mesmo

Organize-se com seus colegas e pesquisem por amostragem a altura


dos alunos da turma. Depois, construa uma tabela de distribuio de
frequncias agrupadas em intervalos de classe e um histograma.

Por fim, compare sua resposta com a dos colegas.

FAA VALER A PENA!

1. Assinale a alternativa que contm dados organizados em rol.


a) 71, 88, 56, 65, 99 b) 95, 92, 75, 60, 44 c) 20, 56, 67, 53, 70
d) 32, 81, 59, 17, 38 e) 87, 62, 37, 76, 61

2. Com base nas informaes da Tabela 2.7 | Distribuio dos salrios dos
Tabela 2.7, assinale a alternativa funcionrios de uma empresa
que contm a sequncia de valores Faixa salarial Frequncia Porcentagem
x, y, z, w, nessa ordem.
1500 | 1700 320 x
a) 64, 24, 9, 3 1700 | 1900 110 y
b) 62, 24, 9, 5 1900 | 2100 45 z
2100 | 2300 25 w
c) 64, 22, 9, 5
Total 500 100
d) 60, 28, 9, 5 Fonte: O autor (2015).
e) 66, 21, 8, 5

3. Em determinado hospital foram realizados exames em diversos

Estatstica descritiva 95
U2

pacientes com suspeita de uma Figura 2.18 | Resultados dos exames realizados
doena. Os resultados foram
compilados no grfico da Figura
2.18.
Assinale a alternativa que contm
os dados brutos que deram
origem a esse grfico.
a) N,N,N,N,N,N,P,P,P,P,P,P,P,P,I,I
b) N,N,N,N,P,P,P,P,P,I Fonte: O autor (2015).

c) N,N,N,N,N,N,N,P,P,P,P,P,P,P,P,P,P,I
d) N,N,N,N,N,N,N,P,P,P,P,P,P,P,P,I,I,I
e) N,N,N,N,N,N,P,P,P,P,P,P,P,P,P,I,I,I

4. A Tabela 2.8 apresenta a distribuio da populao brasileira em 2010


por faixa etria.
Tabela 2.8 | Distribuio da populao brasileira em 2010
Com base nos dados da tabela,
assinale a alternativa correta. Faixa etria Frequncia (em milhes) Porcentagem
0 | 20 62,89 33,10
a) Metade da populao tinha
mais 40 anos. 20 | 40 x 33,30
40 | 60 y 22,60
b) Aproximadamente 30 60 ou mais z w
milhes de brasileiros tinham
Total 190,00 100,00
60 anos ou mais.
Fonte: O autor (2015).
c) Um tero da populao
tinha menos de 40 anos.
d) 18% da populao tinha 60 anos ou mais.
e) Mais de 63 milhes de brasileiros possuam entre 20 e 40 anos.

5. O histograma da Figura 2.19 mostra a Figura 2.19 | Salrios ganhos pelos


distribuio dos salrios ganhos pelos funcionrios de uma empresa
funcionrios de uma empresa.
Com base no histograma, assinale a
alternativa correta:
a) Seis funcionrios ganham at 3 salrios
mnimos.
b) Sete funcionrios ganham 5 salrios
mnimos ou mais.
Fonte: O autor (2015).

96 Estatstica descritiva
U2

c) 10% dos funcionrios ganham 6 salrios mnimos ou mais.


d) 25% dos funcionrios ganham menos de 2 salrios mnimos.
e) Metade dos funcionrios ganha mais de 4 salrios mnimos.
Tabela 2.9 | Populao brasileira por
6. A Tabela 2.9 mostra a quantidade de regio em 2010
habitantes no Brasil em 2010. Regio Populao (em milhes)
Norte 15,9
Elabore um grfico de setores a partir
Nordeste 53,1
da Tabela 2.9 e em cada setor indique a
Sudeste 80,4
porcentagem correspondente.
Sul 27,4
Centro-Oeste 14,1
Fonte: O autor (2015).

7. Elabore um diagrama de ramos-e-folhas a partir do conjunto de dados


a seguir.
132 259 188 573 540 458 663 780 614 937 872
170 312 223 601 559 535 687 782 645 953 895

Estatstica descritiva 97
U2

98 Estatstica descritiva
U2

Seo 2.3
Medidas de posio

Dilogo aberto

Na Seo 2.2, voc aprendeu sobre diferentes formas de apresentar


informaes, como as tabelas e os grficos. Vimos que as tabelas so teis para
organizar e resumir dados, mas que, em alguns casos, podem ser de difcil leitura
e interpretao. Nesse sentido, uma representao grfica pode ser mais fcil de
interpretar, resume ainda mais os dados e d uma ideia melhor da distribuio.

Existem ainda outras maneiras de resumir conjuntos de dados, que vo alm de


uma tabela ou um grfico. Ferramentas para esse fim so denominadas medidas
de posio, as quais buscam sintetizar um conjunto com um nico valor. So
exemplos de medidas de posio: a mdia aritmtica, a mediana e a moda.

Considere a Tabela 2.1 e imagine maneiras de representar os dados referentes


a cada varivel por um nico valor. Como voc faria isso? Que valor seria mais
adequado para cada conjunto?

Essas perguntas sero respondidas ao final dessa seo de autoestudo. Leia o


texto e se aprofunde no assunto com a sugesto de leitura do Pesquise mais!.
No deixe tambm de consultar outras bibliografias.

Reflita

"Estatstica: a cincia que diz que se eu comi um frango e tu no comeste


nenhum, teremos comido, em mdia, meio frango cada um."

Dino Segr, escritor italiano

No Pode Faltar!

Voc aprendeu anteriormente que dados brutos so aqueles que se apresentam


da maneira como foram coletados, ou seja, fora de ordem. Tambm vimos que ao
ordenar esses dados em ordem crescente ou decrescente estamos construindo

Estatstica descritiva 99
U2

um rol. Veja um exemplo:

Dados brutos: 18 42 31 26 21 24 20 90

Rol crescente: 18 20 21 24 26 31 42 90

Rol decrescente: 90 42 31 26 24 21 20 18

A construo de um rol o primeiro passo para a confeco de tabelas e


grficos. Entretanto, essa no sua nica utilidade. O rol ser de grande ajuda
na obteno de algumas medidas de posio. Estas, por sua vez, so valores que
buscam resumir ainda mais um conjunto de dados, mais at do que as tabelas e os
grficos. As medidas mais conhecidas que possuem essa finalidade so: a mdia
aritmtica, a mediana e a moda. Trataremos de cada uma mais adiante, mas antes
temos que adotar algumas notaes para simplificar a escrita.

Na Seo 2.2 atribumos valores s variveis estudadas na amostra de


funcionrios. Eram elas: idade, peso, altura, sexo, cor dos olhos, raa, satisfao
em relao s condies de trabalho e satisfao em relao remunerao. Para
no ser necessrio reescrever repetidamente os nomes dessas variveis, utilizamos
letras maisculas para represent-las, como a seguir:

A: idade B: peso C: altura

D: sexo E: cor dos olhos F: raa

G: satisfao em relao s condies de trabalho

H: satisfao em relao remunerao

Com essa padronizao, sempre que quisermos nos referir varivel


satisfao em relao s condies de trabalho, por exemplo, podemos escrever
simplesmente varivel G. Bem mais simples, no concorda?

Outro procedimento bastante utilizado enumerar os elementos de um


conjunto de dados, geralmente quando eles j esto organizados em rol. Para
exemplificarmos, considere a varivel definida a seguir:

X: idade dos leitores de uma revista

Admita que em uma pesquisa realizada para estudar a varivel X se tenham sido
obtidos os seguintes valores, j organizados em rol:

Dados da amostra: 18 20 21 24 26 31 42 90

Como os dados se referem varivel X, comumente simbolizamos cada um


pela letra x (minscula) acompanhada do ndice i, que indica a posio que o valor
aparece no rol. O quadro a seguir resume essa associao.

100 Estatstica descritiva


U2

Posio no rol (i) 1 2 3 4 5 6 7 8


xi 18 20 21 24 26 31 42 90

Ao escrevermos o smbolo x3, por exemplo, estamos nos referindo ao valor obtido
para a varivel X que ocupa a posio i = 3 (terceira posio) do rol, isto , x3 = 21.

No quadro anterior foram apresentados oito valores obtidos a partir de uma


amostra. Essa quantidade geralmente simbolizada pela letra n (minscula). Nesse
caso, temos que n = 8 o tamanho da amostra.

Ateno!

Na continuidade dessa seo, com frequncia os conjuntos de dados


sero apresentados em rol crescente para facilitar a compreenso das
medidas de posio. Entretanto, fique atento ao trabalhar com os dados
brutos em outras situaes, pois voc ter, primeiro, que organiz-los em
ordem crescente ou decrescente para calcular algumas dessas medidas.

Mdia aritmtica

A mdia aritmtica (ou simplesmente mdia) corresponde diviso da soma de


todos os valores de um conjunto de dados pela quantidade de valores desse conjunto.
Se um conjunto tiver n valores, {x1, x2, x3, ..., xn }, sua mdia ser simbolizada por:

Exemplificando

Calcule a mdia do seguinte conjunto de dados:

18 20 21 24 26 31 42 90

Resoluo:

Estatstica descritiva 101


U2

Leitura dos smbolos:

: x barra

: soma dos valores de x

A mdia uma das mais importantes medidas de posio. Veja que o conjunto
de dados do exemplo anterior corresponde ao da amostra da varivel X apresentada
anteriormente. O resultado obtido nesse exemplo nos indica que, em mdia, os
leitores da referida revista possuem 34 anos. Pergunta: o valor 34 descreveu bem
o conjunto de dados? Por qu?

A resposta esperada para essa pergunta seria no. A mdia aritmtica uma
medida fortemente influenciada por valores extremos (muito baixos ou muito
altos), motivo que nos leva, quase sempre, a no a utilizar sozinha para descrever
um conjunto. Em inmeros casos essa medida utilizada conjuntamente com
outras, como a mediana e medidas de disperso (que medem a variabilidade de
um conjunto). Quando o conjunto de valores mais homogneo, a mdia cumpre
eficientemente o papel de descrev-lo, como no exemplo a seguir.

Conjunto: 82 82 83 83 83 84 84; Mdia: = 83

Dizer que nesse conjunto os valores so, em mdia, 83, no longe do esperado.

Mdia aritmtica ponderada

Considere a Tabela 2.10 que apresenta as notas de um aluno nas 4 avaliaes


de uma disciplina.

Tabela 2.10 | Notas de um aluno


Avaliao Trabalho 1 Prova 1 Trabalho 2 Prova 2
i 1 2 3 4
Peso (pi) 3 7 4 6
Nota (xi) 9,0 8,0 8,5 7,0
Fonte: O autor (2015).

Como determinar a mdia final do aluno, visto que cada avaliao tem
importncia diferente? Em situaes como essa, em que alguns elementos de
um conjunto tm mais importncia do que outros, costuma-se utilizar a mdia
ponderada para resumir os dados.

A mdia aritmtica ponderada ( ) de um conjunto de dados calculada ao


multiplicarmos os nmeros por seus respectivos pesos e dividirmos a soma desses
produtos pela soma dos pesos. Para o exemplo anterior, temos:

102 Estatstica descritiva


U2

Portanto, a mdia final do aluno na disciplina 7,95 pontos.

Simbolicamente, representamos a mdia ponderada de x1, x2, ..., xn valores


cujos pesos so, respectivamente, p1, p2, ..., pn , por

Exemplificando

Considere que em um concurso os candidatos devam realizar trs


testes: conhecimentos gerais (CG), Tabela 2.11 | Pontuao dos
conhecimentos especficos (CE) e aptido candidatos em um concurso
fsica (AF), sendo que cada etapa possui Teste CG CE AF
um peso diferente. Na Tabela 2.11 esto Peso 2 5 3
os resultados obtidos por dois candidatos. Marcio 10,0 5,0 9,0
Se para ser aprovado necessrio obter Lucas 8,0 9,0 7,0
Fonte: O autor (2015).
nota final igual a 8 ou superior, qual dos
candidatos foi aprovado?

Resoluo:

Efetuamos os clculos das mdias:

Marcio:

Lucas:

Portanto, o candidato aprovado Lucas.

Mediana

Considere a varivel Y como sendo os salrios dos funcionrios de uma


empresa e que os valores amostrados para essa varivel foram: 840 860 790
780 1800 880 2800. A mdia dos salrios = 1250, contudo, ao afirmar
isso no descrevemos o quadro de salrios satisfatoriamente, visto que grande
parte dos valores prxima de 800 reais. Em casos como este, a mediana pode
ser uma boa opo para descrever o conjunto.

A mediana (ou valor mediano) de um conjunto de dados corresponde ao valor

Estatstica descritiva 103


U2

central de um rol. Para calcul-la temos de considerar dois casos: (1) quantidade
mpar de valores no conjunto; (2) quantidade par de valores no conjunto.

1 caso: quantidade mpar de valores no conjunto

No caso da amostra colhida para a varivel Y, considere o seguinte rol:

i 1 2 3 4 5 6 7
yi 780 790 840 860 880 1800 2800

Como n = 7 (mpar), a mediana (simbolizada por Md) corresponde ao valor


que ocupa a posio i = (n + 1)/2 = (7 + 1)/2 = 4, ou seja, Md = 860. Veja que
abaixo e acima de 860 temos 3 valores, isto , a mediana divide o rol ao meio, em
que metade dos valores menor ou igual mediana e a outra metade maior ou
igual mediana.

Afirmar que o salrio mediano dos trabalhadores da referida empresa 860


reais corresponde melhor a uma descrio do conjunto do que a mdia.

2 caso: quantidade par de valores no conjunto

Considere Z o nmero dirio de visitantes em um museu e a amostra coletada


para essa varivel como sendo o conjunto: 80 73 92 98 160 77. Nesse
caso, temos n = 6 (par) elementos na amostra. Ao organizar os dados em rol,
obtemos:

i 1 2 3 4 5 6
zi 73 77 80 92 98 160

Observe que agora no temos um nico valor no centro do rol, mas dois deles. Um
dos valores est localizado na posio i = n/2 = 6/2 = 3 e o outro na posio i = n/2
+ 1 = 6/2 + 1 = 3 + 1 = 4. Para representar a mediana nesse caso, utilizamos a mdia
aritmtica dos dois valores centrais, ou seja, Md = (z3 + z4 )/2 = (80 + 92)/2 = 86.

Exemplificando

Calcule a mediana dos valores amostrados das variveis X e Y


apresentados a seguir.

i 1 2 3 4 5 6 7 8
xi 102 103 135 144 148 159 160 166
yi 413 484 495 543 558 565 580 -

O smbolo (-) indica que o dado ausente.

104 Estatstica descritiva


U2

Resoluo:

Observe que o tamanho da amostra da varivel X nx = 8 (par) e o


tamanho da amostra para Y ny = 7 (mpar). Assim, para calcular a
mediana de X (Mdx) temos que utilizar o 2 caso e para a mediana de Y
(Mdy) o 1 caso, como segue:

- mediana de X:

primeira posio central

segunda posio central

- mediana de Y:

posio central

Moda

O que lhe vem cabea quando falamos a palavra moda? Aquela roupa
descolada que bastante gente est usando? Pois bem, em estatstica essa palavra
tem um sentido semelhante.

A moda, simbolizada por Mo, o valor com maior frequncia em um conjunto


de dados. Lembra-se da tabela apresentada na seo 2.2 que continha os dados
referentes amostra de 20 funcionrios da empresa M (veja Tabela 2.1)? Os dados
referentes varivel raa (F) esto reproduzidos a seguir.

Parda Parda Amarela Preta Preta Amarela Parda Branca Preta


Branca Parda Indgena Parda Parda Branca Preta Branca Branca
Parda Branca
Tabela 2.12 | Distribuio de frequncias da varivel F
A distribuio de frequn-
cias desse conjunto de dados Raa Frequncia Proporo Porcentagem
apresentada na Tabela 2.11. Amarela 2 0,10 10
Como pode ser observado na Branca 6 0,30 30
coluna Frequncia, o valor Indgena 1 0,05 5
que teve a maior frequncia Parda 7 0,35 35
foi Parda. Portanto, para este Preta 4 0,20 20
exemplo, Mo = Parda.
Total 20 1,00 100
Fonte: O autor (2015).

Estatstica descritiva 105


U2

A moda uma medida de posio indicada tanto para variveis quantitativas


quanto para qualitativas, como o caso da varivel raa. Isso no ocorre, por
exemplo, com a mdia e a mediana, que so medidas indicadas somente para
variveis quantitativas.

Quando os possveis valores de uma varivel aparecem em igual nmero de


vezes em uma amostra (tm a mesma frequncia), dizemos que o conjunto
amodal, isto , no possui moda. Tambm podemos classificar os conjuntos em
unimodais (uma moda), bimodais (duas modas), trimodais (trs modas) e multi-
modais (quatro ou mais modas).

Assimile

A mdia aritmtica, a mediana e a moda so medidas que buscam


resumir um conjunto de dados em um nico valor.

Para calcular a mdia aritmtica, adicionamos todos os valores e


dividimos o resultado pela quantidade de valores adicionados. Se a
mdia aritmtica for ponderada, devemos levar em considerao os
respectivos pesos.

A mediana divide o conjunto de dados ao meio. Ela corresponde


ao valor central em um rol, se a quantidade de valores for mpar, e
mdia aritmtica dos dois valores centrais, se a quantidade for par.

A moda o valor com maior frequncia em um conjunto.

Pesquise mais
Apresentamos aqui os clculos de algumas medidas de posio para
dados no agrupados em classes. Essas mesmas medidas podem ser
utilizadas tambm para dados agrupados (em tabelas de distribuio
de frequncias). Para conhecer o clculo dessas medidas para dados
agrupados e outras medidas de posio, como as separatrizes,
sugerimos a seguinte leitura complementar:

Descrio de amostras. Disponvel em: <http://www.ufpa.br/dicas/


biome/bioamos.htm>. Acesso em: 15 jul. 2015.

106 Estatstica descritiva


U2

Sem Medo de Errar!

Vamos relembrar as questes feitas no incio dessa seo de autoestudo:


considerando a Tabela 2.1, como representar os dados referentes a cada varivel
por um nico valor? Que valor seria mais adequado para cada conjunto?

Trataremos aqui das variveis A (idade) e D (sexo). O tratamento das demais ser
proposto na seo AVANANDO NA PRTICA.

Varivel A

Iremos utilizar a mdia aritmtica e a mediana para descrever as idades. Para


calcular a mdia, efetuamos:

Logo, os funcionrios da empresa tm, em mdia, 39 anos, aproximadamente.


Para o clculo da mediana, observe que o conjunto possui n = 20 (par) valores.
Portanto, a mediana corresponder mdia aritmtica dos elementos nas posies:

Assim, . Conclumos ento que


a mediana das idades 38 anos. Observe que a mediana e a mdia, sozinhas,
no descrevem muito bem o conjunto de dados. Isso ocorre porque h muita
variabilidade. Temos funcionrios com 21 anos e outros com 59. Veremos na seo
2.4 que h ferramentas que auxiliam as medidas de posio a descrever o conjunto.
Por enquanto nos limitaremos a apresentar estes valores como descrio.

Varivel D

Para descrever os dados referentes varivel D no podemos utilizar a mdia


e a mediana, visto que essa varivel qualitativa. Nos resta ento utilizar a moda.
Repetimos aqui os dados para contabilizar as frequncias:

MFFFMMMFFMMMMMMFMFFF

Observe que temos 11 funcionrios do sexo masculino e 9 do sexo feminino,


resultando em Mo = M, ou seja, a maioria dos funcionrios do sexo masculino.

Estatstica descritiva 107


U2

Avanando na Prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.
1. Competncias
Conhecer os conceitos matemticos bsicos e proporcionar o de-
de fundamentos
senvolvimento do raciocnio lgico e quantitativo.
de rea
2. Objetivos de
Resumir dados por meio de uma medida de posio
aprendizagem
3. Contedos
Medidas de posio
relacionados

Considerando os dados apresentados na Tabela 2.1, calcule:


4. Descrio - o peso mdio;
da situao - a altura mediana;
problema - a cor dos olhos e a raa de maior frequncia;
- a moda dos dados referentes s variveis G e H.
- Peso mdio

Para calcular a mdia dos pesos efetuamos:

Portanto, o peso mdio dos funcionrios aproximadamente 76


quilogramas.

- Altura mediana

Para calcular a mediana, primeiro precisamos construir um rol, como


a seguir:
5. Resoluo da
situao problema 162 162 163 165 165 165 170 170 170 171 174 175
176 177 179 179 180 181 185 188

Como n=20 (par), a mediana corresponder mdia dos valores nas


posies:

Assim, . Conclumos
que a altura mediana aproximadamente 173 centmetros.

- Cor dos olhos e raa de maior frequncia

108 Estatstica descritiva


U2

Para determinar a moda de cada conjunto de dados utilizaremos as


tabelas de distribuio de frequncias, cuja construo foi proposta na
seo 2.2 e cujo gabarito consta no apndice.

O valor modal para a: cor dos olhos foi Castanhos com porcentagem
igual a 75%; raa foi Parda com porcentagem igual a 35%.

- Moda dos dados referentes s variveis G e H

Para determinarmos a moda de cada conjunto, primeiro construmos


um rol, como a seguir:

Varivel G: 1 1 2 3 4 4 4 5 5 5 5 5 5 7 7 8
9 9 10 10

Varivel H: 3 3 4 4 4 4 4 4 4 5 5 5 5 6 6 7
7788

Com o rol disponvel podemos observar que o valor de maior frequncia


em cada caso 5 e 4, para as variveis G e H, respectivamente.

Lembre-se

Para calcular a mdia aritmtica, adicionamos todos os valores e


dividimos o resultado pela quantidade de valores adicionados. Se a
mdia aritmtica for ponderada, devemos levar em considerao os
respectivos pesos.

A mediana divide o conjunto de dados ao meio. Ela corresponde ao


valor central em um rol, se a quantidade de valores for mpar, e mdia
aritmtica dos dois valores centrais, se a quantidade for par.

A moda o valor com maior frequncia em um conjunto.

Faa voc mesmo

Na Seo 2.2, no tpico Faa voc mesmo, foi proposto que, junto
com seus colegas, voc pesquisasse a altura dos alunos da turma.
Aproveite os dados coletados nessa pesquisa e calcule a mdia e a
mediana do conjunto. Tambm classifique o conjunto com relao
quantidade de modas e indique os valores modais.

Estatstica descritiva 109


U2

Faa Valer a Pena!

1. Assinale a alternativa que contm o conjunto com a maior mdia.


a) 409 337 104
b) 131 115 302
c) 395 404 369
d) 250 432 1562
e) 258 156 223

2. Assinale a alternativa que contm a mdia aritmtica do conjunto de da-


dos sintetizado no diagrama de ramos-e-folhas ao lado.
a) 138
b) 139
c) 140
d) 141
10 8,8
e) 142
11 6
12 0,7
3. Observe o seguinte conjunto de dados. 13 1,1
14 4
12 27 16 42 16 23 41 25
15 0,8,8,9,9
Com relao mdia, mediana e moda do 16 4,7
conjunto anterior, assinale a alternativa correta:
a)
b)
c)
d)
e)

4. Observe a Tabela 2.13 em que constam as idades de 20 crianas que


participam de um projeto social.
Assinale a alternativa que contm a mdia e a mediana das idades das
crianas.

110 Estatstica descritiva


U2

Dica: escreva o rol correspondente Tabela 2.13 | Distribuio de frequncias


distribuio de frequncias. Idade Frequncia Proporo Porcentagem
a) e 7 4 0,20 20
8 4 0,20 20
b) e
9 5 0,25 25
c) e 10 3 0,15 15
d) e 11 3 0,15 15
e) e 12 1 0,05 5
Total 20 1,00 100
Fonte: O autor (2015).

5. Em uma turma de 40 alunos h alguns com 20 anos, 21 anos, 24


anos e ainda outros com 28 anos. A quantidade de alunos com cada
uma dessas idades apresentada na Figura 2.20.
Assinale a alternativa que contm a mdia das idades dos alunos dessa turma.
a) 24,2 anos Figura 2.20 | Distribuio das idades

b) 24,0 anos
c) 22,0 anos
d) 24,4 anos
e) 22,4 anos

Fonte: O autor (2015).

6. Calcule a mdia, a mediana e a moda do seguinte conjunto de dados.


1122233334
4455666667
7777889999
Depois, classifique o conjunto com relao quantidade de modas.

7. Considere o seguinte conjunto de dados:


1932 y 1596 1649 1597
Calcule o valor de y sabendo que a mdia do conjunto 1646.

Estatstica descritiva 111


U2

112 Estatstica descritiva


U2

Seo 2.4
Medidas de disperso

Dilogo aberto

Vimos na seo anterior que existem maneiras ainda mais sintticas de resumir
um conjunto de dados do que as tabelas e os grficos. Tais mtodos envolvem a
obteno de um nico valor (ou poucos valores) para representar todo o conjunto,
valor esse que denominamos medida de posio. As medidas que estudamos
foram a mdia aritmtica, a mdia aritmtica ponderada, a mediana e a moda.

No exemplo apresentado na seo SEM MEDO DE ERRAR! constatamos


que nem sempre uma medida como a mdia representa significativamente um
conjunto. Isso tambm pode ser observado nos conjuntos a seguir:

1 conjunto: 90 90 90 90 90

2 conjunto: 86 88 90 92 94

3 conjunto: 30 60 90 120 150

Os conjuntos possuem mdia e mediana iguais a 90 (calcule!), entretanto,


apenas para os dois primeiros esse valor representativo. Aqui surgem alguns
questionamentos: quando uma mdia representativa em um conjunto? Quais
ferramentas podem ser utilizadas para auxiliar as medidas de posio na descrio
de um conjunto de dados?

Para auxiliar as medidas de posio na descrio de um conjunto utilizamos


as medidas de disperso. Essas medidas buscam dimensionar quanto os dados
esto distantes da mdia, por exemplo. Com o auxlio delas podemos decidir, por
exemplo, se a mdia pode ser utilizada como representante de um conjunto.

No decorrer dessa seo buscaremos responder aos questionamentos


anteriores e, mais especificamente, decidir se a mdia adequada para resumir
os dados referentes aos funcionrios da empresa M (apresentados na Tabela 2.1) e
quantificar a variabilidade de cada conjunto de dados.

Estatstica descritiva 113


U2

Reflita

"Disperso (ou variabilidade) de um conjunto refere-se maior ou


menor diversificao dos valores de uma varivel em torno de um valor
de tendncia central tomado como ponto de comparao".

Carlos Augusto de Medeiros, chefe da Unidade de Administrao Geral


da Fundao Universidade Aberta do Distrito Federal

No Pode Faltar!

Desvio

Vamos considerar os dados do 1, 2 e 3 conjuntos apresentados anteriormente


como sendo provenientes de censo das variveis X, Y e Z, respectivamente.
Denominamos desvio a diferena de um valor do conjunto com relao mdia.
Para os conjuntos de dados apresentados anteriormente, temos os desvios
calculados na Tabela 2.14 (lembre-se de que ).

Tabela 2.14 | Desvios dos conjuntos de dados


Valores do conjunto Desvios
i xi yi zi
1 90 86 30 90 90 = 0 86 90 = 4 30 90 = 60
2 90 88 60 90 90 = 0 88 90 = 2 60 90 = 30
3 90 90 90 90 90 = 0 90 90 = 0 90 90 = 0
4 90 92 120 90 90 = 0 92 90 = 2 120 90 = 30

5 90 94 150 90 90 = 0 94 90 = 4 150 90 = 60
Total x = 450 y = 450 z = 450
Fonte: O autor (2015).

Observe que para as amostras das variveis X, Y e Z a soma de todos os desvios


igual a zero. Isso no ocorre somente para estes conjuntos, mas para todos os
conjuntos de dados. Desse modo, qualquer tentativa de utilizar a soma dos desvios
para dimensionar a variabilidade dos dados ser frustrada. Isso ocorre
pois os desvios negativos neutralizam os positivos, tornando o total igual a zero.

Para driblar esse contratempo, os estatsticos se utilizam de um artifcio


matemtico, o valor absoluto.

114 Estatstica descritiva


U2

Assimile

O valor absoluto de um nmero corresponde distncia que este se


encontra do 0 (zero). A distncia sempre um valor positivo ou zero.
Na prtica, o valor absoluto de um nmero: (a) negativo ele prprio
com sinal trocado; (b) no negativo ele prprio. Exemplos:

O valor absoluto de:

1, simbolizado por | 1 | igual a 1, ou seja, | 1 | = 1;


2, simbolizado por |2| igual a 2, ou seja, |2| = 2;

0, simbolizado por |0| igual a 0, ou seja, |0| = 0.

Utilizando o valor absoluto, podemos refazer os clculos como na Tabela 2.15.

Tabela 2.15 | Valores absolutos dos desvios


Valores do conjunto Valor absoluto dos desvios
i xi yi zi
1 90 86 30 0 4 60
2 90 88 60 0 2 30
3 90 90 90 0 0 0
4 90 92 120 0 2 30
5 90 94 150 0 4 60
Total x = 450 y = 450 z = 450
Fonte: O autor (2015).

Tambm podemos simbolizar a soma dos valores absolutos dos desvios


por , sem o acrscimo do ndice i. Com a construo da Tabela 2.15,
definimos nossa primeira medida de disperso.

Desvio mdio

Desvio mdio, simbolizado por Dm, uma medida de disperso calculada por
meio da mdia aritmtica dos valores absolutos dos desvios. Para as variveis X, Y
e Z, temos:

Estatstica descritiva 115


U2

Ateno!

Quanto menor o desvio mdio, menor a disperso; quanto maior o desvio


mdio, maior a disperso dos dados. O menor desvio mdio possvel 0
(zero) e ocorre quando os dados so totalmente homogneos.

Outra maneira de neutralizar o efeito do sinal negativo ocorrido na Tabela 2.14


elevar cada desvio ao quadrado, como mostra a Tabela 2.16.

Tabela 2.16 | Quadrado dos desvios


i ( )2 ( )2 ( )2
1 02 = 0 (4)2 = 16 (60)2 = 3600
2 0 =0
2
(2) = 4
2
(30)2 = 900
3 02 = 0 02 = 0 02 = 0
4 02 = 0 22 = 4 302 = 900
5 02 = 0 42 = 16 602 = 3600
Total ( )2 = 0 ( )2 = 40 ( )2 = 9000
Fonte: O autor (2015).

A partir da Tabela 2.16 definimos nossa segunda medida de disperso.

Varincia

A varincia, simbolizada por Var, uma medida de disperso calculada por meio
da mdia aritmtica dos quadrados dos desvios. Para as variveis X, Y e Z, temos:

Imagine que os valores observados para as variveis X, Y e Z sejam idades.


Quando elevamos os desvios ao quadrado para o clculo da varincia, obtemos
um valor que, teoricamente, tem unidade de medida idade2 (idade ao quadrado).
Como isso pode causar confuso e dificuldade de interpretao, definimos a
terceira medida de disperso.

116 Estatstica descritiva


U2

Ateno!

A frmula apresentada para o clculo da varincia utilizada somente


quando os dados so provenientes da populao, ou seja, quando
a coleta de dados feita por meio de censo. No caso de uma
amostragem, a varincia do conjunto calculada por meio da frmula

Desvio padro

O desvio padro, simbolizado por Dp, uma medida de disperso definida


como a raiz quadrada da varincia. Para as variveis X, Y e Z, temos:

Ateno!

Ao calcularmos o desvio padro retornamos unidade de medida do


conjunto de dados, ou seja, se o conjunto de dados medido em:

idade, a varincia medida em idade2 e o desvio padro medido


em idade;

m (metros), a varincia medida em m2 e o desvio padro medido


em m;

R$ (reais), a varincia medida em R$2 e o desvio padro medido


em R$.

As medidas apresentadas at aqui esto de forma absoluta (no percentual). Por


esse motivo, ao calcul-las nem sempre conseguimos inferir muita coisa sobre a
disperso de um conjunto de dados. Por exemplo, o valor muito ou
pouco? Se no tivermos outro valor para que possamos compar-lo fica difcil fazer
alguma afirmao. Por causa disso, definimos nossa quarta medida de disperso.

Estatstica descritiva 117


U2

Coeficiente de variao

O coeficiente de variao, simbolizado por CV, uma medida de disperso


definida como a razo entre o desvio padro e a mdia de um conjunto de dados.
Para as variveis X, Y e Z, temos:

Tambm podemos indicar os valores de forma percentual, como a seguir:

O coeficiente de variao permite uma comparao do desvio padro com a


mdia do conjunto de dados. Por exemplo, o desvio padro de Y corresponde a
3,1% do valor mdio do conjunto; o desvio padro de Z corresponde a 47,1% do
valor mdio do conjunto. Alguns autores cos- Tabela 2.17 | Classificao de um
tumam utilizar o coeficiente de variao para conjunto de dados
classificar um conjunto de dados quanto dis- Classificao Critrio
perso dos valores em torno da mdia. Essa Baixa disperso
classificao feita conforme Tabela 2.17. Mdia disperso
Alta disperso
O coeficiente de variao tambm per- Fonte: O autor (2015)
mite comparar conjuntos totalmente distin-
tos quanto variabilidade dos dados. Veja o exemplo a seguir.

Exemplificando

Considerando os conjuntos e ,
qual deles possui os dados mais dispersos em torno da mdia?

Resoluo:

Primeiramente calculamos , , , , , ,
e .

118 Estatstica descritiva


U2

Como > , conclumos que o conjunto A mais disperso


que o conjunto B. Alm disso, poderamos acrescentar que A possui
alta disperso e B, baixa disperso.

Pesquise mais
Existe uma maneira alternativa (mais rpida) para calcular a varincia.
Para conhecer essa forma alternativa consulte o documento no link a
seguir, na pgina 35. Alm disso, existem outras medidas de disperso
alm das apresentadas aqui. Para saber mais sobre elas, leia a seo 2.3
do mesmo material indicado a seguir.

Estatstica Descritiva. Disponvel em: <http://www.uff.br/


ieeanamariafarias/estdesc_2006.pdf>. Acesso em: 27 maio 2015.

Sem Medo de Errar!

Vamos relembrar os questionamentos feitos no incio dessa seo:

1. Quando a mdia representativa em um conjunto?

2. Quais ferramentas podem ser utilizadas para auxiliar as medidas de posio


na descrio de um conjunto de dados?

3. A mdia adequada para resumir os dados referentes aos funcionrios da


empresa M?

4. Como quantificar a variabilidade dos dados referentes a cada varivel?

A resposta para a primeira pergunta : depende dos critrios estabelecidos pelo


pesquisador. Geralmente, ao elaborar um relatrio, so definidas determinadas
regras/normas, as quais o pesquisador segue fielmente, deixando-as explcitas para
os leitores. De modo semelhante, para adotarmos certa padronizao, iremos
recorrer Tabela 2.17. Consideraremos a mdia representativa de um conjunto de
dados quando este tiver baixa disperso.

Estatstica descritiva 119


U2

Em relao segunda pergunta, esperamos que tenha ficado claro que as


medidas de posio so ferramentas que devem ser utilizadas em conjunto com
as medidas de disperso, pois, se um conjunto possui alta variabilidade, pouca
informao ser fornecida por uma medida pontual.

Para responder terceira pergunta so necessrios alguns dados (os quais


podem ser obtidos a partir da Tabela 2.1):

Varivel A (idade) Varivel B (peso) Varivel C (altura)

Agora, calculamos a varincia, o desvio padro e o coeficiente de variao para


cada varivel:

Como podemos perceber, somente a amostra da varivel C possui baixa


disperso. De acordo com o critrio estabelecido anteriormente, a mdia no
representativa das amostras das variveis A e B, apenas da amostra de C. No caso
das variveis A e B, como a mdia e a mediana esto muito prximas, tambm
assumiremos que a mediana no representativa do conjunto, sendo necessrio
um mtodo grfico ou tabular para sintetizar os dados.

A mediana seria representativa nos casos em que apenas poucos valores


do conjunto se distanciam consideravelmente da mdia. Quando isso ocorre,
geralmente, esses valores so denominados outliers (ou valores atpicos).

120 Estatstica descritiva


U2

Avanando na Prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.
1. Competncias
Conhecer os conceitos matemticos bsicos e proporcionar o
de fundamentos
desenvolvimento do raciocnio lgico e quantitativo.
de rea
2. Objetivos de
Compreender a utilizao das medidas de disperso.
aprendizagem
3. Contedos
Varincia; Desvio padro; Coeficiente de variao.
relacionados

Uma rea em que a estatstica est muito presente a de controle de


qualidade. Geralmente processos industriais procuram uniformidade
nos produtos que saem de uma linha de produo. Imagine que
uma fbrica de refrigerantes, que envasa embalagens de 1 litro e de
600 mililitros, utilize os seguintes critrios para realizar o controle de
qualidade:
Sero amostradas sistematicamente para controle de qualidade
5% da produo: a cada 20 embalagens de cada tipo, ser
retirada 1 para conferncia do volume de refrigerante.
Se uma amostra de tamanho n = 20 apresentar coeficiente
de variao superior a 4%, todo o lote de 400 embalagens
correspondente a essa amostra ser rejeitado.
Com base nesses critrios, analise as amostras a seguir e decida:
a) Qual das amostras mais homognea?
4. Descrio da
situao problema b) Qual das amostras causar rejeio do lote de refrigerantes?
Amostra de embalagens de 1 litro

0,983 1,025 1,047 1,027 1,013 0,958 0,996


0,991 0,960 1,036 0,987 0,971 0,972 1,016
0,996 1,013 0,951 1,024 1,050 0,969

Amostra de embalagens de 600 mililitros

627 641 556 591 590 613 646


565 614 592 584 627 600 597
620 660 601 627 586 578

Estatstica descritiva 121


U2

Sejam:
X: volume das embalagens de 1 litro
Y: volume das embalagens de 600 mililitros
Temos:

5. Resoluo da
situao problema

Em relao pergunta (a), como , segue que a amostra


de X mais homognea, ou seja, a amostra de refrigerantes de 1 litro
mais homognea que a de 600 mililitros.

Com relao pergunta (b), como , a amostra


de Y causar rejeio do lote, enquanto a amostra de X est dentro
das conformidades.

Lembre-se

O desvio a diferena de um valor do conjunto com relao mdia.

O desvio mdio, simbolizado por Dm, uma medida de disperso


calculada por meio da mdia aritmtica dos valores absolutos dos desvios.

A varincia, simbolizada por Var, uma medida de disperso calculada


por meio da mdia aritmtica dos quadrados dos desvios.

O desvio padro, simbolizado por Dp, uma medida de disperso


definida como a raiz quadrada da varincia.

O coeficiente de variao, simbolizado por CV, uma medida de


disperso definida como a razo entre o desvio padro e a mdia de
um conjunto de dados.

122 Estatstica descritiva


U2

Um conjunto de dados classificado como de: baixa disperso se


; mdia disperso se ; alta disperso se
.

Faa voc mesmo

Na seo 2.2, no tpico Faa voc mesmo, foi proposto que, junto com
seus colegas, voc pesquisasse a altura dos alunos da turma. Verifique
se a mdia representativa do conjunto de dados de acordo com os
critrios estabelecidos nesta seo.

Faa Valer a Pena!

1. Assinale a alternativa que contm o desvio mdio do conjunto de dados


a seguir.
50 48 48 36 41 11 29 37
a) 5,92 b) 9,52 c) 2,59 d) 9,25 e) 2,95

2. Assinale a alternativa que contm a varincia e o desvio padro da


amostra a seguir.
118 104 124 116 117 105
a) 63 e d) 63 e 7,874
b) e 7,874 e) 66 e 8,124
c) e

3. O conjunto de dados a seguir, obtido a partir da populao, possui mdia


. Assinale a alternativa que contm o desvio padro do conjunto.
y 20 40 60
a) 18,44
b) 18,46
c) 18,63

Estatstica descritiva 123


U2

d) 18,02
e) 17,74

4. Observe os conjuntos A={1,2,3}, B={2,3,4} e C={5,6,7}. Assinale a


alternativa que apresenta, respectivamente, a classificao desses
conjuntos quanto disperso.
a) alta disperso; mdia disperso; mdia disperso.
b) mdia disperso; mdia disperso; baixa disperso.
c) alta disperso; alta disperso; mdia disperso.
d) alta disperso; baixa disperso; mdia disperso.
e) alta disperso; mdia disperso; baixa disperso.

5. Considerando o apresentado nessa seo e os conjuntos A={1,2,3},


B={2,3,4} e C={5,6,7}, assinale a alternativa que completa a frase: A mdia
uma medida representativa...
a) somente para o conjunto C. d) para os conjuntos A e C.
b) para os conjuntos B e C. e) somente para o conjunto A.
c) somente para o conjunto B.

6. Os dados a seguir referem-se s alturas dos atletas das selees


masculina e feminina do vlei brasileiro que participaram das Olimpadas
de Atenas, em 2004.
Seleo masculina (X)
1,99 1,99 2,01 1,84 1,92 1,96 2,03 1,84 1,95 1,91 2,05
1,90
Seleo feminina (Y)
1,77 1,79 1,84 1,80 1,94 1,80 1,73 1,88 1,79 1,80 1,85
1,90
Calcule a mdia, a varincia, o desvio padro e o coeficiente de variao
de cada conjunto e conclua em qual deles h maior variabilidade na altura
dos atletas.

124 Estatstica descritiva


U2

7. Observe os dados a seguir.


1000 1260 1320 1380 1410 1645 1980 2106 2230 2239
2379 2760 3060 3120 3460 4030 4260 5050 5120 6460
Esse conjunto refere-se aos salrios amostrados de alguns funcionrios
de uma grande empresa. Calcule a mdia e justifique por que ela no
representativa para esse conjunto. Em seguida, construa um histograma
para sintetizar os dados. Os intervalos de classes devem ser 1000 |-- 2000,
2000 |-- 3000,3000 |-- 4000,4000 |-- 5000,5000 |-- 6000,6000 |-- 7000.

Estatstica descritiva 125


U2

126 Estatstica descritiva


U2

Referncias

ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatstica


aplicada administrao e economia. Trad. Jos Carlos Barbosa dos Santos. 2.
ed. So Paulo: Cengage Learning, 2011.

CRESPO, Antnio A. Estatstica fcil. 17. ed. So Paulo: Saraiva, 2002.

FREUND, John E. Estatstica aplicada: economia, administrao e contabilidade.


Trad. Claus Ivo Doering. 11. ed. Porto Alegre: Bookman, 2006.

FUTPDIA. Disponvel em: <http://futpedia.globo.com/campeonato/copa-do-


mundo>. Acesso em: 13 maio 2015.

IBGE Instituto Brasileiro de Geografia e Estatstica. Populao presente e


residente. Disponvel em: <www.ibge.gov.br>. Acesso em: 14 maio 2015.

IBGE Instituto Brasileiro de Geografia e Estatstica. Produo vegetal. Disponvel


em: <www.ibge.gov.br>. Acesso em: 14 maio 2015.

JOHNSON, Robert; KUBY, Patrcia. Estatstica. So Paulo: Cengage Learning, 2013.

MEDEIROS, Valria Z. (Coord.). Mtodos quantitativos com excel. So Paulo:


Cengage Learning, 2008.

MORETTIN, Luiz G. Estatstica bsica: probabilidade e inferncia. So Paulo:


Pearson Prentice Hall, 2010.

UOL Esporte. Disponvel em: <http://esporte.uol.com.br/futebol/biografias/559/


pele>. Acesso em: 28 abr. 2015.

Estatstica descritiva 127


Unidade 3

ESTATSTICA INFERENCIAL
(PARTE I)

Convite ao estudo

Tomamos nossas decises com base em conhecimentos prvios e


experincias vivenciadas em situaes semelhantes. Fazemos isso com o
objetivo de potencializar os benefcios ou minimizar os efeitos negativos;
entretanto, sempre estamos sujeitos a erros. Sabendo disso, uma rea da
estatstica denominada estatstica inferencial tenta mensurar as chances
de ocorrerem erros e acertos nas tomadas de deciso.

Voc aprendeu na unidade anterior a coletar, classificar, organizar


e apresentar dados. No que se refere apresentao, foram discutidos
mtodos pontuais que denominamos medidas de posio e vimos que
nem sempre uma medida como a mdia capaz de representar um
conjunto. Mais adiante voc ver que a chance de uma mdia estimada
corresponder exatamente ao parmetro populacional muito pequena
ou at impossvel de ocorrer. Desse modo, o que a estatstica inferencial
tenta fazer, por exemplo, mensurar a chance de determinado estimador
pertencer a um intervalo.

Outro objeto de estudo da estatstica inferencial o levantamento e o


teste de hipteses. Por exemplo, podemos considerar como hiptese a
afirmativa o produto A pertence ao lote 1. O que a estatstica inferencial
ir fazer nesse caso aceitar ou refutar essa afirmao com certa margem
de incerteza, algo que sempre est presente na estatstica.

Para trabalharmos todas essas ideias faz-se necessrio abordar alguns


pontos importantes: probabilidade; distribuies amostrais; intervalos de
confiana; e testes de hipteses. Um a um esses pontos sero discutidos
U3

no decorrer desta unidade e, ao final, esperamos que voc seja capaz de


estimar probabilidades, construir intervalos de confiana para estimadores
e testar hipteses estatsticas, objetivando a tomada de deciso.

Bons estudos!

130 Estatstica inferencial (parte I)


U3

Seo 3.1

Noes de probabilidade

Dilogo aberto

Qual a chance de voc ser atingido por um raio? E de ganhar na Mega


Sena? Pode parecer piada, mas mais fcil ocorrer o primeiro do que o segundo
acontecimento. As chances de acertar as seis dezenas so de uma para cada 50
milhes (aproximadamente). J as chances de ser atingido por um raio durante
sua vida so de uma para cada 6250, de acordo com a National Oceanic and
Atmosferic Administration.

A chance de ocorrncia de determinado acontecimento mensurada pela


probabilidade, uma subrea da matemtica que se tornou o pilar da estatstica
inferencial. Com base nessa mensurao, podemos tomar decises apoiados em
certos nveis de segurana do que pode vir a ocorrer.

Lembra-se de que na Unidade 2 fizemos uma coleta de dados com base em uma
amostra de funcionrios da empresa M? Com base nessa amostra, possvel medir
a chance de sortear um funcionrio na empresa e este ser do sexo masculino?
Ou ento, qual a chance de ele pesar 70 quilogramas ou mais? Essas e outras
questes sero respondidas ao longo desta seo. Bons estudos!

No pode faltar!

Noo de probabilidade Figura 3.1 | Frequncia das alturas de uma


amostra de 167 da empresa M
Para ilustrarmos a ideia de
probabilidade, considere o diagrama
de disperso representado na Figura
3.1, o qual se refere a uma amostragem
de funcionrios da empresa M.

Nesse diagrama, pontos marcados


sobre as marcas de escala no eixo
horizontal referem-se quele valor Fonte: O autor (2015)

Estatstica inferencial (parte I) 131


U3

especfico (por exemplo, exatamente 1 funcionrio declarou ter exatamente 1,55


m). J os pontos marcados entre duas marcas de escala referem-se a funcionrios
que declararam ter altura entre esses valores e no iguais a eles (por exemplo,
exatamente 4 funcionrios declararam ter mais de 1,55 m e menos de 1,60 m).

Como j foi descrito na Unidade 2, o diagrama de disperso tenta dar uma


ideia da distribuio dos valores de uma varivel. Observando a Figura 3.1, por
exemplo, podemos perceber que os valores esto concentrados em torno de 1,75
m, e as frequncias diminuem conforme nos afastamos desse valor. Intuitivamente
temos a impresso de que, ao selecionarmos aleatoriamente um funcionrio dessa
amostra, as chances de que ele tenha por volta de 1,75 m so maiores que as
chances de que ele tenha por volta de 1,55 m.

Antes de continuarmos, faz-se necessrio introduzir alguns conceitos:

Assimile

Denominamos experimento todo e qualquer ato de experimentao


(ou experincia) e investigao de determinado fenmeno sob
condies controladas, a fim de observ-lo e classific-lo. Como
exemplo de experimento, temos a investigao da altura dos
funcionrios da empresa M.

O conjunto de todos os resultados possveis na investigao de


uma varivel em um experimento denominado espao amostral,
o qual denotamos por (mega). O espao amostral da varivel
altura o intervalo que contempla os
valores maiores que zero.

Um valor especfico pertencente a um espao amostral


denominado ponto amostral. A altura 1,75 m um exemplo de
ponto amostral de .

Qualquer subconjunto de um espao amostral denominado


evento. As alturas compreendidas entre 1,55 m e 1,75 m, por
exemplo, compem um evento.

Medimos a chance de ocorrncia de determinado evento utilizando a probabilidade.


Simplificadamente, a probabilidade um valor numrico, compreendido no intervalo
e calculado por meio da razo entre o nmero de
resultados favorveis ao evento em questo pelo total de resultados possveis no
espao amostral. Quanto mais prximo de 0, menor a chance de ocorrncia de um

132 Estatstica inferencial (parte I)


U3

evento; quanto mais prximo de 1, maior a chance de ocorrncia.

Vamos compreender melhor o conceito de probabilidade por meio do exemplo


a seguir.

Exemplificando

Considerando a Figura 3.1, qual a probabilidade de, em um sorteio ao


acaso, selecionarmos um funcionrio da empresa M que possua altura
maior ou igual a 1,85 m e menor que 1,90 m?

Resoluo:

Considere o evento A = {alturas maiores ou iguais a 1,85 m e menores


que 1,90 m}. Denotamos por n(A) o nmero de elementos do conjunto
A, ou seja, o nmero de ocorrncias de alturas no intervalo citado.
Observando o diagrama de disperso, vemos que n(A) = 17 (= 10
+7). Alm disso, o espao amostral possui 167 elementos, ou seja,
n() = 167.
Desse modo, a probabilidade de ocorrncia do evento A igual a:

No exemplo anterior, denotando por X a varivel altura e por x um ponto


amostral qualquer, podemos simbolizar a probabilidade de ocorrncia do evento
A por P(A) = P(1,85 X < 1,90).

Reflita

Dados dois eventos B e C, sendo P(B) = 1 = 100% e P(C) = 0 = 0%,


dizemos que B um evento certo e que C um evento impossvel.

Faa voc mesmo

Ainda considerando a Figura 3.1, calcule:

a) P(1,60 X < 1,70) c) P(X 2,00)

b) P(1,65 X < 1,90) d) P(1,50 X < 2,00)

Estatstica inferencial (parte I) 133


U3

Curva normal

Observando a Figura 3.1, voc notou alguma peculiaridade? A forma como os


pontos se distribuem se assemelha a algum objeto conhecido do mundo real?

Esperamos que voc tenha notado Figura 3.2 | Frequncia das alturas de uma
que a forma como os pontos se amostra de 167 da empresa M - Curva normal
distribuem se assemelha a um sino.
Observe novamente esse diagrama na
Figura 3.2, na qual adicionamos uma
linha contnua contornando os pontos.

A linha contornando os pontos


(denominada curva normal) obedece a
uma regra matemtica dada por uma
funo do tipo exponencial, descrita por Fonte: O autor (2015)

, < x < + ,

em que x corresponde a um ponto amostral, (mu) a mdia da populao, 2


a varincia populacional e (sigma) o desvio padro populacional.

Ateno!

Na Unidade 2, com exceo da varincia e do desvio padro, no fizemos


distino simblica entre medidas calculadas a partir de uma amostra e
medidas calculadas a partir de dados populacionais. Naquele momento,
no havia necessidade de abordar essa diferena. Entretanto, agora
podemos ampliar a simbologia:

: mdia amostral : mdia populacional


Var(X): varincia amostral1 2: varincia populacional
Dp(X): desvio padro amostral : desvio padro populacional
As demais medidas, por serem utilizadas em menor frequncia, no
sero simbolizadas de forma diferente para amostras ou populaes.
1
Alguns autores tambm denotam a varincia amostral por s2 e o desvio padro amostral
por s.

A funo f descrita anteriormente, chamada de funo densidade de

134 Estatstica inferencial (parte I)


U3

probabilidade (f.d.p.), determinada pelos valores de e 2. Sendo X uma varivel


que possui distribuio dos dados com formato de sino (caracterizada por e 2),
simbolizamos X ~ N (, 2) para descrever que X possui distribuio normal, com
mdia e varincia 2.

Variveis com distribuio normal so muito comuns na natureza. Um dos


principais estudiosos a observ-las foi Carl Friedrich Gauss (1777-1855) em seus
trabalhos sobre astronomia por volta de 1810. Motivo pelo qual alguns autores
tambm denominam gaussiana essa distribuio..

A probabilidade de ocorrncia de um evento est diretamente ligada aos


parmetros e 2 provenientes da populao. Conhecendo esses valores,
considerando dada varivel com distribuio normal e um evento A, podemos
calcular a probabilidade de ocorrncia de A por meio do clculo de uma rea.

Exemplificando

Identifique a rea correspondente probabilidade de ocorrncia de


A = {Z > 0,5 e Z < 2,1}, sendo Z~N (0,1).
Resoluo:

Observe que, para esse exemplo, = Figura 3.3 | Distribuio da varivel Z


0 e 2 = 1 (e = 1). Com isso, a f.d.p.
fica , cujo
grfico est representado na Figura
3.3. A rea R destacada corresponde
probabilidade de ocorrncia de A,
ou seja, P(A) = R. Fonte: O autor (2015)

No exemplo anterior temos Z~N (0,1). Pelo fato de = 0 e 2 = 1, essa distribuio


recebe uma denominao especial, normal padro (ou normal padronizada). Veja
outras curvas normais em <http://www.ufpa.br/dicas/biome/biofig/curnor02.gif>
(Acesso em: 23 maio 2016) para diferentes valores dos parmetros e 2.

O clculo da rea R destacada no exemplo feito por meio de tcnicas que


no sero detalhadas aqui, pois no o objetivo do nosso estudo. Uma maneira
alternativa (e mais simples) para o clculo dessa rea a utilizao da Tabela da
Distribuio Normal Padro (ou tabela Z). Para compreendermos a utilizao

Estatstica inferencial (parte I) 135


U3

dessa tabela fazem-se necessrias algumas observaes:

A rea limitada pela curva normal e pelo eixo horizontal (f(z) = 0), de Z = at

Z = +, igual a 1 (no exemplo anterior, temos P( < Z < +) = P() = 1);
P(a X b) = P(X b) P(X a) = rea sob a curva entre a e b (no exemplo

anterior, temos P(0,5 Z 2,1) = R);

P(X = x0) = 0, para x0 fixo. Na prtica, a probabilidade de ocorrncia de um



valor especfico igual a zero, o que nos fora a calcular a probabilidade para
intervalos e no para valores particulares. (No exemplo anterior, temos P(Z =
0,5) = 0 = 0%);
P(X ) = P(X ) = 0,5, ou seja, a probabilidade de X ser menor que a

mdia igual a 50%, assim como a probabilidade de X ser maior que a mdia
(no exemplo anterior, temos P(Z 0) = P(Z 0) = 0,5);

P(X x) = 1 P(X x).


Figura 3.4 | rea representada por
P(Z z)
Entendidas essas observaes, vamos
ento ao clculo da rea R. A Tabela 3.1
apresenta o valor da rea abaixo da curva
f(z), acima do eixo horizontal (f(z) = 0)
entre Z = e Z = z, como mostra a Figura
3.4. Simbolizamos o valor dessa rea por
P(Z z) (ou P(Z < z)).
Fonte: O autor (2015)

Tabela 3.1 | Tabela da Distribuio Normal Padro Acumulada


z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
3 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000
2 0,023 0,018 0,014 0,011 0,008 0,006 0,005 0,003 0,003 0,002
1 0,159 0,136 0,115 0,097 0,081 0,067 0,055 0,045 0,036 0,029
0 0,500 0,460 0,421 0,382 0,345 0,309 0,274 0,242 0,212 0,184

z +0,0 +0,1 +0,2 +0,3 +0,4 +0,5 +0,6 +0,7 +0,8 +0,9
+0 0,500 0,540 0,579 0,618 0,655 0,691 0,726 0,758 0,788 0,816
+1 0,841 0,864 0,885 0,903 0,919 0,933 0,945 0,955 0,964 0,971
+2 0,977 0,982 0,986 0,989 0,992 0,994 0,995 0,997 0,997 0,998
+3 0,999 0,999 0,999 1,000 1,000 1,000 1,000 1,000 1,000 1,000
Fonte: O autor (2015)

136 Estatstica inferencial (parte I)


U3

Para calcularmos P(A) = P(0,5 Z 2,1), efetuaremos P(0,5 Z 2,1) = (Z


2,1) P(Z 0,5), pois os valores direita da igualdade podem ser consultados
na Tabela 3.1 (em destaque). Para calcularmos P(Z 2,1) consultamos a primeira
coluna da tabela onde h o valor z = +2. Em seguida, percorremos essa linha at
alcanarmos a coluna z = +0,1. Como 2,1 = 2 + 0,1, temos que P(Z 2,1) =
0,982. De modo semelhante chegamos a P(Z 0,5) = 0,691. Logo, P(A) = R =
P(0,5 Z 2,1) = P(Z 2,1) P(Z 0,5) = 0,982 0,691 = 0,291 = 29,1%.
Portanto, o evento A = {Z > 0,5 e Z < 2,1} tem 29,1% de chance de ocorrncia.

Normalizao de variveis

Como voc deve ter notado na indicao que fizemos anteriormente, uma
distribuio normal depende dos parmetros e 2. Se formos considerar todos
as possibilidades de e 2, teramos que ter infinitas tabelas para consultar as
probabilidades correspondentes. Para contornar essa dificuldade, normalizamos
a varivel em questo. Considere X~N (,2) e a transformao Z = (X )/.
Nessas condies possvel demonstrar que:

Z~N(0,1), ou seja, Z uma varivel normal padronizada;

P(X x) = P(Z z), em que .

Com o auxlio dessa transformao, podemos utilizar a Tabela 3.1 para


calcularmos P(X x) para quaisquer e 2.

Exemplificando

Sendo X~N (10,4), calcule:

a) P(X 6,4)

b) P(8,8 < Z 11,6)

Resoluo:

a) , em que

Consultando a Tabela 3.1, vemos que P(Z 1,8) = 0,036 (linha z =


1, coluna z = 0,8).
Logo .

Estatstica inferencial (parte I) 137


U3

b)

Calculamos separadamente e .

, em que .

Consultando a tabela, vemos que . Logo


.

, em que .

Consultando a tabela, vemos que (linha z = 0,


coluna z = 0,6). Logo .

Portanto, P(8,8 < X 11,6) = P(X 11,6) P(X 8,8) = 0,788


0,274 = 0,514 = 51,4%.

Pesquise mais
Leia mais sobre a distribuio normal e sobre outras distribuies de
probabilidade no link indicado a seguir.

A distribuio normal. Disponvel em: <http://www.ufpa.br/dicas/


biome/bionor.htm>. Acesso em: 23 maio 2016.

Para consultar uma tabela de distribuio normal mais completa que a


Tabela 3.1, acesse o link a seguir.

Tabela normal padro. Disponvel em: <http://www.leg.ufpr.br/~silvia/


CE001/tabela-normal.pdf>.2 Acesso em: 23 maio 2016.

2
No decorrer deste livro sempre sero utilizados os valores desta tabela.

Sem medo de errar

Vamos relembrar a situao-problema proposta no incio desta seo: Com


base na amostra de funcionrios apresentada na Tabela 2.1, possvel medir a
chance de sortear um funcionrio na empresa e este ser do sexo masculino? Ou
ento, qual a chance de ele pesar 70 quilogramas ou mais?

Para responder a essas questes, vamos representar as variveis sexo e peso,

138 Estatstica inferencial (parte I)


U3

respectivamente, por X e Y e considerar os eventos A = {funcionrio sorteado ser


do sexo masculino} e B = {funcionrio sorteado ter 70 quilogramas ou mais}. As
perguntas anteriores podem ser representadas simbolicamente por P(A) = P(X =
masculino) e P(B) = P(Y 70), respectivamente.

Para o clculo de P(A) e P(B) vamos utilizar os dados amostrais e supor que os
verdadeiros parmetros populacionais sejam prximos.

O nmero de homens na amostra igual a 11 e o total de elementos amostrados


foi 20. Logo, P(A) = 11/20 = 0,55 = 55% .

Para o clculo de P(B) vamos supor que Y~N(,2). Voc pode verificar a partir

da Tabela 2.1 que , e . Sendo assim,

consideraremos , e .

Assim, , em que

. Consultando a tabela Z, temos .

Logo, .

Para finalizar, a probabilidade de sortear um funcionrio do sexo masculino


na empresa M de 55% e a de ele ter 70 quilogramas ou mais de 69,1%.

Avanando na prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.
1. Competncias
No se aplica.
tcnicas
2. Objetivos de
Compreender o conceito de probabilidade e suas aplicaes.
aprendizagem
3. Contedos
Probabilidade. Distribuio normal.
relacionados

Estatstica inferencial (parte I) 139


U3

Em uma indstria, para garantir a qualidade, so inspecionadas


amostras de 15 unidades a cada lote de 200 produzidas. A seguir
constam as medies, em mililitros, dos contedos de duas
amostras, uma do lote 1 e outra do lote 2.

Lote 1: 104 95 96 104 96 104 101 104 104 103 100


100 102 102 95

4. Descrio da SP Lote 2: 105 104 100 96 97 105 100 100 94 97 99


97 104 102 101

O lote deve ser descartado se a probabilidade de nele conter uma


unidade do produto com menos de 95 mililitros for maior que 6%.

Pergunta: qual lote deve ser descartado, 1 ou 2?

Utilize os estimadores como aproximaes para os parmetros


populacionais.

Faamos algumas consideraes:

X: quantidade em mililitros de cada unidade do produto no lote 1


Y: quantidade em mililitros de cada unidade do produto no lote 2
A = {uma unidade do produto conter menos de 95 mililitros}
Voc pode verificar que: x 100,67; Dp(X) 3,52; y 100,07;
Dp(Y) 3,45
Assim:

5. Resoluo da SP Lote 1: P(A) = P(X < 95) = P(Z < z), em que

Consultando a tabela Z, temos P(X < 95) = P(Z < 1,6) = 0,055
= 5,5%.

Lote 2: P(A) = P(Y < 95) = P(Z < z), em que

Consultando a tabela Z, temos P(Y < 95) = P(Z < 1,5) = 0,067
= 6,7%.
Como P(X < 95) = 6% < P(Y < 95), segue que o lote 2 deve ser
descartado.

140 Estatstica inferencial (parte I)


U3

Lembre-se

Experimento: todo e qualquer ato de experimentao (ou experincia)


e investigao de determinado fenmeno sob condies controladas,
a fim de observ-lo e classific-lo.

Espao amostral: conjunto de todos os resultados possveis na


investigao de uma varivel em um experimento, o qual denotamos
por .

Ponto amostral: valor especfico pertencente a um espao amostral.

Evento: qualquer subconjunto de um espao amostral.

Probabilidade: valor numrico, compreendido no intervalo [0,1] =


{t | 0 t 1} e calculado por meio da razo entre o nmero de
resultados favorveis a um evento pelo total de resultados possveis
no espao amostral.

Faa voc mesmo

Sendo X a altura, em metros, dos alunos de graduao no Brasil, faa


uma estimativa para P(X 1,45). Para isso, calcule as estatsticas x e
Dp(X) a partir da sua turma e utilize esses valores como aproximao
para os verdadeiros parmetros populacionais.

Faa valer a pena

1. Assinale a alternativa INCORRETA.


a) A probabilidade igual razo entre o nmero de resultados favorveis
a um evento pelo total de resultados possveis no espao amostral.
b) Denominamos evento qualquer subconjunto de um espao amostral.
c) Um ponto amostral um valor especfico de .
d) Quando a probabilidade de ocorrncia de um evento igual a zero,
dizemos que o evento certo.
e) Quanto mais prxima de 1, maior a probabilidade de ocorrncia de um
evento.

Estatstica inferencial (parte I) 141


U3

2. Considere = {a, b, c, d, e, f, g, h, i, j, k, l} e um evento A = {b, d, f}. Assinale


a alternativa que contm P(A).
a) 0,20
b) 0,25
c) 0,30
d) 0,35
e) 0,40

3. Sendo Y~N(0,1), assinale a alternativa que contm o valor de P(Y > 1,6).
a) 0,945
b) 0,055
c) 1,000
d) 0,000
e) 0,726

4. Considere Z~N(0,1) e um ponto amostral z > 0 tal que P(z < Z < z) =
95,4%. Assinale a alternativa que contm o valor de z.
a) 1,0
b) 1,5
c) 2,0
d) 2,5
e) 3,0

5. Sendo X~N(15,9), assinale a alternativa que contm o valor de P(12 < X


< 18).
a) 15,9%
b) 84,1%
c) 62,8%

142 Estatstica inferencial (parte I)


U3

d) 42,9%
e) 68,2%

6. Considerando X~N(50,16) e Y~N(100,25), qual o evento mais provvel:


sortear um valor de X menor que 48 ou um valor de Y maior que 102?

7. Em determinada linha de produo, um produto descartado se seu


peso for menor que 4,9 kg. Sabe-se que a varivel peso (X) nessa linha de
produo possui distribuio normal com mdia de 5 kg e desvio padro
de 0,06 kg. Nessas condies, qual a probabilidade de se descartar um
produto?

Estatstica inferencial (parte I) 143


U3

144 Estatstica inferencial (parte I)


U3

Seo 3.2

Distribuio dos estimadores

Dilogo aberto

Voc aprendeu na seo anterior o conceito de probabilidade e como ele pode


ser aplicado a situaes reais, tais como no exemplo do controle de qualidade.
Nesse exemplo e em outros momentos utilizamos os valores x e Var(X) para
estimar os verdadeiros parmetros e 2 e solicitamos a voc que fizesse o mesmo.

Como de se esperar, sempre que utilizamos x e Var(X) para estimar e 2


estamos cometendo erros. Muitas vezes, esses erros so to importantes quanto
o valor que se pretende estimar. Voc confiaria, por exemplo, em uma estimativa
para a altura mdia da populao brasileira de 1,90 m, considerando que o dado
no seja acompanhado de nenhuma informao sobre os erros de estimativa?
Essa informao um tanto quanto suspeita.

Quando apresentamos estimadores como a mdia e a varincia, seja em


relatrios, artigos, obrigatoriamente temos de apresentar informaes acerca
dos erros de estimativa, pois isso d credibilidade. Nesse contexto, podemos nos
perguntar: fixada certa probabilidade de acerto e dado x calculado a partir de uma
amostra, qual o erro que estamos cometendo ao aproximar por x ? Ou, ainda,
fixada uma probabilidade de acerto, qual o tamanho da amostra que temos de
coletar para cometer um erro mximo predeterminado?

Essa ltima pergunta nos faz relembrar uma informao dada na Unidade 2 de
que, quanto maior a amostra, melhor a estimativa feita dos verdadeiros parmetros.
Nesta seo, voc ver uma justificativa concreta para essa afirmao. Entretanto,
para iniciarmos os estudos, propomos a seguinte situao-problema: com uma
probabilidade de 95% de acerto, qual o erro mximo que estamos cometendo ao
aproximar a mdia do peso dos funcionrios da empresa M por y = 76,05? Qual
deveria ser o tamanho da amostra para que o erro fosse de, no mximo, 2 kg?

Para que possamos responder a essas perguntas, precisamos entender melhor


a distribuio de probabilidade da mdia amostral.

Estatstica inferencial (parte I) 145


U3

No pode faltar

Teorema do Limite Central

Para entendermos o que significa distribuio de probabilidade da mdia,


considere que ao observar uma varivel X na populao tenhamos obtido =
{1,2,3,4}. Qual o valor de ? Lembre-se de que a mdia populacional e um
clculo simples mostra que .

Ao retirar uma amostra de tamanho 2 dessa populao, conseguiramos estimar


precisamente por x ? Ou, ainda, em todas as amostras o valor de x seria o mesmo?
As respostas para essas perguntas so, respectivamente, pouco provvel e no.
Veja a seguir todas amostras possveis de tamanho 2 e suas respectivas mdias.

Amostra x Amostra x Amostra x Amostra x


{1,1} 1,0 {2,1} 1,5 {3,1} 2,0 {4,1} 2,5
{1,2} 1,5 {2,2} 2,0 {3,2} 2,5 {4,2} 3,0
{1,3} 2,0 {2,3} 2,5 {3,3} 3,0 {4,3} 3,5
{1,4} 2,5 {2,4} 3,0 {3,4} 3,5 {4,4} 4,0

Podemos montar um diagrama de


disperso com os valores das mdias Figura 3.5 | Frequncias das mdias
amostrais
amostrais, como na Figura 3.5.

Observou algo de curioso na forma


como os dados se distriburam? A linha
ajudou, mas esperamos que voc tenha
notado que os dados se distriburam de
forma semelhante a uma curva normal.
A mdia amostral tambm pode ser
considerada uma varivel. Vamos Fonte: O autor (2015)
calcular a mdia das mdias amostrais
(x ) e a varincia das mdias amostrais (2x ) para termos uma ideia quantitativa da
distribuio?

Observe que a mdia das mdias amostrais exatamente igual mdia da

146 Estatstica inferencial (parte I)


U3

populao, ou seja, x = . E quanto varincia, ser que 2x = 2? Vejamos:

Note que 2x < 2, resultado que pode ser mais bem compreendido com a
leitura do Teorema do Limite Central (TLC).

Assimile

De acordo com Morettin (2010), o TLC diz que para n amostras


aleatrias simples, retiradas de uma populao com mdia e varincia
2 finita, a distribuio amostral da mdia aproxima-se, para n grande,
de uma distribuio normal, com mdia e varincia 2/n.

O TLC de extrema importncia para a estatstica inferencial e tem implicaes


muito interessantes. Observe que, apesar de ele no dizer nada a respeito da
distribuio da populao, afirma que a distribuio amostral da mdia aproxima-
se de uma curva normal, e, alm disso, essa distribuio tem a mesma mdia que
a populao e varincia 2/n, isto , a mesma varincia que a populao, mas
dividida por n. A partir desse resultado, conclumos que, quanto maior o nmero
de amostras, mais preciso teremos para a mdia, pois 2/n diminui conforme n
aumenta. Podemos visualizar esse resultado na Figura 3.6.

Figura 3.6 | Distribuio amostral da mdia x de uma populao X~N(0,1) para vrios
valores de n

Fonte: O autor (2015)

Se X ~ N(0,1), a f.d.p. da varivel x pode ser escrita como

Com base no TLC h ainda dois resultados interessantes que podemos enunciar.

Estatstica inferencial (parte I) 147


U3

Assimile

De acordo com Morettin (2010), sendo X uma varivel com mdia


e varincia 2 finita, e x a varivel mdia amostral, ento a varivel
tem distribuio normal com mdia 0 e varincia

1, ou seja, Z ~ N(0,1).

Podemos ainda definir a varivel e como a diferena entre o estimador x e o


parmetro , ou seja, e = x .

Determinando o tamanho de uma amostra

Vamos relembrar um questionamento feito no incio desta seo: fixada certa


probabilidade de acerto e dado x calculada a partir de uma amostra, qual o erro
que estamos cometendo ao aproximar por x? Ou, ainda, fixada uma probabilidade
de acerto, qual o tamanho da amostra que temos de coletar para cometer um
erro mximo predeterminado?

Vamos supor que o erro mximo que estipulamos para estimar a mdia
populacional seja . Desse modo, qualquer valor x no intervalo
nos deixar satisfeitos para essa estimativa. Para assimilar melhor, suponha que
queiramos estimar a verdadeira mdia populacional = 1,70 m da altura de certo
grupo de atletas e, para isso, queiramos cometer um erro mximo de = 2 cm.
Portanto, qualquer valor de x pertencente ao intervalo [1,68 m; 1,72 m] servir.
Alm disso, para acompanhar essa estimativa, suponha que queiramos ter uma
probabilidade de acerto de y (95%, por exemplo), uma margem de segurana.

Matematicamente, afirmar que x pertence ao intervalo implica


ou, . Alm disso, ter uma probabilidade de acerto de
y que pode ser traduzido matematicamente por .

Com base nos resultados obtidos do TLC, temos:

Lembre-se de que , logo:

148 Estatstica inferencial (parte I)


U3

Dado um valor y podemos obter na tabela Z um valor zY tal que


e ainda:

Observe que, se tivermos o conhecimento de 2, podemos estimar n em


funo de y e , prefixados, ou estimar em funo de y e n. Com base na ltima
igualdade podemos justificar a afirmativa feita na Unidade 2 de que o erro diminui
medida que o tamanho da amostra aumenta, pois:

Podemos agora, observando a ltima igualdade, ver claramente que, se n


aumenta (n ), o erro diminui ( 0).

Exemplificando

Seja uma varivel X~N(,4) observada em dada populao. Com


preciso de:

95%, qual o erro mximo que cometemos ao estimar a verdadeira mdia


dessa populao com base em uma amostra de tamanho n = 30?

90%, qual o tamanho da amostra que deve ser coletada para que o erro
seja de, no mximo, = 1?

Resoluo:

a) Observe que a frmula do erro depende de zY , 2

e n. O parmetro 2 = 4 foi dado e n = 30. Resta determinar zY , em que


, para que tenhamos .
Observe a Figura 3.7.

Estatstica inferencial (parte I) 149


U3

Figura 3.7 | Regio correspondente a 0,95

Fonte: O autor (2015)

Veja que o valor zY deve ser tal que .


Consultando a tabela Z, temos zY = 1,96. Logo

Portanto, com preciso de 95%, o erro mximo que cometemos


ao estimar a verdadeira mdia dessa populao com base em uma
amostra de tamanho n = 30 = 0,72.

b) Observe que, para


Figura 3.8 | Regio correspondente a
determinar o tamanho da

amostra, devemos utilizar a

frmula , em que

2 e foram dados, e zY deve


ser consultado na tabela Z

para . Veja

a Figura 3.8. Fonte: O autor (2015)

Veja que o valor zY deve


ser tal que . Consultando a tabela Z,

temos zY = 1,65. Logo .

Portanto, com preciso de 90%, para ter erro mximo = 1, temos


de obter uma amostra de tamanho n = 11 para estimar a verdadeira
mdia da populao.

150 Estatstica inferencial (parte I)


U3

Observe que para calcular o erro e o tamanho da amostra ficamos dependentes


de conhecer o valor de 2, isto , a varincia populacional. Dificilmente conhecemos
esse valor com exatido, mas em certas situaes ele pode ser conhecido de
pesquisas anteriores. O IBGE, por exemplo, a cada dez anos realiza um censo e
obtm todos os parmetros populacionais. Entre um censo e outro bvio que
os valores sofrem alteraes, mas utilizar 2 obtido no censo anterior no muito
distante da realidade e considerado aceitvel. Caso esse valor seja desconhecido,
comumente se utiliza Var(X) em seu lugar.

Ateno!

A desigualdade pode dar origem a intervalo


de confiana para a mdia populacional. Para a construo do mesmo,
efetuamos:

Portanto, um intervalo de confiana para a mdia populacional, com


nvel de confiana , definido como , em que
e .

Pesquise mais

Observe que no tratamos da distribuio amostral de Var(X). No


entraremos em detalhes sobre essa distribuio, pois ela demanda
maior detalhamento. Citaremos apenas que a distribuio da varincia
amostral conhecida como distribuio de qui-quadrado, a qual
simbolizamos por X2.

Veja mais detalhes sobre a distribuio amostral da mdia e a


distribuio de qui-quadrado no link indicado a seguir.

Inferncia Estatstica. Disponvel em: <http://www.professores.uff.


br/patricia/images/stories/arquivos/5_inferencia.pdf>. Acesso em: 23
maio 2016.

Estatstica inferencial (parte I) 151


U3

Sem medo de errar!

Vamos relembrar a situao-problema proposta no incio desta seo: com uma


probabilidade de 95% de acerto, qual o erro mximo que estamos cometendo ao
aproximar a mdia do peso dos funcionrios da empresa M por ? Qual
deveria ser o tamanho da amostra para que o erro fosse de, no mximo, 2 kg?

Como no temos a varincia populacional, iremos utilizar Var(X) como


estimativa para 2. Temos:

Observando a frmula do erro , vemos que nos resta determinar

zY para , uma vez que n = 20 e so conhecidos. A


interpretao geomtrica dessa probabilidade pode ser vista na Figura 3.7, no
mesmo exemplo em que determinamos . Assim:

Portanto, com uma amostra de tamanho n = 20 estamos cometendo um erro


mximo = 5,15 kg, com 95% de probabilidade.

Se desejarmos um erro mximo = 2 kg temos, por substituio direta na


frmula , uma amostra de tamanho:

Portanto, se coletarmos uma amostra de 133 indivduos, cometeremos um erro


mximo de 2 kg para a estimativa de .

152 Estatstica inferencial (parte I)


U3

Avanando na prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas situaes
que pode encontrar no ambiente de trabalho. Realize as atividades e depois as compare com as de
seus colegas.

1. Competncias tcnicas No se aplica.

Mensurar o erro de estimao da mdia populacional e dimensionar o


2. Objetivos de aprendizagem
tamanho de uma amostra para determinado erro mximo estipulado.

3. Contedos relacionados Erro amostral da mdia. Dimensionamento de amostra.

Determinada linha de produo, que envasa leite em embalagens de


3 L, possui as seguintes regras para o controle de qualidade:

1) Retiram-se 10 unidades de cada lote de 200 para compor a


amostra de controle.

2) Utiliza-se como estimativa de 2 o maior valor calculado para as


amostras dos trs ltimos lotes que saram da linha de produo.

3) Se, com 98% de probabilidade de acerto, o erro amostral da


mdia for superior a 0,05 L, a linha de produo pausada
para verificaes nos equipamentos.

Os valores a seguir correspondem s amostras dos trs ltimos lotes


4. Descrio da situao- que saram da linha de produo:
problema
Lote 1 (X1): 3,006 2,935 2,976 3,018 2,996 2,978 3,045
3,075 2,857 2,953

Lote 2 (X2): 2,973 3,108 2,894 3,053 3,031 2,968 3,051


2,956 3,109 2,971

Lote 3 (X3): 2,864 3,005 3,065 2,901 2,94 3,059 3,005


3,025 3,152 3,112

Com base nessas amostras:

a) A linha de produo deveria ser pausada?

b) Se modificarmos para 90,1% a probabilidade de acerto, a


deciso seria a mesma?

Estatstica inferencial (parte I) 153


U3

a) Primeiramente calculamos Var(X1), Var(X2) e Var(X3). Para


isso necessrio conhecer tambm as respectivas mdias.
Voc pode verificar que , , ,
, e .

De acordo com a regra (2), temos que . Alm

disso, observando a frmula do erro , temos de


determinar zY para . Esse valor deve ser tal que
. Consultando a tabela Z, temos
, o que implica:

5. Resoluo da Situao-
Problema

De acordo com a regra (3), devemos pausar a linha de produo, pois


L.

b) Se , temos de determinar zY para o qual


. Consultando a tabela Z,
temos . Logo:

Como L, a deciso seria diferente, ou seja, se a


linha de produo no seria pausada.

Reflita

Qual interpretao temos da reduo, no exemplo anterior, de


para ?

Lembre-se

Teorema do Limite Central (TLC): para n amostras aleatrias simples,


retiradas de uma populao com mdia e varincia 2 finita, a
distribuio amostral da mdia aproxima-se, para n grande, de uma
distribuio normal, com mdia e varincia 2/n.

154 Estatstica inferencial (parte I)


U3

Consequncia do TLC: sendo X uma varivel com mdia e varincia 2


finita, e x a varivel mdia amostral, ento a varivel

tem distribuio normal com mdia 0 e varincia 1, ou seja, .

Erro amostral da mdia: Definido como , permite reescrever


z da seguinte forma, , em que .

Faa voc mesmo

Acesse o link <http://www.de.ufpb.br/~tarciana/CPEI/Aula3.pdf>


(Acesso em: 23 maio 2016) e estime o erro amostral da mdia para os
dados apresentados na pgina 15. Considere diferentes valores de ,
como 90%, 95% e 98%.

Faa valer a pena!

1. Seja uma varivel X~N(,9) observada em dada populao. Com


preciso de 90%, assinale a alternativa que contm o erro mximo que
cometemos ao estimar a verdadeira mdia dessa populao com base em
uma amostra de tamanho n = 25.
a) 1,099.
b) 0,099.
c) 2,909.
d) 2,970.
e) 0,990.

2. Seja uma varivel X~N(, 16) observada em dada populao. Supondo


que queiramos um erro amostral da mdia mximo de = 1, com 94% de
probabilidade, entre as alternativas a seguir, assinale aquela que contm o
menor tamanho de amostra que possibilite esse erro mximo estabelecido.
a) 46.
b) 55.
c) 59.

Estatstica inferencial (parte I) 155


U3

d) 62.
e) 68.

3. Os conjuntos de dados a seguir so obtidos a partir de amostragem.


Eles representam as idades de determinado grupo de frequentadores de
um estabelecimento.
Grupo 1 (X1): 31 27 33 33 24 25 28 29 24 31.
Grupo 2 (X2): 31 28 28 30 29 31 31 28.
Grupo 3 (X3): 30 28 31 28 31 30 28 31 29 32.
Sendo 1, 2 e 3 os erros amostrais dos grupos 1, 2 e 3, respectivamente,
assinale a alternativa correta.
a) 1 = 2 < 3.
b) 1 > 2 > 3.
c) 1 > 2 = 3.
d) 1 = 2 = 3.
e) 1 < 2 < 3.

4. As variveis X~N(x,49), Y~N(Y,45) e W~N(w,30) so observadas


em uma populao. Deseja-se coletar uma nica amostra para estimar
a mdia populacional de ambas as variveis. Para os estudos que sero
realizados necessrio que o erro amostral da mdia seja, no mximo,
= 2 com confiana de 90,30%, 88,12% e 97,96% para as variveis X, Y e Z,
respectivamente. Desse modo, assinale a alternativa que contm o menor
tamanho de amostra que atenda a essas exigncias.
a) n = 41.
b) n = 34.
c) n = 28.
d) n = 26.
e) n = 49.

156 Estatstica inferencial (parte I)


U3

5. Para a realizao de certo estudo, coletou-se a seguinte amostra:


1075 979 1034 1090 904 920 908 1026 963
Foi constatado, com 95% de probabilidade, que o erro amostral da mdia
era de, no mximo, 46,38, valor que foi considerado alto. Com base nisso,
estabeleceu-se um novo erro mximo tolerado, = 15, sendo necessrio
coletar uma nova amostra que ser dimensionada com base na varincia
Var(X) da amostra que ser descartada. Assinale a alternativa que contm
a dimenso da nova amostra.
a) 43.
b) 94.
c) 72.
d) 87.
e) 112.

6. Enuncie o Teorema do Limite Central e elenque duas de suas


consequncias.

7. As duas amostras a seguir foram retiradas de uma mesma populao e


so referentes a uma mesma varivel X~N (,2).
Amostra 1 (X1): 61,6 63,8 61,7 59,7 66,5 64,1 58,6 59,0
Amostra 2 (X2): 59,4 59,4 63,0 58,8 63,6 59,6 59,2 64,5
61,6 60,3
Faa uma estimativa pontual para calculando x a partir da amostra que
apresentar o menor erro amostral para a mdia. Calcule o erro amostral
com preciso de 93,86%.

Estatstica inferencial (parte I) 157


U3

158 Estatstica inferencial (parte I)


U3

Seo 3.3

Testes de hipteses para a mdia (2 conhecido)

Dilogo aberto

Voc aprendeu anteriormente sobre o Teorema do Limite Central (TLC) e


algumas de suas implicaes. Esse teorema de extrema importncia para
a estatstica inferencial e existem diversas situaes em que pode ser utilizado,
sendo que uma delas no teste estatstico de hipteses. Mas o que significa isso?
Segundo Morettin e Bussab (2010, p. 330):

[...] feita determinada afirmao sobre uma populao,


usualmente sobre um parmetro dessa, desejamos saber se
os resultados experimentais provenientes de uma amostra
contrariam ou no tal afirmao. Muitas vezes, essa afirmao
sobre a populao derivada de teorias desenvolvidas no
campo substantivo do conhecimento. A adequao ou no
dessa teoria ao universo real pode ser verificada ou refutada
pela amostra. O objetivo do teste estatstico de hipteses ,
ento, fornecer uma metodologia que nos permita verificar se
os dados amostrais trazem evidncias que apoiem ou no uma
hiptese (estatstica) formulada.

Para avanarmos um pouco neste assunto, considere a seguinte situao-


problema: suponha que a empresa M seja uma prestadora de servios e que ir
concorrer com outras para ser contratada para determinado projeto. A empresa
contratante (empresa N) afirma que, para a execuo das tarefas pertinentes ao
projeto, desejvel que os funcionrios possuam, em mdia, 80 kg e altura mdia
maior ou igual a 170 cm, para utilizarem os Equipamentos de Proteo Individual
(EPIs) de que a empresa dispe. Em vista disso, a empresa M declara que seus
funcionrios se encaixam nesses padres e acrescenta que, em medies feitas
recentemente, constatou-se que o desvio padro do peso de seus funcionrios
era 12 kg e que o desvio padro da altura era 8 cm. Considerando que a empresa

Estatstica inferencial (parte I) 159


U3

N tenha acesso aos dados amostrados na Tabela 2.1, ela consegue constatar se
a afirmao da empresa M verdica?

Para que possamos verificar essas afirmaes, precisamos compreender melhor


como formular hipteses, adotar algumas simbologias que nos auxiliaro no
processo e compreender os erros a que estamos sujeitos. No decorrer desta seo
apresentaremos um roteiro para que voc possa testar as hipteses apresentadas
e, ao final, verificaremos as afirmaes.

No pode faltar!

Formulando hipteses

As situaes abordadas em testes estatsticos de hipteses podem nos parecer


bem familiares. Considere, por exemplo, a afirmao (A) vai chover hoje. Essa
afirmao pode ser considerada uma hiptese, cuja negativa outra hiptese, (B) no
vai chover hoje. Observe que as duas hipteses levantadas so complementares,
isto , ocorre a primeira ou ocorre a segunda, no h outra possibilidade.

Como verificar a Figura 3.9 | Previso do Tempo em Natal RN para o dia 18/06/2015
veracidade da hiptese
(A)? possvel ter certeza Temperatura mnima: 21 C
absoluta da ocorrncia Temperatura mxima: 29 C
de (A) ou (B)? Para Probabilidade de precipitao: 60%
respondermos a essas Sol e aumento de nuvens de manh.
Pancadas de chuva tarde e noite.
perguntas, observe a
Figura 3.9.
Fonte: Climatempo

Veja que a previso


do tempo para Natal traz uma informao muito importante, a probabilidade de
precipitao, ou seja, a chance de chover. Para facilitar nossa discusso, vamos
denotar as hipteses A e B como a seguir:

H0: vai chover hoje H1: no vai chover hoje

Assimile

A hiptese H0, denominada hiptese nula, geralmente afirmativa ou,


no caso de uma varivel quantitativa, uma hiptese de igualdade. Ela
nossa principal hiptese, o foco da nossa anlise e a que queremos
pr prova. A hiptese H1, denominada hiptese alternativa, aquela
que ser aceita se rejeitarmos a hiptese nula.

160 Estatstica inferencial (parte I)


U3

Ateno!

Alguns autores tambm denotam a hiptese alternativa por Ha.

Em relao a nossa deciso Tabela 3.2 | Resultados possveis para um teste de


de aceitar ou rejeitar H0, po- hipteses
demos ter quatro resultados Possibilidades para H0
Deciso
possveis, elencados na Tabela Verdadeira Falsa
3.2. No rejeitar H Deciso correta Erro tipo II
0

Para o nosso exemplo, a Rejeitar H0 Erro tipo I Deciso correta


ocorrncia do erro tipo I seria Fonte: Morettin (2010)
rejeitar a hiptese vai chover hoje e, ao final do dia, constatarmos que choveu.
Denotamos por a a probabilidade de ocorrncia desse erro e, nesse caso, a =
60%. A ocorrncia do erro tipo II, nesse caso, seria no rejeitar a hiptese vai
chover hoje e, no final do dia, constatarmos que no choveu. A probabilidade de
ocorrncia desse erro = 40%. Podemos escrever P(erro tipo I) = a e P(erro
tipo II) = . Portanto, respondendo s perguntas feitas anteriormente, para verificar
a veracidade da hiptese (A) temos de realizar um teste de hipteses. Contudo,
nunca teremos certeza absoluta da ocorrncia de uma hiptese, pois sempre esta-
mos sujeitos a cometer um dos erros apresentados na Tabela 3.2.

Testando hipteses

Para fixarmos um procedimento para o teste de uma hiptese nula, considere


o seguinte exemplo.

Exemplificando

Uma varivel estudada em determinada populao.


Parte dos pesquisadores suspeita que e outros que
. No intuito de pr prova essas suspeitas eles decidiram
fazer testes para identificar qual delas a correta. Para isso foi retirada
uma amostra da populao, a qual apresentada a seguir.

49 50 48 51 47 48 55 50 55 49 51 53

Com 95% de confiana, qual a verdadeira mdia da populao,


ou ?

Estatstica inferencial (parte I) 161


U3

Resoluo:

Vamos inicialmente testar se .

Passo 1 (elaborar as hipteses): precisamos estipular duas hipteses,


a nula e a alternativa. Como a hiptese nula sempre de igualdade,
como foi descrito anteriormente, determinamos:

H0: H1:

Passo 2 (determinar a estatstica de teste): Como nosso objetivo


testar a mdia populacional da varivel , pelo TLC nossa
estatstica de teste ser ou , caso a
hiptese nula seja verdadeira.

Passo 3 (fixar o nvel de significncia): Como queremos 95% de


confiana, a probabilidade de cometermos o erro tipo I deve ser
. Figura 3.10 | Regio crtica para H :
0
Essa probabilidade tambm
e H 1: , com
denominada nvel de
significncia.

Rejeitaremos a hiptese
H0 caso o valor x obtido a
partir da amostra seja muito
maior ou muito menor que
ou, ainda, quando Fonte: O autor (2015)
x pertencer regio crtica
(RC), ilustrada na Figura 3.10.

A regio crtica pode ser denotada por ou


. Observando a tabela Z e lembrando que , temos:

ou .

Passo 4 (calcular a estatstica a partir da amostra): a mdia amostral


.

Passo 5 (tomar uma deciso): como , decidimos rejeitar H0,

162 Estatstica inferencial (parte I)


U3

isto , h indcios suficientes que nos permitem refutar a possibilidade


de a mdia populacional ser .

Vamos testar agora se .

Passo 1 (elaborar as hipteses):

H0: = 50 H1: 50

Passo 2 (determinar a estatstica de teste): ou


, caso a hiptese nula seja verdadeira.

Passo 3 (fixar o nvel de significncia):

Rejeitaremos a hiptese Figura 3.11 | Regio crtica para H0: = 50


H0 caso o valor x obtido a e H : 50, com
1
partir da amostra pertena
regio crtica (RC), ilustrada
na Figura 3.11.

Observando a tabela Z e
lembrando que ,
temos: Fonte: O autor (2015)

ou .

Passo 4 (calcular a estatstica a partir da amostra): a mdia amostral


.

Passo 5 (tomar uma deciso): como , no podemos rejeitar


H0, isto , no h indcios suficientes que nos permitam refutar a
possibilidade de a mdia populacional ser .

Desse modo, em concordncia com o problema apresentado,


devemos concluir que a verdadeira mdia da populao .

Estatstica inferencial (parte I) 163


U3

Assimile

Regio crtica: regio de rejeio da hiptese nula.

Ateno!

Testes de hipteses como o do exemplo anterior so ditos bilaterais,


pois a regio crtica tem parte esquerda e parte direita do valor que
est sendo testado.

Caso a regio crtica estivesse somente esquerda do valor que est


sendo testado, o teste seria unilateral esquerda; caso estivesse
somente direita, o teste seria unilateral direita.

Veja a seguir um exemplo de teste unilateral esquerda.

Exemplificando

Uma empresa de telefonia fixa oferece um pacote de acesso internet


com franquia ilimitada e velocidade mdia mensal de = 50 Mbps
com 2 = 6 Mbps. Paulo contratou o servio e anda desconfiado de
que a velocidade mdia menor que a anunciada. Para testar se est
sendo trapaceado pela empresa de telefonia, ele mediu a velocidade
de sua conexo durante um ms, em 15 diferentes dias e horrios,
obtendo a seguinte amostra:

47,7 47,9 49,2 48,5 47,5 48,3 50,5 51,1 48,0 48,9 47,9
47,9 47,9 50,2 51,4

Considerando que o valor 2 = 6 esteja correto, h evidncias de que


a velocidade fornecida menor que a contratada?

Resoluo:

Passo 1 (elaborar as hipteses):

H0: = 50 H1: < 50

Passo 2 (determinar a estatstica de teste): ou

164 Estatstica inferencial (parte I)


U3

Passo 3 (fixar o nvel de significncia): suponha . Como


nos interessa H1: < Figura 3.12 | Regio crtica para H : = 50
0
50, a regio crtica e H : < 50, com
1
com
, como
mostra a Figura 3.12.

Mas
em que .
Observando a tabela Z, Fonte: O autor (2015)
temos:

Passo 4 (calcular a estatstica a partir da amostra):

Passo 5 (tomar uma deciso): como , optamos por rejeitar H0,


ou seja, existem indcios suficientes de que a mdia populacional
menor que = 50.

Conclumos que Paulo est correto ao afirmar que a velocidade mdia


fornecida menor que a velocidade mdia contratada.

Valor-p

Se efetuarmos obtemos um valor denominado z calculado ou,

ainda, z estrela (z) como alguns autores preferem denotar. Retomando o exemplo

anterior, temos zc = . Veja a representao de e

de (determinado a partir do nvel de significncia ) na Figura 3.13.


Figura 3.13 | Representao de e de
Lembre-se de que,
ao fixarmos o nvel de
significncia ,
obtivemos a
partir da tabela Z. Alm
disso, com a relao
Fonte: O autor (2015)

calculamos o valor de
que serviu de base para analisar a hiptese nula. Alm dessa metodologia de

Estatstica inferencial (parte I) 165


U3

anlise existe outra bastante utilizada, a qual envolve o clculo do valor-p. No


caso do exemplo anterior, representado pela Figura 3.13, o valor-p corresponde
rea que se apresenta esquerda de zc , abaixo da curva normal e acima do eixo
horizontal (regio hachurada). Mais formalmente, se o teste de hipteses for:

unilateral esquerda, o valor-p igual a ;

unilateral direita, o valor-p igual a ;

bilateral, o valor-p igual a .

De acordo com Robert Johnson e Patrcia Kuby (2013), uma vez calculado o
valor-p, podemos adotar a seguinte regra de deciso:

Se o valor-p menor ou igual ao nvel de significncia a, ento a deciso deve


ser rejeitar H0.

Se o valor-p maior que o nvel de significncia a, ento a deciso deve ser


no rejeitar H0.

Pesquise mais
Leia mais sobre os testes de hipteses no Captulo 5 do material disponvel
em: <http://www.est.ufpr.br/ce003/material/apostilace003.pdf>. Acesso
em: 23 maio 2016.

Sem medo de errar!

Observe que cada afirmao feita pela empresa M trata de uma suposio: (1) o
peso mdio dos funcionrios 80 kg; (2) a altura mdia maior ou igual a 170 cm.
Denotando por X e Y, respectivamente, o peso e a altura, temos que as afirmaes
anteriores podem ser traduzidas matematicamente como X = 80 e Y 170. Sendo
assim, temos duas hipteses nulas a serem testadas:

Problema 1 Problema 2

H0: X = 80 H0: Y = 170

H1: X 80 H1: Y < 170

Para ambos os problemas, o passo 1 j foi realizado, ou seja, as hipteses j


foram fixadas.

166 Estatstica inferencial (parte I)


U3

Problema 1: testar X = 80

Passo 2 (determinar a estatstica de teste): ou ,


caso a hiptese nula seja verdadeira.

Passo 3 (fixar o nvel de Figura 3.14 | Regio crtica para H0: X = 80 e


significncia): suponha a = 2%
H1: X 80, com a = 2%
e RC como mostra a Figura 3.14.
Consultando a tabela Z, e lembrando
que , temos:

Fonte: O autor (2015).

ou .

Passo 4 (calcular a estatstica a partir da amostra):

Passo 5 (tomar uma deciso): como , no podemos rejeitar H0, isto ,


no h indcios suficientes que nos permitam refutar a possibilidade de a mdia
populacional ser X = 80.

Problema 2: testar Y = 170

Passo 2 (determinar a estatstica de teste): ou ,


caso a hiptese nula seja verdadeira.

Passo 3 (fixar o nvel de significncia): suponha a = 2% e RC como mostra a


Figura 3.15. Consultando a tabela Z, e lembrando que , temos:

Estatstica inferencial (parte I) 167


U3

Passo 4 (calcular a estatstica a


Figura 3.15 | Regio crtica para H0: Y = 170
partir da amostra):
e H1: Y < 170, com a = 2%
Passo 5 (tomar uma deciso): como
, no podemos rejeitar H0,
isto , no h indcios suficientes que
nos permitam refutar a possibilidade
de a mdia populacional ser Y = 170.

Portanto, considerando que a


empresa N tenha acesso aos dados
Fonte: O autor (2015).
amostrados na Tabela 2.1 e o nvel
de significncia a = 2%, no h indcios suficientes para que ela consiga refutar a
afirmao da empresa M de que o peso mdio de seus funcionrios 80 kg e que
a altura mdia maior ou igual a 170 cm.

Avanando na prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.
1. Competncias tcnicas No se aplica.
2. Objetivos de
Realizar testes de hipteses pela abordagem valor-p.
aprendizagem
3. Contedos
Testes de hipteses para a mdia com varincia conhecida.
relacionados
Determinada mquina corta barras de metal com 50 cm,
em mdia, sendo o comprimento dessas barras uma varivel
. Caso a mdia dos comprimentos seja superior
a 50 cm, h prejuzo para a empresa.

Alguns funcionrios suspeitam que a mquina esteja


4. Descrio da Situao-
desregulada e que isso tem causado prejuzo. Para verificarem
Problema
a suspeita, coletaram uma amostra de tamanho n = 36 e
obtiveram x = 52 cm.

Utilizando a abordagem valor-p e o nvel de significncia a = 2%,


verifique se h indcios suficientes para confirmar a suspeita dos
funcionrios.

168 Estatstica inferencial (parte I)


U3

Passo 1 (elaborar as hipteses):


H0: = 50 H1: > 50
Passo 2 (determinar a estatstica de teste): ou

Passo 3 (fixar o nvel de significncia): a = 2% (dado)


Passo 4 (calcular a estatstica a partir da amostra): x = 52
5. Resoluo da Situao-
Problema
valor-p =
Passo 5 (tomar uma deciso): como valor-p<a optamos
por rejeitar H0, ou seja, existem indcios suficientes de que a
mdia populacional maior que = 50.

Conclumos que h indcios suficientes de que a suspeita dos


funcionrios pode ser confirmada.

Lembre-se

Hiptese nula (H0): geralmente afirmativa ou, no caso de uma varivel


quantitativa, uma hiptese de igualdade. Ela nossa principal hiptese,
o foco da nossa anlise e a que queremos pr prova.

Hiptese alternativa (H1): aquela que ser aceita se rejeitarmos a


hiptese nula.

Regio crtica (RC): regio de rejeio da hiptese nula.

Regra de deciso (abordagem valor-p): se o valor-p menor ou igual


ao nvel de significncia a, ento a deciso deve ser rejeitar H0; se o
valor-p maior que o nvel de significncia a, ento a deciso deve ser
no rejeitar H0.

Faa voc mesmo

Junto a um colega, colete as informaes sobre a altura de todos


os alunos da turma. Um de vocs (primeiro) ir calcular a mdia
e a varincia 2, sem que o outro (segundo) veja o resultado de .
O primeiro ir fazer ao segundo uma afirmao sobre a mdia, por
exemplo, a mdia = 1,70 m (no necessariamente o verdadeiro

Estatstica inferencial (parte I) 169


U3

valor de ). O segundo, por sua vez, ir coletar uma amostra e formular


uma hiptese alternativa, por exemplo, a mdia menor que 1,70
m. Em seguida, conhecendo-se o valor de 2 e estipulando um nvel
de significncia, o segundo ir testar as hipteses para refutar ou no
a afirmao do primeiro.

Faa valer a pena

1. Considere as hipteses H0: = 100 e H1: 100 elaboradas para a mdia


de uma varivel . Para testar essas hipteses coletou-se uma
amostra de tamanho n = 36 e obteve-se . Supondo um nvel de
significncia a = 5%, assinale a alternativa que contm a regio crtica, ou
seja, a regio de rejeio da hiptese nula:
a) ou
b) ou
c) ou
d) ou
e) ou

2. Considere as hipteses H0: = 150 e H1: > 150 elaboradas para a


mdia de uma varivel . Para testar essas hipteses coletou-se
uma amostra de tamanho n = 49 e obteve-se . Supondo um nvel
de significncia a = 6,3%, assinale a alternativa que contm a regio crtica,
ou seja, a regio de rejeio da hiptese nula:
a)
b)
c)
d)
e)

3. Considere as hipteses H0: = 200 e H1: < 200 elaboradas para a mdia
de uma varivel . Para testar essas hipteses coletou-se uma
amostra de tamanho n = 36 e obteve-se . Assinale a alternativa

170 Estatstica inferencial (parte I)


U3

que contm o menor nvel de significncia para o qual a hiptese nula seja
rejeitada:
a) 12,3%
b) 10,2%
c) 7,5%
d) 5,0%
e) 2,5%

4. Considere as hipteses H0: = 85 e H1: 85 elaboradas para a


mdia de uma varivel e as amostras ,
e , coletadas para testar as
hipteses. Sendo a, b e c, respectivamente, os valores-p correspondentes s
amostras A, B e C, assinale a alternativa correta:
a) a = b = c
b) a = b > c
c) a < b = c
d) a < b < c
e) a > b > c

5. Os salrios dos funcionrios de determinado setor da indstria


correspondem a uma varivel . Em uma pesquisa foram
selecionadas trs indstrias desse setor e 30 funcionrios de cada uma
para verificar a mdia salarial, sendo obtidos os seguintes resultados:

Indstria 1 Indstria 2 Indstria 3

Com base nesses resultados e considerando um nvel de significncia a =


2%, assinale a alternativa correta:
a) A indstria 1 paga salrios abaixo da mdia; e no se pode afirmar que
as indstrias 2 e 3 paguem salrios diferentes da mdia.
b) As indstrias 1 e 3 pagam salrios abaixo da mdia; e a indstria 3 paga
salrios acima da mdia.

Estatstica inferencial (parte I) 171


U3

c) As trs indstrias pagam salrios diferentes da mdia.


d) No se pode afirmar que essas indstrias paguem salrios diferentes da
mdia.
e) A probabilidade de se selecionar um funcionrio desse setor da indstria
e este receber mais de R$ 1500,00 menor que 10%.

6. Considere uma fbrica de refrigerantes que envasa embalagens de 2 L,


sendo a quantidade de refrigerante nas garrafas uma varivel .
Para controle de qualidade so coletadas periodicamente amostras
de 20 unidades e mensuradas respectivas quantidades. Se, ao nvel de
significncia de 2%, a hiptese de a mdia das quantidades ser igual a 2 L
for refutada, a linha de produo pausada para verificaes e ajustes nos
equipamentos.
Com base na amostra a seguir, a linha de produo deve ser pausada?
1,90 2,09 2,07 1,89 1,94 1,89 2,15 2,10 2,06 2,13 2,05
2,03 2,04 2,11 2,12 2,15 1,86 2,10 1,98 1,90

7. Os parafusos fabricados por uma empresa tm resistncia mdia trao


de 120 kg, com desvio padro de 5 kg. Um depsito possui uma caixa
com parafusos que o proprietrio afirma ser desse fabricante. Entretanto, a
informao no pode ser confirmada, pois algum funcionrio descuidado
estragou a embalagem e perdeu-se a informao sobre a origem. Na
tentativa de vender para um comprador interessado nos parafusos desse
fabricante, ou de melhor qualidade, o proprietrio do depsito disse que
faria um desconto no produto e daria 15 unidades para que o comprador
pudesse testar a resistncia mdia trao e confirmar a origem. Da amostra
testada o comprador constatou que a resistncia mdia foi de 117,5 kg.
Com essas informaes e um nvel de significncia de 2%, possvel
confirmar a informao dada pelo proprietrio do depsito?

172 Estatstica inferencial (parte I)


U3

Seo 3.4

Testes de hipteses para a mdia (2 desconhecido)

Dilogo aberto

Na seo anterior, voc aprendeu a formular e testar hipteses. Entretanto, h um


detalhe que deve ser acrescentado: ns supusemos que a varincia populacional
era conhecida. Essa suposio tambm foi feita nas sees 3.1 e 3.2 e, em alguns
casos, utilizamos Var(X) como aproximao de 2. Diante disso surgem alguns
questionamentos: (1) em situaes reais, com que frequncia conhecemos o
verdadeiro valor de 2? (2) correto utilizarmos Var(X) no lugar de 2?

Em relao ao primeiro questionamento, a resposta quase nunca. Somente


em raras situaes isso ocorre. Um exemplo, inclusive descrito anteriormente,
quando o IBGE, a cada dez anos, realiza um censo e obtm os verdadeiros
parmetros populacionais. Se utilizamos no ano seguinte ao censo o valor de 2,
de certa forma estaremos lidando com um parmetro real, mas com um pequeno
atraso; devemos esperar que ele esteja desatualizado, mas podemos supor que o
verdadeiro valor seja prximo. Essa mesma suposio teria de ser feita com cautela
se utilizssemos 2 muito tempo depois do censo.

A resposta para o segundo questionamento sim, desde que de forma


adequada. A distribuio normal padro (ou distribuio z) utilizada para os
casos em que a varincia populacional conhecida ou quando temos grandes
amostras. Para pequenas amostras e varincia populacional desconhecida, o
correto utilizarmos a distribuio de Student (ou distribuio t).

Para nos aprofundarmos nesse assunto iremos propor a mesma situao-


problema da seo anterior, mas com uma pequena modificao, supor as
varincias populacionais desconhecidas. Desse modo, questionamos novamente:
considerando que a empresa N tenha acesso aos dados amostrados na Tabela
2.1, ela consegue constatar se a afirmao da empresa M verdica, isto , que os
funcionrios possuem, em mdia, 80 kg e altura mdia maior ou igual a 170 cm?

Estatstica inferencial (parte I) 173


U3

No pode faltar!

Distribuio de Student

A distribuio t de Student uma distribuio de probabilidade proposta pelo


irlands W. S. Gosset, em 1908. Gosset era funcionrio de uma cervejaria e escreveu
sobre essa distribuio em um trabalho publicado com o pseudnimo Student,
da a justificativa para o nome atribudo. Nesse trabalho, Student sups que as
amostras eram retiradas de populaes normalmente distribudas. Mesmo sem essa
suposio, mais tarde se constatou que so obtidos resultados satisfatrios para
quaisquer populaes (normais ou no) quando so utilizadas grandes amostras.

Lembre-se de que na seo anterior utilizamos para os testes de hipteses a

estatstica , a qual normalmente distribuda com mdia 0 e varincia 1,

ou seja, Z~N (0,1). Alm disso, segundo Johnson e Kuby (2013):

[...] quando um 2 conhecido usado para fazer uma inferncia


sobre a mdia , a amostra fornece um valor para aplicar
nas frmulas. Esse valor x. Quando o desvio padro da
amostra Dp(X) tambm usado, esta fornece dois valores: a
mdia amostral x e o erro padro estimado Var(X)/n. Como
resultado, a estatstica z ser substituda por uma estatstica
que representa o uso de um erro padro estimado. Essa nova
estatstica conhecida como a estatstica t de Student.

Desse modo, substituindo 2 por Var(X), temos:

Assimile

Estatstica z Estatstica t

Diremos que uma varivel T possui distribuio t de Student, e denotaremos

174 Estatstica inferencial (parte I)


U3

por , se sua f.d.p. dada por:

, com ,

em que denominada funo


Gama e v so os graus de Figura 3.16 | Distribuio z e distribuio t
liberdade. Veja na Figura 3.16
as distribuies normal padro
e t de Student, com v = 2.
Para calcularmos os graus de
liberdade efetuamos v = n 1, em
que n o tamanho da amostra
que estamos trabalhando. O
nmero de graus de liberdade
equivalente ao nmero de Fonte: O autor (2015).
desvios em relao mdia que
no esto relacionados. Para compreender melhor, lembre-se de que foi descrito
na seo 2.4 que a soma dos desvios igual a zero. Portanto, quando
temos n desvios xi x, somente n 1 destes tm liberdade de valor, pois o ltimo
desvio fica determinado pela relao .

No entraremos em detalhes acerca da f.d.p. da distribuio de Student ou da


funo Gama, pois nosso intuito utilizar valores tabelados para as probabilidades
relacionadas a essa distribuio.

Assimile

Graus de liberdade (v): nmero de desvios em relao mdia que


no esto relacionados entre si. Para calcular os graus de liberdade,
efetuamos v = n 1.

Tabela para a distribuio t

Diferentemente da distribuio Tabela 3.3 | Distribuio t de Student: valores de t tais que


c
z, em que possumos uma P(t tc) = (ou P(t tc) =
nica tabela, para a distribuio Nvel de significncia (a) unilateral
t teramos de ter uma grande v 0,1% 0,2% 0,5% 1% 2% 2,5% 5%
variedade, uma para cada grau 1 318,309 159,153 63,657 31,821 15,895 12,706 6,314
de liberdade. Entretanto, para o 2 22,327 15,764 9,925 6,965 4,849 4,303 2,920
nosso trabalho no necessria 3 10,215 8,053 5,841 4,541 3,482 3,182 2,353
4 7,173 5,951 4,604 3,747 2,999 2,776 2,132
uma tabela to completa quanto
5 5,893 5,030 4,032 3,365 2,757 2,571 2,015
a tabela Z, disponvel em

Estatstica inferencial (parte I) 175


U3

<http://www.leg.ufpr.br/~silvia/
6 5,208 4,524 3,707 3,143 2,612 2,447 1,943
CE001/tabela-normal.pdf>, 7 4,785 4,207 3,499 2,998 2,517 2,365 1,895
(Acesso em: 23 maio 2016) por 8 4,501 3,991 3,355 2,896 2,449 2,306 1,860
exemplo. Basta uma que possua 9 4,297 3,835 3,250 2,821 2,398 2,262 1,833
probabilidades-chave, as quais so 10 4,144 3,716 3,169 2,764 2,359 2,228 1,812
muito utilizadas, como mostra a Ta- 11 4,025 3,624 3,106 2,718 2,328 2,201 1,796

bela 3.3. O cabealho dessa tabela 12 3,930 3,550 3,055 2,681 2,303 2,179 1,782
13 3,852 3,489 3,012 2,650 2,282 2,160 1,771
fornece os nveis de significncia ou,
14 3,787 3,438 2,977 2,624 2,264 2,145 1,761
em outras palavras, as probabilidades
15 3,733 3,395 2,947 2,602 2,249 2,131 1,753
de ocorrncia. A coluna da esquerda 16 3,686 3,358 2,921 2,583 2,235 2,120 1,746
apresenta os graus de liberdade, 17 3,646 3,326 2,898 2,567 2,224 2,110 1,740
e o corpo da tabela apresenta os 18 3,610 3,298 2,878 2,552 2,214 2,101 1,734
valores tc (t calculado), tais que a rea 19 3,579 3,273 2,861 2,539 2,205 2,093 1,729
esquerda de tc , abaixo da curva 20 3,552 3,251 2,845 2,528 2,197 2,086 1,725
21 3,527 3,231 2,831 2,518 2,189 2,080 1,721
de densidade de probabilidade e
22 3,505 3,214 2,819 2,508 2,183 2,074 1,717
acima do eixo horizontal, igual a
23 3,485 3,198 2,807 2,500 2,177 2,069 1,714
a. Essa tabela pode ser mais bem 24 3,467 3,183 2,797 2,492 2,172 2,064 1,711
interpretada com o auxlio da Figura 25 3,450 3,170 2,787 2,485 2,167 2,060 1,708
3.17. 26 3,435 3,158 2,779 2,479 2,162 2,056 1,706
27 3,421 3,147 2,771 2,473 2,158 2,052 1,703
Alguns valores de 28 3,408 3,136 2,763 2,467 2,154 2,048 1,701
probabilidades que no 29 3,396 3,127 2,756 2,462 2,150 2,045 1,699
constam na tabela T tambm 30 3,385 3,118 2,750 2,457 2,147 2,042 1,697
podem ser obtidos por meio Fonte: O autor (2015).

Figura 3.17 | rea correspondente a: (a) P(t tc); (b) P(t tc)
das propriedades
apresentadas na seo
3.1, tambm vlidas para
a distribuio t, entre as
quais destacamos:

Fonte: O autor (2015).

Observe que a Tabela 3.3 tem valores de tc para graus de liberdade variando
de 1 a 30. Algumas tabelas, como a disponvel no link <http://www.ime.unicamp.
br/~cnaber/Tabela%20t.pdf> (Acesso em: 23 maio 2016), apresentam valores de tc
para graus de liberdade acima de 30, contudo, de modo mais espaado e at, no
mximo, 130 graus de liberdade. Pergunta: por que no construir tambm uma

176 Estatstica inferencial (parte I)


U3

tabela para v > 130? A resposta simples: quanto mais graus de liberdade temos,
mais a curva de densidade da distribuio t se aproxima da curva normal padro.
Logo, quando tivermos muitos graus de liberdade, podemos utilizar a tabela Z em
vez da tabela T.

Veja um exemplo de aplicao da tabela T.

Exemplificando

Uma varivel X~N (,2) estudada em determinada populao.


Parte dos pesquisadores suspeita que = 1 = 55 e outros que =
2 = 50. No intuito de pr prova essas suspeitas eles decidiram fazer
testes para identificar qual delas a correta. Para isso, foi retirada uma
amostra da populao, a qual apresentada a seguir.

49 50 48 51 47 48 55 50 55 49 51 53

Com 95% de confiana, qual a verdadeira mdia da populao, 1 =


55 ou 2 = 50?
Resoluo:

Observe que este o mesmo exemplo apresentado na Seo 3.3, com


a diferena de que agora no conhecemos a varincia populacional.
Apesar disso, os passos a serem seguidos so os mesmos:

Vamos inicialmente testar se = 1 = 55.

Passo 1 (elaborar as hipteses):

H0: = 55 H1: 55

Passo 2 (determinar a estatstica de teste): como a varincia


populacional desconhecida, a estatstica ser com v
= 11 graus de liberdade.
Passo 3 (fixar o nvel de significncia):

Passo 4 (calcular a estatstica a partir da amostra): a mdia amostral


e .

Rejeitaremos a hiptese H0 caso o valor x obtido a partir da amostra


seja muito maior ou muito menor que 1 = 55 ou, ainda, quando x
pertencer regio crtica

ou . Observando a tabela T na linha v

Estatstica inferencial (parte I) 177


U3

= 11 e coluna correspondente probabilidade 2,5% (pois o teste


bilateral), temos:

ou .

Passo 5 (tomar uma deciso): como , decidimos rejeitar H0,


isto , h indcios suficientes que nos permitem refutar a possibilidade
de a mdia populacional ser 1 = 55.

Vamos testar agora se = 2 = 50.

Passo 1 (elaborar as hipteses):

H0: = 50 H1: 50

Passo 2 (determinar a estatstica de teste): como a varincia


populacional desconhecida, a estatstica ser com v
= 11 graus de liberdade.
Passo 3 (fixar o nvel de significncia):

Passo 4 (calcular a estatstica a partir da amostra): a mdia amostral


e . Logo:

Observe na tabela T que, medida que percorremos suas colunas da


esquerda para a direita, o valor aumenta e os valores de tc diminuem.
Assim, tc = 0,655 (menor que todos os valores da tabela T) deve
corresponder a um valor de tc maior que 5%. Em consequncia disso,
temos:

valor-p .

Mais precisamente, podemos verificar utilizando o computador ou uma


tabela T mais completa que o valor-p, nesse caso, igual a 52,62%.

Passo 5 (tomar uma deciso): como o valor-p maior que o nvel de


significncia = 5% estipulado, no podemos rejeitar H0, isto , no

178 Estatstica inferencial (parte I)


U3

h indcios suficientes que nos permitam refutar a possibilidade de a


mdia populacional ser 2 = 50.

Desse modo, em concordncia com o problema apresentado,


devemos concluir que a verdadeira mdia da populao 2 = 50.

Vejamos agora um exemplo de teste unilateral direita.

Exemplificando

Seja uma varivel X~N (,2) de dada populao. Foram levantadas


duas hipteses para a mdia populacional X:

H0: = 15 H1: > 15

Para testar essas hipteses, foi coletada uma amostra de tamanho n =


30 da qual se extraiu e 0,5.
Com 95% de confiana, possvel refutar a hiptese nula?

Resoluo:

Passo 1 (elaborar as hipteses):

H0: = 15 H1: > 15

Passo 2 (determinar a estatstica de teste): como a varincia


populacional desconhecida, a estatstica ser com v
= 29 graus de liberdade.
Passo 3 (fixar o nvel de significncia):

Passo 4 (calcular a estatstica a partir da amostra): e


0,5. Logo:

Observe na tabela T, na linha correspondente a v = 29, que o valor


que mais se aproxima de tc = 2,053 2,045, que corresponde a 2,5%.
Assim, temos:

valor-p .

Estatstica inferencial (parte I) 179


U3

Mais precisamente, podemos verificar utilizando o computador que o


valor-p, nesse caso, igual a 2,46%.

Passo 5 (tomar uma deciso): como o valor-p menor que o nvel de


significncia = 5% estipulado, podemos rejeitar H0, isto , h indcios
suficientes que nos permitem refutar a possibilidade de a mdia
populacional ser = 15.

Pesquise mais
Leia mais sobre os testes de hipteses com varincia desconhecida no
captulo 5 do material disponvel em: <http://www.est.ufpr.br/ce003/
material/apostilace003.pdf>. Acesso em: 23 maio 2016.

Sem medo de errar!

Observe que queremos novamente pr prova as afirmaes feitas pela em-


presa M: (1) o peso mdio dos funcionrios 80 kg; (2) a altura mdia maior ou
igual a 170 cm. A principal diferena com relao aos testes da seo anterior se
apresenta na distribuio que ser utilizada, pois no iremos mais supor que a vari-
ncia populacional conhecida. Denotando por X e Y, respectivamente, temos as
seguintes hipteses a serem testadas.

Problema 1 Problema 2

H0: X = 80 H0: Y = 170

H1: X 80 H1: Y < 170

Para ambos os problemas, o passo 1 j foi realizado, ou seja, as hipteses j


foram fixadas.

Problema 1: testar X = 80

Passo 2 (determinar a estatstica de teste): com v = 19 graus de


liberdade (veja Tabela 2.1).

Passo 3 (fixar o nvel de significncia): = 2%

Passo 4 (calcular a estatstica a partir da amostra): e 137,94.

180 Estatstica inferencial (parte I)


U3

Observe na tabela T, na linha correspondente a v = 19, que o valor que mais se


aproxima de tc = 1,504 1,729, que corresponde a 5%. Assim, temos:

valor-p .

Mais precisamente, podemos verificar utilizando o computador que o valor-p,


nesse caso, igual a 14,9%.

Passo 5 (tomar uma deciso): como o valor-p maior que o nvel de significncia
estipulado, no podemos rejeitar H0, isto , no h indcios suficientes que nos
permitam refutar a possibilidade de a mdia populacional ser X = 80.

Problema 2: testar Y = 170

Passo 2 (determinar a estatstica de teste): com v = 19 graus de


liberdade.

Passo 3 (fixar o nvel de significncia): = 2%

Passo 4 (calcular a estatstica a partir da amostra): e 60,45.

Observe na tabela T, na linha correspondente a v = 19, que o valor que mais se


aproxima de tc = 1,639 1,729, que corresponde a 5%. Assim, temos:

valor-p = .

Mais precisamente, podemos verificar utilizando o computador que o valor-p,


nesse caso, igual a 5,88%.

Passo 5 (tomar uma deciso): como o valor-p maior que o nvel de significncia
estipulado, no podemos rejeitar H0, isto , no h indcios suficientes que nos
permitam refutar a possibilidade de a mdia populacional ser Y = 170.

Portanto, considerando que a empresa N tenha acesso aos dados amostrados


na Tabela 2.1 e o nvel de significncia = 2%, no h indcios suficientes para
que ela consiga refutar a afirmao da empresa M de que o peso mdio de seus
funcionrios 80 kg e que a altura mdia deles maior ou igual a 170 cm.

Estatstica inferencial (parte I) 181


U3

Avanando na prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.

1. Competncias tcnicas No se aplica.

2. Objetivos de aprendizagem Realizar testes de hipteses pela abordagem valor-p.

3. Contedos relacionados Testes de hipteses para a mdia com varincia desconhecida.


Determinada mquina corta barras de metal com 50 cm, em
mdia, sendo o comprimento dessas barras uma varivel
X~(,2). Caso a mdia dos comprimentos seja diferente de 50
cm, h prejuzo para a empresa.
Alguns funcionrios suspeitam que a mquina esteja desregulada
4. Descrio da situao-
e que isso tem causado prejuzo. Para verificarem a suspeita,
problema
coletaram uma amostra de tamanho n = 28 e obtiveram x =
52,04 cm e Var(X) = 25 cm.
Utilizando a abordagem valor-p e o nvel de significncia = 5%,
verifique se h indcios suficientes para confirmar a suspeita dos
funcionrios.
Passo 1 (elaborar as hipteses):
H0: = 50 H1: 50
Passo 2 (determinar a estatstica de teste): com v =
27 graus de liberdade.
Passo 3 (fixar o nvel de significncia): = 5%
Passo 4 (calcular a estatstica a partir da amostra): x = 52,04 e
Var(X) = 25.

5. Resoluo da Situao Observe na tabela T, na linha correspondente a v = 27, que o


Problema: valor tc = 2,159, maior que 2,158 que corresponde a 2%. Assim,
temos:
valor-p < 2 2% = 4%.
Mais precisamente, podemos verificar utilizando o computador
que o valor-p, nesse caso, igual a 3,99%.
Passo 5 (tomar uma deciso): como valor-p < = 5% optamos
por rejeitar H0, ou seja, existem indcios suficientes de que a
mdia populacional diferente de = 50.
Conclumos que h indcios suficientes de que a suspeita dos
funcionrios pode ser confirmada.

182 Estatstica inferencial (parte I)


U3

Lembre-se

A distribuio normal padro (ou distribuio z) utilizada para os casos


em que a varincia populacional conhecida ou quando temos grandes
amostras (geralmente n > 120). Para pequenas amostras e varincia
populacional desconhecida, o correto utilizarmos a distribuio de
Student (ou distribuio t).

Graus de liberdade (v): nmero de desvios em relao mdia que


no esto relacionados entre si. Para calcular os graus de liberdade,
efetuamos v = n 1.

Faa voc mesmo

Junto a um colega, colete as informaes sobre o peso de todos os


alunos da turma. Um de vocs (primeiro) ir calcular a mdia e a
varincia 2, sem que o outro (segundo) veja os resultados. O primeiro
ir fazer ao segundo uma afirmao sobre a mdia, por exemplo, a
mdia = 70 kg (no necessariamente o verdadeiro valor de ). O
segundo, por sua vez, ir coletar uma amostra e formular uma hiptese
alternativa, por exemplo, a mdia diferente de 70 kg. Em seguida,
estipulando um nvel de significncia, o segundo ir testar as hipteses
para refutar ou no a afirmao do primeiro.

Faa valer a pena!

1. Em determinado teste de hipteses temos H0: = 20 e H1: 20.


Sabendo que a partir de uma amostra de tamanho n = 25 obteve-se x = 19
e Var(X) = 4, assinale a alternativa que contm a regio crtica para = 5%.
a) ou
b) ou
c) ou
d) ou
e) ou

Estatstica inferencial (parte I) 183


U3

2. Deseja-se testar as hipteses H0: = 60 e H1: > 60. Sabendo que a


partir de uma amostra de tamanho n = 30 obteve-se x = 61 e Var(X) = 9,
assinale a alternativa que contm a regio crtica para = 2,5%.
a)
b)
c)
d)
e)

3. Para testar as hipteses H0: = 100 e H1: < 100, coletou-se uma
amostra de tamanho n = 20 e obteve-se x = 98,84 e Var(X) = 9. Assinale a
alternativa que contm o valor-p.
a) 0,5% c) 2% e) 5%
b) 1% d) 2,5%

4. Suponha que para testar as hipteses H0: = 50 e H1: > 50 tenha-se


coletado uma amostra de tamanho n = 25, obtendo x = 51 e Var(X) = 16.
Assinale a alternativa correta.
a) 1% < valor-p < 2% c) 2,5% < valor-p < 5% e) valor-p = 5%
b) 2% <valor-p < 2,5% d) valor-p > 5%

5. Considere que para testar as hipteses H0: = 100 e H1: 80 tenha-se


coletado a seguinte amostra:
83 83 82 80 79 81 80 79 84 80 82 82
Considerando = 5%, assinale a alternativa correta:
a) No se pode rejeitar a hiptese nula, pois valor-p menor que 5%
b) Deve-se rejeitar a hiptese nula, pois valor-p menor que 5%
c) No se pode rejeitar a hiptese nula, pois valor-p maior que 5%
d) Deve-se rejeitar a hiptese nula, pois valor-p menor que 1%
e) No se pode rejeitar a hiptese nula, pois valor-p maior que 1%

184 Estatstica inferencial (parte I)


U3

6. Sejam as hipteses H0: = 500 e H1: < 500. Determine a regio crtica
para = 5%, sabendo que de uma amostra de tamanho n = 28 obteve-se x
= 498 e Var(X) = 100. Por fim, conclua se a hiptese nula deve ser rejeitada
ou no.

7. Para testar as hipteses H0: = 150 e H1: 150 coletou-se uma amostra
de tamanho n = 200, obtendo-se x = 151,46 e Var(X) = 64. Considerando
= 2%, verifique se a hiptese nula deve ser rejeitada ou no.

Estatstica inferencial (parte I) 185


U3

186 Estatstica inferencial (parte I)


U3

Referncias

ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatstica


aplicada administrao e economia. 2. ed. So Paulo: Cengage Learning, 2011.

CLIMATEMPO. Disponvel em: <http://www.climatempo.com.br>. Acesso em: 18


jun. 2015.

CRESPO, Antnio A. Estatstica fcil. 17. ed. So Paulo: Saraiva, 2002.

FREUND, John E. Estatstica aplicada: economia, administrao e contabilidade. 11.


ed. Porto Alegre: Bookman, 2006.

FUTPDIA. Disponvel em: <http://futpedia.globo.com/campeonato/copa-do-


mundo>. Acesso em: 13 maio 2015.

IBGE Instituto Brasileiro de Geografia e Estatstica. Populao presente e


residente. Disponvel em: <www.ibge.gov.br>. Acesso em: 14 maio 2015.

IBGE Instituto Brasileiro de Geografia e Estatstica. Produo vegetal. Disponvel


em: <www.ibge.gov.br>. Acesso em: 14 maio 2015.

JOHNSON, Robert; KUBY, Patrcia. Estatstica. So Paulo: Cengage Learning, 2013.

MEDEIROS, Valria Z. (Coord.). Mtodos quantitativos com Excel. So Paulo:


Cengage Learning, 2008.

MORETTIN, Luiz G. Estatstica bsica: probabilidade e inferncia. So Paulo:


Pearson Prentice Hall, 2010.

MORETTIN, Luiz G.; BUSSAB, Wilton O. Estatstica bsica. So Paulo: Saraiva, 2010.

UOL Esporte. Disponvel em: <http://esporte.uol.com.br/futebol/biografias/559/


pele>. Acesso em: 28 abr. 2015.

Estatstica inferencial (parte I) 187


Unidade 4

ESTATSTICA INFERENCIAL
(PARTE II)

Convite ao estudo

Muitas das pesquisas e investigaes que realizamos tm o objetivo de


verificar a existncia de relao entre duas variveis. A isso, damos o nome
de lei da oferta e da demanda. Por exemplo: o preo (X) e a quantidade
ofertada (Y) possuem uma relao direta, ou seja, um aumento no preo
implica um aumento na quantidade ofertada; j o preo (X) e a quantidade
demandada (Z) possuem uma relao inversa, isto , um aumento no
preo ocasiona uma reduo na quantidade demandada.

A lei da oferta e da demanda indica que as variveis X e Y esto


relacionadas, assim como as variveis X e Z. Uma vez cientes da existncia
de relao entre duas variveis, podemos fazer diversos questionamentos:
(1) a relao entre as duas variveis forte ou fraca? (2) a relao direta
ou inversa? (3) como medimos a relao entre duas variveis? (4) por que
estudar a relao entre duas variveis?

Para dar um direcionamento s possveis respostas para essas


perguntas, podemos imaginar a seguinte situao: colocar-se no papel
de um vendedor que necessita determinar a demanda de mercado de
um produto; e a seguinte situao (vista na unidade 2): supor que
um funcionrio de uma grande empresa e deve descrever o perfil dos
funcionrios.

Se soubermos que duas variveis esto relacionadas, teremos a


garantia de que, ao haver uma modificao em uma delas, a outra tambm
ser alterada. Com isso, saber se a relao forte ou fraca, direta ou
inversa, implica na modificao de uma varivel, conhecer a magnitude
U4

da alterao que ocorrer na outra varivel e o sentido dessa alterao


(positivo ou negativo).

A principal motivao para estudarmos a relao entre duas


variveis a possibilidade de prever resultados futuros ou inferir valores
no amostrados de uma populao. Lembre-se de que, na Unidade
2, foi perguntado aos funcionrios da empresa M qual era a avaliao
deles em relao s condies de trabalho e remunerao. Imagine
novamente que voc o funcionrio citado na Unidade 2. Ser que
essas variveis esto relacionadas? Quanto maior a remunerao,
maior a satisfao do funcionrio?

190 Estatstica inferencial (parte II)


U4

Seo 4.1

Correlao entre variveis quantitativas

Dilogo aberto

Nesta seo voc aprender a medir o grau de associao entre duas variveis.
Mensuramos essa associao por meio do coeficiente de correlao. Para ilustrar
esse conceito, imagine novamente que voc um funcionrio da empresa M e
que necessita avaliar a relao existente entre a satisfao em relao s condies
de trabalho e a satisfao em relao remunerao. Ser que, quanto maior
a satisfao em relao remunerao, mais satisfeitos ficam os funcionrios em
relao s condies de trabalho?

Para responder a essas perguntas voc dever elaborar um diagrama de


disperso e calcular o coeficiente de correlao.

No pode faltar

Bastante nfase foi dada at o momento para o tratamento de cada varivel


separadamente, estudada em dada populao. Anlises com essa caracterstica so
denominadas univariadas. O que ocorre que nem sempre estamos interessados
em estudar uma nica varivel de cada vez, mas sim duas ou mais e a relao entre
elas. Tais anlises so denominadas multivariadas. Neste livro nos limitaremos a
estudar o caso bivariado, ou seja, a anlise de duas variveis simultaneamente.

Veja como exemplo os dados da Tabela 4.1, amostrados a partir da populao


de crianas de 0 a 5 anos em determinada cidade.

Tabela 4.1 | Idade e altura de uma amostra de 24 crianas


Idade (em meses) 0 0 5 5 10 10 15 15 20 20 25 25
Altura (em cm) 49,1 49,7 52,4 51,0 61,6 61,2 57,1 50,4 71,6 67,0 63,6 70,7
Idade (em meses) 35 35 40 40 45 45 50 50 55 55 60 60
Altura (em cm) 85,3 77,5 87,0 82,8 83,5 84,1 86,5 101,7 101,3 104,2 110,1 110,7
Fonte: O autor (2015).

Estatstica inferencial (parte II) 191


U4

Observe que h um total de 24 observaes, ou seja, uma amostra de 24


crianas. Alm disso, de cada criana foram coletadas duas informaes, a saber,
a idade em meses e a altura em centmetros. Se denominarmos X a varivel idade e
Y a varivel altura, tambm podemos escrever as informaes anteriores da forma
(X, Y), em que o primeiro valor se refere idade e o segundo altura:
(0; 49,1), (0; 49,7), (5; 52,4), (5; 51), (10; 61,6), (10; 61,2), (15; 57,1), (15; 50,4), (20;
71,6), (20; 67), (25; 63,6), (25; 70,7), (30; 80,6), (30; 77,2), (35; 85,3), (35; 77,5), (40;
87), (40; 82,8), (45; 83,5), (45; 84,1), (50; 86,5), (50; 101,7), (55; 101,3), (55; 104,2),
(60; 110,1), (60; 110,7)

A escrita em pares
Figura 4.1 | Idade e altura de uma amostra de 24 crianas
ordenados (X, Y) ou
tambm (X; Y) muito
comum no mbito da anlise
bivariada, pois deixa bem clara
a associao do valor de X com
o seu Y correspondente, na
medida em que ambos foram
coletados de um mesmo
elemento da populao (no
caso, da mesma criana). Fonte: O autor (2015).
Podemos representar essas
informaes em um grfico de disperso, como se observa na Figura 4.1.

Voc aprendeu anteriormente que um grfico tem o objetivo de facilitar a leitura


e a interpretao dos dados, alm de dar uma ideia da distribuio de uma varivel.
Quando a anlise bivariada, os grficos tambm tm o objetivo de investigar a
presena de uma relao entre as variveis. Observando a Figura 4.1, o que voc
imagina em relao s variveis X e Y? Esperamos que voc tenha percebido que,
quanto maior a idade, maior a altura. Essa ideia nos parece bvia, mas nem sempre
a relao de dependncia entre duas variveis to clara assim.

Uma vez aceita a hiptese de relao de dependncia entre duas variveis,


surgem duas perguntas bsicas: (1) essa relao forte ou fraca? (2) de que
forma podemos mensurar essa relao?

Observando a Figura 4.1, imaginamos que se os pontos estivessem um pouco


mais organizados quase daria para traar uma linha reta passando por todos eles.
Essa nossa percepo indica que a relao de dependncia entre X e Y forte
e, alm disso, linear. Quando isso ocorre, dizemos que existe uma correlao
linear entre as variveis. Veja mais alguns exemplos na Figura 4.2, em que no eixo
horizontal representada uma varivel X e no eixo vertical uma varivel Y.

192 Estatstica inferencial (parte II)


U4

Assimile

Correlao: diz-se que duas variveis esto correlacionadas quando


existe uma relao de dependncia entre elas.

Correlao linear: duas variveis esto correlacionadas linearmente


quando a relao entre elas pode ser representada geometricamente
por meio de uma reta.

Figura 4.2 | Diagramas de disperso e correlao linear

(e)
(c) (d)
(a) (b) Correlao
Correlao Correlao
Sem correlao Correlao positiva altamente
altamente positiva negativa
negativa
Fonte: O autor (2015).

A Figura 4.2 (a) mostra um caso em que a varivel X e a varivel Y no esto


correlacionadas, isto , a variao de Y no explicada pela variao de X. J na
Figura 4.2 (b) e (c), h uma correlao linear positiva entre as duas variveis, e, alm
disso, a variao de Y mais bem explicada pela variao de X em (c). Por fim, na
Figura 4.2 (d) e (e), h uma correlao linear negativa entre as duas variveis, e,
alm disso, a variao de Y mais bem explicada pela variao de X em (e).

Assimile

Dizer que a correlao positiva implica afirmar que, quando X


aumenta, Y tambm aumenta; quando X diminui, Y tambm diminui.
Se a correlao negativa ocorre o contrrio: se X aumenta, Y diminui;
se X diminui, Y aumenta.

H ainda outros casos interessantes, os quais podem ser observados na Figura


4.3 a seguir. Na figura, em (a) e (b) h a correlao linear perfeita, em que todos
os pontos se encontram sobre uma mesma reta. Apesar de em (c) e (d) os pontos
estarem sobre uma mesma reta, no h correlao entre as variveis, pois a

Estatstica inferencial (parte II) 193


U4

variao de uma no explicada pela variao da outra. Por fim, na Figura 4.3
(e) a correlao entre as variveis existe, mas no linear.

Figura 4.3 | Mais exemplos de diagrama de disperso

(a) (b) (e)


(c) (d)
Correlao Correlao Correlao no
Sem correlao Sem correlao
positiva perfeita negativa perfeita linear
Fonte: O autor (2015).

Uma vez identificada uma


Figura 4.4 | Diagrama de disperso para X e Y
correlao linear entre duas variveis
X e Y, como quantific-la? Para
responder a essa pergunta, observe
o exemplo da Figura 4.4. Note que
os pontos correspondem aos dados
bivariados (3,5), (4,7), (5,6), (7,9), (8,11)
e (9,10). Alm disso, esto traadas
as retas x e y, em que x = e y=
, isto , as mdias aritmticas dos
valores de X e Y, respectivamente. As
retas x e y se cruzam no ponto (6,8),
Fonte: O autor (2015).
denominado centroide. Tambm
esto representados no diagrama os desvios de cada valor em relao mdia.

Nesse exemplo, se multiplicarmos Tabela 4.2 | Produtos dos desvios


os desvios de X pelos desvios X 3 4 5 7 8 9
correspondentes de Y teremos Y 5 7 6 9 11 10
somente valores positivos, como xi x 3 2 1 +1 +2 +3
mostra a Tabela 4.2. Observe que (xi yi y 3 1 2 +1 +3 +2

x)(yi y) = 9 + 2 + 2 + 1 + 6 + 6 = i
(x x ) (y i
y )
9 2 2 1 6 6

26 > 0, o que define que a correlao Fonte: O autor (2015).


entre as variveis X e Y positiva. Se obtivssemos (xi x)(yi y) < 0, diramos
que a correlao seria negativa; e se (xi x)(yi y) = 0, X e Y seriam variveis no
correlacionadas. Definimos, ento, a covarincia.

194 Estatstica inferencial (parte II)


U4

Assimile

Sendo X e Y duas variveis contnuas, a covarincia entre X e Y dada


por , com n 2.

Observe que ao dividir o nmero (xi x)(yi y) por n 1 a interpretao feita


anteriormente continua a mesma, pois n 1 > 0. Podemos ainda escrever que
duas variveis X e Y:

Esto correlacionadas positivamente se Cov(X,Y) > 0;


Esto correlacionadas negativamente se Cov(X,Y) < 0;
No esto correlacionadas se Cov(X,Y) = 0.

Exemplificando

Observe os dados obtidos por amostragem para as variveis X, Y, Z e W.

X 5 10 15 20 25 30
Y 9 15 18 26 29 31
Z 125 130 75 50 50 0
W 90 2 85 8 106 43

Calcule Cov(X, Y), Cov(X, Z) e Cov(X, W) e classifique os pares de


variveis quanto correlao.

Resoluo:

x = 17,5; y 21,33; z 71,67; w 55,67.


;

.
Logo, X e Y esto correlacionadas positivamente, X e Z esto
correlacionadas negativamente e X e W no esto correlacionadas.

Estatstica inferencial (parte II) 195


U4

Neste momento pode ter surgido uma dvida: quanto maior a magnitude
da covarincia, mais fortemente esto relacionadas as variveis? A resposta no.
A covarincia influenciada pela escala, logo, quanto maiores os valores de um
conjunto de dados, maiores as chances de a covarincia assumir valores mais
elevados. Uma maneira de corrigir isso utilizar variveis padronizadas (xi x)/
Dp(X) e (yi y)/Dp(Y) e definir uma nova medida, o coeficiente de correlao:

Com essa transformao, 1 r + 1. Alm disso, se:

r > 0, as variveis esto correlacionadas positivamente;

r < 0, as variveis esto correlacionadas negativamente;

r = 0, as variveis no esto correlacionadas;

r = +1, temos uma correlao positiva perfeita;

r = 1, temos uma correlao negativa perfeita.

Quanto mais prximo de 1 se encontra o valor de |r|, mais forte a correlao;


quanto mais prximo de 0 se encontra o valor de |r|, mais fraca a correlao.
Alm disso, se rxy e rzw so os coeficientes de correlao das variveis X e Y e
das variveis Z e W, respectivamente, |rxy| > |rzw| implica que X e Y esto mais
fortemente correlacionadas do que Z e W.

Exemplificando

Utilizando as variveis do exemplo anterior, calcule os coeficientes de


correlao (X, Y), (X, Z) e (X, W) e verifique quais variveis esto
mais fortemente correlacionadas.

Resoluo:

Temos Dp(X) 9,35, Dp(Y) 8,69, Dp(Z) 49,67 e Dp(W) 44,46.

Logo:

196 Estatstica inferencial (parte II)


U4

Portanto, as variveis X e Y esto mais fortemente correlacionadas do


que as variveis X e Z e do que as variveis X e W.

Existe uma forma alternativa (mais prtica) de calcular o coeficiente de


correlao. Para utiliz-la, necessrio definir SQ(x), SQ(y) e SQ(xy):

Soma dos quadrados para x:

Soma dos quadrados para y:

Soma dos quadrados para x e y:

Com essa definio, temos:

Exemplificando

Utilizando a frmula , calcule o coeficiente


de correlao para as variveis X e Y, cujos dados amostrais foram
apresentados na Tabela 4.1, e classifique as variveis quanto
correlao.

Resoluo:

Estatstica inferencial (parte II) 197


U4

Portanto, as variveis X e Y esto positivamente correlacionadas.

Pesquise mais
Complemente e aprofunde seus estudos sobre covarincia e
coeficiente de correlao atravs do link: <http://www.cprm.gov.br/
publique/media/cap9-correl_regres.pdf>. Acesso em: 6 jul. 2015.

Sem medo de errar

Observe a seguir os dados referentes s variveis G: satisfao em relao s


condies de trabalho e H: satisfao em relao remunerao.

H 7 4 5 5 7 4 5 4 4 4 8 7 4 3 4 3 5 6 6 8
G 8 5 1 4 10 5 5 5 4 5 9 7 3 4 2 5 1 7 10 9

O diagrama de disperso Figura 4.5 | Diagrama de disperso para G e H


para os dados pode ser
observado na Figura 4.5.

Observa-se no diagrama
que existe uma tendncia
positiva nos dados, ou seja,
quanto maior a satisfao
em relao remunerao,
maior a satisfao em relao
s condies de trabalho.
Vamos agora medir o grau de Fonte: O autor (2015).

198 Estatstica inferencial (parte II)


U4

associao de H e G.

Temos:

Portanto, as variveis H e G esto correlacionadas positivamente e, alm disso,


como r 0,707, essa correlao forte.

Avanando na prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.
1. Competncia de Conhecer os conceitos matemticos bsicos e proporcionar
fundamentos de rea o desenvolvimento do raciocnio lgico e quantitativo.
2. Objetivos de Mensurar a relao entre duas variveis por meio do
aprendizagem coeficiente de correlao linear.
3. Contedos relacionados Correlao; covarincia; coeficiente de correlao.

A seguir, consta o valor gasto com propaganda e a quantidade


vendida de um produto no mesmo ms.
Gastos com propaganda
4. Descrio da situao- 10,0 11,0 12,2 13,8 14,4 15,5
( R$ 1.000)
problema
Unidades vendidas
9,8 9,7 12,6 14,4 13,6 16,2
( 10.000)

Verifique se essas variveis esto correlacionadas linearmente.

Estatstica inferencial (parte II) 199


U4

Considere X: gasto com propaganda e Y: unidades vendidas.


Temos:

5. Resoluo da situao-
problema

Como r 0,960, as variveis X e Y esto fortemente


correlacionadas linearmente e positivamente.

Lembre-se

Duas variveis esto correlacionadas quando existe uma relao de


dependncia entre elas.

Dizer que a correlao positiva implica afirmar que, quando X


aumenta, Y tambm aumenta; quando X diminui, Y tambm diminui.
Se a correlao negativa ocorre o contrrio: se X aumenta, Y diminui;
se X diminui, Y aumenta.

Duas variveis podem ser classificadas como: correlacionadas


positivamente, se r > 0; correlacionadas negativamente, se r < 0; no
correlacionadas, se r = 0; correlacionadas positiva e perfeitamente, se
r = +1; e correlacionadas negativa e perfeitamente, se r = 1.

Faa voc mesmo

Faa uma amostragem com os seus colegas de classe sobre a


satisfao em relao s condies de trabalho e a satisfao em
relao remunerao. Em seguida, verifique se essas variveis esto
correlacionadas.

200 Estatstica inferencial (parte II)


U4

Faa valer a pena

1. Considere o conjunto de dados bivariados (X, Y), em que, por


amostragem, coletou-se:
(5, 3), (14, 11), (15, 14), (5, 3), (9, 11), (13, 14), (7, 4)
Assinale a alternativa que contm o valor aproximado de Cov(X, Y).
a) 20,02 c) 22,22 e) 20,22
b) 22,02 d) 22,20

2. Assinale a alternativa que contm o coeficiente de correlao do


conjunto:
(16, 59), (16, 39), (47, 68), (23, 22), (15, 55), (34, 48)
a) 0,8543 c) 0,3584 e) 0,3845
b) 0,5834 d) 0,3485

3. Considere o seguinte conjunto de dados, obtidos por amostragem.

X 75 59 32 54 20
Y 78 63 39 59 26
Z 13 23 54 31 63
W 9 87 12 93 56

Assinale a alternativa correta:


a) X e Y no esto correlacionadas.
b) X e W esto correlacionadas positivamente.
c) X e Z esto correlacionadas negativamente.
d) X e Y esto positivamente correlacionadas, assim como X e Z.
e) X e Z no esto correlacionadas.

Estatstica inferencial (parte II) 201


U4

4. Considere as variveis X, Y, Z e W, para as quais temos Cov(X, Y) = 10,


Cov(X, Z) = 15, Cov(X, W) = 18, Dp(X) = 2, Dp(Y) = 6, Dp(Z) = 8 e Dp(W) = 10.
Assinale a alternativa correta:
a) (X, Y) = (X, Z) < (X, W) d) (X, Y) > (X, Z) = (X, W)
b) (X, Y) < (X, Z) < (X, W) e) (X, Y) > (X, Z) > (X, W)
c) (X, Y) < (X, W) < (X, Z)

5. Considere as variveis X, Y e Z, tais que Cov(X, Y) = 50, Cov(X, Z) = 60,


Dp(X) = 10, Dp(Y) = 15 e Dp(Z) = 10. Assinale a alternativa correta:
a) (X, Y) > (X, Z), o que indica que as variveis X e Y esto mais fortemente
relacionadas do que X e Z.
b) |(X, Z)| > |(X, Y)|, o que indica que as variveis X e Z esto mais
fortemente relacionadas do que X e Y.
c) |(X, Z)| = |(X, Y)|.
d) |(X, Z)| < |(X, Y)|, o que indica que as variveis X e Y esto mais
fortemente relacionadas do que X e Z.
e) |(X, Z)| = |(X, Y)|.

6. Classifique as variveis X e Y como correlacionadas positivamente,


correlacionadas negativamente ou no correlacionadas.

X 40 68 17 41 41 65
Y 51 19 73 55 45 32

7. Considere os valores amostrados para as variveis X, Y e Z a seguir.

X 118 122 139 119 127


Y 167 170 190 177 186
Z 189 193 177 191 190

Verifique quais variveis esto mais fortemente correlacionadas: X e Y ou


X e Z.

202 Estatstica inferencial (parte II)


U4

Seo 4.2
Teste de significncia

Dilogo aberto

Voc aprendeu na seo anterior a mensurar a correlao entre duas variveis


quantitativas por meio do coeficiente de correlao. Vale ressaltar que esse
coeficiente mede o grau de associao linear entre duas variveis, isto , mede o
quanto os pontos (X, Y) em um diagrama de disperso se aproximam de uma reta.

As anlises feitas para avaliar a fora de associao entre as variveis X e Y


foram apenas subjetivas, considerando quo prximo o coeficiente de correlao
se encontrava de 1 ou +1. Entretanto, em estatstica, a ferramenta utilizada para
comprovar algo o teste estatstico de hipteses. Logo, alm de calcularmos
o coeficiente de correlao r, precisamos verificar sua significncia. Para
prosseguirmos com essa anlise, vamos relembrar a situao-problema proposta
na seo anterior: imagine novamente que voc um funcionrio da empresa M e
que necessita avaliar a relao existente entre a satisfao em relao s condies
de trabalho e a satisfao em relao remunerao. Ser que, quanto maior
a satisfao em relao remunerao, mais satisfeitos ficam os funcionrios em
relao s condies de trabalho?

Verificamos na seo anterior que o coeficiente de correlao para a amostra


apresentada na Tabela 2.1 r 0,707, e afirmamos que nesse caso a correlao
forte. A fim de sustentarmos essa afirmao, precisamos test-la. Para isso, que
procedimentos devemos adotar?

No pode faltar

Voc aprendeu que o coeficiente de correlao r calculado a partir de dados


bivariados (X, Y) e mede o grau de associao entre as variveis X e Y. O coeficiente
r varia no intervalo [1, +1], e, alm disso:

Estatstica inferencial (parte II) 203


U4

Assimile

Se r > 0, a correlao entre X e Y positiva, e, quanto mais prximo


r estiver de +1, mais fortemente as variveis esto correlacionadas.
Se r < 0, a correlao entre X e Y negativa, e, quanto mais prximo
r estiver de 1, mais fortemente as variveis esto correlacionadas.
Se r = 0, no h correlao entre X e Y.

Obviamente, se r 0, mas no exatamente igual a zero, temos indcios de que


as variveis no esto correlacionadas.

O teste de hipteses utilizado para testar a fora de uma correlao por


meio do coeficiente r denominado teste de significncia. Segundo Larson e
Farber (2010, p. 403):

[...] as hipteses nula e alternativa para os testes so:

Teste unilateral esquerda


(correlao negativa significante)

Teste unilateral direita


(correlao positiva significante)

Teste bilateral
(correlao significante)

[...].

Alm disso:

Assimile

[...] um teste t pode ser usado se a correlao entre duas variveis for
significante. A estatstica de teste r e a estatstica de teste padronizada

segue uma distribuio t com n 2 graus de liberdade.

204 Estatstica inferencial (parte II)


U4

Para facilitar a compreenso, vamos testar a significncia do coeficiente de


correlao para os dados apresentados na Figura 4.1.

Exemplificando

Na seo anterior apresentamos o diagrama de disperso para os


dados correspondentes idade (X) e altura (Y) de uma amostra de 24
crianas de 0 a 5 anos. Ao final da seo, obtivemos r = 0,967 para a
correlao entre essas variveis. Com 95% de confiana, o valor r =
0,967 indica que a correlao significante?
Resoluo:

Para testar a significncia da correlao, executamos os seguintes passos:

Passo 1 (elaborar as hipteses):

H0: = 0 (no h correlao significante).


H1: 0 (correlao significante).
Passo 2 (determinar a estatstica de teste):

com v = n 2 graus de liberdade.

Passo 3 (fixar o nvel de significncia): = 100% 95% = 5%

Passo 4 (calcular a estatstica a partir da amostra):

Rejeitaremos a hiptese H0 caso o valor tc obtido a partir da amostra


seja muito maior ou muito menor que = 0 ou, ainda, quando tc
pertencer regio crtica RC = {T = |T t ou T t}, em que t
obtido na tabela T. Observando a tabela na linha v = 24 2 = 22 e na
coluna correspondente probabilidade 2,5% (pois o teste bilateral),
temos t = 2,074. Logo, RC = {T |T 2,074 ou T 2,074}.

Obtivemos r = 0,967 a partir de uma amostra de tamanho n = 24,


logo, calculamos:

Passo 5 (tomar uma deciso): como tc RC, decidimos rejeitar H0, isto
, h indcios suficientes que nos permitem considerar a correlao
entre idade e altura significante.

Estatstica inferencial (parte II) 205


U4

Vejamos agora o caso de um teste de hipteses unilateral esquerda.

Exemplificando

Analise os dados bivariados na forma (X, Y) a seguir e verifique,


para o nvel de significncia = 2%, se a correlao entre X e Y
negativamente significante.

(54, 7), (60, 2), (48, 25), (57, 17), (57, 8)

Resoluo:

Temos:

( x) ( 54 ++ 57 )
2 2
2762
SQ ( x ) = x 2

n
(
= 54 ++ 57
2 2
)
5
= 15318
5

SQ ( x ) = 82, 8

( y) ( 7 ++ 8)
2 2
592
SQ ( y ) = y 2

n
(
= 7 ++ 8
2 2
)
5
= 1031
5
SQ ( y ) = 334, 8

SQ ( xy ) = xy
( x)( y)
n

SQ ( xy ) = ( 54 7 ++ 57 8 )
( 54 ++ 57 ) ( 7 ++ 8)
5

276 59
SQ ( xy ) = 3123 = 133, 8
5
SQ ( xy ) 133, 8
r= = 0, 8036
SQ ( x ) SQ ( y ) 82, 8 334, 8

Conhecendo-se o valor de r, podemos agora testar a significncia.

Passo 1 (elaborar as hipteses):

H 0 : 0 (no h correlao negativa significante).

206 Estatstica inferencial (parte II)


U4

H1 : < 0 (correlao negativa significante).

Passo 2 (determinar a estatstica de teste):


r
tc =
1 r com v = n 2 graus de liberdade.
n2
Passo 3 (fixar o nvel de significncia): = 2% (dado).

Passo 4 (calcular a estatstica a partir da amostra):

Rejeitaremos a hiptese H0 caso o valor tc obtido a partir da amostra seja


muito menor que = 0 ou, ainda, quando tc pertencer regio crtica
RC = {T | T t}, em que t obtido na tabela T. Observando
a tabela na linha v = 52 = 3
e na coluna correspondente
probabilidade 2%, temos t = 3, 482 . Logo, RC = {T | T 3, 482} .

Obtivemos r = 0, 8036 a partir de uma amostra de tamanho n = 5,


logo, calculamos:

r 0, 8036
tc = = 2, 339 RC
1 r 1 ( 0, 8036 )
n2 52

Passo 5 (tomar uma deciso): como tc RC , decidimos no rejeitar


H0, isto , no h indcios suficientes que nos permitam considerar a
correlao entre X e Y negativamente significante.

Por fim, vejamos o caso de um teste de hipteses unilateral direita.

Exemplificando

Analise os dados bivariados na forma ( X , Y ) a seguir e verifique,


para o nvel de significncia = 2% , se a correlao entre X e Y
positivamente significante.

(54, 49), (27, 35), (15, 6), (59, 64), (32, 42)

Resoluo:

Temos:

Estatstica inferencial (parte II) 207


U4


( x) ( 54 ++ 32 )
2 2
187 2
SQ ( x ) = x 2

n
(
= 54 ++ 32
2 2
)
5
= 8375
5

SQ ( x ) = 1381, 2

( y) ( 49 ++ 42 )
2 2
1962
SQ ( y ) = y 2

n
(
= 49 ++ 42
2 2
)
5
= 9522
5

SQ ( y ) = 1838, 8

SQ ( xy ) = xy
( x)( y)
n

SQ ( xy ) = ( 54 49 ++ 32 42 )
( 54 ++ 32 ) ( 49 ++ 42 )
5

187 196
SQ ( xy ) = 8801 = 1470, 6
5

SQ ( xy ) 1470, 6
r= = 0, 923
SQ ( x ) SQ ( y ) 1381, 2 1838, 8

Conhecendo-se o valor de r , podemos agora testar a significncia.


Passo 1 (elaborar as hipteses):

H 0 : 0 (no h correlao positiva significante).


H1 : > 0 (correlao positiva significante).
Passo 2 (determinar a estatstica de teste):
r
tc = com v = n 2 graus de liberdade.
1 r
n2
Passo 3 (fixar o nvel de significncia): = 2% (dado).

Passo 4 (calcular a estatstica a partir da amostra):

Rejeitaremos a hiptese H0 caso o valor tc obtido a partir da amostra

208 Estatstica inferencial (parte II)


U4

seja muito maior que = 0 ou, ainda, quando tc pertencer regio


crtica RC = {T | T t}, em que t obtido na tabela T. Observando
a tabela na linha v = 5 2 = 3 e na coluna correspondente
probabilidade 2%, temos t = 3, 482 . Logo, RC = {T | T 3, 482} .

Obtivemos r = 0, 923 a partir de uma amostra de tamanho n = 5 ,


logo, calculamos:
r 0, 923
tc = = 4,155 RC
1 r 1 ( 0, 923)
n2 52

Passo 5 (tomar uma deciso): como tc RC , decidimos rejeitar H0,


isto , h indcios suficientes que nos permitem considerar a correlao
entre X e Y positivamente significante.

Pesquise mais
Leia mais sobre o teste de significncia no material disponvel no link:
<http://people.ufpr.br/~jomarc/correlacao.pdf> (acesso em: 13 jul. 2015).

Sem medo de errar

Vamos relembrar a situao-problema proposta no incio desta seo: imagine


novamente que voc um funcionrio da empresa M e que necessita avaliar
a relao existente entre a satisfao em relao s condies de trabalho e a
satisfao em relao remunerao. Ser que quanto maior a satisfao em
relao remunerao, mais satisfeitos ficam os funcionrios em relao s
condies de trabalho?

Na seo anterior foi verificado que o coeficiente de correlao entre G:


satisfao em relao s condies de trabalho e H: satisfao em relao
remunerao r 0, 707 . Alm disso, essa medida foi obtida a partir de uma
amostra de tamanho n = 20 , apresentada na Tabela 2.1. Para testar a significncia
de r , executamos os seguintes passos:

Passo 1 (elaborar as hipteses):

H 0 : 0 (no h correlao positiva significante).

Estatstica inferencial (parte II) 209


U4

H1 : > 0 (correlao positiva significante).

Passo 2 (determinar a estatstica de teste):


r
tc =
1 r
com v = n2 graus de liberdade.
n2
Passo 3 (fixar o nvel de significncia): suponha = 5% .

Passo 4 (calcular a estatstica a partir da amostra):

Rejeitaremos a hiptese H0 caso o valor tc obtido a partir da amostra seja muito


maior que = 0 ou, ainda, quando tc pertencer regio crtica RC = {T | T t}, em que
t obtido na tabela T. Observando a tabela na linha v = 20 2 = 18 e na coluna
correspondente probabilidade 5%, temos t = 1, 734 . Logo, RC = {T | T 1, 734}.

Obtivemos r 0, 707 a partir de uma amostra de tamanho n = 20 , logo,


calculamos:

r 0, 707
tc = = 4, 241 RC
1 r 1 ( 0, 707 )
n2 20 2

Passo 5 (tomar uma deciso): como tc RC , decidimos rejeitar H0, isto ,


h indcios suficientes que nos permitem considerar a correlao entre G e H
positivamente significante.

Avanando na prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.
1. Competncia de Conhecer os conceitos matemticos bsicos e proporcionar
fundamentos de rea o desenvolvimento do raciocnio lgico e quantitativo.
2. Objetivos de
Testar a significncia da correlao entre duas variveis.
aprendizagem
3. Contedos relacionados Coeficiente de correlao; teste de significncia.

210 Estatstica inferencial (parte II)


U4

A seguir, consta o valor gasto com propaganda e a quantidade


vendida de um produto no mesmo ms.
Gastos com propaganda
10,0 11,0 12,2 13,8 14,4 15,5
4. Descrio da situao- ( R$ 1.000)
problema Unidades vendidas
9,8 9,7 12,6 14,4 13,6 16,2
( 10.000)

Teste a significncia da correlao linear entre as variveis


gastos com propaganda e unidades vendidas.

Na seo anterior obtivemos para esses dados r 0, 960 ,


e conclumos que as variveis X : gastos com propaganda
e Y : unidades vendidas esto correlacionadas linearmente e
positivamente. Vamos pr prova essa afirmao testando a
significncia de r .

Passo 1 (elaborar as hipteses):


H0 : 0 (no h correlao positiva significante).

H1 : > 0 (correlao positiva significante).

Passo 2 (determinar a estatstica de teste):


r
tc = com v = n2 graus de liberdade.
1 r
n2
5. Resoluo da situao- Passo 3 (fixar o nvel de significncia): suponha = 5% .
problema
Passo 4 (calcular a estatstica a partir da amostra):
Rejeitaremos a hiptese H0 caso o valor tc obtido a partir
da amostra seja muito maior que = 0 ou, ainda, quando
tc pertencer regio crtica RC = {T | T t}, em
que t obtido na tabela T. Observando a tabela na linha
v = 6 2 = 4 e na coluna correspondente probabilidade
5%, temos t = 2,132 . Logo, RC = {T | T 2,132}.
Obtivemos r 0, 960 a partir de uma amostra de tamanho
n = 6 , logo, calculamos:
r 0, 960
tc = = 6, 857 RC
1 r 1 ( 0, 960 )
n2 62

Passo 5 (tomar uma deciso): como tc RC , decidimos


rejeitar H0, isto , h indcios suficientes que nos permitem
considerar a correlao entre X e Y positivamente significante.

Estatstica inferencial (parte II) 211


U4

Lembre-se

Segundo Larson e Farber (2010, p. 403), [...] um teste t pode ser usado
se a correlao entre duas variveis for significante. A estatstica de teste
r r
r e a estatstica de teste padronizada tc = = segue uma
r 1 r
n2
distribuio t com n - 2 graus de liberdade.

Faa voc mesmo

Utilize os dados amostrados de seus colegas de classe na seo anterior,


sobre a satisfao em relao s condies de trabalho e a satisfao
em relao remunerao, e teste a significncia da correlao entre
essas variveis com um teste bilateral ao nvel de confiana de 95%.

Faa valer a pena

1. Considere o conjunto de dados bivariados (X, Y) em que, por amostragem,


coletou-se:
(5, 3), (14, 11), (15, 14), (5, 3), (9, 11), (13, 14), (7, 4)
Assinale a alternativa que contm o valor aproximado do coeficiente de
correlao entre X e Y.
a) 0,92365 c) 0,93265 e) 0,35629
b) 0,92634 d) 0,29356

2. Observe a amostra coletada para os dados bivariados (X, Y) a seguir.

X 1276 1445 1681 1917 1953 1584


Y 1108 1688 1494 2127 2108 1696

Assinale a alternativa que contm o valor aproximado da estatstica de

212 Estatstica inferencial (parte II)


U4

r
teste tc = considerando os dados anteriores.
1 r
n2

a) 3,9905 c) 3,8940 e) 0,8094


b) 0,8940 d) 0,9804

3. Considere as variveis X e Y para as quais foi coletada a amostra a seguir.

X 20 80 40
Y 42 150 81

Assinale a alternativa que contm o menor valor de para o qual, em um


teste de significncia bilateral, a hiptese nula seja rejeitada, ou seja, o
menor para o qual a correlao seja significante.
a) 1% c) 4% e) 10%
b) 2% d) 5%

4. Observe as amostras coletadas para as variveis X, Y, Z e W.

X 83 85 78
Y 93 95 61
Z 56 125 115
W 22 17 44

Existe um indicativo de correlao entre as variveis: X e Y, X e Z, X e W.


Com 90% de confiana, possvel afirmar que:
a) As variveis X e Y e as variveis X e Z possuem correlao significante.
b) As variveis X e Y e as variveis X e W possuem correlao significante.
c) Apenas X e W possuem correlao significante.
d) Apenas X e Y possuem correlao significante.
e) Apenas X e Z possuem correlao significante.

Estatstica inferencial (parte II) 213


U4

5. Duas variveis X e Y esto correlacionadas linearmente, sendo r = 0,7976


obtido a partir de uma amostra de tamanho n = 9. Teste a significncia
de r por meio de um teste bilateral e assinale a alternativa que contm o
valor-p:
a) 1% c) 4% e) 10%
b) 2% d) 5%

6. O coeficiente de correlao entre as variveis X e Y, calculado a partir


de uma amostra de tamanho n = 20, r = 0,85. Construa a regio crtica
para o teste bilateral de significncia para r com = 5%.

7. H indcios de que a correlao entre as variveis X e Y seja significante.


Para comprovar essa suspeita, coletou-se a amostra a seguir.

X 44 28 76 49
Y 62 41 92 60

Utilize a abordagem valor-p para testar bilateralmente a significncia da


correlao entre essas variveis com 98% de confiana.

214 Estatstica inferencial (parte II)


U4

Seo 4.3
Regresso linear

Dilogo aberto

Voc aprendeu nas sees anteriores a mensurar a correlao linear entre


duas variveis e a testar a significncia dessa correlao por meio de um teste
estatstico de hipteses. Vale lembrar que o ndice que foi utilizado (o coeficiente
de correlao) mede a correlao linear, ou seja, mede o quanto os pontos em um
diagrama de disperso se aproximam de uma reta. Ressaltamos isso porque no
existe somente a correlao linear, mas sim uma grande variedade de associaes
entre duas variveis, tais como a polinomial, a exponencial e a logartmica.

Ao comprovarmos a significncia da correlao linear entre duas variveis, alguns


questionamentos podem surgir: (1) h como estabelecer uma relao matemtica,
uma regra de associao entre uma varivel X e uma varivel Y? (2) possvel realizar
uma previso pontual de Y a partir de um valor de X no amostrado?

Para darmos continuidade a essa investigao, considere a seguinte situao:


imagine novamente que voc um funcionrio da empresa M e que foi incumbido
de descrever o perfil dos funcionrios. A partir da Tabela 2.1, possvel estabelecer
uma relao matemtica entre a satisfao em relao remunerao e a satisfao
em relao s condies de trabalho? Um funcionrio que avalie sua satisfao
em relao remunerao com a pontuao 9 avaliar com qual pontuao a
satisfao em relao s condies de trabalho?

Veremos nesta seo um mtodo para relacionar matematicamente duas


variveis correlacionadas linearmente. Vamos l!

No pode faltar

Quando testamos a significncia da correlao linear entre duas variveis X e


Y , verificamos se os dados sustentam a hiptese de que a correlao entre elas
no nula, ou seja, de que as variaes de Y so influenciadas pelas variaes de X
de modo linear. Sabendo dessa influncia, algo natural questionar se para um valor
especfico de X , no amostrado, possvel prever o valor correspondente de Y .

Estatstica inferencial (parte II) 215


U4

Para compreender melhor essa ideia, observe o diagrama da Figura 4.6, obtido
a partir da Tabela 4.1. A linha que foi acrescentada aquela que melhor se ajusta
aos pontos e busca sinalizar uma tendncia nos dados. Com base nisso, que valor
voc espera obter para y , dado que x = 57 , isto , qual seria a estatura de uma
criana com idade de 57 meses?

Voc pode verificar tanto na Figura 4.6 quanto na Tabela 4.1 que no h na
amostra uma criana com 57 meses de idade.

Logo, para realizar essa Figura 4.6 | Linha de tendncia para a idade e a
estimativa, voc deve se basear altura das crianas de 0 a 5 anos
nos demais valores amostrados e
considerar a tendncia indicada
pela linha vermelha. Esperamos
que voc perceba que o valor
esperado para y , nesse caso,
gira em torno de 100. Assim, a
previso para a altura de crianas
de 57 meses de idade um valor
prximo de 100 cm. Fonte: O autor (2015).

A linha reta representada na Figura 4.6, que a reta de melhor ajuste,


denominada reta de regresso. O papel desempenhado por essa reta o de
representar geometricamente a associao entre as variveis X e Y .

Uma linha reta descrita matematicamente por uma equao do tipo


y = a x + b , em que ae b so nmeros desconhecidos a serem determinados.
Uma vez calculados os nmeros a e b , tambm denominados coeficientes,
podemos calcular o valor de y para qualquer valor de x dado. Vale observar
que somente conseguiramos calcular os valores exatos de a e b se tivssemos
os valores populacionais de ( X , Y ) . Como a nossa anlise ser feita com base
em amostras, a equao y = ax+b da reta de regresso reescrita como
Figura 4.7 | Reta de regresso , em que , e so as estimativas para
para A1, A2 e A3
y, a e b.
Para compreender
Tabela 4.3 | Dados amostrados
como so calculados os para as variveis X e Y
valores de e a par-
X 1 3 7
tir de uma amostra de
Y 2 5 4
dados bivariados ( X , Y ) , Fonte: O autor (2015).
observe um exemplo de
amostra na Tabela 4.3 e o diagrama de disperso cor-
Fonte: O autor (2015). respondente, na Figura 4.7.

216 Estatstica inferencial (parte II)


U4

Voc pode verificar na Figura 4.7 que foi adicionada a reta de equao
e os erros cometidos ao aproximar os pontos A1, A2 e A3 por essa
reta. Os erros e1 , e2 e e3 so calculados por meio da diferena entre o valor de y
amostrado (vide Tabela 4.3) e o valor correspondente de calculado por meio da
reta de regresso, ou seja, .

Feito isso, como calculamos o erro total na aproximao pela reta de regresso?
Institivamente, poderamos pensar em adicionar os erros ei de cada aproximao,
ou seja, . Entretanto, ocorre aqui algo semelhante ao que aconteceu no estu-
do das medidas de disperso, em que sugerimos mensurar a disperso dos dados
efetuando ( xi x ) . Voc deve se lembrar de que essa soma igual a zero. O
que foi sugerido para driblar esse inconveniente elevar ao quadrado cada desvio,
ou seja, ( xi x ) 2
. Essa mesma estratgia pode ser utilizada para calcular o erro
de aproximao da reta de regresso, e, assim, definimos a soma dos quadrados
dos erros como:

A expresso uma funo que depende dos valores de e . Vamos

calcular o valor de para alguns casos.

Se e , temos:

Se e , temos:

Observe que varia dependendo dos valores de e escolhidos. O


desafio ento determinar valores especficos para e tais que seja a
menor possvel. A ferramenta utilizada para esse fim denominada mtodo dos
mnimos quadrados.

No entraremos em detalhes sobre o mtodo dos mnimos quadrados, pois ele


envolve recursos de Clculo Diferencial, mas voc pode se aprofundar nesse assunto
acessando o link: <http://repositorio.unesp.br/bitstream/handle/11449/101850/
silva_mazm_dr_botfca.pdf?sequence=1> (acesso em: 20 jul. 2015). Iremos nos
restringir a apresentar os resultados que podem ser obtidos por meio desse mtodo.

Estatstica inferencial (parte II) 217


U4

Assimile

Os coeficientes e podem ser calculados pelas seguintes frmulas:

Dp (Y )
a
== r e
Dp ( X )

em que r = ( X , Y ) o coeficiente de correlao entre X e Y ;


Dp (Y ) e Dp ( X ) so, respectivamente, os desvios padres amostrais;
e y e x so, respectivamente, as mdias dos valores de Y e X .

Vamos utilizar essas frmulas para calcular os coeficientes de regresso da reta


apresentada na Figura 4.7. Temos:

(1 + 3 + 7 )
2
112
(
SQ ( x ) = 1 + 3 + 7
2 2
)
3
= 59
3
18, 667;

( 2 + 5 + 4)
2
112
(
SQ ( y ) = 2 + 5 + 4
2 2
)
3
= 45
3
4, 667;

SQ ( xy ) = (1 2 + 3 5 + 7 4 )
(1 + 3 + 7 ) ( 2 + 5 + 4 ) = 45 121 4, 667;
3 3

SQ ( xy ) 4, 667
r= = 0, 5;
SQ ( x ) SQ ( y ) 18, 667 4, 667

Dp (Y ) 1, 528 ; Dp ( X ) 3, 055 ; y 3, 667 ; e x 3, 667 . Logo:

Dp (Y ) 1, 528
a== r = 0, 5 0, 25;
Dp ( X ) 3, 055

b= y a x = 3, 667 0, 25 3, 667 2, 75.


Portanto, a equao da reta de regresso da Figura 4.7 y= 0, 25 x + 2, 75 .
Podemos fazer uma pequena verificao para esses valores, calculando

218 Estatstica inferencial (parte II)


U4

e constatando se a soma dos quadrados dos erros menor que os


valores anteriormente calculados:

( )
SQ a= 0, 25; b= 2, 75 = 2 ( 0, 25 1 + 2, 75 ) + 5 ( 0, 25 3 + 2, 75 ) +
2 2

+ 4 ( 0, 25 7 + 2, 75 ) = 1 + 2, 25 + 0, 25 = 3, 5.
2

Observe que .
Isso pode ser constatado para quaisquer outras escolhas de e , o que faz que
os coeficientes de regresso sejam aqueles que fornecerem o menor erro, isto
, a reta de equao a que melhor se ajusta aos pontos em um
diagrama de disperso.

Ateno!

A reta de regresso pode ser obtida para quaisquer conjuntos de dados


bivariados, havendo correlao linear ou no. O que se deve levar em
considerao o objetivo de calcular sua equao: prever um valor de
y para um dado valor de x . Nesse contexto, s faz sentido calcularmos
a equao da reta de regresso para os conjuntos de dados bivariados
que possuem correlao linear significante, pois, caso contrrio, no
conseguiremos realizar previses concretas.

Com base nessa ideia, veja o exemplo a seguir.

Exemplificando

Obtenha a reta de regresso para os dados da Figura 4.6 e responda:


qual seria a estatura de uma criana com idade de 57 meses?

Resoluo:

Inicialmente, lembre-se de que na seo anterior testamos a correlao


entre a idade ( X ) e a altura ( Y ) das crianas com at 5 anos de idade
e constatamos que h significncia. Logo, faz sentido obtermos a

Estatstica inferencial (parte II) 219


U4

reta de regresso para esses dados. Recorde-se tambm de que j


calculamos o coeficiente de correlao e obtivemos r = 0, 967 . Resta
ento calcular Dp (Y ) , Dp ( X ) , y e x . Assim:

Dp (Y ) 20, 0744 ; Dp ( X ) 19, 8910 ; y = 75, 8375 ; x = 30 .


Agora podemos calcular os coeficientes de regresso:
Dp (Y ) 20, 0744
a== r = 0, 967 0, 9759;
Dp ( X ) 19, 8910

b= y a x = 75, 8375 0, 9759 30 = 46, 5605.


Portanto, y= 0, 9759 x + 46, 5605 a equao da reta de regresso
que pode ser observada na Figura 4.6. Para prever a estatura de uma
criana de 57 meses de idade, substitumos x = 57 na equao
anterior. Temos:

y= 0, 9759 57 + 46, 5605 = 102,1868 102 .


Conclumos ento que a estimativa para a estatura de uma criana de
57 meses de idade y
102 centmetros. Observe que esse valor
prximo do estimado visualmente (100 cm).

Existem frmulas alternativas e equivalentes para calcular os coeficientes de


regresso. So elas:

Pesquise mais
Veja mais detalhes sobre a regresso linear nos links: <http://leg.
ufpr.br/~paulojus/CE003/ce003/node9.html>; <http://www.usp.br/
fau/cursos/graduacao/arq_urbanismo/disciplinas/aut0516/Apostila_
Regressao_Linear.pdf>; <http://www.pucrs.br/famat/rossana/
psicologia/Aula18_Analise_regressao.pdf> (acesso em: 21 jul. 2015).

220 Estatstica inferencial (parte II)


U4

Sem medo de errar

Vamos retornar situao-problema proposta no incio desta seo: imagine


novamente que voc um funcionrio da empresa M e que foi incumbido de
descrever o perfil dos funcionrios. A partir da Tabela 2.1, possvel estabelecer uma
relao matemtica entre a satisfao em relao remunerao e a satisfao
em relao s condies de trabalho? Um funcionrio que avalie sua satisfao
em relao remunerao com a pontuao 9 avaliar com qual pontuao a
satisfao em relao s condies de trabalho?

Voc aprendeu nas sees anteriores a mensurar a correlao entre duas


variveis e a testar a significncia dessa correlao. Durante esse aprendizado,
foi visto que o coeficiente de correlao linear entre as variveis G: satisfao
em relao s condies de trabalho e H: satisfao em relao remunerao
r = 0, 707 . Alm disso, com um nvel de confiana de 95%, foi atestada a
significncia dessa correlao. Logo, faz sentido determinarmos a equao da reta
de regresso.

Da Seo 4.1, temos: SQ ( hg ) = 57, 65 ; SQ ( h ) = 46, 55 . Logo,

SQ ( hg ) 57, 65
a=
= = 1, 238. Segue da Tabela 2.1 que h = 5,15 e g = 5, 45 . Assim,
SQ ( h ) 46, 55

b b= h = 5, 45 1, 238 5,15 0, 926.


=ggaa

Portanto, a equao da reta de regresso g == 1, 238 h 0, 926 . Para


estimarmos qual pontuao em relao condio de trabalho ser atribuda por
um funcionrio que avaliar sua remunerao com a pontuao 9, substitumos
h = 9 na equao anterior, ou seja:
g=
= 1, 238 9 0, 926 = 10, 216 10.
O resultado foi arredondado, visto que a nota que deveria ser atribuda na
pesquisa era um valor entre 0 e 10. Por fim, conclumos que um funcionrio que
atribua nota 9 a sua remunerao avaliar as condies de trabalho com a nota 10.

Avanando na prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.

Estatstica inferencial (parte II) 221


U4

1. Competncia de Conhecer os conceitos matemticos bsicos e proporcionar


fundamentos de rea o desenvolvimento do raciocnio lgico e quantitativo.

2. Objetivos de Obter a reta de regresso para dados bivariados com correlao


aprendizagem significante e realizar previses para valores no amostrados.

3. Contedos relacionados Regresso linear.

A seguir, consta o valor gasto com propaganda e a quantidade


vendida de um produto no mesmo ms.
Gastos com propaganda
10,0 11,0 12,2 13,8 14,4 15,5
( R$ 1.000)
4. Descrio da situao- Unidades vendidas
9,8 9,7 12,6 14,4 13,6 16,2
problema ( 10.000)

Obtenha a equao da reta de regresso para as variveis


gastos com propaganda e unidades vendidas, e estime
a quantidade de unidades vendidas para um gasto com
propaganda igual a R$ 13.000.

Nas sees anteriores obtivemos r 0, 960 e conclumos


que as variveis X : gastos com propaganda e Y : unidades
vendidas esto correlacionadas linearmente e positivamente,
sendo este fato atestado em um teste de significncia com
95% de confiana.
Com base nisso, podemos agora obter a equao da reta de

regresso. Temos SQ ( xy ) = 26,168 SQ ( x ) = 22, 288 .


e
Alm disso, a partir da amostra podemos obter x 12, 817 e
y 12, 717 . Assim:
5. Resoluo da situao-
problema
SQ ( xy ) 26,168
a=
= = 1,174;
SQ ( x ) 22, 288
b= y a x = 12, 717 1,174 12, 817 2, 330.
A equao da reta de regresso correspondente
y= 1,174 x 2, 330 . Desse modo, a estimativa para
a quantidade de unidades vendidas para um gasto com
propaganda igual a R$ 13.000 :
y= 1,174 13 2, 330 = 12, 932 12.932 unidades.

222 Estatstica inferencial (parte II)


U4

Lembre-se

A reta de melhor ajuste a um conjunto de pontos em um diagrama de


disperso denominada reta de regresso.

Uma linha reta descrita matematicamente por uma equao do tipo


y = a x + b , em que a e b so nmeros desconhecidos a serem
determinados, tambm denominados coeficientes.

O mtodo dos mnimos quadrados uma ferramenta que busca


determinar valores especficos para e tais que , a soma
dos quadrados dos erros, seja a menor possvel.

Por mnimos quadrados, temos que os coeficientes de regresso so


dados por e .

Faa voc mesmo

Acesse o link: <http://nbcgib.uesc.br/lec/download/material_didatico/


correlacao.pdf> (acesso em: 21 jul. 2015) e resolva o problema proposto
na pgina 6 desse material. Em seguida, determine a equao da reta
de regresso que relaciona o ndice DJIA com o S&P500. Por fim,
realize uma previso para o S&P500 quando o ndice DJIA for 11.000.

Faa valer a pena

1. De determinada amostra de dados bivariados ( X ,Y ) extraram-se as


seguintes informaes:

r = 0, 75 Dp (Y ) = 2 Dp ( X ) = 3 y = 20 x = 32

Assinale a alternativa que contm a equao da reta de regresso para


esse caso:
a) y= 4, 0 x + 0, 5 c) y= 0, 5 x + 4, 0 e) y= 5, 0 x + 4, 0
b) y= 4, 5 x + 4, 0 d) y= 0, 5 x + 4, 5

Estatstica inferencial (parte II) 223


U4

2. A funo denominada soma dos


quadrados dos erros. Considerando os valores amostrados a seguir,
assinale a alternativa que contm o valor de .

X 2 5 8
Y 4 11 20

a) 144. c) 146. e) 148.


b) 145. d) 147.

3. Observe o conjunto de dados a seguir.

X 4 2 8
Y 8 5 13

Sendo a equao de uma reta, assinale a alternativa que


contm os valores de e tais que , a soma dos quadrados dos
erros, assuma o menor valor possvel.
a) a=
= 1, 3214 e b=
= 2, 5 c) a=
= 1, 3214 e b=
= 5, 2 e) a=
= 1, 2143 e b=
= 2, 7
b) a=
= 1, 2143 e b=
= 2, 5 d) a=
= 1, 2143 e b=
= 2,1

4. Assinale a alternativa que contm a equao da reta que melhor se


ajusta aos dados bivariados ( X , Y ) apresentados a seguir.
(3, 9), (5, 10), (6, 8), (4, 6)
a) y= 0, 2 x + 7, 8 c) y= 0, 2 x + 8, 8 e) y= 0,1 x + 7, 8
b) y= 0,1 x + 8, 7 d) y= 0,1 x + 9, 7

5. De um conjunto de dados bivariados ( X ,Y ) extraram-se os valores


r = 0, 8 , Dp (Y ) = 4 , Dp ( X ) = 5 , y = 25 e x = 50 . Por meio da reta de
regresso, assinale a alternativa que contm uma estimativa pontual para

224 Estatstica inferencial (parte II)


U4

y , dado x = 60 .
a) 34,1. c) 43,1. e) 43,4.
b) 31,4. d) 41,3.

6. Considere o conjunto de dados a seguir, cuja reta de melhor ajuste


possui equao y= 2, 3 x + 62, 5 .

X 5 10 15 20
Y 50 40 30 15

Determine a soma dos quadrados dos erros .

7. Determine a equao da reta de regresso para o conjunto de dados a


seguir.

X 10 20 30 40
Y 94 82 68 57

Estatstica inferencial (parte II) 225


U4

226 Estatstica inferencial (parte II)


U4

Seo 4.4
Estudando resduos

Dilogo aberto

Voc aprendeu na seo anterior a obter a reta de regresso a


partir de uma amostra de dados bivariados ( X , Y ) . Vimos que os coeficientes
de regresso e so calculados por mnimos quadrados e so aqueles que
minimizam a funo , a soma dos quadrados dos erros. Voc
tambm aprendeu que a equao da reta de regresso tem como objetivo gerar
estimativas pontuais para valores de Y, dados os valores observados de X.

Lembre-se de que a regresso linear deve ser feita quando a correlao linear
entre duas variveis for significante. Caso isso no ocorra, uma previso feita
a partir de um valor x pode ter grande impreciso. Recorde-se tambm de que
na Seo 3.2 construmos intervalos de confiana para a mdia amostral. Esse
procedimento muito comum na estatstica, no somente para estimadores como
a mdia, mas para todo estimador pontual, como o caso do estimador de y . A
construo de intervalos de confiana feita com base na teoria de probabilidades
e tem por objetivo estabelecer uma margem de erro para a estimativa.

Aproveitamos o momento para acrescentar que, apesar de a anlise de


significncia ser feita com base em r (coeficiente de correlao), seu valor no
auxilia a interpretar o quanto da variao de Y devido a sua correlao com X e
o quanto devido ao acaso. Essa interpretao possvel por meio de um estudo
dos resduos de uma regresso linear, ou seja, dos erros ocorridos na gerao de
estimativas pelo processo de regresso. O estudo de resduos tambm auxilia na
construo de intervalos de confiana para os valores de regresso, e por esse
motivo ele o objeto de estudo desta seo.

Para compreender a importncia do estudo dos resduos, considere o seguinte


problema: imagine novamente que voc um funcionrio da empresa M e que
foi incumbido de descrever o perfil dos funcionrios. Vimos nas sees anteriores
que a partir da Tabela 2.1 possvel estabelecer uma relao matemtica entre a
satisfao em relao remunerao e a satisfao em relao s condies de
trabalho. Obtivemos a equao de regresso g= 1, 238 h 0, 926, em que H
a satisfao em relao remunerao e G a satisfao em relao s condies

Estatstica inferencial (parte II) 227


U4

de trabalho. Estimamos que um funcionrio que avalie sua satisfao em relao


remunerao com a pontuao 9 avaliar com a pontuao 10 a satisfao em
relao s condies de trabalho. Neste ponto surgem alguns questionamentos:
possvel estabelecer um intervalo de confiana para a estimativa ? Quanto
da variao de G explicado pela variao de H e quanto devido ao acaso e s
caractersticas prprias de cada funcionrio?

No pode faltar

Resduos

Quando realizamos uma regresso linear e obtemos os valores e , tais


que a reta aquela que melhor se ajusta ao conjunto de pontos
correspondentes aos valores amostrados para as variveis X e Y, sempre estamos
sujeitos a erros. Em Estatstica, tais erros so denominados resduos.

Voc aprendeu na seo anterior que a reta de regresso determinada por


meio da minimizao de , em que o erro (tambm
denominado desvio no explicado) associado ao -simo ponto no diagrama de
disperso. O erro pode ser Figura 4.8 | Resduos em uma regresso linear
observado no diagrama da Figura 4.8.

No diagrama foram
representados os pontos amostrais
obtidos para ( X , Y ) , a reta de
regresso correspondente, o ponto
de coordenadas , o ponto de
coordenadas ( xi , y ) e o ponto de
coordenadas ( x , y ) . Uma propriedade Fonte: O autor (2015).
associada a toda regresso linear
que o ponto ( x , y ) pertence reta de melhor ajuste. Vale observar que os pontos
( x , y ) , ( xi , y ) e foram adicionados ao diagrama e no necessariamente
esto na amostra para ( X , Y ) . Para uma anlise mais detalhada, definimos:

Assimile

O desvio no explicado a diferena entre o valor amostrado yi e


o valor previsto por regresso , ou seja, .

O desvio explicado a diferena entre o valor previsto por regresso


y
i - y , ou seja,
e o valor mdio .

228 Estatstica inferencial (parte II)


U4

O desvio total a diferena entre o valor amostrado yi e o valor


y
i - y , ou seja,
mdio .

Lembre-se

Voc j aprendeu o significado de desvio na Seo 2.4. O que se deve


fazer agora aprofundar este conceito e adapt-lo ao contexto da
anlise de regresso.

As nomenclaturas utilizadas anteriormente so, de certa maneira,


autoexplicativas. Contudo, vale observar que:

O desvio no explicado se refere diferena que pode ocorrer entre o valor


previsto por regresso e o valor amostrado. Utilizamos essa terminologia porque
a regresso por si s no explica a diferena ocorrida, de modo que a atribumos
especificidade de cada ponto amostral e ao acaso.

O desvio explicado aquele devido regresso e totalmente compreendido por


meio dela.

Por fim, o desvio total a soma do desvio explicado com o no explicado, ou seja:

Desvio total = desvio explicado + desvio no explicado.

Com base nas definies anteriores, podemos tambm definir:

Assimile

A variao no explicada igual soma dos quadrados dos desvios


( )
no explicados, ou seja, ei = (yi yi) = SQ a,b .

Analogamente, a variao explicada igual soma dos quadrados


dos desvios explicados, ou seja, ( yi y ).

Por fim, a variao total igual soma dos quadrados dos desvios
totais, ou seja, ( yi y ).

No entraremos em maiores detalhes, mas possvel demonstrar que a variao


total igual soma da variao explicada com a no explicada, isto :

Estatstica inferencial (parte II) 229


U4

variao no
Variao total = variao explicada + explicada.

( yi y ) 2 = + ( yi y ) 2
.

Com base nesses conceitos, podemos mensurar o quanto da variao total de


Y pode ser explicado pela variao de X considerando a correlao existente
entre essas variveis.

Coeficiente de determinao (ou explicao)

O coeficiente de determinao uma medida que tem por finalidade mensurar,


em termos percentuais, o quanto da variao de uma varivel Y devido variao
de X , supondo que essas variveis sejam correlacionadas. Esse coeficiente
calculado por meio da razo entre a variao explicada e a variao total, ou seja:

Exemplificando

Suponha duas variveis X e Y correlacionadas linearmente, tais que


e . Qual o valor do coeficiente de
determinao?

Resoluo:

Para essas duas variveis, a variao explicada 48 e a variao no


explicada 12. Logo, a variao total 60, j que corresponde soma
das variaes explicada e no explicada. Assim:

Portanto, 80% da variao de Y se deve variao de X , e 20% (valor


obtido efetuando 100% - 80% ) no se explica pela variao de X .

Existe uma relao estreita entre o coeficiente de correlao r e o coeficiente

230 Estatstica inferencial (parte II)


U4

de determinao. Essa relao expressa por:

Por meio dessa relao, o coeficiente de determinao, ou explicao, pode


ser calculado mais facilmente, simplesmente elevando ao quadrado o coeficiente
de correlao.

Exemplificando

Duas variveis X e Y esto negativamente correlacionadas de modo


que r = 0, 9 . Quanto da variao de Y pode ser explicado por sua
correlao e variao de X ?

Resoluo:

Como r = 0, 9 , o coeficiente de explicao ser:

r 2 = ( 0, 9 ) = 0, 81 = 81% .
2

Logo, 81% da variao de Y se deve variao de X . Temos ainda


que 19% da variao de Y no se explica pela variao de X e se deve
ao acaso.

Intervalos de previso

Em Estatstica, sempre que realizada uma estimativa pontual, como o caso


da previso para feita por meio da reta de regresso em que ,
natural pensarmos em construir um intervalo de confiana para a estimativa.
Alguns autores tambm o denominam intervalo de previso.

Segundo Larson e Farber (2010), dada uma equao de regresso linear


, para um valor especfico xi , o intervalo de confiana para yi
ou, ainda, , em que E a margem de erro.

Exemplificando

Dada a regresso linear , suponha que, ao nvel de


confiana de 95%, a margem de erro de previso para seja E = 2.
Determine o intervalo de confiana para o valor correspondente

Estatstica inferencial (parte II) 231


U4

a x0 = 15 .
Resoluo:

A estimativa pontual para a varivel Y , correspondente ao valor x0 = 15,


calculada substituindo esse valor em . Logo:

Assim, o intervalo de confiana para ser:

[ yi E, yi + E] = [161,5 2; 161,5 + 2] = [159,5;163,5].

Podemos denotar um intervalo de confiana com probabilidade para


como . Para o exemplo anterior, temos

Tambm de acordo com Larson e Farber (2010):

Assimile

Dada uma regresso linear , a margem de erro E para


uma estimativa , calculada a partir de um valor x0 , =15
dada por:


n ( x0 x )
2
1
E = t Se 1 + + ,
n n x 2 ( x )2

em que t obtido a partir da tabela T, com n - 2 graus de liberdade,


( )
de modo que P t < t < t = . O valor Se denominado erro
padro de estimativa e calculado pela frmula:

Observe que ( yi yi ) o que denominamos anteriormente de


(
variao no explicada. Como P t < t < t = , segue que a )

232 Estatstica inferencial (parte II)


U4

probabilidade de que pertena ao intervalo


tambm .

Para compreendermos melhor a construo de um intervalo de previso, veja


o exemplo a seguir.

Exemplificando

Considere a regresso linear y= 1, 4 x + 5, 7 , obtida a partir do


conjunto de dados a seguir.

i 1 2 3 4 5
X 5 10 15 20 25

Y 11,5 22,0 25,5 34,0 40,5

Determine um intervalo de previso com 95% de confiana para ,


dado x0 = 22 .

Resoluo:

Primeiramente realizamos uma estimativa pontual por meio da


regresso linear:

Como a estimativa pontual para 36,5, o intervalo de previso (ou


de confiana) para [ [
36, 5 E ;36, 5
+ E; 36 ] E E a margem
, 5 +que
, em ]
de erro. Para calcularmos a margem de erro, precisamos determinar o
erro padro de estimativa Se e obter t =95% . Temos:

yi = 11, 52 + 22, 02 + 25, 52 + 34, 02 + 40, 52 = 4062, 75 ;


yi = 11, 5 + 22, 0 + 25, 5 + 34, 0 + 40, 5 = 133, 5 ;
xi yi = 5 11, 5 + 10 22, 0 + 15 25, 5 + 20 34, 0 + 25 40, 5 = 2352, 5 ;
xi2 = 52 + 102 + 152 + 202 + 252 = 1375 ;
xi = 5 + 10 + 15 + 20 + 25 = 75 ;

Estatstica inferencial (parte II) 233


U4

xi 75
x= = = 15 ;
n 5
yi b yi a xi yi 4062, 75 5, 7 133, 5 1, 4 2352, 5
Se = = 1, 6663 .
n2 52
Alm disso, consultando a tabela T para v = 5 2 = 3 graus de
1
liberdade e na coluna correspondente a 2,5% (obtido efetuando ),
temos t =95% = 3,182 . Logo: 2

n ( x0 x )
2
1
E = t Se 1 + + ;
n n x 2 ( x )2

5 ( 22 15 )
2
1 1 245
E = 3,182 1, 663 1 + + = 5, 291666 1 + + ;
5 5 1375 ( 75 ) 2
5 1250
E 6, 252 .
Por fim, o intervalo de previso para com 95% de confiana :

Conclumos assim que h 95% de probabilidade de , calculado a


partir de [30, 248
x0 = 22, pertencer ao intervalo [30[,; 30
42
248 ; 42;,]42
, 248
752 752 ]. ]
, 752

Pesquise mais
Veja mais detalhes acerca dos intervalos de predio em: <http://
people.ufpr.br/~jomarc/regressao.pdf>. Acesso em: 28 jul. 2015.
(LARSON; FARBER, 2010; MORETTIN; BUSSAB, 2010).

Sem medo de errar

Agora que voc j estudou os resduos, vamos retomar a situao-problema


proposta no incio desta seo: possvel estabelecer um intervalo de confiana
para a estimativa , obtida a partir de h0 = 9 ? Quanto da variao de G
explicado pela variao de H e quanto devido ao acaso e s caractersticas
prprias de cada funcionrio?

234 Estatstica inferencial (parte II)


U4

Voc aprendeu que para calcular o quanto da variao de uma varivel G devido
variao de outra correlacionada H utilizamos o coeficiente de determinao,
2
ou r . Na Seo 4.1 o coeficiente de correlao dessas variveis foi estimado em
r 0, 707 . Logo, r 2 = 0, 707 2 0, 5 = 50% . Desse modo, apenas 50% da variao
de G se deve variao de H , e os outros 50% devem-se ao acaso.

Supondo um nvel de confiana de = 95% , para determinar um intervalo


de predio para precisamos calcular o erro padro de estimativa Se e a
margem de erro E . Temos:
gi = 82 + 52 ++ 102 + 92 = 737 ;
gi = 8 + 5 ++ 10 + 9 = 109 ;
hi gi = 7 8 + 4 5 ++ 6 10 + 8 9 = 619 ;
hi2 = 7 2 + 42 ++ 62 + 82 = 577 ;
hi = 7 + 4 ++ 6 + 8 = 103 ;

hi 103
h= = = 5,15 ;
n 20

gi b gi a hi gi 737 ( 0, 926 ) 109 1, 238 619


Se = = 1, 9955 .
n2 20 2

Alm disso, consultando a tabela T para v = 20 2 = 18 graus de liberdade e


1
na coluna correspondente a 2,5% (obtido efetuando ), temos t =95% = 2,101.
Logo: 2

n ( h0 h )
2
1
E = t Se 1 + + ;
n n h 2 ( h )2

20 ( 9 5,15 )
2
1 1 296, 45
E = 2,101 1, 995 1 + + = 4,191495 1 + + ;
20 20 577 (103) 2
20 931

E 4, 903 .
Por fim, o intervalo de previso para g 0 = 10 com 95% de confiana :

Estatstica inferencial (parte II) 235


U4

Como possvel atribuir apenas uma pontuao inteira entre 0 e 10, temos 95%
de confiana de que um funcionrio que avalie sua remunerao com nota 9 ir
atribuir uma nota de 5 a 10 para a satisfao em relao s condies trabalho.

Avanando na prtica

Pratique mais!
Instruo
Desafiamos voc a praticar o que aprendeu transferindo seus conhecimentos para novas
situaes que pode encontrar no ambiente de trabalho. Realize as atividades e depois as
compare com as de seus colegas.
1. Competncia de Conhecer os conceitos matemticos bsicos e proporcionar
fundamentos de rea o desenvolvimento do raciocnio lgico e quantitativo.

2. Objetivos de Quantificar a variao de uma varivel que se deve correlao


aprendizagem com outra e a variao que se deve ao acaso.

3. Contedos relacionados Regresso linear; coeficiente de determinao.

No quadro a seguir, tambm apresentado nas sees


anteriores, consta o valor gasto com propaganda e a
quantidade vendida de um produto no mesmo ms.
Gastos com propaganda
10,0 11,0 12,2 13,8 14,4 15,5
4. Descrio da situao- ( R$ 1.000)
problema Unidades vendidas
9,8 9,7 12,6 14,4 13,6 16,2
( 10.000)

Quanto da variao da quantidade de unidades vendidas


explicado pela variao do gasto com propaganda e quanto
devido ao acaso?

A medida de explicao da variao de uma varivel em


relao variao de outra correlacionada feita por meio do
2
coeficiente de determinao, ou r .
Lembre-se de que nas sees anteriores estimamos
5. Resoluo da situao- r 0, 960 . Logo:
problema
r 2 = 0, 9602 = 0, 9216 0, 92 = 92% .
Desse modo, 92% da variao da quantidade de unidades
vendidas pode ser explicada pela variao do gasto com
propaganda, e os 8% restantes devem-se ao acaso.

236 Estatstica inferencial (parte II)


U4

Lembre-se

A variao no explicada igual soma dos quadrados dos desvios


no explicados, ou seja, .

Analogamente, a variao explicada igual soma dos quadrados dos


desvios explicados, ou seja, .

Por fim, a variao total igual soma dos quadrados dos desvios
totais, ou seja, .

A variao total igual soma da variao explicada com a no explicada.

O coeficiente de determinao uma medida que tem por finalidade


mensurar, em termos percentuais, o quanto da variao de uma varivel Y
devido variao de X, supondo que essas variveis sejam correlacionadas.

Faa voc mesmo

Na seo anterior propusemos que voc acessasse o link: <http://nbcgib.


uesc.br/lec/download/material_didatico/correlacao.pdf> (acesso em: 21
jul. 2015) e resolvesse o problema exposto na pgina 6 desse material.
Em seguida, sugerimos que determinasse a equao da reta de regresso
que relaciona o ndice DJIA com o S&P500. Por fim, solicitamos que
realizasse uma previso para o S&P500 quando o ndice DJIA for 11.000.

Agora, aproveitando o que voc j desenvolveu e com 90% de confiana,


construa um intervalo de previso para a estimativa realizada.

Faa valer a pena

1. Duas variveis X e Y esto correlacionadas linearmente de modo que os


valores de Y so previstos a partir de X por regresso linear. Sabendo que
r = 0, 75 , assinale a alternativa que contm o percentual da variao de Y
no explicado pela variao de X.
a) 56,25%. c) 43,75%. e) 56,52%.
b) 52,65%. d) 47,35%.

Estatstica inferencial (parte II) 237


U4

2. Considere o seguinte conjunto de dados.

X 1 2 3 4 5
Y 4 7 4 8 9

Assinale a alternativa que contm o valor aproximado do coeficiente de


determinao para essas variveis.
a) 75,5%. c) 65,0%. e) 71,4%.
b) 57,0%. d) 51,2%.

3. Duas variveis X e Y esto correlacionadas de modo que, quando os


valores de X aumentam, os valores de Y diminuem. Sabendo que a variao
no explicada pela correlao entre essas variveis igual a 19%, assinale a
alternativa que contm o valor do coeficiente de correlao r:
a) 0,81 c) 0,9 e) 0,19
b) 0,81 d) 0,9

4. Duas variveis X e Y esto correlacionadas positivamente, sendo a


equao da reta de regresso y== 1, 33 x + 4, 35 . Essa equao foi estimada
a partir de uma amostra de tamanho n = 4 , sendo o erro padro de
estimativa Se = 9, 27 . Sabendo que x 2 = 4600 e x = 120 , assinale a
alternativa que contm o valor da margem de erro de previso E, a um
nvel de confiana de 98%, para a estimativa y 0 = 20, 31 :

a) 64. c) 78. e) 81.


b) 75. d) 80.

5. Duas variveis X e Y esto correlacionadas de modo que Y pode ser


estimado a partir de X por meio da equao y == 1, 07 x + 12, 07 . Alm disso,
o erro padro de estimativa obtido a partir de uma amostra de tamanho
n = 5 Se = 9, 00 . Com essas informaes, assinale a alternativa que
contm o intervalo de confiana de 96% para , sendo x0 = 10 e dados
n ( x0 x ) = 19220 e n x ( x ) = 34400 .
2 2 2

a) [18,79; 64,33] c) [28,79; 54,33] e) [8,79; 54,33]


b) [18,79; 64,33] d) [8,79; 44,33]

238 Estatstica inferencial (parte II)


U4

6. Considere as variveis (X, Y) correlacionadas e a amostra a seguir.


(100, 134), (150, 183), (200, 207), (250, 229), (300, 316)
Sabendo que a equao da reta de regresso para (X, Y) y== 0, 82 x + 49, 8 ,
construa uma tabela em que: na primeira coluna sejam listados os valores
xi ; na segunda coluna sejam listados os valores observados ; na terceira
coluna sejam listados os valores estimados ; e na quarta e ltima coluna
sejam listados os desvios no explicados ei = yi yi.

7. Duas variveis (X, Y) esto correlacionadas, sendo y=


= 5 x + 4 a equao
da reta de regresso correspondente. Sabendo que o desvio no explicado
e0 = y0 y0 3, com x0 = 4 , determine o valor observado .

Estatstica inferencial (parte II) 239


U4

240 Estatstica inferencial (parte II)


U4

Referncias

ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatstica


aplicada administrao e economia. 2. ed. So Paulo: Cengage Learning, 2011.

CRESPO, Antnio A. Estatstica fcil. 17. ed. So Paulo: Saraiva, 2002.

FREUND, John E. Estatstica aplicada: economia, administrao e contabilidade.


11. ed. Porto Alegre: Bookman, 2006.

JOHNSON, Robert; KUBY, Patrcia. Estatstica. So Paulo: Cengage Learning, 2013.

LARSON, R.; FARBER, B. Estatstica aplicada. 4. ed. So Paulo: Person Prentice Hall,
2010.

MEDEIROS, Valria Z. (Coord.). Mtodos quantitativos com Excel. So Paulo:


Cengage Learning, 2008.

MORETTIN, Luiz G. Estatstica bsica: probabilidade e inferncia. So Paulo:


Pearson Prentice Hall, 2010.

MORETTIN, Luiz G.; BUSSAB, Wilton O. Estatstica bsica. So Paulo: Saraiva, 2010.

Estatstica inferencial (parte II) 241