Vous êtes sur la page 1sur 75

BIOESTATSTICA

Edio Revisada e Ampliada









BOTUCATU
2011
MATERIAL DIDTICO PARA A DISCIPLINA DE
BIOESTATSTICA OFERECIDA AOS ALUNOS
DE GRADUAO EM CINCIAS BIOLGICAS E
DA SADE PELO PROF. DR. CARLOS
ROBERTO PADOVANI, DEPARTAMENTO
BIOESTATSTICA - IB / UNESP.

2

Bioestatstica Prof. Dr. Carlos Roberto Padovani
Sumrio
Introduo.............................................................................................................................. 4
1. Consideraes Preliminares ........................................................................................ 5
1.1 Definio de Estatstica........................................................................................... 5
1.2 Definio de Bioestatstica..................................................................................... 5
1.3 Varivel Biolgica (Conceito) ................................................................................ 6
1.4 Anlise Descritiva ..................................................................................................... 6
1.5 Anlise Inferencial .................................................................................................... 6
1.6 Planejamento Experimental.................................................................................... 6
1.7 Tipos de Varivel ....................................................................................................... 7
1.8 Exerccios: Variveis Biolgicas .......................................................................... 8
2. Estatstica Descritiva.................................................................................................... 10
2.1 Introduo................................................................................................................. 10
2.2 Medidas de Posio............................................................................................... 10
2.2.1 Medidas de Tendncia Central ..................................................................... 10
2.2.1.1 Mdia Aritmtica...................................................................................... 10
2.2.1.2 Moda............................................................................................................. 11
2.2.1.3 Mediana....................................................................................................... 11
2.3 Separatrizes.............................................................................................................. 11
2.3.1 Quartis................................................................................................................. 11
2.3.2 Percentis............................................................................................................. 12
2.4 Medidas de Variabilidade...................................................................................... 12
2.4.1 Amplitude Total ................................................................................................ 12
2.4.2 Amplitude Interquartlica ............................................................................... 12
2.4.3 Varincia e Desvio Padro ............................................................................ 12
2.4.4 Coeficiente de Variao ................................................................................. 13
2.4.5 Erro Padro........................................................................................................ 13
2.4.6 Erro Amostral.................................................................................................... 13
2.5 Outras Medidas( Assimetria e Curtose) ............................................................ 14
2.5.1 Coeficiente de Assimetria.............................................................................. 14
2.5.2 Coeficiente de Curtose................................................................................... 14
2.6 Tabelas e Grficos .................................................................................................. 14
2.7 Quantis....................................................................................................................... 15
2.8 Moda de Czuber....................................................................................................... 15
2.9 Exerccios: Estatstica Descritiva....................................................................... 19
3. Probabilidades ............................................................................................................... 21
3.1 Introduo................................................................................................................. 21
3.2 Definio de Probabilidade................................................................................... 22
3.3 Probabilidade Condicional e Independncia.................................................. 22
3.4 Teorema de Bayes ................................................................................................. 23
3.5 Exemplos Aplicados............................................................................................... 23
3.6 Probabilidade na Vida Real ................................................................................. 25
3.7 Exerccios: Probabilidades................................................................................... 25
3.8 Respostas dos Exerccios .................................................................................... 27
4. Modelos Probabilsticos.............................................................................................. 29
4.1 Variveis Aleatrias Discretas............................................................................. 29
4.2 Modelos Discretos mais Comuns....................................................................... 29
4.2.1 Modelo Uniforme.............................................................................................. 29
4.2.2 Modelo ( Ensaio ) de Bernoulli .................................................................... 30
4.2.3 Modelo Binomial............................................................................................... 30
4.2.4 Exemplos........................................................................................................... 30
3

Bioestatstica Prof. Dr. Carlos Roberto Padovani
4.3 Variveis Aleatrias Contnuas........................................................................... 31
4.4 Funo Densidade de Probabilidade................................................................ 31
4.5 Modelo Gaussiano ou Modelo Normal ............................................................. 32
4.5.1 Distribuio Normal Padro (Z).................................................................... 33
4 6 Lema de GlivenkoCantelli (Joseph Glivenko & Francesco Paolo
Cantelli)............................................................................................................................. 33
4.7 Exemplos................................................................................................................... 33
4.8 Teorema Limite Central ........................................................................................ 34
4.9 Transformao de Variveis ............................................................................... 34
4.10 Exerccios: Distribuio Normal ....................................................................... 35
5. Estimao de Parmetros........................................................................................... 39
5.1 Introduo................................................................................................................. 39
5.2 Parmetros, Estimadores e Estimativas........................................................... 39
5.3 Distribuies Amostrais........................................................................................ 40
5.3.1 Mdia Amostral ( X)......................................................................................... 41
5.3.2 Proporo Amostral (p).................................................................................. 41
5.4 Estimao por Intervalo ....................................................................................... 42
5.4.1 IC Mdia Populacional (
2
conhecido) ..................................................... 43
5.4.2 IC Proporo de Sucessos (Aproximao-TCL)...................................... 44
5.4.3 IC para Mdia Populacional (
2
desconhecido ) ..................................... 45
5.5 Consideraes Finais............................................................................................. 46
5.6 Exerccios: Estimao (Intervalo de Confiana)............................................. 47
6.Testes de Hipteses ...................................................................................................... 49
6.1 Consideraes Preliminares................................................................................ 49
6.2 Procedimento Geral do Teste de Hipteses .................................................... 53
6.3 Principais Testes de Hipteses.......................................................................... 54
6.3.1 Teste sobre a Mdia de uma Populao com Varincia Conhecida. 54
6.3.2 Teste sobre a Mdia de uma Populao com Varincia
Desconhecida. ............................................................................................................ 54
6.3.3 Teste para a Proporo................................................................................ 56
6.3.4 Teste para a comparao de mdias de duas populaes normais
independentes com varincias desconhecidas e iguais................................ 58
6.3.5 Teste para a comparao de mdias de duas populaes normais
independentes com varincias desconhecidas e desiguais. ........................ 60
6.3.6 Teste para a comparao de mdias de duas populaes normais
dependentes (amostras pareadas, amostras emparelhadas) e varincias
desconhecidas............................................................................................................ 61
6.4 Exerccios: Teste de Hipteses.......................................................................... 63
7. Bibliografia...................................................................................................................... 67
8. Tabelas............................................................................................................................ 68
Tabela 8.1 Distribuio Normal Reduzida ( ) | | = 1
0
z Z P ............................... 69
Tabela 8.2 Distribuio t de Student ( ) | | = < < 1
0 0
t t t P ................................. 70
Tabela 8.3 Distribuio Qui-quadrado ( ) | | = >
2
0
2
P ........................................ 71
Tabela 8.4 Distribuio F ( ) | | 01 , 0
0
= > F F P .............................................................. 72
Tabela 8.5 Distribuio F ( ) | | 05 , 0
0
= > F F P .............................................................. 73
Tabela 8.6 Distribuio F ( ) | | 10 , 0
0
= > F F P .............................................................. 74

4

Bioestatstica Prof. Dr. Carlos Roberto Padovani










Introduo





O que estatstica? E a Bioestatstica? Considerando o conceito de que a Cincia o
aprendizado adquirido por meio da experimentao e dos dados observados, segundo o
qual a procura das causas, das leis, traduz-se num processo iterativo de observao do
real, da realizao de experimentos confirmatrios e da avaliao quantitativa dos
fenmenos em estudo, o paradigma da Estatstica, em particular a Estatstica Aplicada s
Cincias Biolgicas Bioestatstica, consiste em construir o conjunto unificado de mtodos
e tcnicas de planejamento e anlise de dados experimentais e observacionais.
O grande desafio que se torna imperativo diz respeito a como desenvolver as
atividades de ensino de Estatstica, sob as exigncias de um modelo referencial de
conceitos matemticos e probabilsticos no cotidiano da formao da estrutura lgica de
raciocnio dos estudantes das reas biolgicas e da sade, e qual linguagem e motivao
devem ser colocadas em prtica para ministrar o contedo programtico?
Para abordar e entender os contedos dos textos, sem qualquer preconceito e posio
premeditada, o iniciante dever trabalhar sua atitude, a fim de evitar dois obstculos
preliminares: dramatizar as dificuldades e ter iluses por causa de facilidades aparentes.




Botucatu, janeiro de 2011
Prof. Dr. Carlos Roberto Padovani
Prof. Titular de Bioestatstica


Nenhum objeto de pensamento resiste duvida, mas o prprio ato de duvidar
indubitvel. (Descartes)

5

Bioestatstica Prof. Dr. Carlos Roberto Padovani
1. Consideraes Preliminares
A elaborao deste material didtico objetivou oferecer aos alunos um roteiro
conceitual e prtico que apresente a teoria, os procedimentos operacionais ( ferramentas
de clculo ), os mtodos e tcnicas estatsticas para que o usurio se torne um consumidor
esclarecido da estatstica aplicada s cincias da sade e biolgicas.

1.1 Definio de Estatstica

A Estatstica constitui-se em uma cincia destinada a:

I. Decidir o melhor plano (experimental ou observacional) para a execuo de uma
pesquisa metodologia cientfica.
II. Organizar e resumir dados de contagem, mensurao e classificao
raciocnio dedutivo.
III. Inferir sobre populaes de unidades (indivduos, animais, objetos) quando uma
parte (amostra) considerada raciocnio indutivo.

A doutrina sobre o chegar a termo do tempo e da histria da estatstica matemtica
(escatologia) to complicada como a de qualquer religio, ou mais. Alm disso, as
concluses da estatstica matemtica no so apenas verdadeiras, como, ao contrrio das
verdades da religio, podem ser provadas.
Os mtodos da estatstica matemtica so universais (ubquos), e o estatstico,
assim como o especialista em modelagem matemtica, capaz de colaborar em,
praticamente, qualquer rea de conhecimento e atividade profissional.
Uma igualdade que pode sintetizar as consideraes descritas anteriormente pode
ser expressa como:

ESTATSTICA = CINCIA + TECNOLOGIA + ARTE

1.2 Definio de Bioestatstica

a metodologia estatstica aplicada s cincias biolgicas, com a finalidade
planejar, coletar, organizar, resumir, analisar e interpretar os dados, permitindo tirar
concluses biolgicas sobre populaes a partir do estudo de amostras.
Em 1829, Pierre Charles Alexandre Louis (1787-1872), afirmou: Eu sei que a
verdade est nos fatos e no na mente que os julga, e quanto menos eu introduzir da
minha opinio pessoal nas concluses, mais prximo estarei da verdade (Louis,
considerado o pai da bioestatstica).
Considera-se que o olho humano capaz de enxergar padres em nmeros
puramente aleatrios, at que ponto um padro aparente realmente significa alguma coisa?
John W. Tukey (1915-2000), nascido em New Bedford, Massachusetts afirmou:
melhor ter uma resposta aproximada pergunta certa do que ter a resposta exata
pergunta errada.
6

Bioestatstica Prof. Dr. Carlos Roberto Padovani
A fora da estatstica aplicada as diversas reas do conhecimento est em sua
capacidade de persuadir os pesquisadores a formular perguntas; de considerar se estas
questes podem ser respondidas com as ferramentas disponveis para o experimentador;
de ajud-lo a estabelecer hipteses (nulas H
0
) adequadas; de aplicar rgidas disciplinas
de planejamento aos experimentos.
De mesma forma, pode-se expressar os sentimentos descritos na igualdade:

BIOESTATSTICA = VIDA + ESTATSTICA

1.3 Varivel Biolgica (Conceito)

Quando se estuda uma varivel biolgica, o maior interesse do pesquisador
conhecer o comportamento dessa varivel, analisando a ocorrncia de suas possveis
realizaes.
O resultado de medies de variveis biolgicas encontram-se, geralmente, dentro
de intervalos determinados e bem definidos, mas no sujeitos repetio exata. Uma
varivel biolgica pode ser entendida como uma classificao um qualidade, ou medida
quantificada por magnitude, intensidade, trao, entre outras designaes que varia tanto
intra como inter indivduos.
O estudo de bioestatstica compreende o planejamento e a anlise estatstica
(estatstica descritiva e inferencial), mas voltado s informaes biolgicas contidas nas
variveis em considerao, transformadas em dados coletados para a operacionalizao
dos mtodos estatsticos.

1.4 Anlise Descritiva

Organizao dos dados coletados por meio de classificao, contagem ou
mensurao. Os dados devem ser apresentados de forma clara por meio tabelas, grficos
e medidas resumo (posio e variabilidade), no permitindo, no entanto, concluses
analticas.

1.5 Anlise Inferencial

Permite realizar inferncias (concluses e analticas) a respeito de populaes a
partir de amostras pela aplicao de testes de hipteses e/ou construo de intervalos de
confiana. Deve ser considerado que est utilizando-se amostras para inferir aos dados
reais da populao ( parmetros), portanto existindo nestas estatsticas (dados obtidos de
amostras) uma margem de erro. A exceo o censo, quando toda a populao
pesquisada.

1.6 Planejamento Experimental
7

Bioestatstica Prof. Dr. Carlos Roberto Padovani

Consiste em estabelecer o desenho amostral com poder adequado para os testes
de hipteses e estimaes sem vises (distores). Deve ser considerado o clculo do
tamanho da amostra (tamanho tico e estatstico) e a definio da forma de coleta de
dados ( tcnicas de amostragem).

1.7 Tipos de Varivel

Variveis so caractersticas que assumem valores diferentes de um indivduo para
outro ou no mesmo indivduo ao longo do tempo.

Em relao participao no estudo, as variveis podem ser classificadas em:
I. Independente, explicativa ou preditora: permite predizer uma resposta (causas).
II. Dependente ou resposta: evento que se pretende estudar (efeitos).
III. Varivel de controle: deseja-se que esteja homogeneamente distribuida nos
grupos, pois poderia interferir nos resultados (atuando, por exemplo, como uma
varivel de confuso). No tem interesse para estudo.
Observaes:
I. Dependo do objetivo do estudo, uma mesma varivel pode ser preditora, resposta
ou de controle.
II. As variveis preditoras, resposta e de controle devem ser indicadas pelo
pesquisador (biologia), nunca pelo estatstico.
III. O nmero excessivo de variveis dificulta a anlise estatstica e torna menor o
poder da amostra.
IV. O estatstico capaz de coordenar o planejamento de uma pesquisa e realizar a
anlise.
Escala de Variveis
Quanto escala utilizada, tm-se variveis:
Nominal ( classificao sem ordem definida)

Categricas
(Qualitativas)

Ordinal ( classificao com ordem definida)

Discreta ( contagem, correspondendo a nmeros inteiros)
Numricas
(Quantitativa ou
Intervalar)
Contnua ( mensurao, correspondendo a nmeros reais)

Observaes:
I. A unidade de medida mostra a diferena entre as numricas discreta e contnua.
II. Escore no contagem (no confundir variveis categricas nominais expressas
8

Bioestatstica Prof. Dr. Carlos Roberto Padovani
por nmeros com variveis discretas).
III. Pode-se transformar uma varivel numrica em categrica (lembrar que h perda
de informaes).
IV. Para variveis categricas a anlise estatstica limitada. Se as variveis
dependentes e independentes forem todas categricas, s ser possvel utilizar
testes no paramtricos, que apresentam menor poder.
V. ric Temple Bell (matemtico norte-americano): Nmeros no mentem, mas tm a
propenso de dizer a verdade com inteno de enganar. O ser humano tem a
tendncia de ver padres e costuma v-los onde s existe rudo aleatrio.

1.8 Exerccios: Variveis Biolgicas

1) Classifique o par de variveis a seguir em qualitativa ( nominal ou ordinal) ou
quantitativa (discreta ou contnua).
i) Intensidade de perda de peso de maratonistas na corrida de So Silvestre (leve,
moderada, forte).
ii) Total de perda de peso de maratonistas na corrida de So Silvestre (em kg).
2) Quanto maior a disperso dos dados em torno da mdia, maior ser:
i) O desvio-padro.
ii) A amplitude total.
iii) A varincia.
iv) Todas as alternativas anteriores.
3) Um editorial de um jornal de grande circulao criticou um anncio que alegava que
o novo creme dental de um laboratrio Reduz em mais de 500% as placas nos
dentes. Pergunta-se:
a) Removendo-se 100% de uma quantidade, quanto sobra?
b) correto dizer que houve uma reduo de mais de 500% de uma quantidade?
E dizer que houve um aumento ou acrscimo de 150%?
4) Responda se cada uma das afirmativas a seguir verdadeira ou falsa. Se afirmativa
for falsa, corrija a palavra sublinhada para que ela se torne verdadeira.
a) Metade dos valores de uma varivel quantitativa so sempre menores que a
mdia.
b) Quando a varivel quantitativa tem distribuio unimodal e simtrica, a posio
relativa das medidas de tendncia central : mdia < mediana < moda.
c) Quando a varivel quantitativa tem distribuio unimodal e simtrica, metade de
seus valores menor que a mdia.
d) Para alguns conjuntos de dados possvel encontrar valor de varincia menor
do que o valor do desvio padro.
9

Bioestatstica Prof. Dr. Carlos Roberto Padovani
5) Suponha que um forno A est com uma temperatura de 90 C e um outro forno B
est com 30 C. correto afirmar que o forno A est trs vezes mais quente que o
forno B?
6) O jornal Newport Chronicle afirmou que mes grvidas podem aumentar suas
chances de ter um beb sadio comendo lagostas. A alegao se baseou em um
estudo mostrando que as crianas nascidas de mes que comem lagostas tm
menos problemas de sade do que as nascidas de mes que no comem lagostas.
Qual o erro nesta alegao?
7) No diagrama seguinte A,B,..., F representam ilhas e as linhas que ligam, pontes. Um
bilogo comea em A e percorre ilha por ilha. Ele para a fim de almoar quando no
pode continuar a andar sem que cruze a mesma ponte duas vezes. Encontre o
nmero de caminhos que ele pode percorrer antes de almoar.
A B C D
E F

8) Numa pesquisa para avaliar a presso arterial canina, foram selecionados ao acaso
10 animais para participar do estudo. Para cada animal foram realizados trs
medidas da presso (triplicata). O pesquisador pode considerar, para tratamento
estatstico dos dados, uma amostra de tamanho 30 (30 presses)?
9) Um pesquisador foi criticado certa vez por adulterar dados. Entre os seus dados
estavam cifras obtidas de seis grupos de ratos, com 20 ratos em cada grupo. Foram
dados os seguintes valores como porcentagens de sucesso: 58%, 65%, 47%, 33%,
50%,47%. O que est errado?
10) Uma pesquisa patrocinada por uma grande cooperativa de produtos crticos
concluiu que os nveis de colesterol podem ser reduzidos mediante ingesto de
produtos crticos. Por que razo a concluso poderia ser suspeita?
10

Bioestatstica Prof. Dr. Carlos Roberto Padovani
2. Estatstica Descritiva

2.1 Introduo

Consiste na organizao dos dados obtidos por meio de classificao, contagem ou
mensurao. Os dados so apresentados em medidas resumo, tabelas e grficos, no
permitindo, no entanto, concluses analticas.
A notao matemtica, consistindo de um arranjo de letras, tanto romanas como
gregas ou latinas, com linhas tortuosas e sobrescritos e subscritos, um aspecto da
matemtica que intimida o no-matemtico (e at alguns matemticos). Na realidade um
meio conveniente de relatar idias complexas em espao compacto. O truque, ao ler um
artigo matemtico, reconhecer que cada smbolo tem um significado, conhecer o
significado quando ele apresentado, mas ento acreditar de boa-f que voc entendeo
significado,e prestar ateno forma como o smbolo manipulado. A essncia da
elegncia matemtica produzir uma notao de smbolos organizada de maneira to
simples o bastante que o leitor compreende as relaes de imediato.
Em relao as necessidades de clculos para encontrar os valores resultantes dos
indicadores (medidas) estatsticas, tem que o computador no concorrente do crebro
humano. Ele apenas um grande e paciente mastigador de nmeros. No se aborrece,
no fica sonolento nem comete erros de clculo.


2.2 Medidas de Posio

Mdia
Tendncia Central Moda
Mediana
Posio
Quartis
Separatizes
Percentis


2.2.1 Medidas de Tendncia Central


2.2.1.1 Mdia Aritmtica

A mdia aritmtica, ou simplesmente mdia, definida como a soma dos valores
divididos pelo nmero de observaes (centro de massa).

Observaes
I. A mdia afetada por valores extremos.
II. A mdia bastante utilizada em distribuies simtricas.
III. No utilizvel em variveis categricas.
11

Bioestatstica Prof. Dr. Carlos Roberto Padovani
IV. A mdia pode ser utilizada para variveis discretas, inclusive com decimais.


2.2.1.2 Moda

Consiste no valor mais freqente no conjunto de observaes ( valor tpico, valor
mais comum).
Observaes
I. Um conjunto pode apresentar mais de uma moda.
II. A moda pode ser calculada para variveis numricas e categorizada.
III. Pode existir conjunto sem moda (amodal).

2.2.1.3 Mediana

Definida como o valor que divide as observaes, ordenadas de forma crescente,
em igual nmero de observaes acima e abaixo.

Observaes
I. No utilizvel em variveis categricas.
II. Pouco afetada por valores muito discrepantes.
III. Bastante utilizada para distribuio assimtrica.

Finalizando para decidir se a medida de tendncia central apropriada deve ser mdia
ou mediana, considere:

Distribuio simtrica mdia.
Distribuio assimtrica mediana.

No caso de distribuio simtrica, mdia, moda e mediana so equivalentes ( x =Mo=Me).
Quando existe assimetria, a mdia e a mediana desviam-se na direo dos valores
extremos ( Mo < Me < x ou x < Me < Mo).

2.3 Separatrizes

2.3.1 Quartis

Considerados como valores que dividem a amostra em quatro partes com o mesmo
nmero de observaes.
12

Bioestatstica Prof. Dr. Carlos Roberto Padovani
Q1 Limita os 25% dos menores valores (ou 75% dos maiores valores).
Q2 Limita os 50% dos menores valores (ou 50% dos maiores valores).
Q3 Limita os 75% dos menores valores (ou 25% dos maiores valores).

2.3.2 Percentis

Considerados como valores que dividem mostra em cem partes.
P23 Limita os 23% dos menores valores (ou 77% dos maiores valores).
P67 Limita os 67% dos menores valores (ou 33% dos maiores valores).
P92 Limita os 92% dos menores valores (ou 8% dos maiores valores).

2.4 Medidas de Variabilidade


Amplitude Total
Amplitude Interquartil
Individual Varincia
Desvio Padro
Coeficiente Variao
Variabilidade

Erro padro
Amostral
Erro amostral


2.4.1 Amplitude Total

Expressa a variao mxima encontrada no conjunto de dados, sendo obtida pela
diferena entre o maior valor e o menor valor.

2.4.2 Amplitude Interquartlica

Expressa a variao de 50% de amostra ao redor da mediana. Seu valor dado pela
diferena entre o terceiro e primeiro quartil.

2.4.3 Varincia e Desvio Padro

Consistem em medidas de disperso absoluta e indicam como os valores variam
entre si, por meio do afastamento destes valores em relao mdia do conjunto.

Observaes
I. A varincia apresenta unidade quadrtica.
II. Quanto mais afastado o valor se encontrar em relao mdia, maior ser sua
13

Bioestatstica Prof. Dr. Carlos Roberto Padovani
contribuio para o valor da varincia (desvio padro).
III. Ambas as medidas (varincia e desvio-padro) indicam a variao absoluta.

2.4.4 Coeficiente de Variao

Trata-se de uma medida de disperso relativa e expressa a razo entre o desvio
padro e a mdia. Pode ser apresentado na forma de proporo ou porcentagem.

Observaes
I. Quanto menor o coeficiente de variao, mais homogneo o conjunto de valores.
II. Trata-se de uma medida de variao relativa e adimensional.

2.4.5 Erro Padro

Constitui-se em uma medida de variabilidade da mdia amostral (expressa como a
mdia varia de uma amostra para outra).

Observaes
I. A margem de erro que se comete em estimar a mdia populacional pela mdia de
uma amostra dada pelo erro padro.
II. O valor do erro padro dado em funo do tamanho amostral. Ou seja,
inversamente proporcional raiz quadrada do tamanho amostral.

2.4.6 Erro Amostral

Trata-se de uma medida do afastamento da mdia amostral em relao mdia da
populao, associada a um nvel de confiana.

Observaes
I. O erro amostral proporcional ao erro padro
II. A constante de proporcionalidade fica estabelecida pelo nvel de confiana.
III. Erro amostral proporcional ao erro padro, equivale a EA = k EP.
Se k= 1,00 Nvel de confiana 68%
Se k= 1,64 Nvel de confiana 90%
Se k= 1,96 Nvel de confiana 95%
Quanto maior o valor de k, maior o nvel de confiana na estimao da mdia
populacional.




14

Bioestatstica Prof. Dr. Carlos Roberto Padovani


2.5 Outras Medidas( Assimetria e Curtose)


2.5.1 Coeficiente de Assimetria

Utilizado para mensurar o grau de assimetria da distribuio em torno da mdia,
sendo assimetria positiva quando existe desvio para a direita e negativa, quando h para a
esquerda.

2.5.2 Coeficiente de Curtose

Utilizado para medir o grau da relao entre a altura e largura da curva, ou seja, o
grau de achatamento da curva. O padro de achatamento pode indicar curva: leptocrtica,
mesocrtica ou platicrtica.

2.6 Tabelas e Grficos

So constitudas por formas de apresentao do resumo dos dados, devendo ser
auto-explicativas.
Observaes
I. A construo de grficos e tabelas estabelecida por meio de regras,sendo as mais
comuns: IBGE e ABNT.
II. Um tipo especial de tabela consiste na tabela de contingncia, onde as linhas e
colunas so compostas por freqncias de ocorrncias dos atributos.
III. Os grficos mais usuais para variveis numricas so histogramas, barras com
haste e diagrama de caixas (Box plot).
IV. Para as variveis categricas os grficos de setores circulares (do tipo pizza) e os
grficos em barras (vertical e horizontal).
V. Uma aplicao interessante do box plot consiste em identificar valor discrepante
(outlier). A maioria dos programas de anlise estatstica define outliers como valores
fora do intervalo (Q
1
1,5Q; Q
3
+ 1,5Q), onde Q= Q
3
-

Q
1
, denomina-se
amplitude interquartis.
15

Bioestatstica Prof. Dr. Carlos Roberto Padovani
VI. So duas as frmulas mais usuais para determinar o nmero de classes de uma
distribuio de frequncias:
a) n =
b) 2 , 3 1+ = log n (Sturges).
2.7 Quantis

Chama-se quantil de ordem p ou p-quantil, a medida indicada por q(p), sendo p uma
proporo qualquer (0<p<1), onde 100p% das observaes sejam menores do que q(p).
Os quantis so valores separatizes importantes em vrias reas das cincias da sade e
alguns de seus nomes particulares bem conhecidos no cotidiano; por exemplo:
q(0,05) = 5 Percentil (P
5
)
q(0,10) = 10 Percentil (P
10
) = 1 Decil (D
1
)
q(0,25) = 25 Percentil (P
25
) = 1 Quartil (Q
1
)
q(0,50) = 50 Percentil (P
50
) = 5 Decil (D
5
) = 2 Quartil (Q
2
) = Mediana (Me)
q(0,75) = 75 Percentil (P
75
) = 3 Quartil (Q
3
)
q(0,90) = 90 Percentil (P
90
) = 9 Decil (D
9
)
q(0,95) = 95 Percentil (P
95
)

Para calcular os quantis q(p), para qualquer p, 0<p<1, pode-se utilizar o seguinte
procedimento para um conjunto de valores
) ( ) 2 ( ) 1 (
...
n
X X X (n valores ordenados em
ordem crescente; ou seja, as estatstica de ordem):
1) q(p) = X
(i)
Se n i
n
i
p p
i
,..., 2 , 1 ,
5 , 0
=

= = ;
2) q(p) = X
(1)
Se
1
p p < ;
3) q(p) = X
(n)
Se
n
p p > ;
4) q(p) = ) 1 ( ) ( ) 1 ( + +
i i i i
p q f p q f

Se
1 + i i
p p p < < , onde
i i
i
p p
p p
fi

=
+1
.

2.8 Moda de Czuber



) 6 (
60 , 3
) 3 (
40 , 3
2 1


=


Mo Mo
DEC ABC

47 , 3
9
2 , 31
3 80 , 10 40 , 20 6 = = = Mo Mo Mo
16

Bioestatstica Prof. Dr. Carlos Roberto Padovani


Neste sentido, tem-se de maneira geral




2 1
1
1
2 1
1
2 1
1
2 1
2
1
2
1
2
2
1
1
2 1
2
1
+

+
=

+
=
+

= = +
=
=
h
l Mo
l Mo
h
h
h h
h
h h h
h l L h h
Mo L h
L Mo h
mo
Mo
Mo Mo
Mo
Mo


Para entendimento do clculo dos quantis e algumas medidas descritivas a partir de
uma distribuio de freqncias, considere os exemplos apresentados a seguir.

1) Considerando os seguintes valores de HDL colesterol (mg/dL); 26,54,35,37 e 36
determinar:
a) Os quantis correspondentes aos valores observados.
X
(1)
= 26 ; X
(2)
= 35 ; X
(3)
= 36 ; X
(4)
= 37 ; X
(5)
= 54 (n=5)
5
5 , 0
= =
i
p p
i
se i = 1,2,3,4,5
p = p
1
= 0,10 q(0,10) = X
(1)
P
10
= 26
p = p
2
= 0,30 q(0,30) = X
(2)
P
30
= 35
p = p
3
= 0,50 q(0,50) = X
(3)
P
50
= Me=36
p = p
4
= 0,70 q(0,70) = X
(4)
P
70
= 37
p = p
5
= 0,90 q(0,90) = X
(5)
P
90
= 54

b) Os quantis correspondentes aos quartis (Q
1
,Q
2
,Q
3
).

Q
(1)
= q(0,25) ; Q
(2)
= q(0,50) ; Q
(3)
= q(0,75)

26 35 36 37 54
P
30
P
50
P
70

Q
(1)
= q(0,25) = (1 - f
1
)q(p
1
) +f
1
q(p
2
) onde 75 , 0
20 , 0
15 , 0 25 , 0
1 2
1
1
= =

=
p p
p
f
Q
(1)
= (1 - 0,75) (26) + 0,75 (35) = 32,75
Q
(2)
= q(0,50) = P
50
= 36
Q
(3)
= q(0,75) = (1 f
4
) q(p
4
)+f
4
q(p
5
) onde 25 , 0
20 , 0
05 , 0 75 , 0
4 5
4
4
= =

=
p p
p
f
17

Bioestatstica Prof. Dr. Carlos Roberto Padovani
Q
(3)
= (1 - 0,25) (37) + 0,25 (54) = 41,25


2) A seguir so apresentados valores do cido rico (mg/dL) de oito indivduos do
gnero masculino: 4,0;5,8;8,2;7,4;6,0;5,2;7,8 e 4,8. Determinar as seguintes
medidas separatrizes:

a) P
70
b) Me c)P
35
d)P
97,5


Tabela 1. Distribuio de frequncias do peso (kg) de recm-nascidos
Classes
i
x
i
f
i i
x f ( ) x x f
i i

2
i i
x f
2
) ( x x f
i i

20 , 3 00 , 3 a 3,10 2 6,20 -0,752 19,22 0,282752
40 , 3 20 , 3 a 3,30 7 23,10 -1,232 76,23 0,216832
60 , 3 40 , 3 a 3,50 10 35,00 0,240 122,50 0,005760
80 , 3 60 , 3 a 3,70 4 14,80 0,896 54,76 0,200704
00 , 4 80 , 3 a 3,90 2 7,80 0,848 30,42 0,359552
Total 25 86,90 0,000 303,13 1,065600

211 , 0 0444 , 0
24
0656 , 1
24
476 , 3 25 13 , 303
2
2
= = =
+
= s s





25 = n
25 , 4
20 , 3
7
20 , 3 40 , 3
) 25 , 6 ( ) 4 / 25 ( ) (
1
1

=

= =
Q
Q
321 , 3
7
25 , 4 20 , 0
20 , 3
1
= + =
x
Q
25 = n
50 , 3
40 , 3
10
40 , 3 60 , 3
) 5 , 12 ( ) 2 / 25 ( ) ( ) (
2

=

= = =
Me
Me Q
47 , 3
10
50 , 3 20 , 0
40 , 3 = + =
x
Me
25 = n
50 , 3
60 , 3
4
60 , 3 80 , 3
) 5 , 22 ( ) 100 / 25 90 ( ) 90 (
90

=

= =
P
x P
775 , 3
4
50 , 3 20 , 0
60 , 3
90
= + =
x
P


476 , 3 = x
18

Bioestatstica Prof. Dr. Carlos Roberto Padovani
Tabela 2. Colesterol total de indivduos sadios (mg/dL) e indicativos de referncia
180 182 184 190 186 192 188 186 186
Colesterol Total Desejvel < 200 mg/dL
Glicose Normal 70 a 110 mg/dL
HDL Colesterol Desejvel 40 a 60 mg/dL
LDL Colesterol timo < 100mg/dL Desejvel 100 a 129 mg/dL
Triglicrides TG/5 = COLTOT HDL LDL
X(1) = 180 X(2) = 182 X(3) = 184 X(4) = 186 X(5) = 186 X(6) = 186
X(7) = 188 X(8) = 190 X(9) = 192

N = 9 (mpar)
1 Quartil = ( ) 183 50 , 2
4
1
1
= = |

\
| +
= X
n
X Q

Valor mnimo = X
(1)
= 180 Mediana = 186 ) 5 (
2
1
2
= = |

\
| +
= X
n
X Q
Valor mximo = X
(9)
= 192
3 Quartil =
( )
( ) 189 5 , 7
4
1 3
3
= = |

\
| +
= X
n
X Q
Moda = Mo = 186
Mdia = 186
9
1674
= = X
Varincia = 14
8
112
8
186 9 311476
2
2
= =

=
x
s

Desvio padro = 74 , 3 14 = + = s

Tabela 3. Dados brutos e distribuio de freqncia da massa corprea de Rattus
norvegicus(Wistar)

0,300 0,317 0,320 0,322 0,324 0,325 0,328 0,337 0,339 0,340 0,344 0,346
0,347
0,350 0,352 0,352 0,358 0,358 0,359 0,361 0,367 0,369 0,377 0,384 0,400

Classes (kg)
i
x
i
f (%)
i
fr (%)
i
facr
i i
x f
2
i i
x f
320 , 0 300 , 0 a 0,310 2 8,00 8,00 0,62 0,1922
340 , 0 320 , 0 a 0,330 7 28,00 36,00 2,31 0,7623
360 , 0 340 , 0 a 0,350 10 40,00 76,00 3,50 1,2250
380 , 0 360 , 0 a 0,370 4 16,00 92,00 1,48 0,5476
400 , 0 380 , 0 a 0,390 2 8,00 100,00 0,78 0,3042
Total 25 100,00 8,69 3,0313


k = 1+3,2 log 25 = 5,47 5 ; h = 0,100/5 = 0,020 kg;

x = 0,3476 kg; Me = 0,437 kg; Mo = 0,347 kg;

2
s = 0,00045 kg
2
; s = 0,022 kg; CV(%)=6,32 %.


19

Bioestatstica Prof. Dr. Carlos Roberto Padovani

2.9 Exerccios: Estatstica Descritiva

1) Resultados de trs alunos da 8 srie da rede pblica municipal submetidos a
cinco testes de aptido fsica.

Teste
Mdia
(Gold)
Desvio-Padro
(Gold)
Pedro Joo Manuel
N abdominais em 2 min. 30 6 32 40 20
Salto em extenso (cm) 150 25 146 140 125
Suspenso braos flex.(seg.) 50 10 35 70 75
Distncia percorrida 12 min. (m) 1850 200 2256 1700 1650
Tempo para nadar 50m (seg.) 30 5 35 28 26

a) Para cada aluno, indicar o teste de melhor desempenho.
b) Estabelecer um ndice (valor nico) que expresse o desempenho global do
aluno.
c) Classificar os trs alunos segundo ndice global estabelecido.

2) Em uma maternidade foi observada a distribuio do peso dos nascituros,
conforme descrita a seguir:

Peso (kg) Freq. Absoluta Freq. Relativa (%)
6 , 1 2 , 1 a 2 4,0
0 , 2 6 , 1 a 10 20,0
4 , 2 0 , 2 a 12 24,0
8 , 2 4 , 2 a 14 28,0
2 , 3 8 , 2 a 8 16,0
6 , 3 2 , 3 a 4 8,0
Total 50 100,0

a) Qual a media da distribuio?
b) Construir o histograma.
c) Dividir os pesos em quatro categorias, de modo que:
- os 30% mais leves sejam da categoria A;
- os 25% seguintes sejam da categoria B;
- os 25% seguintes sejam da categoria C;
- os 20% restantes (ou seja, os 20% mais pesados) sejam da categoria D).
d) Quais os limites de peso entra as categorias A,B,C e D\

3) Considerando informaes sobre o estado civil, grau de instruo, nmero de
filhos, salrio (expresso como frao do salrio mnimo), idade (medida em anos
e meses) e procedncia de tcnicos de laboratrio clinico, responda as
indagaes que sero descritas a seguir.

Idade
N
Estado Civil Grau de instruo Salrio
(X sal. mn.)
anos meses
Regio de
procedncia
20

Bioestatstica Prof. Dr. Carlos Roberto Padovani
1 solteiro ensino fundamental 1,25 26 03 interior
2 casado ensino fundamental 1,50 32 10 capital
3 casado ensino fundamental 1,50 36 05 capital
4 solteiro ensino mdio 1,60 20 10 interior
5 solteiro ensino fundamental 1,80 40 07 interior
6 casado ensino fundamental 1,30 28 00 interior
7 solteiro ensino fundamental 1,40 41 00 interior
8 solteiro ensino fundamental 1,50 43 04 capital
9 casado ensino mdio 1,65 34 10 capital
10 solteiro ensino mdio 1,35 23 06 interior
11 casado ensino mdio 1,95 33 06 interior
12 solteiro ensino fundamental 1,30 27 11 capital
13 solteiro ensino mdio 1,65 37 05 interior
14 casado ensino fundamental 1,85 44 02 interior
15 casado ensino mdio 1,95 30 05 interior
16 solteiro ensino mdio 2,05 38 08 capital

a) Qual a porcentagem de empregos solteiros?
b) Como o grau de instruo est associado com o estado civil? E com a regio de
procedncia?
c) Qual o salrio mdio de cada grau de instruo?
d) Qual a idade mdia de cada regio de procedncia?
e) Faa o grfico de barras para a mdia de salrio segundo o grau de instruo?
f) Em qual estado civil o salrio mais homogneo?
g) A maioria dos casados situa-se acima da idade mdia dos empregados?
h) Construa a distribuio de frequncias das variavis: estado civil e idade.
i) Se for concedido um abono de meio salrio mnimo para todos os 16
empregados, qual a alterao que haver na mdia? E na varincia? E no
desvio-padro? E na mediana? E no coeficiente de variao? Justifique sua
resposta.
21

Bioestatstica Prof. Dr. Carlos Roberto Padovani
3. Probabilidades


3.1 Introduo


Acredita-se que todo mundo gosta de ter certeza, de estar sempre certo, de acertar.
Para muitos, principalmente os teimosos e arrogantes, incertezas e dvidas refletem uma
espcie de fraqueza de firmeza de atitudes. Infelizmente, saber aceitar que perfeitamente
razovel no saber tudo e que nem sempre estamos certos, requer uma boa dose de
modstia e pacincia para as incertezas e imprecises. Neste sentido, a noo de um
determinismo absoluto deve ser desconsiderado, em favor das probabilidades. Estas sim,
so as que contam, nas certezas. Pode-se dizer que a teoria da probabilidade comea no
sculo XVII com os matemticos franceses Pierre de Fermat (1601-1665) e Blaise Pascal
(1623-1662). Antoine Gambaud (1607-1684), um importante cavalheiro conhecido como
Chevalier de Mere e tambm um jogador entusiasmado, discutia com Pascal temas
relacionados com a possibilidade de sucesso em jogos em cartas. Pascal, interessado no
assunto, correspondeu-se com Fermat. Nessas cartas, escritas em 1654 encontram-se o
desenvolvimento do que hoje chamado probabilidade finita. Pode-se dizer que a teoria de
probabilidade contou em sua origem com o estmulo de questes levantadas pela
observao e prtica dos jogos de azar, cuja participao cientfica acontece com o
objetivo de medir o acaso e, com isso, exercer maior controle sobre os fenmenos naturais.
Outras contribuies importantes para o desenvolvimento da teoria da probabilidade
acontecem com o matemtico francs Abraham de Moivre (1667-1754) a partir da
publicao da obra Doutrina do acaso (Doctrine of chances) e com o matemtico suo
Jacques Bernoulli (1654-1705) na obra Arte da conjectura (Ars conjectandi). Na sequncia
do desenvolvimento tem-se os matemticos franceses Pierre-Simon de Laplace (1749-
1827) e Simon Poisson (1781-1840); o matemtico alemo Karl Friedrich Gauss(1777-
1855) e o matemtico russo Andrei Nikolaevich Kolmogorov (1903-1987).
Kolmogorov pensou sobre a natureza dos clculos de probabilidade e finalmente
compreendeu que encontrar a probabilidade de um evento era exatamente igual a
encontrar a rea de uma figura irregular. Adotou a recm surgida matemtica da teoria de
medio (Teoria de Henri Lebesgue) para os clculos de probabilidade e, com essas
ferramentas, foi capaz de identificar um pequeno conjunto de axiomas sobre os quais pde
construir todo o corpo da teoria de probabilidade (Axiomatizao da Teoria de
Probabilidades). Essa teoria ensinada hoje como a nica forma de ver a probabilidade e
que resolve para sempre todas as questes sobre a validade dos clculos.
Deve ser destacado que a prpria palavra probabilidade foi criada para lidar com o
sentido da incerteza pessoal. No se deve referir-se probabilidade tanto como um
nmero preciso, mas como mtodo de ordenar idias (probabilidade de chover a manh
22

Bioestatstica Prof. Dr. Carlos Roberto Padovani
maior que a probabilidade de nevar).

Fenmeno Aleatrio (Casual): refere-se situao ou acontecimento cujos resultados no
podem ser previstos com certeza.
Exemplo: - Alterao do ritmo cardaco de indivduos submetidos prova de exausto.
- Configurao do gnero de casais com quatro filhos.

Experimento: qualquer processo que permite ao pesquisador fazer observaes.

Evento: uma coleo de resultados de um experimento.
Evento Simples ou Elementar (A) : um resultado, ou um evento, que no comporta mais
qualquer decomposio.
Espao Amostral ( ): consiste de todos os possveis eventos simples de um experimento.


3.2 Definio de Probabilidade


Uma funo P(.) denominada probabilidade se satisfaz as condies:
I. 1 ) ( A P O , AC
II. 1 ) ( = P
III.

= =
=
n
j
n
j
Aj P Aj P
U
1 1
) ( ) ( , com os A
j
s mutuamente exclusivos.

Espao Amostral Equiprovvel: todos os pontos (eventos) tm a mesma probabilidade
|

\
|
=
n
P
1
(.) . Se um evento A tem m pontos amostrais,ento
n
m
A P = ) ( , ou seja, P(A) =
nmero de casos favorveis / nmero total. Essa a definio que aproxima a
probabilidade freqncia relativa (definio frequentista de probabilidade).

Leis do Grandes Nmeros: Quando se repete um experimento um grande nmero de
vezes, a probabilidade pela freqncia relativa de um evento tende a probabilidade terica.

3.3 Probabilidade Condicional e Independncia


Em muitas situaes prticas, os fenmenos aleatrios considerados podem ser
separados em etapas consecutivas. A informao do que ocorreu em uma determinada
etapa pode influenciar nas probabilidades de ocorrncias das prximas etapas. Com este
ganho de informao pode-se recalcular as probabilidades de interesse, cujos resultados
recebem o nome de probabilidade condicional. Dados dois eventos A e B, a probabilidade
condicional de A dado que ocorreu B obtida por P(A/B) = ) ( / ) ( B P B A P , com P(B) > 0.
23

Bioestatstica Prof. Dr. Carlos Roberto Padovani
A regra do produto de probabilidades pode ser deduzida da expresso anterior,ou seja
P(AB) = P(A/B)P(B), com P(B) > 0. Se a informao da ocorrncia ou no de B no
altera a probabilidade da ocorrncia de A, deve acontecer que P(A/B) = P(A), ou
equivalentemente, ) ( ) ( ) ( B P A P B A P = , com P(B) > 0, mostrando a independncia
probabilstica entre os eventos A e B.

3.4 Teorema de Bayes


Seja a participao C
1
,C
2
,...,C
n
do espao amostral
|

\
|
= =
=
i
n
i
i i
C U i i C C
1
'
; ' , e
as seguintes probabilidades conhecidas P(
i
C ) e P(A/
i
C ), i=1,..., n.
Ento para qualquer j=1,...,n, tem-se:

=
=

=
n
i
i i
j j j
j
C P C A P
C P C A P
A P
A C P
A C P
1
) ( ) / (
) ( ) / (
) (
) (
) / (

3.5 Exemplos Aplicados

1) Um teste de proficincia in loco, avaliou a competncia dos tcnicos que analisavam o
Papanicolau para anormalidades. Os tcnicos de 306 laboratrios de citologia foram
avaliados e revelaram:

P(Ca feminino no colo do tero) = 0,000083;
P(Teste negativo/cncer) = 0,1625 (falso negativo);
P(Teste positivo/cncer) = 0,8375 (sensibilidade);
P(Teste positivo/sem cncer) = 0,1864 (falso positivo);
P(Teste negativo/sem cncer) = 0,8136 ( espeficidade).
Qual a probabilidade de uma mulher com Papanicolau positivo para o cncer ter realmente
a doena?

) ( ) / ( ) ( ) / (
) ( ) / (
) / (
Cncer Sem P Cncer Sem Pos Teste P Cncer P Cncer Pos Teste P
Cncer P Cncer Pos Teste P
positivo Teste Cncer P
+ +
=


) ( 999983 , 0 ) / (
) ( 000373 , 0
1864 , 0 999917 , 0 8375 , 0 000083 , 0
8375 , 0 000083 , 0
negativo teste um de preditivo Valor negativo Teste Cncer Sem P
positivo teste um de preditivo Valor
x x
x
=
=
+
=




24

Bioestatstica Prof. Dr. Carlos Roberto Padovani
2) Levantamento Nacional de Entrevistas de Sade (MS)

Condio de Emprego Amostra Debilidade Auditiva (Leso)
Atualmente Empregado (
1
E )
400000 60000
Atualmente Desempregado(
2
E )
38000 950
Fora de Fora de Trabalho(
3
E )
227000 2270
Total (E
1
U E
2
U E
3
) 665000 63220

Evento P(evento) = P(E) P(Deb/Evento) = P(D/E)
) (
i
E D P = P(E)*P(D/E)
1
E
0,6015037 0,150 0,0902255
2
E
0,0571428 0,025 0,00142857
3
E
0,3413533 0,010 0,00341353
D (debilidade) 0,0950676 0,0950675

) ( ) ( ) ( ) (
3 2 1
E D P E D P E D P D P + + = e P(E) = n(E) / n()


3) Sensibilidade e Especificidade

Doena Teste
Presente(D)
Ausente( D)
Probabilidade
Positivo (T+)
P(
+
T D )
P(
+
T D )
P(
+
T )
Negativo (T-)
P(

T D )
P(

T D )
P(

T )
Probabilidade P(D)
P( D)

Sensibilidade(S) e
Especificidade (E) so
caractersticas fixas dos
testes diagnsticos.Os
valores preditivos do teste,
porm, dependem da
prevalncia da doena.

Falso Positivo = ) ( / ) ( ) / ( D P T D P D T P
+ +
=

Falso Negativo = ) ( / ) ( ) / ( D P T D P D T P

=

Correto Positivo = ade Sensibilid D P T D P D T P = =
+ +
) ( / ) ( ) / (
.


Correto Negativo = dade Especifici D P T D P D T P = =

) ( / ) ( ) / (

Valor Preditivo Positivo = ) ( / ) ( ) / (
+ + +
= T P T D P T D P

Valor Preditivo Negativo = ) ( / ) ( ) / (

= T P T D P T D P

Considerando os resultados do exemplo 1

P(
+
T D/ )= 0,000373 (VPP) Para cada 1 milho (1000000) de Papanicolau positivos,
somente 373 representam casos verdadeiros (corretos) de cncer no colo(colon) uterino.
P(

T D/ ) = 0,999987(VPN) Para cada 1 milho de Papanicolau negativos, 999987
representam casos verdadeiros de ausncia de cncer no colo uterino.


25

Bioestatstica Prof. Dr. Carlos Roberto Padovani
4)Dois equipamentos, A e B, para processamento de dosagens bioqumicas so colocados
para teste de controle de qualidade por 120 horas. A probabilidade de que um erro de
clculo acontea em um equipamento do tipo A de 1/30; no tipo B, 1/80 e em ambos,
1/1000. Qual a probabilidade de que:
a) Pelo menos um dos equipamentos tenha apresentado erro?
04483 , 0 24000 / ) 24 300 800 (
1000
1
80
1
30
1
) ( = + = + = B A P
b) Nenhum equipamento tenha apresentado erro?
95517 , 0 ) ( 1 ) ( ) ( = = = B A P B A P B A P
c) Apenas o equipamento A tenha apresentado erro?
) ( ) ( ) ( :
03233 , 0 3000 / ) 3 100 (
1000
1
30
1
) ( ) ( ) (
B A B A B B A A A Observao
B A P A P B A P
= = =
= = = =


3.6 Probabilidade na Vida Real

Considere um ensaio clinico para examinar a eficcia de um novo tratamento
para AIDS. O resultado da anlise estatstica aponta que a diferena entre o antigo
tratamento e o novo significante. Isso mostra que a comunidade mdica pode
estar certa de que o novo tratamento funcionar no prximo paciente com AIDS?
Significa que ele funcionar para uma certa porcentagem de pacientes com AIDS?
Ou apenas que, na populao altamente selecionada do estudo, parece haver
vantagem do novo tratamento (mais provvel para a reposta desejada da cura) em
relao ao artigo?

3.7 Exerccios: Probabilidades

1) Um estudante acredita que sua chance de passar no vestibular de biomedicina de
2:23. Qual sua estimativa subjetiva da probabilidade de ser aprovado?

2) A experincia indica que 15% dos inscritos para a prova de seleo do
aprimoramento nunca aparecem. Se o anfiteatro para a realizao da prova tm 60
lugares e so aceitas 62 inscries, qual a probabilidade de poder acomodar no
anfiteatro todos os que comparecerem?

3) Qual o nmero mnimo de filhos de um casal para assegurar uma probabilidade
superior a 0,74 de obter do menos um filho do gnero feminino?
26

Bioestatstica Prof. Dr. Carlos Roberto Padovani

4) De acordo com certa tbua de mortalidade, a probabilidade de Jos estar vivo daqui
a 28 anos 0,6; e a mesma probabilidade para Joo 0,9. Determinar:
a) P(ambos estarem vivos daqui a 28 anos).
b) P(nenhum estar vivo daqui a 28 anos).
c) P(um estar vivo e outro estar morto daqui a 28 anos).

5) Determinar a probabilidade de n pessoas ( 365 n ) fazerem aniversrio em datas
diferentes.

6) As probabilidades de um aluno ser aprovado em Fisiologia, em Morfologia e ambas
so 0,75; 0,84 e 0,63, respectivamente. Qual a probabilidade de ser aprovado em
Fisiologia, sabendo-se que foi aprovado em Morfologia?

7) Suponha um teste diagnstico para cncer em que 95% dos que tm a doena
reagem positivamente, enquanto 3% dos que no tm a doena tambm reagem
positivamente. Suponha ainda que 2% da populao sejam portadores da doena.
Qual a probabilidade de um indivduo sorteado da populao que respondeu
positivamente ao teste diagnstico, ter de fato cncer?
8) Um grupo de pessoas foi classificado quanto a peso e presso arterial de acordo
com as propores do quadro a seguir:
Peso Presso
Excesso Normal Deficiente
Total
Elevada 0,10 0,08 0,02 0,20
Normal 0,15 0,45 0,20 0,80
Total 0,25 0,53 0,22 1,00
a) Qual a probabilidade de uma pessoa deste grupo, escolhida ao acaso, ter
presso elevada?
b) Verifica-se que a pessoa escolhida tem excesso de peso, qual a probabilidade
de ter tambm presso elevada?
c) Os eventos excesso de peso e presso elevada so independentes?

9) Considere o seguinte quadro de informao do Ministrio da Sade
(Manual de Qualificao do Captador Braslia / 1997)
Sistema ABO Rh
O A B AB
+ 36% 34% 8% 2,5%
- 9% 8% 2% 0,5%
Calcular as seguintes probabilidades:
a) P(Rh+ ou O) b) P(Rh- / O) c) P(Rh-)
d) P(AB) e) P(O+ ou AB+) f) P(O+ ou A- ou B+)

10) Num teste com duas marcas que lhe so apresentadas em ordem aleatria, um
experimentador de vinhos faz trs identificaes corretas em trs tentativas.
a) Qual a probabilidade de isso ocorrer, se na realidade ele no possuir habilidade
27

Bioestatstica Prof. Dr. Carlos Roberto Padovani
alguma para distingui-los?
b) E se a probabilidade de distinguir corretamente de 90% em cada tentativa?

11) Sabendo-se que 8% de um lote de ratos tem peso superior a 296g e 16% entre 280
e 296g, qual a probabilidade de um rato com peso superior a 280g pesar mais que
296g?

12) Num lote de animais, 50% so machos e 20% da raa Wistar. Dentre os que so
machos, 30% Wistar. Qual a porcentagem de animais que no so machos e nem
Wistar?

13) Em uma gaiola metlica 4% dos coelhos machos e 1% das fmeas tm mais que
1,8 kg de peso. Por outro lado, 60 % dos coelhos so fmeas. Se um coelho
escolhido casualmente tem mais que 1,8kg de peso, qual a probabilidade de ser
fmea?

14) Sabendo-se que 2% dos exames clnicos feitos por um laboratrio apresentam
falha humana, 1% falha tcnica e 2,5% pelo menos uma das duas falhas, qual a
probabilidade de um exame ter as duas falhas?

15) So dadas as seguintes informaes a respeito dos animais de um biotrio: 2%
macho e WKY; 10% WKY e 50% macho. Qual a probabilidade de um animal no
sendo macho ser WKY?


3.8 Respostas dos Exerccios
1) 0,08
2) 0,999498
3) n=3
4) a) 0,54 b) 0,04 c) 0,42
5)
|

\
|
|

\
|
|

\
|

365
1
1 ...
365
2
1
365
1
1
n

6) 0,75
7) 0,396
8) a) 0,20 b) 0,40 c) No
9) a) 0,895 b) 0,20 c) 0,195
d) 0,03 e) 0,385 f) 0,52
10) a) 0,125 b) 0,729
28

Bioestatstica Prof. Dr. Carlos Roberto Padovani
11) 0,333
12) 0,45
13) 0,20
14) 0,005
15) 0,16
29

Bioestatstica Prof. Dr. Carlos Roberto Padovani
4. Modelos Probabilsticos


No enfoque determinista original, sempre havia a crena de que medies mais
refinadas levariam a uma definio melhor da realidade fsica examinada. No enfoque
estatstico, os parmetros de uma distribuio algumas vezes no exigem realidade fsica e
s podem ser estimados pelo erro, no importa quo preciso seja o sistema de medio.
Por exemplo, no enfoque determinista, existe um nmero fixo, a constante gravitacional,
que descreve como as coisas caem em direo Terra. Na abordagem estatstica, as
medies da constante gravitacional sero sempre diferentes, e a disperso de sua
distribuio o que queremos estabelecer para entender os corpos que caem.
Os nmeros que identificam a funo de distribuio no so os nmeros medidos
experimentalmente. Eles no podem ser observados, embora possam ser inferidos pelo
modo como as medies se dispersam, e posteriormente foram chamados de parmetros
(do grego quase-medies). Os quatro parmetros que descrevem completamente um
membro do sistema de Pearson so:
i) a mdia (o valor central a partir do qual as medies se dispersam);
ii) o desvio-padro (o quanto a maioria das medies se dispersa em torno da
mdia);
iii) simetria (o grau em que as medies se acumulam em apenas um lado da
mdia);
iv) curtose (o quanto as medies raras se afastam da mdia).


4.1 Variveis Aleatrias Discretas


Uma quantidade X, associada a cada possvel resultado do espao amostral,
denominada de Varivel Aleatria Discreta (VAD) se assume valores num conjunto
enumervel com certa probabilidade.
Exemplos:
- Nmero de filhos em famlias.
- Nmero de gestaes.
A funo de probabilidade atribui a cada valor da VAD sua probabilidade. A notao para a
funo feita como:
i i i
p x p x X P = = = ) ( ) ( i =1....,n; onde 1 0
i
p e

=
=
n
i
i
p
1
1

4.2 Modelos Discretos mais Comuns



4.2.1 Modelo Uniforme
30

Bioestatstica Prof. Dr. Carlos Roberto Padovani

Todos os valores ocorrem com a mesma probabilidade.

n
x X P
i
1
) ( = = , para i=1,...,n.

4.2.2 Modelo ( Ensaio ) de Bernoulli

Uma VAD segue o modelo Bernoulli quando o espao amostral tem alternativas
dicotmicas, que genericamente podem ser representadas por respostas tipo sucesso-
fracasso.
( )
x x
p p x X P

= =
1
1 ) ( para x=0,1, com 0<p<1, sendo x = 0 (fracasso) e x = 1
(sucesso).


4.2.3 Modelo Binomial


Constitui-se pela repetio de n ensaios independentes de Bernoulli,sendo todos com a
mesma probabilidade de sucesso(p). A varivel aleatria X que conta o nmero total de
sucessos denominada Binomial com parmetros n e p.
A funo de probabilidade dada por:

k n k
p p
n
X P

|
|

\
|
= = ) 1 ( ) (

, com k=0,1,...,n ; 0<p<1 e

=
= =
n
k
k X P
0
1 ) (



4.2.4 Exemplos

1. Sabe-se que a eficincia de uma vacina 80%. Um grupo de trs indivduos sorteado,
dentre a populao vacinada, e submetido a testes para verificar se a imunizao foi
efetiva. Construa as probabilidades para o nmero de indivduos imunizados no sorteio.
X 0 1 2 3
P(X=x) 0,008 0,096 0,384 0,512


2. Uma certa doena pode ser curada por meio de procedimento cirrgico em 96% dos
casos.Dentre os que tm a doena, sorteamos 10 pacientes que sero submetidos
cirurgia. Qual a probabilidade de:
I. Todos serem curados?
6648 , 0 ) 10 ( = = X P
II. Pelo menos 8 curados?
9937 , 0 ) 8 ( 6648 , 0 2770 , 0 0519 , 0 ) 8 ( = + + = x P X P
31

Bioestatstica Prof. Dr. Carlos Roberto Padovani

3. Para casal com trs filhos construa a funo de probabilidades para o gnero feminino.
X(F) Nenhuma Uma Duas Trs
P(X=x) 1/8 3/8 3/8 1/8


4.3 Variveis Aleatrias Contnuas


So variveis cujos possveis valores ocorrem aleatoriamente e pertencem a um
intervalo dos nmeros reais (a resposta observada est associada a um procedimento de
mensurao).
Exemplos:
- Nvel de colesterol total (mg/dL) mtodo qumica seca.
- Peso (kg) mtodo balana.
- Existncia de um grande lenol de gua no subsolo de uma regio cuja profundidade no
foi determinada; porm, sabe-se que est situada entre 25 a 160 metros. Dispe-se de uma
sonda que, ao fazer a perfurao, detecta com preciso a profundidade do reservatrio de
gua (X:profundidade; 160 25 x ) mtodo perfurao.

4.4 Funo Densidade de Probabilidade

A funo f(x) uma FDP ou uma funo contnua de probabilidade para uma VAC, se
satisfaz as condies:
I. 0 ) ( x f , para todo x ;
II.


=1 ) ( dx x f .
Observao: Para calcular as probabilidades utiliza-se a rea sob a curva, ou seja, se
b a ento

=
b
a
dx x f b x a P ) ( ) ( . Lembrar que sendo a rea no ponto igual a zero,
tem-se ) ( ) ( ) ( ) ( b x a P b x a P b x a P b x a P < < = < = < = .

Exemplo: Arquelogos estudaram uma certa regio e estabeleceram um modelo terico
para o comprimento (C) de fosseis da regio(cm). Sendo C uma VAC com a seguinte FDP:

)
`

\
|
+ = 1
10 40
1
) (
c
c f , se 20 0 c e 0, caso contrrio.
Determinar:
I. O grfico de f(c)
II. P(C<8)
III. =E(C)=


dc c f ) (
32

Bioestatstica Prof. Dr. Carlos Roberto Padovani
IV.


= = dc c f c C Vac ) ( ) ( ) (
2 2




2 2
8
0
9 / 275
3 / 35
25 / 7 ) ( ) 8 (
cm
cm
dc c f C P
=
=
= = <




4.5 Modelo Gaussiano ou Modelo Normal


A varivel X tem distribuio normal ou gaussiana com parmetros
2
e , se sua FDP
dada por . 0 ; ,
2
1
) (
2
) ( 2 / 1
> < < < < =



e u x e x f
u x


Caractersticas da distribuio normal
I. f(x) simtrica em relao mdia.
II. f(x) 0 quando x .
III. o valor mximo de f(x) se d para x= .
IV. X de mdia X E : ) ( = .
: ) (
2
X Var = varincia de X .
V. Mdia = Moda = Mediana.
VI. O coeficiente de assimetria varia de -2 a +2.
VII. O coeficiente de curtose varia de 1 a 5 (mede a relao entre altura e a largura da
curva).

Observaes interessantes:
I. Por conveno, costuma-se considerar que os indivduos que representam os 5%
extremos de uma distribuio (2,5% para casa extremidade so anormais esprios).
Lembre-se que esta afirmao (2,5% nas extremidades) s pode ser assegurada
quando a distribuio de uma varivel numrica normal.
II. Este intervalo que inclui 95% das observaes no deve ser confundido com o
33

Bioestatstica Prof. Dr. Carlos Roberto Padovani
intervalo de confiana 95% para a mdia, que representa a margem de erro para a
mdia calculada (preciso da mdia).
III. Outro ponto fundamental da distribuio normal decidir que tipo de teste
estatstico pode ser aplicado, embora este problema possa ser contornado
utilizando-se amostras de tamanho adequado, quando se torna possvel aplicar o
teorema do limite central.

4.5.1 Distribuio Normal Padro (Z)


uma distribuio normal com mdia nula ( 0 =
z
) e varincia unitria ( 1
2
=
z
). A
distribuio normal padro Z, pode ser referida como distribuio normal reduzida ou
distribuio normal standard.

Observao Importante:
sempre possvel transformar uma varivel ) , ( ~
2
N X em uma varivel normal
reduzida ) 1 , 0 ( ~ N Z . Para isso, deve-se usar a transformao


=
x
Z (simplesmente
uma mudana escalar).Os resultados das probabilidades para a varivel Z encontram-se
tabelados.

4 6 Lema de GlivenkoCantelli (Joseph Glivenko & Francesco Paolo Cantelli)

O lema um desses resultados que parecem ser intuitivamente bvios, mas s
depois de terem sido descobertos. Se no se conhece nada sobre a distribuio de
probabilidade subjacente (que faz por baixo) que gerou um conjunto de dados, os prprios
dados podem ser usados para construir uma distribuio no-paramtrica. Essa uma
funo matemtica feia, cheia de descontinuidades e sem nenhum tipo de elegncia. Mas,
apesar de sua estrutura desajeitada, Cantelli foi capaz de mostrar que essa feia funo de
distribuio emprica fica cada vez mais prxima da funo de distribuio verdadeira
medida que o nmero de observaes aumenta.

4.7 Exemplos

1) Considere o peso X, em gramas, de cobaias com distribuio N (200g;144g
2
). Calcule as
probabilidades de cobaias com peso:
a) maior que 232g;
b) menor que 218g;
c) entre 185 e 216g;
34

Bioestatstica Prof. Dr. Carlos Roberto Padovani
d) maior que 192g.

2) Uma clnica de emagrecimento recebe pacientes adultos com peso N (130kg;400kg
2
).
Para efeito de determinar o tratamento mais adequado, os 25% pacientes de menor peso
so classificados de magros, enquanto os 25% de maior peso de obesos. Determinar os
pesos que delimitam cada classe.

3) A classificao do indivduo quanto ao valor de referncia do LDL Colesterol o
seguinte:
timo < 100 mg/dL
Desejvel 100 mg/dL a < 130 mg/dL
Limite 130 mg/dL a 159 mg/dL
Aumentado > 159 mg/dL
Sabendo-se que em determinado grupo o LDL ~N(115;484), qual a porcentagem de
indivduos em cada categoria de referncia?

4) Em populaes indgenas do Xingu, 20,90% dos homens adultos tm comprimento do
fmur superior a 34cm e 10,20%, inferior a 19 cm. Supondo a distribuio normal:
I. calcule a mdia e a varincia do comprimento do fmur;
II. encontre os limites inferior e superior que incluem 95% dos comprimentos
distribudos simetricamente ao redor da mdia.

4.8 Teorema Limite Central

Quando so retiradas amostras aleatrias de uma populao com distribuio normal, a
distribuio das mdias amostrais tambm ser normal (distribuio exata).
O mais importante que, se o tamanho da amostra for suficientemente grande (n 30),
as mdias amostrais tero distribuio normal independentemente da distribuio original
da varivel (em resumo; para amostras de tamanho maior que 30, podem ser utilizados
testes paramtricos para a comparao de mdias amostrais, mesmo que no se conhea
a distribuio da varivel em estudo).

Observao Interessante: O teorema do limite central no garante que a distribuio da
varivel na populao seja normal. Apenas garante a normalidade assinttica para os
testes paramtricos.

4.9 Transformao de Variveis

Vrios procedimentos estatsticos baseiam-se na suposio de normalidade dos dados
ou pelo menos na simetria deles. Porm, nem sempre estas situaes esto configuradas
35

Bioestatstica Prof. Dr. Carlos Roberto Padovani
nas variveis numricas pesquisadas. Uma alternativa consiste em efetuar uma
transformao das observaes, de modo a se obter uma distribuio mais simtrica e
prxima do normal.
Essa transformao pode se dar elevando os valores a uma potncia (positiva ou
negativa) ou calculando o logaritmo natural dos valores. O auxlio de grficos (histogramas,
disperso, desenhos esquemticos, ...) torna-se muito til para indicar a transformao
mais apropriada aos dados. Porm, deve-se tornar muito cuidado nas concluses face a
transformao realizada e atentar complexidade de interpretao, em alguns casos.



4.10 Exerccios: Distribuio Normal

1) Uma clnica de emagrecimento recebe pacientes adultos com peso distribudo como
normal com mdia 130 kg e desvio-padro 20 kg. Para efeito de determinar o
tratamento mais adequado, os 25% pacientes de menor peso so classificados de
magros, enquanto os 25% de maior peso de obesos. Determine os valores que
delimitam a classificao dos pacientes.

2) Em populao indgena do Xingu, 28,10% dos homens adultos tm comprimento do
fmur superior a 34 cm e 12,10% inferior a 19cm. Supondo o comprimento do fmur
com distribuio normal estabelea os limites que incluem, simetricamente, 80% dos
comprimentos ao redor da mdia.


3) Uma vacina contra a gripe eficiente em 85% dos casos. Sorteia-se, ao acaso, 10 dos
pacientes vacinados e pergunta-se a probabilidade de obter:
a) Todos imunizados.
b) Pelo menos 6 imunizados.
c) No mximo 6 imunizados.
d) No mais do que 2 no imunizados.

4) Suponha que as amplitudes de vida de dois aparelhos eltricos utilizados pelo
laboratrio de Bioqumica, tenham distribuies N(42;36) e N(45;9), respectivamente.
Se os aparelhos so feitos para ser usados por um perodo de 45 horas, qual deve ser
preferido? E se for por um perodo de 49 horas?
5) Um laboratrio farmacutico produz seringas, das quais 0,5% so defeituosas. As
seringas so vendidas em caixas com 20 unidades. Se a caixa tiver duas ou mais
defeituosas o preo de venda R$ 1,00; tendo uma, o preo R$ 2,50 e no tendo
36

Bioestatstica Prof. Dr. Carlos Roberto Padovani
defeituosa, o preo R$ 6,00. Qual o preo mdio de uma caixa?

6) Um teste de aptido feito por tcnicos de laboratrios experimentais e clnicos em
treinamento inicial requer que, uma srie de operaes seja realizada em uma rpida
sucesso. Admita que o tempo necessrio para completar o teste seja distribudo de
acordo com uma normal de mdia 60 minutos e desvio-padro 15 minutos.
a) Para passar no teste, o candidato deve complet-lo em menos de 50 minutos. Se 80
candidatos submetem-se ao teste, quantos so esperados passar?
b) Se os 5% melhores candidatos sero contratados com salrios diferenciados, quo
rpido deve ser o candidato para que obtenha essa posio?

7) Um novo remdio tem efeito colateral indesejvel em 5% das pessoas que o tomam.
Se 16 pacientes tomam o remdio qual a probabilidade de:
a) Nenhuma reao negativa?
b) Uma reao negativa?
c) No mximo uma reao negativa?
d) No mnimo uma reao negativa?

8) As alturas de 1200 estudantes das reas de Cincias Biolgicas e da Sade de uma
Universidade tm distribuio N(1,70m; 0,0625 m
2
).
a) Quantos tm altura inferior a 1,80m?
b) Entre 1,60 e 1,85m?
c) Menor que 1,55m?

9) Uma indstria farmacutica sabe que, em mdia, 1% dos comprimidos por ela
produzidos contm um componente da composio abaixo do padro especificado,
sendo por isso, inaceitveis (descartados). Em uma amostra de 500 comprimidos, qual
a probabilidade de haver menos de trs inaceitveis?

10) A durao da gravidez humana, da concepo ao parto, varia segundo uma
distribuio aproximadamente normal com mdia 266 dias e desvio-padro de 16 dias.
a) Qual a porcentagem dos casos de gravidez com menos de 240 dias?
b) Qual a porcentagem dos casos de gravidez que duram entre 240 e 270 dias?

11) Em indivduos sadios, o consumo geral de oxignio tem distribuio normal com
mdia 12cm
3
/min e desvio-padro 2cm
3
/min. Determine a proporo de indivduos
sadios com consumo:
a) Inferior a 10cm
3
/min.
37

Bioestatstica Prof. Dr. Carlos Roberto Padovani
b) Superior a 15cm
3
/min.
c)Entre 8cm
3
/min e 15cm
3
/min.
Determinar o valor do consumo geral que superado por 92,5% dos indivduos sadios.

12) Qual o nmero mnimo de filhos que um casal deve ter para que se tenha ao menos
0,95 de probabilidade que se ter ao menos uma menina?

13) Dez pares de coelhos so submetidos a duas dietas. A alocao das dietas a cada par
feito por processo randmico. Aps o experimento avalia-se os ganhos de peso dos
animais. No par onde o ganho de peso da dieta A for superior ao da B, ser dito como
sucesso. Qual a probabilidade de que pelo menos 8 sucessos ocorram se as dietas
no possuem diferenas reais no que diz respeito as propriedades de ganho de peso?


14) O peso vivo de coelhos tem distribuio normal com mdia 3,4kg e desvio-padro
0,2kg. Se o peso de um animal for inferior a 3,3 kg ele vendido a R$ 3,20, caso
contrrio, a R$ 4,30. Qual o preo mdio de venda de cada animal?

15) A quantidade de um anestsico necessria para um procedimento cirrgico comporta-
se como N(50mg; 100mg
2
). A dose letal tambm admite-se ser N(110mg; 400mg
2
).
Que porcentagem dos animais submetidos a essa cirurgia morreria se fosse usado a
dose que anestesia 95% dos animais?


16) Considere que 40% dos ratos de um biotrio so fmeas. Numa lote de 20 animais,
qual a probabilidade de encontrar:
a) no mximo 10 fmeas?
b) pelo menos 4 fmeas?
c) exatamente 12 fmeas?

17) Sabe-se que 8% das vacinas estocadas numa central de atendimento tm validade
vencida. Retirando-se, casualmente, 10 vacinas de uma entrega, qual a probabilidade
de:
a) uma vacina com validade vencida?
b) existir vacina com validade vencida?
18) Se o peso bruto de sunos normalmente distribudo, qual a probabilidade de um
peso deferir da mdia de:
a) mais da metade do desvio-padro?
38

Bioestatstica Prof. Dr. Carlos Roberto Padovani
b) menos de 5/8 do desvio-padro?

19) O peso de coelhos de uma granja tem distribuio N(3kg;0,25kg
2
). Um abatedouro
comprar 5000 coelhos e pretende classific-los de acordo com o peso do seguinte
modo: os 20% mais leves como pequenos, os 50% seguintes como mdios e os 30%
restantes (mais pesados) como grandes. Quais so os limites de peso para cada
classificao?

20) Sabendo-se que o peso de ratos distribui-se normalmente e que 88,10% dos pesos
esto abaixo de 280g e 45,62% acima de 200g, qual a porcentagem de animais com
peso acima de 220g?


21) Considere a famosa frase do filsofo matemtico Descartes: Logito, ergo sum. Uma
das trs palavras selecionada ao acaso. Determine as distribuies de probabilidade
de:
a) V (nmero de vogais na palavra selecionada)
b) C (nmero de consoantes na palavra selecionada)
c) V+C
d) (V-1)
2

22) Um biomdico tem vrias analises bioqumicas para realizar; 40% delas iro requerer
1 hora de trabalho, 20% duas horas e 40% trs horas. Ele seleciona duas anlises
aleatoriamente e realiza o procedimento analtico. Determine a distribuio do tempo
(X), que ele leva para realizar as duas anlises selecionadas.

39

Bioestatstica Prof. Dr. Carlos Roberto Padovani
5. Estimao de Parmetros


5.1 Introduo


Descartes (Ren Descartes, 1596-1650, foi filsofo, fsico e matemtico.
Notabilizou-se sobretudo por seu trabalho revolucionrio na filosofia e na cincia, mas
tambm obteve reconhecimento matemtico por sugerir a fuso da lgebra com a
geometria, fato que gerou a geometria analtica e o sistema de coordenadas que leva seu
nome.) aponta que o bom senso a coisa mais bem distribuda no mundo: pois cada um
pensa estar to bem provido dele, que mesmo aqueles mais difceis de se satisfazerem
com qualquer outra coisa no costumam desejar mais bom sendo do que tm. Assim, no
verossmil que todos se enganem; mas, pelo contrrio,isso demonstra que o poder de
bem julgar e de distinguir o verdadeiro do falso,que propriamente o que se denomina bom
senso ou razo, por natureza igual em todos os homens; e portanto que a diversidade de
nossas opinies no decorrem de uns serem mais razoveis que outros, mas somente de
que conduzimos nossos pensamentos por diversas vias, e no consideramos as mesmas
coisas.
A tomada de decises sobre a populao, com base em estudos feitos sobre os dados
da amostra, constitui o problema central (ncleo) da Inferncia Estatstica. A tais decises
esto sempre associados um grau de incerteza e, consequentemente, uma probabilidade
de erro. A generalizao da amostra para a populao deve ser feita dentro de um modelo
estatstico para a situao em estudo. Os dois tpicos bsicos abordados pela Inferncia
Estatstica so: a)estimao de parmetros e b) teste de hipteses sobre parmetros.
Resumidamente, a Inferncia Estatstica objetiva estudar a populao por meio de
evidncias fornecidas pela amostra. a amostra que contm os elementos que podem ser
observados e onde as quantidades de interesse podem ser medidas. No contexto terico
os parmetros so funes de valores populacionais, quanto estatsticas so funes de
valores amostrais.

Observao:
I. Evidncia trata-se da qualidade do objetivo ( a plena certeza com que a verdade
nos aparece e determina a adeso do esprito).
II. Certeza trata-se do estado sujeito ( o estado de esprito que afirma sem o temor de
enganar-se).


5.2 Parmetros, Estimadores e Estimativas


40

Bioestatstica Prof. Dr. Carlos Roberto Padovani
As quantidades da populao em geral desconhecidas e sobre as quais tm-se
interesse, so denominadas parmetros (representaes: ,... , , ).
combinao dos elementos da amostra, construda com a finalidade de representar,
ou estimar, um parmetro de interesse na populao, denomina-se estimador
(representaes: ,... , ,

).
Aos valores numricos assumidos pelos estimadores denominamos estimativas
pontuais ou, simplesmente, estimativas.
Fisher estabeleceu alguns critrios para uma boa estatstica
i) Consistncia quanto mais dados houver, maior a probabilidade de que
a estatstica calculada esteja perto do valor real do parmetro.
ii) Ausncia de Vis se usarmos uma estatstica particular muitas vezes
sobre diferentes conjuntos de dados, a mdia desses valores da estatstica dever
chegar perto do verdadeiro valor do parmetro.
iii) Eficincia os valores da estatstica no sero exatamente iguais ao
verdadeiro valor do parmetro, mas a maioria de um grande nmero de estatsticas
que estimem um parmetro no deve estar longe do valor verdadeiro.

Tabela 1. Principais estimadores pontuais
Parmetro Estimador Propriedades
(mdia populacional)
X
No viciado e Consistente
(proporo pop.) p = freq. relativa No viciado e Consistente
2
(varincia pop.)
2
S
No viciado e Consistente


Observao:
I. Um estimador

no-viciado (imparcial ou no-viesado) para um parmetro se


= )

( E (seu valor esperado coincide como parmetro de interesse).


II. Um estimador

consistente medida que o tamanho da amostra aumenta, seu


valor converge para o parmetro de interesse e sua varincia converge para o zero.
Ou seja:
=

)

( limE
n
e
0 )

Var( lim =


n
.


5.3 Distribuies Amostrais


Os estimadores so funes de variveis aleatrias e, portanto, so variveis
aleatrias. Neste sentido, torna-se muito interessante obter a distribuio probabilstica dos
estimadores.

41

Bioestatstica Prof. Dr. Carlos Roberto Padovani

5.3.1 Mdia Amostral ( X)


Considere uma amostra aleatria de tamanho n de uma varivel X ~ N (
2
, ), ento,
mostra-se que:
I. X ~ Normal;
II.
X
= = ) (X E ; ). ; ( ~
2
n
N X


III.
2
X
=Var( X ) =
n
2

.

Observao Importante: medida que o tamanho amostral cresce a probabilidade de a
mdia amostral estar na proximidade da mdia populacional maior.

Exemplo: O Biotrio possui uma mquina para encher pacotes de rao com peso que se
comporta como uma v.a. normal com mdia 200g desvio padro 10g. Uma amostra
aleatria de 25 pacotes sorteada e pergunta-se:
I. Qual o nmero esperado de pacotes da amostra com peso inferior a 205g?
29 , 17 . 69146 , 0 ) 50 , 0 ( ) 205 ( = = < = < ESP N Z P X P pacotes.
II. Qual a probabilidade de que o peso mdio dos pacotes da amostra no exceder
205g?
. 99379 , 0 ) 50 , 2 ( ) 205 ( = < = < Z P X P


5.3.2 Proporo Amostral (p)


Para uma amostra de tamanho n retirada de uma populao qualquer com mdia e
varincia
2
, a distribuio de X , pelo teorema TLC, para n tendendo a infinito normal
padro, ou seja, .
X
X
X


). 1 , 0 ( ~ N Z
Considerando
) (

n amostra da Tamanho
Y ticas caracters a com dada amostra na indivduos de N
p =

0, caso contrrio.
e para o i-simo individuo
i
Y =
1, se o individuo apresentar a caracterstica (sucesso),

ento Y
n
Y Y
p
n
=
+ +
=
...

1
.
42

Bioestatstica Prof. Dr. Carlos Roberto Padovani

Cada
i
Y Bernoulli, ou seja, p Y E
i
= ) ( e ) 1 ( ) ( p p Y Var
i
= , para i=1,...,n. Logo,
para
n
Y Y ,...,
1
uma seqncia de variveis aleatrias independentes de Bernoulli, tem-se:
E( p ) = E( y ) = p;
Var( p ) = Var( y ) =
n
p p ) 1 (
.

Para n suficientemente grande, pelo TLC:


n
p p
p p
y
y
y
) 1 (


Z ~ N (0,1).

Exemplo: Um laboratrio farmacutico afirma que sua vacina contra gripe imuniza em 80%
dos casos. Uma amostra de 25 indivduos que tomaram a vacina foi sorteada e testes
foram feitos para verificar a imunizao ou no desses individuos. Se o fabricante estiver
correto, qual a probabilidade da proporo de imunizados na amostra ser inferior 0,75?
E superior 0,85?
p = 0,80 1-p = 0,20 E( p ) = E( y ) = 0,80
Var( p ) = Var( y ) = 0,0064

P( p < 0,75) = P( 625 , 0 < Z ) = 0,26435
P( p > 0,85) = P( 625 , 0 > Z ) = 0,26435

5.4 Estimao por Intervalo

Se no h como dizer que uma estimativa exatamente correta, existe algum modo de
dizer quo prxima ela est do valor verdadeiro do parmetro? Sim, pelo uso da estimativa
por intervalo. Uma estimativa pontual um nico nmero. Algumas vezes, a estimativa por
intervalo muito ampla, fato tambm que deve ser melhorado. A concluso que pode-se
tirar de um intervalo demasiado vasto que a informao disponvel no adequada para
tomar uma deciso, e que outras informaes devem ser procuradas, talvez ampliando o
escopo da investigao ou empenhando-se em outra srie de experimentos.
Como se calcula uma estimativa de intervalo? Como se interpreta uma estimativa
de intervalo? Pode-se fazer uma afirmao de probabilidade a seu respeito? Quo certo
est em dizer que o verdadeiro valor do parmetro est dentro do intervalo?
Em 1934, Neyman apresentou uma palestra sobre a anlise de pesquisas por
amostragem cujo material apresentado tem no seu apndice o caminho direto para criar
uma estimativa por intervalo e determinar seu nvel de exatido. Chama-se esse
43

Bioestatstica Prof. Dr. Carlos Roberto Padovani
procedimento de intervalos de confiana, e as extremidades dos intervalos de confiana,
de limites de confiana.
Como entender a probabilidade versus o grau de confiana? O procedimento de
Neyman resiste, no importa quo complicado seja o problema, e essa a razo pela qual
ele to amplamente utilizado nas anlises estatsticas. O que significa probabilidade
nesse contexto?
Em sua resposta, Neyman caiu na definio frequentista de probabilidade na vida real. Ou
seja, o intervalo de confiana deve ser visto no em termos de cada concluso, mas como
um processo. Com o decorrer do tempo, um estatstico que sempre calcula intervalos de
95% de confiana descobrir que o valor verdadeiro do parmetro est dentro do intervalo
construdo 95% das vezes. A probabilidade associada ao intervalo de confiana no era a
probabilidade de acerto, mas a freqncia de declaraes corretas que um estatstico que
utiliza o mtodo de Neyman far no decorrer do tempo. Nada afirma a respeito de quo
precisa a estimativa corrente.
Mesmo com o cuidado que Neyman tomou ao definir o conceito, e com os cuidados
que outros estatsticos tomaram para manter o conceito de probabilidade claro e no
contaminado, o uso geral dos intervalos de confiana na cincia produziu muitos
raciocnios descuidados. No incomum, por exemplo, que algum que esteja usando um
intervalo de confiana de 95% afirme que est 95% seguro de que o parmetro esteja
dentro desse intervalo.
Portanto, o clculo do grau em que uma pessoa pode estar segura de alguma coisa
diferente do clculo de um intervalo de confiana.
Os estimadores pontuais fornecem como estimativa um nico valor numrico para o
parmetro de interesse (aspecto no muito interessante do ponto de vista biolgico). Por
serem variveis aleatrias, os estimadores possuem uma distribuio de probabilidades e,
levando este fato em considerao, pode-se apresentar uma estimativa mais informativa
para o parmetro de interesse que inclua uma medida de preciso do valor obtido. Esse
mtodo de estimao, denominado intervalo de confiana, incorpora, estimativa pontual
do parmetro, informaes a respeito de sua variabilidade.


5.4.1 IC Mdia Populacional (
2
conhecido)

Objetiva-se construir um intervalo simtrico ao redor de que contenha a massa
44

Bioestatstica Prof. Dr. Carlos Roberto Padovani
ou rea =1 .
Isto ,


= < < = = < < ) ( 1 ) (
2 2
z Z z P b X a P
.
O intervalo de confiana para )) ; ( ( IC , com coeficiente de confiana =1 ,
dado por n z x LI /
2

= e n z x LS /
2

+ = .
Interpretao de IC( ; ): quando se considera vrias amostras de mesmo
tamanho e para cada amostra calcular os respectivos limites de confiana, com coeficiente
de confiana , espera-se que a proporo de intervalos que contenham o valor de seja
igual a .


Observao: Para o nvel de 95% de confiana tem-se para os tamanhos amostrais 10, 100
e 1000 os seguintes limites de confiana com os respectivos comprimentos do intervalo
(amplitude/intervalo):

n Limites de 95% confiana Amplitude
10 x 0,620 1,240
100 x 0,196 0,392
1000 x 0,062 0,124

Exemplo:
1) Os comprimentos de jacars adultos de uma certa raa tm distribuio normal com
mdia desconhecida e varincia igual a 0,01m
2
. Uma amostra de 10 animais foi
sorteada e forneceu mdia 1,69m. Estabelea os limites de confiana 95% para o
comprimento dos jacars.

=0,95
96 , 1
2
=

z
IC( ): 1,69 0,06
m m 75 , 1 63 , 1
Amplitude do intervalo = m
n
z 12 , 0 2
2
=



Semi-amplitude = 0,06m = Erro envolvido na estimao.


5.4.2 IC Proporo de Sucessos (Aproximao-TCL)


)
) 1 (
, ( ~
n
p p
p N p


45

Bioestatstica Prof. Dr. Carlos Roberto Padovani
Otimista
IC(p; ):
n
p p
z p
) 1 (



n
p p
z p
) 1 (



Conservativo

n
z p
4
1





Exemplo:
Estimar a proporo de cura de um certo medicamento em doentes contaminados com
cercria ( uma das formas do verme da esquistossomose) administrado, ao acaso, em 200
pacientes.Considere para a estimao o nvel de confiana 95% e que foi verificada a cura
em 160 pacientes.
95 , 0 = 80 , 0 = p e
96 , 1
2
=

z

Soluo Otimista
855 , 0 745 , 0 055 , 0 80 , 0 : ) 95 , 0 ; ( p p IC .
Soluo Conservadora
869 , 0 731 , 0 069 , 0 80 , 0 : ) 95 , 0 ; ( p p IC .

5.4.3 IC para Mdia Populacional (
2
desconhecido )

IC( ; ):
n
s
t x
n ) 1 ,
2
(


onde
|

\
|
1 ,
2
n
t

corresponde ao quantil de ordem 100(1-
2

)% da
distribuio t de Student(William Gosset) com (n-1) graus de liberdade.


Exemplos:
1) Para a populao de bebs submetidos a cirurgia fetal para anomalias congnitas, a
distribuio das idades gestacionais ao nascer aproximadamente normal. Uma
amostra aleatria de 16 desses bebs tem uma idade gestacional mdia de 29,6
semanas e desvio padro de 3,6 semanas. Construa um intervalo de 95% confiana
para a idade gestacional mdia populacional.
n=16 e 95 , 0 =
( )
131 , 2
15 ; 025 , 0
= t
IC( 95 , 0 ; ): 29,6 1,9 27,7sem 31,5sem

2) Doze ratos foram alimentados com uma dieta experimental, desde seu nascimento at
a idade de trs meses.Os aumentos de pesos(g) foram os seguintes: 77; 68; 66; 75;
74; 70; 68; 71; 72; 69; 73; 75. Determine um intervalo de confiana de 95% para a
mdia dos aumentos de peso.
46

Bioestatstica Prof. Dr. Carlos Roberto Padovani

n=12 e =0,95
( )
201 , 2
11 ; 025 , 0
= t
40 , 3 56 , 11 ; 5 , 71
2
= = = s e s x 2 , 2 5 , 71 : ) , ( IC g g 7 , 73 3 , 69

5.5 Consideraes Finais
I. Os estimadores pontuais especificam um nico valor para o estimador,
impossibilitando julgar qual o erro que se comete no processo de estimao.
II. Com os intervalos de confiana a magnitude do erro pode ser mensurada
(probabilidade de cometer erros de determinadas magnitudes).
III. O intervalo pode ou no conter o parmetro, mas sua construo assegura que tm-
se 100 %=100(1- )% de confiana que contenha.
IV. Se T for um estimador do parmetro , chama-se erro padro de T a quantidade
EP(T) = ) (T Var .
Exemplos: T= X EP( X )=
n

erro padro de X .
T=
^
p EP(
^
p )=
n
p p ) 1 (
erro padro de p.
T= MED EP( MED)
n 2

erro padro de MED.



V. Desigualdade de Chebyshev
Se E(x) = e Var(x) =
2
finita, ento, para todo 0 > , P( | | x )

2
/ ) ( x Var .
VI. Lei dos Grande Nmeros(LGN)
Considere n ensaios de Bernoulli com p= P(Sucesso), e seja o nmero de
sucessos nas n provas. Para n grande, a proporo de sucessos
n

estar prximo
de p=P(Sucesso). Ou seja,
2 2
) 1 (
) | (|

n
p p
p
n
P

.
VII. Uso da LGN para o clculo de tamanho amostral. Qual o n a fim de que
n

defira de
p menos de , com probabilidade maior ou igual a .
2
) 1 (
1 ) | (| ) | (|


n
p p
p
n
P p
n
P
LGN

<

<


2 2 2
) 1 ( 4
1
) 1 (
) 1 ( ) 1 (
1

= n
p p
n
n
p p
.

47

Bioestatstica Prof. Dr. Carlos Roberto Padovani

5.6 Exerccios: Estimao (Intervalo de Confiana)


1) Uma amostra aleatria de 144 alunos de uma universidade revela que 70% deles
preferem as provas nos finais de semana, fora do horrio regular semanal. Construir
um intervalo de 90% de confiana para a proporo de alunos favorveis
realizao das provas nos finais de semana.

2) Entrevistam-se em um municpio 1200 pessoas adultas a respeito do conhecimento
sobre Diabetes mellitus e constata-se que 80 tm desconhecimento total da doena.
Estabelecer um intervalo de 95% de confiana para a proporo populacional de
desconhecimento.


3) Em um estudo de poluio lacustre a concentrao de chumbo em 25 amostras de
1000 cm
3
cada, extradas da camada sedimentria superior do fundo de um lago
forneceu mdia 0,38 e desvio-padro 0,06. Estabelea um intervalo de 99% de
confiana para a concentrao mdia de chumbo por 1000 cm
3
de sedimento do
fundo do lago.

4) Uma amostra de 160 voluntrios foi utilizada em um experimento para verificar a
eficincia de um novo medicamento preventivo da gripe. Embora todos fossem
expostos ao vrus, 90 deles no contraram a doena. Determine um intervalo de
confiana ( 95 , 0 = ) para a proporo de pessoas que o novo medicamento
protege contra a gripe.


5) Obtm-se uma amostra de 35 crnios de homens egpicios que viveram por volta de
1850 AC. Mede-se a largura mxima de cada crnio, encontra-se mm x 5 , 134 = e
48 , 3 = s mm (dados de Ancient Races of the Thebaid, por Thomson e Randall
Marciver). Com esse dados amostrais, construir um intervalo de 95% de confiana
para a mdia populacional da largura mxima dos crnios.

6) Em uma amostra de 50 ratos que receberam dieta hipercalrica, encontrou-se 10
com peso abaixo do padro esperado. Estimar por intervalo de 95% de confiana a
proporo de ratos com peso abaixo do esperado na dieta hipercalrica.

48

Bioestatstica Prof. Dr. Carlos Roberto Padovani

7) Um lote de 20 bovinos forneceu os seguintes pesos (kg): 250, 265, 267, 269, 271,
281, 283, 284, 287, 289, 291, 293, 298, 301, 301, 301, 303, 306. Por meio de
construo de intervalo de confiana ( 0,95 ), responder se este lote satisfaz a
condio de que o peso mdio deve ser 293 kg.

8) Pretende-se coletar uma amostra de uma varivel aleatria com distribuio normal
de mdia desconhecida e varincia 36. Qual deve ser o tamanho da amostra para
que, com probabilidade 0,9768, a mdia amostral no difira da mdia da populao
por mais de 2 unidades?


9) De experincias passadas, sabe-se que o desvio-padro da altura de crianas
5cm. Que tamanho de ter uma amostra dessa populao para que o intervalo
225 , 1 150 cm tenha 95% de confiana?

10) Antes de adotar uma tcnica laboratorial padro em que existiam dois
procedimentos, A e B, foi feita uma pesquisa de opinio com 225 tcnicos
especializados escolhidos ao acaso, e verificou-se que 115 deles optaram pelo
tcnica A. Construa um intervalo de 95% de confiana, para a porcentagem de
tcnicos favorveis tcnica A.
49

Bioestatstica Prof. Dr. Carlos Roberto Padovani
6.Testes de Hipteses

6.1 Consideraes Preliminares


Popper (Sir Karl Popper, 1902-1994, filsofo austraco naturalizada britnico,
considerado por muitos como o filosofo mais influente do sculo XX a tematizar a cincia.)
ensina que s possvel aprender com o erro. Para o entendimento da assertiva
popperiana, considere uma menina recm-nascida. Ela est programada para esperar
coisas do mundo (caso no tivesse algum programa em seu crebro, seria como um
computador sem um sistema operacional completamente morto). Hipoteticamente,
imagine que a criana programada para acreditar que o mundo macio. Os pais da
criana fazem o possvel para que tudo que o toque a menina seja cor-de-rosa e macio em
seus primeiros dias de vida e, portanto, ela no tem razes para rejeitar sua preconcepo
de que o mundo todo macio. Porm, deve ser notado que no importa quantos objetos
macios ela tenha tocado, isto nunca provar que o mundo macio. Basta tocar um nico
objeto rgido, talvez um brinquedo de cor azul, para rejeitar toda sua conjectura sobre o
mundo macio. A criana descobre que estava errada e aprende. Ela criar uma nova
conjectura, talvez que apenas objetos azuis sejam rgidos, e somente ir adiante quando
houver alguma razo para refutar esta nova conjectura. A metodologia Popperiana se
baseia nesta linha de raciocnio, ou seja, mais fcil desaprovar (contradizer) do que
provar uma assertiva ( muitas vezes denominada prova da contradio).
A tomada de deciso estatstica, no campo da Inferncia Estatstica, em um teste de
hipteses desenvolvida semelhana do procedimento de Popper quando utiliza-se a
abordagem de Neyman e Pearson. Objetiva-se pela abordagem fornecer uma metodologia
que permita verificar se os dados amostrais trazem evidncias que apiem ou no uma
hiptese estatstica formulada. A idia central desse procedimento a supor verdadeira a
hiptese em questo e verificar se a amostra observada verossmil sob a veracidade da
hiptese formulada.
Em continuidade ao mtodo de construo de um teste de hipteses, ser
apresentada uma segunda abordagem devido a Fisher. Esta consiste em apresentar a
probabilidade significncia ou nvel descritivo ou auida p-value do teste. Os passos das
duas abordagens so muito parecidos; porm, a principal diferena consiste em no
construir a regio crtica do teste no mtodo de Fisher. Isto , o que se faz determinar a
probabilidade (p) de ocorrer valores da estatstica mais extremos do que o observado, Sob
a hiptese de nulidade (ausncia de efeito, ou seja, presena meramente casual) ser
verdadeira. Uma forma prtica de entender o significado da hiptese nula pode ser vista na
seguinte indicao. Uma hiptese nula uma assertiva de como o mundo deveria ser, se
afirmao colocada estivesse errada
50

Bioestatstica Prof. Dr. Carlos Roberto Padovani
O que representa ter um resultado no significativo em um teste de significncia?
Podemos concluir que a hiptese verdadeira se falhamos em refut-la?
Fisher considerava que valores de p altos (um fracasso em encontrar significncia)
indicavam a inadequao dos dados para se chegar a uma deciso. Para Fisher, nunca
houve a premissa de que o fracasso em encontrar significncia implicasse que a hiptese
testada era verdadeira.
Os testes de significncia, quando usados com preciso, so capazes de rejeitar ou
invalidar hipteses, quando so contrariados pelos dados; mas nunca so capazes de
estabelec-las certamente como verdadeiras.
Quando da formulao de Neyman-Pearson a grande descoberta foi o de que os
testes de significncia no faziam sentido a no ser que houvesse pelo menos duas
hipteses possveis. A probabilidade de detectar aquela hiptese alternativa, se for
verdadeira, o poder do teste. Para distinguir entre a hiptese que est sendo usada para
calcular o valor de p de Fisher e a outra possvel hiptese ou hipteses, Neyman-Pearson
chamaram a hiptese testada de hiptese nula e as outras de alternativas. Em sua
formulao, o valor de p calculado para testar a hiptese nula, mas o poder do teste se
refere a como, esse valor de p se comportar se a alternativa for de fato verdadeira.
Em muitas situaes, os testes de hipteses so usados sobre uma hiptese nula
que um artifcio. Por exemplo, quando duas drogas so comparadas, em um ensaio
clnico, a hiptese nula, a ser testada, que elas produzem igual efeito. No entanto, se isso
fosse verdade, o estudo nunca teria sido feito.
A hiptese nula de que os dois tratamentos so iguais um bufo (boneco), criado
para ser derrubado pelos resultados do estudo. Assim, segundo Neyman, o planejamento
do estudo deve ser orientado no sentido de maximizar o poder dos dados resultantes para
derrubar o artifcio e mostrar como as drogas se diferenciam na verdade.
Em 1977, David R. Cox para distinguir entre o uso que Fisher dava aos valores de p
e a formulao de Neyman-Pearson, ele chamou o mtodo de Fisher de teste de
significncia, e o de Neyman-Pearson de teste de hiptese. Cox conclui que o clculo da
significncia estatstica (atravs dos valores p) se tinha transformado em um dos mtodos
mais amplamente usados na pesquisa cientifica. Os testes de significncia e os valores de
p so, hoje, constantemente usados.
A idia de teste de uma hiptese ser introduzida por meio de um exemplo, partindo de
uma situao simples para a tomada de deciso (deciso popular e natural), sendo
gradualmente ampliada para atender situao geral de testes de hipteses.
Considere que o colesterol total (mg/dL) tenha distribuio normal de probabilidade e
ainda:

A: Alunos de Educao Fsica ~ N(145;144)
51

Bioestatstica Prof. Dr. Carlos Roberto Padovani
B: Alunos de Cincias Biolgicas ~ N(155;400).
Um grupo de 25 alunos do mesmo curso forneceu uma mdia de 148 mg/dL para o
colesterol total. Qual deve ser o curso de origem dos alunos?


1 idia (Deciso Popular e Natural)


Regra de Deciso: Se Fsica Educao dL mg x / 150
Se Biolgicas Cincias dL mg x > / 150



Observao: Deve ser considerado que possvel encontrar uma amostra de 25 alunos de
Cincias Biolgicas que apresente mdia de 148 mg/dL. Assim como, mdia acima de 150
mg/dL para um grupo de alunos de Educao Fsica. Neste sentido, a regra de deciso
estabelecida fica mais informativa quando so associados os erros que podem ser
cometidos.

Ou seja,

Erro tipo I: dizer que os alunos so de Educao Fsica(A), quando no realidade so de
Cincias Biolgicas (B).

Erro tipo II: dizer que os alunos so de Cincias Biolgicas (B), quando na realidade so de
Educao Fsica (A).

Para estabelecer a magnitude desses erros considere as seguintes hipteses:

H
0
: Os alunos so de Cincias Biolgicas (B) dL mg / 155 = e dL mg / 20 = .


H
1
: Os alunos so de Educao Fsica (A) dL mg / 145 = e dL mg / 12 = .


P(Erro tipo I) = P (A/B verdade) = P ( 150 x / H
0
verdade)
= P ( )
25
400
, 155 ( ~ / 150 N x x ) = P( 25 , 1 Z ).
Portanto, = P(Erro tipo I) = 0,1056.

P(Erro Tipo II) = P(B/A verdade) = P( 150 > x / H
1
verdade)
52

Bioestatstica Prof. Dr. Carlos Roberto Padovani
= P( 150 > x / )
25
144
, 145 ( ~ N x ) = P(Z> 2,08).
Portanto, = P(Erro tipo II) = 0,0188.
O seguinte quadro de probabilidades indica os erros e acertos para a deciso tomada.


Deciso (H
0
ou H
1
) Curso (Origem do grupo)
H
0
: Cincias Biolgicas H
1
: Educao Fsica
Educao Fsica (A) Erro Tipo II (1,88%) Correta (98,12%)
Cincias Biolgicas (B) Correta (89,44%) Erro Tipo I (10,56%)

A regra de deciso, de certo modo, privilegia a afirmao de que os alunos so de
Educao Fsica (o erro tipo I apresenta-se com maior probabilidade do que o erro tipo II).


2 idia: Estabelecer uma regra de deciso em que a probabilidade de errar contra
Cincias Biolgicas seja a mesma de errar contra Educao Fsica ( = ).




= P(Erro Tipo I) = P(
C
x x / H
0
verdade) = P (Z
4
155

C
X
)
= P(Erro Tipo II) = P(
C
x x > / H
1
verdade) = P (Z
4 , 2
145
>
C
X
)
75 , 148
4 , 6
952
4 , 2
145
4
155
= =


C
C C
X
X X
mg/dL.
Ou seja, se
C
X = 148,75 mg/dL, tem-se % 94 , 5 = = .

O quadro de probabilidades para a 2 idia fica constitudo como:

Deciso (H
0
ou H
1
) Curso (Origem do grupo)
H
0
: Cincias Biolgicas H
1
: Educao Fsica
Educao Fsica (A) Erro Tipo II (5,94%) Correta (94,06%)
Cincias Biolgicas (B) Correta (94,06%) Erro Tipo I (5,94%)



3 Idia: Fixar um dos erros e estabelecer a regra de deciso (Opo: fixar erro tipo I).


Seja = P(Erro Tipo I ) = 0,05 P(Z < -1,645) = 0,05
53

Bioestatstica Prof. Dr. Carlos Roberto Padovani
= P(
0
/ H x x
C
verdade) = P(Z
4
155

C
x
) 42 , 148 645 , 1
4
155
= =

C
C
x
x
mg/dL.
Portanto, = P(Erro Tipo II) = P(
1
/ 42 , 148 H x > verdade) = P(Z > 1,425)=0,00764 = 7,64%

Tem-se, o seguinte quadro de probabilidade
Deciso (H
0
ou H
1
) Curso (Origem do grupo)
H
0
: Cincias Biolgicas H
1
: Educao Fsica
Educao Fsica (A) Erro Tipo II (7,64%) Correta (92,36%)
Cincias Biolgicas (B) Correta (95,05%95,00%) Erro Tipo I (4,95%5,00%)



6.2 Procedimento Geral do Teste de Hipteses

H
0
:
0
= (Hiptese Nula)
(Existe uma varivel X associada a dada populao e tem-se uma hiptese sobre
determinado parmetro dessa populao. A hiptese de H
0
afirma que o verdadeiro valor
de
0
).

H
1
:
0
(Hiptese alternativa bilateral)
(O valor de diferente de
0
).
ou
0
> (Hiptese alternativa unilateral direita)
(O valor de maior que
0
).
ou
0
< (Hiptese alternativa unilateral esquerda)
(O valor de menor que
0
).

A deciso pela hiptese alternativa depende do interesse e da informao e da
biolgica que a situao oferece.

Erros que so cometidos para qualquer deciso tomada:

Erro Tipo I: Rejeitar H
0
quando esta verdadeira.
=P(Erro Tipo I) = P(Rejeita H
0
/ H
0
Verdade) = nvel de significncia do teste
estatstico (valor arbitrrio).
Erro Tipo II: No Rejeitar H
0
quando H
0
falsa.
= P(Erro Tipo II) = P(No Rejeita H
0
/H
0
Falsa).
O objetivo do teste estatstico dizer, usando uma estatstica

(estimador no-
viesado e consistente de

, cuja estimativa (o valor) ser obtida na amostra fornecida pelo


pesquisador), se a hiptese H
0
ou no aceitvel.
A deciso deve ser tomada por meio de critrio objetivo, ou seja, estabelecido a
partir do risco que se quer cometer. Nesse sentido, estabelece-se a regio de rejeio de
H
0
(regio crtica ou regio de rejeio do teste), construda considerando
0
/

( H RC P = verdade), com fixado a priori. Um fato importante ressaltar que


54

Bioestatstica Prof. Dr. Carlos Roberto Padovani
a regio crtica sempre construda sob a hiptese de H
0
ser verdadeira. O resultado da
amostra tanto mais significante para rejeitar H
0
quanto menor for esse nvel . Ou seja,
quanto menor for o , menor a probabilidade de se obter uma amostra com
estatstica(

) pertencente a regio crtica, sendo pouco verossmil a obteno de uma


amostra da populao para qual H
0
seja verdadeira.

6.3 Principais Testes de Hipteses

6.3.1 Teste sobre a Mdia de uma Populao com Varincia Conhecida
Exemplo: Uma companhia de cigarros afirma que a quantidade mdia de nicotina dos
cigarros que produz apresenta-se abaixo de 20mg por cigarro. Um laboratrio realiza nove
analises dessa quantidade, obtendo: 23, 20, 22, 18, 19, 19, 19, 23, 20. Sabe-se que a
quantidade de nicotina se distribui normalmente, com varincia 3,24mg
2
. Pode-se aceitar
no nvel de 5%, a afirmao do fabricante?

H
0
: = 20mg (A afirmao do fabricante verdadeira).
H
1
: > 20mg (A afirmao do fabricante falsa).

) 05 , 0 ( 29116 , 0 ) 55 , 0 (
) , ( ~
2
> = >

=
P Z P
n
N
n
x
Z





No rejeita-se H
0
.



6.3.2 Teste sobre a Mdia de uma Populao com Varincia Desconhecida.

Exemplo 1: Um bilogo deseja estudar o efeito de certa substncia no tempo de reao de
seres vivos a um certo tipo de estmulo. Um experimento desenvolvido com cobaias, que
so inoculadas com a substncia e submetidas a um estmulo eltrico, com seus tempos
de reao (em segundos) anotados. Os tempos obtidos foram: 9,1; 9,3; 7,2; 7,5; 13,3; 10,9;
7,2; 9,9; 8,0; 8,6. Admitindo-se que o tempo de reao segue distribuio normal com
mdia 7,6 segundos, verificar se o tempo mdio sofre alterao por influncia da
substncia, no nvel de 5% de significncia.






< =

=
= =
=
= =
crit calc
z z 55 , 0
3
8 , 1
20 33 , 20
33 , 20
9
183
9
645 , 1 05 , 0
z
x
n
z
Cobaias Normais
(Controle)
seg. 6 , 7 =
Amostra (#10)
9,1;...;8,6
. seg 91 , 1
seg. 1 , 9
=
=
s
x

Substncia Inoculada

55

Bioestatstica Prof. Dr. Carlos Roberto Padovani
Teste t de Student para uma amostra (William S. Gosset, 1876-1937. A origem do teste t
deve-se a busca da melhor variedade de cevada para a produo de cerveja).
0 0
= = H
0 1
= H

0
>

0
<

Sob a veracidade de H
0
, a estatstica do teste dada por t =
) 1 (
0
~
) (

n
t
S
n x
, com a
regra de deciso habitual.
Hipteses Regra de Deciso (Habitual) Neyman e
Pearson
H
0
:
0
= x H
1
:
0

Rej. H
0
se |t| >
|

\
|

2
, 1
t

n

H
0
:
0
= x H
1
:
0
>
Rej. H
0
se t >
( ) , 1
t
n

H
0
:
0
= x H
1
:
0
<
Rej. H
0
se -t >
( ) , 1
t
n

H
0
: = 7,6 seg. H
1
: 7,6 seg.

t = 48 , 2
91 , 1
10 ) 6 , 7 1 , 9 (
=


| t | > 2,26; Rej.-se H
0.

9 1
05 , 0
=
=
n

t
(9;0,025) =
2,26

P( |t
(9)
| < 2,48 ) = P( -2,48 < t
(9)
< 2,48) = 0,965 p = 0,035 (< )

Exemplo 2. Uma firma comercial sustenta que seus cigarros contm no mais que 30 mg
de nicotina.Uma amostra de 25 cigarros forneceu mdia de 31,5 mg e desvio-padro de
3mg. Considerando a distribuio normal de probabilidades para a quantidade de nicotina,
no nvel de 5% de significncia, os dados contestam ou no a afirmao do fabricante?

H
0
: = 30 mg (afirmao favorvel firma)
H
1
: > 30 mg (afirmao desfavorvel firma)

24 1
05 , 0
=
=
n

t
(24;0,05)
= 1,71 t > t
(24;0,05)
Rej.-se H
0
.
t = 50 , 2
3
25 ) 30 5 , 31 (
=


No nvel de 5% de significncia, h evidncias de que os cigarros contenham, em mdia,
mais de 30 mg de nicotina.
Observao P(t
(24)
2,50) = 0,0098 p = 0,0098 ( < )

56

Bioestatstica Prof. Dr. Carlos Roberto Padovani
6.3.3 Teste para a Proporo

Exemplo 1. Um relatrio de uma ONG afirma que 40% de toda a gua obtida, por meio de
poos artesianos no nordeste, salobra (levemente salgada). H muitas controvrsias
sobre essa informao, alguns dizem que a proporo maior, outras que menor. Para
dirimir as dvidas, 400 poos foram sorteados e observou-se, em 152 deles, gua salobra.
Qual a concluso no nvel de 5% de significncia?


H
0
:
0
= H
1
:
0
(bilateral)
ou
0
> (unilateral direita)

0
p p =
0
< (unilateral esquerda)

Utilizando o TLC, a estatstica ) ( p , a proporo amostral, tem distribuio
aproximadamente normal com E( ) = (p) e Var( ) =
n
) 1 (
.
Portanto, sob a veracidade de H
0
, tem-se Z=
) 1 (
) (
0 0
0

n
N(0,1), com a regra de
deciso habitual, a estatstica do teste de proporo.

H
0
: = 0,40 (favorvel afirmao da ONG).
H
1
: 0,40 (desfavorvel afirmao da ONG).

n = 400 38 , 0 = z = 82 , 0
60 , 0 * 40 , 0
400 ) 40 , 0 38 , 0 (
=

(bilateral) (p = 0,412)
x = 152

= 0,05
= 96 , 1
2

z
| z | <
2

z
no se rejeita H
0
.

No nvel de 5% de significncia, os dados no possibilitam refutar informao fornecida
pela ONG.

Exemplo 2. Um professor aplica um teste envolvendo 10 questes do tipo certo-errado. Ele
quer testar hiptese a estudante est adivinhando chutando certo.
Seja (= p) a probabilidade de o estudante responder corretamente a uma questo.
Hiptese H
0
: = 0,50 (casual) (est adivinhando).

Como so 10 questes (supondo independncia nas respostas), se H
0
for
verdadeiro, o nmero esperado de sucessos dever estar prximo de np = 5 = E(X).

57

Bioestatstica Prof. Dr. Carlos Roberto Padovani
Suponha que o professor adote a seguinte regra de deciso: Se oito ou mais
respostas esto corretas, o estudante no est adivinhando, enquanto que se, menos do
que oito esto corretas, o estudante est adivinhando

= P(Rejeio de H
0
/ H
0
verdade) = P(X=8 ou 9 ou 10) = 054 , 0
128
7
.
Interpretao do resultado: Se o teste fosse aplicado 128 vezes, o professor
esperaria rejeitar H
0
(o aluno est adivinhando) quando H
0
verdadeira, 7 vezes. O erro
que se comete com probabilidade 7/128; chama-se nvel de significncia do teste (no caso,
teste unilateral).

Observaes:

1) Alteraes na regra de deciso provocam mudanas nas probabilidades de erro.
2) As regras de deciso podem envolver tomadas bilaterais, caso a situao
problemtica permita.

Aprofundando um pouco na discusso do exemplo, suponha, que o aluno acertou
apenas 6 questes (pela considerao anterior, no h razo para rejeitar H
0
), mas que
ele no esteja adivinhando, ou seja, p > 0,50. Portanto, h um outro erro que est
envolvido na tomada deciso: aceitar uma hiptese H
0
, sendo ela falsa. Para efeito de
estudo, suponha que na realidade p = 0,80. Ento, tem-se a seguinte formulao:

H
0
: p = 0,50 e H
1
: p = 0,80.

O clculo da probabilidade de aceitar H
0
, quando H
1
verdadeira, para
054 , 0
128
7
= = (regio crtica definida pela regra de deciso) dada por: = P(No
rejeitar H
0
/ H
1
verdade) = P(X 7 / p = 0,8) 0,322.

Tem-se o seguinte quadro:

Realidade Deciso
p = 0,50 p = 0,80
Aceitar H
0
Deciso Correta Erro II ( 322 , 0 = )
Aceitar H
1
Erro I ( 054 , 0 = ) Deciso Correta

Como j relatado, conforme mudamos a regio crtica, as probabilidades e so
alteradas.
Por exemplo:
58

Bioestatstica Prof. Dr. Carlos Roberto Padovani
Regio Crtica

{7,8,9,10} 0,17 0,121
{8,9,10} 0,054 0,322
{9,10} 0,01 0,624

Relao entre Intervalo de Confiana e Teste de Hipteses

Considerando o exemplo anterior, seja n = 10 e = 0,05.

Supondo p = 0,6, o intervalo de confiana para p, com coeficiente de pelo menos
95% confiana so dados pelos limites:

LI = 0,60 1,96 30 , 0
10
4 , 0 6 , 0
=
x

LS = 0,60 + 1,96 90 , 0
10
4 , 0 6 , 0
=
x


IC(p): [0,30;0,90] com nvel de confiana 95%.

Este intervalo corresponde aceitao da hiptese de nulidade do teste ao nvel de
significncia 5%. Isto , obtendo-se p = 0,6, no se rejeita a hiptese H
0
: p = p
0
, para p
0

assumindo valor fixado entre 0,30 e 0,90.
De modo geral, a regio de aceitao de um teste tipo o exemplificado de nvel ,
corresponde a um intervalo de confiana p, com = 1- .

6.3.4 Teste para a comparao de mdias de duas populaes normais
independentes com varincias desconhecidas e iguais


Antes do teste de mdias tem que ser considerado a homogeneidade ou no das
varincias.
Para isto, tem-se:



H
0
:
2 2
2
2
1
= = (varincias homogneas = homocedasticia).

H
1
:
2
2
2
1
(varincia heterogneas = heterocedasticia).

O teste de hipteses da homogeneidade pode ser construdo considerando

F=
) , ( menor
) , ( maior
2
2
2
1
2
2
2
1
S S
S S
, onde
2
1
S e
2
2
S so as respectivas varincias amostrais.



Sob a veracidade de H
0
, a estatstica F do teste de hiptese da homogeinidade de
59

Bioestatstica Prof. Dr. Carlos Roberto Padovani
varincias tem distribuio F (Fisher-Snedecor) com parmetros g.l. numerador (
1
) e g.l.
denominador (
2
). A regra de deciso a habitual, ou seja, se
|

\
|
>
2 1
; ;
2

F F
, rejeita-se
H
0
.

Para o teste de mdias considere o seguinte exemplo:
Um estudo sobre hipertenso induzida por gravidez considerou um grupo de 23
mulheres com essa disfuno recebendo baixa dose de aspirina e um segundo, com 24
mulheres nas mesmas condies, que receberam placebo. A presso sangnea arterial
dos grupos est descrita no quadro a seguir.

Grupo n x (mmHg) s(mmHg) s
2
(mmHg)
2

Aspirina 23 109 7 49
Placebo 24 111 8 64


No nvel de significncia 5%, os grupos diferem quanto a presso arterial sangnea?
H
0
: =
2 1
H
1
:
2 1
Pop
1
~N(
2
1 1
, )
>
2 1
Pop
2
~N(
2
2 2
, )
<
2 1

Se
2 2
2
2
1
= = , o teste estatstico descrito como
( )
) 2 (
2 1
2
2 1
2 1
~
1 1
+
|
|

\
|
+

=
n n
t
n n
S
x x
t
, onde
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1 2
+
+
=
n n
S n S n
S (varincia amostral
comum).


A regra de deciso habitual

Hipteses Rejeitar H
0
se
H
0
: =
2 1
x H
1
:
2 1

|

\
|
+
>
2 ;
2
2 1
| |
n n
t t

H
0
: =
2 1
x H
1
: >
2 1

( ) 2 ;
2 1
+
>
n n
t t


H
0
: =
2 1
x H
1
: <
2 1

( ) 2 ;
2 1
+
>
n n
t t



Teste de homogeneidade

H
0
:
2
2
2
1
= H
1
:
2
2
2
1

60

Bioestatstica Prof. Dr. Carlos Roberto Padovani

F = 31 , 1
49
64
) , ( menor
) , ( maior
2
2
2
1
2
2
2
1
= =
S S
S S
(p = 0,530)

23
.
=
num
F < F
2


05 , 0 = 344 , 2
) 22 ; 23 ; 025 , 0 (
= F Homogneas
22
.
=
den


H
0
: 0
2 1
= (Aspirina = Placebo)
H
1
: 0
2 1
(Aspirina Placebo)
91 , 0
)
24
1
23
1
( 67 , 56
111 109
67 , 56
45
64 * 23 49 * 22
2
=
+

= =
+
= t s (p = 0,37)
45 2
05 , 0
2 1
= +
=
n n


( )
01 , 2
45 ; 025 , 0
= t
Como
2
| |

t t < , no se rejeita H
0
.
No nvel de significncia 5% no foi possvel verificar diferena na presso mdia
arterial dos grupos.


6.3.5 Teste para a comparao de mdias de duas populaes normais
independentes com varincias desconhecidas e desiguais.


Para melhor entendimento do teste de mdias envolvendo varincias heterogneas
considere o seguinte exemplo: Acredita-se que o nvel mdio de carboxihemoglobina dos
fumantes seja mais alto do que o nvel mdio dos no-fumantes. A seguir so
apresentados os resultados de dois grupos.

Grupo n x S s
2

No-fumante 121 1,8% 1,0% 1,00(%)
2

Fumante 75 4,1% 1,6% 2,56(%)
2

H
0
: =
2 1
H
1
:
2 1

>
2 1

<
2 1

Se
2
2
2
1
, o teste estatstico descrito como
2
2
2
1
2
1
2 1
n
S
n
S
) X X (
t
+

= ~
) (
t
, onde
( )
) 1 ( ) 1 (
2
2
1
2
2

+
=
n
B
n
A
B A
, sendo
1
2
1
n
S
A = e
2
2
2
n
S
B = .
61

Bioestatstica Prof. Dr. Carlos Roberto Padovani

A regra de deciso habitual.


No exemplo, tem-se:
H
0
:
2
2
2
1
= (Varincias Homogneas)
H
1
:
2
2
2
1
(Varincias Heterogneas)

56 , 2
00 , 1
56 , 2
) , ( menor
) , ( maior
2
2
2
1
2
2
2
1
= = =
S S
S S
F
2

F F >
, rej.-se H
0
(Varincias Heterogneas).
p = 0,0000044 ( < )
( )
50 , 1
120 ; 74 ; 025 , 0
= F

H
0
: NF) (F 0
2 1
= = H
1
: NF) (F 0
2 1
> <
17 , 11
75
56 , 2
121
00 , 1
1 , 4 8 , 1
=
+

= t (p < 0,000001)
00826 , 0
121
00 , 1
= = A 03413 , 0
75
56 , 2
= = B
110 17 , 110
0000157 , 0 000000569 , 0
04239 , 0
2
=
+
=


05 , 0 =
( ) ( )
t t t > = | | 6 , 1
110 ; 05 , 0
rej.-se H
0
.
110 =
No nvel de 5% de significncia, conclu-se que o nvel mdio de carboxihemoglobina
mais alto nos fumantes.


6.3.6 Teste para a comparao de mdias de duas populaes normais
dependentes (amostras pareadas, amostras emparelhadas) e varincias
desconhecidas.

Exemplo: Verificar, no nvel de 5% de significncia, se o calibre da veia esplnica , em
mdia, o mesmo, antes e depois da ocluso da veia porta a partir dos seguintes dados de
ces.


Co 1 2 3 4 5 6
Antes da ocluso 75 50 50 60 50 70
Depois da ocluso 85 75 70 65 60 90

H
0
: =
D
H
1
:
D

>
D

<
D

62

Bioestatstica Prof. Dr. Carlos Roberto Padovani


Seja uma amostra com n pares (
i i
Y X , ). Definindo D
i
=
i i
Y X , i=1,...,n, a estatstica do
teste de hipteses da comparao de mdias dependentes dada por:
) 1 (
~
) (


=
n
D
t
S
D n
t , onde
n
D
D
n
i
i
=
=
1
e
1
2
1
2
2

n
nD D
S
n
i
i
D
.


A regra de deciso a habitual.
Hipteses Rejeita-se H0 quando
H
0
: =
D
x H
1
:
D

|

\
|

<
1 ;
2
| |
n
t t

H
0
: =
D
x H
1
: >
D

( ) 1 ;
>
n
t t


H
0
: =
D
x H
1
: <
D

( ) 1 ;
>
n
t t



No exemplo, tem-se

D
1
=10; D
2
=25; D
3
=20; D
4
=5; D
5
=10 e D
6
=20, sendo D
i
= Depois Antes.

H
0
: =
D
(Depois = Antes)
H
1
:
D
(Depois Antes)

0 , 15 = d 74 , 4
0 , 60
150 * 6
60
5
0 , 15 * 6 1650
2
2
= = =

= t S
d
(p = 0,0052)

05 , 0 =
( ) 0
1 ,
2
5 ; 025 , 0
H se rej. | | 57 , 2 > =
|

\
|
n
t t t

.
5 1 = n

No nvel de 5% de significncia conclui-se que o calibre da veia esplnica, em mdia,
difere pela ocluso da veia posta.

Exemplo 2. Os dados seguintes foram obtidos a partir de amostras de gua, coletas em
oito locais diferentes de um rio, antes e depois de dois anos de incio de uma campanha
para a despoluio. Os valores so obtidos combinando-se vrios indicadores de poluio
e quanto maior o valor, maior o grau de poluio. No nvel de significncia 0,05, verificar
se a campanha foi produtiva.
Local L1 L2 L3 L4 L5 L6 L7 L8
Antes 88,4 68,9 100,5 81,4 96,3 73,7 65,1 72,1
Depois 87,1 69,1 91,1 75,6 96,9 69,2 66,3 68,3
Depois - Antes -1,3 0,2 -9,4 -5,8 0,6 -4,5 1,2 -3,8
H
0
: 0 =
D
H
1
: 0 <
D

63

Bioestatstica Prof. Dr. Carlos Roberto Padovani
61 , 13
7
) 85 , 2 ( 8 22 , 160
85 , 2
8
8 , 22
2
2
=

= =

=
d
s d
19 , 2
61 , 13
) 85 , 2 ( 8
=

= t (p = 0,032)
( )
. H se rej.
0 1 ,
>
n
t t


7 1
05 , 0
=
=
n


( )
90 , 1
7 ; 05 , 0
= t No nvel de significncia 0,05 a campanha foi produtiva.

Uma observao interessante quanto a pratica da comparao de grupos consiste
no efeito Hawthorne.
O termo efeito Hawthorne tem sido usado para descrever a melhoria em uma
situao que ocorre apenas porque um experimento est sendo feito. Tpico disso o fato
de que grandes ensaios clnicos, comparando novos tratamentos com tratamentos
tradicionais, habitualmente mostram uma melhora na sade do paciente, mais do que seria
esperada do tratamento tradicional baseado na experincia passada. Isso torna mais difcil
detectar a diferena entre o tratamento tradicional e o novo.

6.4 Exerccios: Teste de Hipteses

1) Em um julgamento o corpo de jurados tem que decidir sobre a culpa ou a inocncia
de um ru. Dois fatos devem ser considerados: i) o sistema jurdico admite que toda
pessoa inocente at que se prove o contrrio; ii) s vai a julgamento pessoas
sobre as quais existe dvida de sua inocncia. Fazendo analogia com o teste de
hipteses, responda:
a) Estabelea as hipteses nula (H0) e alternativa (H1) sobre a culpa ou inocncia
do ru.
b) Quais os erros de deciso que o jri pode cometer?
c) Qual os dois erros o mais srio?
d) Na terminologia estatstica de teste de hipteses, qual tipo de erro (I ou II) pode-
se vincular a cada deciso do item b?
2) Apresente as hipteses nula e alternativa sobre a situao de sade do paciente;
fazendo uma analogia com teste de hipteses (estatstico), que tipo de erro (I ou II)
seria cometido se o resultado do teste fosse falso positivo? E se o resultado fosse
falso negativo?
3) Numa discusso sobre o reajuste salarial de uma industria farmacutica, diretoria e
sindicato no conseguem acordo. A diretoria diz que o salrio mdio dos operrios
7,6sm, e sindicado diz que 5,6sm. Para eliminar dvidas, cada uma das partes
resolveu colher uma amostra independente. A diretoria, com uma amostra de 90
operrios, encontrou um salrio mdio de 7,0sm, com um desvio-padro igual a
64

Bioestatstica Prof. Dr. Carlos Roberto Padovani
2,9sm. J a amostra do sindicato, com 60 operrios apresentou mdia igual a
7,10sm e desvio-padro de 2,4sm.
a) Considerando 05 , 0 = , as amostras colhidas servem para justificar as
respectivas afirmaes dos dois grupos?
b) De posse do resultado, qual o seu parecer?
4) Entre um nmero considervel de casos de pneumonia no tratados com sufa, a
porcentagem que desenvolveu complicaes foi de 16%. Com o intuito de saber se
o emprego de sulfas diminuiria essa porcentagem, 250 casos de pneumonia foram
tratados com sulfapiridina e destes 26 apresentaram complicaes. Admitindo que
os pacientes so semelhantes em tudo, exceto quanto ao tratamento, teste a
hiptese de que a proporo de casos com complicaes entre os pacientes
tratados com sulfa significativamente menor do que os no tratados (considerar
05 , 0 = ).
5) Uma amostra aleatria de 100 mortes naturais, no Rio Grande do Sul, deu uma
mdia de 78 anos, com desvio-padro de 8,9 anos. No nvel de 5% de significncia,
isto indica que o tempo mdio de vida no RS, atualmente, maior que 70 anos?
6) Estima-se em 30% a proporo dos habitantes de certa localidade que tm plano de
sade privado. Para testar a hiptese, escolhe-se uma amostra aleatria de 15
habitantes. Se dentre eles, houver de 2 a 7 indivduos com plano de sade privado,
aceita-se a hiptese H0 : 30 , 0 = .Caso contrrio, tem-se que 30 , 0 .
a) Determinar , P(erro tipo I).
b) Determinar , P(erro tipo II) para as alternativas 20 , 0 = ; 40 , 0 = .
7) Em oito experimentos com o bombardeamento de nuvem foram observadas
precipitaes pluviomtricas com os seguintes valores: 0,74; 0,54; 1,25; 0,27; 0,76;
1,01; 0,49; 0,70. Em seis outras ocasies, utilizadas como controle, foram medidas
as precipitaes de 0,25; 0,36; 0,42; 0,16; 0,59; 0,66. No nvel de 5% de
significncia h razo para afirmar de que o bombardeamento aumenta a
quantidade de precipitao?
8) Explique a analogia entre os erros tipo I e tipo II em um teste de hiptese (teste
estatstico) e os resultados falso positivo e falso negativo que ocorrem no teste
diagnstico.
9) Sempre que o aumento mdio da temperatura da gua em uma cmara
compressora superar 5C, o processo de resfriamento deve ser recalibrado. Este
processo , entretanto, muito caro e portanto deve ser feito apenas se necessrio.
Em oito experimentos independentes com cmera, obtiveram-se os seguintes
aumentos mdios: 6,4; 4,3; 5,7; 4,9; 6,5; 5,9; 6,4; 5,1. No nvel de 5% de
significncia, estes dados sugerem a necessidade de recalibrao?
65

Bioestatstica Prof. Dr. Carlos Roberto Padovani
10) Selecionam-se aleatoriamente oito comprimidos diferentes de cada um de dois
remdios antigripais concorrentes, e faz-se um teste do contedo de acetaminofena
em cada um. Os resultados, em mg, so os seguintes
Dozenol 472 487 506 511 496 524 504 501
Niteze 562 512 494 528 552 508 496 532

Considerando o nvel de 5% significncia, teste a afirmao de que a quantidade
mdia de acetamnofena a mesma nas duas marcas.
11) Um biotrio afirma que pelo menos 90% dos animais por ele fornecido esto acima
do padro de qualidade exigido na experimentao animal. Num lote casual de 400
animais foram encontradas 24 abaixo do padro. No nvel de 5% de significncia,
h razo para discordar do biotrio?
12) Duas solues qumicas, Q1 e Q2, vo ser avaliadas em relao ao pH mdio. A
anlise de 21 amostras da soluo Q1 acusou pH mdio de 36 , 0 68 , 7 , enquanto
que a anlise de 23 amostras da soluo Q2 acusou pH mdio de 38 , 0 48 , 7 .
Qual a concluso sobre os pHs mdios das solues considerando o nvel 5% de
significncia ?
13) Uma amostra casual de 800 coelhos de uma granja apresentou 480 machos. Ao
nvel de 5% de significncia pode-se concluir que h prevalncia de coelhos
machos nessa granja?
14) Objetiva-se verificar se duas dietas so igualmente eficazes ou no. Logo,
sortearam-se duas amostras de animais que foram submetidos s dietas com os
seguintes resultados:
Dados N de animais Mdia Desvio Padro
A 15 6,9 0,5
B 15 6,2 0,8
Qual a concluso no nvel de 5% de significncia?
15) Um mdico deseja saber se uma certa droga reduz a presso arterial mdia. Para
isso mediu a presso arterial de 10 voluntrios, antes e aps a ingesto da droga,
obtendo os dados do quadro a seguir.

Voluntrios A B C D E F G H I J
Antes 68 80 90 74 75 69 66 83 87 83
Depois 60 71 88 72 71 70 66 78 85 76

Voc acha que existe significncia (5%) estatstica de que a droga realmente reduz
a presso arterial mdia?
16) Algum sugere que, no teste de hipteses, possvel eliminar um erro tipo I
66

Bioestatstica Prof. Dr. Carlos Roberto Padovani
fazendo-se 0 = . Em um teste bilateral, que valores crticos correspondem a
0 = ?
17) Um artigo cientfico reportou que uma hiptese nula ( 100 :
0
= H ) fora rejeitada
porque p < 0,01. O tamanho da amostra era de 62 e a mdia amostral 103,6.
Determine o maior desvio padro possvel.

67

Bioestatstica Prof. Dr. Carlos Roberto Padovani
7. Bibliografia



BUSSAB, W. O.; MORETTIN, P. A. Estatstica bsica,5ed. So Paulo, Editora Saraiva,
2003.

CAMPANA, A. O.; PADOVANI, C .R.; TIMO-IARA, C.; FREITAS, C. B. D.; PAIVA, S .A.
R.; HOSSNE, W. S. Investigao cientfica na rea mdica. So Palo, Editora Manole,
2001.

DAWSON, B.; TRAPP, R. G. Bioestatistica bsica e clnica, 3ed. Rio de Janeiro, Editora
McGraw- Hill Interamericana do Brasil Ltda, 2003.

CAMPBELL, J. M.; CAMPBELL, J. B. Matemtica de laboratrio Aplicaes mdicas e
biolgicas, 3 ed., So Paulo, Editora Roca Ltda, 1993.

MOORE, D. A estatstica bsica e sua prtica. Rio de Janeiro, Editora LTC, 2000.

NORMAN, G. R.; STREINER, D. L. Biostatistics The bare essentials, St. Louis, Mosby-
Year Book, 1994.

PADOVANI, C. R. Exerccios de estatstica bsica e experimental. Departamento de
Bioestatstica, IB/UNESP, 2002.

PAGANO, M.; GAUVREAU, K. Princpios de bioestatstica. So Paulo, Editora Thompson,
2004.

VIEIRA, S. Introduo bioestatstica, 2ed., Rio de Janeiro, Editora Cmpus, 1911.

VIEIRA, S. Elementos de estatstica, 3ed., So Paulo, Editora Atlas, 1999.
68

Bioestatstica Prof. Dr. Carlos Roberto Padovani
8. Tabelas
Tabela 8.1 Distribuio Normal Reduzida ( ) | | = 1
0
z Z P .............................................. 69
Tabela 8.2 Distribuio t de Student ( ) | | = < < 1
0 0
t t t P ............................................... 70
Tabela 8.3 Distribuio Qui-quadrado ( ) | | = >
2
0
2
P ....................................................... 71
Tabela8.4 Distribuio F ( ) | | 01 , 0
0
= > F F P ......................................................................... 72
Tabela 8.5 Distribuio F ( ) | | 05 , 0
0
= > F F P ........................................................................ 73
Tabela 8.6 Distribuio F ( ) | | 10 , 0
0
= > F F P ........................................................................ 74

69

Bioestatstica Prof. Dr. Carlos Roberto Padovani


Tabela 8.1 Distribuio Normal Reduzida ( ) | | = 1
0
z Z P
70

Bioestatstica Prof. Dr. Carlos Roberto Padovani

Tabela 8.2 Distribuio t de Student ( ) | | = < < 1
0 0
t t t P
71

Bioestatstica Prof. Dr. Carlos Roberto Padovani

Tabela 8.3 Distribuio Qui-quadrado ( ) | | = >
2
0
2
P
72

Bioestatstica Prof. Dr. Carlos Roberto Padovani

Tabela 8.4 Distribuio F ( ) | | 01 , 0
0
= > F F P
73

Bioestatstica Prof. Dr. Carlos Roberto Padovani

Tabela 8.5 Distribuio F ( ) | | 05 , 0
0
= > F F P
74

Bioestatstica Prof. Dr. Carlos Roberto Padovani

Tabela 8.6 Distribuio F ( ) | | 10 , 0
0
= > F F P
75

Bioestatstica Prof. Dr. Carlos Roberto Padovani























Departamento de Bioestatstica
Instituto de Biocincias
Distrito Rubio Junior
CEP 18618-000
CP 510
Fone (14) 3811.6272
(14) 3811.3744
E-mail: bioestatistica@ibb.unesp.br

Vous aimerez peut-être aussi