Académique Documents
Professionnel Documents
Culture Documents
Faculdade de Medicina
Disciplina de Epidemiologia e Bioestatstica
Conceitos Bsicos em
Epidemiologia e Bioestatstica
A natureza probabilstica
A informao, incompleta
Os resultados, essenciais
Os recursos, limitados
As decises, inevitveis
H.S. Frazier
Universidade de Havard
Pag 5
Pag 7
Conceitos bsicos
Pag 9
Pag 12
Pag 14
Distribuio normal
Pag 17
Pag 19
Pag 20
Estudo de coorte
Pag 22
Estudos transversais
Pag 23
Estudos de caso-controle
Pag 24
Estudos Ecolgicos
Pag 25
Testes de hiptese
Pag 28
Intervalo de confiana
Pag 29
Pag 30
05
06
Populao
conjunto de indivduos ou objetos que apresentam em comum determinadas caractersticas definidas para o
estudo. Ex.: Populao de pacientes internados em um dado hospital.
Uma populao pode ser finita e pequena, sendo fcil de conhecer todos os seus elementos. Porm, na maioria
das vezes, finita mais incontvel ou mesmo infinita. Nestes dois ltimos casos, para conhecer uma populao,
a estatstica lana mo de um recurso que coletar uma amostra desta populao e caracterizar alguma
varivel da populao a partir dos resultados obtidos a partir da amostra, ou seja, tirar concluses sobre a
populao a partir de resultados obtidos em amostras (inferncia estatstica).
Amostra
Conjunto de elementos de uma populao, selecionado segundo algum critrio. um subconjunto da populao.
Tipos de amostras casuais (tipo de amostra na qual os elementos so escolhidos ao acaso, eliminando a
tendeciosidade do pesquisador):
Caracterstica
Casual simples
ou equiprobabilstica
Sistemtica
Estratificada
Uma amostra pode ser estratificada de acordo com algum fator como sexo, idade
ou nvel econmico. Para uma amostra estratificada de acordo com o sexo,
por exemplo, divide-se a populao em dois estratos: homens e mulheres, e em
seguida escolhe-se uma amostra casual dentro de cada estrato.
07
Conceitos bsicos
Varivel
a caracterstica que se deseja estudar de uma dada populao. Ex.: Cor dos olhos dos moradores de Fortaleza,
altura dos alunos da UFC. As variveis so classificadas segundo suas caractersticas particulares em quatro
categorias. Tais classificaes no so simplesmente didticas, mas assumem papel importante na estatstica,
pois tero tratamentos diferentes como ser visto adiante.
Tipos de Variveis
Caracterstica
Tipo
Contnuas
Discretas
Nominais
Ordinais
VARIVEIS
CATEGRICAS OU QUALITATIVAS
NOMINAL
08
ORDINAL
NUMRICAS OU QUANTITATIVAS
DISCRETA
CONTNUA
Conceito
O conceito de medida de tendncia diz respeito a medida de um valor que possa melhor representar a tendncia
de um conjunto de nmeros, ou uma varivel. As trs medidas mais utilizadas so a mdia, a mediana e a moda.
Mdia Aritmtica
Medida de tendncia central mais utilizada;
definida como soma dos valores tericos de todas as observaes (observao um elemento de uma amostra)
dividida pelo nmero de observaes;
O smbolo (mu) ser usado para denotar mdia de uma populao;
O smbolo x ser usado para denotar a mdia de uma amostra;
x = (x1 + x2 + x3 +.......+ xn)
n
Exemplo: Uma amostra constituda de 3 pesos de recm-nascidos: 2,75kg, 3,25kg e 3,80kg. Aqui, n, o tamanho da
amostra, igual a 3. x1, primeira observao, 2,75kg; x2, segunda observao 3,25kg; x3 3,80kg.
x = (2,75 + 3,25 + 3,80) = 9,80/3 = 3,27, ou seja, peso mdio 3,27 kg.
3
Mediana
Outra medida usada para indicar o centro de uma distribuio;
A mediana de uma srie de observaes o nmero que fica exatamente no meio da srie quando os dados esto
ordenados e o nmero de observaes impar; ou a mdia aritmtica de dois nmeros do meio, quando o
nmero de observaes par;
Isto significa que para um conjunto de dados, se os mesmos forem ordenados, a mediana ocupar o centro deste
conjunto.
Ex.: Dada a varivel x = {1, 3, 0, 2,4}, a mediana 2.
Para se calcular a mediana a mediana de um conjunto de dados deve-se:
1) ordenar o conjunto; no exemplo acima: x= {0,1,2,3,4};
2) verificar se a h um nmero par ou mpar de valores no conjunto; no exemplo acima: 5 observaes - mpar;
3) se for mpar a mediana ser o valor que ocupa a posio central e se for par ser a mdia entre as duas posies
centrais.
Exerccio
D as medianas:
Conjunto
Mediana
Conjunto
2;3;3;4
40;90;81;80;100
1;18;19;22
5,1;6,5;8,1;9,1;10,6;15,5
9,2;3,7;11,8;10,1;12,8
1;2;3;3;3;4;7
Mediana
09
Moda
A moda o valor que aparece com maior freqncia em uma distribuio.
Exemplos:
Seja x = {0 1 0 2 3 4 4 0 3 2 5 6}, a moda 0.
Seja x= {3 1 2 3 3 4 5 1,5 2 1,5 0 4 1,5 1,5 6}a moda 1,5.
Exerccio
Qual a moda da freqncia?
Freqncia Semanal
Nmero de Indivduos
12
22
46
20
Limitaes
Mdia
Contnua
Discreta
Mediana
Contnua
Discreta
Contnua
Discreta
Categrica
Ordinal
Moda
10
Concluso
Portanto, importante saber que a mdia a melhor e mais importante medida de tendncia central, devido a
sua maior estabilidade amostral, utilidade e facilidade de clculos. Porm, em distribuies assimtricas, a mdia
no descreve adequadamente o centro. Nesses casos, prefere-se a mediana. Por exemplo, numa distribuio: ( 2,
4, 6, 9, 10, 11, 2000) na qual um dos valores(2000) destoa bastante dos outros. Nesse caso, temos:
* mdia: 2+4+6+9+10+11+2000 / 7 = 291,7
* mediana: temos sete elementos nesse conjunto. Portanto, a mediana o elemento central desse conjunto
ordenado 4 elemento (n+1/2, ou seja, 7 +1 /2 = 4). O quarto elemento desse conjunto corresponde observao
9.
Mediana = 9.
Nesse caso, verifica-se facilmente que a mediana representa melhor o centro da distribuio.
11
Medidas de Variabilidade
Exerccio
As sries so iguais? Qual a mdia e a mediana de cada uma das sries?
Srie A
Srie B
Srie C
1
1
2
3
5
6
6
7
93
94
94
95
97
98
98
100
1
44
45
46
48
48
49
50
50
51
52
52
54
55
55
100
1
8
11
14
28
30
37
48
52
62
70
72
84
91
92
100
Amplitude
Amplitude definida como a diferenas do menor ao maior valor de um conjunto de dados. Na srie 7-3-4-6-1-6-76-5, a amplitude 6=(7-1); considerada uma medida de disperso muito satisfatria para grupos pequenos de
dados.
12
(x-x)
(x-x)
7
3
4
6
1
6
7
6
5
+2
-2
-1
+1
-4
+1
+2
+1
0
4
4
1
1
16
1
4
1
0
45
32
Distribuio normal
Distribuio normal
Uma curva de distribuio pode descrever a forma da distribuio de uma populao. Conhecendo-se a forma, a
mdia e o desvio padro, pode-se a caracterizar uma populao.
Um tipo de curva de distribuio bastante comum para representar a distribuio de populaes de dados
biolgicos( peso, altura, presso arterial, taxa de glicose no sangue, etc.....) a curva normal ou curva de Gauss.
: mdia populacional : desvio padro
importante destacar que no h apenas uma curva normal. Para cada valor diferente da mdia e do desvio
padro, h uma curva normal diferente. Estaturas de adultos do sexo masculino, por exemplo, teriam distribuio
normal com uma altura mdia de 172cm, enquanto as estaturas de meninos de 10 anos de idade seriam ainda
normalmente distribudas mas em torno de uma mdia de 152cm. Se a disperso( desvio padro: ) das duas
populaes de estaturas igual, as duas curvas tero forma idntica, ocupando posies diferentes no eixo
horizontal.
152
172
152
172
14
15
Distribuio normal
4) Que proporo de estaturas esto no intervalo 167 a 177 cm?
Do resultado anterior temos que, para x =167, z = -1 e para x =177, z = +1. A rea entre z = 0 e z = 1 igual a
34,13%. Deste modo, a rea entre z = -1 e z = 1 ser de 68,26%, ou seja, 68,26% das estaturas de homens adultos
esto entre 167 a 177cm.
68,26%
167
172
177
z
-1
1
5) Que proporo de estaturas so maiores que 179,7 cm?
Z = 179,1 - 172 = 1,54
5
Na tabela z, a rea entre z = 0 e z = 1,54 0,4382. Subtraindo de 0,5000, a rea direita de z = 1,54, ou seja, a
proporo de estaturas acima de 179,7 cm ser de 6,18%.
172
6,18%
179,7 x
1,54 z
Nos exemplos anteriores, reas sob partes da curva normal foram interpretadas como porcentagens de homens
adultos, cujas estaturas estavam dentro de certos intervalos. Tais reas podem ser interpretadas como
probabilidade. No exemplo 1, onde 84,13% das estaturas dos homens adultos estava abaixo de 177cm, afirmou-se
que 84,13% das estaturas de homens adultos esto abaixo de 177cm. Pode-se dizer tambm que, se um homem
adulto tomado ao acaso, a probabilidade de que sua estatura seja menor que 177cm 0,8413 ou 84,13%.
Valores normais
Uma aplicao bastante til da curva normal a determinao de valores normais. Como a prtica da medicina
est se tornando cada vez mais quantitativa, grande importncia est sendo atribuda aos exames laboratoriais.
Torna-se essencial, portanto, definir os limites de normalidade de modo a diferenciar os possveis valores
anormais. Para isso fazemos medidas para uma srie de indivduos supostamente normais e para essas medidas
calculam-se a mdia e o desvio padro. A seguir determinam-se intervalos(simtricos em torno da mdia) que
incluam qualquer proporo desejada de indivduos. Usa-se normalmente um intervalo de 95% que, numa curva
normal, inclui valores entre mdia menos 1,96 desvios padro at mdia mais 1,96 desvios padro( ou ~ +/- 2 ).
Por exemplo, se a temperatura mdia de um grupo de adultos normais(sadios), do sexo masculino, for calculado
em 36,8C, com um desvio padro de 0,27C, poderemos dizer que 95% dos indivduos normais do sexo masculino
tm uma temperatura entre 36,8 2(0,27) e 36,8 + 2(0,27), ou seja, entre 36,3C e 37,3C. Esse intervalo
chamado de intervalo de normalidade para temperatura.
16
Prevalncia
Prevalncia a frao de um grupo de pessoas que possuem uma determinada condio clinica em um dado
perodo de tempo. A prevalncia obtida atravs de uma populao predefinida contendo pessoas sadias e com a
condio em questo, em um nico momento.
Incidncia
Incidncia a frao de um grupo que inicialmente no possua a Doena e que a desenvolve em um determinado
perodo de tempo. A incidncia ento se refere aos novos casos da doena que aparecem em uma populao
inicialmente sadia. O grupo de pessoas utilizado na medida de incidncia um grupo suscetvel doena em
questo.
Coeficiente de incidncia
nmero de casos novos em relao ao total de indivduos expostos na unidade de tempo.
Coeficiente de prevalncia
nmero de casos novos + antigos, em relao ao total de indivduos expostos na unidade de tempo.
17
Medidas de Associao
Exerccio
A figura abaixo mostra a ocorrncia de doena em um grupo de 100 pessoas durante o decorrer de trs anos. Nos
trs anos, 16 desenvolveram a doena e quatro j a possuam.
Perguntas:
01 - Qual a prevalncia: no comeo de 2005, no comeo de
2006, no comeo de 2007 e no comeo de 2008?
02 - Qual a incidncia: No perodo anual de 2005, no perodo
anual de 2006, no perodo anual de 2007, no perodo de
2005 at 2007?
A prevalncia considera a situao do paciente em um
determinado ponto do tempo, enquanto a incidncia
considera um intervalo de tempo em que os susceptveis
foram acompanhados.
Comparao IncidnciaxPrevalncia
Caracterstica
Incidncia
Prevalncia
Tempo
Durao do perodo
Um nico ponto
Medida
Estudo de Coorte
Estudo transversal
Numerador
Denominador
Epidemia
Considera-se que uma doena apresenta um surto epidmico quando sua incidncia em um determinado perodo
maior que a Incidncia Mxima Esperada (IME). A IME calculada como sendo: IME= (Mdia da incidncia) +
2x(Desvio Padro da Incidncia), ou seja, uma epidemia uma variao de aproximadamente 5% nas pontas da
curva normal.
18
19
Estudo de coorte
SIM
NO
SIM
Passar do tempo
NO
20
21
Estudos transversais
Estudos transversais
Nos Estudos Transversais, cada indivduo avaliado para o fator de exposio e a doena em determinado
momento. Muitas vezes o estudo transversal realizado apenas com objetivo descritivo sem nenhuma hiptese
para ser avaliada. Alguns tm usado o termo levantamento para denominar estudos transversais realizados com
essa finalidade. O estudo transversal pode ser usado como um estudo analtico, ou seja para avaliar hipteses de
associaes entre exposio ou caractersticas e evento. No entanto limitaes existem quando se tenta concluir
qual a natureza da relao entre exposio e evento nestas situaes. Essa limitao relaciona-se, principalmente,
com o fato de que a exposio e a doena so avaliados ao mesmo tempo (transversalmente). Uma questo
importante que pode ficar sem resposta sobre o que apareceu primeiro, o fator de exposio ou a doena. Um
outro ponto que deve ser observado nestes estudos transversais a dificuldade em separar os casos novos
da doena dos casos j presentes por algum tempo. Desta forma os estudos transversais iro refletir no apenas
determinantes de doena mas, tambm, determinantes de sobrevida. Apesar das limitaes, os estudos
transversais, pelo fato de incluir indivduos com e sem o evento e de poder avaliar associaes entre
o evento e exposies ou caractersticas, podem ser considerados um passo adiante na identificao dos
determinantes de doenas, quando comparados com relatos ou sries de casos. Em verdade, existem situaes
em que os estudos transversais podem ser considerados estudos verdadeiramente analticos. Isto ocorre quando o
fator de exposio no sofre influncia do tempo. Diversos exemplos sero encontrados entre aqueles fatores
presentes desde o nascimento, como tipo sanguneo, sexo (masculino, feminino) e sistema HLA. Como os estudos
transversais descrevem o que ocorre com um determinado grupo e em um determinado momento, eles so
importantes guias para tomadas de decises no setor de planejamento de sade. Para o profissional que lida
diretamente com pacientes, os estudos transversais oferecem informaes da maior utilidade ao chamar ateno
para caractersticas ligadas com a freqncia de uma determinada doena na comunidade ou em determinado
servio assistencial. Estes estudos, portanto, podem influenciar o raciocnio clnico e a tomada de decises na
prtica mdica. Quando da escolha do desenho de pesquisa deve ser considerado que os estudos transversais,
habitualmente, exigem menos recursos financeiros e podem ser realizados mais rapidamente do que os estudos
de caso-controle ou coorte.
Os estudos transversais tambm podem ser:
- Comparados - 4835 indivduos de 20 a 74 anos foram selecionados aleatoriamente da populao adulta do Rio
Grande do Sul para, em sua prpria residncia, responderem a um questionrio sobre hbitos alimentares e terem
sua presso arterial medida. Os 4565 indivduos efetivamente estudados foram ento classificados como
consumidores excessivos de sal ou no, e em hipertensos e no hipertensos.
- No comparados - (estudo de prevalncia) 3101 moradores da fronteira sudeste do Rio Grande do Sul foram
submetidos a investigao para determinar a prevalncia de soro positividade para hidatidose.
Vantagens:
1 - Fceis, rpidos e baratos.
2 - Boa fonte de hipteses.
Com doena
Inconvenientes:
1 - Impossvel determinar o que ocorre primeiro (causa - efeito)
2 - Desconhecimento da ao dos fatores no passado.
3 - Impossibilidade de estabelecer uma prova causal.
Sujeitos
Sem doena
Comeo
do estudo
22
TEMPO
Estudos de caso-controle
O estudo de caso controle comea com a ausncia ou a presena de um evento e ento procura no passado
tentando detectar possveis causas ou fatores de risco que possam ser encontrados. Os "casos" so indivduos
selecionados de um grupo q possui um determinado evento, os "controles" so indivduos que no apresentam o
evento. So analisados a histria de casos e controles em uma tentativa de identificar uma caracterstica ou fator
de risco presente nas histrias dos casos mas no nas histrias dos controles.
A figura ilustra que os sujeitos do estudo so escolhidos no comeo do estudo depois que eles sejam reconhecidos
como portadores de uma doena ou resultado (quadrados) ou controles sem a doena ou resultado (diamantes).
So examinadas as histrias de casos e controles em um perodo prvio para descobrir a presena (reas
sombreadas) ou ausncia (reas no sombreadas) de caractersticas predisponentes ou de fatores de risco, ou, se
a doena infecciosa, se o caso foi exposto ao agente infeccioso presumido. Nos estudos de caso-controle, a
pergunta est no passado, como mostra a seta apontando para trs na figura, por isso sendo chamado de
retrospectivo. Podemos dizer que so os estudos que perguntam: O QUE ACONTECEU?. Os estudos de casocontrole so tambm longitudinais, pois cobrem um perodo de tempo.
Exposto
Casos
No exposto
Exposto
Controles
No exposto
Comeo
do estudo
TEMPO
Direo da pergunta
O QUE ACONTECEU?
23
Estudos Ecolgicos
Estudos Ecolgicos
Nos Estudos Ecolgicos as medidas usadas representam caractersticas de grupos populacionais. Portanto a
unidade de anlise a populao e no o indivduo. Um exemplo seria um estudo envolvendo diversas cidades
brasileiras em que se procurasse correlacionar dados sobre mortalidade infantil a nvel de cada municpio com a
renda per capita e ndice de analfabetismo do local no sentido de encontrar evidncias de que o nvel scio
econmico um dos determinantes de mortalidade infantil.
A limitao principal do estudo ecolgico que a relao entre o fator de exposio e o evento pode no estar
ocorrendo ao nvel do indivduo. Desta forma uma associao entre uma exposio e evento ao nvel da populao
no permite afirmar que a exposio est mais presente naqueles que adquirem a doena - (falcia ecolgica).
Estes estudos, no entanto, ajudam a identificar fatores que merecem uma investigao mais detalhada atravs de
estudo com maior capacidade analtica. Por exemplo, a demonstrao de uma relao entre venda de cigarros per
capita e mortalidade de doena cardiovascular (DCV) em estudos ecolgicos motivou o planejamento de estudos
Caso-Controle e Coorte que vierem a demonstrar de forma bem mais convincente que o hbito de fumar um dos
fatores determinantes de DCV, particularmente doena coronariana e acidente vascular cerebral.
Os estudos de sries temporais, em que uma mesma rea ou populao estudada em momentos distintos do
tempo, so classificados como um subtipo dos estudos ecolgicos. Nesse caso, cada unidade de tempo passaria a
ser tratada como uma unidade ecolgica completa
Vantagens
1 -Facilidade de execuo
2 -Baixo custo relativo
3 - Simplicidade Analtica
4 - Capacidade de gerar hipteses
Desvantagens
1 - Baixo poder analtico
2 - Pouco desenvolvimento das tcnicas de anlise dos dados
3 - Vulnervel chamada "falcia ecolgica"
24
Testes de hiptese
Quando fazemos uma pesquisa, normalmente usamos amostras, pelos motivos j estudados. Entretanto, o nosso
objetivo final generalizar os resultados para toda a populao. O que nos diz se isso vlido ou no so os testes
de hiptese.
Chamamos de H0 (hiptese nula) a hiptese que diz que os nossos resultados so obra do acaso, ou seja, no
podem ser generalizados para a populao. Chamamos de H1 a hiptese que diz que os nossos dados so vlidos
para toda a populao.
Os testes de hiptese dizem a probabilidade da hiptese H0 ser a verdadeira, o que por fim se traduz no valor de
p.
Teste t de student
DESCOBRE SE AS MDIAS DIFERENTES JUSTIFICAM EXCLUIR H0
Condies para o uso do teste t:
As distribuies seguem uma distribuio normal; os desvios padro nas amostras so iguais; as observaes so
independentes; e o n da amostra maior que 30.
Como usar o teste t:
Definem-se quais mdias se quer comparar: X1=media de idade das mulheres ao entrar na faculdade; X2=media de
idade dos homens ao entrar na faculdade. Definem-se os tamanhos das amostras: N1=numero de mulheres na
amostra; N2=numero de homens na amostra. Descobre-se o t da nossa pesquisa:
t (n +n -2) = (X 1 -X 2)
1
SD
[(1/n 1 )+(1/n 2 )]
Descobre-se o t crtico na tabela, baseado no grau de liberdade da amostra (N1+N2-2) e no alpha desejado e
compara-se com o t obtido. Se o t calculado for MENOR que o tabelado, a hiptese vlida a H1.
Exerccio
Teste t de student:
Em um determinado estudo, ao se compararem duas mdias, encontramos um t calculado de 4,35. O t tabelado
para alpha igual a 0,05 4,98. Podemos ento afirmar:
a) A pesquisa tem somente 1% de chance de no ser significante.
b) O valor de p 0,05.
c) A comparao significativa com pelo menos 95% de chance.
d) O valor de t independe do tamanho da amostra.
25
Testes de Hiptese
Teste F
Teste F
DESCOBRE SE AS VARINCIAS DIFERENTES JUSTIFICAM EXCLUIR H0
Condies de uso do teste F:
As distribuies seguem uma distribuio normal; os desvios padro nas amostras so desiguais; as observaes
so independentes, qualquer n vlido.
Clculo do F:
(SDmaior)2/(SDmenor)2
Procura-se na tabela o F tabelado para o alpha desejado e o respectivo grau de liberdade. Se o F calculado for
MAIOR que o F tabelado, rejeita-se H0.
Exerccio
Teste F:
Em um determinado estudo, ao se compararem duas propores, foi encontrado um valor de F igual a 4. O F
tabelado para um alpha igual a 0,01 e o respectivo grau de liberdade foi igual a 5. Logo:
a) A pesquisa estatisticamente significante para alpha = 0,01.
b) possvel que o desvio padro maior fosse 16 e o menor 4.
c) possvel que a pesquisa seja estatisticamente significante para um alpha de 0,05.
d) O teste F pode ser usado com variveis nominais.
Teste de Levene
Mesma idia do teste F, mas no precisa ser distribuio normal e um teste mais exato.
26
Calcula-se o
para a amostra:
n(ad - bc)
(a+c)(b-d)(a+b)(c+d)
Se o chi-quadrado calculado for MAIOR que o valor crtico (tabelado), rejeita-se a hiptese nula.
Exerccio
Teste chi-quadrado:
Em um determinado estudo, realizou-se uma anlise utilizando a frmula do chi-quadrado em uma tabela que
comparava as idades dos participantes com o valor do colesterol encontrado em uma dosagem. Chegou-se ao
valor de 53. O valor crtico tabelado para alpha=0,05 3. Podemos afirmar:
a) O resultado altamente significante.
b) O resultado no significante.
c) O p com certeza menor que 0,05.
d) No podemos afirmar nada, pois o teste foi mal empregado.
Teste de fisher
Mesma idia do teste de chi-quadrado, mas calculado de forma exata:
p = (a+b)!(c+d)!(a+c)!(b+d)!
a!b!c!d!n!
O valor de p (p value)
O valor de p o alpha mnimo em que ainda se rejeita a hiptese nula. p=0,05=5%, quer dizer que esse o menor
alpha que pode ser utilizado para que seja impossvel o resultado ser obra do acaso; ou seja, se eu usasse p=0,04,
a hiptese nula j seria considerada. Digamos que tenhamos achado um t = 1; o t tabelado para alpha igual a 0,05
seria 1,1, e o o t tabelado para alpha igual a 0,04 seria igual a 0,9.
27
Intervalo de Confiana
Intervalo de confiana de uma diferena de propores
USADO PARA COMPARAR PROPORES
Exemplo: (P1=proporo de pessoas com cncer de pulmo que fumavam; P2=proporo de pessoas sem cncer
de pulmo que fumavam)
Clculo do intervalo de confiana para a proporo:
IC=P1+-1,96(para IC de 95%(ESSE O ALPHA DESSE CLCULO))xSD
Clculo do intervalo de confiana para a diferena entre as propores:
IC=(P1-P2)+-1,96(para IC de 95%)xSE
Se o intervalo de confiana obtido contiver 0, no se rejeita a hiptese nula.
Calculo do Erro Padro:
Onde p :
Exerccio
Em um determinado estudo, uma determinada diferena de propores foi igual a 1,96, com erro padro igual a 1.
Para um alpha igual a 0,05(z=1,96), podemos afirmar:
a) A diferena entre essas propores estatisticamente significante.
b) A diferena entre estas propores deve estar entre 1,96 e 3,92.
c) Para um alpha=0,01, o inverso da diferena entre propores estudada torna-se possvel.
d) O n da amostra no influencia o intervalo de confiana.
28
Padro-ouro negativo
TOTAL
Exame positivo
a+b
Exame negativo
c+d
TOTAL
a+c
b+d
a+b+c+d
Exerccio
Um estudo foi realizado com o objetivo de avaliar um novo exame de sangue para diagnosticar cncer de mama.
100 mulheres foram avaliadas, e destas 20 tiveram o resultado do exame de sangue positivo para cncer de
mama. Ao se realizar a bipsia em todas as mulheres, foi encontrado na lmina clulas cancergenas em 30
mulheres, e em 5 das que se queixavam no foram vistas clulas cancergenas.
D a especificidade, sensibilidade e valores preditivos positivo e negativo.
29
Tabelas de freqncia
Os artigos cientificos apresentam freqentemente informao em distribuies de freqncia ou tabelas de
freqncia. A escala das observaes deve ser primeiro dividida em classes. O nmero de observaes em cada
classe ento contado. Os passos para construir uma tabela de freqncia so os seguintes:
Identifique as maiores e menores observaes.
Subtraia a observao menor do maior obter a variao.
Determine o nmero de classes. O bom senso normalmente suficiente para tomar esta deciso, mas as diretrizes
seguintes podem ser teis.
Entre 6 e 14 classes geralmente adequado para prover bastante informao sem ser detalhista demais.
O nmero de classes deveria ser grande o bastante para demonstrar a forma da distribuio mas no as flutuaes
menos notveis.
Uma dica dividir a variao de observaes pelo nmero de classes obter a compriemnto das classes. Para
algumas aplicaes, decidir primeiro o comprimento da classe pode fazer mais sentido; ento use depois o
comprimento de classe para determinar o nmero de classes. AS seguintes so algumas diretrizes para determinar
o comprimento de classe.
Os limites de classe (nmeros iniciais e finais) no devem se sobrepor. Por exemplo, eles devem ser declarados
como 4049 ou de 40 at 50, no como 4050 ou 5060. pois assim no temos como dizer a que classe
o 50 pertence.
Se possvel, os comprimentos de classe devem ser iguais. Comprimentos de classe desiguais podem gerar
problemas na criao dos grficos e s devem ser usados quando aberturas grandes acontecerem nos dados.
Se possivel devem ser evitadas classes em no inicio ou no fim da variao porque eles no comunicam a variao
das observaes com preciso.
Se possvel, deveriam ser escolhidos limites de classe de forma que a maioria das observaes na classe ficasse
mais proximo de ponto central da classe do que do final da classe.
Conte o nmero de observaes em cada classe. Se voc estiver construindo uma tabela de freqncia, voc
precisa somente do nmero de observaes que ocorrem dentro da classe.
30