Académique Documents
Professionnel Documents
Culture Documents
Centro: Um valor representativo ou mdio, que indica onde se localiza o meio do conjunto de dados. Variao: Uma medida de quanto os valores dos dados variam. Distribuio: A natureza ou forma da distribuio dos dados (ex. uniforme, sino, assimtrica). Outliers ou valores discrepantes: valores amostrais que se localizam muito longe da grande maioria dos outros valores amostrais. Tempo: Caractersticas mudam com o tempo. dos dados que
Diagrama de Barras
Usado para apresentar variveis qualitativas e quantitativas discretas. As barras do diagrama podem ser verticais ou horizontais. Variveis qualitativas ilustrar comparaes entre categorias. Variveis quantitativas discretas barras do diagrama devem ser verticais.
Grfico de setores
representar
variveis
Cada categoria corresponder a uma diviso ou a um setor de um crculo. Geralmente utilizado quando se pretende comparar o total de cada categoria com o conjunto total. Neste tipo de grfico, um crculo de raio qualquer vai representar 100% dos dados (360o). Quando usar a freqncia relativa no grfico, colocar o N.
er
s 1% s f
t tes
Br 5
Histograma
Adequado para ilustrar o comportamento de valores agrupados em classes. um grfico de colunas composto por vrios ret ngulos adjacentes, representando a tabela de freqncia. As classes so colocadas no eixo horizontal e as freqncias no eixo vertical. Na construo devem ser empregadas de 20 classes. a
Interpretao: Centro, variao, forma e outlier. No apropriado para verificar se h mudanas ao longo do tempo.
Histograma
P r t l
Exemplo
i t
li f it l i li fi
Freqncia
1 2 1 20
Histograma - Exemplo
Per en u l de lin i o em p ien es om leu emi lin ide
Polgono de freqncia
Utilizado na representao de variveis quantitativas contnuas. Usa segmentos de reta ligados a pontos localizados diretamente acima dos valores dos pontos mdios de classe. Os segmentos so estendidos direita e esquerda de forma que o grfico comece e termine no eixo horizontal. Exemplo: tabela usada para construo do histograma
Ogiva de Galton
um grfico de linha que representa as freqncias acumuladas. O grfico se inicia com a fronteira inferior da primeira classe e termina com a fronteira superior da ltima classe. Exemplo: tabela usada para construo do histograma
percen u l de lin ci os
Ramo-e-folha
Representa dados separando cada valor em duas partes: o ramo (dgito mais a esquerda) e a folha (dgito mais a direita). Pode ser expandido ou condensado. Ao virar o ramo-e-folhas de lado podemos ver a distribuio dos dados. Vantagem: os dados originais podem ser recuperados. Usar de 5 a 20 classes.
Ramo-e-folha Exemplo
Dimetros abdominais de 40 indivduos
57 59 60 60 62 63 63 63 64 66 66 68 69 69 70 70 71 72 72 73 74 75 75 77 78 81 83 85 86 86 87 88 88 89 91 94 95 101 107 119
Ramo-e-folha Exemplo
Dimetros abdominais de 40 indivduos
Ramo (dezena) 5 6 7 8 9 10 11 Folhas (unidades) 7 9 0 0 2 3 3 3 4 6 6 8 9 9 0 0 1 2 2 3 4 5 5 7 8 1 3 5 6 6 7 8 8 9 1 4 5 1 7 9
Diagrama de disperso
a melhor maneira de visualizar o relacionamento entre duas variveis. A representao grfica feita no mesmo sistema de coordenadas, em que uma das variveis colocada no eixo x e outra no eixo y. O grfico de disperso utilizado para interpretar o relacionamento entre duas variveis (direo, forma e intensidade do relacionamento).
29 25 26 23 25 23 18 28 46 22
50 ra er et al e gor 40 30 20 10 0 0 5 10 15 IM 20 25 30 35
Boxplot
aps MP
Medidas de centro
Mdia
Mdia amostral
n
Mdia populacional
n
x
X !
i !1
x
Q!
i !1
Mdia - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Medidas de centro
Mediana
Para calcular a mediana devemos primeiro colocar os valores em ordem crescente (ou decrescente) e, em seguida, aplicar um dos dois processos abaixo: Se o nmero de valores mpar, a mediana o nmero localizado exatamente no meio da lista. Se o nmero de valores par, a mediana a mdia dos 2 valores do meio.
Mediana - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Medidas de centro
Moda (M)
o valor freqentemente.
que
ocorre
mais
Moda
5 5 5 3 1 5 1 4 3 5 1 2 2 2 3 4 5 6 6 6 7 9 1 2 3 6 7 8 9 10
Moda - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Medidas de centro
Ponto mdio
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Medidas de centro
xn
X !
i !1 n
i i
n
i !1
Assimetria
A distribuio de dados assimtrica quando se estende mais para um lado que para o outro. Uma distribuio de dados simtrica se a metade esquerda do seu histograma praticamente uma imagem espelhada de sua imagem direita.
Separatrizes
Separatrizes
Quartil: Divide a distribuio em 4 partes iguais em um conjunto ordenado de valores. Percentil: Divide a distribuio em 100 partes iguais em um conjunto ordenado de valores. Decil: Divide a distribuio em 10 partes iguais em um conjunto ordenado de valores.
Separatrizes
Separatrizes
Observa :
Intervalo interquartil = Q3 Q1 Intervalo semi-quartil = (Q3 Q1) / 2 Quartil mdio = (Q1 + Q3) / 2 Amplitude de percentis 10-90 = P90 P10
Separatrizes Exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Resumo dos cinco nmeros: mnimo, Q1, Q2, Q3 e mximo. um grfico de um conjunto de dados que consiste em uma linha que se estende do valor mnimo at o valor mximo, em uma caixa com linhas traadas em Q1, Q2 e Q3.
entre
Ache o resumo dos cinco nmeros. Construa uma escala com valores que incluam o mximo e o mnimo dos dados. Construa uma caixa retangular estendendo-se de Q1 a Q3, e trace uma linha ns caixa no valor de Q2. Trace linhas estendendo-se da caixa at os valores mnimo e mximo.
Boxplot - Exemplo
Figure 1. Effect of Newly Diagnosed Helicobacter pylori Infection on Thyrotropin Levels in Patients with Multinodular Goiter Treated with Thyroxine. The box plots show levels of thyrotropin in patients who received no treatment with thyroxine, in patients receiving thyroxine treatment (median dose, 1.56 microg per kilogram per day) and in whom a low level of thyrotropin (0.05 to 0.20 mU per liter) was stably achieved, in patients with H. pylori infection (with no change in the dose of thyroxine), and in patients after the eradication of H. pylori infection (median dose, 1.70 microg per kilogram per day).
Medidas de disperso
A disperso fornece uma medida da proximidade da srie de dados em torno de um valor de tendncia central, tomado como comparao. Medidas para avaliar a disperso de um conjunto de dados: Amplitude T tal, Desvi Mdi , Varincia, Padr e C eficiente de Desvi Varia .
Medidas de disperso
Amplitude t tal
AT ! x ( mx ) x ( mn )
total
maior
Problema: somente so usados os extremos do conjunto (medida instvel). Elemento auxiliar na anlise p mostra a faixa de variao onde encontramos todos os elementos do conjunto.
Amplitude - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Medidas de disperso
Desvi mdi
a mdia aritmtica dos desvios absolutos dos elementos da srie, tomados em relao a mdia.
| d | DM !
N
onde d ! x i x
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Medidas de disperso
Desvio padro
n n
(x
i
W!
i!1
(xi X )2 s!
i!1
n
Utiliza
n 1
Verificao da disperso ou espalhamento de um conjunto de dados; Permite distinguir numericamente conjuntos de dados de mesmo tamanho e mesma mdia, mas que so visivelmente diferentes.
Medidas de disperso
Uma pergunta que pode surgir se um desvio padro grande ou pequeno; dependendo da ordem de grandeza da varivel. Comparao de sries p menor desvio p padro mais homognea ou menos dispersa.
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Medidas de disperso
ni ( xi Q )
!
i !1
ni ( xi X ) 2 s!
i !1
n
Populao
n 1
Amostra
Medidas de disperso
Varincia
n
n
(xi Q)2
2
(x X )
i
i !1
s2 !
i !1
n 1
Medida direta da disperso p conjunto com os dados mais dispersos ter maior vari ncia. Medida em unidade quadrada (exemplo: anos2) p o que dificulta a sua interpretao.
Varincia - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Medidas de disperso
C eficiente de varia
uma medida de disperso relativa (%) que mede a variao do desvio padro em relao mdia aritmtica.
s CV (%) ! 100 v X
Medidas de disperso
Coeficiente de variao
1) Qual a srie mais homognea: a srie A ou a srie ? 2) A srie C ou a srie D? 3) A srie A ou a srie E?
Srie A (t) (cm) C (oC) D (oC) E (t) Mdia 80,8 t 450,0 cm 32,6 oC 30,0 oC 8200 t Desvio padro 10,0 t 10,0 cm 4,2 oC 2,6 oC 700,0 t
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes
Identificao do indivduo 1 2 3 4 5 6 7 8 9 10
Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9
Doenas Cardacas 7.683 casos coletados no Havai em 1969 Tamanho da amostra: 100 Universo: Homens doentes com idade entre 45 e 67 anos. Fator de exposio: fumante Mdia de Idade da populao: 54,36 anos
Variveis Codificadas:
1) Educatio: nvel de instruo Utilizando similar brasileiro: 1 = nenhuma 2 = primeiro grau incompleto 3 = primeiro grau completo 4 = segundo grau completo 5 = curso tcnico 6 = curso superior 2) Weight : peso em Kg 3) Height : altura em cm 4) Age : idade em anos
Variveis Codificadas:
0 = no 1 = sim
7) Glucose: nivel de glicose no sangue em miligramas percentuais 8) Cholest: nvel de coleterol srico em miligramas percentuais 10) Pressure: presso sanguinea sistlica em mmHg
Variveis nvel educacional, Fumo e Atividade Fsica construo de tabela usando comando freqncia.
Procedimentos
quali. cont. graf.)
Grficos (Planilha:
Variveis Nvel Educacional, Fumo e Atividade Fsica construo de diagrama de barras (barras e colunas) e diagrama circular.
Procedimentos - Medidas
mdia, varincia
mediana, para as
moda, variveis
Uso das funes estatsticas do EXCEL. Uso da ferramenta anlise descritiva do menu Ferramentas.
Procedimentos - Medidas
Uso das funes estatsticas do EXCEL. Inserir p Funo p Estatstica p nome da funo (planilha: medidas)
Procedimentos - Medidas
Nome das funes Medida Mdia Moda Mediana Quartil Percentil Desvio mdio Desvio padro Varincia Funo Mdia Modo Med Quartil Percetil mnimo Desv.mdio Desvpad Var