Académique Documents
Professionnel Documents
Culture Documents
Grupo 3 Integrantes: - Len Vera Joe - Marino Aguilar Fernado - Marios Maln Michael - Marreros Aquino Nicole
Frecuencia absoluta Frecuencia relativa Porcentaje Frecuencia absoluta acumulada Frecuencia relativa acumulada
Frecuencia absoluta: La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece en la muestra dicho valor de la variable, la representaremos por ni
Frecuencia relativa:
La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fi Donde N = Tamao de la muestra
Frecuencia relativa porcentual La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre en trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.
Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamao de la muestra, y la denotaremos por Fi
Porcentaje Acumulado:
Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada por 100.
MEDIDAS DE RIESGO
Riesgo absoluto (incidencia, prevalencia) Determinar las tasas de enfermedad por persona, lugar
y tiempo
Riesgo relativo (o razn de momios) Identificar los factores de riesgo para la enfermedad
enfermedad.
ocurriendo en un periodo especfico de tiempo dividido entre el nmero de personas en riesgo de desarrollar la enfermedad durante el mismo periodo de tiempo.
Prevalencia = nmero total de individuos afectados en una
poblacin en un periodo de tiempo especfico dividido entre el nmero de individuos en la poblacin al mismo tiempo
Incidencia es ms relevante clnicamente
Riesgo relativo (RR), razn de momios (RM) RR = razn de incidencia de la enfermedad en individuos expuestos y la incidencia de la enfermedad en individuos no expuestos (de un estudio cohorte/prospectivo) Si RR > 1, hay una asociacin positiva Si RR < 1, hay una asociacin negativa
RM = razn del momio de que cases estuvieron
expuestos al momio de que los controles estuvieron expuestos (de un estudio casos-controles/retrospectivo), es una estimacin del RR La interpretacin es la misma que para RR
puede atribuirse a una exposicin especfica Diferencia en incidencia de la enfermedad entre individuos expuestos y no expuestos Incidencia en no expuestos = riesgo antecedente Cantidad de riesgo que puede prevenirse
FA = la proporcin de la incidencia de la enfermedad
que puede ser atribuida a una exposicin especfica (entre los que estuvieron expuestos) RA dividido entre la incidencia en expuestos x 100%
MEDIDAS DE RESUMEN
Centralizacin
Indican valores con respecto a los que los datos parecen agruparse.
Media, mediana y moda
Posicin
Dispersin
Indican la mayor o menor concentracin de los datos con respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza,
MEDIA
Se define como la suma de todos los valores numricos (que adopta la variable estudiada) divididos por el nmero total de valores observados Media de 2,2,3,7 es (2+2+3+7)/4=3,5 -Conveniente cuando los datos se concentran simtricamente con respecto a ese valor. -Muy sensible a valores extremos. En estos casos es ms conveniente calcular la mediana -En distribuciones a partir de intervalos de clase no se puede estimar si existen intervalos abiertos a)Media aritrmtica: Datos sin agrupar X= x N b)Media Ponderada: Xw= wx w
Datos agrupados X= fx N
Ejemplo
Peso 40 < 50 50 < 60 M. Clase 45 55 Fr. 5 10 Fr. ac. 5 15
xf x
i i
N 45 5 55 10 115 3 69,3 58
60 < 70
70 < 80 80 < 90 90 < 100 100 < 130
65
75 85 95 115
21
11 5 3 3 58
36
47 52 55 58
Mediana: de un conjunto de valores ordenados en magnitud es el valor central o la media de los dos valores centrales. Es un valor que divide a las observaciones en dos grupos con el mismo nmero de individuos .
Altura mediana
Mediana de n observaciones impar: N/2 + 0,5: Ejemplo: 1,2,4,5,6,6,8 n observaciones, 7; (7/2)+0,5=4 ; hay que buscar el valor que ocupa la posicin 4: 1,2,4,5,6,6,8 ;luego la mediana es 5
Mediana de n observaciones par es el valor medio de los valores que ocupan las posiciones N/2 y N/2 +1 Ejemplo: 1,2,4,5,6,6,8,9 N observaciones par, 8; hay que buscar los valores que ocupan las posiciones 8/2 y (8/2)+1, es decir, las posiciones 4 y 5; los valores que ocupan las posiciones 4 y 5 son el 5 y el 6; la ,mediana es la media de esos dos valores 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
MEDIANA
- No es sensible a valores extremos. -Es conveniente cuando los datos son asimtricos.
EJEMPLO
Ejemplo
Peso 40 < 50 50 < 60 60 < 70 70 < 80 80 < 90 90 < 100 100 < 110 M. Clase 45 55 65 75 85 95 115 Fr. 5 10 21 11 5 3 3 Fr. ac. 5 15 36 47 52 55 58
1 / 2 * N Fi 1 Mediana L c fi 1 / 2 * 58 15 60 10 66 ,6 21
58
La moda: se define como el valor que tiene una mayor frecuencia en un conjunto de datos (es decir, aquel que ms se repite). Para datos agrupados en intervalos Mo= Li + c. D1: fi-fi-1 D2: fi- fi+1
Peso 40 < 50 50 < 60 M. Clase 45 55 Fr. 5 10 Fr. ac. 5 15
D1 D1+D2
60 < 70
70 < 80 80 < 90 90 < 100 100 < 110
65
75 85 95 115
21
11 5 3 3 58
36
47 52 55 58
Intervalo modal
Mo 60 10
11 65,24 11 10
Estadsticos de posicin
Cuartiles: Dividen a la muestra en 4 grupos homogneos. Primer cuartil = Percentil 25 = Cuantil 0,25 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana Tercer cuartil = Percentil 75 = cuantil 0,75 Quintiles: 4 valores que dividen a una muestra en 5 grupos homogneos Quintil 2= Decil 2= Percentil 20 Deciles: 9 valores que dividen a una muestra en 10 grupos homogneos Decil 5= mediana= cuartil segundo= percentil 50 Percentil de orden k = cuantil de orden k/100 Percentil 50= mediana= cuartil segundo= decil quinto, El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%
Ejemplo
Peso 40 < 50 50 < 60 60 < 70 70 < 80 80 < 90 90 < 100 100 < 130 M. Clase 45 55 65 75 85 95 115 Fr. 5 10 21 11 5 3 3 58 Fr. ac. 5 15 36 47 52 55 58
P75 Li c
75 / 100 N Fi 1 43,5 36 70 10 76 ,8 f 11
Medidas de dispersin
Las medidas de dispersin indican el grado de representatividad de las medidas de tendencia central. Miden el grado de dispersin/ concentracin de los datos en torno a las medidas de tendencia central Existen dos tipos de medidas de dispersin: ABSOLUTAS Y RELATIVAS
Mediana
P10
0.02
0.03
0.04
Mn.
P25
P50
P75
Mx.
25%
25%
Rango intercuartlico:
Es la distancia entre primer y tercer cuartil.
Rango intercuartlico = Q3
0.00
Parecida al rango, pero eliminando las observaciones ms extremas inferiores y superiores. No es tan sensible a valores extremos
0.01
Rango
150
160
170
180
190
- Q1
Parecida al rango, pero eliminando las observaciones ms extremas inferiores y superiores. Es el menos sensible a valores extremos.
Q3 Q1 Vq *100 me
Es la razn entre el rango intercuartlico y la mediana. Mide el rango intercuartlico en forma dequ tamao tiene con respecto a la mediana
Es frecuente mostrarla en porcentajes Si la mediana es 80 y el rango intercuartlico es de 5 entonces Vq=5/80*100=6,25% Es una cantidad adimensional (independiente de las unidades de medida). Interesante para comparar la variabilidad de diferentes variables. Si el peso tiene Vq=6,25% y la edad tiene Vq=10%, los individuos presentan ms dispersin en edad que en peso.
S CV *100 x
Es una cantidad adimensional (independiente de las unidades de medida). Interesante para comparar la variabilidad de diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan ms dispersin en peso que en altura.
No debe usarse cuando para variables cuyo nivel de medicin es por intervalos, es decir,la variable cuenta con un valor 0 fijado arbitrariamente.
Por ejemplo 0C 0F
Si la variable presenta valores negativos, al calcular el coeficiente de variacin de pearson los habr que considerar como positivos
VARIABLES NORMALIZADAS O UNIDADES TIPIFICADAS Normal.............. |z| < 1 Anormal............ 1 < |z| < 2 Muy anormal...... |z| >=2 Variables normalizadas: nmero de unidades de desviacin tpica que un individuo queda por encima o por debajo de la media del grupo. Son unidades independientes de las unidades originales de medida con lo cual facilitan enormemente la comparacin. til para comparar un individuo respecto a los datos poblacionales a los que pertenece. Las unidades Z se calculan: Z= x - x S