Vous êtes sur la page 1sur 26

MEDIDAS DE FRECUENCIA

Grupo 3 Integrantes: - Len Vera Joe - Marino Aguilar Fernado - Marios Maln Michael - Marreros Aquino Nicole

Frecuencia absoluta Frecuencia relativa Porcentaje Frecuencia absoluta acumulada Frecuencia relativa acumulada

Frecuencia absoluta: La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece en la muestra dicho valor de la variable, la representaremos por ni

Frecuencia relativa:
La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fi Donde N = Tamao de la muestra

Frecuencia relativa porcentual La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre en trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.

Frecuencia Absoluta Acumulada:


Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por Ni.

Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamao de la muestra, y la denotaremos por Fi

Porcentaje Acumulado:

Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada por 100.

MEDIDAS DE RIESGO

Riesgo absoluto (incidencia, prevalencia) Determinar las tasas de enfermedad por persona, lugar

y tiempo
Riesgo relativo (o razn de momios) Identificar los factores de riesgo para la enfermedad

Riesgo/fraccin atribuible Desarrollar formas para la prevencin de la

enfermedad.

Riesgo absoluto (incidencia, prevalencia)


Incidencia = nmero de nuevos casos de una enfermedad

ocurriendo en un periodo especfico de tiempo dividido entre el nmero de personas en riesgo de desarrollar la enfermedad durante el mismo periodo de tiempo.
Prevalencia = nmero total de individuos afectados en una

poblacin en un periodo de tiempo especfico dividido entre el nmero de individuos en la poblacin al mismo tiempo
Incidencia es ms relevante clnicamente

Riesgo relativo (RR), razn de momios (RM) RR = razn de incidencia de la enfermedad en individuos expuestos y la incidencia de la enfermedad en individuos no expuestos (de un estudio cohorte/prospectivo) Si RR > 1, hay una asociacin positiva Si RR < 1, hay una asociacin negativa
RM = razn del momio de que cases estuvieron

expuestos al momio de que los controles estuvieron expuestos (de un estudio casos-controles/retrospectivo), es una estimacin del RR La interpretacin es la misma que para RR

Riesgo (RA) /fraccin (FA) atribuible RA = la cantidad de incidencia de enfermedad que

puede atribuirse a una exposicin especfica Diferencia en incidencia de la enfermedad entre individuos expuestos y no expuestos Incidencia en no expuestos = riesgo antecedente Cantidad de riesgo que puede prevenirse
FA = la proporcin de la incidencia de la enfermedad

que puede ser atribuida a una exposicin especfica (entre los que estuvieron expuestos) RA dividido entre la incidencia en expuestos x 100%

MEDIDAS DE RESUMEN

Centralizacin

Indican valores con respecto a los que los datos parecen agruparse.
Media, mediana y moda

Posicin

Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.


Cuartiles, quintiles, deciles y percentiles.

Dispersin

Indican la mayor o menor concentracin de los datos con respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza,

MEDIA
Se define como la suma de todos los valores numricos (que adopta la variable estudiada) divididos por el nmero total de valores observados Media de 2,2,3,7 es (2+2+3+7)/4=3,5 -Conveniente cuando los datos se concentran simtricamente con respecto a ese valor. -Muy sensible a valores extremos. En estos casos es ms conveniente calcular la mediana -En distribuciones a partir de intervalos de clase no se puede estimar si existen intervalos abiertos a)Media aritrmtica: Datos sin agrupar X= x N b)Media Ponderada: Xw= wx w

Datos agrupados X= fx N

Ejemplo
Peso 40 < 50 50 < 60 M. Clase 45 55 Fr. 5 10 Fr. ac. 5 15

xf x

i i

N 45 5 55 10 115 3 69,3 58

60 < 70
70 < 80 80 < 90 90 < 100 100 < 130

65
75 85 95 115

21
11 5 3 3 58

36
47 52 55 58

Mediana: de un conjunto de valores ordenados en magnitud es el valor central o la media de los dos valores centrales. Es un valor que divide a las observaciones en dos grupos con el mismo nmero de individuos .

Altura mediana

Mediana de n observaciones impar: N/2 + 0,5: Ejemplo: 1,2,4,5,6,6,8 n observaciones, 7; (7/2)+0,5=4 ; hay que buscar el valor que ocupa la posicin 4: 1,2,4,5,6,6,8 ;luego la mediana es 5

Mediana de n observaciones par es el valor medio de los valores que ocupan las posiciones N/2 y N/2 +1 Ejemplo: 1,2,4,5,6,6,8,9 N observaciones par, 8; hay que buscar los valores que ocupan las posiciones 8/2 y (8/2)+1, es decir, las posiciones 4 y 5; los valores que ocupan las posiciones 4 y 5 son el 5 y el 6; la ,mediana es la media de esos dos valores 1,2,4,5,6,6,8,9 es (5+6)/2=5,5

MEDIANA
- No es sensible a valores extremos. -Es conveniente cuando los datos son asimtricos.
EJEMPLO

-Mediana de 3,5,6,8,9,11 es 7 -Mediana de 3,5,6,8,9,29 es 7

Ejemplo
Peso 40 < 50 50 < 60 60 < 70 70 < 80 80 < 90 90 < 100 100 < 110 M. Clase 45 55 65 75 85 95 115 Fr. 5 10 21 11 5 3 3 Fr. ac. 5 15 36 47 52 55 58

1 / 2 * N Fi 1 Mediana L c fi 1 / 2 * 58 15 60 10 66 ,6 21

58

La moda: se define como el valor que tiene una mayor frecuencia en un conjunto de datos (es decir, aquel que ms se repite). Para datos agrupados en intervalos Mo= Li + c. D1: fi-fi-1 D2: fi- fi+1
Peso 40 < 50 50 < 60 M. Clase 45 55 Fr. 5 10 Fr. ac. 5 15

D1 D1+D2

60 < 70
70 < 80 80 < 90 90 < 100 100 < 110

65
75 85 95 115

21
11 5 3 3 58

36
47 52 55 58

Intervalo modal

Mo 60 10

11 65,24 11 10

Estadsticos de posicin

Cuartiles: Dividen a la muestra en 4 grupos homogneos. Primer cuartil = Percentil 25 = Cuantil 0,25 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana Tercer cuartil = Percentil 75 = cuantil 0,75 Quintiles: 4 valores que dividen a una muestra en 5 grupos homogneos Quintil 2= Decil 2= Percentil 20 Deciles: 9 valores que dividen a una muestra en 10 grupos homogneos Decil 5= mediana= cuartil segundo= percentil 50 Percentil de orden k = cuantil de orden k/100 Percentil 50= mediana= cuartil segundo= decil quinto, El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%

Ejemplo
Peso 40 < 50 50 < 60 60 < 70 70 < 80 80 < 90 90 < 100 100 < 130 M. Clase 45 55 65 75 85 95 115 Fr. 5 10 21 11 5 3 3 58 Fr. ac. 5 15 36 47 52 55 58

P75 Li c

75 / 100 N Fi 1 43,5 36 70 10 76 ,8 f 11

Medidas de dispersin
Las medidas de dispersin indican el grado de representatividad de las medidas de tendencia central. Miden el grado de dispersin/ concentracin de los datos en torno a las medidas de tendencia central Existen dos tipos de medidas de dispersin: ABSOLUTAS Y RELATIVAS

Mediana

Rango Rango intercuartlico

Rango entre percentiles


ABSOLUTAS Media Desviacin media Varianza Desviacin tpica Mediana RELATIVAS Media Coeficiente variacin intercuartlica Coeficiente variacin de Pearson

Dispersin absoluta: mediana


0.05

Amplitud o Rango: Diferencia entre observaciones extremas.


Rango entre percentiles (interquartile range):

Rango entre percentiles = P90


P10

0.02

Es la distancia entre percentil 90 y percentil 10.

0.03

0.04

1, 2, 3,4,4,8. El rango es 8-1=7 Es muy sensible a los valores extremos.

Mn.

P25

P50

P75

Mx.

25%

25% 25% Rango intercuartlico

25%

Rango intercuartlico:
Es la distancia entre primer y tercer cuartil.
Rango intercuartlico = Q3

0.00

Parecida al rango, pero eliminando las observaciones ms extremas inferiores y superiores. No es tan sensible a valores extremos
0.01

Rango

150

160

170

180

190

- Q1

Parecida al rango, pero eliminando las observaciones ms extremas inferiores y superiores. Es el menos sensible a valores extremos.

Dispersin absoluta: media


Desviacin media: Mide el promedio de las desviaciones (absolutas) de las observaciones con respecto a la media. Es la menos sensible a valores extremos (alejados de la media). Viene expresada en las mismas unidades de la variable. Varianza S2 : Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media. Es sensible a valores extremos (alejados de la media). Sus unidades son el cuadrado de las de la variable. De interpretacin difcil para un principiante.

Desviacin tpica Es la raz cuadrada de la varianza


Tiene las misma dimensionalidad (unidades) que la variable. Es sensible a valores extremos (alejados de la media).

Dispersin relativa: mediana

Q3 Q1 Vq *100 me
Es la razn entre el rango intercuartlico y la mediana. Mide el rango intercuartlico en forma dequ tamao tiene con respecto a la mediana
Es frecuente mostrarla en porcentajes Si la mediana es 80 y el rango intercuartlico es de 5 entonces Vq=5/80*100=6,25% Es una cantidad adimensional (independiente de las unidades de medida). Interesante para comparar la variabilidad de diferentes variables. Si el peso tiene Vq=6,25% y la edad tiene Vq=10%, los individuos presentan ms dispersin en edad que en peso.

Dispersin relativa: media

Coeficiente de variacin de PEARSON

Es la razn entre la desviacin tpica y la media.


Mide la desviacin tpica en forma de qu tamao tiene con respecto a la media Tambin se la denomina variabilidad relativa. Es frecuente mostrarla en porcentajes

S CV *100 x

Si la media es 80 y la desviacin tpica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)

Es una cantidad adimensional (independiente de las unidades de medida). Interesante para comparar la variabilidad de diferentes variables.

Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan ms dispersin en peso que en altura.

No debe usarse cuando para variables cuyo nivel de medicin es por intervalos, es decir,la variable cuenta con un valor 0 fijado arbitrariamente.

Por ejemplo 0C 0F

Si la variable presenta valores negativos, al calcular el coeficiente de variacin de pearson los habr que considerar como positivos

VARIABLES NORMALIZADAS O UNIDADES TIPIFICADAS

VARIABLES NORMALIZADAS O UNIDADES TIPIFICADAS Normal.............. |z| < 1 Anormal............ 1 < |z| < 2 Muy anormal...... |z| >=2 Variables normalizadas: nmero de unidades de desviacin tpica que un individuo queda por encima o por debajo de la media del grupo. Son unidades independientes de las unidades originales de medida con lo cual facilitan enormemente la comparacin. til para comparar un individuo respecto a los datos poblacionales a los que pertenece. Las unidades Z se calculan: Z= x - x S

Vous aimerez peut-être aussi