Académique Documents
Professionnel Documents
Culture Documents
Presentado por:
Carlos Wilfredo Soto Lopéz
Presentado a:
Luis Alberto Cáceres Torres
Programa:
Agronomía
Desviación estándar
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos
están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor
será la dispersión de los datos.
El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de
una población, mientras que s se utiliza para representar la desviación estándar de una
muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como
ruido.
La desviación estándar se puede utilizar para establecer un valor de referencia para estimar
la variación general de un proceso.
Ejemplo: Tiempos de egreso de un hospital
Considere el ejemplo siguiente. Los administradores dan seguimiento al tiempo de egreso de
los pacientes tratados en las áreas de urgencia de dos hospitales. Aunque los tiempos de
egreso promedio son aproximadamente iguales (35 minutos), las desviaciones estándar son
significativamente diferentes. La desviación estándar del hospital 1 es de aproximadamente
6. En promedio, el tiempo para dar de alta a un paciente se desvía de la media (línea
discontinua) aproximadamente 6 minutos. La desviación estándar del hospital 2 es de
aproximadamente 20. En promedio, el tiempo para dar de alta a un paciente se desvía de la
media (línea discontinua) aproximadamente 20 minutos.
Mediana
Es el valor que está en el centro de la distribución, es decir, el valor que supera a la mitad de
los de la muestra y se ve superado por la otra mitad (salvo empates en ambos casos); se
calcula buscando el valor de la muestra que ocupa el lugar (n+1)/2, con los datos ordenados.
Moda
Es el valor de la variable que tiene mayor frecuencia en la muestra, es decir, el que se repite
más (moda se asocia con lo más frecuente). En nuestro ejemplo es el valor 0, que tiene una
frecuencia absoluta de cuatro, que es la más grande. La moda puede definirse para cualquier
tipo de variables. También se puede hablar de moda local o secundaria, que sería cualquier
valor más frecuente que sus adyacentes, es decir, con más frecuencia que la que tengan el
anterior y el posterior, lo que requiere al menos orden en los datos.
Imagen tomada de https://es.wikipedia.org/wiki/Mediana_(estad%C3%ADstica)
Cuartiles
Definen las cuartas partes de la muestra mediante tres “cortes”: el primer cuartil deja por
debajo al 25% de la distribución, el segundo coincide con la mediana y el tercero deja por
debajo al 75% de la distribución. No tienen mucho sentido en muestras pequeñas, pero en
nuestro ejemplo valdrían respectivamente 0, 1 y 3.5 (que están situados en las posiciones
“tercera y media”, séptima y “décima y media” de los datos ordenados).
Percentiles
Son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las
personas cuando atienden características tales como peso, estatura, etc. Los percentiles son
ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente
iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos
ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.
Fórmula para datos agrupados:
En esta expresión:
k es el número de clases.
N es el número total de observaciones de la muestra.
Log es el logaritmo común de base 10.
Frecuencia absoluta
Es el número de veces que una modalidad o un valor de una variable aparece entre los datos
de una muestra; si en una muestra de la variable “nivel de estudios” aparecen 148 personas
con nivel de estudios “superiores”, diremos que 148 es la frecuencia absoluta de la modalidad
“superiores”. Naturalmente, el número total de datos es n y, por tanto, la suma de las
frecuencias absolutas de todas las modalidades o valores debe ser igual al tamaño muestral
n.
Frecuencia relativa
Es su frecuencia absoluta dividida entre el tamaño muestral, es decir, la proporción de veces
que aparece esa modalidad o valor entre todos los datos de la muestra; si la frecuencia
absoluta 148 del ejemplo anterior corresponde a una muestra de 2000 personas, diremos que
la frecuencia relativa de la modalidad AB es 148/2000 = 0.074.
Es claro que la suma de las frecuencias relativas de todas las modalidades o valores debe ser
1, ya que las absolutas suman n y estamos dividiendo entre n. Es muy habitual expresar las
frecuencias relativas como porcentajes (multiplicándolas por cien) y entonces la frecuencia
relativa del ejemplo sería 7.4 % y la condición de la suma sería que deben sumar 100 %, lo
que se entiende mejor (la frecuencia relativa es la parte del total de datos que corresponde a
cada valor o modalidad).
Frecuencia absoluta acumulada
La frecuencia absoluta acumulada es el resultado de ir sumando las frecuencias absolutas de
las observaciones o valores de una población o muestra. Esta se representa por las siglas Fi.
Para calcular la frecuencia absoluta acumulada, hay que calcular primero la frecuencia
absoluta (fi) de la población o muestra
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el resultado de ir sumando las frecuencias relativas de
las observaciones o valores de una población o muestra. Esta se representa por las siglas Hi.
Para calcular la frecuencia relativa acumulada, hay que calcular primero la frecuencia
absoluta (fi) y la frecuencia relativa (hi) de los valores de la población o muestra.
Tabla de frecuencias
Las Tablas de frecuencias son herramientas de Estadística donde se colocan los datos en
columnas representando los distintos valores recogidos en la muestra y las frecuencias (las
veces) en que ocurren.
- Tabla de frecuencia de datos no agrupados: Los datos no agrupados son las de observaciones
realizadas en un estudio estadístico que se presentan en su forma original tal y como fueron
recolectados, para obtener información directamente de ellos.
La Tabla de frecuencia de datos no agrupados indica las frecuencias con que aparecen los
datos estadísticos sin que se haya hecho ninguna modificación al tamaño de las unidades
originales.
En estas distribuciones cada dato mantiene su propia identidad después que la distribución
de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido
solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.
- Tabla de frecuencia de datos agrupados: La Tabla de frecuencia de datos agrupados aquella
distribución en la que los datos estadísticos se encuentran ordenados en clases y con la
frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del
conjunto se combinan para formar un intervalo de clase.
La tabla de frecuencias agrupadas se emplea generalmente si las variables toman un número
grande de valores o la variable es continua.
En este caso se agrupan los valores en intervalos que tengan la misma amplitud denominados
clases. A cada clase se le asigna su frecuencia correspondiente. La tabla de frecuencias de
datos no agrupados se emplea si las variables toman un número pequeños de valores o la
variable es discreta.
Imagen tomada de https://steemit.com/spanish/@xandra79/introduccion-a-las-tablas-de-frecuencias-y-los-graficos-
estadisticos
En este Histograma de Edad se representa la frecuencia con la que aparecen los datos de la
variable Edad. Como se trata de una variable continua, se representa en intervalos y se
interpreta así:
- En el intervalo entre 14 a 16 años hay 1 solo dato
- En el intervalo entre 16 a 18 años hay 3 datos
- En el intervalo entre 18 a 20 años hay 1 solo dato
- En el intervalo entre 20 a 22 años hay 2 datos
- En el intervalo entre 22 a 24 años hay 2 datos
- En el intervalo entre 24 a 26 años hay solo 1 dato
Graficas e Interpretación de la Variable Cuantitativa Discreta Hermanos
En este Histograma de Edad se representa la frecuencia con la que aparecen los datos de la
variable Hermanos, que por tratarse de una variable discreta no es necesario hacerlo por
intervalos, y se interpreta así:
- Para la clase 0 hermanos, hay 1 solo dato (El 10% tiene 0 hermanos)
- Para la clase 1 hermano, hay 2 datos (El 20% tiene 2 hermanos)
- Para la clase 2 hermanos, hay 2 datos
- Para la clase 3 hermanos, hay 1 solo dato
- Para la clase 4 hermanos, hay 3 datos
- Para la clase 5 hermanos, hay solo 1 dato