Académique Documents
Professionnel Documents
Culture Documents
Modalidad Semipresencial
Tabla de Contenidos
REFERENCIAS BIBLIOGRÁFICAS: 26
SESIÓN
10
DESCRIPCIÓN
El uso de las funciones estadísticas es muy útil, porque permitirá realizar un análisis estadístico,
ayudará a establecer relaciones entre los múltiples conjuntos de datos, la previsión de crecimiento
y las tendencias, predecir las ventas futuras; lo cual es de gran utilidad para los profesionales de
negocios.
CAPACIDAD
El participante al final de esta sesión estará en capacidad de procesar datos y realizar un análisis
estadístico de los datos.
TEMÁTICA
Conceptos básicos
Función Frecuencia
Medidas de tendencia central: Promedio, Moda, Mediana
Medidas de dispersión: Desviación promedio, Desviación estándar, Varianza,
Medidas de posición: Cuartiles
Herramienta análisis estadístico
1. ANÁLISIS DESCRIPTIVO UNIVARIADO CON MS EXCEL
División de la estadística
Estadística Descriptiva (Deductiva): es la encargada de la organización, condensación,
presentación de los datos en tablas y gráficos y del cálculo de medidas numéricas que
permitan estudiar los aspectos más importantes de los datos
Población:
Es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una
variable bajo estudio
Muestra:
es un conjunto de mediciones u observaciones tomadas a partir de una población.
es un subconjunto de la población
Variables:
son las características o lo que se estudia de cada individuo de la muestra. Ej: sexo, edad,
peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión,
grosor, diámetro, ...
Datos:
son los valores que toma la variable en cada caso.
Tipos de datos
Cuantitativos:
Provienen de variables que pueden medirse, cuantificarse o expresarse numéricamente.
Ejemplos:
Peso
2
Edad
Estatura
Presión
Humedad
Intensidad de un sismo
Cantidad de hermanos
Continuas: es la variable que puede tomar cualquier valor en una escala continua. Ejemplo:
cantidad de líquido contenido en un recipiente.
Escalas de medida
Escala Nominal. Variable cualitativa
Escala Ordinal.
Escala de Intervalos.
Escala de Razón o Proporción. Variable cuantitativa
Escala Absoluta.
Escala nominal:
Los datos se pueden agrupar en categorías que no mantienen una relación de orden entre sí,
por lo tanto, no están definidas las operaciones lógicas (>, <, , ) sino solo las de igualdad o
diferencia.
Ejemplos: color de ojos, sexo, profesión, estado civil, religión
Escala ordinal:
Existe un cierto orden o jerarquía entre las categorías (>, <, , ).
Ejemplos: grados militares, organigrama de una empresa, escalafón de los profesores
universitarios, grados de disnea, estadiaje de un tumor.
Escala de Intervalos:
Valores numéricos de las variables y además de las relaciones de orden (>, <, , ), se pueden
establecer distancias, es decir, tienen sentido las operaciones de suma y resta. Tiene dos
propiedades:
Existe una unidad de medida que se mantiene constante para todos los valores que toma la
variable.
Existe un valor patrón u origen relativo que no significa la ausencia de valor en la variable.
Ejemplo: temperatura, nivel de ruido, movimientos sísmicos.
Escala Absoluta:
Se caracteriza porque los valores que toma la variable son el resultado de contar y, por lo
tanto, está constituida por los enteros positivos y el cero.
3
Ejemplos: número de hermanos, cantidad de autos vendidos, cantidad de accidentes en una
intersección, cantidad de hijos.
Sintaxis
=FRECUENCIA (datos, grupos)
Donde:
Datos: rango de datos a analizar.
Grupos: rango de intervalos en los que se analizará la muestra.
Ejercicio:
Se hizo una encuesta para conocer las edades de los pacientes atendidos en el Hospital de
Neoplásicas, la muestra poblacional fue de 120 encuestados. Se pide clasificar dicha muestra
con una de amplitud de 10, considerando un límite mínimo de 29 y un límite máximo de 79,
obteniendo la frecuencia absoluta y relativa.
4
Para desarrollar esta aplicación se necesita tener la siguiente tabla de datos, donde clasificarás
la muestra y obtendrás la frecuencia Absoluta y Relativa:
Solución:
Digite en la celda K10, el dato 29 como límite del primer grupo.
Ahora, en la celda K11, ingresa el dato 39 como límite de este grupo, este valor se obtiene
sumando al límite anterior, la amplitud que es de 10; y así sucesivamente sobre el resto de
grupos. Quedará el cuadro con se muestra:
a) Seleccione la
categoría:
ESTADÍSTICA
b) Elija la función
FRECUENCIA
c) Aceptar.
d) Ingrese los
argumentos
solicitados:
DATOS y.
GRUPOS.
Por ser la Frecuencia, una función de tipo matricial, los resultados se mostrarán presionando
las teclas: CRTL+SHIFT+INTRO:
6
Calculando las frecuencias relativas:
Estas frecuencias se obtienen con la fórmula: =frecuencia Absoluta/Total muestra.
Por ello debe calcular el total de la muestra con la función SUMA:
Haga clic en la celda L16
Escriba la función: =SUMA(L10:L15) y pulsa la tecla Enter
Ahora ya puede calcular la frecuencia relativa:
Haga clic en la celda M10
Escriba la fórmula: =L10/$L$16 y pulsa la tecla Enter.
Copie la fórmula hacia abajo y veras la información completa.
7
1.3 Medidas de tendencia central:
Promedio
Devuelve el promedio (media aritmética) de los argumentos. Por ejemplo, si el rango A1:A20
contiene números, la fórmula =PROMEDIO(A1:A20) devuelve el promedio de dichos números.
Sintaxis
=PROMEDIO(número1, [número2], ...)
Donde
Número1: El primer número obligatorio, referencia de celda o rango para el cual desea el
promedio.
Número2...(Opcional): Números, referencias de celda o rangos adicionales para los que
desea el promedio, hasta un máximo de 255.
Ejercicio:
Se tiene las ventas realizadas en el primer trimestre del presente año por los vendedores de la
empresa PCMaWy S.A. Se pide obtener el promedio de ventas por vendedor.
Haga clic después del signo = y escribe exactamente lo que se muestra a continuación con
color rojo:
= PROMEDIO(D6:F6)
8
Pulse la tecla Enter para obtener el Promedio Vendedor. Ahora puede copiar la función al
resto de vendedores (arrastre desde el controlador de relleno).
Moda
Devuelve el valor más frecuente o repetitivo de una matriz o rango de datos =MODA(A2:G11)
devuelve la moda de dichas edades.
Sintaxis
=MODA(número1, [número2], ...)
Donde
Número1: El primer número obligatorio, referencia de celda o rango para el cual desea la
moda.
Número2...(Opcional): Números, referencias de celda o rangos adicionales para los que
desea la moda)
Ejercicio:
Se tiene las edades de los alumnos ingresante a la carrera de medicina de la UCV, en el
periodo 2019-0.
9
Escriba la función frecuencia, e ingrese los argumentos respectivos, como se muestra en la
imagen:
Presionar Enter y obtenemos el resultado. En este ejemplo la edad más frecuente de los
alumnos ingresantes a la carrera de Medicina es 17 años.
Mediana
10
Sintaxis
=MEDIANA(número1, [número2], ...)
Donde
Número1: El primer número obligatorio, referencia de celda o rango para el cual desea la
mediana.
Número2...(Opcional): Números, referencias de celda o rangos adicionales para los que
desea la mediana)
Ejercicio:
Se tiene las edades de los alumnos ingresante a la carrera de medicina de la UCV, en el
periodo 2019-0.
11
1.4 Medidas de dispersión:
Función DESPROM
Devuelve el promedio de las desviaciones absolutas de la media de los puntos de datos.
DESVPROM mide la dispersión de los valores en un conjunto de datos. Sintaxis
=DESVEST.P(número1; número2; ...)
Donde:
Observaciones
DESVPROM está influida por la unidad de medida de los datos especificados.
Los argumentos deben ser números, o bien nombres, matrices o referencias que
contengan números.
Se tienen en cuenta los valores lógicos y las representaciones textuales de números
escritos directamente en la lista de argumentos.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,
estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
La ecuación para la desviación media es:
Ecuación
Ejercicio:
Se tiene las edades de los alumnos ingresante a la carrera de medicina de la UCV, en el
periodo 2019-0. Calcular promedio de las desviaciones absolutas de la media
12
Presionar Enter y obtenemos el resultado.
Función DESVEST
Calcula la desviación estándar de la población total determinada por los argumentos. La
desviación estándar es la medida de la dispersión de los valores respecto a la media (valor
promedio).
Sintaxis
=DESVEST.P(número1; número2; ...)
Donde:
Número1, número2,...: son de 1 a 30 argumentos numéricos correspondientes a una
población. También puede utilizar una matriz única o una referencia matricial en lugar de
argumentos separados con punto y coma.
Se pasan por alto los valores lógicos, como VERDADERO y FALSO, y de texto. Si los valores
lógicos y el texto no se deben pasar por alto, utilice la función de hoja de cálculo DESVESTA.
Observaciones
DESVESTP parte de la hipótesis de que los argumentos representan la población total. Si sus
datos representan una muestra de la población, utilice DESVESTP para calcular la desviación
estándar.
Cuando el tamaño de las muestras es importante, las funciones DESVEST y DESVESTP
devuelven aproximadamente el mismo valor.
13
La desviación estándar se calcula utilizando los métodos "sesgado" o "n".
DESVESTP utiliza la fórmula siguiente:
Donde:
X: es la media de muestra PROMEDIO(número1,número2,…)
n: es el tamaño de la muestra.
Función DESVEST.M
Calcula la desviación estándar, según una muestra (se omiten los valores lógicos y de texto
en la muestra).
La desviación estándar es la medida de la dispersión de los valores respecto a la media (valor
promedio).
Sintaxis
=DESVEST.M(número1;[número2];...])
Donde:
Número1: Obligatorio. El primer argumento numérico correspondiente a una muestra de una
población. También puede usar una matriz única o una referencia matricial en lugar de
argumentos separados con punto y coma.
Número2; Opcional. De 2 a 254 argumentos numéricos correspondientes a una muestra de
una población. También puede usar una matriz única o una referencia matricial en lugar de
argumentos separados por comas.
Observaciones
DESVEST.M parte de la hipótesis de que los argumentos representan la muestra de una
población. Si sus datos representan la población total, use DESVEST.P para calcular la
desviación estándar.
La desviación estándar se calcula utilizando el método "n-1".
Los argumentos pueden ser números, o nombres, matrices o referencias que contengan
números.
Los argumentos que sean valores de error o texto que no se pueda traducir a números
provocan errores.
Si desea incluir valores lógicos y representaciones textuales de números en una referencia
como parte del cálculo, utilice la función DESVESTA.
DESVEST.M usa la fórmula siguiente:
Donde:
X: es la media de muestra PROMEDIO(número1;número2;…)
N: es el tamaño de la muestra.
14
Ejercicio:
Se tiene las edades de los alumnos ingresante a la carrera de medicina de la UCV, en el
periodo 2019-0. Calcular la Desviación Estándar Poblacional y la Desviación Estándar
Maestral
15
Ahora con los mismos datos vamos a calcular la Desviacion Estándar Muestral
Función
Función VAR.P
VAR.PCalcula la varianza en función de toda la población (pasa por alto los valores lógicos y el
texto de la población).
Sintaxis: VAR.P(número1,[número2],...)
Observaciones
VAR.P parte de la hipótesis de que los argumentos representan la población total. Si los datos
representan una muestra de la población, use la función VAR.S para calcular la varianza.
16
Los argumentos pueden ser números o nombres, matrices o referencias que contienen
números.
Se tienen en cuenta los valores lógicos y las representaciones textuales de números escritos
directamente en la lista de argumentos.
Si un argumento es una matriz o una referencia, solo se considerarán los números de esa matriz
o referencia. Se pasan por alto las celdas vacías, valores lógicos, texto o valores de error de la
matriz o de la referencia.
Los argumentos que son valores de error o texto que no se pueden traducir a números
provocan errores.
Si desea incluir valores lógicos y representaciones textuales de números en una referencia
como parte del cálculo, use la función VARPA.
La ecuación de VAR.P es la siguiente:
Ejercicio:
Se tiene las edades de los alumnos ingresante a la carrera de medicina de la UCV, en el
periodo 2019-0. Calcular la Varianza Poblacional.
Haga clic sobre la celda donde se calcular la VAR.P. (Ejemplo: B13) y luego digite la función
con sus argumentos respectivos.
17
Función VAR.S
Calcula la varianza de una muestra (pasa por alto los valores lógicos y el texto de la muestra).
Sintaxis: VAR.S(número1,[número2],...)
Observaciones
La función VAR.S parte de la hipótesis de que los argumentos representan una muestra
de la población. Si los datos representan la población total, use VAR.P para calcular la
varianza.
Los argumentos pueden ser números o nombres, matrices o referencias que contienen
números.
Se tienen en cuenta los valores lógicos y las representaciones textuales de números
escritos directamente en la lista de argumentos.
Si un argumento es una matriz o una referencia, solo se considerarán los números de
esa matriz o referencia. Se pasan por alto las celdas vacías, valores lógicos, texto o
valores de error de la matriz o de la referencia.
Los argumentos que son valores de error o texto que no se pueden traducir a números
provocan errores.
Con los mismos datos del ejercicio anterior vamos a calcular la Varianza Muestral
18
1.5 Medidas de posición:
CUARTIL.INC
Devuelve el cuartil de un conjunto de datos, según los valores de percentil de 0 a 1, ambos
incluidos.
Los cuartiles se usan con frecuencia en los datos de ventas y encuestas para dividir las
poblaciones en grupos. Por ejemplo, puede usar la función CUARTIL.INC para determinar el
25 por ciento de ingresos más altos en una población.
Sintaxis
=CUARTIL.INC(matriz; cuartil)
Donde:
Matriz Obligatorio. La matriz o el rango de celdas de valores numéricos cuyo cuartil desea
obtener.
Cuartil Obligatorio. Indica el valor que se devolverá.
Parámetros
SI CUARTIL ES IGUAL A LA FUNCIÓN CUARTIL.INC DEVUELVE
0 Valor mínimo
1 El primer cuartil (percentil 25)
2 El valor de la mediana (percentil 50)
3 El tercer cuartil (percentil 75)
4 Valor máximo
Observaciones
Si el argumento matriz está vacío, CUARTIL.INC devuelve el valor de error #¡NUM!
Si el argumento cuartil no es un número entero, se trunca.
Si cuartil < 0 o si cuartil > 4, CUARTIL.INC devuelve el valor de error #¡NUM!
19
Las funciones MIN, MEDIANA y MAX devuelven el mismo valor que CUARTIL.INC cuando el
argumento cuartil es igual a 0 (cero), 2 y 4 respectivamente.
20
En la ficha Datos, grupo Análisis podemos observar la opción Análisis
de datos.
Componente Descripción
Medida de variabilidad que da cuenta del grado
Varianza
de homogeneidad de un grupo de observaciones
Determina la relación o dependencia que existe
Correlación
entre dos o más variables.
Es un valor que indica el grado de variación
Covarianza
conjunta de dos variables aleatorias.
Genera un informe estadístico de una sola
variable para los datos del rango de entrada, y
Estadística descriptiva
proporciona información acerca de la tendencia
central y dispersión de los datos.
Predice un valor que está basado en el
Suavización
pronóstico del período anterior, ajustado al
exponencial
error en ese pronóstico anterior.
Prueba F para Ejecuta una Prueba F de dos muestras para
varianzas de dos comparar dos varianzas de población.
muestras
Resuelve problemas de sistemas lineales y
analiza datos periódicos, transformándolos
Análisis de Fourier
mediante el método de transformación rápida
de Fourier (FFT, Fast Fourier Transform).
21
Calcula las frecuencias individuales y
Histograma acumulativas de rangos de celdas de datos y de
clases de datos.
Proyecta valores en el período de pronósticos,
basándose en el valor promedio de la variable
Media móvil
calculada durante un número específico de
períodos anteriores.
Rellena un rango con números aleatorios
Generación de
independientes extraídos de una de varias
números aleatorios
distribuciones.
Crea una tabla que contiene los rangos ordinales
Jerarquía y percentil y porcentuales de cada valor de un conjunto de
datos.
Efectúa el análisis de regresión lineal utilizando
Regresión el método de "mínimos cuadrados" para ajustar
una línea a un conjunto de observaciones.
Crea una muestra de población tratando el
Muestreo
rango de entrada como una población.
Comprobar la igualdad de las medias de
Prueba t
población que subyacen a cada muestra.
Realiza una Prueba z en las medias de dos
Prueba z
muestras con varianzas conocidas.
Debemos de tener siempre presente que los análisis estadísticos se hacen para conocer las
características de una población a estudiar.
Horas trabajadas al mes al cabo del término de un periodo.
Cantidad de libros que extrae cada alumno de la biblioteca por semestre.
Presión atmosférica de una ciudad.
Notas obtenidas en exámenes de un alumno durante un semestre.
Distribución por edad y sexo de pacientes de un hospital.
22
Solución:
23
En el resultado, mejoraremos el aspecto visual en el análisis de ventas trimestrales de las
ciudades usando estadística descriptiva.
Componente Descripción
La media es la suma de las observaciones dividido por el
Media
número de observaciones.
24
Una estimación no sesgada de la desviación estándar de un
conjunto de datos. Debido a la desviación estándar se
Error típico calcula a partir de una muestra de una gran población de
datos, que no logra captar la verdadera dispersión de los
datos.
El valor central de datos. Es el número de la separación de la
Mediana
mitad superior de una muestra de la mitad inferior.
El valor que ocurre con mayor frecuencia en un conjunto de
Moda datos. Si no hay datos se produce más de una vez, entonces
el resultado es #N/A.
Una medida de la variabilidad o dispersión de un conjunto
Desviación
de datos. La desviación estándar aquí es la desviación
estándar
estándar de la muestra.
Otra medida de la variabilidad o dispersión de un conjunto
Varianza de la
de datos. Esto se calcula mediante la fórmula de la varianza
muestra
= (desviación estándar)2.
Mide el apuntamiento de un conjunto de datos. Curtosis
alta significa más de la varianza es debido a las desviaciones
Curtosis
extremas infrecuentes, en lugar de las desviaciones
modestos frecuentes.
Una medida de la asimetría de un conjunto en torno a su
media de datos. Si es negativo, entonces la mayoría de los
Coeficiente de
datos se concentra en el lado derecho de la media. Si es
asimetría
positivo, entonces la mayoría de los datos se concentra en
el lado izquierdo de la media.
Una medida de la dispersión de los datos, que se calcula por
Rango la diferencia entre los valores máximo y mínimo en un
conjunto de datos.
Mínimo El valor mínimo de un conjunto de datos.
Máximo El valor máximo de un conjunto de datos.
Suma La suma de todos los valores de un conjunto de datos.
Cuenta El número de observaciones en un conjunto de datos.
25
Referencias bibliográficas:
Pacheco, J. (2017). Aplicaciones prácticas con Excel 2016. Lima: Macro
Pérez, M. (2016). Windows 10 práctico. Mexico: Alfa Omega
Rathbone A (2015). Windows 10. Barcelona: Para Dummies
Peña, R; Orbegozo A. (2017). Office 2016 - Paso a paso. Mexico:Alfa Omega
Mediaactive. (2016). El Gan Libro de Office 2016. Barcelona: Marcombo
Marco, R. y Ferrari, A. (2015). Dax Patterns 2015.
http://www.aulaclic.es/excel-2016/index.htm
http://www.formacionprofesional.info/manual-excel-2016-en-pdf/
https://support.office.com/es-es/article/Gu%C3%ADas-de-inicio-r%C3%A1pido-de-
Office-2016-25f909da-3e76-443d-94f4-6cdf7dedc51e?ui=es-ES&rs=es-ES&ad=ES
https://www.youtube.com/watch?v=Rkq-EKlTY1w
https://www.youtube.com/watch?v=HFgjxwqocl4
https://www.fibao.es/media/uploads/manual_de_spss_universidad_de_celaya.pdf
https://www.ibm.com/pe-es/products/spss-statistics
ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/25.0/es/c
lient/Manuals/IBM_SPSS_Statistics_Core_System_User_Guide.pdf
26