Académique Documents
Professionnel Documents
Culture Documents
Probabilidad y Estadstica.
ESTADSTICA
DESCRIPTIVA
E INFERENCIAL
Ing. Gonzalo Santilln Bahamaca
1
Qu es la estadstica ?
La estadstica se ocupa de los
mtodos cientficos para :
recolectar , organizar , resumir ,
presentar y analizar datos ; as como
de sacar conclusiones vlidas y tomar
decisiones con base a este anlisis
Murray R. Spiegel & Larry J. Stephens
2
Uso de la estadstica
No existe actividad humana donde no se involucre :
3
Importancia de la estadstica
De qu sirve tener datos si no son representativos?
Qu pasa si tomo decisiones con informacin incorrecta?
Es bueno suponer informacin para su anlisis?
Hay una forma objetiva de mejorar una situacin o proceso?
Hay una forma clara de reducir riesgos y tener certidumbre ?
Puedo controlar variables sin tener su medicin?
4
Ventajas de la estadstica
El empleo correcto de la estadstica nos permite :
Visualizacin de los datos Eliminacin de incertidumbre
Integracin de comunicacin
Medicin de las variables
Optimizacin de uso de tiempo
Apoyo en las decisiones
Mejora de la eleccin
Reduccin de riesgos Eficacia de manejo de informacin
Organizacin de informacin Estmulo enfocado a resultados
Certeza Documentacin de procesos y
Reconocimiento decisiones
de alternativas Visualizacin y control de tendencias
Aceptacin de soluciones Toma de decisiones racional y objetiva
5
Definiciones bsicas
Poblacin: Conjunto de elementos que se quiere estudiar.
Habitantes de una ciudad.
Televisores fabricados en una factora.
Alumnos de primero de bachillerato.
7
Tipos de Estadstica
La Estadstica descriptiva o deductiva:
Trata del recuento, ordenacin y clasificacin de
los datos obtenidos de las observaciones:
Construccin de tablas, grficos y clculo de parmetros.
Cualitativas
(Cualidades ,
Colores
categoras o
atributos) Nominales Lugares
Profesiones
Variables Discretas Nmero de hijos
(Unidades Pginas de un libro
Cuantitati vas completas )
(Aquellas
medibles Edad
numricamente) Continuas Peso
(Cualquier Talla
valor en un Tiempo
rango) 9
Tipos de Variables Cualitativas
Dicotmicas: Slo hay dos categora, que son
excluyentes una de la otra
Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre
14
Variables cuantitativas:
Representacin grfica
15
Diferentes tipos de medidas
Las descripciones numricas de datos son
importantes. Dado un conjunto de n
observaciones :
x1 , x2 ,....., xn
La estadstica descriptiva nos ayuda
mediante el manejo de medidas de
tendencia central relativas a la posicin
de los datos y medidas de dispersin
relativas a la variabilidad de los datos.
16
Medidas de Tendencia Central
17
Media Aritmtica
x 1 x 2 ... x n
x
i 1
i
X
n n
18
Caractersticas de la media
Ventajas :
Fcil de calcular e interpretar.
En su clculo intervienen todos los datos disponibles.
Su valor es nico para una serie de datos.
Es el punto de equilibrio de la informacin.
Desventajas :
No es representativa con pocos datos
Se ve afectada por el grado de dispersin
Es poco til con datos muy heterogneos
No todos los valores contribuyen de igual forma ,los
mayores tienen ms peso
19
Mediana
x n 1 2 si n es impar
Me x
n 2 x ( n 2) 1
si n es par
2
20
Caractersticas de la mediana
Ventajas :
Valor nico que no se ve afectado por los extremos por ser
equidistante de ellos.
Se localiza a la mitad de los datos , dejando el 50 % por arriba y
el 50 % por debajo de su valor.
Es menos sensible a las variaciones de los datos.
No se ve afectada por la dispersin de los datos.
Desventajas :
No se emplea para hacer clculos
Utiliza muy poca informacin de los datos
Cuanto ms grande es la serie de datos , ms complicado se
vuelve su determinacin.
21
Moda
La moda de un conjunto de observaciones es el
valor que ms se repite, aquel cuya frecuencia
absoluta es mxima.
Puede ser nica, que haya ms de una, o que
no exista.
Cuando hay ms de una , la distribucin de los
datos se denomina acorde : bimodal , trimodal,
polimodal, etc.
22
Uso de : Media , Mediana y Moda
Nos brindan una idea muy clara de la posicin de los
parmetros dentro de una distribucin de datos.
25
Rango
El rango de la muestra es la medida de variabilidad ms sencilla entre todas las mencionadas
Como valor se define como la diferencia entre la observacin ms grande y la ms pequea :
Indica el ancho, recorrido o amplitud de valores . Tiene como sus lmites el valor mayor y el
menor en la distribucin de datos.
r xmax xmin
26
Caractersticas del rango
Ventajas :
Fcil de determinar e interpretar.
Nos indica los lmites de nuestra informacin.
Nos permite visualizar la amplitud de dispersin
de los valores de forma sencilla.
Desventajas :
Ignora toda la informacin de la muestra
No mide el grado de dispersin , solo su ancho
No nos da una idea detallada de la informacin
de las observaciones.
27
Varianza
(x x)
i
2
s
2 i 1
n
28
Caractersticas de la Varianza
Ventajas :
Fcil de calcular mediante su frmula.
Indica el grado y forma de dispersin de los
datos con respecto a la media.
Depende de todas las mediciones.
Desventajas :
Es imprctica por ser un trmino cuadrtico de
poco sentido en la realidad.
Es un nmero muy grande de referencia
matemtica , pero sin valor concreto y de difcil
manejo comparativo.
29
Desviacin estndar
(x x)
i
2
i 1
n
30
Caractersticas de la Desviacin Estndar
Ventajas :
Fcil de calcular mediante su frmula y particularmente en
hojas de clculo como Excel que lo hacen de forma
automtica.
Indica el grado y forma de dispersin de los datos con
respecto a la media.
Depende de todas las mediciones.
Muy prctica por usar los mismos valores de las unidades
que se analizan.
Un valor grande indica que los datos se alejan mucho de la
media y un valor pequeo indica que se acercan a la media.
Desventajas :
Si hacemos el clculo manual , es complicado.
31
Utilidad de las medidas de dispersin
Las medidas centrales solo nos indican el valor medio
alrededor del cual se agrupan nuestros datos , pero las
de dispersin nos detallan la variacin de las
observaciones en cuanto a forma y extensin.
32
Medidas de Distribucin
g1 i 1
s3
34
Simetra y Asimetra
Los resultados pueden ser los siguientes:
g1 = 0 (distribucin simtrica;
existe la misma concentracin de
valores a la derecha y a la
izquierda de la media)
n
(1 / n)( ( xi x ) 4
g2 i 1
4
3
s
36
Curtosis
37
Tipos de Curtosis
38
Ejemplo prctico de Alfredo Casas
Se tiene informacin del consumo promedio de agua de
los huspedes de un hotel segn la temporada :
CONSUMO($)
MES PROMEDIO
POR HUESPED
ENERO 30
FEBRERO 45
MARZO 50
ABRIL 58
MAYO 65
JUNIO 110
JULIO 100
AGOSTO 120
SEPTIEMBRE 50
OCTUBRE 60
NOVIEMBRE 45
DICIEMBRE 35
TOTAL 768
39
Ejemplo prctico de Alfredo Casas
40
Ejemplo prctico de Alfredo Casas
Interpretacin :
Cada huesped consume $ 64 en promedio por mes
Los datos NO son simtricos , se desplazan ligeramente
hacia la derecha con un sesgo positivo , solo con ver que la
mediana es inferior a la media.
Aunque la frmula solo indica un dato de moda, tenemos dos
nmeros que se repiten dos veces : 45 y 50 , por lo que la
distribucin es de tipo bimodal.
El rango de consumo es de 90 unidades , entre el lmite
inferior de 30 y el superior de 120
La desviacin estndar no es grande comparativamente ,
lo que indica que los datos no se alejan tanto de la media.
El valor de simetra g1 > 0 , nos indica una distribucin
asimtrica positiva porque existe mayor concentracin de
valores a la derecha de la media que a su izquierda.
En cuanto a la curtosis con valor de de -0.32 (g2 < 0 ) nos
confirma una distribucin platicrtica porque presenta un
reducido grado de concentracin alrededor de los
valores centrales de la variable.
41
Grfico del ejemplo de Alfredo
Desviacin
Estndar
Rango
Media
Mediana
Moda
42
BIBLIOGRAFA
43