Vous êtes sur la page 1sur 49

Tema

1. Estads-ca Descrip-va

Estads-ca Descrip-va Unidimensional

Dep. Estads-ca e IO Aplicadas y Calidad, Universidad Politcnica de Valencia

Tema 1. Estads-ca Descrip-va


1
Unidimensional
ndice
1. Introduccin
2. Conceptos bsicos
3. Distribuciones de frecuencias
4. Representaciones grcas I
4.1 Diagrama de barras
4.2 Diagrama de sectores
4.3 Histogramas
5. Medidas numricas
5.1 Medidas de posicin
5.2 Medidas de dispersin
5.3 Medidas de forma
6. Representaciones grcas II
6.1 Diagrama de caja-bigotes

Tema 1. Estads-ca Descrip-va


2
Unidimensional
1. Introduccin
La Estads-ca -ene un doble obje-vo :
La generacin y recopilacin de datos que
contengan informacin relevante sobre un
problema determinado.
El anlisis de dichos datos, con el n de
extraer informacin de ellos.

Tema 1. Estads-ca Descrip-va


3
Unidimensional
1. Introduccin
Conjunto de datos : Datos obtenidos a travs
de observaciones reales, encuestas,
experimentos, etc., normalmente arreglados
en forma de tabla (las y columnas), de
manera que :
Cada la representa un individuo, un caso, una
observacin real (un elemento de la muestra).
Cada columna representa una caracters-ca
observada, registrada o calculada para ese
elemento.
Tema 1. Estads-ca Descrip-va
4
Unidimensional
1. Introduccin

Tema 1. Estads-ca Descrip-va


5
Unidimensional
2. Conceptos bsicos
Poblacin: Conjunto de objetos sobre los que
se est interesado, sobre los que se desea
obtener conclusiones.
Ejemplo: Todas las piezas que se van a fabricar
durante una orden de fabricacin.

Muestra: Subconjunto cons-tuido por parte


de los objetos de una poblacin.
Ejemplo: 20 piezas producidas durante esa
orden de fabricacin.

Tema 1. Estads-ca Descrip-va


6
Unidimensional
2. Conceptos bsicos
Caracters-cas aleatorias: Sobre los individuos
de una poblacin pueden observarse diversas
caracters-cas o propiedades. Si el valor de la
caracters-ca no puede ser conocido de
antemano con certeza, diremos que la
caracters-ca es aleatoria.
Ejemplo: La longitud de una pieza.

Tema 1. Estads-ca Descrip-va


7
Unidimensional
2. Conceptos bsicos
Tipos de variables:
Naturaleza
Cualita-vos: Cualidad del objeto
Cuan-ta-vos: Que se puede contar o medir
Nmero de caracters-cas:
Unidimensionales
K-dimensionales: K variables se miden sobre los individuos de
una nica poblacin
Conjunto de valores
Discretos: N de valores nito o innito numerable
Con-nuos: Pueden tomar un n innito de valores dentro de un
intervalo

Tema 1. Estads-ca Descrip-va


8
Unidimensional
Ejemplos
Ejercicio 1.
Indicar para cada una de las siguientes caracters-cas
cules son cualita-vas, cuan-ta-vas discretas y
cuan-ta-vas con-nuas:
Temperatura de un mostrador frigorco
Nmero de anuncios emi-dos en un intermedio
publicitario
Tiempo necesario para la fabricacin de una pieza
Nivel cultural dominante entre los lectores habituales de
una revista
Pulsaciones por minuto

Tema 1. Estads-ca Descrip-va


9
Unidimensional
Ejemplos
Ejercicio 2.
Indicar para cada uno de los siguientes ejemplos cules
son variables unidimensionales o bidimensionales:
Las estaturas del marido y de la mujer en los matrimonios
jvenes de un pas
La estatura y peso de una persona
El contenido de leucocitos en la sangre de individuos
alcohlicos y no alcohlicos
El contenido en zumo y calibre de las naranjas de una
huerta

Tema 1. Estads-ca Descrip-va


10
Unidimensional
2. Conceptos bsicos
Hay que tener claro:
Poblacin
Muestra
Variable aleatoria
Datos Estads-cos

muestreo
(caracterstica
observada) muestra
Poblacin
Conclusiones
(Razonamiento estadstico)

Tema 1. Estads-ca Descrip-va


11
Unidimensional
2. Conceptos bsicos
ESTADSTICA DESCRIPTIVA:
El tratamiento de los datos estads-cos, para poner
de maniesto sus cualidades ms relevantes y
sinte-zarlas en unas pocas medidas (parmetros) o
mediante representaciones grcas adecuadas
INFERENCIA ESTADSTICA:
Proceso de razonamiento por el que se ob-enen
conclusiones (con un margen de error conocido)
sobre la Poblacin, a par-r del anlisis de muestras
extradas de ella.

Tema 1. Estads-ca Descrip-va


12
Unidimensional
2. Conceptos bsicos
Maneras de describir los datos:
- Distribucin de frecuencias
- Medidas numricas
- Grcos

Tema 1. Estads-ca Descrip-va


13
Unidimensional
3. Distribucin de frecuencias
Si tenemos muchos datos, es interesante agruparlos en
forma de tabla para condensar la informacin
Distribucin de frecuencias: Conjunto de valores que
toma una variable estads-ca con sus respec-vas
frecuencias.
Se representa mediante tablas de frecuencia

Tema 1. Estads-ca Descrip-va


14
Unidimensional
3. Distribucin de frecuencias
Datos sin agrupar:
Variable cualita-va o cuan-ta-va discreta

Tabla de Frecuencias para SEXO

------------------------------------------------------------------------
Frecuencia Frecuencia Frecuencia
Clase Valor Frecuencia Relativa Acumulativa Acum.Rel.
------------------------------------------------------------------------
1 1 135 0,6818 135 0,6818
2 2 63 0,3182 198 1,0000
------------------------------------------------------------------------

Tema 1. Estads-ca Descrip-va


15
Unidimensional
3. Distribucin de frecuencias
Datos agrupados por intervalos
Variable cuan-ta-va con-nua y discreta con
muchos valores

Tema 1. Estads-ca Descrip-va


16
Unidimensional
Ejemplo
Ejercicio. Completa la tabla de frecuencia con los datos que faltan.

Tema 1. Estads-ca Descrip-va


17
Unidimensional
4. Representaciones Grcas
Las representaciones grcas nos ayudan de una manera
rpida y visual a entender la informacin que tenemos
Para variables cualita-vas y cuan-ta-vas con pocos valores
diferentes:
Diagrama de barras
Diagrama de sectores o de tarta
Para variables cuan-ta-vas con muchos valores diferentes:
Histograma
Diagrama de caja (box-and-whisker)

Tema 1. Estads-ca Descrip-va


18
Unidimensional
4.1 Diagrama de barras
Diagrama de barras. Procedimiento
Dibujaremos una barra por cada valor diferente observado en la muestra
La altura de la barra coincidir con la frecuencia (absoluta o rela-va) de
ese valor
Grco de Pareto: caso par-cular, donde se han ordenado los dis-ntos
valores de la caracters-ca de mayor a menor frecuencia

Tema 1. Estads-ca Descrip-va


19
Unidimensional
4.2 Diagrama de sectores
Diagrama de sectores. Procedimiento
Dibujamos un crculo, y repar-mos su supercie en
sectores o reas proporcionales a las frecuencias
observadas para cada valor en la muestra

Tema 1. Estads-ca Descrip-va


20
Unidimensional
4.3 Histograma

Tema 1. Estads-ca Descrip-va


21
Unidimensional
4.3 Histograma

Tema 1. Estads-ca Descrip-va


22
Unidimensional
Utilidades del Histograma
1 1.- Frecuencia anmala de un valor 2
2.- Medidas inconsistentes
3.- Mezclas de poblaciones distintas
4.- Datos artificialmente modificados
5.- Asimetra
6.- Datos anmalos

Medidas inconsistentes
Frecuencia anmala de un valor (Diagrama en forma de peine)
(error sistemtico en el registro de 3
datos)

4 5

Datos truncados:
Histograma en acantilado
Histograma asimtrico
6

Datos anomalos
4.3 Histograma
Una variante del histograma es el polgono o diagrama
de frecuencias acumuladas.

Tema 1. Estads-ca Descrip-va


24
Unidimensional
5. Medidas numricas
Para realizar comparaciones entre las
variables, a veces necesitamos unas medidas
numricas (parmetros):
Medidas de posicin: donde est situada la
variable
Medidas de dispersin: cul es su dispersin o
variabilidad
Medidas de forma: simetra y apuntamiento

Tema 1. Estads-ca Descrip-va


25
Unidimensional
5.1 Medidas de posicin
Estudiaremos las siguientes:
Media
Mediana
Moda
Percen-les / Cuar-les

Tema 1. Estads-ca Descrip-va


26
Unidimensional
5.1 Medidas de posicin
Media
Se calcula:

Propiedades: siendo a,b,c valores ctes

Media(aX+bY+c)=a Media(X) +b Media (Y)+ c

Medida poco robusta frente a la asimetra


se ve inuenciada por los valores extremos
Tema 1. Estads-ca Descrip-va
27
Unidimensional
Ejemplo
Ejercicio. Media Mediana :
Supongamos que tomamos 19 personas al azar, y les preguntamos
cuanto dinero llevan encima en ese momento. Las respuestas
obtenidas (en euros) son las siguientes:
5 10 7 6,5 4 2 1.500 3 9,5 4,5
5 6 7,5 9 8 8,5 3,5 4 4,5
nota: haba una persona que acababa de salir del banco

- Calcula la media de los valores recogidos.


-Crees que la media recoge bien la posicin de los datos
muestrales?

Tema 1. Estads-ca Descrip-va


28
Unidimensional
5.1 Medidas de posicin
Mediana
Representa la idea del valor central
No es tan sensible a los valores extremos como la
media
Ordenando los datos de menor a mayor, se calcula:
Si n es impar: = Dato Central
Si n es par: =Valor medio de los dos datos centrales
Es el valor que deja por debajo de l el 50% de los
datos

Tema 1. Estads-ca Descrip-va


29
Unidimensional
5.1 Medidas de posicin
Moda
Se dene como el valor de la variable X para el que
se alcanza un mximo rela-vo de la distribucin de
frecuencias
La moda puede ser nica (unimodal) o pueden
exis-r varias (mul-modal)

Tema 1. Estads-ca Descrip-va


30
Unidimensional
5.1 Medidas de posicin
Percen-les
Ordenados los datos de menor a mayor, el percen-l
p representa el valor que deja por debajo un p% de
los datos: xp
Cuar-les: corresponden a los percen-les 25,50 y 75
Si p=25 X25 = C1
Si p=50 X50 = C2: es por denicin la mediana
Si p=75 X75 = C3

Tema 1. Estads-ca Descrip-va


31
Unidimensional
5.1 Medidas de posicin

EJEMPLO:
TABLAS DE PERCENTILES:
NIOS DE 0 A 2 AOS

Tema 1. Estads-ca Descrip-va


32
Unidimensional
Ejemplo
Ejercicio. La norma-va vigente ja unas tolerancias inferiores respecto al
peso mnimo de los paquetes de cacahuetes, imponiendo sanciones en caso
de incumplimiento de las mismas. As, para los paquetes de 250 gr. se ja que
como mximo el 5% de los paquetes puede tener un peso inferior a 241 gr.
Se cumple la norma-va para este formato?

Resumen de Procedimiento
Datos: GRS250
100 valores comprendidos desde 234,75 hasta 268,94
Resumen Estads-co para GRS250
Frecuencia = 100 Media = 251,472 Varianza = 61,9362
Percen-les para GRS250
1,0% = 235,06 5,0% = 237,875 10,0% = 240,6
25,0% = 246,365 50,0% = 251,245 75,0% = 256,61
90,0% = 261,93 95,0% = 266,0 99,0% = 268,825

Tema 1. Estads-ca Descrip-va


33
Unidimensional
Ejemplo
Ejercicio. Calcula la Media y la Mediana de las siguientes alturas
tomadas aleatoriamente de un grupo de alumnos:

1,64 | 1,66 | 1,74 | 1,86 | 1,87 | 1,69 | 1,65 |


1,71 | 1,68 | 1,70 | 1,62 | 1,84 | 1,61

Tema 1. Estads-ca Descrip-va


34
Unidimensional
5.2 Medidas de dispersin
Los parmetros de posicin NO permiten describir
totalmente como es un conjunto de datos.

Ejemplo. Cul es la nota media de un examen en la que la mitad de los alumnos


han sacado un 0 y la otra mitad un 10?Y si todos han sacado un 5?

Ejemplo. Para una persona que no sabe nadar es suciente saber que la
profundidad media de un lago es 1,40 metros para lanzarse al bao en el mismo?
Aclarara mucho el conocer adems la profundidad mediana del lago?

Tema 1. Estads-ca Descrip-va


35
Unidimensional
5.2 Medidas de dispersin
Estudiaremos las siguientes:
Rango
Recorrido intercuarblico
Varianza
Desviacin
Coeciente de variacin

Tema 1. Estads-ca Descrip-va


36
Unidimensional
5.2 Medidas de dispersin
Rango o recorrido
Diferencia entre el valor mximo y mnimo de
los datos: R= Xmax- Xmin
Es sensible a los valores extremos
Se suele usar con muestras pequeas
Rango intercuarblico
Diferencia entre el primer y tercer cuar-l de los
datos: RI=C3 - C1
Es ms robusto que el anterior a los valores
extremos
Tema 1. Estads-ca Descrip-va
37
Unidimensional
5.2 Medidas de dispersin
Varianza muestral (cuasivarianza)

Desviacin bpica muestral (cuasidesviacin)

Tema 1. Estads-ca Descrip-va


38
Unidimensional
5.2 Medidas de dispersin
Propiedades de la Varianza
Siendo a,b valores ctes
Varianza (a+bX) = b2 Varianza(X)
puede ser
Varianza (X+Y) Varianza(X)+Varianza (Y)

Unidades de la Varianza y la Desviacin wpica


Unidades de la Varianza unidades de la variable al cuadrado
Unidades de la Desviacin wpica las mismas unidades de la
variable

Tema 1. Estads-ca Descrip-va


39
Unidimensional
Desviacin wpica en una variable Gaussiana (Normal)

68.27% 95.45%

99.73%
Ejemplo
Ejercicio. Calcula la desviacin wpica para los datos del ejemplo del
dinero.

Ejercicio. Calcula la desviacin wpica de la muestra de alturas del


ejemplo.

Tema 1. Estads-ca Descrip-va


41
Unidimensional
5.2 Medidas de dispersin
Coeciente de variacin
Adimensional

Cuando hace falta un parmetro de dispersin que no


dependa de las unidades.

Tema 1. Estads-ca Descrip-va


42
Unidimensional
5.3 Medidas de forma
Los coecientes de asimetra y curtosis son
parmetros de forma.
Los dos, usados conjuntamente, permiten
comprobar si nuestros datos se parecen lo
suciente a una campana de Gauss (distribucin
Normal)

Tema 1. Estads-ca Descrip-va


43
Unidimensional
5.3 Medidas de forma
Coeciente de variacin:
Indicador de la simetra de la distribucin

CA = 0
media =mediana

CA < 0 CA > 0
NEGATIVA POSITIVA
media mediana mediana media

Muestra CA y CA tipificado
Poblacin CA
n=tamao de muestra
Tema 1. Estads-ca Descrip-va
44
Unidimensional
5.3 Medidas de forma
Coeciente de curtosis:
Indicador del grado de apuntamiento de la
distribucin (alejamiento de la normalidad)

CC>0 LEPTOCURTICA DATOS AISLADOS y/ ANMALOS?


CC<0 PLANICURTICA DATOS CENSURADOS?
Tema 1. Estads-ca Descrip-va
45
Unidimensional
6.1 Diagrama de caja y bigotes
Diagrama de caja y bigotes (Box and Whisker)
Sirve para representar las principales caracters-cas de dispersin y
posicin de un conjunto de datos
Procedimiento : Dibujaremos una caja y unos bigotes laterales.
Caja :
Lado izquierdo (C1) y Lado derecho (C3) Anchura (Rango intercuarwlico)
Lnea ver-cal : C2 (Mediana)
Punto o cruz : Media (opcional)
Bigotes :
la longitud mxima de cada bigote ser 1,5 veces la anchura de la caja.
Cada bigote se ex-ende hasta el ul-mo valor observado que NO supere dicha
distancia.
Los valores mas alejados, si los hay, se representan con puntos. Se
consideraran valores anmalos, o simplemente aislados.

Tema 1. Estads-ca Descrip-va


46
Unidimensional
6.1 Diagrama de caja y bigotes

Tema 1. Estads-ca Descrip-va


47
Unidimensional
6.1 Diagrama de caja y bigotes
Diagrama de caja y bigotes (Box and Whisker)
Permite detectar:
Asimetras
Datos anmalos
Datos aislados
Diferencias entre grupos
A la vista de un diagrama de caja, podemos conocer:
Los cuar-les y la mediana (y la media, si esta dibujada)


El rango intercuarwlico: el 50% central
Si las observaciones -enen forma simtrica o no

Tema 1. Estads-ca Descrip-va


48
Unidimensional
6.1 Diagrama de caja y bigotes

Tema 1. Estads-ca Descrip-va


49
Unidimensional