Académique Documents
Professionnel Documents
Culture Documents
teora de probabilidades
1
Contenido
Qu es la estadstica?
Qu es la teora de probabilidades?
Qu es la estadstica descriptiva?
Qu es la estadstica inferencial
2
Estadstica
Es la rama matemtica relacionada con la
coleccin, el anlisis, la interpretacin (o
explicacin) y la representacin de datos.
Teora de probabilidades vs
Estadstica
La teora de probabilidades es la rama de la
matemtica relacionada con el anlisis de
fenmenos aleatorios; esta se desarroll como
un modelo abstracto y sus conclusiones y
deducciones estn basados en axiomas.
La estadstica se basa en la aplicacin de la
teora de probabilidad a problemas reales y sus
conclusiones son inferencias basadas en
observaciones.
Ramas de la estadstica
La estadstica se divide en dos ramas:
Estadstica descriptiva
Estadstica inferencial
Estadstica descriptiva
6
Estadstica inferencial
Esta comprende los mtodos y procedimientos para
deducir propiedades (hacer inferencias) de una
poblacin, a partir de una pequea parte de la misma
(muestra). Se usa para modelar patrones en los
datos y extraer inferencias acerca de la poblacin
bajo estudio. Estas inferencias pueden tomar la
forma de respuestas a preguntas si/no (prueba de
hiptesis), estimaciones de caractersticas numricas
(estimacin), pronsticos de futuras observaciones,
descripciones de asociacin (correlacin) o
modelamiento de relaciones entre variables (anlisis
de regresin).
7
Estadstica descriptiva vs.
Estadstica inferencial
8
01 Estadstica descriptiva
9
Contenido
Definiciones bsicas
Medidas de tendencia no central
Medidas de tendencia central
Medidas de dispersin
Momentos
Representacin grfica de la informacin
Histogramas
10
Definiciones
Se quiere estudiar una poblacin. Sin embargo
por razones prcticas se analiza una muestra de
la poblacin. Los datos se coleccionan mediante
un muestreo o experimento. Las observaciones
de la muestra aleatoria se usan para calcular
ciertas caractersticas de la muestra llamadas
estadsticas.
Poblacin: es el conjunto de elementos de
referencia sobre el que se realizan todas las
observaciones. La poblacin es la coleccin de
toda la informacin que caracteriza un
fenmeno.
Muestra estadstica (o aleatoria): es un
subconjunto representativo de individuos de la
poblacin
Muestreo: es la tcnica por la cual se selecciona
una muestra a partir de una poblacin
Una estadstica es el resultado de aplicar una
funcin a un conjunto de datos.
Informacin bsica de un conjunto
de datos
Mnimo y mximo
Percentil
Tendencia central
Dispersin
Momentos
Mnimo y mximo (con MATLAB)
Mnimo y mximo (con MS EXCEL)
Medidas de posicin no central
22
Mediana
23
Mediana
24
Mediana
25
Media geomtrica
26
Media geomtrica
27
Ejemplo
28
Propiedades de la media
geomtrica
29
Media armnica
30
Ejemplo
31
Ejemplo
32
Media armnica
33
Moda
34
Media acotada (o media truncada)
35
Medidas de tendencia central en
MS EXCEL
39
Notas varias
La media armnica es siempre inferior a la media
geomtrica, que a su vez es siempre inferior a
la media aritmtica.
Ver:
http://en.wikipedia.org/wiki/Inequality_of_arithmet
ic_and_geometric_means
http://en.wikipedia.org/wiki/Pythagorean_means
40
Medidas de dispersin
La dispersin de los datos se puede atribuir a
pequeas diferencias de construccin, a mano de
obra deficiente, errores humanos, variabilidad
inherente al material, as como a errores en las
observaciones y en las mediadas.
42
Varianza y desviacin estndar
muestral
Use siempre
estas
frmulas
para calcular
la varianza y
la desviacin
estndar, a
menos que
se indique lo
contrario.
Ver: http://en.wikipedia.org/wiki/Variance
http://en.wikipedia.org/wiki/Standard_deviation 43
Varianza y desviacin estndar
poblacional
44
Correccin de Bessel
45
Recorrido o rango
46
Recorrido interdecil e intercuartil
47
Desviacin media (mean absolute deviation - MAD)
Desviacin mediana (median absolute deviation)
48
Coeficiente de variacin
(coefficient of variation - C.O.V.)
No confundir
con la
covarianza!
49
Nota final
50
Otras medidas de dispersin
Momento central de cualquier orden
http://en.wikipedia.org/wiki/Moment_(mathematics)
Diferencia media
http://en.wikipedia.org/wiki/Mean_difference
Desviacin estndar geomtrica
http://en.wikipedia.org/wiki/Geometric_standard_deviation
51
Medidas de dispersin en MS EXCEL
52
Haga Alt+F11 para
ingresar el cdigo
Insertar Mdulo
Copy+Paste cdigo
Grabar como .xlsm
54
Valor atpico (outlier)
Un valor atpico es una observacin que es
numricamente distante del resto de los datos.
Las estadsticas derivadas de los conjuntos de
datos que incluyen valores atpicos sern
frecuentemente engaosas. Por ejemplo, en el
clculo de la temperatura media de 10 objetos en
una habitacin, si la mayora tienen entre 20 y
25C, pero hay un horno a 350C, la mediana de
los datos puede ser 23, pero la temperatura
media ser 55. En este caso, la mediana refleja
mejor la temperatura de la muestra al azar de un
objeto que la media.
55
Valor atpico (outlier)
56
Sensibilidad de las medidas de
tendencia central a valores atpicos
57
Sensibilidad de las medidas de
dispersin a los valores atpicos
58
Momentos
Coeficiente de asimetra
Ver: http://en.wikipedia.org/wiki/Skewness
Curtosis
Ver: http://en.wikipedia.org/wiki/Kurtosis
59
Curtosis y coeficiente de asimetra
en MS EXCEL
Curtosis y coeficiente de asimetra
en MATLAB
Entonces
MS EXCEL 2003:
http://www.bloggpro.com/creating-histograms-in-excel/
MS EXCEL 2007:
http://www.bloggpro.com/creating-a-simple-histogram-in-excel-2007/
Percentil 80
Nmero de clases
No existe una forma nica de escoger el nmero
de intervalos. Esto por lo tanto se deja a criterio
del analista. Sin embargo, existen algunas
recomendaciones (las cuales generalmente
hacen suposiciones sobre la forma de los
datos):
El nmero de clases depende del nmero total
de observaciones
Nmero de intervalos (k)
k nmero de intervalos (clases)
h ancho del intervalo
Mi recomendacin:
Frmula de Sturges (1926): su rendimiento es
pobre si n<30
Ver: http://en.wikipedia.org/wiki/Kernel_density_estimation
Generalizacin de histograma