Académique Documents
Professionnel Documents
Culture Documents
ESTADISTICA
Trata con la informacin cuantitativa o numrica.
A la informacin cuantitativa se le llaman datos
estadsticos.
La estadstica se ocupa de la recopilacin,
organizacin
presentacin,
anlisis
e
interpretacin de la informacin con el fin de
tomar decisiones.
La estadstica se divide en:
Estadstica descriptiva
Estadstica inductiva e inferencial
Estadstic
a
descriptiv
a
Estadstic
a
inductiva
e
inferencial
DEFINICIONES
Poblacin o universo: Es un conjunto de individuos o de
elementos que guardan similitud entre s en los aspectos que
son relevantes para los objetivos de la investigacin.
Poblacin de estudio: Se caracteriza por ser finita, poseer
atributos o caractersticas particulares, temporal y
geogrficamente disponible para ser estudiada.
Muestra: Es un subconjunto de la poblacin y se define
como un conjunto de elementos representativos extrados de
una poblacin.
Variables:
variables.
En
estadstica
a) Variable cuantitativa
b) Variable cualitativa
se
consideran
Son medibles
No son medibles
clases
de
Variable
Variable cuantitativa:
cuantitativa:
Son
expresadas
Son
expresadas
mediante
mediante nmeros
nmeros o
o
cantidades
y
pueden
cantidades y pueden
ser
ser de
de 2
2 clases:
clases:
Continuas:
Toman
Continuas:
Toman
cualquier
valor
dentro
cualquier valor dentro
de
de su
su recorrido.
recorrido.
Discretas:
Discretas:
nicamente
toman
nicamente
toman
valores
enteros.
valores enteros.
VARIABLES
Variable
cualitativa:
Variable
cualitativa:
Son
las
que
se
Son
las
que
se
describen
mediante
describen mediante
palabras
palabras y
y pueden
pueden
ser
de
2
clases:
ser de 2 clases:
Nominal:
Nominal: Se
Se utiliza
utiliza cuando
cuando
sus
caractersticas
se
sus
caractersticas
se
clasifican
en
varias
clasifican
en
varias
categoras
categoras y
y no
no importa
importa el
el
orden
en
el
que
se
ubiquen.
orden en el que se ubiquen.
Ordinal:
Se
utiliza
Ordinal:
Se
utiliza
cuando
sus
cuando
sus
caractersticas
son
caractersticas
son
ordenadas
de
manera
ordenadas de manera
creciente
creciente o
o decreciente.
decreciente.
RECOPILACIN DE DATOS
Existen 3 clases de datos:
a.
Datos
internos
Dentro de la institucin
b.
Datos
publicados
Primarios o secundarios
c.
Datos
provenientes
de encuesta
Por telfono
Por correo
En forma personal
ORGANIZACIN DE DATOS
Es el segundo paso en un estudio estadstico e incluye 3
pasos que son:
Revisin y correccin de los datos recopilados
Tiempo (cronolgico)
Clasificacin de los datos Lugar (geogrfico)
Cantidad (cuantitativas)
Cualidad (cualitativas)
La tabulacin de los datos
PRESENTACIN DE DATOS
En general hay 3 formas para presentar datos organizados:
Mediante palabras
Mediante tablas o cuadros estadsticos
Mediante grficas
Numeracin
Ttulo
Encabezado
Concepto o columna matriz
Cuerpo
Fuente
Nota de encabezado
GRFICAS
Es la representacin de una informacin dada
PARTES PRINCIPALES DE UNA GRFICA
Numeracin
Ttulo
Escala
Diagrama
Fuente
Nota de encabezado
Grfico
lineal
Cuantitativa
Cronolgica
Grfico de
barras
Vertical:
Cuantitativa
Cronolgica
Horizontal:
Cualitativa
Geogrfica
Grfico
circular
Cualitativa
Geogrfica
Grfica
partes
componentes
Lineal:
Cuantitativa
Cronolgica
Barras:
a. Vertical
Cuantitativa
Cronolgica
b. Horizontal
Cualitativa
Geogrfica
DISTRIBUCIN DE FRECUENCIA
Es una tabla en la cual se agrupan los valores de la variable:
En una forma individual, si se trata de una variable discreta o cualitativa.
En intervalos de clases, si se trata de una variable continua o
cuantitativa.
En ella se registra el nmero de valores observados que corresponde a cada
valor de la variable o cada intervalo de clase y recibe el nombre de
frecuencia absoluta.
Los datos organizados en una distribucin de frecuencia se denominan
datos agrupados.
Ej:
Se seleccion una muestra de 10 trabajadores para conocer su estado
civil. Los resultados fueron los siguientes: casado soltero unin libre,
casado soltero soltero, viudo unin libre casado casado.
Se ha seleccionado una muestra de 15 familias en l ciudad para conocer
el nmero de hijos que tiene, obtenindose los siguientes resultados: 2
101-2013320232-3
COEFICIENTES NUMRICOS
Las medidas numricas en estadstica son:
Medidas de
centralizaci
n
Medidas
de
posicin
Indican una vez est ordenadas, cuntas observaciones o elementos quedan a la izquierda o a la
derecha con respecto a punto dado o de referencia. Las ms utilizadas son:
- Los cuartiles
- Los deciles
- Los percentiles
Medidas
de
dispersi
n
Medidas
de forma
Proporcionan una idea sobre la variacin de los datos con respecto a una medida central
generalmente la media aritmtica. Las ms utilizadas son:
- La varianza
- La desviacin tpica o estndar
- La desviacin media
El coeficiente de variacin
MEDIA ARITMETICA
Es el principal promedio, el ms conocido, el ms utilizado y se define como
la relacin existente entre la suma de los valores de la variable y el tamao
de la muestra.
Es el valor ms representativo dentro de una serie de datos.
Datos no agrupados
Datos agrupados
LA MODA
Se define como el valor que ms se repite, dentro de una serie de datos. En
una serie de datos. En una serie de datos puede existir ms de una moda
como no puede existir ninguna.
Clculo de la moda para datos no agrupados:
Se calcula por simple inspeccin.
LA MEDIANA
Se define como el valor que esta situado en todo el centro de un conjunto
de datos. En otras palabras la mediana es aquel valor que supera al 50% de
la distribucin, pero que a su vez es superado por el 50%.
Clculo de la mediana para datos no agrupados:
Se ordenan los datos en orden de magnitud, es decir, de menor a mayor.
Si el nmero de datos es impar, la mediana ser aquel nmero que est
situado en todo el centro.
Si el nmero de datos es par, la mediana ser igual al valor promedio de
los 2 valores que est ubicados en el centro.
CUARTILES
Son los que dividen a la distribucin en 4 partes iguales.
El cuartil uno Q1: Es el valor que supera al 25% de la distribucin, pero que
a su vez es superado por el 75%.
El cuartil dos Q2: Es el valor que supera al 50% de la distribucin, pero que
a su vez es superado por el 50%.
El cuartil dos es igual a la mediana.
El cuartil tres Q3: Es el valor que supera al 75% de la distribucin, pero que
a su vez es superado por el 25%.
DECILES DK
Son los que dividen a la distribucin en 10 partes iguales.
PERCENTILES PK
Son los que dividen a la distribucin en 100 partes iguales.
MEDIDAS DE DISPERSIN
La idea de dispersin se relaciona con la mayor o menor concentracin de
los datos en torno a un valor central, generalmente la media aritmtica.
Las medidas de dispersin ms importante para la inferencia estadstica es:
La varianza
La desviacin estndar o tpica
LA VARIANZA
La varianza de una distribucin se define como la media aritmtica de los
cuadrados de las diferencias entre los valores de la variable y su media
aritmtica.
Datos no agrupados
de una muestra
Datos agrupados de
una muestra
Datos no agrupados
de una poblacin
Datos agrupados de
una poblacin
PROBABILIDAD
La probabilidad trata con los problemas de azar o aleatorios,
y se define como la relacin existente entre el nmero de
xitos y el nmero de casos posibles.
Nmero de xito
Probabilidad xito =
Nmero de casosposibles
Ejemplo:
Hallar la probabilidad de obtener un seis al lanzar un dado.
Una bolsa contiene 6 bolas blancas y 4 negras. Cul es la
probabilidad que al sacar una bola de la bolsa sea de color
blanca?
PROPIEDADES DE LA PROBABILIDAD
1) La probabilidad es un nmero mayor e igual a cero, pero
menor e igual a 1.
2) La suma de las probabilidades ser siempre igual a 1.
3) La Probabilidad de xito ms la probabilidad de fracaso es
igual a 1.
P ( xito ) + P ( No xito) = 1
P ( xito ) = 1 P( Fracaso )
DISTRIBUCIN BINOMIAL
Es una distribucin discreta de probabilidad que tiene las
siguientes caractersticas:
1) Concurren 2 eventos o sucesos, uno ser xito y otro
fracaso.
2) Los eventos son independientes.
3) La probabilidad de xito mas la probabilidad de fracaso es
igual a 1.
La funcin:
es la funcin de probabilidad binomial, que calcula la
probabilidad de x xito en n pruebas independientes.
DISTRIBUCIN DE POISSON
Es una distribucin de probabilidad discreta y se utiliza:
1) Cuando el tamao de la muestra es grande, por lo general
mayor e igual a 30.
2) La media aritmtica = n*p
3) La media aritmtica debe ser menor e igual a 10.
La funcin de:
x e-u
PX=
x!
DISTRIBUCIN NORMAL
Es una distribucin continua de probabilidad y es considerada
la mas importante. La representacin grfica de la curva
normal es en forma de campana y se llama la curva de
GAUSS.
Propiedades de la curva normal
1) El rea bajo la curva normal es igual a 1 o al 100%.
2) La distribucin normal est definida por 2 cantidades, la
media aritmtica y la desviacin estndar.
3) La distribucin normal es simtrica, las colas, es decir, los
extremos o los lados de la curva se prolongan al infinito en
ambas direcciones y nunca tocan al eje de las X.
Ejemplo:
La presin sangunea sistlica de 400 trabajadores es de
120 mm Hg, con una varianza de 81.
a) Cuntos trabajadores tienen una presin sangunea
sistlica entre 110 y 115 mm Hg?
b) Cul es la presin sangunea sistlica que por debajo de
ella se encuentra el 35% de los trabajadores?
)Los niveles de colesterol en un grupo de obreros de la
construccin tienen un promedio de 240 mg/100 ml y una
desviacin estndar de 20mg/100ml. Calcular la
probabilidad, que un individuo elegido al azar, tenga un
nivel de colesterol:
a) Entre 180 y 200 mg/100 ml
b) Entre 220 y 265 mg/100 ml
c) Por lo menos 190 mg/100 ml
d) Cul es el nivel de colesterol, tal que el 20% de todos los
obreros tengan un nivel superior a dicho valor?
probabilstico):
Presenta
las
simple:
Presenta
las
siguientes
Presenta
las
siguientes
presenta
las
siguientes
Presenta
las
siguientes
ESTIMACIN DE PARMETROS
Parmetro: Es una medida usada, para describir una caracterstica de una
poblacin.
Estadstico: Es una medida usada, para describir una caracterstica de una
muestra.
Estimacin: Es el proceso de usar un estadstico (muestral), para estimar el
correspondiente parmetro poblacional desconocido.
La estimacin de un parmetro puede ser expresada de dos maneras:
a. Una estimacin de punto
Es un nmero nico, que es usado para representar la estimacin del
parmetro.
b. Una estimacin de intervalo
Es un recorrido establecido dentro del cual podemos esperar que est el
parmetro.
TOTAL
a+b
c+d
+
Factor de riesgo (FR)
TOTAL
a+c
b+d
CONTROLES
TOTAL
EXPUESTOS
352
238
390
NO EXPUESTOS
48
122
170
400
360
560
TOTAL
Se pide:
a) Calcular el OR e interpretar el resultado.
b) Probar si existe una relacin o asociacin entre el factor
de riesgo (expuesto) y la enfermedad (casos ).
Si la poblacin es finita:
Si la poblacin es finita:
Variable cualitativa
Cuando nicamente se conoce el tamao de la poblacin
n=
N
1+NE2
PRUEBA DE HIPTESIS
Hiptesis estadstica: Es una suposicin o una conjetura concerniente a la
poblacin. Antes de aceptar o rechazar una hiptesis, todo investigador
deber probar la validez de la misma, puesto que puede o no ser
verdadera. Un medio seguro de probar la hiptesis, sera un examen de la
poblacin, sin embargo, el examen puede llegar a ser imposible. Un modo
prctico es probar la hiptesis usando una muestra de acuerdo con la teora
de la probabilidad. El resultado de la prueba conducir a un estadstico, ya
sea a aceptar la hiptesis o a rechazarla. La aceptacin o rechazo conducir
al investigador a tomar una decisin.
Divisin de la hiptesis estadstica: La hiptesis estadstica se divide en
hiptesis nula y en hiptesis alternativa.
Hiptesis nula (H0): La hiptesis que es establecida para el propsito de
posible rechazo o aceptacin se le llama hiptesis nula.
Hiptesis alternativa (H1): Cualquier hiptesis que difiere de la hiptesis
nula, es llamada una hiptesis alternativa. En una prueba dada, hay
usualmente slo una hiptesis nula, pero puede haber varias hiptesis
alternativas.
Error tipo I (): Consiste en rechazar una hiptesis nula, cuando realmente
es verdadera.
Error tipo II (): Consiste en aceptar una hiptesis nula, cuando realmente
no es verdadera.
Nivel de significacin: A la mxima probabilidad de cometer un error tipo I,
especificada en una prueba de hiptesis, es llamado nivel de significacin.
El nivel de significacin es usualmente especificado antes de que una
prueba sea hecha. En la prctica, el valor de 5% y 1% son frecuentemente
usados para establecer el nivel de significacin.
Prueba de un extremo y dos extremos
El nivel de significacin puede ser representado por una porcin del rea
bajo la curva normal de 2 maneras:
a. Prueba de 2 colas o de 2 extremos: Cuando el nivel de significacin est
representado por ambos extremos de la curva normal.
b. Prueba de una cola o un extremo: Cuando el nivel de significacin es
representado por solamente un extremo de la curva normal, las pruebas
son llamadas prueba de una cola o de un extremo.
Si no conocemos P y Q,
se trabaja con el pi de la
muestra
t=
X1 - X2 - 1- 2
1 1
S
+
n1 n2
2
z=
p1 - p2 - P1 - P2
1
1
pq
+
n1 n2
p1n1 +p2n2
p=
n1 +n2
PRUEBA CHI-CUADRADO X2
La prueba chi-cuadrado es frecuentemente usada para probar hiptesis
concernientes a la diferencia entre un conjunto de frecuencias observadas
de una muestra y un conjunto correspondiente de frecuencias tericas o
esperadas.
O = Frecuencia observada
E = Frecuencia esperada
E=np
r = N de filas
k = N de columnas
ANLISIS DE VARIANZA
Las pruebas de hiptesis z y t de student se utilizan para efectuar test de
significacin referentes a las medias de dos muestras independientes. Si
hay ms de 2 muestras, dichos test no son aplicables. Para estos casos, el
mtodo adecuado es el anlisis de varianza, que permite efectuar test de
significacin para ms de 2 muestras independientes.
El anlisis de varianza implica el clculo de la distribucin F, que se define
como el cociente o la relacin existente entre la varianza entre las medias
de las muestras y la varianza dentro de las medias.
Empleado
Planta 1
B/quilla
Planta 2
Cali
Planta 3
Medelln
85
71
59
75
75
64
82
73
62
76
74
69
71
69
75
85
82
67