Académique Documents
Professionnel Documents
Culture Documents
Aplicar
apropiadamente
los
mtodos
estadsticos
en
la
NTRODUCCION
NDICE
UNIDAD 3
ESTADISTICA DESCRIPTIVA
UNIDAD 3
ESTADISTICA DESCRIPTIVA
Estudio formal sobre la toma de decisiones. Los estudios de casos reales, que se
sirven de la inspeccin y los experimentos, se denominan teora descriptiva de
decisin; los estudios de la toma de decisiones racionales, que utilizan la lgica y
la estadstica, se llaman teora preceptiva de decisin. Estos estudios se hacen
ms complicados cuando hay ms de un individuo, cuando los resultados de
diversas opciones no se conocen con exactitud y cuando las probabilidades de los
distintos resultados son desconocidas. La teora de decisin comparte
caractersticas con la teora de juegos, aunque en la teora de decisin el
"adversario" es la realidad en vez de otro jugador o jugadores.
POBLACIN
El concepto de poblacin en estadstica va ms all de lo que comnmente se
conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de
personas u objetos que presentan caractersticas comunes. "Una poblacin es un
conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones".
Cuando el nmero de elementos que integra la poblacin es muy grande, se
puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de
todos los nmeros positivos. Una poblacin finita es aquella que est formada por
un limitado nmero de elementos, por ejemplo; el nmero de estudiante del
Ncleo San Carlos de la Universidad Nacional Experimental Simn Rodrguez.
Cuando la poblacin es muy grande, es obvio que la observacin de todos los
elementos se dificulte en cuanto al trabajo, tiempo y costos necesarios para
hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica. Es
a menudo imposible o poco prctico observar la totalidad de los individuos, sobre
MUESTRA ALEATORIA
Una tabla, grfico o expresin matemtica que de las probabilidades con que una
variable aleatoria toma diferentes valores, se llama distribucin de la variable
aleatoria.
Como vimos anteriormente, la inferencia estadstica se relaciona con las
conclusiones que se pueden sacar acerca de una poblacin de observaciones
basndose en una muestra de observaciones. Entonces intervienen las
probabilidades en el proceso de la seleccin de la muestra; en este caso se desea
saber algo sobre una distribucin con base en una muestra aleatoria de esa
distribucin.
De tal manera vemos que trabajamos con muestras aleatorias de una poblacin
que es mas grande que la muestra obtenida; tal muestra aleatoria aislada no es
mas que una de muchas muestras diferentes que se habran podido obtener
mediante el proceso de seleccin. Este concepto es realmente importante en
estadstica.
La distribucin de un estadgrafo en todas las muestras aleatorias de tamao n
tomadas de una poblacin, se llama distribucin muestral del estadgrafo para
muestras aleatorias de tamao n.
Para muestras aleatorias de tamao n de toda poblacin base, la media de la
distribucin muestral de la media muestral, es la media de la poblacin de base.
Para muestras aleatorias de tamao n de toda poblacin base, la varianza de la
distribucin muestral de la media muestral, es s2/ n que es la varianza de la
poblacin de base dividida por el tamao de la muestra.
Para muestras aleatorias de tamao n de toda poblacin de base, la media de la
distribucin muestral de la varianza muestral s2, es la varianza s2 de la poblacin
de base.
PARMETROS ALEATORIOS
Una tabla, grfico o expresin matemtica que d las probabilidades con que una
variable aleatoria toma diferente valores, se llama distribucin de la variable
aleatoria.
De tal manera vemos que trabajamos con muestras aleatorias de una poblacin
que es ms grande que la muestra obtenida; tal muestra aleatoria aislada no es
ms que una de muchas muestras diferentes que se habran podido obtener
mediante el proceso de seleccin. Este concepto es realmente importante en
estadstica.
FRECUENCIA DE CLASE
Marca de clase (punto medio): punto que divide a la clase en dos partes iguales.
Es el promedio entre los lmites superior e inferior de la clase.
Intervalo de clase: para una distribucin de frecuencias que tiene clases del mismo
tamao, el intervalo de clase se obtiene restando el lmite inferior de una clase del
lmite inferior de la siguiente.
FRECUENCIA RELATIVA
LIMITES
Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre
los cuales van a estar los valores de los datos agrupados en ese intervalo de
clase.
Media aritmtica:
Es uno de los promedios de mayor utilizacin. Su generalizacin se debe a las
propiedades que posee, que la convierten en un indicador muy representativo.
Se obtiene sumando los productos de cada valor de la variable por su respectiva
frecuencia, y dividiendo esta suma por el total de observaciones.
MEDIANA EN ESTADISTICA
Mediana:
Es el valor de la variable que divide a la distribucin de frecuencias en dos partes
iguales.
Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas
se contrarrestan con las negativas.
Para resolver este problema, tenemos dos caminos:
Tomar el valor absoluto de las desviaciones. Desviacin media Elevar al cuadrado
las desviaciones. Varianza.
Varianza:
Nmero de
clases
Menos de 50
5a7
50 a 99
6 a 10
100 a 250
7 a 12
250 en adelante
10 a 20
El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para
establecer el nmero de clases en las que se van a agrupar los datos, existen
otros para hacerlo.
Para formar la primera clase, se pone como lmite inferior de la primera clase un
valor un poco menor que el dato menor encontrado en la muestra y posteriormente
se suma a este valor C, obteniendo de esta manera el lmite superior de la primera
clase, luego se procede a obtener los lmites de la clase siguiente y as
sucesivamente.
Ejemplo:
Los siguientes datos se refieren al dimetro en pulgadas de un engrane.
6.75
7.00
7.00
6.75
6.50
6.50
7.15
7.00
6.50
6.50
6.50
6.25
6.25
6.50
6.65
7.00
7.25
6.70
6.00
6.75
6.00
6.75
6.75
7.10
7.00
6.70
6.50
6.75
6.25
6.65
6.75
7.10
7.25
6.75
6.25
6.25
7.00
6.75
7.00
7.15
Solucin:
a)
Agrupando datos;
1.
2.
3.
k=6
C=R/k=1.25/6=0.2083=.21
4. Formando clases.
Es aquella distribucin que indica las frecuencias con que aparecen los datos
estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se
haya hecho ninguna modificacin al tamao de las unidades originales. En estas
distribuciones cada dato mantiene su propia identidad despus que la distribucin
de frecuencia se ha elaborado. En estas distribuciones los valores de cada
variable han sido solamente reagrupados, siguiendo un orden lgico con sus
respectivas frecuencias.
1.- Rango o Amplitud total (recorrido).- Es el lmite dentro del cual estn
comprendidos todos los valores de la serie de datos, en otras palabras, es el
nmero de diferentes valores que toma la variable en un estudio o investigacin
dada. Es la diferencia entre el valor mximo de una variable y el valor mnimo que
sta toma en una investigacin cualquiera. El rango es el tamao del intervalo en
el cual se ubican todos los valores que pueden tomar los diferentes datos de la
serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos
ambos extremos. El rango de una distribucin de frecuencia se designa con la
letra R.
Para organizar los valores de la serie de datos hay que determinar un nmero de
clases que sea conveniente. En otras palabras, que ese nmero de intervalos no
origine un nmero pequeo de clases ni muy grande. Un nmero de clases
pequeo puede ocultar la naturaleza natural de los valores y un nmero muy alto
puede provocar demasiados detalles como para observar alguna informacin de
gran utilidad en la investigacin.
Los intervalos de clase pueden ser de tres tipos, segn el tamao que estos
presenten en una distribucin de frecuencia: a) Clases de igual tamao, b) clases
desiguales
5.-Frecuencia de clase
La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las
clases de una distribucin de frecuencia de clase entre el nmero total de datos(N)
de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se
multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).
7.-Frecuencias acumuladas
La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las
fa de las diferentes clases que integran una distribucin de frecuencia de clase
LS Frecuencia
Marca de
clase
Lmite real
inferior
Lmite real
superior
Frecuencia
relativa
Frecuencia
Relativa
acumulada
5.97
6.18
6.075
5.97-0.005= 6.18+0.005
=
5.965
6.185
2/40 = 0.05
0.05
6.19
6.40
6.295
6.185
6.405
5/40=0.125
0.175
6.41
6.62
6.515
6.405
6.625
0.175
0.350
6.63
6.84
13
6.735
6.625
6.845
0.325
0.675
6.85
7.06
6.955
6.845
7.065
0.175
0.850
7.07
7.28
7.175
7.065
7.285
0.15
1.000
Total
40
1.000
3.9 Histogramas
En estadstica, un histograma es una representacin grfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a
la frecuencia de los valores representados. En el eje vertical se representan las
frecuencias, y en el eje horizontal los valores de las variables, normalmente
sealando las marcas de clase, es decir, la mitad del intervalo en el que estn
agrupados los datos.
Se utilizan para variables continuas o para variables discretas, con un gran
nmero de datos, y que se han agrupado en clases.
Se utiliza cuando se estudia una variable continua, como franjas de edades o
altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir,
valores continuos. En los casos en los que los datos son cualitativos (nonumricos), como sexto grado de acuerdo o nivel de estudios, es preferible
un diagrama de sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas
que en ciencias naturales y exactas. Y permite la comparacin de los resultados
de un proceso.
Tipos de histograma
Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra
la cual es proporcional a la frecuencia simple de la categora que representa.
Diagramas de barras compuesta
Se usa para representar la informacin de una tabla de doble entrada o sea a
partir de dos variables, las cuales se representan as; la altura de la barra
representa la frecuencia simple de las modalidades o categoras de la variable y
esta altura es proporcional a la frecuencia simple de cada modalidad.
Diagramas de barras agrupadas
Construccin de un histograma
Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato
menor.
Paso 2
Obtener los nmeros de clases, existen varios criterios para determinar el nmero
de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de
ellos es exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de cmo estn los datos y cuntos sean. Un criterio usado
frecuentemente es que el nmero de clases debe ser aproximadamente a la raz
cuadrada del nmero de datos. Por ejemplo, la raz cuadrada de 30 ( nmero de
artculos) es mayor que cinco, por lo que se seleccionan seis clases.
Paso 3
Establecer la longitud de clase: es igual al rango dividido por el nmero de clases.
Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los
datos en relacin al resultado del PASO 2 en intervalos iguales.
Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma
amplitud, se hace un grfico de barras, las bases de las barras son los intervalos
de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de
la base superior de los rectngulos se obtiene el polgono de frecuencias.