Vous êtes sur la page 1sur 27

OBJETIVOS GENERALES:

Comprender la importancia del estudio de la historia de la


estadstica, para lo cual es necesario un recorrido por sus
conceptos, mtodos e importancia y ms definiciones, con el fin
de acercarnos un poco ms al tema de la Estadstica.

Conocer sobre el tema con el cual se trabajara a lo largo del


semestre.

Aplicar

apropiadamente

los

mtodos

estadsticos

en

la

recoleccin de informacin y procesos matemticos bsicos en


clculos estadsticos.

Adquirir los conocimientos y habilidades sobre el tema, ser


capaz de reconocer los elementos habituales de la estadstica

Aplicar los fundamentos bsicos para realizar un buen trabajo


en clase.

NTRODUCCION

En el presente ensayo se refiere al tema de la Estadstica, que se


puede definir es la ciencia cuyo objetivo es reunir una informacin para
facilitar al hombre el estudio de datos masivos de individuos, grupos,
series de hechos, etc. y deducir de ello gracias al anlisis de estos
datos unos significados precisos o unas previsiones para el futuro.

Tambin se refiere a la importancia, mtodos e importancia de la


estadstica ya que est relacionada con el estudio de proceso cuyo
resultado es ms o menos imprescindible y con la finalidad de obtener
conclusiones para tomar decisiones razonables de acuerdo con tales
observaciones

La Estadstica se ocupa de los mtodos cientficos para recolectar,


organizar, resumir, presentar y analizar datos, as como de sacar
conclusiones vlidas y tomar decisiones con base en este anlisis, as
tambin realizar predicciones a cerca del conjunto del cual se han

seleccionado dichos datos. El empleo cuidadoso de los mtodos


estadsticos permite obtener informacin precisa de los datos.

NDICE

UNIDAD 3

ESTADISTICA DESCRIPTIVA

3.1 Conceptos bsicos de estadstica:


Definicin, Teora de decisin, Poblacin,
Muestra aleatoria, Parmetros aleatorios
3.2 Descripcin de datos: Datos agrupados
y no agrupados, Frecuencia de clase,
Frecuencia relativa, Punto medio, Lmites.
3.3 Medidas de tendencia central:
Media aritmtica, geomtrica y ponderada,
Mediana, Moda, Medidas de dispersin,
Varianza, Desviacin estndar, Desviacin media,
Desviacin mediana, Rango..
3.5 Parmetros para datos agrupados.
3.6 Distribucin de frecuencias

3.7 Tcnicas de agrupacin de datos.


3.8 Tcnicas de muestreo.
3.9 Histogramas.

UNIDAD 3

ESTADISTICA DESCRIPTIVA

Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es


la Descriptiva. Esta parte se dedica nica y exclusivamente al
ordenamiento y tratamiento mecnico de la informacin para su
presentacin por medio de tablas y de representaciones grficas, as
como de la obtencin de algunos parmetros tiles para la explicacin de la
informacin.
La Estadstica Descriptiva es la parte que conocemos desde los
cursos de educacin primaria, que se ensea en los siguientes niveles
y que, por lo general, no pasa a ser un anlisis ms profundo de la
i n f o r m a c i n . E s u n p r i m e r a c e r c a m i e n t o a l a i n f o r m a c i n y,
p o r e s a m i s m a r a z n , e s l a m a n e r a d e presentar la informacin ante
cualquier lector, ya sea especialista o no.
Sin embargo, lo anterior no quiere decir que carezca de metodologa o algo
similar, sino que, al contrario, por ser un medio accesible a la mayora
de la poblacin humana, resulta de suma importancia considerar para as evitar
malentendidos, tergiversaciones o errores.

3.1 Conceptos bsicos de estadstica: Definicin, Teora de


decisin, Poblacin, Muestra aleatoria, Parmetros aleatorios
TEORA DE DECISIN

Estudio formal sobre la toma de decisiones. Los estudios de casos reales, que se
sirven de la inspeccin y los experimentos, se denominan teora descriptiva de
decisin; los estudios de la toma de decisiones racionales, que utilizan la lgica y
la estadstica, se llaman teora preceptiva de decisin. Estos estudios se hacen
ms complicados cuando hay ms de un individuo, cuando los resultados de
diversas opciones no se conocen con exactitud y cuando las probabilidades de los
distintos resultados son desconocidas. La teora de decisin comparte
caractersticas con la teora de juegos, aunque en la teora de decisin el
"adversario" es la realidad en vez de otro jugador o jugadores.

Al hacer un anlisis sobre esta teora, y mirndola desde el punto de vista de un


sistema, se puede decir que al tomar una decisin sobre un problema en
particular, se debe tener en cuenta los puntos de dificultad que lo componen, para
as empezar a estudiarlos uno a uno hasta obtener una solucin que sea acorde a
lo que se est esperando obtener de este, y si no, buscar otras soluciones que se
acomoden a lo deseado.
Se puede decir que la Teora de decisin es una de las ramas que sirve para que
al dar un paso, no se vaya a dar en falso, porque si se conoce de esta no hay el
porqu de equivocarse.

POBLACIN
El concepto de poblacin en estadstica va ms all de lo que comnmente se
conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de
personas u objetos que presentan caractersticas comunes. "Una poblacin es un
conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones".
Cuando el nmero de elementos que integra la poblacin es muy grande, se
puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de
todos los nmeros positivos. Una poblacin finita es aquella que est formada por
un limitado nmero de elementos, por ejemplo; el nmero de estudiante del
Ncleo San Carlos de la Universidad Nacional Experimental Simn Rodrguez.
Cuando la poblacin es muy grande, es obvio que la observacin de todos los
elementos se dificulte en cuanto al trabajo, tiempo y costos necesarios para
hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica. Es
a menudo imposible o poco prctico observar la totalidad de los individuos, sobre

todos si estos son muchos. En lugar de examinar el grupo entero llamado


poblacin o universo, se examina una pequea parte del grupo llamada muestra.

Poblacin o Universo: es el total del conjunto de elementos u objetos de los cuales


se quiere obtener informacin. Aqu el trmino poblacin tiene un significado
mucho ms amplio que el usual, ya que puede referirse a personas, cosas, actos,
reas geogrficas e incluso al tiempo.

La poblacin debe estar perfectamente definida en el tiempo y en el espacio, de


modo que ante la presencia de un potencial integrante de la misma, se pueda
decidir si forma parte o no de la poblacin bajo estudio. Por lo tanto, al definir una
poblacin, se debe cuidar que el conjunto de elementos que la integran quede
perfectamente delimitado.

MUESTRA ALEATORIA

Es una muestra sacada de una poblacin de unidades, de manera que todo


elemento de la poblacin tenga la misma probabilidad de seleccin y que las
unidades diferentes se seleccionen independientemente.
Muestra aleatoria: muestra elegida independientemente de todas las dems, con
la misma probabilidad que cualquier otra y cuyos elementos estn elegidos
independientemente unos de otros y con la misma probabilidad. Muestra aleatoria
Una muestra aleatoria es una muestra sacada de una poblacin de unidades, de
manera que todo elemento de la poblacin tenga la misma probabilidad de
seleccin y que las unidades diferentes se seleccionen independientemente.
Variables aleatorias y distribuciones
Se llama variable aleatoria aquella que toma diversos valores o conjuntos de
valores con distintas probabilidades. Existen 2 caractersticas importantes de una
variable aleatoria, sus valores y las probabilidades asociadas a esos valores.

Una tabla, grfico o expresin matemtica que de las probabilidades con que una
variable aleatoria toma diferentes valores, se llama distribucin de la variable
aleatoria.
Como vimos anteriormente, la inferencia estadstica se relaciona con las
conclusiones que se pueden sacar acerca de una poblacin de observaciones
basndose en una muestra de observaciones. Entonces intervienen las
probabilidades en el proceso de la seleccin de la muestra; en este caso se desea
saber algo sobre una distribucin con base en una muestra aleatoria de esa
distribucin.
De tal manera vemos que trabajamos con muestras aleatorias de una poblacin
que es mas grande que la muestra obtenida; tal muestra aleatoria aislada no es
mas que una de muchas muestras diferentes que se habran podido obtener
mediante el proceso de seleccin. Este concepto es realmente importante en
estadstica.
La distribucin de un estadgrafo en todas las muestras aleatorias de tamao n
tomadas de una poblacin, se llama distribucin muestral del estadgrafo para
muestras aleatorias de tamao n.
Para muestras aleatorias de tamao n de toda poblacin base, la media de la
distribucin muestral de la media muestral, es la media de la poblacin de base.
Para muestras aleatorias de tamao n de toda poblacin base, la varianza de la
distribucin muestral de la media muestral, es s2/ n que es la varianza de la
poblacin de base dividida por el tamao de la muestra.
Para muestras aleatorias de tamao n de toda poblacin de base, la media de la
distribucin muestral de la varianza muestral s2, es la varianza s2 de la poblacin
de base.
PARMETROS ALEATORIOS

Se llama variable aleatoria aquella que toma diversos valores o conjuntos de


valores con distintas probabilidades. Existen 2 caractersticas importantes de una
variable aleatoria, sus valores y las probabilidades asociadas a esos valores.

Una tabla, grfico o expresin matemtica que d las probabilidades con que una
variable aleatoria toma diferente valores, se llama distribucin de la variable
aleatoria.

Como vimos anteriormente, la inferencia estadstica se relaciona con las


conclusiones que se pueden sacar acerca de una poblacin de observaciones
basndose en una muestra de observaciones. Entonces intervienen las
probabilidades en el proceso de la seleccin de la muestra; en este caso se desea
saber algo sobre una distribucin con base en una muestra aleatoria de esa
distribucin.

De tal manera vemos que trabajamos con muestras aleatorias de una poblacin
que es ms grande que la muestra obtenida; tal muestra aleatoria aislada no es
ms que una de muchas muestras diferentes que se habran podido obtener
mediante el proceso de seleccin. Este concepto es realmente importante en
estadstica.

3.2 Descripcin de datos: Datos agrupados y no agrupados,


Frecuencia de clase, Frecuencia relativa, Punto medio, Lmites

La estadstica descriptiva es una parte de la estadstica que se dedica a analizar y


representar los datos. Este anlisis es muy bsico, pero fundamental en todo
estudio. Aunque hay tendencia a generalizar a toda la poblacin las primeras
conclusiones obtenidas tras un anlisis descriptivo, su poder inferencia es mnimo
y debera evitarse tal proceder. Otras ramas de la estadstica se centran en el
contraste de hiptesis y su generalizacin a la poblacin.
Algunas de las tcnicas empleadas en este primer anlisis de los datos se
enumeran ms abajo en el listado de conceptos bsicos. Bsicamente, se lleva a
cabo un estudio calculando una serie de medidas de tendencia central, para ver
en qu medida los datos se agrupan o dispersan en torno a un valor central.

DATOS AGRUPADOS Y NO AGRUPADOS

Cuando la muestra que se ha tomado de la poblacin o proceso que se desea


analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos
datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que
se le llama tratamiento de datos no agrupados.
Cuando la muestra consta de 30 o ms datos, lo aconsejable es agrupar los datos
en clases y a partir de estas determinar las caractersticas de la muestra y por
consiguiente las de la poblacin de donde fue tomada. Antes de pasar a definir
cul es la manera de determinar las caractersticas de inters (media, mediana,
moda, etc.) cuando se han agrupado en clases los datos de la muestra, es
necesario que sepamos como se agrupan los datos.

FRECUENCIA DE CLASE

Marca de clase (punto medio): punto que divide a la clase en dos partes iguales.
Es el promedio entre los lmites superior e inferior de la clase.
Intervalo de clase: para una distribucin de frecuencias que tiene clases del mismo
tamao, el intervalo de clase se obtiene restando el lmite inferior de una clase del
lmite inferior de la siguiente.
FRECUENCIA RELATIVA

Es la relacin o cociente entre la frecuencia absoluta y el nmero total de


observaciones. Es la proporcin entre la frecuencia de un intervalo y el nmero
total de datos.
PUNTO MEDIO

Punto medio es el punto que divide a un segmento en dos partes iguales.


El punto medio de un segmento, es nico y equidista de los extremos del
segmento. Cumpliendo esta ltima condicin, pertenece a la mediatriz del
segmento.
La frmula para determinar el punto medio de un segmento en el plano, con
coordenadas: (x1,y1) y (x2,y2) es: [(x1 + x2) / 2] + [(y1 + y2) / 2]

LIMITES
Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre
los cuales van a estar los valores de los datos agrupados en ese intervalo de
clase.

3.3 Medidas de tendencia central: Media aritmtica, geomtrica y


ponderada, Mediana, Moda, Medidas de dispersin, Varianza,
Desviacin estndar, Desviacin media, Desviacin mediana,
Rango
Tambin se les conoce como medidas de posicin o promedios son los valores
que se utilizan para representar el conjunto de observaciones. Tienden a situarse
en el centro del conjunto de los datos, previamente ordenados.
Las principales medidas centrales son: La media, la mediana y la moda.
MEDIA ARITMETICA GEOMETRICA PONDERADA

Media aritmtica:
Es uno de los promedios de mayor utilizacin. Su generalizacin se debe a las
propiedades que posee, que la convierten en un indicador muy representativo.
Se obtiene sumando los productos de cada valor de la variable por su respectiva
frecuencia, y dividiendo esta suma por el total de observaciones.
MEDIANA EN ESTADISTICA
Mediana:
Es el valor de la variable que divide a la distribucin de frecuencias en dos partes
iguales.

Para hallar la mediana ordenamos la frecuencias de mayor a menor o viceversa, y


si hay un nmero impar de valores la mediana es el central y si es par ser la
semisuma de los dos valores.
MEDIDAS DE DISPERSIN
MODA
En Estadstica, la moda es el valor que cuenta con una mayor frecuencia en una
distribucin de datos.
Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Una
distribucin trimodal de los datos es en la que encontramos tres modas. Si todas
las variables tienen la misma frecuencia diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos estn agrupados, es un punto que divide al intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:
Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.
Se llama tpicain de un conjunto de datos al grado en que los diferentes valores
de los datos tiende a extenderse alrededor del valor medio utilizado.
Este grado de tpicain se mide por medio de los indicadores tpicains llamados
medidas de tpica in, entre ellas tenemos el rango, la varianza, y la tpicain
tpica.
Hasta el momento hemos estudiado los valores centrales de la distribucin, pero
tambin es importante conocer si los valores en general estn cerca o alejados de
estos valores centrales, es por lo que surge la necesidad de estudiar medidas de
dispersin.
Rango:
Es la primera medida que vamos a estudiar, se define como la diferencia existente
entre el valor mayor y el menor de la distribucin,. Lo notaremos como R.
Realmente no es una medida muy significativa e la mayora de los casos, pero
indudablemente es muy fcil de calcular.

Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de


desviacin con respecto a cualquiera de ellas, sin embargo, la mas utilizada es
con respecto a la media.
Desviacin:
Es la diferencia que se observa entre el valor de la variable y la media aritmtica.
La denotaremos por di.
No es una medida, son muchas medidas, pues cada valor de la variable lleva
asociada su correspondiente desviacin, por lo que precisaremos una medida que
resuma dicha informacin.
La primera solucin puede ser calcular la media de todas las desviaciones, es
decir, si consideramos como muestra la de todas las desviaciones y calculamos su
media. Pero esta solucin es mala pues como veremos siempre va a ser 0.

Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas
se contrarrestan con las negativas.
Para resolver este problema, tenemos dos caminos:
Tomar el valor absoluto de las desviaciones. Desviacin media Elevar al cuadrado
las desviaciones. Varianza.
Varianza:

3.5 Parmetros para datos agrupados


Pasos para agrupar datos.

Determinar el rango o recorrido de los datos.


Rango = Valor mayor Valor menor
Establecer el nmero de clases (k) en que se van a agrupar los datos tomando
como base para esto la siguiente tabla.
Tamao de muestra o No. De
datos

Nmero de
clases

Menos de 50

5a7

50 a 99

6 a 10

100 a 250

7 a 12

250 en adelante

10 a 20

El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para
establecer el nmero de clases en las que se van a agrupar los datos, existen
otros para hacerlo.

Determinar la amplitud de clase para agrupar (C).


d.

Formar clases y agrupar datos.

Para formar la primera clase, se pone como lmite inferior de la primera clase un
valor un poco menor que el dato menor encontrado en la muestra y posteriormente
se suma a este valor C, obteniendo de esta manera el lmite superior de la primera
clase, luego se procede a obtener los lmites de la clase siguiente y as
sucesivamente.

Ejemplo:
Los siguientes datos se refieren al dimetro en pulgadas de un engrane.

6.75

7.00

7.00

6.75

6.50

6.50

7.15

7.00

6.50

6.50

6.50

6.25

6.25

6.50

6.65

7.00

7.25

6.70

6.00

6.75

6.00

6.75

6.75

7.10

7.00

6.70

6.50

6.75

6.25

6.65

6.75

7.10

7.25

6.75

6.25

6.25

7.00

6.75

7.00

7.15

a) Agrupe datos, considere k = 6.


b) Obtenga: Histograma, polgono de frecuencias, ojiva y distribucin de
probabilidad.
c)

Obtenga: media, mediana, moda y desviacin estndar.

Solucin:
a)

Agrupando datos;

1.

R= VM - Vm = 7.25 6.00 = 1.25

2.
3.

k=6
C=R/k=1.25/6=0.2083=.21

4. Formando clases.

3.6 Distribucin de frecuencias


Distribucin de frecuencia para datos no Agrupados:

Es aquella distribucin que indica las frecuencias con que aparecen los datos
estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se
haya hecho ninguna modificacin al tamao de las unidades originales. En estas
distribuciones cada dato mantiene su propia identidad despus que la distribucin
de frecuencia se ha elaborado. En estas distribuciones los valores de cada
variable han sido solamente reagrupados, siguiendo un orden lgico con sus
respectivas frecuencias.

Distribucin de frecuencia de clase o de datos Agrupados:

Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se


encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los
datos originales de varios valores adyacentes del conjunto se combinan para
formar un intervalo de clase. No existen normas establecidas para determinar
cundo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo,
se sugiere que cuando el nmero total de datos (N) es igual o superior 50 y
adems el rango o recorrido de la serie de datos es mayor de 20, entonces, se
utilizar la distribucin de frecuencia para datos agrupados, tambin se utilizar
este tipo de distribucin cuando se requiera elaborar grficos lineales como el
histograma, el polgono de frecuencia o la ojiva.

La razn fundamental para utilizar la distribucin de frecuencia de clases es


proporcionar mejor comunicacin acerca del patrn establecido en los datos y
facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el fin
de sintetizar, resumir, condensar o hacer que la informacin obtenida de una
investigacin sea manejable con mayor facilidad.

Componentes de una distribucin de frecuencia de clase

1.- Rango o Amplitud total (recorrido).- Es el lmite dentro del cual estn
comprendidos todos los valores de la serie de datos, en otras palabras, es el
nmero de diferentes valores que toma la variable en un estudio o investigacin
dada. Es la diferencia entre el valor mximo de una variable y el valor mnimo que
sta toma en una investigacin cualquiera. El rango es el tamao del intervalo en
el cual se ubican todos los valores que pueden tomar los diferentes datos de la
serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos
ambos extremos. El rango de una distribucin de frecuencia se designa con la
letra R.

2.- Clase o Intervalo de clase.- Son divisiones o categoras en las cuales se


agrupan un conjunto de datos ordenados con caractersticas comunes. En otras

palabras, son fraccionamientos del rango o recorrido de la serie de valores para


reunir los datos que presentan valores comprendidos entre dos limites.

Para organizar los valores de la serie de datos hay que determinar un nmero de
clases que sea conveniente. En otras palabras, que ese nmero de intervalos no
origine un nmero pequeo de clases ni muy grande. Un nmero de clases
pequeo puede ocultar la naturaleza natural de los valores y un nmero muy alto
puede provocar demasiados detalles como para observar alguna informacin de
gran utilidad en la investigacin.

Tamao de los Intervalos de Clase

Los intervalos de clase pueden ser de tres tipos, segn el tamao que estos
presenten en una distribucin de frecuencia: a) Clases de igual tamao, b) clases
desiguales

de tamao y c) clases abiertas.

3.-Amplitud de Clase, Longitud o Ancho de una Clase

La amplitud o longitud de una clase es el nmero de valores o variables que


concurren a una clase determinada. La amplitud de clase se designa con las letras
Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa
diversidad de criterios, se ha considerado que lo ms importante es dar un ancho
o longitud de clase a todos los intervalos de tal manera que respondan a la
naturaleza de los datos y al objetivo que se persigue y esto se logra con la
practica.

4.-Punto medio o Marca de clase

El centro de la clase, es el volar de los datos que se ubica en la posicin central de


la clase y representa todos los dems valores de esa clase. Este valor se utiliza
para el calculo de la media aritmtica.

5.-Frecuencia de clase

La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las


letras fi. Es el nmero total de valores de las variables que se encuentran presente
en una clase determinada, de una distribucin de frecuencia de clase.

6.- Frecuencia Relativa

La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las
clases de una distribucin de frecuencia de clase entre el nmero total de datos(N)
de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se
multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).

7.-Frecuencias acumuladas

Las frecuencias acumuladas de una distribucin de frecuencias son aquellas que


se obtienen de las sumas sucesivas de las fi que integran cada una de las clases
de una distribucin de frecuencia de clase, esto se logra cuando la acumulacin
de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la
ultima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias
acumuladas pueden ser menor que (fa< que) y frecuencias acumuladas mayor
que (fa>que).

8.- Frecuencia acumulada relativa

La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las
fa de las diferentes clases que integran una distribucin de frecuencia de clase

entre el nmero total de datos (N) de la serie de valores, estas frecuencias se


designan con las letras far. Si las far se multiplican por 100 se obtienen las
frecuencias acumuladas relativas porcentuales y las mismas se designan as: far
%.
LI

LS Frecuencia

Marca de
clase

Lmite real
inferior

Lmite real
superior

Frecuencia
relativa

Frecuencia
Relativa
acumulada

5.97
6.18

6.075

5.97-0.005= 6.18+0.005
=
5.965
6.185

2/40 = 0.05

0.05

6.19
6.40

6.295

6.185

6.405

5/40=0.125

0.175

6.41
6.62

6.515

6.405

6.625

0.175

0.350

6.63
6.84

13

6.735

6.625

6.845

0.325

0.675

6.85
7.06

6.955

6.845

7.065

0.175

0.850

7.07
7.28

7.175

7.065

7.285

0.15

1.000

Total

40

1.000

3.7 Tcnicas de agrupacin de datos


Es aquella distribucin en la distribucin tabular de los datos estadsticos se
encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los
datos originales de varios valores adyacentes del conjunto se combinan para
formar un intervalo de clases. No existen normas establecidas para determinar
cundo es apropiado utilizar datos agrupados o no agrupados; sin embargo, se
sugiere que cuando el nmero total de datos (N) es igual o superior 50 y adems
el rango o recorrido de la serie es mayor de 20, entonces, se utilizara la
distribucin de frecuencia para datos agrupados, tambin se utilizara este tipo de

distribucin cuando se requiera elaborar grficos lineales como el histograma, el


polgono de frecuencia o la ojiva.

Cuando la muestra consta de 30 o ms datos, lo aconsejable es agrupar los datos


en clases y a partir de estas determinar las caractersticas de la muestra y por
consiguiente las de la poblacin de donde fue tomada.

Antes de pasar a definir cul es la manera de determinar las caractersticas de


inters (media, mediana, moda, etc.) cuando se han agrupado en clases los datos
de la muestra, es necesario que sepamos cmo se agrupan los datos.

3.8 Tcnicas de muestreo


Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no
aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en
el proceso de seleccin). Cuando este ltimo cumple con la condicin de que
todos los elementos de la poblacin tienen alguna oportunidad de ser escogidos
en la muestra, si la probabilidad correspondiente a cada sujeto de la poblacin es
conocida de antemano, recibe el nombre de muestreo probabilstico. Una muestra
seleccionada por muestreo de juicio puede basarse en la experiencia de alguien
con la poblacin. Algunas veces una muestra de juicio se usa como gua o
muestra tentativa para decidir cmo tomar una muestra aleatoria ms adelante.
Muestreo probabilstico
Forman parte de este tipo de muestreo todos aquellos mtodos para los que
puede calcular la probabilidad de extraccin de cualquiera de las muestras
posibles. Este conjunto de tcnicas de muestreo es el ms aconsejable, aunque
en ocasiones no es posible optar por l. En este caso se habla de muestras
probabilsticas, pues no es en rigor correcto hablar de muestras representativas
dado que, al no conocer las caractersticas de la poblacin, no es posible tener
certeza de que tal caracterstica se haya conseguido.
Sin reposicin de los elementos: Cada elemento extrado se descarta para la
subsiguiente extraccin. Por ejemplo, si se extrae una muestra de una "poblacin"
de bombillas para estimar la vida media de las bombillas que la integran, no ser
posible medir ms que una vez la bombilla seleccionada.

Con reposicin de los elementos: Las observaciones se realizan con


reemplazamiento de los individuos, de forma que la poblacin es idntica en todas
las extracciones. En poblaciones muy grandes, la probabilidad de repetir una
extraccin es tan pequea que el muestreo puede considerarse sin reposicin
aunque, realmente, no lo sea.
Con reposicin mltiple: En poblaciones muy grandes, la probabilidad de repetir
una extraccin es tan pequea que el muestreo puede considerarse sin
reposicin. Cada elemento extrado se descarta para la subsiguiente extraccin.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la
extraccin de nmeros aleatorios mediante ordenadores, calculadoras o tablas
construidas al efecto.
Muestreo estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se
suponen homogneos con respecto a alguna caracterstica de las que se van a
estudiar. A cada uno de estos estratos se le asignara una cuota que determinara
el nmero de miembros del mismo que compondrn la muestra. Dentro de cada
estrato se suele usar la tcnica de muestreo sistemtico, una de las tcnicas de
seleccin ms usadas en la prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno
de los estratos, existen dos tcnicas de muestreo estratificado:
Asignacin proporcional: el tamao de la muestra dentro de cada estrato es
proporcional al tamao del estrato dentro de la poblacin.
Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que
tengan ms variabilidad. Para ello es necesario un conocimiento previo de la
poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. As, si la poblacin est
compuesta de un 55% de mujeres y un 45% de hombres, se tomara una muestra
que contenga tambin esos mismos porcentajes de hombres y mujeres.

Para una descripcin general del muestreo estratificado y los mtodos de


inferencia asociados con este procedimiento, suponemos que la poblacin est
dividida en h subpoblaciones o estratos de tamaos conocidos N1, N2,..., Nh tal
que las unidades en cada estrato sean homogneas respecto a la caracterstica
en cuestin. La media y la varianza desconocidas para el i-simo estrato son
denotadas por mi y si2, respectivamente.
Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse
en el tiempo. Primero hay que identificar las unidades y relacionarlas con el
calendario (cuando proceda). Luego hay que calcular una constante, que se
denomina coeficiente de elevacin K= N/n; donde N es el tamao del universo y n
el tamao de la muestra. Determinar en qu fecha se producir la primera
extraccin, para ello hay que elegir al azar un nmero entre 1 y K; de ah en
adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es
conveniente tener en cuenta la periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la
poblacin (N) y queremos escoger de esa poblacin un nmero ms pequeo el
cual es la muestra (n), dividimos el nmero de la poblacin por el nmero de la
muestra que queremos tomar y el resultado de esta operacin ser el intervalo,
entonces escogemos un nmero al azar desde uno hasta el nmero del intervalo,
y a partir de este nmero escogemos los dems siguiendo el orden.
Muestreo por estadios mltiples
Esta tcnica es la nica opcin cuando no se dispone de lista completa de la
poblacin de referencia o bien cuando por medio de la tcnica de muestreo simple
o estratificado se obtiene una muestra con unidades distribuidas de tal forma que
resultan de difcil acceso. En el muestreo a estadios mltiples se subdivide la
poblacin en varios niveles ordenados que se extraen sucesivamente por medio
de un procedimiento de embudo. El muestreo se desarrolla en varias fases o
extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en
un pas determinado, stos pueden subdividirse en unidades primarias
representadas por circunscripciones didcticas y unidades secundarias que seran
los propios profesores. En primer lugar extraemos una muestra de las unidades
primarias (para lo cual debemos tener la lista completa de estas unidades) y en

segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de


cada una de las primarias seleccionadas en la primera extraccin.
Muestreo por conglomerado
Tcnica similar al muestreo por estadios mltiples, se utiliza cuando la poblacin
se encuentra dividida, de manera natural, en grupos que se supone que contienen
toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la
caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos o
conglomerados para la realizacin del estudio.
Dentro de los grupos seleccionados se ubicarn las unidades elementales, por
ejemplo, las personas a encuestar, y podra aplicrsele el instrumento de medicin
a todas las unidades, es decir, los miembros del grupo, o slo se le podra aplicar
a algunos de ellos, seleccionados al azar. Este mtodo tiene la ventaja de
simplificar la recogida de informacin muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos
individuos para integrar la muestra, el diseo se llama muestreo bietpico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer
mtodo funciona mejor cuanto ms homognea es la poblacin respecto del
estrato, aunque ms diferentes son stos entre s. En el segundo, ocurre lo
contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben
ser muy parecidos entre s.
Homogeneidad de las poblaciones o sus subgrupos
Homogneo siginifica, en el contexto de la estratificacin, que no hay mucha
variabilidad. Los estratos funcionan mejor cuanto ms homogneos son cada uno
de ellos respecto a la caracterstica a medir. Por ejemplo, si se estudia la estatura
de una poblacin, es bueno distinguir entre los estratos mujeres y hombres porque
se espera que, dentro de ellos, haya menos variabilidad, es decir, sean menos
heterogneos. Dicho de otro modo, no hay tantas diferencias entre unas estaturas
y otras dentro del estrato que en la poblacin total.
Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan las
mismas diferencias dentro del estrato que en toda la poblacin, no hay por qu
usar este mtodo de muestreo. En los casos en los que existan grupos que
contengan toda la variabilidad de la poblacin, lo que se construyen son
conglomerados, que ahorran algo del trabajo que supondra analizar toda la

poblacin. En resumen, los estratos y los conglomerados funcionan bajo principios


opuestos: los primeros son mejores cuanto ms homogneo es el grupo respecto
a la caracterstica a estudiar y los conglomerados, si representan fielmente a la
poblacin, esto es, contienen toda su variabilidad, o sea, son heterogneos.
Muestreo no probabilstico
Aqul para el que no puede calcularse la probabilidad de extraccin de una
determinada muestra. Se busca seleccionar a individuos que se juzga de
antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se
considera que la informacin aportada por esas personas es vital para la toma de
decisiones.
Muestreo por cuotas
Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de
opinin. En primer lugar es necesario dividir la poblacin de referencia en varios
estratos definidos por algunas variables de distribucin conocida (como el gnero
o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es
decir, la parte proporcional de poblacin que representan. Finalmente se multiplica
cada peso por el tamao de n de la muestra para determinar la cuota precisa en
cada estrato. Se diferencia del muestreo estratificado en que una vez determinada
la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de
cada estrato.
Muestreo de bola de nieve
Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas
pero en contacto entre s. Consiste en identificar sujetos que se incluirn en la
muestra a partir de los propios entrevistados. Partiendo de una pequea cantidad
de individuos que cumplen los requisitos necesarios estos sirven como
localizadores de otros con caractersticas anlogas.
Muestreo subjetivo por decisin razonada
En este caso las unidades de la muestra se eligen en funcin de algunas de sus
caractersticas de manera racional y no casual. Una variante de esta tcnica es el
muestreo compensado o equilibrado, en el que se seleccionan las unidades de tal
forma que la media de la muestra para determinadas variables se acerque a la
media de la poblacin.

3.9 Histogramas
En estadstica, un histograma es una representacin grfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a
la frecuencia de los valores representados. En el eje vertical se representan las
frecuencias, y en el eje horizontal los valores de las variables, normalmente
sealando las marcas de clase, es decir, la mitad del intervalo en el que estn
agrupados los datos.
Se utilizan para variables continuas o para variables discretas, con un gran
nmero de datos, y que se han agrupado en clases.
Se utiliza cuando se estudia una variable continua, como franjas de edades o
altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir,
valores continuos. En los casos en los que los datos son cualitativos (nonumricos), como sexto grado de acuerdo o nivel de estudios, es preferible
un diagrama de sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas
que en ciencias naturales y exactas. Y permite la comparacin de los resultados
de un proceso.

Tipos de histograma
Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra
la cual es proporcional a la frecuencia simple de la categora que representa.
Diagramas de barras compuesta
Se usa para representar la informacin de una tabla de doble entrada o sea a
partir de dos variables, las cuales se representan as; la altura de la barra
representa la frecuencia simple de las modalidades o categoras de la variable y
esta altura es proporcional a la frecuencia simple de cada modalidad.
Diagramas de barras agrupadas

Se usa para representar la informacin de una tabla de doble entrada o sea a


partir de dos variables, el cual es representado mediante un conjunto de barras
como se clasifican respecto a las diferentes modalidades.
Polgono de frecuencias
Es un grfico de lneas que de las frecuencias absolutas de los valores de una
distribucin en el cual la altura del punto asociado a un valor de las variables es
proporcional a la frecuencia de dicho valor.
Ojiva porcentual
Es un grfico acumulativo, el cual es muy til cuando se quiere representar el
rango porcentual de cada valor en una distribucin de frecuencias.
En los grficos las barras se encuentran juntas y en la tabla los nmeros poseen
en el primer miembro un corchete y en el segundo un parntesis, por ejemplo: [1020)

Construccin de un histograma
Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato
menor.
Paso 2
Obtener los nmeros de clases, existen varios criterios para determinar el nmero
de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de
ellos es exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de cmo estn los datos y cuntos sean. Un criterio usado
frecuentemente es que el nmero de clases debe ser aproximadamente a la raz
cuadrada del nmero de datos. Por ejemplo, la raz cuadrada de 30 ( nmero de
artculos) es mayor que cinco, por lo que se seleccionan seis clases.
Paso 3
Establecer la longitud de clase: es igual al rango dividido por el nmero de clases.
Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los
datos en relacin al resultado del PASO 2 en intervalos iguales.

Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma
amplitud, se hace un grfico de barras, las bases de las barras son los intervalos
de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de
la base superior de los rectngulos se obtiene el polgono de frecuencias.

El histograma de una imagen representa la frecuencia relativa de los niveles de


gris de la imagen. Las tcnicas de modificacin del histograma de una imagen son
tiles para aumentar el contraste de imgenes con histogramas muy
concentrados.

Sea u una imagen de tamao NxN, la funcin de distribucin del histograma


es:

Ejemplos de otros tipos de representaciones grficas: Hay histogramas donde se


agrupan los datos en clases, y se cuenta cuntas observaciones (frecuencia
absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas)
las clases estn definidas de modo natural, p.e sexo con dos clases: mujer, varn
o grupo sanguneo con cuatro: A, B, AB, O. En las variables cuantitativas, las
clases hay que definirlas explcitamente (intervalos de clase).
Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las
frecuencias, absolutas o relativas, en el de ordenadas (eje vertical).
A veces es ms til representar las frecuencias acumuladas.
O representar simultneamente los histogramas de una variable en dos
situaciones distintas.
Otra forma muy frecuente, de representar dos histogramas de la misma variable
en dos situaciones distintas.
En las variables cuantitativas o en las cualitativas ordinales se pueden representar
polgonos de frecuencia en lugar de histogramas, cuando se representa la
frecuencia acumulativa, se denomina ojiva.

Vous aimerez peut-être aussi