Académique Documents
Professionnel Documents
Culture Documents
UN POCO DE HISTORIA
El uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en pocas
remotas. Se tiene informacin de hace ms 3000 aos antes de Cristo, donde las antiguas civilizaciones,
como la Egipcia, aplicaron continuamente censos que ayudaban a la organizacin del estado y la
construccin de las pirmides.
El antiguo testamento nos sugiere que Moiss orden un Censo a la poblacin Israelita para
identificar los miembros de las familias. En la antigua Grecia y el Imperio Romano, era comn la
aplicacin de censos para la planificacin de impuestos y la prestacin del servicio militar.
La palabra estadstica deriva del latn moderno statisticum collegium (consejo de estado), del
latn antiguo status (posicin, forma de gobierno), de la palabra italiana moderna statista
(estadista, poltico) y del italiano antiguo stato (estado). En 1749, el alemn, Gottfried Achenwall
(1719-1792) usa el trmino Statistik en su libro titulado Staatswissenschaft der vornehmen
Europischen Reiche und Republiken, quien originalmente design la palabra estadstica para el anlisis
de los datos de un gobierno, definindola como la Ciencia del Estado. A Gottfried Achenwall se le
conoce como el Padre de la Estadstica.
La primera persona que introdujo el trmino estadstica en Inglaterra fue Sir John Sinclair
(1754-1835) con su trabajo Statistical Account of Scotland (1791-,1799) trabajo compilado en 21
volmenes. El autor explica en su libro, que la palabra estadstica la adopt gracias al estudio de
investigaciones realizadas en Alemania, como una palabra novedosa que llamara la atencin de los
ingleses; a diferencia, de que en Alemania la estadstica se usa como instrumento para medir la
fortaleza de un estado, mientras que Sinclair, la empleara como generadora de informacin interna
para encontrar falencias y proponer mejoras en el pas. A este trabajo le siguieron dos publicaciones: la
segunda edicin elaborada entre 1834 y 1845; la tercera edicin comienza despus de la segunda guerra
mundial comprendiendo los periodos entre 1951 y 1992.1
El registro de nacimientos y defunciones comenz en Inglaterra a principios del siglo XVI, y en
1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations on the London
Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres). Un estudio similar sobre la
tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el
astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad
A comienzos del siglo XIX, la palabra estadstica adopta un significado ms generalizado hacia
la recoleccin y clasificacin de cualquier tipo de datos cuantitativos. William Playfair (1759-1823)
expone su idea de que los grficos permiten una comunicacin ms eficiente que las tablas de
frecuencia. Es considerado como el inventor de los grficos lineales, de barras y de sectores. Playfair
public el libro titulado The Commercial and Political Atlas (1786) el cual contiene 43 grficos de
series de tiempo y por primera vez, es usado un grfico de barras. En 1801 utiliza el primer grfico de
sectores en su obra Playfairs Statistical Breviary.
Tambin en este siglo, con la generalizacin del mtodo cientfico para estudiar todos los
fenmenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la
informacin a valores numricos para evitar la ambigedad de las descripciones verbales.
Sir Francis Galton (1822-1911) cre el concepto estadstico de regresin y correlacin, y fue el
primero en aplicar mtodos estadsticos para estudiar las diferencias humanas basadas en el uso de
cuestionarios y entrevistas para recolectar los datos. Herman Hollerith (1860-1929) fue un estadstico
estadounidense quien desarrollo la primera mquina tabuladora basada en tarjetas perforadas y
mecanismos elctrico-mecnicos para el tratamiento rpido de millones de datos. Su mquina fue usada
en el censo de 1890 en estados unidos que redujo la tabulacin de los datos de 7 aos (censo de 1880) a
2.5 aos. En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con
exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve
como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no
consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa
informacin.
El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la
estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando
determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar
datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y
para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico.
DEFINICION DE ESTADISTICA
Como vimos en el apartado anterior, la estadstica a variado su significado a travs del tiempo,
pasando de ser una herramienta usada solo para la administracin de los gobiernos, a una ciencia con un
sin fin de aplicaciones en diferentes disciplinas
La estadstica admite varias definiciones entre las que podemos citar
"El estudio, recuento y comparacin de cifras para observar o analizar los procesos de
cualquier conjunto de hechos".
El estudio de los mtodos y procedimientos para recoger, clasificar, resumir y analizar
datos y para hacer inferencias cientficas partiendo de tales datos".
Una ciencia bsica cuyo objetivo principal es el procesamiento y anlisis de grandes
volmenes de datos, resumindolos en tablas, grficos e indicadores estadsticos, que
permiten la fcil compresin de las caractersticas concernientes al fenmeno
estudiado.
Un rea de la matemtica aplicada orientada a la recoleccin e interpretacin de datos
cuantitativos y al uso de la teora de la probabilidad para calcular los parmetros de una
poblacin.
UTILIDAD DE LA ESTADISTICA
Quiz uno se puede preguntar por que razn es importante la estadstica. Hay varios motivos por
los cuales se debe conocer y manejar la estadstica:
COMO HERRAMIENTA DE TRABAJO: La estadstica es de una utilidad inmediata y
practica.
Ayuda a que el trabajo diario y repetitivo se efecte con ms rapidez y eficacia.
Ayuda a los profesores en la determinacin de calificaciones y en la realizacin de test.
Ayuda a interpretar sus datos y observaciones.
En las ciencias del comportamiento, la estadstica se ha convertido en una parte
imprescindible del trabajo.
En todos estos campos, la eficacia y la facilidad de operacin exige un conocimiento de
los mtodos estadsticos bsicos
EN LA SOLUCION DE PROBLEMAS:
La investigacin se lleva a menudo segn una escala limitada, no para comprobar la
teora, sino para revisar alguna informacin vital para la solucin de un problema
practico. Es frecuente que surjan preguntas como estas.
Cules son los alumnos que ms rpido corren?
El mtodo de entrenamiento aplicado a este grupo, es mejor o peor que el que
emplee para con otro?
Existe alguna relacin entre las variables obtenidas con un grupo y otro?
Evidentemente, las respuestas se obtienen aplicando los mtodos estadsticos a los
datos observados
EN LA INVESTIGACION TEORICA:
Las ciencias del comportamiento han alcanzado, hoy en da un alto grado de elaboracin,
se han hecho ms cuantitativas. El desarrollo de teoras es til para organizar la
informacin disponible. Las teoras predicen lo que se espera observar en circunstancias
determinadas. Los medios con que se comprueban las teoras de las ciencias de la
educacin, psicologa, sociologa y economa son en gran parte estadsticos.
COMPRESION Y UTILIZACION DE LA INVESTIGACION:
Un profesional competente, adems de su especialidad, tiene que estar al corriente de
los avances tcnicos. Debe comprender los informes de la investigacin aplicada y
terica. En las ciencias del comportamiento, esto exige que conozca el significado de
ciertos trminos estadsticos, y cuando se puede emplear un mtodo particular.
Desgraciadamente, no toda investigacin es una buena investigacin y el peso de la
evaluacin cae, finalmente en el lector. Las estadsticas pueden ser mal empleadas o mal
interpretadas, pero para aquellos que la entiende, les dicen la verdad o no le dicen nada
SATISFACCION PERSONAL:
Muchos estudiantes creen o piensan que el hecho de recoger y analizar datos es tarea
poco grata. Pero con los datos obtenidos encontramos que solucionamos un problema o
nos dems cuenta que el mtodo aplicado al entrenamiento de un deportista fue
acertado; estaremos en presencia de un logro personal, con solo haber utilizado a la
estadstica como herramienta para obtener la informacin que queramos saber
CLASIFICACION DE LA ESTADISTICA
La estadstica se puede dividir en 2 categoras, la "estadstica inferencial o inductiva" y la
"estadstica descriptiva o deductiva"
Inferencial o inductiva tiene por objeto establecer previsiones o conclusiones sobre una
poblacin basndose en los resultados obtenidos de una muestra
Descriptiva o deductiva, tiene por objeto recoger, recopilar, y calcular de valores
estadsticos que representan al conjunto de datos. Pueden representarse dentro de su
organizacin en tablas y grficos. La estadstica descriptiva sirve como mtodo para
organizar datos y poner de manifiesto sus caractersticas esenciales con el propsito de
llegar a conclusiones.
Las poblaciones son grupos definidos arbitrariamente y engloban a las muestras. Ejemplo:
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la
poblacin que estamos manejando es muy grande.
El riesgo se este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin
ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un
muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no
podra haber una representacin de los dos sexos.
60
4.
25
Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los
anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamao
dado de la muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos)
que poseen gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por
ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se
pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters
estarn representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que formarn parte de la muestra. En
ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento
detallado de la poblacin. (tamao geogrfico, sexos, edades,...). Se divide la poblacin en
clases o estratos y se escoge, al eatoriamente, un nmero de individuos de cad a
estr ato proporcional al nmero de compo nentes de cada estrato.
Ejemplo: En una escuela primaria hay 600 alumnos entre el segundo y tercer ciclo. Queremos
tomar una muestra de 20 alumnos. Sabemos que hay 200 alumnos en cuarto grado, 150 en quinto, 150
en sexto y 100 en sptimo. Procedemos entonces de esta manera
20
600
20
600
20
600
20
600
x1
x1
200
x
2 x2
150
x
3 x3
150
x
4 x4
100
20 * 200
6.6 7 alumnos de 4to grado
600
20 * 150
Una vez que tengo la cantidad, puedo aplicar cualquiera de las dos tcnicas anteriormente
descriptas para seleccionar la cantidad de alumnos determinados
Es frecuente que cuando se realiza un estudio que interese estudiar una serie de subpoblaciones
(estratos) en la poblacin, siendo importante que en la muestra haya representacin de todos y cada
uno de los estratos considerados. El muestreo aleatorio simple no nos garantiza que tal cosa ocurra.
Para evitar esto, se saca una muestra de cada uno de los estratos.
Hay dos conceptos bsicos:
Estratificacin: El criterio a seguir en la formacin de los estratos ser formarlos de tal
manera que haya la mxima homogeneidad en relacin a la variable a estudio dentro de cada
estrato y la mxima heterogeneidad entre los estratos.
Afijacin: Reparto del tamao de la muestra en los diferentes estratos o subpoblaciones.
Existen varios criterios de afijacin entre las que se destaca:
Afijacin igual: Todos los estratos tienen el mismo nmero de elementos en la
muestra.
Afijacin proporcional: Cada estrato tiene un nmero de elementos en la muestra
proporcional a su tamao.
6000
3000
0.60 Colegios privados
0.30
10000
10000
1000
Colegios privados de gestin pblica
0.10
10000
Colegios pblicos:
Para conocer el tamao de cada estrato en la muestra no tenemos ms que multiplicar esa
proporcin por el tamao muestral.
Colegios pblicos: 0.60 * 600 360 padres
Colegios privados: 0.30 * 600 180 padres
Colegios privados de gestin pblica: 0.10 * 600 60 padres
Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora estn pensados
para seleccionar directamente los elementos de la poblacin, es decir, que las unidades
mustrales son los elementos de la poblacin. En el muestreo por conglomerados la unidad
muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos
conglomerado. El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
numero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en
investigar despus todos los elementos pertenecientes a los conglomerados elegidos.
Ejemplo: En una investigacin en la que se trata de conocer el grado de satisfaccin laboral de
los profesores de los institutos de formacin docente, necesitamos una muestra de 700 sujetos. Ante
la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra por
conglomerados. Sabiendo que el nmero de profesores por instituto es aproximadamente de 35, los
pasos a seguir seran los siguientes:
1.
2.
3.
Aleatorio simple
TIPOS
CARACTERSTICAS
Se selecciona una muestra
de tamao n de una
poblacin de N unidades,
cada elemento tiene una
probabilidad de inclusin
igual y conocida de n/N.
VENTAJAS
Sencillo
y
de
fcil
comprensin.
Clculo rpido de medias y
varianzas.
Se basa en la teora
estadstica, y por tanto
existen
paquetes
Informticos
para
analizar los datos
Fcil de aplicar.
No siempre es necesario
tener un listado de toda
la poblacin.
Cuando la poblacin est
ordenada siguiendo una
tendencia
conocida,
asegura una cobertura de
unidades de todos los
tipos
INCONVENIENTES
Requiere que se posea de
antemano
un
listado
completo de toda la
poblacin.
Cuando se trabaja con
muestras pequeas es
posible
que
no
represente a la Poblacin
adecuadamente.
Si la constante de
muestreo est asociada
con el fenmeno de
inters, las estimaciones
obtenidas a partir de la
muestra
pueden
contener
sesgo
de
seleccin
Conglomerados
Estratificado
Sistemtico
Conseguir un listado de
los N elementos de la
poblacin
Determinar
tamao
muestral n.
Definir un intervalo k=
N/n.
Elegir
un
nmero
aleatorio, r, entre 1 y k
(r= arranque aleatorio).
Seleccionar los elementos
de la lista.
En
ciertas
ocasiones Tiende a asegurar que la Se ha de conocer la
resultar
conveniente
muestra
represente
distribucin
en
la
estratificar la muestra
adecuadamente
a
la
poblacin
de
las
segn ciertas variables de
poblacin en funcin de
variables utilizadas para
inters.
unas
variables
la estratificacin.
Por eso debemos conocer
seleccionadas.
la
composicin Se obtienen estimaciones
estratificada
de
la
ms precisa
poblacin
objetivo
a Su objetivo es conseguir
hacer un muestreo.
una muestra lo ms
Una vez calculado el
semejante posible a la
tamao
muestral
poblacin en lo que a las
apropiado,
este
se
variables estratificadotas
reparte
de
manera
se refiere.
proporcional entre los
distintos
estratos
definidos en la poblacin
usando una simple regla
de tres.
Se realizan varias fases Es muy eficiente cuando la El error estndar es
de muestreo sucesivas La
poblacin es muy grande y
mayor
que
en
el
necesidad de listados de
dispersa.
muestreo
aleatorio
las unidades de una etapa No es preciso tener un
simple o estratificado. El
se
limita
a
aquellas
listado
de
toda
la
clculo
del
error
unidades de muestreo
poblacin, slo de las
estndar es complejo
seleccionadas en la etapa
unidades primarias
de
anterior.
muestreo.
Comparacin entre distintos Tipos de Muestreo Probabilstica
3.
4.
Medicin de datos
En esta etapa comienza la elaboracin matemtica y medicin de los datos. El anlisis se
complementa con la obtencin de indicadores estadsticos como las medidas: de tendencia
central, dispersin, posicin y forma. Se observa que los datos tienden a centrarse en torno
a ciertos valores llamados parmetros o medida de posicin (Promedio, Mediana, Modo,
Etc.,)
5.
Elaboracin de grficos
A partir de la medicin de datos se establecen grficos al respecto que permiten una
interpretacin simple y rpida de los hechos y por otra parte pueden conducir a la eleccin
de los mtodos mas adecuados para el anlisis de datos.
6.
7. Elaboracin de conclusiones.
Se construye el informe final.
que
Poblacin Finita
Z 2* N * p* q
e 2 * N 1 Z 2 * p * q
Poblacin infinita
Z 2* p* q
e2
n Tamao de la muestra
N Tamao de la poblacin si se conoce (Poblacin finita)
Z Valor correspondiente a la distribucin de Gauss. Para el 95% de confianza, Z=1.96, para el
99% de confianza 2.57. (Estos valores provienen de las tablas de la distribucin normal Z)Se explicara
luego cuando se desarrolle curvaturas y desvo estndar)
p Probabilidad de xito o proporcin esperada. Esta idea se puede obtener revisando la
literatura, por estudio pilotos previos. Asumamos que puede ser prxima al 5%. En caso de no tener
dicha informacin utilizaremos el valor p = 0.5 (50%).
q Probabilidad de fracaso 1 p
178.71 179
Se requerira encuestar a no menos de 179 estudiantes para poder tener una seguridad del 95%
Ejemplo 2 Cmo hubiera cambiando el ejemplo anterior, si se desconoce la proporcin esperada?
Si se desconoce la proporcin esperada, se tendra que utilizar el criterio conservador (p = q =
0.5), lo cual maximiza el tamao de muestra de la siguiente manera:
623.7 624
1067
Aciertos
7
6
8
6
10
4
6
6
1
7
8
5
Clasificacin
Bueno
Bueno
Muy bueno
Bueno
Excelente
Regular
Bueno
Bueno
Malo
Muy bueno
Muy bueno
Regular
Frecuencia
1
2
5
3
1
Como podemos observar, el numero de resultados que puede alcanzar la variable Clasificacin son
pocos (solo cinco posibilidades), por lo cual identificaremos la tabla de frecuencia resultante como una
tabla de datos ordenados
La estadstica considera otros tipos de frecuencias auxiliares
La forma ms simple de agrupar datos consiste en indicar el nmero de veces que figura cada
valor de la variable estudiada. Ese numero de veces que la variable toma un determinado valor se llama
frecuencia.
, ser ms
intervalos,
que
1. Determinamos el Rango, que es igual a
2. Determinamos la amplitud de intervalo (limites entre el menor valor y mayor valor que va a
tener cada intervalo)
R
k
, tomamos 7 intervalos
R 406 317 89
89
i
12, 71 13 Se recomienda que la amplitud sea impar.
7
Una vez calculado los valores procedemos a confeccionar la tabla
X
317- 329
330-342
343-355
356-368
369-381
382-394
395-407
f
3
4
13
14
5
5
2
fa
3
7
20
34
39
44
46
PM
323
336
349
362
375
388
403
Si sumamos sucesivamente cada frecuencia nos encontramos con la frecuencia acumulada, cuyo
numero final nos da como resultado la totalidad de alumnos que participaron de la muestra al que
llamaremos con la letra n . El agrupamiento de datos se hace a travs de intervalos de clase o
simplemente intervalos