Vous êtes sur la page 1sur 14

Estadstica,

Poblacin, Muestra,
Sesgo, Variable,
Datos, Experimento,
Parmetro, Censo,
Muestreo, Encuesta,
Fuente, Error






UNIVERSIDAD AUTNOMA DE CENTRO AMRICA
SEDE REGIONAL PACFICO NORTE
NICOYA - GUANACASTE


CONCEPTOS
PRELIMINARES
DE ESTADSTICA




CURSO:
PROBABILIDAD Y ESTADSTICA


PREPARADO POR:
ING. ALLAN VILLEGAS ALEMN

2012

Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 2

Estadstica Descriptiva
Se denomina estadstica descriptiva al conjunto de procedimientos estadsticos
que sirven para organizar y resumir conjuntos de datos numricos. Algunos datos
pueden organizarse en una distribucin de frecuencias. Tambin pueden utilizarse
diversos tipos de grficas para describir datos. Los promedios especializados como la
media, mediana o moda, pueden calcularse para describir el valor central de un
grupo de datos numricos.
Estadstica Inferencial (tambin llamada estadstica analtica)
A partir de los datos obtenidos de manera descriptiva, se pueden realizar
procedimientos estadsticos que dan lugar a la estadstica inferencial. Tales
procedimientos sirven para deducir o inferir algo acerca de un conjunto de datos
numricos (poblacin), seleccionando un grupo menor de ellos (muestra).
Debemos agregar que la inferencia estadstica se usa para sacar conclusiones
sobre una poblacin, basadas en un modelo de probabilidad de variables aleatorias
de la poblacin.
Existen ciertos riesgos relacionados con el empleo de resultados de las
muestras para deducir algo acerca de una poblacin desconocida. Por ejemplo: un
estadstico puede querer usar la media de ingresos de una muestra aleatoria de
recin graduados en Psicologa para estimar la media de ingresos de todos los recin
graduados en Psicologa.
Como son muestras aleatorias diferentes darn estimaciones diferentes, se
necesita algn conocimiento de la variacin de todas las posibles estimaciones
derivadas de muestreos aleatorios, para llegar a conclusiones razonables.
Hay una serie de anlisis que se realizan a fin de evaluar los riesgos de tomar
una decisin incorrecta. Y de eso se ocupa la estadstica inferencial.
Poblacin
Se le llama Poblacin a la cantidad total de cualquier conjunto completo de
datos, objetos, individuos o resultados que tengan alguna caracterstica en comn
que se va a observar o analizar en un problema o experimento. Denotaremos al
tamao de la poblacin por N.
El significado estadstico que se le da al trmino poblacin es ms amplio que
el usual, ya que puede referirse a actos, reas geogrficas, casos, datos, objetos,
individuos, resultados, e incluso a temperaturas o tiempos.
Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 3
"Una poblacin es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones". Levin &
Rubin (1996).
"Una poblacin es un conjunto de elementos que presentan una caracterstica
comn". Crdenas (1974).
Poblacin Finita
Una Poblacin es finita cuando existe una cantidad determinada de elementos
por analizar; esto es, una cantidad de elementos, numerable y que en determinado
momento finaliza.
Ejemplo: a) Los habitantes del cantn de Nicoya.
Poblacin Infinita
Una Poblacin es infinita cuando existe una cantidad indeterminada de
elementos por analizar; es decir, una cantidad de elementos que aunque los
enumerramos nunca terminaramos de hacerlo. Por ejemplo:
1) Los valores de temperatura durante un da.
2) Todos los puntos de una lnea.
3) Nmero de alumnos de Psicologa en la U.T.I.C.A del presente y en el
futuro.
Muestra
Se le llama Muestra a cualquier subconjunto de elementos de la poblacin. El
inters de la Estadstica es proporcionar mtodos que permitan elegir una muestra
de datos representativos destinado a suministrar informacin a cerca de una
poblacin, ser fundamental que los elementos deben tener todas las caractersticas
de la poblacin.
"Se llama muestra a una parte de la poblacin a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
"Una muestra es una coleccin de algunos elementos de la poblacin, pero no
de todos". Levin & Rubin (1996).
"Una muestra debe ser definida en base de la poblacin determinada y las
conclusiones que se obtengan de dicha muestra solo podrn referirse a la
poblacin en referencia", Cadenas (1974).
Denotamos al tamao de la muestra por n. Las caractersticas de la muestra
dependen del criterio del muestreo empleado para su determinacin.
Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 4
Sin embargo, para que una muestra sea representativa de la poblacin, sta
deber contener aproximadamente entre el 5 % y el 10 % de los datos de la
poblacin cuando sta es finita, adems los elementos de la muestra deben ser
escogidos al azar (a la suerte) y se deben observar todas las caractersticas que se
observan en la poblacin.
Dentro de los tipos de muestras, se prefiere siempre las que son aleatorias (ver
variables aleatorias), ya que:
Eliminan los sesgos de seleccin.
Producen errores aleatorios que son medibles utilizando modelos
probabilsticos.
El error de muestreo puede hacerse tan pequeo como se quiera
aumentando el tamao de la muestra.
Variable
Se le llama Variable a la cualidad (caracterstica) o cantidad medible de
cualquier suceso o accin que presente o experimente un cambio, la podemos
representar mediante un smbolo (X, Y, Z, , , , ) y al cual se le puede asignar
un valor cualquiera de un conjunto determinado de datos.
Le llamamos Variable Aleatoria a aquella variable cuyos cambios no pueden
ser determinados antes de que estos se presenten; es decir, estn destinados a la
suerte. Tambin se le conoce como Variable Probabilista, Cabalstica, de Azar o a la
Suerte.
Tipos de variable
Para su estudio, las variables aleatorias se han clasificado segn la naturaleza
de los valores que toman en:
1) Variables Numricas:
a) Variables Numricas Discretas
b) Variable Numrica Continua


2) Variables Categricas:
a) Variables Categricas Nominales
b) Variables Categricas Ordinales

Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 5
1) Variables Numricas (o Cuantitativas): son aquellas que se identifican o se les
puede asignar un valor numrico o que corresponden a aspectos que son
medibles.
Ejemplo: Tiempo de uso, precio, tamao, velocidades, nmero de hijos
de una familia, nmero de carros que circulan por determinada calle,
alturas, pesos, tallas, temperaturas, tiempo de vida de una persona,
cantidad de azcar para endulzar un caf, medida de sombreros,
etctera.
Las variables numricas se dividen en:
a) Variables Numricas Discretas: son aquellas que solamente toman
valores enteros con rango finito.
Ejemplo: Nmero de hijos en cada familia de una colonia de la
ciudad, talla de calzado de cada alumno de un grupo escolar, la
cantidad de alumnos por grupo, etc.
b) Variable Numrica Continua: son aquellas que pueden tomar cualquier
valor entre dos valores dados. Es decir, el rango contiene no slo valores
enteros sino un intervalo (finito o infinito) de valores reales (esto es, que
puede ser fraccionario, decimal o irracional).
Ejemplo: El tiempo de vida de una persona, la cantidad de azcar
para endulzar un caf, el nivel de hemoglobina de los habitantes
de una colonia, la temperatura ambiental durante un da,
etctera.

2) Variables Categricas (o Cualitativas): son aquellas a las que no se les puede
asignar o identificar con un valor numrico, sino con un aspecto, cualidad o
caracterstica que las distinga y que no se pueden medir sino solo observar, a
ese aspecto, cualidad o caracterstica se le llama categora.
Ejemplos: Marca, tipo de sangre, deporte preferido, el estado en general
de cualquier cosa, idioma, nacionalidad, colores, cabello o piel, himnos
nacionales, sexo, estado de nimo, clima, etctera.
En las variables categricas, un elemento no puede estar en dos o ms
categoras a la vez, lo cual las hace excluyentes y adems no puede haber
elementos de la poblacin que no pertenezcan a alguna categora, lo cual las
hace exhaustivas.
Las variables categricas se dividen en:
Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 6
a) Variables Categricas Nominales: son aquellas a las que no se les puede
asignar un orden, es decir que slo permite clasificacin en categoras por
mencin de sta.
Ejemplo: La nacionalidad de una persona, idioma, sexo, himnos
nacionales.
b) Variables Categricas Ordinales: son aquellas que adems de clasificar a
los elementos en distintas categoras les podemos asignar un orden o que
podemos ordenar de acuerdo a cierta caracterstica.
Ejemplo: El estado de salud de una persona; que podemos ordenarla
segn la urgencia del caso, el color de algn objeto segn la tonalidad
desde muy clara a ms oscuro; que podemos ordenarlo de acuerdo a la
intensidad del color, el grado militar, puesto en la empresa, da de la
mam, meses del ao, etctera.
Datos
Se le llama Datos a las agrupaciones de cualquier nmero de observaciones
relacionadas. Para que se considere un dato estadstico debe tener dos
caractersticas:
a) Que sean comparables entre s.
b) Que tengan alguna relacin.
La recoleccin de informacin o recopilacin de datos estadsticos se divide en:
Datos Internos: son aquellos datos que no necesitan de observaciones adicionales al
experimento; es decir, no es necesario buscar caractersticas que proporcionen
informacin adicional acerca del experimento.
Ejemplo: Las calificaciones de un grupo, un experimento qumico, etctera.
Datos Externos: estos datos pueden ser de dos tipos:
a) Datos Bibliogrficos: son aquellos ya conocidos y que podemos encontrar
fcilmente utilizando bibliografa, registros, actas, etctera, como los datos
histricos, censos y otros.

b) Datos Originales: son aquellos que podemos obtener mediante mtodos de
recoleccin, como las encuestas, plebiscitos, referndum, y nos proporcionan
datos reales y certeros.

Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 7
Organizacin de Datos
Para Organizar los datos: existen muchas formas de clasificarlos, en general
pueden ser determinados de acuerdo a cuatro elementos que son:
1) Tiempo
2) Lugar
3) Cantidad
4) Cualidad.
Presentacin de Datos
Despus de la organizacin de los datos, la informacin se resume en Tablas
Estadsticas con base en arreglos formados de renglones y columnas, adecuados
segn cronologa, geografa, anlisis cuantitativo o cualitativo.
Los principales elementos de una tabla estadstica son: Ttulo, unidades,
encabezado, cuerpo o contenido, nota de pie y referencias; la informacin
contenida en una tabla estadstica tambin se puede presentar mediante
graficas, siendo las ms comunes las de lneas, barras, pictogrficas,
cronogramas, circulares o de pastel, histograma y polgono de frecuencias.
Experimento
Se le llama Experimento a toda accin o prueba que se realiza con el fin de
observar su resultado. Existen dos tipos de experimentos, que son:
Experimento Determinista: son aqullos en los que se puede predecir con
certeza su resultado antes de que ste se presente.
Ejemplo: Al lanzar en un cuarto un libro al aire con el fin de determinar
si flota, se queda unido al techo o cae al suelo, sabemos con certeza que
el libro caer al suelo, lo cual lo hace un experimento determinista.
Experimento Aleatorio, Probabilista, casual o de azar: hablar de aleatorio,
probabilista, casual o azar es hablar de algo que est determinado a la suerte.
As, decimos que un Experimento Aleatorio ocurre cuando no es posible
asegurar el resultado que se va a presentar.
Ejemplo: Al lanzar una moneda al aire no sabemos si el resultado va a
ser guila o sello, lanzar un dado, etctera.

Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 8
Valores Estadsticos
Se le llama valores estadsticos, estadsticos muestrales o simplemente
estadsticos a los valores o cantidades desconocidas que son obtenidas de, o que
hacen referencia a las caractersticas de una muestra.
Parmetros Poblacionales
Se le llama Parmetro poblacionales o simplemente parmetros a los valores o
cantidades desconocidas que son obtenidas de, o que hacen referencia a las
caractersticas de una poblacin.
Censo
Llamamos Censo al mtodo de recoleccin de datos mediante el cual la
informacin se obtiene del estudio de todos los elementos que componen a la
poblacin o universo bajo estudio.
Un censo debe cumplir las condiciones de universalidad (censar a todos los
elementos de la poblacin) y simultaneidad (realizarse en un momento determinado).
El trmino censo no slo se aplica a aquellos estudios que comprenden todas
las unidades del pas y que se realizan con frecuencia de recoleccin quinquenal o
decenal, como es el caso de los censos de poblacin, econmicos, agropecuarios,
etctera, sino tambin a cualquiera independientemente de su cobertura geogrfica,
nmero de unidades de informacin, o frecuencia de su recoleccin, siempre que
incluya todas las unidades que componen el universo que se investiga.
Muestreo
Se llama Muestreo al estudio que se hace de una poblacin por medio de
muestras representativas, debidamente elegidas de manera que posea todas las
caractersticas de una poblacin y de tamao determinado segn la precisin que de
ella se quiere obtener en las decisiones y conclusiones estadsticas posteriores.
Tipos de Muestreo
Fundamentalmente el muestreo es de dos tipos bsicos:

1) No probabilstico: tipo de muestreo en el que no es posible estimar la
probabilidad de que cada individuo o elemento estar incluido en la muestra,
adems no permite el clculo del posible error de la muestra. Pueden ser de
Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 9
tres clases: Accidental o incidental, por cuotas, intencional por conveniencia o
de juicio (aunque este tipo de muestreo no ser objeto de estudio en este curso).

2) Probabilstico o aleatorio: tipo de muestreo que se obtiene mediante sorteo de
los individuos que la forman teniendo as, cada individuo la misma posibilidad
de pertenecer a la muestra, permitiendo calcular el posible error de la
muestra. De entre los que destacan:

a) El muestreo aleatorio simple
b) El sistemtico
c) El estratificado
d) El de conglomerados

a) El muestreo aleatorio simple es el tipo de muestreo en el cual todos y cada
uno de los elementos de la poblacin se elige de tal forma que tengan la
misma posibilidad de ser seleccionados y pertenecer a la muestra.

b) El muestreo sistemtico se utiliza cuando el universo es de gran tamao o ha
de extenderse en el tiempo y requiere de una seleccin aleatoria inicial de
observaciones seguida de otra seleccin de observaciones, obtenida mediante
una constante denominada constante de sistematizacin

; donde
N es el tamao de la poblacin y n es el tamao de la muestra.
Esta constante nos sirve para determinar cada cuntos elementos o
cada cunto tiempo se debe elegir el siguiente; para ello hay que elegir al azar
un nmero entre 1 y Cs; de ah en adelante tomar uno de cada K a intervalos
regulares. Es conveniente tener en cuenta la periodicidad del fenmeno.
Ejemplo: Para obtener una muestra de suscriptores telefnicos en una
ciudad grande, puede obtenerse primero una muestra aleatoria de los
nmeros de las pginas del directorio telefnico; al elegir el vigsimo
nombre de cada pgina obtendramos un muestreo sistemtico, tambin
podemos escoger un nombre de la primera pgina del directorio y
despus seleccionar cada nombre del lugar nmero cien a partir del ya
seleccionado. En este caso, podramos seleccionar un nmero al azar
entre los primeros 100; suponiendo que el elegido es el 40, entonces
seleccionamos los nombres del directorio que corresponden a los
nmeros 40, 140, 240, 340 y as sucesivamente.
El muestreo sistemtico suele ser ms preciso que el aleatorio simple, ya
que recorre la poblacin de un modo ms uniforme.
Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 10
c) El muestreo estratificado es un tipo de muestreo en donde se involucra la
divisin previa de la poblacin en subgrupos, clases o estratos que se suponen
ms homogneos, y a los cuales se le asigna una cuota que determina el
nmero de miembros del estrato que compondrn la muestra, estos son
escogidos mediante muestreo aleatorio simple. Segn la cantidad de
elementos de la muestra que se han de elegir de cada uno de los estratos,
existen dos tcnicas de muestreo estratificado:

1) Asignacin proporcional: el tamao de cada estrato en la muestra es
proporcional a su tamao en la poblacin.

2) Asignacin ptima: la muestra recoger ms individuos de aquellos
estratos que tengan ms variabilidad. Para ello es necesario un
conocimiento previo de la poblacin.
Ejemplo: Suponiendo un estudio sobre la poblacin de estudiantes
de cierto curso en una universidad, en el que a travs de una
muestra de 10 de ellos queremos obtener informacin sobre el uso
del lpiz labial. Pero reflexionando sobre que el comportamiento de la
poblacin con respecto a esta caracterstica no es homogneo,
podemos dividir a la poblacin en dos estratos:
Estudiantes masculinos 40%.
Estudiantes femeninos 60%.
De modo que la asignacin proporcional a esta muestra es en
funcin de sus respectivos tamaos (6 varones y 4 mujeres).
Tambin se puede observar que el comportamiento de los varones
con respecto a la caracterstica en estudio es muy homogneo y
diferenciado del grupo de las mujeres que es muy variable. De modo
que la asignacin ptima de una muestra de 10 alumnos, nos indica
que es ms conveniente elegir ms individuos en los grupos de mayor
variabilidad.
De la cual obtendramos mejores resultados estudiando una
muestra de
1 varn.
9 mujeres.

d) El muestreo por conglomerados es el muestreo en el que se suele dividir
primero la poblacin en grupos o conglomerados convenientes para el
muestreo, seleccionando de cada uno de ellos una porcin, al azar o por un
Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 11
mtodo sistemtico. Bajo este mtodo, aunque no todos los grupos son
muestreados, cada grupo tiene una igual probabilidad de ser seleccionado.
Por lo tanto, la muestra es aleatoria. Una muestra por conglomerados,
usualmente produce un mayor error muestral que una muestra aleatoria
simple del mismo tamao; sin embargo, puede ser obtenida dentro de un corto
perodo de tiempo y a bajo costo.
Adems una muestra por conglomerados ofrece la misma precisin en la
estimacin que una muestra aleatoria simple, si la variacin de los elementos
individuales dentro de cada conglomerado es proporcionalmente tan grande
como la de la poblacin.

Cundo usar muestras? (Resumen)
La poblacin es infinita o muy grande y es imposible fsicamente cubrir todos
los elementos que la componen.

La poblacin es finita pero lo suficientemente grande para que el estudio de
todos los elementos no sea aconsejable, porque resultara demasiado costoso y
tomara tanto tiempo que hara que los datos resultaran obsoletos o intiles
en el momento en el que estn disponibles.

La unidad de estudio se transforma o se destruye al ser examinada.

Los resultados que arrojara una muestra bien seleccionada, de tamao
razonable, seran suficientemente precisos para los fines prcticos que se
persiguen con los datos.


Fuentes Primarias y Secundarias
Algunas fuentes publican o suministran datos solamente recogidos por ellas
mismas. Estas fuentes se denominan Fuentes Primarias.
Los volmenes censales que publica cada 10 aos el Instituto Nacional de
Estadstica y Censos (INEC) en Costa Rica. As como las Estadsticas Viales. Otros
ejemplos de fuentes primarias son: el Informe trimestral del Banco Central de Costa
Rica, la Encuesta de Hogares que realizan y publican cada cuatro meses la
direccin de Empleo del Ministerio de Trabajo en conjunto con el INEC.
Otras fuentes toman y publican estadsticas originalmente recogidas por otros
y se le denominan Fuentes Secundarias.
Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 12
Un ejemplo tpico -en Costa Rica- lo constituye los Los Planidatos, publicados
por el Ministerio de Planificacin y Poltica Econmica (MIDEPLAN), en los cuales se
resumen y presentan numerosas series estadsticas recogidas y elaboradas por otras
instituciones nacionales productoras de datos: INEC, BANCO CENTRAL, etc.
Sesgos
El que una muestra sea de tamao razonable o aun grande no garantiza que
ella sea representativa de la poblacin. Hay muchos ejemplos de estudios basados
en muestras muy grandes que han producido resultados errados porque a pesar de
su tamao, esas muestras tenan fallas de seleccin sesgos- que las hacan no
representativas.
Recordemos que, en la prctica se pueden distinguir tres formas de seleccin
de las muestras:
a) Aleatoria o al azar: es decir, dndole a cada uno de los elementos de la
poblacin una probabilidad conocida de ser incluido en la muestra. Un
caso particular es aqul en el que a todos los elementos se les da la
misma probabilidad; este procedimiento recibe el nombre de muestreo
simple al azar.
b) Intencional: o sea utilizando el juicio de una persona con experiencia y
conocimiento con respecto a la poblacin que se estudia.
c) Por conveniencia: es decir, escogiendo las unidades o elementos que
estn disponibles o que son ms fciles de conseguir.
Si nos confiamos del procedimiento c, corremos el riesgo de que la muestra
no sea representativa, ya que es casi seguro que las unidades estadsticas
disponibles o fciles de conseguir son de naturaleza diferente a la de las dems
unidades.
Y si nos fiamos de procedimiento b, igualmente corremos el riesgo de que la
muestra no sea representativa, ya que la experiencia ha demostrado que las
personas tienen tendencias, muchas de ellas inconscientes, que hacen que cuando
seleccionan una muestra intencional, les den preferencia a ciertos elementos en
perjuicio de otros.
La seleccin al azar a, tambin produce discrepancias entre el resultado
dado por la muestra y el valor de la poblacin, discrepancias cuyas magnitudes y
sentido (direccin) no pueden predecirse para una muestra; se trata de errores
aleatorios o errores de muestreo, que tienen su origen exclusivamente en el hecho de
que se trabaja con una muestra y sta es seleccionada al azar.
Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 13
La seleccin intencional (b) o por juicio, en cambio, produce bsicamente
discrepancias o errores en un solo sentido, es decir, lo que se denomina como sesgos
de seleccin.
En general, los sesgos son errores sistemticos o sea, en un solo sentido, y pueden
ser de seleccin o de medicin.
Los sesgos de seleccin se presentan nicamente cuando se utilizan
muestras. Adems, no pueden ser evaluados o medidos con un modelo
matemtico.

Los sesgos de medicin son comunes a censos y a muestras. Por
ejemplo: el caso de una persona que mida con un metro al que le han
quitado 2 centmetros. Al medir siempre estara exagerando, pero
apenas se descubra esta falla en el metro es posible corregir las
mediciones ya realizadas.
Los errores de muestreo, por su naturaleza aleatoria, si pueden ser evaluados o
medidos con los modelos matemticos que brinda la teora de probabilidades.

Conceptos Preliminares de Estadstica

Ing. Allan Villegas Alemn Pgina 14

Referencias

LIPSCHUTZ, SEYMOUR y SCHILLER, JOHN. Introduccin a la Probabilidad y
Estadstica, Editorial McGraw Hill. 2000.

SPIEGEL, MURRAY. Manual de Frmulas y Tablas Matemticas, Editorial McGraw
Hill.1998.

GMEZ, MIGUEL. Estadstica Descriptiva, Oficina de publicaciones de la Universidad
de Costa Rica, 1977.

QUINTANA, CARLOS. Estadstica Elemental, Editorial Mster Libro S.A.1992.

Vous aimerez peut-être aussi