Vous êtes sur la page 1sur 35

Qu es la Estadstica?

Ahora, a pesar de ser la anterior una respuesta entendible y completa, es necesario el exponer otras
interesantes definiciones acerca del tema, tales como las siguientes:

1. Es una rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que ayuda a

resolver problemas como el diseo de experimentos y la toma de decisiones. [6]

2. Es el recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer

comparaciones y sacar conclusiones. [12]

3. Es un conjunto de mtodos cientficos ligados a la toma, organizacin, recopilacin, presentacin y anlisis

de datos, tanto para la deduccin de conclusiones como para tomar decisiones razonables de acuerdo con

tales anlisis. [13]

4. Es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series

de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas

previsiones para el futuro. [14]

5. En general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de

datos numricos con el fin de realizar una toma de decisin ms efectiva. [14]

6. Es la ciencia que tiene por objeto el estudio cuantitativo de los colectivos. Enrique Chacn [14]

7. La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad,

deducir las leyes que los rigen y hacer su prediccin prxima.


scar Vzquez Mnguez [14]
Ahora bien, en cuanto a la Estadstica Descriptiva, especficamente hablando, podemos definirla como la
ciencia que analiza, estudia y describe a la totalidad de individuos de una poblacin. Su finalidad es obtener
informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y
rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. [6]
Divisin de la Estadstica y su Objeto de Estudio
La Estadstica se puede clasificar en funcin de su etapa o funcin, del tiempo considerado o del nmero de variables
estudiadas.

La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran
cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Tiene
como propsito la descripcin del conjunto de datos colectados, as como la generalizacin y/o toma de
decisiones acerca de las caractersticas de todas las observaciones potenciales
bajo consideracin. En consecuencia nos permite organizar y resumir datos para poder realizar
inferencias (conclusiones) relativas a los mismos. Para su mejor estudio se han creado varias formas de
clasificar los estudios estadsticos. Algunas de las ms comunes son las siguientes:
Clasificacin de la Estadstica segn la etapa o funcin
Generalmente se considera que la estadstica tiene dos funciones (divisiones). Hay una estadstica
descriptiva y una estadstica inferencial. La primera etapa se ocupa de describir la muestra, y la segunda
etapa infiere conclusiones a partir de los datos que describen la muestra (por ejemplo con respecto a la
poblacin). A continuacin, se dar paso a describir brevemente, cada etapa.
Estadstica Descriptiva o Deductiva
Se refiere a la recoleccin, presentacin, descripcin, anlisis e interpretacin de una coleccin de datos,
esencialmente consiste en resumir stos con uno o dos elementos de informacin (medidas descriptivas)
que caracterizan la totalidad de los mismos.

La Estadstica Descriptiva recolecta, describe, analiza, interpreta y presenta los datos de una poblacin en forma de tablas y
grficas

Consiste sobre todo en la presentacin de datos en forma detablas y grficas; as que se emplea
simplemente para resumir de forma numrica o grfica un conjunto de datos. Esta comprende cualquier
actividad relacionada con los datos y est diseada para resumir o describir los mismos sin factores
pertinentes adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como tales.
La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre s mismos
y no sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para resumir o describir cualquier
conjunto ya sea que se trate de una poblacin o de una muestra, cuando en la etapa preliminar de la
Inferencia Estadstica se conocen los elementos de una muestra.
As pues, si aplicamos las herramientas ofrecidas por la estadstica descriptiva a una muestra, solo nos
limitaremos a describir los datos encontrados en dicha muestra, por lo que no se podr generalizar
la informacin hacia la poblacin.

Estadstica Inferencial o Inductiva

La Estadstica Inferencial trabaja a base de muestras para inferir aspectos de la poblacin.

La estadstica descriptiva trabaja con todos los individuos de la poblacin. La estadstica inferencial, sin
embargo, trabaja con muestras, subconjuntos formados por algunos individuos de la poblacin. A partir del
estudio de la muestra se pretende inferir aspectos relevantes de toda la poblacin. Cmo se selecciona la
muestra, cmo se realiza la inferencia, y qu grado de confianza se puede tener en ella son aspectos
fundamentales de la estadstica inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de
estadstica, probabilidad y matemticas.
Para que stas generalizaciones sean vlidas la muestra deben ser representativa de la poblacin y
la calidad de la informacin debe ser controlada, adems puesto que las conclusiones as extradas estn
sujetas a errores, se tendr que especificar el riesgo o probabilidad que con que se pueden cometer
esos errores.
La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra tomada. Es as que
permite realizar conclusiones o inferencias, basndoseen los datos simplificados y analizados de
una muestra hacia la poblacin o universo.
Por ejemplo, a partir de una muestra representativa tomada a los habitantes de una ciudad, se podr
inferir la votacin de todos los ciudadanos que cumplan los requisitos con un error de aproximacin.

En sus particularidades la Inferencia distingue la Estimacin (cuando se usan las caractersticas de la


muestra para hacer inferencias sobre las caractersticas de la poblacin) y la Contrastacin de
Hiptesis (cuando se usa la informacin de la muestra para responder a interrogantes sobre la poblacin).
Clasificacin de la Estadstica segn el tiempo considerado
Si se clasifica la Estadstica en base al tiempo considerado, tenemos la Estadstica Esttica (datos de la actualidad) y la
Estadstica Evolutiva (datos del pasado).

Dentro de la estadstica descriptiva se distinguen los datos en funcin al tiempo en que se encuentra
analizada la poblacin; de esta manera, tenemos 2 clasificaciones:
Estadstica Esttica o Estructural
La estadstica esttica o estructural, que describe la poblacin en un momento dado empleando datos de la
actualidad (por ejemplo la tasa de nacimientos en determinado censo)
Estadstica Dinmica o Evolutiva
La estadstica dinmica o evolutiva, que describe como va cambiando la poblacin en el
tiempo empleando datos del pasado (por ejemplo el aumento anual en la tasa de nacimientos).

Clasificacin de la Estadstica segn la cantidad de variables estudiada


Tambin, se puede clasificar a la Estadstica en funcin de la cantidad de variables que estn siendo
estudiadas en determinado problema estadstico. Desde este punto de vista hay una estadstica
univariada (estudia una sola variable, como por ejemplo la inteligencia, en una muestra), una estadstica
bivariada (estudia cmo estn relacionadas dos variables, como por ejemplo inteligencia y alimentacin), y
una estadstica multivariada (que estudia tres o ms variables, como por ejemplo como estn relacionados
el sexo, la edad y la alimentacin con la inteligencia).
Estadstica Univariada

Un ejemplo perfecto del anlisis estadstico univariado, es la utilizacin del promedio o media aritmtica, pues slo se mide
una variable.

Cuando el anlisis presenta caracterstica por caracterstica, aisladamente, estaremos en presencia de


un anlisis estadstico univariado. Esto quiere decir, que se est estudiando una sola variable.
El anlisis univariado es el anlisis bsico, primario. Las caractersticas o propiedades de las personas o
cosas han de medirse una a una, de modo univariado y si se presentan de esa manera decimos que es
anlisis univariado.

Los estadsticos bsicos que conocemos, como la media, la mediana, la moda, la varianza, los porcentajes,
entre otros, miden una variable. Es decir, fueron hechos univariados.
Ahora bien este tipo de anlisis ha sido muy criticado ya que la realidad se presenta interconectada,
relacionada. Por ejemplo existe una relacin entre el peso y la talla de las personas o entre la el inters y
el rendimiento escolar, etc.

Como la realidad se presenta relacionada necesitamos mtodos ms rigurosos para evaluarla. Esto lo
podemos hacer de dos modos; El primero es medir las variables de modo univariado (analizarlas) y
relacionarlas luego en la interpretacin.

Estadstica Bivariada
La Estadstica bivariada, busca la relacin entre 2 variables, mediante la elaboracin de ndices y resultados estadsticos

La estadstica univariada se aplica, por lo general, en explotaciones estadsticas bsicas de la fuente de


datos (frecuencias, porcentajes, promedios, tasas). La estadstica bivariada trata de ir ms all elaborando
ndices y resultados estadsticos en trminos de relaciones entre dos variables de inters, as como de
establecer inferencias sobre una poblacin a partir de datos que provienen de una muestra (como, por
ejemplo, en los estudios mediante encuesta).
El conjunto de tcnicas estadsticas bivariadas difiere en funcin del tipo de datos de los que se dispone
(niveles de medida: nominal, ordinal, intervalo, razn), adaptndose en todo momento al contexto de anlisis
aplicado en el que nos encontremos.
Estadstica Multivariada

La Estadstica multivariada tiene diversas aplicaciones en una enorme cantidad de reas, como los son: la agricultura, el
deporte, la psicologa, la economa, etc.

Los mtodos estadsticos multivariantes y el anlisis multivariante son herramientas estadsticas que
estudian el comportamiento de tres o ms variables al mismo tiempo. Se usan principalmente
para buscar las variables menos representativas para poder eliminarlas, simplificando as modelos
estadsticos en los que el nmero de variables sea un problema y para comprender la relacin entre
varios grupos de variables. Algunos de los mtodos ms conocidos y utilizados son la Regresin lineal y el
Anlisis discriminante.
Se pueden sintetizar dos objetivos claros:

1. Proporcionar mtodos cuya finalidad es el estudio conjunto de datos multivariantes que el anlisis estadstico

uni y bidimensional es incapaz de conseguir.

2. Ayudar al analista o investigador a tomar decisiones ptimas en el contexto en el que se encuentre teniendo

en cuenta la informacin disponible por el conjunto de datos analizado.


Los datos multivariados surgen cuando a un mismo individuo se le mide ms de una caracterstica de inters.
Un individuo puede ser un objeto o concepto que se puede medir. Ms generalmente, los individuos son
llamados unidades experimentales. Ejemplos de objetos: personas, animales, terrenos, compaas, pases,
etc. Ejemplos de conceptos: amor, amistad, noviazgo, etc. Una variable es una caracterstica o atributo que
se le mide a un individuo.
Las aplicaciones de la estadstica multivariada estn presentes en distintas reaso ramas de la ciencias,
como por ejemplo en: Investigacin de mercados (para identificar caractersticas de los individuos con el
propsito de determinar qu tipo de personas compran determinado producto); en el sistema de educacin de
cualquier tipo de especialidad (para conocer los estudiantes que tendrn xito y concluirn
satisfactoriamente sus estudios); en la agricultura (al estudiar la resistencia de determinado tipo de
cosechas a daos por plagas y sequas); en el deporte (para conocer a partir de medidas antropomtricas
las posibilidades de obtener buenos resultados en un deporte especfico); en la psicologa (al estudiar la
relacin entre el comportamiento de adolescentes y actitudes de los padres); en la economa (para conocer
el nivel de desarrollo de un territorio en relacin con otros y realizar inferencias a partir de variables
econmicas fundamentales, entre otros).
[6], [15], [16], [17], [18], [19], [20] y [21]

Elementos bsicos de la Estadstica


Concepto de Poblacin

En estadstica, poblacin es el conjunto de datos de un problema estadstico determinado.

Poblacin estadstica, tambin llamada universo o colectivo, es el conjunto de elementos de referencia sobre
el que se realizan las observaciones.
El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una
poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas
comunes. Algunas de las definiciones ms aceptadas son:
Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca
de los cuales intentamos sacar conclusiones.

Levin & Rubin (1996).


Una poblacin es un conjunto de elementos que presentan una caracterstica comn.

Cadenas (1974).
Es entonces que cuando tenemos un conjunto muy grande de datos numricos para analizar decimos que
tenemos un Universo o Poblacin de observaciones; tiene como
objetivo final descubrir las caractersticas y propiedades de aquello que gener los datos. En estadstica
es representado con N.
Existen distintos tipos de poblaciones que son:

o Poblacin base: es el grupo de personas designadas por las siguientes caractersticas:

personales, geogrficas o temporales, que son elegibles para participar en el estudio.

o Poblacin muestreada: es la poblacin base con criterios de viabilidad o posibilidad de realizarse

el muestreo.
o Muestra estudiada: es el grupo de sujetos en el que se recogen los datos y se realizan las observaciones,

siendo realmente un subgrupo de la poblacin muestreada y accesible. El nmero de muestras que se puede

obtener de una poblacin es una o mayor de una.

o Poblacin diana: es el grupo de personas a la que va proyectado dicho estudio, la clasificacin caracterstica

de los mismos, lo cual lo hace modelo de estudio para el proyecto establecido.


Concepto de Muestra

Una muestra de poblacin, en estadstica, es un conjunto de datos representativos del total de una poblacin o universo.

Muestra de poblacin, seleccin de un conjunto de individuos representativos de la totalidad del


universo objeto de estudio, reunidos como una representacin vlida y de inters para la investigacin de
su comportamiento.
Los criterios que se utilizan para la seleccin de muestras pretenden garantizar que el conjunto
seleccionado represente con la mxima fidelidad a la totalidad de la que se ha extrado, as como hacer
posible la medicin de su grado de probabilidad.
Otras definiciones altamente aceptadas, son:

Se llama muestra a una parte de la poblacin a estudiar qu sirve para representarla.

Murria R. Spiegel (1991).


Una muestra es una coleccin de algunos elementos de la poblacin, pero no de
todos.

Levin & Rubin (1996).


Una muestra debe ser definida en base de la poblacin determinada, y las
conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en
referencia

Cadenas (1974).
La muestra tiene que estar protegida contra el riesgo de resultar sesgada, manipulada u orientada durante
el proceso de seleccin, con la finalidad de proporcionar una base vlida a la que se pueda aplicar la teora
de la distribucin estadstica. A la muestra de una poblacin se le representa en estadstica con la letra n.
Es as muestreo probabilstico, consiste en elegir una muestra de una poblacin al azar. Podemos
distinguir varios tipos de muestreo.
Muestreo aleatorio simple:
El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada individuo de la poblacin y 2) a
travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros
aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario
para completar el tamao de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que
estamos manejando es muy grande.

Muestreo aleatorio sistemtico:


Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de
extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero
elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,,
i+(n-1) k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la poblacin
entre el tamao de la muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero
al azar entre 1 y k.

El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al
elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacin.

Muestreo aleatorio estratificado:


Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad
respecto a alguna caracterstica. Lo que se pretende con este tipo de muestreo es asegurarse de que
todos los estratos de inters estarn representados adecuadamente en la muestra.

Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formarn parte de la muestra. La
distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede ser de
diferentes tipos:

o Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales.

o Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en cada

estrato.

o Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la

proporcin y la desviacin tpica.


Muestreo aleatorio por conglomerados:
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados
(el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos
pertenecientes a los conglomerados elegidos.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la poblacin que forman
una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios,
una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son
reas geogrficas suele hablarse de muestreo por reas.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos sealar:
1. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.

2. Como consecuencia del punto anterior ahorraremos costes.

3. Estudiar la totalidad de los pacientes o personas con una caracterstica determinada en muchas ocasiones

puede ser una tarea inaccesible o imposible de realizar.

4. Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones y mediciones

realizadas a un reducido nmero de individuos pueden ser ms exactas y plurales que si las tuvisemos que

realizar a una poblacin.

5. La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una poblacin al indicar los

criterios de inclusin y/o exclusin.


Tipos y clasificacin de Datos Estadsticos

Los Datos Estadsticos, son aquellos que se estudian en cada elemento de la muestra y son variables que tomaran valores
dependiendo del problema.

Los datos estadsticos son lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo,
peso, talla, tensin arterial sistlica, etctera). Los datos son los valores que toma la variable en cada caso.
Lo que vamos a realizar es medir, es decir, asignar valores a las variables incluidas en el estudio.
Deberemos adems concretar la escala de medida que aplicaremos a cada variable.
La naturaleza de las observaciones ser de gran importancia a la hora de elegir el mtodo estadstico ms
apropiado para abordar su anlisis. Con este fin, clasificaremos a estos datos estadsticos, a grandes rasgos,
en dos tipos: datos cuantitativos o datos cualitativos.
Datos cuantitativos
Las Datos Cuantitativos son aquellos que se pueden expresar mediante valores numricos, y se dividen en continuos (enteros
y decimales) y discretos (slo enteros):

Son las variables que pueden medirse, cuantificarse o expresarse numricamente y pueden ser manipulados
estadsticamente. Incluyen tabulaciones de frecuencia, porcentajes, medias y promedios. Si entre cada dos datos
puede haber una infinidad de ellos, se llaman continuos, y si entre un dato y otro siempre hay un hueco o
salto, se llaman discretos.
Datos cuantitativos continuos: si admiten tomar cualquier valor dentro de un rango numrico determinado,
es decir, que pueden expresarse con nmeros decimales o fraccionarios. (Densidad de un lquido, la fuerza
de un muelle, edad, peso, talla).
Datos cuantitativos discretos: si no admiten todos los valores intermedios en un rango. Suelen tomar
solamente valores enteros (Nota de un examen, nmero de hijos, nmero de partos, nmero de hermanos,
etc.).
Datos cualitativos.

Son datos que no se pueden expresar numricamente, debido a que suponen cualidades, opiniones, sentimientos entre otros,
y se dividen en nominales (categoras que no mantiene relacin de orden) y los jerarquizados (escalas utilizadas bajo un
orden).

Datos que expresan cualidades, como opiniones, sentimientos, observaciones y cambios en


el comportamiento que clasifica a cada caso en una de varias categoras (Domroese & Sterling 1999). La
situacin ms sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer,
enfermo/sano, fumador/no fumador).
Son datos dicotmicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificacin no es
suficiente y se requiere de un mayor nmero de categoras (color de los ojos, grupo sanguneo, profesin,
etctera).
En el proceso de medicin de estas variables, se pueden utilizar dos escalas:

o Escalas nominales: sta es una forma de observar o medir en la que los datos se ajustan por categoras que

no mantienen una relacin de orden entre s (color de los ojos, sexo, profesin, presencia o ausencia de un

factor de riesgo o enfermedad, etctera).


o Escalas ordinales o jerarquizados: en las escalas utilizadas, existe un cierto orden o jerarqua entre las

categoras (grados de disnea, estadiaje de un tumor, etctera).


Tipos y clasificacin de Variables Estadsticas
Una variable estadstica es cada una de las caractersticas o cualidades que poseen los
individuos de la poblacin que estamos interesados en estudiar. Se pueden clasificar en funcin a la
Medicin o a la influencia.
VARIABLES EN FUNCIN DE SU MEDICIN
Existen dos tipos: las variables cualitativas y las variables cuantitativas.
VARIABLE CUALITATIVA
Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros.
Podemos distinguir dos tipos:

o Variable cualitativa nominal: presenta modalidades no numricas que no admiten un criterio de orden.
Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

o Variable cualitativa ordinal o variable cuasicuantitativa: presenta modalidades no numricas, en las que

existe un orden.
Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente.

Puesto conseguido en una prueba deportiva: 1, 2, 3,


Medallas de una prueba deportiva: oro, plata, bronce.

La variable que tiene resultados o valores que tienden a variar de observacin en observacin debido a
los factores relacionados con el azar recibe el nombre de variable aleatoria. Las variables aleatorias pueden
ser discretas y continuas.
VARIABLE CUANTITATIVA
Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones
aritmticas con ella. Podemos distinguir dos tipos:
Variable discreta: Una variable discreta es aquella que toma valores aislados, es decir no admite valores
intermedios entre dos valores especficos. Es decir, slo puede ser expresado con nmeros enteros.
Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua: Una variable continua es aquella que puede tomar valores comprendidos entre dos
nmeros por lo cual tiene un nmero infinito de valores posibles. Es decir, puede ser expresada con nmeros
decimales o fraccionarios.
Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales.
VARIABLES EN FUNCIN DE SU INFLUENCIA
VARIABLES INDEPENDIENTES
Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrnsecamente a
los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables
independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de
un sesgo.
Es aquella caracterstica o propiedad que se supone ser la causa del fenmeno estudiado. En investigacin
experimental se llama as a la variable que el investigador manipula.
VARIABLES DEPENDIENTES
Son las variables de respuesta que se observan en el estudio y que podran estar influenciadas por los
valores de las variables independientes. Hayman la define como propiedad o caracterstica que se trata de
cambiar mediante la manipulacinde la variable independiente. La variable dependiente es el factor que es
observado y medido para determinar el efecto de la variable independiente.
Fuentes del subtema 1.5 [22], [23], [24], [25], [25], [27], [28], [29] y [30],

Cuadros Estadsticos
Qu es un cuadro o tabla estadstica?
Un cuadro estadstico es una representacin grafica de las diversas situaciones que se nos presentan
diariamente; sirve para presentar de forma ordenada las distribuciones de frecuencias. Es la forma
esquemtica de comprender las tendencias de nuestra forma de ser y de vivir. En un cuadro estadstico
puedes identificar tantas variables como quieras; se realiza como un resumen del conjunto de datos que se
poseen, distribuidos segn las variables que se estudian.
Su forma general es la siguiente:

Modalidad Frec. Abs. Frec. Rel. Frec. Abs. Acumu. Frec. Rel. Acumu.

C ni fi Ni Fi

c1 n1 N1 = n1

cj nj

ck nk Nk = n Fk = 1

n 1

Es un instrumento que permite sintetizar y/o presentar la informacin de un hecho investigado, y consta de
cinco elementos principales:

Cabeza: parte inicial donde se registra el ttulo.


Columna principal: Aqu anotamos las categoras ordenadas obtenidas.
Encabezado de columnas: Smbolos que explican el objeto en estudio, o las caractersticas fundamentales
que dan lugar al ingreso de la informacin (vaciado de datos).
Cuerpo: Conjunto de datos estadsticos realmente observados y distribuidos de acuerdo a las
caractersticas predeterminadas.
Fuente: Referencia donde se adquiere la informacin.
Cmo construir tablas o cuadros estadsticos?
Si tenemos datos estadsticos que los podemos manejar tambin los podemos ordenar. Si luego de la
recopilacin, obtenemos un conjunto de datos estadsticos demasiado numeroso, poco o nada se puede
hacer con ellos. Pero si los organizamos y los clasificamos se nos va a facilitar la informacin incluso
la interpretacin.

La forma ms correcta es en una tabla de distribucin de frecuencias, y su elaboracin no requiere ningn


artificio especial, basta con anotar los datos en fila o en columna.

Cuando elaboramos estas tablas se debe tener presente lo siguiente:


o Si se trabaja con variables discretas las clases pueden ser sin agrupamiento, siempre y cuando su recorrido sea

menor a 20.

o Cuando estamos encontrando estadsticas de variables continuas y por lo general numerosa, debemos agrupar,

o por lo general cuando su rango sea mayor a 20.

o
Por consiguiente podemos obtener 3 tipos de series:

1. Serie simple o tipo I, tambin llamada ordinaria (cuando las estadsticas representan un rango menor a
10.
2. Serie de frecuencia, o tipo II (cuando las estadsticas observadas se repiten y su rango est entre mayor
a 10 y menor que 20).
3. Serie de intervalos de clase o tipo III, o de datos agrupados (cuando los datos observados son numerosos
o su rango es mayor que 20).
Tipos de Tablas o Cuadros Estadsticos
Las tablas o cuadros estadsticos no tienen modelo nico, estn sujetos a las exigencias de la informacin
y del investigador (revise, estudie y analice los cuadros de la gua didctica y texto bsico.

Las tablas estadsticas segn el nmero de observaciones y segn el recorrido de la variable estadstica,
as tenemos los siguientes tipos de tablas estadsticas:

1. Tablas Tipo I

2. Tablas Tipo II

3. Tablas Tipo III


Tablas tipo I: Cuadro Simple
Cuando el tamao de la muestra y el recorrido de la variable son pequeos, por ejemplo si tenemos una
muestra de las edades de 5 personas, por lo que no hay que hacer nada especial simplemente anotarlas
de manera ordenada en filas o columnas.

Edad de los 5 miembros de una familia:

5 11 22 40 65 80

Tablas tipo II: Cuadro de Frecuencias


Cuando el tamao de la muestra es grande y el recorrido de la variable es pequeo, por lo que hay valores
de la variable que se repiten. Por ejemplo, si preguntamos el nmero de personas activas que hay en 50
familias obtenemos la siguiente tabla:

Personas Activas en 50 familias

2 1 2 2 1 2 4 2 1 1

2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2

3 2 3 1 2 4 2 1 4 1

1 3 4 3 2 2 2 1 3 3

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una
tabla en la que resumamos estos datos quedando la siguiente tabla:

Personas Activas Nmero de Familias

1 16

2 20

3 9

4 5

Total 50

Tablas tipo III: Cuadro de Intervalos


Cuando el tamao de la muestra y el recorrido de la variable son grandes, por lo que ser necesario agrupar
en intervalos los valores de la variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero
que en ese momento llevan encima, nos encontramos con los siguientes datos:

450 1152 250 300 175 80 25 2680

5 180 200 675 500 375 1500 205

605 785 1595 2300 5000 1200 100 985

185 125 315 425 560 1100

Evidentemente, la variable estadstica tiene un recorrido muy grande, 4998 pesetas, por lo que s queremos
hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos,
necesitaremos decidir cuntos intervalos queremos?
Normalmente se suele trabajar con no ms de 10 o 12 intervalos.

Amplitud =4998/10 = 499,8 Por lo que tomaremos intervalos de amplitud 500

Debemos tener en cuenta las siguientes consideraciones:

o Tomar pocos intervalos implica que la prdida de informacin sea mayor.

o Los intervalos sern siempre Cerrados por la izquierda y Abiertos por la Derecha [ Li-1 , Li )

o Procuraremos que en la decisin de intervalos los valores observados no coincidan con los valores de los

extremos del intervalo y si esto ocurre que no sea en ms de un 5% del total de observaciones.
Con estas recomendaciones tendremos la siguiente tabla:

[ Li-1 , Li ) Frecuencia

[ 0,500) 16

[ 500, 1000) 6

[ 1000,1500) 3

[ 1500, 2000) 2

[ 2000, 2500) 1

[ 2500, 3000) 1

[ 3000, 3500) 0

[ 3500, 4000) 0

[ 4000, 4500) 0

[ 4500, 5000) 0

[ 5000,5500) 1

Fuentes del subtema 1.8 [31], [32], y [33]

Representacin Grfica de los Datos de una Tabla de Distribucin de


Frecuencias
Qu son las Grficas Estadsticas?
La Representacin Grfica de un conjunto de datos recopilados, es una manera rpida y eficiente de presentar
estadsticamente la informacin.

Cuando se hace un estudio estadstico se obtiene una gran cantidad de datos numricos. Para tener una
informacin clara y rpida de lo obtenido en el estudio se han creado las grficas estadsticas.
Gran parte de la utilidad que tiene la Estadstica Descriptiva es la de proporcionar un
medio para informarbasado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de
informacin depender de la presentacin de los datos, siendo la forma grfica uno de los ms rpidos y
eficientes, aunque tambin uno de los que ms pueden ser manipulados o ser malinterpretados si no se
tienen algunas precauciones bsicas al realizar las grficas.
Existen tambin varios tipos de grficas, o representaciones grficas, utilizndose cada uno de ellos de
acuerdo al tipo de informacin que se est usando y los objetivos que se persiguen al presentar la
informacin.
Entonces, algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier grfica
a fin de que la informacin sea transmitida de la manera ms eficaz posible y sin distorsiones son:

1. El eje que represente a las frecuencias de las observaciones (comnmente el vertical o de las ordenadas)

debe comenzar en cero (0), de otra manera podra dar impresiones errneas al comparar la altura, longitud

o posicin de las columnas, barras o lneas que representan las frecuencias.

2. La longitud de los espacios que representan a cada dato o intervalo (clase) en la grfica deben ser iguales.

3. El tipo de grfico debe coincidir por sus caractersticas con el tipo de informacin o el objetivo que se persigue

al representarla, de otra manera la representacin grfica se convierte en un instrumento ineficaz, que produce

ms confusin que otra cosa, innecesario o productor de malinterpretaciones.


Existen decenas de tipos de grficas, a continuacin te presento los ms usuales e importantes.

Por ejemplo, si se desea representar la proporcin de poblacin masculina en un pas conviene ms usar
una grfica de pastel o circular que una grfica de barras al compararla contra la poblacin femenina; por
un lado se puede apreciar dicha proporcin, por el otro se aprecia cul de las dos poblaciones es mayor.

Hay un punto que conviene remarcar: existe software que permite la construccin rpida y eficiente de
grficas a partir de bases de datos o hojas de clculos, pero no importa cun bonita, bien delineada, bien
coloreada o bien presentada est una grfica, si no se han tomado en cuenta consideraciones de este tipo
que tienen que ver ms sobre el objetivo de estas herramientas y la Estadstica: la transmisin eficiente de
la informacin.
Hay muchos tipos de grficas estadsticas. Cada una de ellas es adecuada para un estudio determinado, ya
que no siempre se puede utilizar la misma para todos los casos. Tienen una estructura distinta, lo cual les
permite ser utilizados para diferentes objetivos, y es que la mayora de las veces utilizan datos o variables
distintos.
A continuacin, se presentarn las grficas estadsticas ms utilizadas:

Histograma

Histograma de Frecuencias

Un histograma es una representacin grficade una variable en forma de barras.


Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han
agrupado en clases.
En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y por altura,
la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de
los valores representados.
Un ejemplo es el que se presenta abajo y que representa el nmero de visitas que ha tenido este hipertexto
de acuerdo a la hora de la visita. Es importante observar que resulta difcil utilizar este tipo de representacin
cuando existen intervalos abiertos o cuando los intervalos no son iguales entre s.
Otra observacin es la amplitud de los intervalos, que se puede establecer utilizando la regla de Sturges,
pues al cambiarla la presentacin visual de un histograma puede variar. Un applet que muestra cmo el
nmero de clases y su ancho pueden hacer variar fue desarrollado por Webster West de la Universidad del
Sur de Carolina.
Algunos de los usos ms comunes del uso de un histograma son: aumentar la calidad de alguno de nuestros
procesos, pues todos sabemos que es necesario reducir al mnimo la variacin que se presente en el mismo.
Es por eso, que el histograma nos permite identificar cuantas veces se repite un mismo valor, as como la
frecuencia con la que se presenta. Siendo base para la toma de decisiones.
Diagrama de Barras

Diagrama o grfica de barras

Un tipo de grfico muy parecido al histograma es la grfica de columnas.


En este tipo de grfica, sobre los valores de las variables se levantan barras estrechas de longitudes
proporcionales a las frecuenciascorrespondientes. Se utilizan para representar variables
cualitativas y cuantitativas discretas.
Para este tipo de grfica, elaboradas con rectngulos tambin, se pide que sus bases sean del mismo ancho
y sus alturas equivalentes con las frecuencias. A diferencia del histograma, no es necesario tener una escala
horizontal continua, por lo que los rectngulos (o barras) no tienen que aparecer juntas entre s. Otra
observacin pertinente es que se pueden representar en la misma grfica, utilizando las mismas escalas
horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias
observaciones. Esto produce una grfica con varias series, correspondiendo cada una de ellas a
cada observacin de la muestra(o poblacin), y tenindose una grfica compuesta. Es conveniente que
cada serie de datos (u observaciones) sean ilustrados o iluminados de igual manera entre s, pero distinta
de las dems.
En el eje horizontal, o eje de abscisas, se representan los datos o modalidades; en el eje vertical o
de ordenadas, se representan las frecuencias de cada dato o modalidad. Las frecuencias pueden
ser absolutas, acumuladas relativas y relativas acumuladas.
El ejemplo de la ilustracin de arriba pertenece al comportamiento de las calificaciones parciales de tres
alumnos de preparatoria. Las series (cada una de las calificaciones parciales) estn coloreadas con
diferente color para mostrar el comportamiento tanto individual, como comparativo.

TIPOS DE GRFICOS DE BARRAS

o
Grfica de barras compuestas

Barra simple: se emplean para graficar hechos nicos.


o Barras mltiples:es muy recomendable para comparar una serie estadstica con otra, para ello emplea barras

simples de distinto color o tramado en un mismo plano cartesiano, una al lado de la otra.

o Barras compuestas: en este mtodo de graficacin las barras de la segunda serie se colocan encima de

las barras de la primera serie en forma respectiva.


El diagrama de barras proporciona informacin comparativa principalmente y este es su uso fundamental.

Grficas de Barras Horizontales


Tambin es posible realizar grficas de barras horizontales, los cuales se parecen mucho a las grficas de
columnas, con la salvedad importante de que la funcin de los ejes se intercambia y el eje horizontal queda
destinado a las frecuencias y el eje vertical a las clases.
Es muy comn que este tipo de grficos se utilicen para ilustrar el tamao de una poblacin
dividida en estratos como, por ejemplo, son sus edades.
El ejemplo que se presenta es la poblacin de un pas ficticio llamado Timbuctulandia:

A este tipo de grficos en particular se le llama pirmide de edades por su forma. Incluso, cuando se compara
la poblacin masculina y femenina por estratos de edades, se estila utiliza el lado izquierdo para la poblacin
de un sexo y el lado derecho para el otro, el resultado es una pirmide casi simtrica (depender de la
poblacin en particular).
Pirmides de poblacin.
La pirmide de poblacin es la representacin grfica de la distribucin por edad y sexo de la poblacin.
Grficamente se trata de un doble histograma de frecuencias.
La pirmide de edades es un histograma doble en el que se representa en la derecha la poblacin
masculina y en la izquierda la poblacin femenina. En el eje de abscisas se representa los efectivos de
poblacin, normalmente en porcentajes, y en el eje de ordenadas las edades. Toma el nombre de la forma
que debe adoptar en las sociedades con una poblacin equilibrada, con una amplia base debido al gran
nmero de nacimientos que se estrecha paulatinamente por la mortalidad creciente a medida que aumenta
el intervalo de edades considerado.
La pirmide de poblacin, dependiendo de su forma, puede dar una visin general de la juventud, madurez
o vejez de una poblacin, y por lo tanto obtener consecuencias sociales de ello.

Segn su perfil podemos distinguir tres tipos bsicos de pirmides:

De poblacin expansiva: con una base ancha y una rpida reduccin a medida que ascendemos. Es
propia de los pases del Tercer Mundo en plena transicin demogrfica con altas tasas de natalidad y
mortalidad, y con un crecimiento natural alto.
De poblacin regresiva: con una base ms estrecha que el cuerpo central y un porcentaje de ancianos
relativamente grande. Se trata de una poblacin envejecida con bajas tasas de natalidad y de mortalidad,
y con un crecimiento natural reducido.
De poblacin estacionaria: con una notable igualdad entre las generaciones jvenes y adultas, y una
reduccin importante en las ancianas. El crecimiento natural es bajo. Este tipo de pirmide es propia de las
poblaciones que no presentan cohortes de la transicin demogrfica.
Grficas de Lneas
Cuando los datos se relacionan entre s, es decir, cuando podemos decir que existe cierta continuidad entre
las observaciones se pueden utilizar las grficas de lneas, que consisten en una serie de puntos trazados
en las intersecciones de las marcas de clase y las frecuencias de cada una, unindose consecutivamente
con lneas.
Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo
de cinco observaciones anuales. Al igual que en el caso de las grficas de columnas (y de otras ms) es
posible presentar varias series de observaciones (en este caso cada serie de observaciones son los pesos
de un individuo).

Polgono de Frecuencias
Otra forma de representacin de un uso menos comn, y muy parecida a las grficas de lneas, es
el polgono de frecuencias.
ste, es un grfico que se realiza a travs de la unin de los puntos ms altos de las columnas en
un histograma de frecuencia (que utiliza columnas verticales para mostrar las frecuencias). La diferencia
fundamental entre ambas es que en el polgono de frecuencias se aaden dos clases con frecuencias
cero: una antes de la primera clase con datos y otra despus de la ltima.
El resultado es que se sujeta la lnea por ambos extremos al eje horizontal y lo que podra ser una lnea
separada del eje se convierte, junto con ste, en un polgono. Los polgonos de frecuencia para datos
agrupados, por su parte, se construyen a partir de la marca de clase que coincide con el punto medio de cada
columna del histograma.
Cuando se representan las frecuencias acumuladas de una tabla de datos agrupados, se obtiene un
histograma de frecuencias acumuladas, que permite diagramar su correspondiente polgono.
Se suelen utilizar cuando se desea mostrar ms de una distribucin o la clasificacin cruzada de
una variable cuantitativa continua con una cualitativa o cuantitativa discreta en un mismo grfico.
El punto con mayor altura de un polgono de frecuencia representa la mayor frecuencia, mientras que el
rea bajo la curva incluye la totalidad de los datos existentes.

El ejemplo de arriba corresponde al porcentaje del PIB gastado en docencia e investigacin durante el
ao de 1990 en cinco pases (fuente: Revista Ciencia y Desarrollo, 1994, XIX (114):12))

Cabe recordar que la frecuencia es la repeticin menor o mayor de un suceso, o la cantidad de veces que un proceso
peridico se repite por unidad de tiempo.
Pictograma
Son grficos con dibujos alusivos al carcter que se est estudiando y cuyo tamao es proporcional a
las frecuencias que representan.La mayor frecuencia se identifica por la mayor acumulacin de smbolos. Los
pictogramas se emplean sobre todo, para hacer ms amigables y entendibles los informes estadsticos. Se
utilizan en estadstica, en muchas ocasiones como parte de una tabla.
Por ejemplo, si se quiere representar la produccin de troncos de un aserradero, se utilizan el dibujo de un
tronco ancho para sealar mil troncos y un tronco pequeo para representar 500 troncos.

Diagrama de Sectores
Tambin conocido como grfica de pastel o grfico circular. Un diagrama de sectores se puede utilizar
para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas.
Si el estudio estadstico tiene pocos valores distintos, suele ocurrir con los caracteres cualitativos, se puede
usar un diagrama en forma de crculo dividido en tantos sectores como datos distintos haya, de modo que
la frecuencia de cada valor viene dada por un trozo de rea del crculo. As, el crculo queda dividido en
sectores cuya amplitud es proporcional a las frecuencias de los valores.
Para obtener esta caracterstica fundamental del diagrama de sectores, en que el ngulo de
cada sector es proporcional a la frecuencia absoluta correspondiente, tenemos que el ngulo se calcula de
la siguiente forma:
El diagrama circular se construye con la ayuda de un transportador de ngulos.
Tambin puede usarse para datos cuantitativos agrupados en clases, y en tales casos, cada sector
corresponde a una clase. Dada la ndole de esta representacin, slo se utiliza para distribuciones de
frecuencias relativas usualmente expresadas en porcentajes.
PARA QU SIRVE?
Expresa de manera grfica la distribucin proporcional de los eventos o datos en estudio; sin embargo,
stos no deben ser ms de 7 porque el anlisis se vuelve excesivamente complejo. Cuando lo que se
desea es resaltar las proporciones que representan algunos subconjuntos con respecto al total, es decir,
cuando se est usando una escala categrica, conviene utilizarla.
Los datos presentados comienzan a las 12 horas en el crculo y corren en el sentido de las manecillas del
reloj; colocando el porcentaje mayor (la rebanada ms amplia del pastel) junto con la siguiente ms
importante; y as sucesivamente, hasta la ms pequea. Apguese a esta convencin a menos que quiera
ilustrar contrastes dramticos en los porcentajes, colocando los porcentajes mayores junto con los ms
pequeos.
Los textos necesarios pueden situarse dentro del pastel o fuera de ste (preferiblemente fuera cuando las
secciones representen valores pequeos) y el colordebe usarse para dar nfasis y esttica. Su principal
inconveniente consiste en que requieren de mucho espacio en cada pgina.
Ejemplo

Deporte Alumnos (fi) ngulo ()


En una clase de
Baloncesto 12 144 30 alumnos, 12
juegan a
baloncesto, 3
practican la
natacin, 4
Natacin 3 36 juegan al ftbol y
el resto no
practica ningn
deporte.

Ftbol 9 108
Diagrama de
Dispersin
En
Sin deporte 6 72 las distribuciones
bidimensionales a
cada individuo le
corresponden
los valores de dos
Total 30 (N) 360 variables, las
representamos
por el par (xi, yi).
Si representamos
cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de
puntos o diagrama de dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo
mejor posible, llamada recta de regresin.
Un grfico de dispersin tiene dos ejes de valores y muestra un conjunto de datos numricos en el eje
horizontal (eje X) y otro en el eje vertical (eje Y). Combina estos valores en puntos de datos nicos y los
muestra en intervalos irregulares o agrupaciones. Los grficos de dispersin se utilizan por lo general
para mostrar y comparar valores numricos, por ejemplo datos cientficos, estadsticos y de ingeniera. Se usa
cuando:

o Desea convertir dicho eje en una escala logartmica.

o Los espacios entre los valores del eje horizontal no son uniformes.

o Hay muchos puntos de datos en el eje horizontal.

o Desea mostrar similitudes entre grandes conjuntos de datos.

o Desea comparar muchos puntos de datos sin tener en cuenta el tiempo.


CLASIFICACIN SEGN TIPO DE CORRELACIN

1. Correlacin directa: La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2. Correlacin inversa: La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3. Correlacin nula: En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma

redondeada.
CLASIFICACIN SEGN GRADO DE CORRELACIN
El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar
tres tipos:

1. Correlacin fuerte: La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbil: La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. Correlacin nula: No existe el ms mnimo grado de correlacin entre los puntos.


Grficas de rea
Los grficos de rea destacan la magnitud del cambio en el tiempo y se pueden utilizar para llamar la atencin
hacia el valor total en una tendencia. Por ejemplo, se pueden trazar los datos que representan el beneficio
en el tiempo en un grfico de rea para destacar el beneficio total. Al mostrar la suma de los valores
trazados, un grfico de rea tambin muestra la relacin de las partes con un todo.
Los grficos de rea tienen los siguientes subtipos de grfico:

o reas en 2D y 3D Tanto si se presentan en 2D como en 3D, los grficos de reas muestran la tendencia de

los valores en el tiempo u otros datos de categora. Como norma, considere la posibilidad de utilizar un grfico

de lneas en lugar de un grfico de reas no apilado, ya que los datos de una serie pueden quedar ocultos por

los de otra.

o reas apiladas y reas 100% apiladas: Los grficos de reas apiladas muestran la tendencia de la

contribucin de cada valor a lo largo del tiempo u otros datos de categora. Las grficas se pueden proyectar

en perspectiva 3D.
Otros grficos
Existen muchos otros grficos, que en este trabajo no abordaremos de manera profunda debido a que son
poco comunes; principalmente, se trata de grficas estadsticas utilizadas en ciencias o actividades muy
especficas y muchas veces se requiere de un conocimiento avanzado para su realizacin. Como ejemplo,
vale la pena mencionar:

GRFICOS DE SUPERFICIE
Un grfico de superficie es til cuando busca combinaciones ptimas entre dos conjuntos de datos. Como
en un mapa topogrfico, los colores y las tramas indican reas que estn en el mismo rango de valores.

Puede utilizar un grfico de superficie cuando ambas categoras y series de datos sean valores numricos.

GRFICOS DE ANILLOS
En un grfico de anillos se pueden representar datos organizados nicamente en columnas o en filas de
una tabla de datos estadsticos. Un grfico de anillos muestra la relacin de las partes con un todo pero
puede contener ms de una serie de datos; no son fciles de leer. Es conveniente utilizar un grfico de
columnas apiladas o un grfico de barras apiladas en su lugar.

GRFICAS RADIALES
Los datos organizados en columnas o filas en una hoja de clculo se pueden representar en un grfico
radial. Los grficos radiales comparan los valores agregados de varias series de datos y muestran cambios
en valores relativos a un punto central.

Fuentes del subtema 1.9 [34 50]

Glosario
Al Azar o Aleatorio: Son todos aquellos eventos fortuitos o productos de la suerte.
Aleatoriamente: Actividades o mtodos producidos o llevados a cabo simulando un comportamiento
al azar.
Clase: Subdivisin de escala de datos.
Correlacin: Cuando dos fenmenos sociales, fsicos o biolgicos crecen o decrecen de forma simultnea
y proporcional debido a factores externos, se dice que los fenmenos estn positivamente
correlacionados. Si uno crece en la misma proporcin que el otro decrece, los dos fenmenos estn
negativamente correlacionados. El grado de correlacin se calcula aplicando un coeficiente de correlacin
a los datos de ambos fenmenos.
Datos: Son los valores cualitativos o cuantitativos mediante los cuales se miden las caractersticas de los
objetos, o fenmenos a estudiar.
Dispersin: La extensin o variabilidad de un conjunto de datos.
Estadstica: Rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que
ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones.
Evento: Uno o ms de los resultados posibles de hacer algo, o uno de los resultados posibles de
realizar un experimento
Frecuencia: Nmero de veces en que se repite un dato.
Frecuencia Acumulada: Es el nmero de estudiantes con calificaciones iguales o menores que el rango de
cada intervalo sucesivo.
Frecuencia absoluta: Es el nmero de veces que ocurre un cierto suceso, en la proporcin de veces que
ocurre dicho suceso con relacin al nmero de veces que podra haber ocurrido.
Frecuencia Relativa: Es la proporcin entre la frecuencia de un intervalo y el nmero total de datos.
Intervalo de Clase: Pequea seccin de la escala segn la cual se agrupan las puntuaciones de una
distribucin de frecuencia. Tamao o rango de la Clase.
Lmites del Intervalo: Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre los
cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
Muestra estadstica: es un subconjunto de casos o individuos de una poblacin estadstica.
Muestreo aleatorio simple: Mtodos de seleccin de muestras que permiten a cada muestra posible una
probabilidad igual de ser elegida y a cada elemento de la poblacin una oportunidad igual de ser incluidos
en la muestra.
Muestreo aleatorio: Las tcnicas de muestreo aleatorio aseguran que cada elemento en la poblacin de
inters tenga una probabilidad (no nula) de ser incluido en la muestra.
Porcentaje: Es la proporcin de una cantidad de datos especficos, con respecto al total de esos datos.
Poblacin estadstica: tambin llamada universo o colectivo, es el conjunto de elementos de referencia
sobre el que se realizan las observaciones.
Rango: Situacin de un dato respecto de una distribucin.
Regresin: Proceso general que consiste en predecir una variable a partir de otra mediante medios
estadsticos, utilizando datos anteriores.
Tablas de Frecuencias: Tabla que muestra el nmero de veces que en un conjunto de datos aparece cada
una de las clases de inters especificadas en el recorrido de los datos
Tamao de la Muestra: Es la cantidad de datos que sern extrados de la poblacin para formar parte de
la muestra.
Variable: Propiedad o rasgo de un hecho u objeto (no constante) por la que puede ser caracterizado o
clasificado. Representacin de una caracterstica, de un tributo, que posee alguna realidad.
Variable dependiente: La variable que tratamos de predecir en el anlisis de regresin.

Variables independientes: Variables (s) conocida(s) en el anlisis de regresin.

Varianza: Desviacin cuadrada media de todos los valores de la media.


Fuentes del Glosario [51] y [52]

Fuentes de Informacin
[1] http://www.gestiopolis.com/recursos/experto/catsexp/pagans/eco/21/estadistica.htm
[2] http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
[3] http://www.eumed.net/cursecon/libreria/drm/1a.htm
[4] http://es.wikipedia.org/wiki/Estadstica#Origen
[5] http://www.galeon.com/estadisticautil/quees.htm
[6] Estadstica. Microsoft Encarta 2009 [DVD]. Microsoft Corporation, 2008.

[7] http://www.uv.mx/cienciahombre/revistae/vol18num2/articulos/historia/index.htm
[8] http://www.monografias.com/trabajos10/esta/esta.shtml#apli
[9] http://web.cortland.edu/flteach/stats/stat-sp.html
[10] http://html.rincondelvago.com/estadistica_38.html
[11] http://www.monografias.com/trabajos27/muestreo-estadistico/muestreo-estadistico.shtml
[12] http://www.vitutor.com/estadistica/descriptiva/a_1.html
[13] http://www.hrc.es/bioest/estadis_1.html
[14] http://www.eumed.net/cursecon/libreria/drm/0.htm
[15] http://www.monografias.com/trabajos19/la-estadistica/la-estadistica.shtml
[16] http://estadisticadescriptiva1.blogspot.com/2009/09/division-de-la-estadistica.html
[17] http://sitios.ingenieria-usac.edu.gt/estadistica/estadistica2/estadisticadescriptiva.html
[18] http://www.estadisticaparatodos.com/index_archivos/page0003.htm
[19] http://www.noparametricas.com/archivos/servicios/analisise.html
[20] http://es.wikipedia.org/wiki/Estadstica_multivariante
[21] http://www.gestiopolis.com/canales7/fin/matematicas-aplicacion-de-estadisticas-multivariables-e-indicadores-
financieros.htm
[22] http://www.mitecnologico.com/Main/PoblacionEnEstadistica
[23] http://es.wikipedia.org/wiki/Poblacin_estadstica
[24] http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html
[25] Muestra de poblacin. Microsoft Encarta 2009 [DVD]. Microsoft Corporation, 2008.

[26] http://html.rincondelvago.com/conceptos-y-muestreo.html
[27] http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.asp
[28] http://www.vitutor.com/estadistica/descriptiva/a_2.html
[29] http://recursostic.educacion.es/descartes/web/materiales_didacticos/iniciacion_estadististica_fjgarcia/01Variab
lesEstadisticas.htm
[30] http://es.wikipedia.org/wiki/Variable_estadstica
[31] http://www.monografias.com/trabajos73/estadistica-descriptiva/estadistica-descriptiva2.shtml
[32] http://www.bioestadistica.uma.es/libro/node7.htm
[33] http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt12.html#seccion2
[34] http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/grficas_estadsticas.html
[35] http://www.uaq.mx/matematicas/estadisticas/xu3.html
[36] http://www.vitutor.net/2/11/graficas_estadistica.html
[37] http://www.vitutor.com/estadistica/descriptiva/a_6.html
[38] Grficas estadsticas. Microsoft Encarta 2009 [DVD]. Microsoft Corporation, 2008.

[39] http://mx.kalipedia.com/glosario/diagrama-barras.html?x=1487
[40] http://www.monografias.com/trabajos11/estadi/estadi.shtml
[41] http://definicion.de/poligono-de-frecuencia/
[42] http://www.vitutor.com/estadistica/descriptiva/a_5.html
[43] http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/diagrama_de_sectores.html
[44] http://www.ematematicas.net/estadistica/graficas/index.php?tipo=sectores
[45] http://dieumsnh.qfb.umich.mx/estadistica/graficas.htm
[46] http://www.ematematicas.net/estadistica/graficas/index.php?tipo=picto
[47] http://www.conevyt.org.mx/cursos/enciclope/prob_inf_graf.html#pictograma
[48] http://www.dgplades.salud.gob.mx/descargas/dhg/GRAFICA_PASTEL.pdf
[49] http://office.microsoft.com/es-es/excel-help/tipos-de-graficos-disponibles-HA001233737.aspx#BMareacharts
[50] http://enciclopedia.us.es/index.php/Pir%C3%A1mide_de_poblaci%C3%B3n
[51] http://web.cortland.edu/flteach/stats/glos-sp.html
[52] http://es.scribd.com/doc/8050872/GLOSARIO-ESTADISTICO
Estadstica
Para anlisis, datos y grficas sobre Wikipedia, vase Wikipedia:Estadsticas.

Una distribucin normal

La estadstica (la forma femenina del trmino alemn Statistik, derivado a su vez
del italiano statista, "hombre de Estado")1 es una rama de las matemticas y una
herramienta que estudia usos y anlisis provenientes de una muestra representativa
de datos, que busca explicar las correlaciones y dependencias de un fenmeno
fsico o natural, de ocurrencia en forma aleatoria o condicional.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad. Adems, se usa en
reas de negocios o instituciones gubernamentales ya que su principal objetivo es
describir al conjunto de datos obtenidos para la toma de decisiones o bien, para realizar
generalizaciones sobre las caractersticas observadas.
Hoy en da, la estadstica es una ciencia que se encarga de estudiar una
determinada poblacin por medio de la recoleccin, recopilacin e interpretacin de datos.
Del mismo modo, tambin es considerada una tcnica especial apta para el estudio
cuantitativo de los fenmenos de masa o colectivo.
La estadstica se divide en dos grandes reas:

Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen de datos


originados a partir de los fenmenos de estudio. Los datos pueden ser
resumidos numrica o grficamente. Su objetivo es organizar y describir las
caractersticas sobre un conjunto de datos con el propsito de facilitar su aplicacin,
generalmente con el apoyo de grficas, tablas o medidas numricas.
Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin
estndar.
Ejemplos grficos son: histograma, pirmide poblacional, grfico circular, entre
otros.

Estadstica inferencial: Se dedica a la generacin de los modelos, inferencias y


predicciones asociadas a los fenmenos en cuestin teniendo en cuenta
la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y
extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden
tomar la forma de respuestas a preguntas s/no (prueba de hiptesis), estimaciones de
unas caractersticas numricas (estimacin), pronsticos de futuras observaciones,
descripciones de asociacin (correlacin) o modelamiento de relaciones
entre variables (anlisis de regresin). Otras tcnicas
de modelamiento incluyen anlisis de varianza, series de tiempo y minera de datos.
Su objetivo es obtener conclusiones tiles para lograr hacer deducciones acerca de la
totalidad de todas las observaciones hechas, basndose en la informacin numrica.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada, pero
la estadstica inferencial, por su parte, se divide en estadstica paramtrica y estadstica no
paramtrica.
Existe tambin una disciplina llamada estadstica matemtica, la que se refiere a las bases
tericas de la materia. La palabra estadsticas tambin se refiere al resultado de aplicar
los logaritmos estadsticos a un conjunto de datos, como en estadsticas
econmicas, estadsticas criminales, etctera.

ndice
[ocultar]

1Historia
o 1.1Origen
o 1.2Empleo de la estadstica en las Antiguas Civilizaciones
1.2.1En la Edad Media
1.2.2En la Edad Moderna
o 1.3Orgenes en probabilidad
o 1.4Siglo XX
o 1.5Estado actual
2Mtodos estadsticos
o 2.1Estudios experimentales y observacionales
o 2.2Niveles de medicin
o 2.3Tcnicas de anlisis estadstico
3Lenguaje y simbologa
o 3.1Poblacin y muestra
o 3.2Parmetro
4Disciplinas especializadas
5Computacin estadstica
6Crticas a la estadstica
7Estadsticos
8Enseanza de la estadstica en las ciencias sociales
9Referencias
10Bibliografa
11Enlaces externos
12Vase tambin

Historia[editar]
Origen[editar]
El trmino alemn Statistik, introducido originalmente por Gottfried Achenwall en 1749, se
refera al anlisis de datos del Estado, es decir, la ciencia del Estado (o ms bien, de
la ciudad-estado). Tambin se llam aritmtica poltica de acuerdo con la traduccin literal
del ingls. No fue hasta el siglo XIX cuando el trmino estadstica adquiri el significado de
recolectar y clasificar datos. Este concepto fue introducido por el militar britnico sir John
Sinclair (1754-1835).
En su origen, por tanto, la estadstica estuvo asociada a los Estados o ciudades libres,
para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La
coleccin de datos acerca de estados y localidades contina ampliamente a travs de los
servicios de estadstica nacionales e internacionales. En particular, los censos comenzaron
a suministrar informacin regular acerca de la poblacinde cada pas. As pues, los datos
estadsticos se referan originalmente a los datos demogrficos de una ciudad o Estado
determinados. Y es por ello que en la clasificacin decimal de Melvil Dewey, empleada en
las bibliotecas, todas las obras sobre estadstica se encuentran ubicadas al lado de las
obras de o sobre la demografa.
Ya se utilizaban representaciones grficas y otras medidas en pieles, rocas, palos de
madera y paredes de cuevas para controlar el nmero de personas, animales o ciertas
mercancas. Hacia el ao 3000 a. C. los babilonios usaban ya pequeos envases
moldeados de arcilla para recopilar datos sobre la produccin agrcola y de los gneros
vendidos o cambiados. Los egipcios analizaban los datos de la poblacin y la renta del
pas mucho antes de construir las pirmides en el siglo XI a. C. Los libros bblicos
de Nmeros y Crnicas incluyen en algunas partes trabajos de estadstica. El primero
contiene dos censos de la poblacin de la Tierra de Israel y el segundo describe el
bienestar material de las diversas tribus judas. En China existan registros numricos
similares con anterioridad al ao 2000 a. C. Los antiguos griegos realizaban censos cuya
informacin se utilizaba hacia el 594 a. C. para cobrar impuestos.
Empleo de la estadstica en las Antiguas Civilizaciones [editar]
Artculo principal: Edad Antigua

En la Edad Antigua, la estadstica consista en elaborar censos (de poblacin y tierras). Su


objetivo era facilitar la gestin de las labores tributarias, obtener datos sobre el nmero de
personas que podran servir en el ejrcito o establecer repartos de tierras o de otros
bienes.

En Egipto: La estadstica comienza con la Dinasta I, en el ao 3050 a.C..


Los faraones ordenaban la realizacin de censos con la finalidad de obtener los datos
sobre tierras y riquezas para poder planificar la construccin de las pirmides.
En China: Ao 2238 a.C. el emperador Yao elabora un censo general sobre la
actividad agrcola, industrial y comercial.
En la Antigua Grecia: Se realizaron censos para cuantificar la distribucin y posesin
de la tierra y otras riquezas, organizar el servicio militar y determinar el derecho al
voto.
En la Antigua Roma: Durante el Imperio Romano se establecieron registros de
nacimientos y defunciones, y se elaboraron estudios sobre los ciudadanos, sus tierras
y sus riquezas.
En Mxico: Ao 1116, durante la segunda migracin de las tribus chichimecas, el
rey Xlotl orden que fueran censados los sbditos.
En el Oriente Medio, bajo el dominio sumerio, Babilonia tena casi 6000 habitantes. Se
encontraron en ella tablillas de arcilla que registraban los negocios y asuntos legales
de la ciudad.
El censo en el pueblo judo sirvi, adems de propsitos militares, para calcular el
monto de los ingresos del templo.
En la Edad Media[editar]
Artculo principal: Edad Media

Durante la Edad Media, la estadstica no present grandes avances, pero destaca el


trabajo de Isidoro de Sevilla, quien recopil y clasific datos de diversa naturaleza cuyos
resultados se publicaron en la obra Originum sive Etymologiarum.
En la Edad Moderna[editar]
Artculo principal: Edad Moderna

En Espaa, destacan: el censo de Pecheros (1528), el de los Obispos (1587),


el Censo de los Millones (1591) y el Censo del Conde de Aranda (1768).
En Inglaterra, la peste de la dcada de 1500 provoc un aumento en la contabilizacin
de los datos sobre defunciones y nacimientos.
Orgenes en probabilidad[editar]
Los mtodos estadstico-matemticos emergieron desde la teora de probabilidad, la cual
data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian
Huygens (1657) da el primer tratamiento cientfico que se conoce a la materia. El Ars
coniectandi (pstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718)
de Abraham de Moivre estudiaron la materia como una rama de las matemticas.2 En la
era moderna, el trabajo de Kolmogrov ha sido un pilar en la formulacin del modelo
fundamental de la Teora de Probabilidades, el cual es usado a travs de la estadstica.
La teora de errores se puede remontar a la pera miscellnea (pstuma, 1722) de Roger
Cotes y al trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) el cual
aplica por primera vez la teora de la discusin de errores de observacin. La reimpresin
(1757) de este trabajo incluye el axioma de que errores positivos y negativos son
igualmente probables y que hay unos ciertos lmites asignables dentro de los cuales se
encuentran todos los errores; se describen errores continuos y una curva de probabilidad.
Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la
combinacin de observaciones desde los principios de la teora de probabilidades. Laplace
represent la Ley de probabilidades de errores mediante una curva y dedujo una frmula
para la media de tres observaciones. Tambin, en 1871, obtiene la frmula para la ley de
facilidad del error (trmino introducido por Lagrange, 1744) pero con ecuaciones
inmanejables. Daniel Bernoulli (1778) introduce el principio del mximo producto de las
probabilidades de un sistema de errores concurrentes.

Fotografa de Ceres por el telescopio espacial Hubble. La posicin fue estimada por Gauss mediante
el mtodo de mnimos cuadrados.

El mtodo de mnimos cuadrados, el cual fue usado para minimizar los errores
en mediciones, fue publicado independientemente por Adrien-Marie
Legendre (1805), Robert Adrain (1808), y Carl Friedrich Gauss (1809). Gauss haba usado
el mtodo en su famosa prediccin de la localizacin del planeta enano Ceres en 1801.
Pruebas adicionales fueron escritas por Laplace (1810, 1812), Gauss (1823), James
Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W. F. Donkin (1844,
1856), John Herschel (1850) y Morgan Crofton (1870). Otros contribuidores fueron Ellis
(1844), Augustus De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). La

frmula de Peters para , el probable error de una observacin simple es bien


conocido.
El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard
Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre y Didion. Augustus De
Morgan y George Boole mejoraron la presentacin de la teora. Adolphe Quetelet (1796-
1874), fue otro importante fundador de la estadstica y quien introdujo la nocin del
hombre promedio (lhomme moyen) como un medio de entender los fenmenos sociales
complejos tales como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.
Siglo XX[editar]

Karl Pearson, un fundador de la estadstica matemtica.

El campo moderno de la estadstica se emergi a los principios del siglo XX dirigida por la
obra de Francis Galton y Karl Pearson, quienes transformaron la estadstica a convertirse
en una disciplina matemtica rigurosa usada por anlisis, no solamente en la ciencia sino
en la manufactura y la poltica. Las contribuciones de Galton incluyen los conceptos
de desviacin tpica, correlacin, anlisis de la regresin y la aplicacin de estos mtodos
al estudio de la variedad de caractersticas la altura, el peso entre otros.3 Pearson
desarroll el Coeficiente de correlacin de Pearson, defini como un momento-producto,4
el mtodo de momentos por caber las distribuciones a las muestras y la distribuciones de
Pearson, entre otras cosas.5 Galton y Pearson se fundaron Biometrika como su primera
revista de la estadstica matemtica y la bioestadstica (en aquel entonces conocida como
la biometra). Pearson tambin fund el primer departamento de estadstica en University
College de Londres.6
Durante el siglo XX, la creacin de instrumentos precisos para asuntos de salud
pblica (epidemiologa, bioestadstica, etc.) y propsitos econmicos y sociales (tasa
de desempleo, econometra, etc.) necesit de avances sustanciales en las prcticas
estadsticas.
La segunda ola de los aos 1910 y 1920 se inici William Gosset, y se culmin en la obra
de Ronald Fisher, quin escribi los libros de texto que iban a definir la disciplina
acadmica en universidades en todos lados del mundo. Sus publicaciones ms
importantes fueron su papel de 1918 The Correlation between Relatives on the Supposition
of Mendelian Inheritance, lo cual era el primero en usar el trmino estadstico varianza, su
obra clsica de 1925 Statistical Methods for Research Workers y su 1935 The Design of
Experiments,78910 donde desarroll los modelos rigurosos de diseo experimental. Origin
el concepto de suficiencia y la informacin de Fisher.11 En su libro de 1930 The Genetical
Theory of Natural Selection aplic la estadstica a varios conceptos en la biologa como
el Principio de Fisher12 (sobre el ratio de sexo), el Fisherian runaway,131415161718 un
concepto en la seleccin sexual sobre una realimentacin positiva efecto hallado en
la evolucin.
Estado actual[editar]
Hoy el uso de la estadstica se ha extendido ms all de sus orgenes como un servicio
al Estado o al gobierno. Personas y organizaciones usan la estadstica para entender
datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras
reas. La estadstica es entendida generalmente no como un sub-rea de las matemticas
sino como una ciencia diferente aliada. Muchas universidades tienen departamentos
acadmicos de matemticas y estadstica separadamente. La estadstica se ensea en
departamentos tan diversos como psicologa, sociologa, educacin y salud pblica.
Regresin lineal Grficos de dispersin en estadstica.

Al aplicar la estadstica a un problema cientfico, industrial o social, se comienza con un


proceso o poblacin a ser estudiado. Esta puede ser la poblacin de un pas, de granos
cristalizados en una roca o de bienes manufacturados por una fbrica en particular durante
un periodo dado. Tambin podra ser un proceso observado en varios instantes y los datos
recogidos de esta manera constituyen una serie de tiempo.
Por razones prcticas, en lugar de compilar datos de una poblacin entera, usualmente se
estudia un subconjunto seleccionado de la poblacin, llamado muestra. Datos acerca de la
muestra son recogidos de manera observacional o experimental. Los datos son entonces
analizados estadsticamente lo cual sigue dos propsitos: descripcin e inferencia.
El concepto de correlacin es particularmente valioso. Anlisis estadsticos de un conjunto
de datos puede revelar que dos variables (esto es, dos propiedades de la poblacin bajo
consideracin) tienden a variar conjuntamente, como si hubiera una conexin entre ellas.
Por ejemplo, un estudio del ingreso anual y la edad de muerte podra resultar en que
personas pobres tienden a tener vidas ms cortas que personas de mayor ingreso. Las
dos variables se dice que estn correlacionadas. Sin embargo, no se puede inferir
inmediatamente la existencia de una relacin de causalidad entre las dos variables. El
fenmeno correlacionado podra ser la causa de una tercera, previamente no considerada,
llamada variable confusora.
Si la muestra es representativa de la poblacin, inferencias y conclusiones hechas en la
muestra pueden ser extendidas a la poblacin completa. Un problema mayor es el de
determinar cun representativa es la muestra extrada. La estadstica ofrece medidas para
estimar y corregir por aleatoriedad en la muestra y en el proceso de recoleccin de los
datos, as como mtodos para disear experimentos robustos como primera medida,
ver diseo experimental.
El concepto matemtico fundamental empleado para entender la aleatoriedad es el
de probabilidad. La estadstica matemtica (tambin llamada teora estadstica) es la rama
de las matemticas aplicadasque usa la teora de probabilidades y el anlisis
matemtico para examinar las bases tericas de la estadstica.
El uso de cualquier mtodo estadstico es vlido solo cuando el sistema o poblacin bajo
consideracin satisface los supuestos matemticos del mtodo. El mal uso de la
estadstica puede producir serios errores en la descripcin e interpretacin, lo cual podra
llegar a afectar polticas sociales, la prctica mdica y la calidad de estructuras tales como
puentes y plantas de reaccin nuclear.
Incluso cuando la estadstica es correctamente aplicada, los resultados pueden ser difciles
de interpretar por un inexperto. Por ejemplo, el significado estadstico de una tendencia en
los datos, que mide el grado al cual la tendencia puede ser causada por una variacin
aleatoria en la muestra, puede no estar de acuerdo con el sentido intuitivo. El conjunto de
habilidades estadsticas bsicas (y el escepticismo) que una persona necesita para
manejar informacin en el da a da se refiere como cultura estadstica.

Mtodos estadsticos[editar]
Estudios experimentales y observacionales[editar]
Un objetivo comn para un proyecto de investigacin estadstica es investigar la
causalidad, y en particular extraer una conclusin en el efecto que algunos cambios en los
valores de predictores o variables independientes tienen sobre una respuesta o variables
dependientes. Hay dos grandes tipos de estudios estadsticos para estudiar causalidad:
estudios experimentales y observacionales. En ambos tipos de estudios, el efecto de las
diferencias de una variable independiente (o variables) en el comportamiento de una
variable dependiente es observado. La diferencia entre los dos tipos es la forma en que el
estudio es conducido. Cada uno de ellos puede ser muy efectivo.
Niveles de medicin[editar]
Hay cuatro tipos de mediciones o escalas de medicin en estadstica: niveles de
medicin (nominal, ordinal, intervalo y razn). Tienen diferentes grados de uso en
la investigacin estadstica. Las medidas de razn, en donde un valor cero y distancias
entre diferentes mediciones son definidas, dan la mayor flexibilidad en mtodos
estadsticos que pueden ser usados para analizar los datos. Las medidas de intervalo
tienen distancias interpretables entre mediciones, pero un valor cero sin significado (como
las mediciones de coeficiente intelectual o temperatura en grados Celsius). Las medidas
ordinales tienen imprecisas diferencias entre valores consecutivos, pero un orden
interpretable para sus valores. Las medidas nominales no tienen ningn rango
interpretable entre sus valores.
La escala de medida nominal, puede considerarse la escala de nivel ms bajo. Se trata de
agrupar objetos en clases. La escala ordinal, por su parte, recurre a la propiedad de
orden de los nmeros. La escala de intervalos iguales est caracterizada por una unidad
de medida comn y constante. Es importante destacar que el punto cero en las escalas de
intervalos iguales es arbitrario, y no refleja en ningn momento ausencia de la magnitud
que estamos midiendo. Esta escala, adems de poseer las caractersticas de la escala
ordinal, permite determinar la magnitud de los intervalos (distancia) entre todos los
elementos de la escala. La escala de coeficientes o Razones es el nivel de medida ms
elevado y se diferencia de las escalas de intervalos iguales nicamente por poseer un
punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia
de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se
dispone de una unidad de medida para el efecto. A iguales diferencias entre los nmeros
asignados corresponden iguales diferencias en el grado de atributo presente en el objeto
de estudio.
Tcnicas de anlisis estadstico[editar]
Algunas pruebas (tests) y procedimientos para la investigacin de observaciones son:

anlisis de frecuencia acumulada


anlisis de regresin
anlisis de varianza (ANOVA)
anlisis factorial confirmatorio

anlisis factorial exploratorio

correlacin: coeficiente de correlacin de Pearson y coeficiente de correlacin de


Spearman

frecuencia estadstica
grfica estadstica
iconografa de las correlaciones

prueba de o prueba de chi cuadrada o prueba de ji cuadrada


prueba de la diferencia menos significante de Fisher

prueba t de Student

U de Mann-Whitney

Lenguaje y simbologa[editar]
Poblacin y muestra[editar]

Poblacin: Es el todo o un conjunto formado por todos los valores existentes, ya


sean personas, medidas u objetos que pueden ser expresados mediante
una variable y adems, tienen una caracterstica; de que son de inters estadstico
para un estudio en especfico. Al anlisis completo de la poblacin tambin se le suele
conocer como "censo".
Poblacin finita: Es aquella que expresa que es posible sobrepasarse al contar o
bien, alcanzarse; por lo tanto, es la que tiene o incluye un nmero limitado ya sea de
objetos, medidas o personas. Por ejemplo: el gasto en comida durante cierto tiempo,
un conjunto de calificaciones o bien, el total de alumnos que estudian en
una universidad.
Poblacin infinita: Es aquella que incluye a un gran nmero de conjunto de
observaciones o medidas que no se pueden alcanzar con el conteo. Esto quiere decir
que tiene un nmero ilimitado de valores, por ejemplo: la produccin futura de
una mquina o el lanzamiento de dados o una moneda.
Muestra: Es aquel subconjunto perteneciente a una poblacin. Esto quiere decir que
se conforma por algunos datos de esta, ya sean ciertos objetos, personas, o medidas
de la poblacin. Al estudio de este concepto se le suele conocer como "muestreo".
Muestra representativa: Es aquel subconjunto representativo de una poblacin, pero
para que se consideren as se deben seguir ciertos procedimientos de seleccin o
bien, un mtodo de muestreo. Se dice que la muestra adecuada es aquella que
contiene caractersticas esenciales de la poblacin para lograr el objetivo de hacer
generalizaciones con respecto al total de los datos sin examinar cada uno de ellos.
Parmetro[editar]

Parmetro: Es la medida de cierta caracterstica numrica de una poblacin que


generalmente se expresa mediante smbolos griegos ( ).

Disciplinas especializadas[editar]
Algunos campos de investigacin usan la estadstica tan extensamente que
tienen terminologa especializada. Estas disciplinas incluyen:
anlisis de economet estadstica en estadstica en estadst matemtica
procesos (p ra (usa la ciencias de la restauracin de icas de estadstica
ara anlisis estadstic salud obras consult minera de
de datos a como estadstica en estadstica en ora datos
en qumica ciencia medicina literatura estadst procesamie
analtica e i auxiliar) estadstica en estadstica en icas nto de
ngeniera estadstic medicina astronoma deporti imgenes
qumica) a veterinaria y estadstica en vas productivid
anlisis computac zootecnia antropologa(ant estadst ad
espacial ional estadstica en ropometra) icas quimiometr
bioestadsti estadstic nutricin estadstica en sociale a (para
ca a de la estadstica en historia s anlisis de
ciencias educaci agronoma encuest datos
actuariales n, la as por en qumica
cienciometr enseanz estadstica en estadstica muestr analtica e i
a a, y la planificacin espacial eo ngeniera
confiabilida formaci estadstica en estadstica fsica qumica)
d estadstica n investigacin industrial estadst reconocimi
control de estadstic estadstica en estadstica ica ento de
calidad a de psicologa(psi militar geoesta patronespar
cultura negocios cometra) dstica a el
estadstica estadstic geograf conocimien
demografa a del a to de datos)
medio investi sistemas de
ambiente gacin informacin
estadstic de geogrfica
a en operaci
comercial ones
izacin
estadstic
a en
epidemio
loga
estadstic
a en
ingenier
a
La estadstica es una herramienta bsica en negocios y produccin. Se usa para entender
la variabilidad de sistemas de medicin, control de procesos (como en control estadstico
de procesos o SPC (CEP)), para compilar datos y para tomar decisiones. En estas
aplicaciones es una herramienta clave y probablemente la nica herramienta disponible.

Computacin estadstica[editar]
Vase tambin: Computacin cientfica

El incremento rpido y sostenido en el poder de clculo de la computacin desde la


segunda mitad del siglo XX ha tenido un sustancial impacto en la prctica de la ciencia
estadstica. Viejos modelos estadsticos fueron casi siempre de la clase de los modelos
lineales. Ahora, complejos computadores junto con apropiados algoritmos numricos han
causado un renacer del inters en modelos no lineales(especialmente redes
neuronales y rboles de decisin) y la creacin de nuevos tipos tales como modelos
lineales generalizados y modelos multinivel.
El incremento en el poder computacional tambin ha llevado al crecimiento en popularidad
de mtodos intensivos computacionalmente basados en remuestreo, tales como tests de
permutacin y de bootstrap, mientras tcnicas como el muestreo de Gibbs han hecho los
mtodos bayesianos ms accesibles. La revolucin en computadores tiene implicaciones
en el futuro de la estadstica, con un nuevo nfasis en estadsticas experimentales y
empricas. Un gran nmero de paquetes estadsticos est ahora disponible para los
investigadores. Los sistemas dinmicos y teora del caos, desde hace una dcada,
empezaron a interesar en la comunidad hispana, pues en la anglosajona de Estados
Unidos estaba ya establecida la conducta catica en sistemas dinmicos no lineales con
350 libros para 1997 y empezaban algunos trabajos en los campos de las ciencias sociales
y en aplicaciones de la fsica. Tambin se estaba contemplando su uso en analtica.

Crticas a la estadstica[editar]
Hay una percepcin general de que el conocimiento estadstico es intencionado y
frecuentemente mal usado, encontrando maneras de interpretar los datos que sean
favorables al presentador. Un dicho famoso, al parecer de Benjamin Disraeli,19 es: Hay
tres tipos de mentiras: mentiras pequeas, mentiras grandes y estadsticas. El popular
libro How to lie with statistics (Cmo mentir con las estadsticas en la edicin espaola)
de Darrell Huff discute muchos casos de mal uso de la estadstica, con nfasis en grficas
malintencionadas. Al escoger (o rechazar o modificar) una cierta muestra, los resultados
pueden ser manipulados; por ejemplo, mediante la eliminacin selectiva de valores
atpicos (outliers). Este puede ser el resultado de fraudes o sesgos intencionales por parte
del investigador (Darrel Huff20). Lawrence Lowell (decano de la Universidad de Harvard)
escribi en 1909 que las estadsticas, como algunos pasteles, son buenas si se sabe
quin las hizo y se est seguro de los ingredientes.
Algunos estudios contradicen resultados obtenidos previamente y la poblacin comienza a
dudar en la veracidad de tales estudios. Se podra leer que un estudio dice (por ejemplo)
que hacer X reduce la presin sangunea, seguido por un estudio que dice que hacer X
no afecta la presin sangunea, seguido por otro que dice que hacer X incrementa la
presin sangunea. A menudo los estudios se hacen siguiendo diferentes metodologas, o
estudios en muestras pequeas que prometen resultados maravillosos que no son
obtenibles en estudios de mayor tamao. Sin embargo, muchos lectores no notan tales
diferencias, y los medios de comunicacin simplifican la informacin alrededor del estudio
y la desconfianza del pblico comienza a crecer.
Sin embargo, las crticas ms fuertes vienen del hecho que la aproximacin de pruebas de
hiptesis, ampliamente usada en muchos casos requeridos por ley o reglamentacin,
obliga a una hiptesis a ser favorecida (la hiptesis nula) y puede tambin exagerar la
importancia de pequeas diferencias en estudios grandes. Una diferencia que es
altamente significativa puede ser de ninguna significancia prctica.
Vase tambin crticas de prueba de hiptesis y controversia de la hiptesis nula.
En los campos de la psicologa y la medicina, especialmente con respecto a la
aprobacin de nuevos medicamentos por la Food and Drug Administration, crticas de
la aproximacin de prueba de hiptesis se han incrementado en los aos recientes.
Una respuesta ha sido un gran nfasis en el p-valor en vez de simplemente reportar si

la hiptesis fue rechazada al nivel de significancia dado. De nuevo, sin embargo,


esto resume la evidencia para un efecto pero no el tamao del efecto. Una posibilidad
es reportar intervalos de confianza, puesto que estos indican el tamao del efecto y la
incertidumbre. Esto ayuda a interpretar los resultados, como el intervalo de confianza

para un dado indicando simultneamente la significancia estadstica y el efecto


de tamao.
El p-valor y los intervalos de confianza son basados en los mismos clculos
fundamentales como aquellos para las correspondientes pruebas de hiptesis. Los
resultados son presentados en un formato ms detallado, en lugar del s o no de las
pruebas de hiptesis y con la misma metodologa estadstica.
Otro tipo de aproximacin es el uso de mtodos bayesianos. Esta aproximacin ha
sido, sin embargo, tambin criticada.
El fuerte deseo de que los medicamentos buenos sean aprobados y que los
medicamentos peligrosos o de poco uso sean rechazados crea tensiones y conflictos
(errores tipo I y II en el lenguaje de pruebas de hiptesis).

Estadsticos[editar]
Thomas Bayes Bruno de Finetti Aleksandr C. R. Rao
George Box Ronald Fisher Lyapunov Ernst Georg
Pafnuti Chebyshov Pierre Fermat Abraham De Ravenstein
David Cox Milton Friedman Moivre Theodore Schultz
Gertrude Cox Francis Galton Isaac Newton Walter Shewhart
George Dantzig Carl Friedrich Jerzy Neyman Charles Spearman
Ren Descartes Gauss Florence Otto Steiger
W. Edwards William Sealy Nightingale John Tukey
Deming Gosset Blaise Pascal
Andri Kolmogrov Karl Pearson
Adolphe Quetelet

Enseanza de la estadstica en las ciencias sociales[editar]


Sobre la enseanza de la estadstica en las ciencias sociales, algunas investigaciones
sugieren que los estudiantes aprenden ms cuando los profesores usan ejemplos
concretos y problemas relevantes para ellos.21
Para contar con ejemplos concretos y problemas relevantes a los estudiantes, es
posible proponer actividades de aprendizaje que vinculen los mtodos cuantitativos a
los enfoques cualitativos, debido a que estos ltimos son utilizados con mayor
recurrencia en los planes de estudio de las licenciaturas en Ciencias sociales. Sobre
esta combinacin de mtodos encontramos que una de sus principales virtudes es que
la recopilacin de los ricos detalles descriptivos de los datos cualitativos se puede
usar para cuantificar y generalizar los resultados.22
Entre las ventajas de una enseanza que combine los mtodos cuantitativos con los
cualitativos se encuentra el que los estudiantes desarrollen la destreza para triangular
resultados, lo que disminuye la falibilidad inherente a cada enfoque. Por ejemplo los
errores que puedan atribuirse a los datos de origen, dato que los mtodos utilizan tipos
de datos distintos, sern ms confiables los resultados si proceden de una
triangulacin de mtodos.23
Incluso, se puede contemplar la enseanza de los mtodos cuantitativos dentro de los
programas de los distintos ejes del currculum acadmico. Actualmente es comn que
en las diversas asignaturas se ejercite el uso de los mtodos de investigacin
cualitativos pero no de los cuantitativos. Esto debera cambiar porque introducir el
razonamiento cuantitativo en los cursos sustanciales permite ligar el entrenamiento en
mtodos cuantitativos, especialmente estadsticos, con los asuntos medulares de las
ciencias sociales.24