Vous êtes sur la page 1sur 5

Estadstica Descriptiva - Tema 1

Conceptos Bsicos
La estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos
de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar
condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma
aleatoria o condicional.
Sin embargo, la estadstica es ms que eso, es decir, es la herramienta fundamental que permite
llevar a cabo el proceso relacionado con la investigacin cientfica.

APLICACIONES
En las ciencias naturales: se emplea con profusin en la descripcin de modelos termodinmicos
complejos (mecnica estadstica), en fsica cuntica, en mecnica de fluidos o en la teora cintica
de los gases, entre otros muchos campos.
En las ciencias sociales y econmicas: es un pilar bsico del desarrollo de la demografa y la
sociologa aplicada.
En economa: suministra los valores que ayudan a descubrir interrelaciones entre mltiples
parmetros macro y microeconmicos.
En las ciencias mdicas: permite establecer pautas sobre la evolucin de las enfermedades y los
enfermos, los ndices de mortalidad asociados a procesos morbosos, el grado de eficacia de un
medicamento, etctera.

LA ESTADSTICA SE DIVIDE EN DOS GRANDES REAS


La estadstica descriptiva, se dedica a la descripcin, visualizacin y resumen de datos originados
a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente.
Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos
ejemplos grficos son: histograma, pirmide poblacional, grfico circular, entre otros.
La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y predicciones
asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones.
Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo
estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de
hiptesis), estimaciones de unas caractersticas numricas (estimacin), pronsticos de futuras
observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre
variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de tiempo
y minera de datos.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:

Individuo: cualquier elemento que porte informacin sobre el fenmeno que se estudia.
As, si estudiamos la altura de los nios de una clase, cada alumno es un individuo; si se
estudia el precio de la vivienda, cada vivienda es un individuo.
Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten
informacin sobre el fenmeno que se estudia. Por ejemplo, si se estudia el precio de la
vivienda en una ciudad, la poblacin ser el total de las viviendas de dicha ciudad.
Muestra: subconjunto que seleccionado de una poblacin. Por ejemplo, si se estudia el
precio de la vivienda de una ciudad, lo normal ser no recoger informacin sobre todas las
viviendas de la ciudad (sera una labor muy compleja), sino que se suele seleccionar un
subgrupo (muestra) que se entienda que es suficientemente representativo.
- Muestreo: El muestreo es la reunin de datos que se desea estudiar, obtenidos de una
proporcin reducida y representativa de la poblacin.
- Valor: Un valor es cada uno de los distintos resultados que se pueden obtener en un
estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara
y cruz.
- Dato: Un dato es cada uno de los valores que se ha obtenido al realizar un estudio
estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz,
cara, cruz.

DEFINICIN Y CLASIFICACIN DE VARIABLES


La estadstica descriptiva es la rama de las Matemticas que recolecta, presenta y caracteriza un
conjunto de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas
caractersticas de ese conjunto.
Al conjunto de los distintos valores numricos que adopta un carcter cuantitativo se llama variable
estadstica.
Las variables pueden ser de dos tipos:
Variables cualitativas o categricas: no se pueden medir numricamente (por ejemplo:
nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos
anuales).
Las variables tambin se pueden clasificar en:
Variables unidimensionales: slo recogen informacin sobre una caracterstica (por
ejemplo: edad de los alumnos de una clase).
Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin
(por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por


ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de
hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podr ser 3.45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehculo puede ser 90.4 km/h, 94.57 km/h...etc.
Las variables aleatorias son variables que son seleccionadas al azar o por procesos aleatorios.

DATOS, CLASIFICACIN, ORGANIZACIN Y CONSTRUCCIN DE BLOQUES ESTADSTICOS


Los datos son medidas y/o nmeros recopilados a partir de la observacin. Los datos pueden
concebirse como informacin numrica necesaria para ayudar a tomar una decisin con ms bases
en una situacin particular.
Existen muchos mtodos mediante los cuales se pueden obtener datos necesarios. Primero, se
puede buscar datos ya publicados por otras fuentes. Segundo, se puede disear un experimento.
En tercer lugar, se puede conducir un estudio. Cuarto, se pueden hacer observaciones del
comportamiento, actitudes u opiniones de los individuos en los que se est interesado.
Los datos se pueden clasificar en:
Datos discretos. Son respuestas numricas que surgen de un proceso de conteo.
Datos continuos. Son respuestas numricas que surgen de un proceso de medicin.

ESCALAS DE MEDICIN
Medir en el campo de las ciencias exactas es comparar una magnitud con otra, tomada de manera
arbitraria como referencia, denominada patrn y expresar cuntas veces la contiene. En el campo
de las ciencias sociales medir es el proceso de vincular conceptos abstractos con indicadores
empricos. Al resultado de medir lo se le llama medida.
La medicin de las variables puede realizarse por medio de cuatro escalas de medicin: la
nominal, ordinal, de intervalo y de razn. Se utilizan para ayudar en la clasificacin de las variables,
el diseo de las preguntas para medir variables, e incluso indican el tipo de anlisis estadstico
apropiado para el tratamiento de los datos.
Una caracterstica esencial de la medicin es la dependencia que tiene de la posibilidad de
variacin. La validez y la confiabilidad de la medicin de una variable depende de las decisiones
que se tomen para operarla y lograr una adecuada comprensin del concepto evitando
imprecisiones y ambigedades, en caso contrario, la variable corre el riesgo inherente de ser
invalidada debido a que no produce informacin confiable.
a) Medicin Nominal.

En este nivel de medicin se establecen categoras distintivas que no implican un orden


especfico. Por ejemplo, si la unidad de anlisis es un grupo de personas, para clasificarlas
se puede establecer la categora sexo con dos niveles, masculino (M) y femenino (F), los
encuestados slo tienen que sealar su gnero, no se requiere de un orden real.
As, se pueden asignar nmeros a estas categoras para su identificacin: 1=M, 2=F o bien,
se pueden invertir los nmeros sin que afecte la medicin: 1=F y 2=M. En resumen en la
escala nominal se asignan nmeros a eventos con el propsito de identificarlos.
b) Medicin Ordinal.
Se establecen categoras con dos o ms niveles que implican un orden inherente entre si.
La escala de medicin ordinal es cuantitativa porque permite ordenar a los eventos en
funcin de la mayor o menor posesin de un atributo o caracterstica. Por ejemplo, en las
instituciones escolares de nivel bsico suelen formar por estatura a los estudiantes, se
desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. Estas escalas
admiten la asignacin de nmeros en funcin de un orden prescrito. Las formas ms
comunes de variables ordinales son tems (reactivos) actitudinales estableciendo una serie
de niveles que expresan una actitud de acuerdo o desacuerdo con respecto a algn
referente. Por ejemplo, ante el reactivo: Isagen debe privatizarse, el respondiente puede
marcar su respuesta de acuerdo a las siguientes alternativas:
__ Totalmente de acuerdo
__ De acuerdo
__ Indiferente
__ En desacuerdo
__ Totalmente en desacuerdo
Las anteriores alternativas de respuesta pueden codificarse con nmeros que van del uno
al cinco que sugieren un orden preestablecido pero no implican una distancia entre un
nmero y otro.
c) Medicin de Intervalo.
La medicin de intervalo posee las caractersticas de la medicin nominal y ordinal.
Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables
continuas pero carece de un punto cero absoluto. El ejemplo ms representativo de este
tipo de medicin es un termmetro, cuando registra cero grados centgrados de
temperatura indica el nivel de congelacin del agua y cuando registra 100 grados
centgrados indica el nivel de ebullicin, el punto cero es arbitrario no real, lo que significa
que en este punto no hay ausencia de temperatura.
d) Medicin de Razn
Una escala de medicin de razn incluye las caractersticas de los tres anteriores niveles
de medicin (nominal, ordinal e intervalo). Determina la distancia exacta entre los intervalos
de una categora. Adicionalmente tiene un punto cero absoluto, es decir, en el punto cero
no existe la caracterstica o atributo que se mide. Las variables de ingreso, edad, nmero

de hijos, etc. son ejemplos de este tipo de escala. El nivel de medicin de razn se aplica
tanto a variables continuas como discretas.