Vous êtes sur la page 1sur 11

Conceptos básicos

La Estadística es la parte de las Matemáticas que se encarga del


estudio de una determinada característica en una población, recogiendo
los datos, organizándolos en tablas, representándolos gráficamente y
analizándolos para sacar conclusiones de dicha población.

Según se haga el estudio sobre todos los elementos de la población o


sobre un grupo de ella, vamos a diferenciar dos tipos de Estadística:

a) Estadística descriptiva. Realiza el estudio sobre la población


completa, observando una característica de la misma y calculando
unos parámetros que den información global de toda la población.
b) Estadística inferencial. Realiza el estudio descriptivo sobre un
subconjunto de la población llamado muestra y, posteriormente,
extiende los resultados obtenidos a toda la población.

Veamos dos ejemplos que nos aclaren estos dos tipos de Estadística:

Ejemplo 1. Cuando van a llegar cualquier tipo de elecciones, por


ejemplo, las elecciones generales, es muy frecuente que los medios de
comunicación, nos adelanten los resultados de encuestas o sondeos en
los que se nos indica el resultado final de dichas elecciones con una
precisión y con un error determinado. Estos sondeos son realizados por
distintas técnicas sobre un grupo (muestra) más o menos numeroso de
personas. Naturalmente, cuánto mayor sea el número de personas con
derecho a voto encuestados, mayor será la fiabilidad de la encuesta,
pero también mayor será el coste del sondeo. El estudio de esta
muestra se haría mediante estadística descriptiva, pero lo que nos
interesa no es el resultado de este estudio reducido sino el resultado
final de las elecciones. El paso de generalizar los resultados de la
muestra a toda la población, se hace mediante técnicas de Estadística
inferencial. La elección de la muestra debe hacerse mediante métodos
de muestreo para que el estudio resulte lo más fiable posible.

Ejemplo 2. Supongamos que estamos en un instituto con un número


muy elevado de alumnos y alumnas, por ejemplo 500, y queremos
hacer un estudio estadístico sobre su altura.

Un método sería pasar clase por clase y medirlos a todos, esto nos
podría llevar un tiempo considerable pero sería la forma más exacta de
hacer dicho estudio, aunque es fácil encontrarnos con ausencias y
tendríamos que volver varios días y pasar lista para conseguir la
estatura de todo el alumnado. Una vez que tengamos todos los datos en
nuestro poder los resultados los obtendríamos mediante Estadística
descriptiva.

Otra posibilidad podría ser pasar clase por clase, decirle a los alumnos y
alumnas que anoten su estatura en un papel y recogerlos todos.
También así tendríamos un estudio de Estadística descriptiva, aunque
seguramente menos fiable que con el método anterior, pues casi con
toda seguridad, algunos alumnos escriban su estatura a cálculo y otros,
con ganas de bromas, muy por encima o muy por debajo de la realidad.

Y otra posibilidad sería escoger una muestra, es decir un grupo de por


ejemplo 50 personas, hacer el estudio descriptivo sobre ellas y después
generalizarlo a todo el instituto con Estadística inferencial. En este caso,
comprobaríamos por una parte que cuanto mayor sea la muestra más
trabajo tendremos, pero más fiable será el resultado final y por otra,
que la elección de la muestra debe hacerse de manera que permita
también fiarnos del resultado obtenido. Si estamos en segundo de
bachillerato, ¿podríamos coger como muestra los 50 alumnos de este
curso? ¿Por qué? ¿Qué forma de elegir la muestra se te ocurre?

En cualquiera de los dos ejemplos, ¿cuáles serían los resultados más


fiables?

Conceptos básicos. Ya hemos hablado de ellos en los ejemplos


anteriores, en cualquier estudio estadístico aparecerán los
conceptos: individuo, cada uno de los elementos, personas u objetos
que se van a estudiar; población, que es el conjunto formado por todos
los elementos a los que les vamos a hacer el estudio; muestra, el
subconjunto de la población que elegimos para hacer un estudio más
reducido.

Variable: Característica que puede presentar distintas modalidades. Por


ejemplo, la variable "género" solo presenta dos modalidades (mujer y
hombre), y la variable "depresión" presenta un número infinito de
modalidades, (las magnitudes de gravedad con que puede afectar a las
personas).
Variables estadísticas

Variable cualitativa

Las variables cualitativas se refieren a características


o cualidades que no pueden ser medidas con números.
Podemos distinguir dos tipos:

Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades


no numéricas que no admiten un criterio de orden. Por
ejemplo: El estado civil, con las siguientes modalidades:
soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades


no numéricas, en las que existe un orden. Por ejemplo:
La nota en un examen: suspenso, aprobado, notable,
sobresaliente. Puesto conseguido en una prueba deportiva:
1º, 2º, 3º, ... Medallas de una prueba deportiva: oro,
plata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante


un número, por tanto se pueden realizar operaciones
aritméticas con ella. Podemos distingu ir dos tipos:
Variable discreta

Una variable discreta es aquella que toma valores


aislados, es decir no admite valores intermedios entre
dos valores específicos. Por ejemplo: El número de
hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua

Una variable continua es aquella que puede


tomar valores comprendidos entre dos números . Por
ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77,
1.69, 1.75.

En la práctica medimos la altura con dos decimales, pero


también se podría dar con tres decimales.

Variable aleatoria

Se llama variable aleatoria a toda función que asocia


a cada elemento del espacio muestral E un número
real.

Se utilizan letras mayúsculas X, Y, ... para designar


variables aleatorias, y las respectivas minúsculas (x, y,
...) para designar valore s concretos de las mismas.
Variable aleatoria discreta

Una variable aleatoria discreta es aquella que sólo


puede tomar valores enteros .

Ejemplos El número de hijos de una familia, la puntuación


obtenida al lanzar un dado.

Variable aleatoria continua

Una variable aleatoria continua es aquella que puede


tomar todos los valores posibles dentro de un cierto
intervalo de la recta real.

Ejemplos La altura de los alumnos de una clase, las horas de


duración de una pila.

Variable aleatoria binomial

La variable aleatoria binomial, X, expresa el número


de éxitos obtenidos en cada prueba del experimento.

La variable binomial es una variable aleatoria


discreta, sólo puede tomar los valores 0, 1, 2, 3, 4, ..., n
suponiendo que se han realizado n pruebas.

Ejemplo k = 6, al lanzar una moneda 10 veces y obtener 6


caras.
Variable aleatoria normal

Una variable aleatoria continua , X, sigue


una distribución normal de media μ y desviación típica
σ, y se designa por N(μ, σ), si se cumplen las siguientes
condiciones:

1. La variable puede tomar cualquier valor: ( -∞, +∞ )

2. La función de densidad , es la expresión en términos


de ecuación matemática de la curva de Gauss .

Variable estadística bidimensional

Una variable bidimensional es una variable en la que


cada individuo está definido por un par de
caracteres, (X, Y).

Estos dos caracteres son a su vez variables


estadísticas en las que sí existe relación entre ellas, una
de las dos variables es la variable independiente y la otra
variable dependiente.

Constante: Característica que presenta una sola modalidad

Datos: Son números que representan las modalidades de las variables.


Por ejemplo, el 1 puede representar la modalidad "Mujer", el 6.3
representa una de las magnitudes que podemos registrar en la variable
"grado de conocimiento de las técnicas estadísticas". Los datos pueden
ser clasificados según diferentes criterios, uno de los cuales se basa en
las modalidades que presentan: Se dirá que son datos dicotómicos los
que provienen de variables que solo admiten dos modalidades (por
ejemplo la variable "género"), son datos dicotomizados aquellos que
presentan dos categorías pero provienen de variables con más de dos
modalidades (por ejemplo datos con valores 1 y 0 que representan
aprobado y suspenso).

Población: Conjunto completo de individuos, objetos o fenómenos.

Muestra: Subconjunto de la población.

Muestreo: Procedimiento de selección de las muestras.

Representatividad de la muestra: Las muestras son partes de la


población, pero no son la población completa. Por ello, sus
características no suelen coincidir con las de la población. La medida en
que la muestra aproxima a la población se denomina representatividad.

Sesgo: Es la discrepancia entre las características de las muestras y las


de la población.

Análisis univariado: Analiza una sola variable. Es más sencillo, más


fácil de entender y de interpretar. En cambio, la sencillez puede
comportar una simplificación excesiva de la realidad. Por ejemplo, un
investigador quiere hacer un estudio del rendimiento académico
universitario, para lo cual recoge las calificaciones de los estudiantes en
los exámenes finales. Es claro que una caracterización del rendimiento
basada exclusivamente en las calificaciones académicas es incompleta y
que, si queremos conocer los condicionantes del rendimiento
deberíamos incluir otros variables (como actitud, preparación previa,
etc.) y estudiar cómo interactúan para dar cuenta de las variables de
interés.

Análisis multivariado: Analiza los datos teniendo en cuenta las


relaciones entre las variables. Es más complejo y de comprensión más
dificultosa, pero proporciona información más completa del objeto
estudiado.
Gráficos y tablas

Gráficos:

Los gráficos se han de explicar enteramente por sí mismos. El contenido


de un gráfico deberá ser tan completo como sea posible.
Las escalas vertical y horizontal estarán rotuladas con claridad dando las
unidades pertinentes. La mayorías de los gráficos presentan información
numérica con escalas, que deben rotularse para describir
completamente la variable presentada en la escala y para variables de
medida se dirán las unidades de medición.
No se debe tratar de abarcar demasiada información en un solo gráfico.
Es mejor hacer varios gráficos que comprimir toda la información en uno
solo. Una regla práctica segura es evitar gráficos que contengan más de
3 curvas.
Los gráficos tienen que dar una visión general y no
una imagen detallada de un conjunto de datos. Las presentaciones
detalladas se deben reservar para las tablas.

Tablas:

Las tablas se explicarán por sí mismas enteramente. como los gráficos,


se ha de dar suficiente información en el título y en los encabezamientos
de columnas y filas de la tabla para permitir que el lector identifique
fácilmente su contenido.
Como el título será por lo general lo primero que se lee en detalle,
deberá suministrar toda la información esencial sobre el contenido de la
tabla y deberá especificar el tiempo, lugar, material ó estudio
experimental y relaciones que se presenten en la tabla.
Para cada variable numérica se han de dar las unidades.
La función del rayado es dar claridad de interpretación.
Las anotaciones de numéricas del cero se han de escribir explícitamente.
Una anotación numérica no debe comenzar con una punto decimal.
Los números que indican valores de la misma característica se han de
dar con el mismo número de decimales.

Medidas de tendencia central

Al describir grupos de observaciones, con frecuencia se desea describir


el grupo con un solo número. Para tal fin, desde luego, no se usará el
valor más elevado ni el valor más pequeño como único representante,
ya que solo representan los extremos. más bien que valores típicos.
Entonces sería más adecuado buscar un valor central.
Las medidas que describen un valor típico en un grupo de observaciones
suelen llamarse medidas de tendencia central. Es importante tener en
cuenta que estas medidas se aplican a grupos más bien que a
individuos. un promedio es una característica de grupo, no individual.

Media aritmética

La medida de tendencia central mas obvia que se puede elegir, es el


simple promedio de las observaciones del grupo, es decir el valor
obtenido sumando las observaciones y dividiendo esta suma por el
número de observaciones que hay en el grupo.
En realidad hay muchas clases de promedios y ésta se la llama media
aritmética para denotar la suma de un grupo de observaciones dividida
por su número.

Mediana
Otra medida de tendencia central que se utiliza con mucha frecuencia es
la mediana, que es el valor situado en medio en un conjunto de
observaciones ordenadas por magnitud.

Moda

Otra medida de tendencia central es la moda. La moda es el valor que


ocurre con mas frecuencia en un conjunto de observaciones.
Oras medidas de tendencia central
Centro de amplitud
Es el valor que queda en medio de los valores mínimo y máximo.

Media geométrica

La media geométrica de un conjunto de observaciones es la raíz n ésima


de su producto. El cálculo de la media geométrica exige que todas las
observaciones sean positivas.
Media armónica

Es el inverso de la media aritmética de los inversos de las


observaciones.

Media ponderada

En ciertas circunstancias no todas las observaciones tienen igual peso.


En general si se tienen observaciones con sus respectivos pesos es:

Medidas de variabilidad

Amplitud

Se obtiene restando el valor mas bajo del mas alto en un conjunto de


observaciones. La amplitud tiene la ventaja de que es fácil de calcular y
sus unidades son las mismas que las de la variable que se mide. La
amplitud no toma en consideración el número de observaciones de la
muestra estadística, sino solamente la observación del valor máximo y
la del valor mínimo. Sería deseable utilizar también los valores
intermedios del conjunto de observaciones.

Desviación media

Esta medida es mas acorde que la de amplitud, ya que involucra a todos


los valores del conjunto de observaciones corrigiendo la desviación. Ésta
medida se obtiene calculando la media aritmética de la muestra, y luego
realizando la sumatoria de las diferencias de todos los valores con
respecto de la media. Luego se divide por el número de observaciones.
Una medida como ésta tiene la ventaja de que utiliza cada observación y
corrige la variación en el número de observaciones al hacer la división
final. Y por último también se expresa en las mismas unidades que las
observaciones mismas.
Varianza

Existe otro mecanismo para solucionar el efecto de cancelación para


entre diferencias positivas y negativas. Si elevamos al cuadrado cada
diferencia antes de sumar, desaparece la cancelación:

Esta fórmula tiene una desventaja, y es que sus unidades no son las
mismas que las de las observaciones, ya que son unidades cuadradas.
Esta dificultad se soluciona, tomando la raíz cuadrada de la ecuación
anterior:

Desviación típica

Es la raíz cuadrada de la varianza:

Entonces en este caso la unidad de s es la misma que la del conjunto de


observaciones de la muestra estadística.

Leer más: http://www.monografias.com/trabajos30/conceptos-de-estadistica/conceptos-de-


estadistica.shtml#ixzz3xRSVlfAM

Leer más: http://www.monografias.com/trabajos30/conceptos-de-estadistica/conceptos-de-


estadistica.shtml#ixzz3xRRBsf45

Vous aimerez peut-être aussi