Académique Documents
Professionnel Documents
Culture Documents
DEFINICIONES DE ESTADÍSTICA
¿Qué es la estadistica?
Estadística es la ciencia de:
Recolectar
Describir
Organizar
Interpretar
Para transformarlos en información, para la toma más eficiente de decisiones
¿Quienes usan la estadística?
Organismos oficiales.
Diarios y revistas.
Políticos.
Deportes.
Marketing.
Control de calidad.
Administradores.
Tipos de Estadística
Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos
en forma informativa.
Ejemplo 1: Los datos del Censo de población de 2001.
Ejemplo 2: La cantidad de robos ocurridos el último mes en en el municipio.
Estadística inferencial: Métodos usados para determinar algo acerca de la población,
basado en una muestra.
Población (1) es la colección, o conjunto, de individuos, objetos o eventos cuyas
propiedades serán analizadas.
Muestra es un subconjunto de la población de interés.
(1) Algunos autores utilizan Universo como sinónimoPoblación y Muestra
1.1.2. VARIABLE Y TÍPOS DE VARIABLES
Variable
Variable: Característica de interés sobre cada elemento individual de una población o
muestra.
Dato: Valor de la variable asociada a un elemento de la población o muestra. Este valor
puede ser un número, una palabra o un símbolo.
Tipos de Variables
Cualitativa o de Atributos Clasifica o describe un elemento de la población. Los valores
que puede asumir no constituyen un espacio métrico, por lo tanto las operaciones
aritméticas, como sumar y obtener promedios, no son significativas
Tipos de Variables(cont
Cuantitativa o Numérica Cuantifica un elemento de la población. Los valores que
puede asumir constituyen un espacio métrico, por lo tanto las operaciones aritméticas,
como sumar y obtener promedios,son significativas.
Ejemplos: Cantidad de Habitaciones, Número de hijos, Kilómetros recorridos, Tiempo
de vuelo, Ingreso, etc..
• Las variables cuantitativas se pueden clasificar a su vez en discretas o continuas.
Cuantitativas Discretas: solo pueden asumir ciertos valores y normalmente hay huecos
entre ellos. Son conteos normalmente.
• Ejemplo1: cantidad de materias aprobadas.(1, 2,3 ......)
• Ejemplo2: cantidad de productos (1, 2, 3,4...)
Las variables cualitativas se miden en escala nominal o ordinal.
Nominal: los elementos solo pueden ser clasificados en categorías pero no se da un
orden o jerarquía
Ejemplo 1: Barrio de residencia de los alumnos .
Ejemplo 2: Color de ojos
Ejemplo 3: Simpatizante de un club de futbol
El fin último de cualquier estudio es aprender sobre las poblaciones. Pero es
usualmente necesario, y más práctico, estudiar solo una muestra de cada una de las
poblaciones.
Definimos:
POBLACIÓN ⇒ total de sujetos o unidades de análisis de interés en el estudio
MUESTRA ⇒ cualquier subconjunto de los sujetos o unidades de análisis de la
población, en el cual se recolectarán los datos
Usamos una muestra para conocer o estimar características de la población,
denominamos:
PARÁMETRO ⇒ una medida resumen calculada sobre la población
ESTADÍSTICO ⇒ una medida resumen calculada sobre la muestra
1.1.2.1. TIPOS DE DATOS
En esta parte presentaremos los distintos tipos de datos o variables que podemos
encontrar en una investigación e comentaremos algunas estrategias para el manejo de
datos con una computadora.
1.1.2.2. CARACTERÍSTICAS DE LOS CONJUNTOS DE DATOS.
Denominaremos:
- UNIDAD DE ANÁLISIS O DE OBSERVACIÓN al objeto bajo estudio. El mismo
puede ser una persona, una familia, un país, una región, una institución o en general,
cualquier objeto.
- VARIABLE a cualquier característica de la unidad de observación que interese
registrar, la que en el momento de ser registrada puede ser transformada en un
número.
- VALOR de una variable, OBSERVACIÓN o MEDICIÓN, al número que describe a la
característica de interés en una unidad de observación particular.
- CASO o REGISTRO al conjunto de mediciones realizadas sobre una unidad de
observación.
(variables independientes) afectan a una o más variables de interés (variables
dependientes). Por ejemplo en un experimento, el investigador impone a los sujetos
condiciones (variable independiente) y estudia el efecto de la misma sobre una
característica del sujeto (aparición de una cierta característica, modificación de una
condición, etc.).
Un paso importante al comenzar a manejar un conjunto de datos es identificar cuántas
variables se han registrado y cómo fueron registradas esas variables, lo que permitirá
definir la estrategia de análisis
DISTRIBUCIÓN Y FRECUENCIA
Frecuencia
1. En cada prueba del experimento sólo hay dos posibles resultados: Éxitos o Fracasos.
Z se la conoce como variable aleatoria estandarizada.
Esta función se caracteriza por tener media igual a cero y desviación tipificada
igual a uno : N(0,1)
Representa a todas las distribuciones Normales. Igual densidad de
probabilidad, si medimos desviaciones de media en base a s.
Valores obtenidos de tabla Normal válidos para todas las distribuciones
Normal de
La distribución de Poisson
La distribución de probabilidad de Poisson es un ejemplo de distribución de
probabilidad discreta.
La distribución de Poisson parte de la distribución binomial.
Cuando en una distribución binomial se realiza el experimento muchas veces, la
muestra n es grande y la probabilidad de éxito p en cada ensayo es baja, es aquí donde
aplica el modelo de distribución de Poisson.
Distribución “t” de Student
Desarrollada con base en distribuciones de frecuencia empíricas por William
Gosset, (a) “Student”.
“The probable error of a mean” Biometrika 1908
Cervecero - estadístico con dificultades al usar distribución Normal en muestras
pequeñas.
Sin embargo fue Fisher el que encontró mas aplicaciones para esta distribución.
Distribución muestreal del promedio se ajusta muy bien a la distribución Normal
cuando se conoce s. Si n es grande, esto no presenta ningún problema, aun
cuando s sea desconocida, por lo que en este caso es razonable sustituirla por s.
Características Distribución “t”
Tiene media igual 0, es asintótica al eje x y su dominio va de - ¥ a +¥;
El área bajo la curva desde -¥ a +¥ es igual a 1
m = 0, s2 depende parámetro n (grados libertad n-1)
Varianza > 1, pero se aproxima a 1 cuando nÞ¥
Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó más, excelente
Ji-cuadrado
Distribución Ji-cuadrado es una función de densidad de probabilidad que
representa la distribución muestreal de la varianza.
Definimos el estadístico Ji-cuadrado (c2) como:
(n - 1) s2
2 =
2
Calcular la linea
( X i ) 2
x 2
(X i X )2 X i
2
n
( X )( Y )
xy X Y i i
i
n
i
b
xy
x 2
Regresión lineal múltiple
La regresión lineal múltiple trata de explicar el comportamiento de Y con más de una
variable predictora usando una función lineal.
Un modelo matemático de regresión lineal múltiple tiene el siguiente aspecto: