Vous êtes sur la page 1sur 25

Módulo N°1: Estadística Descriptiva.

Definición de Estadística.
- Descriptiva: todo cúmulo de datos cuantitatvios sobre un conj. de individuos que tienen un
atributo en común.
- Cálculo de Probabilidad: métodos adecuados para dar significado a un conjunto de datos,
afectados por el azar, usando instrumentos de la matemática.
- Inferencial: recopilación, presentación, análisis e interpretación de daros numéricos extraídos
de un conj de individuo, que permiten formular conclusiones válidas y efectuar decisiones
basadas en dicho análisis y extender los resultados desde un grupo pequeño a uno mas grande.
Estadística descriptiva e inferencial.
- Descriptiva: se refiere en un sentido técnico a la rama de la matemática aplicada que se ocupa
de interpretar pos resultados numéricos, elaborar tablas y gráficos explicativos para después
inferir parámetros etadisticos que caracterizan al conj total de datos.
- Inferencial: ciencia que estudia a los fenómenos regidos por el azar, midiendo los riesgos y
llevando a valores numérico los resultados de hechos aleatorios, observando el comportamiento
de una muestra y generalizando conclusiones a toda una población. Trata de la generalización
hacia la población de resultados obtenidos en las muestras y de las condiciones bajo las cuales
estas conclusiones son válidas.
El lenguaje de la estadística.
Teoría de las muestras: establece resultados calidos para una población númerosa partiendo de
la observación del comportamiento de una parte de la misma, la muestra, que bajo ciertas
condiciones, resulta representativa de las características de la población.
- Poblacion: conjunto de todos los elementos que cumplen una determinada característica, que
deseamos medir o estudiar.
- Muestra: cualquier subconjunto de la población.
- Unidad estadística: cada individuo de una población.
- Carácter estadístico: propiedad del atributo que estamos aislando para estudiarla.
Estos a su vez se clasifican en:
1) Carácter estadístico cualitativo o atributo: no es medible, contable, no es cuantitativo. Las
distintas modalidades de un carácter deben cubrir todas las posibilidades y deben ser
exhaustivas y no se puede presentar más de una de ellas pero si una.
Para medir esta variables se usan las siguientes escalas:
- Escalas Nominales: las categorías no mantienen un orden entre sí
- Escalas Ordinales: existe un cierto orden o jerarquía entre las categorías.
2) Carácter estadístico cuantitativo: lo podemos clasificar numéricamente.
- Carácter estadístico discreto: entre 2 elementos consecutivos no existe un valor intermedio.
(Conteo)
- Carácter estadístico continuo: entre 2 elementos consecutivos puede existir uno intermedio.
(Mediciones)

Series estadísticas o distribuciones estadísticas


Es el ordenamiento sistemático de los datos recolectados. Pueden ser:
- Cronológicas: orden teniendo en cuenta el tiempo
- Espaciales o geográficas: orden teniendo en cuenta el territorio o el espacio
- De distribución o frecuencias: correspondencia entre cada valor de la variable y su respectivo
número de observaciones o frecuencias.

Esquema de realización de un trabajo estadístico


1) Especificación del problema
Establecer con precisión el tema a tratar; definir los objetivos del trabajo; seleccionar el material
experimental.
2) Recolección y ordenación de datos
Fijar los procedimientos para realizar el experimento; tener a disposición los elementos
requeridos para recoger los datos; Examinar el tipo de datos requeridos (cuanti o cuali); Disponer
los datos en forma creciente o descendiente, para mejor ubicación y análisis; Encontrar el rango
de variación para saber valores máximos y mínimos.
3) Organización de distribuciones de frecuencias
Se basa en el armado de las tablas.
Distribución de frec. para la variable aleatoria cualitativa
Muestra el número de observaciones para cada una de las clases o categorías del mismo.
- fi: Nro total de observaciones que pertenecen a cada clase
- fir: fi/n
- fir%: expresión porcentual de fir
Distribución de frec. para la variable aleatoria cuantitativa discreta (VAD)
- fi- fir-fir%
- Fk: ∑fi
- Fkr: Fk/n
- Fkr%: expresión porcentual de Fkr
Distribución de frec. para la variable aleatoria cuantitativa continua (VAC)
- Rango: R= Xmax-Xmin
- Intervalos de clase: cada subintervalo que divide el recorrido de la VAC

- Número de intervalos de clase: 𝐾 = √𝑛


- Amplitud o tamaño de clase: R/K
- Límites de clase: extremos de un intervalo de clase
- Límites reales de clase (LRI-LRS): LRS es la semisuma del límite sup de la clase e inf de la
siguiente clase. LRI semisuma del límite inferior de la clase y el superior de la anterior.
- Marca de clase: Mi= punto medio de cada intervalo de clase, promedio.
4) Presentación de datos por medio de gráficos
Existen diferentes gráficos.
- Diagrama de barras: Cualitativo y VAD
- Histogramas: VAC, su ancho es el tamaño de clase
- Pirámide de Población: 2 histogramas y se unen por los lados
- Polígono de Frecuencias: Marco las Mi en el extremo superior de lso histogramas y los uno con
una línea
- Diagrama de torta
- Pictogramas
- Cartogramas
- Diagramas de frecuencias acumuladas: VAD
- Ojiva: VAC
5) Obtención de parámetros característicos:
Los parámetros característicos son toso aquellos valores que describen de manera precisa a un
conjunto de datos.
Medidas de Centralización.
∑xi.fi ∑Mi.fi
- Media Aritmética: X= VAD y VAC
𝑛 𝑛
∑xi.wi
- Media Aritmética ponderada= 𝑛
𝑛
𝑐.( −∑f ant)
2
- Mediana: Me=LRI+
𝑓𝑀𝑒
𝑐.∆1
- Moda: Mo= LRI+
∆1+2
Medidas de Dispersión
Absolutas
- Rango: R= Xmax- Xmin
- Desvíos: di= Xi- X
∑[di]
- Desviación media: DM= 𝑛

∑(xi−X)2 .𝑓𝑖
- Varianza: Var(x)= 𝑛

- Desviación Típica o Estandar: 𝜎 = √𝑉𝑎𝑟(𝑥) para población y 𝑠 = √𝑉𝑎𝑟(𝑥) para muestras.


Relativas
𝜎
Coeficiente de Variación: CV= 𝑋 . 100

Medidas de Concentración
𝑖.𝑛
( −∑𝑓 𝑎𝑛𝑡).𝑐
- Cuartiles: Qi= LRI+ 4
𝑓𝑄𝑖

𝑖.𝑛
( −∑𝑓 𝑎𝑛𝑡).𝑐
- Deciles: Di= LRI+ 10
𝑓𝐷𝑖

𝑖.𝑛
( −∑𝑓 𝑎𝑛𝑡).𝑐
- Percentiles: Pi= LRI+ 100
𝑓𝑃𝑖

Forma de una distribución


Sesgo: mide el grado de concentración de los datos de una distribución a un lado y otro de la
moda, expresando la asimetría.
𝑋−𝑀𝑜
Coeficiente de Asimetría de Pearson: As= 𝑠

(𝑋𝑖−𝑋)3 .𝑓𝑖

Coeficiente de Asimetría de Fisher: As= 𝑛
𝑠3
Modulo N°2: Regresión y Correlación
Diagrama de Dispersión
Es una gráfica que se representa en un sistema de ejes cartesianios, en la cual se marcan los
pares ordenados (x;y) correspondientes a los datos apareados que resultan de las mediciones
experimentales de las dos variables X e Y.
Los puntos pueden mostrar una tendencia curva o lineal, lo cual representa la relación entre las
variables.
Cuando no hay una curva que de ajuste que se adapte a al comportamiento entre las variables
se dice que son independientes.
Además de ser curva o lineal, la relación puede ser positiva o negativa, perfecta o imperfecta.

Regresión lineal simple


Su objetivo es investigar la relación estadística entre la variable dep Y y la variable indep X. La
variable Y es la variable probabilística o aleatoria.
1° Paso: Se realiza el diagrama de dispersión correspondiente al experimento y luego se analiza
si este diagrama se ajusta o no a un modelo de regresión lineal y se trata de hallar la ecuación
que exprese la relación entre las variables.
2° Paso: Determinamos la recta. A la expresión y= bx+a se la denomina ecuación de regresión
estimada, y a su representación gráfica se la llama línea de regresión estimada.
Método de los mínimos cuadrados
3° Paso: Se agrega al gráfico la línea de tendencia obtenida
Error típico de la estimación
El error estándar de estimación es la medida de la dispersión de los valores observados, con
respecto a la línea de regresión.
∑(𝑦𝑖−{𝑦𝑖−𝑦𝑖 𝑒𝑠𝑡)2
Sy;x=√ 𝑛

Regresión y Correlación lineal


1° Paso: Determinar la intensidad o grado de relación a través del coeficiente de determinación.
2° Paso: Obtener la recta de regresión, siempre y cuando el cálculo del coeficiente de
correlación obtenido en la primera etapa lo justifique.
Coeficiente de determinación: es una medida de la bondad del ajuste de los datos observados a
la ecuación de regresión e indica el porcentaje de variación total de la variable dependiente Y,
que se debe a la variación de la variable independiente X.
SCE= ∑(𝑦𝑖 − 𝑦 𝑒𝑠𝑡)2
SCT= ∑(𝑦𝑖 − 𝑦 𝑚𝑒𝑑𝑖𝑎)2
SCR= ∑(𝑦 𝑒𝑠𝑡 − 𝑦 𝑚𝑒𝑑𝑖𝑎)2
SCT= SCR + SCR
𝑆𝐶𝑅
Coeficiente de determinación: D= 𝑆𝐶𝑇

Coeficiente de correlación lineal: r= ±√𝐷 o D= 𝑟 2


Módulo N°3: Cálculo de probabilidades
Modelos determinísticos y probabilísticos
Modelo: esquema teórico, expresado en forma matemática, que representa una realidad
compleja y se utiliza para facilitar su comprensión y estudiar su comportamiento. Se manifiesta
en forma de expresiones matemáticas que relaciona a las variables que se presentan en él.
- Modelo determinístico: se puede pronosticar con precisión e infiabilidad, debido a que
obedece a leyes y ppios inmutables.
- Modelo probabilístico: no se puede predecir con precisión su resultado, debido a que no
obedece a leyes fijas, depende del azar.
Acontecimiento aleatorio- Experimento aleatorio
- Fenómeno observable: todo hecho de la naturaleza que responde a leyes del azar y
sobre el cual no podemos influir, solamente podemos contemplarlo y analizarlo.
Acontecimiento aleatorio: es todo fenómeno observable que se puede analizar, predecir
resultados futuros, pero sobre él no se ejerce influencia alguna.
Experimento aleatorio: todo fenómeno que puede ensayarse, es decir que se lo puede repetir en
condiciones análogas y sus resultados pueden diferir en cada repetición. Reiterándolo un gran
nro de veces se descubre cierta regularidad en dichos resultados, siendo posible tmb variar a
voluntad las causas para posteriormente examinar la influencia que ejercen sobre los efectos.
CONDICIONES QUE DEBE CUMPLIR UN EXPERIMENTO ALEATORIO:
- Se conocen todos los resultados posibles
- Es posible reiterarlo todas las veces que sea necesario en iguales condiciones
- Al repetirlo un gran nro de veces el experimento muestra regularidad estadística
Teoría de conjuntos aplicada al espacio muestral
Espacio muestral: es el conj de todos los resultados posibles
Clasificación:
- Finito: posee nro finito de muestras
- Infinito numerable: posee infinitas muestras, pero se pueden corresponder con los nros
naturales
- Infinitos no numerables
- Discreto: Corresponde a variables estadísticas discretas
- Continuo: Corresponde a variables estadísticas continuas
Suceso o evento: cualquier subconjunto del espacio muestral (Cierto – Imposible)
- Evento complementario: sucede cuando no ocurre A
- Evento Union: Dados A y B, es aquel que sucede cuando sucede al menos uno
- Evento Intersección: Cuando deben suceder los dos a la vez
- Inclusión de eventos: A ocurre si y solo si ocurre B primero
- Evento diferencia: ocurre si y solo si ocurre A solamente
- Eventos mutuamente excluyentes: la ocurrencia de uno de ellos excluye toda posibilidad
de que suceda el otro
- Eventos colectivamente exhaustivos: la ocurrencia de ambos es igual al espacio
muestral
Concepto de probabilidad y sus propiedades
Suceso elemental: cada uno de los posibles resultados al realizar un experimento aleatorio
De esto:
1) La prob es un nro no negativo
2) La prob no puede superar a la unidad, ya que la unidad es el total
Definición clásica de probabilidad
- Espacio muestral finito
- Existen casos favorables (p) y casos desfavorables (q)
- Los resultados son equiprobables
- Los casos son excluyentes entre ellos
La probabilidad de un evento que responde a una prop A es igual al cociente entre el nro de
casos favorables (m) y el nro de casos posibles (n).
𝑚
 P(A)=
𝑛

Definición frecuencial de probabilidad


En una larga serie de pruebas, la frecuencia relativa de un suceso tiene a estabilizarse alrededor
de un nro fijo, llamado probabilidad del suceso.

 P (A)= lim 𝑓𝑟(𝑎)


𝑛→∞

Definición axiomática de probabilidad


Sea E un espacio muestral correspondiente a un experimento aleatorio y P una fc que asocia a
cada evento S un nro real. Se llama prob del suceso S, que se denota P (S) al nro real que
cumple los siguientes axiomas.
1) 0≤ 𝑃 (𝑆) ≤1
2) P (E)= 1
3) Si A; B; C…. son sucesos mutuamente excluyentes de a pares, se verifica:
P (A∪ 𝐵 ∪ 𝐶 ∪ … )= P (A) +P (B)+ P(C)…..
Propiedades de la probabilidad
1. La prob de q ocurra un evento es un nro real entre 0 y 1
2. Si m=n la prob del suceso es de 1, es decir del 100%
3. Si m=0, entonces la prob es igual a 0, es decir el 0%, el conj vacío
4. p casos fav y q casos desfav: p + q=1
5. Dados A y B, si uno esta incluído en otro, es decir, A está incluído en B, la prob de que
suceda A es menor o igual a la prob de que suceda B.
Teorema de la adición de probabilidades
Cuando hay intersección de eventos se utiliza esta fórmula
P (A∪B)= P (A)+ P (B)- P (A∩B)

Cuando son elementos mutuamente excluyentes y no hay intersección de eventos, se utiliza la


siguiente fórmula:
P (A∪B)= P (A) +P (B)

Tablas de contingencias o probabilidades conjuntas


Se encuentran las probabilidades conjuntas donde siempre son intersecciones, y las
probabilidades marginales que son la de los extremos que nos muestras la probabilidad de cada
evento
Probabilidad Condicional
Si A es un suceso cualquiera de un espacio muestral E, entonces la probabilidad de un suceso,
una vez que haya sucedido A, que se denota P (B/A), se define como el cociente entre la prob de
la intersección de los eventos t la probabilidad del que ocurrió primero.
𝑃 (𝐴∩𝐵)
P (B/A)=
𝑃 (𝐴)

Teorema de la multiplicación
Si A y B son dos sucesos dependientes tales que P (A) y P (B/A) son conocidas, la ocurrencia
simultánea de estos eventos P (A∩B), es igual al producto de la probabilidad de uno de ellos por
la probabilidad condicional del otro, calculada suponiendo que el primer suceso ya ha ocurrido.
(evtos dependientes)
P (A∩B)= P (B/A). P (A)
Eventos independientes
Los eventos A y B son sucesos independientes si el hecho de que acontezca uno, no tiene
ningún efecto en la probabilidad del otro, es decir, si P (B/A)= P (B), es decir
P (A∩B)= P (A). P (B)
Teorema de Bayes
Diagrama de árbol (probs coondicionadas)
Módulo N°4: Variable aleatoria
Definición de variable aleatoria
Una variable aleatoria X de un esp muestral E es una función que hace corresponder a cada
elemento de E un nro real. Convierte a las muestras en nro reales, sean o no elementos
cuantitativos.
EL conj de valores que pude tomar la variable aleatoria X se lo llama recorrido de la variable
aleatoria.
Clasificación de variables aleatorias
1) Variables discretas (VAD): entre 2 valores consecutivos de la misma variable no existe un
valor intermedio. Tiene un esp muestral finito o infinito numerable.
2) Variables continuas (VAC): entre 2 valores cualesquiera de misma variable siempre existen
valores intermedios. Tiene un espacio muestral infinito no numerable.
Variable aleatoria discreta
Función de probabilidad
Es la función que hace corresponder a cada elemento del espacio muestral el valor de su
probabilidad
Propiedades de la fc de probabilidad
1) La prob de cualquier valor de la variable si es positiva y entre 0 y 1
2) La suma de las prob de todos los valores que puede tomar la variable e igual a 1, es decir al
100%
3) La prob del evto imposible es nula
Esperanza de una variable aleatoria discreta

Varianza y desviación estándar de una VAD


Desvío: es la diferencia entre cada valor de la variable aleatoria y su valor esperado
Di= xi-µ
Varianza: es la esperanza de los cuadrados de los desvíos de la variable aleatoria
Var (X)= E (𝑑𝑖)2 = ∑ (di)2. P (di)
La varianza de una variable aleatoria es la esperanza de los cuadrados de los desvíos de dicha
variable con respecto a la media.
Var (X)= E (D)2= ∑(xi-µ)2. P(xi)
O puede demostrarse que la varianza puede calculare por la fórmula:
Var (X)= E(x2) – [E (x)]2= E (x2)- µ2
Variables aleatorias continuas
Función de densidad

Esperanza y varianza para una VAC


Si x e una VAC, se llama esperanza matemmático o valor medio de dicha variable aleatoria a la
expresión:

E (x)= ∫−∞ 𝑥. 𝑓(𝑥)𝑑𝑥

Desigualdad de Chebyshev
Para un conjunto cualquiera de observaciones (muestra o población),la proporción mínima de los
valores que se encuentran dentro de k desviaciones estándares a partir de la media es mayor o
1
igual que 1- 𝑘 2 , donde k es una constante mayor que 1

En símbolos:
1
P[│x- E(x)│< 𝑘 𝜎𝑥] > 1 − donde E(x)= µ
𝑘2
O sino:
1
P[│x- E(x)│≥ 𝑘 𝜎𝑥] ≤ donde E(x)= µ
𝑘2

Función de probabilidades acumuladas o función de distribución de probabilidades


Sea X unaVAD, la fc de distribución F(x) es la fc:
F: R-R definida por: F(xk)= P (x≤xk)= ∑ P(xi)
Módulo N°5: Modelos probabilísticos discretos
Modelos probabilísticos discretos
Distribución de Bernoulli
- Se realiza una sola prueba o repetición del experimento
- tal prueba tiene solo 2 resultados posibles, p o q
E (y)= p
Var (y)= E(𝑦 2 ) − µ2
E(𝑦 2 ) = 𝑝
Var (x)= p.q

𝜎= √𝑝. 𝑞

Distribución Binomial
- Solo se realiza si es proceso es con reposición
- p y q salen de analizar cada uno como un Bernoulli y son las mismas en toda la experiencia,
son constantes
- nro finito de pruebas
𝑛
Modelo binomial: b(k;n;p)= ( ). 𝑝𝑘 . 𝑞 𝑛−𝑘
𝑘
Donde: n: nro de veces; k: nro de éxitos
E (x)= n.p
Var (x)= n.p.q
Número más probable de repeticiones de un suceso
p.n-q≤ 𝑥0 ≤p.n+p
Distribución Multinomial
- Se esperan más de 2 tipos de resultados
- Las probs asociadas a cada uno de los resultados son constantes
- Cada una de las repeticiones del experimento son independientes
- El nro de repeticiones de experimento es constante

Distribución Hipergeométrica
- Se toma una muestra de tamaño n, sin reemplazo de un conj finito de N objetos
- k de los N objetos se puede clasificar como éxitos y N-K fracasos.
- No hay reposición
Distribución de Poisson
Se usa mucho en procesos donde existe una obervación por unidad de tiempo o espacio
- Debe existir un nro fijo y finito de pruebas
- Cada una de las pruebas tiene solo 2 resultados o q
- La prob del éxito es la misma es cada prueba
- Las pruebas son estadísticamente independientes
- El tamaño de la muestra debe ser grande
- La probabilidad de éxito es pequeña
ℯ −𝜆 .𝜆𝑘
P (X=k)=
𝑘!

E (x)= 𝜆 = Var (x)= n.p


Módulo N°6: Modelos probabilísticos continuos
Modelos probabilísticos continuos
Distribución normal
Una distribución de probabilidad sigue una distribución normal con media µ y desviación
estándar 𝜎, que se denota como N (µ, 𝜎), si la fc de densidad tiene una representación gráfica
campanular, positiva, continua, simétrica respecto a la media, donde se ubica su punto máximo.
Propiedades de toda curva normal
1) Dom: R
1
2) Pto máximo de toda curva en (𝜇; 𝜎.√2𝜋)

3) Todas las curvas son simétricas respecto a la vertical que pasa por el pto max
4) Todas las curvas normales tienen forma de campana, cerca de su pto max son convexas,
tienen 2 ptos de inflexión x=𝜇 − 𝜎 y x= 𝜇 + 𝜎 donde se vuelven cóncavas.
5) El área entre la curva normal y el eje x es = a 1
6) Media, mediana y moda coinciden y corresponden al pto máximo de la curva
La distribución normal queda definida por 2 parámetros, su media y su desviación estándar y la
representamos así N(𝜇𝑥; 𝜎𝑥)

El área del intervalo (a;b), debajo de la curva y encima del eje x, es la prob P(𝑎 ≤ 𝑥 ≤ 𝑏).
Los valores µ y 𝜎 determinan la forma y situación de la curva normal.
- La distribución de una variable aleatoria normal con media 0 y desviación estándar 1 se llama
distribución normal estándar.
1 2
1
Su función de densidad es f (z)= . 𝑒 −2(𝑧)
√2𝜋
Propiedades de toda curva normal estándar
1) Caracteriza a las VAC
2) Tiene forma de campana, simétrica resecto al eje y

3) E (x)=0 y 𝜎= 1
4) Media= Mediana= Mo da= 0
5) Puntos de inflexión en z=±1=±𝜎
6) Máximo en z=0
7) El área entre la curva normal estándar y el eje z es= a 1
8) Es asintótica respecto al eje z

Aproximación de la distribución binomial (Teorema de Moivre)


La distribución binomial será simétrica, como la normal, siempre y cuando p=0,5.
Cuando p≠ 0,5, la binomial no será simétrica. Mientras p esté más cerca de 0,5 y cuanto más
grande sea n (n≥30), más simétrica se vuelve la distribución.
Cuando más grande es la muestra de la binomial, se comporta como una normal y podemos
resolver el problema mediante la curva de Gauss.
1) P (x=a)= 𝑃(𝑎 − 0,5 ≤ 𝑥 ≤ 𝑎 + 0,5)
2) Encontrar la posibilidad de x≥a-0,5
3) Encontrar la posibilidad de x≤a+0,5
ESTA APROXIMACIÓN SE PUEDE USAR SIN np o npq SON AL MENOS 5
𝑋−𝑛𝑝
Z=
√𝑛𝑝𝑞
Distribución t de Student
Se conoce 𝜎 pero la meustra es menor a 30, entonces se usa s en lugar de 𝜎 y se utiliza la
distribución t.
𝑋−𝜇𝑥
t= 𝑠
√𝑛

Grados de libertas
Es el nro de valores que podemos elegir libremente.
Distribución Chi-Cuadrado

Si consideramos n variables aleatorias indpendientes con distribución normal estándar (𝜇𝑥=0;


𝜎 = 1), la suma de los cuadrados de cada una de ellas origina una nueva variable aleatoria
llamada X2 de Pearson.
X2= X12 +X22 ……+Xm2
Las gráficas de Chi-cuadrado dependen de los grados de libertad.
- La fc existe en los R+
- Las curvas son asimétricas positivas
- Las fc de densidad son sesgadas y varían según el nro de grados de libertad. Mayor grado de
libertad más se parece a la normal.
Módulo N°7: Teoría del muestreo
Muestreo
Es el procedimiento mediante el cual se obtienen una o más muestra de una población. La
muestra debe ser aleatoria, es decir, debe ser elegida al azar.
Conveniencia del muestreo
Conviene tomar muestras cuando:
- La población es infinita o muy grande, es decir que sea difícil hacer un censo
- La población es suficientemente uniforme, es decir que asegure representatividad
- Cuando el proceso de investigación es destructivo
- Si la medición implica un proceso destructivo
- Por cuestiones económicas, debido a que investigar solo algunos componentes de la población
es más barato que investigar todos
- Por cuestiones de calidad, porque se miden pocos elementos pero se los mide de manera más
precisa
Tipos de muestreo
Muestreo Probabilístico
Los métodos de selección de los miembros de la muestra se escogen utilizando proceso
aleatorio, es decir que cada individuo de la población tiene alguna probabilidad conocida de
figurar en la muestra.
Es necesario que la prueba o experimento se pueda considerar aleatorio, es decir regida por el
azar. La aleatoriedad es una característica del proceso de muestreo utilizado.
a) Muestreo simple al azar:
Cada elemento de la población debe tener la misma probabilidad de ser seleccionado, por eso
se debe implementar un mecanismo de sorteo o selección que garantice la equiprobabilidad
Pasos:
1- Definir la población de estudio
2- Enumerar todas las und de análisis que integran la población, asignándoles un nro de
identidad
3- Determinar el tamaño e muestra óptimo para el estudio
4- Seleccionar la muestra de manera aleatoria.
El muestre simple al azar puede ser:
- Con reemplazo: todas las muestras y elementos de la población tienen la misma prob de ser
seleccionados, se puede considerar infinita la población y cada extracción o experimento es
independiente del anterior
- Sin reemplazo: también todas las und tienen la misma prob dde ser extraídas, pero si al
población es finita, la prob depende de los que fueron extraídos anteriormente.
b) Muestreo sistemático al azar
Se usa cuando la población es de gran tamaño o se extiende en el tiempo. La selección se
realiza usando algún sistema o regla.
𝑁
Se calcula primero el salto sistémico k= 𝑛 . Luego se determina la forma de extraer la primera
unidad y desde ese elemento en adelante se toma uno cada k elementos.
Muestreo no probabilístico
a) Muestreo por cuotas o accidental
Se divide la población en varios estratos, luego se calcula el peso proporcional de cada estrato y
finalmente se multiplica el peso por el tamaño n de la muestra para determinar la cuota precisa
en cada estrato. Una vez determinada la cuota, el investigador es libre de elegir a los sujetos de
la muestra dentro de cada estrato.
b) Muestreo a conveniencia o intencional
Cuando los elementos son seleccionados por juicio personal, generalmente por una prsona
experta en la medida dada. Son fáciles de obtenerla y de bajo costo.
Es un camino de selección no aleatorio por lo que la representatividad de la muestra depende
del juicio del experto que selecciona. Es un método subjetivo.
c) Muestreo casual, incidental o fortuito
El muestreo se realiza considerando la disponibilidad de los elementos en la población, lo
caracteriza la accesibilidad.
d) Bola de nieve
Se usa cuando se desea medir alguna característica de una población que desconocemos o no
hay base de datos, es decir que no se dispone de un marco de muestreo o cuando los individuos
de la población son difíciles de encontrar.
Cada individuo de la población puede nominar a otros que tienen la misma posibilidad de ser
seleccionados. Para que el grupo de estudio se aproxime a una muestra aleatoria, el primer
grupo debe ser seleccionado aleatoriamente.
e) Muestreo de poblaciones móviles
Se realiza tomando como base una población de individuos que se movilizan y no permanecen
en un sitio donde se los pueda evaluar.
f) Muestreo con fines especiales
Se hace sobre una población que presenta caracs comunes.
La muestra debe ser adecuada en cantidad y calidad. La representatividad hace referencia a la
calidad
Introducción al lenguaje del muestreo
- Parámetro: medida usada para describir alguna carac de la población.
- Estadístico muestra: toda medida usada para describir alguna carac de la muestra
UN ESTADÍSTICO MUESTRAL ES UN ESTIMADOR DEL CORRESPONDIENTE PARÁMETRO
POBLACIONAL
Distribución muestral
La distribución muestral es la distribución e frecuencia de un estadístico muestral.
La distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir
de muestras de igual tamaño.
Si de una población se extrae muestras aleatorias de tamaño n y de cada muestra se calcula su
media X, el conj de todos los valores de las medias muestrales forma lo que se denomina
distribución muestral de medias. Así la distribución muestral de la media es la distribución e
frecuencias para los posibles valores de la media muestral basada en un tamaño fijo de muestra
Esperanza y Varianza de los estimadores muestrales
Variable media muestral
Muestreo de poblaciones infinitas
Sea X1, X2,….., Xm una muestra aleatoria de una población infinita con media poblacional µx y
varianza 𝜎 2 x, se verifica que:
a) E (x)= µx osea µx(media)= µx
b) Para poblaciones infinitas o muy grandes

Muestreo de poblaciones finitas


Si la muestra de tamaño n se extrae de una población de tamaño N, y se muestrea más del 5%
𝑛
de la población (𝑁 ≥ 0,05) debe usarse un factor de corrección por población finita (cpf) en la
fórmula de la desviación estándar de la media, el que se calcula mediante:

𝑁−𝑛
Cpf: √𝑁−1

𝜎𝑥 𝑁−𝑛
Entonces sería: 𝜎𝑥 = . √𝑁−1
√𝑛

Variable varianza muestral


Tomando todas las posibles muestras aleatorias, de tamaño n, extraídas de una población y
computando la varianza para cada muestra podemos obtener la distribución muestral de la
varianza.
Teorema del límite central
Sea X una variable aleatoria con distribución binomial de parámetros n y p. Si n es grande
entonces la distribución de X es aproximadamente normal con esperanza µ= n.p y varianza 𝜎2=
n.p.q. En la práctica se suele utilizar esta aproximación cuando n.p y n.q son mayores que 5 o
bien cuando n≥30.
Permite usar la distribución normal como la distribución de las medias de muestras grandes, sin
interesar cual sea la distribución original de las variables aleatorias.
En general:
Sea X1,X2…Xm una muestra aleatoria de tamaño n de variables independientes tomadas de
una población infinita, con media µ y varianza 𝜎2, entonces el promedio de las mimsas, por ser
una suma de ellas, sigue una ley normal si n≥30.
Módulo N°8: Estimación

Vous aimerez peut-être aussi