Vous êtes sur la page 1sur 9

Formulario.

Estadística Administrativa

Módulo 1. Introducción al análisis estadístico


El número de intervalos de clase, k, se elige de tal forma que el valor
2k sea menor (pero el valor más aproximado) al número de
observaciones.
Histogramas Criterio de Sturges: k= 1+3.3log(n)

Ancho de clase =

Media aritmética (media


muestral)

Media aritmética fi = frecuencia absoluta de la clase i


(muestral) para datos mi= es el punto medio de la clase i
agrupados k = # Intervalos de clase

Si n es impar, es la observación ordenada

Mediana (muestral) Si n es par, es el promedio las observaciones ordenadas

Moda (muestral) Es el valor que más se repite

Varianza muestral

fi = frecuencia absoluta de la clase i


mi= es el punto medio de la clase i
Varianza muestral para k = # Intervalos de clase
datos agrupados
Es la media muestral
agrupada
Desviación estándar
muestral
Coeficiente de variación
muestral
Percentil P
0< P < 100 Es la observación ordenada
1. Observación mínima no considerada extrema = Q1 - 1.5*fs
2. Primer cuartil (Percentil 25, Q1)
3. Mediana (Percentil 50, Q2)
4. Tercer cuartil (Percentil 75, Q3)
5. Observación máxima no considerada extrema = Q3 + 1.5*fs
Diagrama de caja
Rango intercuartílico = fs= Q3 – Q1
Puntos extremos del lado izquierdo < Q1 - 1.5*fs
Puntos extremos del lado derecho > Q3 + 1.5*fs

Módulo 2. Teoría de Probabilidad


Probabilidad marginal P(A)
Regla del complemento P(Ac) = 1 – P(A)
Probabilidad conjunta P(A ∩ B)
Regla de la adición para eventos mutuamente
P(A B)= P(A) + P(B)
excluyentes
Regla de la adición para eventos con elementos
P(A B) = P(A) + P(B) – P(A ∩ B)
en común
Regla de la multiplicación para eventos P(A ∩ B) = P(A)P(B)
independientes
Regla de la multiplicación para eventos P(A ∩ B) = P(A/B)P(B) ;
dependientes P(A ∩ B) = P(B/A)P(A)
Probabilidad condicional para eventos
P(A/B) = P(A) ; P(B/A) = P(B)
independientes
Probabilidad condicional para eventos
P(A/B) = ; P(B/A) =
dependientes
Regla de producto para pares ordenados T = n1*n2
Regla de producto para arreglos ordenados de
Tk = n1*n2*……*nk
k elementos
Permutaciones

En la selección: Importa el orden y la selección


es sin reemplazo.

Combinaciones
En la selección: No importa el orden y la n Cx
selección es sin reemplazo.
Módulo 3. Modelación de mediciones aleatorias
Distribución de probabilidad de una variable para todos los valores de X
aleatoria discreta
Distribución de probabilidad acumulada de para todos los valores de X
una variable aleatoria discreta
Valor esperado de una variable aleatoria
discreta

donde,
Varianza de una variables aleatoria discreta

Distribución de probabilidad Binomial P(X = x) = nCx


X = # de éxitos en n pruebas idénticas Para x = 0,1,2,3,...,n
Valor esperado y varianza de una variable µ = E(X) = np
aleatoria Binomial σ 2 = V(X) = np(1-p)

Distribución de probabilidad Poisson


X = # de éxitos en un intervalo de tiempo
P(X = x) = x = 0,1,2,3,………
Valor esperado y varianza de una variable E(X) = µ
aleatoria Poisson V(X) = µ
Función de densidad de probabilidad f(x) para variables aleatorias continuas
Distribución de probabilidad acumulada de
una variable aleatoria continua
Valores esperados para variables aleatorias
continuas

donde,
Varianza de una variable aleatoria continua

Propiedades del valor esperado E(aX + b) = aE(X) + b


Propiedad de la varianza V(aX + b) = a2V(X)
Función de densidad de probabilidad normal Si X ~ Normal con E(X) = µ y V(X) = σ 2
Entonces

~ Normal Estándar con


E(Z) = 0 y V(Z) = 1
Función de densidad de probabilidad de una
variable aleatoria exponencial para
Función de distribución acumulada de una
variable aleatoria exponencial
Módulo 4. Distribuciones de muestreo y estimación de parámetros
Distribuciones de muestreo
Escenario Estadístico Distribución Parámetros
Población normal Normal

Población desconocida Aproximadamente


Normal
y

Aproximadamente
normal y

Intervalos de confianza estimados de 100*(1-α)%


Escenario Intervalo
Caso 1. Intervalo para µ σ
Distribución poblacional de X normal x ± zα 2
Varianza conocida, σ2 n
Caso 2. Intervalo para µ con muestras pequeñas
Distribución poblacional de X normal
Varianza desconocida

Caso 3. Intervalo para σ 2


Distribución poblacional de X normal LIC

LSC
Caso 4. Intervalo para p (Nivel de confianza aproximado)

; ;

Tamaños de muestra
Para estimar un intervalo para µ para el Caso 1
(Población infinita)

E = Error máximo permisible


Para estimar un intervalo para µ para el Caso 1
(Población finita)
N= Tamaño de la población
D=
Para estimar un intervalo para P para el Caso 5

E = Error máximo permisible

Módulo 5. Pruebas de hipótesis paramétricas y no paramétricas

Pruebas de hipótesis con un nivel de significancia de α para una población


Escenario Hipótesis Estadístico Regiones de rechazo

Caso 1. Prueba para µ H0 : µ = µ0


Ha : µ > µ0 z zα
Distribución de X normal Ha : µ < µ0 z - zα
Varianza conocida, σ2 Ha : µ ≠ µ0 Z - zα/2 ó z zα/2
H0 : µ = µ0
Caso 2. Prueba para µ
Ha : µ > µ0 t tα,n-1
Distribución de X normal
Varianza desconocida Ha : µ < µ0 t - tα, n-1

Ha : µ ≠ µ0 t - tα/2, n-1 ó t tα/2, n-1

H 0 : σ2 = σ2 0
Caso 3. Prueba para σ 2
H a : σ2 > σ2 0 χ2 χ2α, n-1
Distribución de X normal
H a : σ2 < σ2 0 χ2 χ21-α, n-1
H a : σ 2 ≠ σ2 0 χ2 χ21-α/2, n-1 ó χ2 >= χ2α/2, n-1

H0: p = p0
Caso 4. Prueba para p z zα
(nivel de significancia aproximado)
Ha: p > p0
; Ha: p < p0 z - zα
;
Ha: p ≠ p0 z - zα/2 ó z zα/2

Pruebas de hipótesis con un nivel de significancia de α para dos poblaciones


Escenario Hipótesis Estadístico Regiones de
rechazo
H0: µ1 − µ2 = Δ0
Ha: µ1 − µ2 > Δ0 z zα
Ha: µ1 − µ2 < Δ0 z
- zα
Caso 1. Prueba para z - zα/2 ó
µ1 − µ2 Ha: µ1 − µ2 ≠ Δ0 z zα/2
Distribuciones normales.
Varianzas conocidas (σ12,σ22) Ha: µ1 − µ2 > Δ0 z zα
Muestras independientes.
Ha: µ1 − µ2 < Δ0 z - zα
z - zα/2 ó
Ha: µ1 − µ2 ≠ Δ0
z zα/2

Caso 2. Prueba para µ 1 − µ 2 H0: µ1 − µ2 = Δ0

Escenario 1 Ha: µ1 − µ2 > Δ0 t tα, (n + n2) -2


1

Distribuciones normales.
Muestras independientes. Ha: µ1 − µ2 < Δ0 t - tα, (n1+ n2) -2
Varianzas desconocidas, pero
asumidas iguales. t - tα/2, (n1+ n2) -2
σ1 2 = σ2 2 Ha: µ1 − µ2 ≠ Δ0
ó t tα/2,( n1+ n2) -2

H0: µ1 − µ2 = Δ0
Escenario 2
Distribuciones normales.
Ha: µ1 − µ2 > Δ0 T tα, ν
Muestras independientes.

Varianzas desconocidas, pero Ha: µ1 − µ2 < Δ0 T - tα, ν


asumidas diferentes.
σ1 2 ≠ σ2 2
t - tα/2, ν
Ha: µ1 − µ2 ≠ Δ0
ó t tα/2, ν

Caso 3. Prueba para σ 12/σ 22 H0: σ12/σ22 = 1 ν1=n1-1


ν2=n2-1
Distribuciones normales Ha: σ12/σ22 > 1 F Fα,ν1,ν2
Muestras independientes Ha: σ12/σ22 < 1 F F1-α,ν1,ν2

F F1-α/2,ν1,ν2 ó
Ha: σ12/σ22 ≠ 1
F fα/2,ν1,ν2
Donde, y

Caso 4. Prueba para p1 − p 2 H0: p1 − p 2 = 0


(nivel de significancia aproximado)
Ha: p1 − p 2 > 0 z zα
Escenario 1
Muestras independientes Ha: p1 − p 2 < 0 z - zα
Δ0 = 0

y z - zα/2 ó
Ha: p1 − p 2 ≠ 0
; z zα/2
i = 1, 2
H0: p1 − p 2 = 0
Escenario 2
Muestras independientes
Δ0 ≠ 0 Ha: p1 − p 2 > 0 z zα

y Ha: p1 − p 2 < 0 z - zα
; z - zα/2 ó
i = 1, 2 Ha: p1 − p 2 ≠ 0
z zα/2

Valor P para una prueba Z


Valor P = 1 – P(Z < z calculada) para una prueba de cola superior
Valor P = P(Z < - z calculada) para una prueba de cola inferior
Valor P = 2*[1 - P(Z < |z calculada|)] para una prueba de dos colas
Si,
Valor P Rechazar H0 al nivel α
Valor P No rechazar H0 al nivel α

Análisis de Varianza, ANOVA, de un factor


H0 = µ1 = µ2 = …= µi = ... = µk
Hipótesis
Ha = al menos dos de las µi son diferentes
Las poblaciones tienen distribuciones normales
Supuestos Las poblaciones tienen desviaciones estándar poblacionales iguales.
Las muestras se seleccionan de manera independiente
Rechazar H0 si
Región de rechazo
F >= Fα, k – 1, n – k
Tabla ANOVA
Fuente de
Suma de Cuadrados G. de L. Cuadrados Medios Estadístico
Variación
Entre
k-1
tratamientos

Dentro de
SCE = SC(Total) - SCT n-k
tratamientos

Total n-1

Donde,

Ti Es la suma total de los valores x en la muestra i


ni Es el número de observaciones en la muestra i

Es la suma de los valores de x en todas las muestras

Son los valores de x en todas las muestras elevados al cuadrado y luego sumados

N es el número total de observaciones n = n1 + n2 + ….+ ni + … + nk


K El número de niveles (poblaciones o tratamientos) del factor

Pruebas de la bondad de ajuste


Aplicaciones: Hipótesis Estadístico Regiones de
rechazo

Frecuencias esperadas H0: las frecuencias observadas


iguales o diferentes son iguales a las esperadas

Normalidad Ha: Son diferentes k = clases o celdas


ei = n*pi

H0: las variables categóricas


son independientes
r = # renglones
Tablas de contingencia
c = # columnas
Ha: Son dependientes
Niveles de confianza más utilizados para estimar intervalos que involucran Z
1-α α α/2 z α/2
0.90 0.1 0.05 z 0.05 = 1.645
0.95 0.05 0.025 z 0.025 = 1.96
0.98 0.02 0.01 z 0.01 = 2.33
0.99 0.01 0.005 z 0.005 = 2.575

Regiones de rechazo más utilizadas para pruebas Z con un nivel de significancia de α


Prueba de cola inferior Prueba de cola superior Prueba de dos colas
α z - zα z zα z - zα ó z zα
0.1 -z 0.1 = -1.282 z 0.1 = 1.282 -z0.05 = -1.645 ó z0.05 = 1.645

0.05 -z 0.05 = -1.645 z 0.05 = 1.645 -z0.025 = -1.96 ó z0.025 = 1.96

0.02 -z 0.02 = -2.054 z 0.02 = 2.054 -z0.01 = -2.33 ó z0.01 = 2.33

0.01 -z 0.01 = -2.326 z 0.01 = 2.326 -z0.005 = -2.575 ó z0.005 = 2.575

Vous aimerez peut-être aussi