Vous êtes sur la page 1sur 249

LICENCIATURA EN INGENIERÍA

INDUSTRIAL

ESTADÍSTICA INFERENCIAL

Nombre del Profesor: M.C. Gustavo Erick Anaya Fuentes

Tercer Semestre Grupo Tres


Semestre Julio-Diciembre 2015
Horario de Clase

Lunes 14-16
Jueves 14-16
Viernes 16-18

Lugar Aula 2, Edificio A.


Consejo Técnico
Director (Dr. Orlando Ávila Pozos)

Secretario (Mtro. Carlos Secretario Administrativo


Domínguez González) (Mtro. Gonzalo Torres Samperio)

Coordinación de Vinculación y
Área Académica de Ingeniería (M.C.
extensión. (Mtro. Carlos Guzmán
Joel Montesinos Hernández)
León)

Coordinación de Administración Coordinación de Ingeniería Industrial


Escolar (M.C. Samuel López (M.E. Lidia Ramírez Quintanilla)
Hernández)

Coordinación de Vinculación (M.A.


Coordinación de Trabajo Social Bernardino Martínez Muñoz)
(Mtra. Bibiana Uribe Mora)

Coordinación de Extensión (Mtra.


María Elena Sánchez Roldan)
Misión
Formar profesionales con un enfoque integral e
interdisciplinar, capaces de optimizar y dirigir los sistemas
en las organizaciones de los sectores productivo, social y de
servicios para incrementar su competitividad, con el
respeto y la valoración del medio ambiente, de la
multiculturalidad del estado y del país.
Visión
Formar de manera integral a los estudiantes con capacidad
de comunicación, creatividad, pensamiento crítico, respeto
por la multiculturalidad y por el desempeño ético de su
profesión.
Objetivos Curriculares
1. Evaluar la producción mediante técnicas de
administración de operaciones, mantenimiento y
evaluación de proyectos de una organización.
2. Evaluar las condiciones de áreas productivas aplicando
estudio del trabajo, ergonomía, seguridad e higiene que
garantice la eficiencia.

3. Aplicar técnicas de localización y distribución en planta


evaluando costos de transporte, insumos y tecnología
para optimizar la producción.

4. Desarrollar e implantar Sistemas de Calidad.


Perfil de ingreso:
Saber: el alumno tiene conocimientos básicos de matemáticas, física y
química.

Saber hacer: Observar y analizar, extraer y sintetizar, de comunicarse y


creatividad.

Saber ser: Aptitudes, actitudes y valores.

Actitudes: Tolerancia, pragmático, iniciativa e innovación para la


comprensión de problemas, perseverancia, empatía y disposición a trabajar
en equipo.

Aptitudes: Compromiso, responsabilidad y disciplina.

Valores: Respeto, equidad, honestidad y puntualidad.


Perfil progresivo uno:

 Saber: Posee capacidad de modelar un problema


cotidiano a través de las matemáticas.
 Saber hacer: Son capaces de identificar las partes de los
problemas sociales y de su profesión; y al mismo tiempo
tratarlos desde la perspectiva de un todo.
 Saber ser: Utilizan técnicas de comunicación para
relacionarse con su equipo de trabajo y así poder tomar
decisiones.
Perfil de egreso

 Saber: Diseñar, administrar una cadena de suministro, visión


sistémica, hacer mejoras en procesos y productos, tener
conocimientos sobre desarrollo sustentable.
 Saber hacer: Observar y analizar las características que definen
el medio social, cultural, económico, político e histórico.
Proponer soluciones a los problemas encontrados en el sector
productivo desde una perspectiva sistémica.
Saber ser: Actitudes: Tolerancia, pragmático, iniciativa e
innovación para la comprensión de problemas, perseverancia,
empatía y disposición a trabajar en equipo.
Aptitudes: Compromiso, responsabilidad y disciplina.
Valores: Respeto, equidad, honestidad y puntualidad y ética
profesional.
Competencias
Campos problemáticos

Campo Problemático
Gestión de Operaciones (ET1)
Ingeniería de Métodos y Factores Humanos( ET2)
Ubicación, planeación, diseño y operación de instalaciones de producción (ET3)
Gestión de la Calidad (ET4)
Ejes Temáticos

Ejes Temáticos
Gestión de Operaciones (ET1)
Ingeniería de Métodos y Factores Humanos( ET2)
Ubicación, planeación, diseño y operación de instalaciones de producción (ET3)
Gestión de la Calidad (ET4)
Ejes transversales
Igualdad de
Respeto y oportunidades por
valoración por la género.
interculturalidad

EDUCACIÓN
PARA LA
EQUIDAD

Capacidad para
vivir escenarios Accesible para todos y
culturales para toda la vida.
cambiantes.
Desarrollo
equilibrado,
armonioso y Considera las
proporcionado de capacidades del
la personalidad individuo.
(biopsicosocial).

EDUCACIÓN
INTEGRAL

Desarrolla
habilidades,
capacidades,
valores, actitudes
y aptitudes
interpersonales.
Capacidad
emprendedora y
creativa para Consolidación del
identificar, plantear estudiante como
y resolver profesional.
problemas.

EDUCACIÓN
PARA LA VIDA
ACTIVA

Permanente Satisface demandas


formación y planteadas en el
perfeccionamiento. ámbito laboral.
Integrar actividades
que promuevan el
Formación de
respeto y conservación
una Cultura
del medio ambiente.
ambiental

EDUCACIÓN
AMBIENTAL

Uso y mejora de Impulsar estrategias


tecnologías y científicas y tecnológicas
procesos para el que generen el menor
desarrollo impacto ambiental.
sostenible del
entorno
ESTADÍSTICA INFERENCIAL

Objetivo de la asignatura:

El estudiante será capaz de diseñar


experimentos y realizar inferencias
estadísticas a partir de muestras aleatorias,
para tomar decisiones sobre sus
poblaciones.
Unidad III.
Unidad 0. Unidad II. Pruebas Unidad IV. Unidad V.
Importancia de Unidad I.Variable Distribuciones de Inferencia Diseño de
la Estadística Aleatoria de Probabilidad Bondad Estadística. Experimentos
Inferencial Discretas y de Ajuste
. Continuas.

Estadística Inferencial
Forma de Evaluación
 Examen Parcial (50%)
 Evaluación Continua (Coevaluación, Autoevaluación,
Heteroevaluación)
 Tareas
 Participaciones
 Portafolio de Evidencias
 Proyecto Integrador
Ponderaciones por parcial

 Primer Parcial: 33.33%

 Segundo Parcial: 33.33%

 Tercer Parcial: 33.33%


Contrato Didáctico
 Actividades:

• Revisar el contrato didáctico.


• Legalizar ante autoridades universitarias.
• Seguimiento.
Examen de diagnóstico

Actividad: Dar respuesta al examen denominado


diagnóstico.
Unidad 0. Importancia de la Estadística
Inferencial
 Ejemplo de Simulación para introducir al alumno a la
materia de Estadística Inferencial.
Unidad I. Variable Aleatoria.
 El estudiante reconocerá la diferencia entre variables
aleatorias y continuas, así como sus propiedades para
determinar sus respectivas funciones acumuladas, valores
esperados y varianzas.
1.1. Concepto de variable aleatoria
 Una variable numérica es una descripción numérica de los
resultados de un experimento.

Ejemplo: Lanzar un dado y asignar a cada una de sus caras


su valor numérico X, el cual puede tomar seis valores, del
1 al 6 con probabilidad P(X=a) = 1/6, a=1,…6.

Ejemplo: Seleccionar a una persona al azar el número de


hermanos que tiene y su edad exacta.
X= número de hermanos.
Y= Edad exacta.
1.2. Variable Aleatoria Unidimensional
Discretas y Continuas
 Una variable aleatoria que puede asumir cualquier
número finito de valores o una sucesión infinita de
valores como 0, 1, 2, … Se conoce como Variable
Aleatoria Discreta.

 Ejemplo: X= el número de automóviles que llegan a una


caseta de cobro durante un periodo de un día

 Ejemplo: Aplicar una encuesta en donde se pregunte a la


persona, si recuerda un determinado comercial. Si, x=1
No, y = 0.
 Una variable aleatoria que asume cualquier valor
numérico en un intervalo o conjunto de intervalos, se
llama Variable Aleatoria Continua.

Ejemplos:
Experimento Variable aleatoria X Valores posibles de
la variable aleatoria

Arribo de vehículos Tiempo entre los arribos X≥0


al autolavado. de los vehículos.
Llenar un Presión en Lbf/in2. 0≤X≤110
neumático con aire.
Colocación de un Tiempo de colocación del 10≤X≤90 seg
tornillo tornillo.
1.3. Función Acumulada, Esperanza y
Varianza de las variables aleatorias
unidimensionales y continuas.
Función acumulada
 El conjunto de pares ordenados (x, f(x)) es una función de
probabilidad, función masa de probabilidad o distribución
de probabilidad de la variable aleatoria discreta X si, para
cada resultado posible x,
1. F(x)≥0
2. ∑x f(x)=1
3. P(X=x)=f(x)
Ejemplo
 Un embarque de 8 microcomputadoras similares que se
envía a un distribuidor contiene 3 aparatos defectuosos.
Si una escuela realiza una compra aleatoria de 2 de estas
computadoras, encuentre la distribución de probabilidad
para el número de microcomputadoras defectuosas.
3 5
f(0)= P(X=0)= 0 2 = 10/28
8
2

3 5
f(1)=P(X=1)= 1 1 = 15/28
8
2

3 5
f(2)=P(X=2)= 2 0 = 3/28
8 x 0 1 2
2 f(x) 10/28 15/28 3/28
Ejemplo
 Si 50% de los automóviles extranjeros que vende una
agencia está equipado para que trabaje con diesel,
encuentre una fórmula para la distribución de
probabilidad del número de modelos diesel entre los
próximos 4 automóviles que venda esta agencia.
4
f(x)= x
16
Distribución acumulada

 La distribución acumulada F(x) de una variable aleatoria


discreta X, cuya distribución de probabilidad es f(x), es:
F(x)= P(X≤x)=∑t≤x f(t) para -∞<x<∞
Ejemplo
 Encuentre la distribución de probabilidad de la variable
aleatoria x en el ejemplo (Autos extranjeros de Diesel).
Utilizando F(X), verifique f(2)=3/8

F(0)= f(0)=1/16
F(1)= f(0)+f(1)= 5/16
F(2)= f(0)+f(1)+ f(2)= 11/16
F(3)= f(0)+f(1)+ f(2)+f(3)=15/16
F(4)= f(0)+f(1)+ f(2)+f(3)+f(4)=1
0 para x<0
1/16 para 0≤x≤1
5/16 para 1≤x<2
F(x)= 11/16 para 2≤x<3
15/16 para 3≤x<4
1 para x≥4

Hacer gráfico de Distribución Acumulada Discreta


Función de densidad
 Es definida en el conjunto de los números reales, si:

1. f(x)≥0 para toda x∈ R



2. ∫-∞ f(x)dx=1
b
3. P(a<X<b)= ∫a f(x)dx
Ejemplo
 El error en la temperatura de reacción, en °C, para un
experimento controlado de laboratorio es una variable
aleatoria continua X, que tiene una función de densidad
de probabilidad:

f(x)= x2/3, -1<x<2


0, en cualquier otro caso.

a) Verifique la condición 2 de la definición de Función de


densidad.
b) Encuentre P(0<X≤b)
Distribución Acumulada
 La distribución acumulada F(x) de una variable aleatoria
continua X con una función de densidad f(x) es:
x
F(x)= P(X≤x)=∫-∞ f(t) dt para -∞<x<∞

Como consecuencia inmediata de la definición anterior, se


pueden escribir los resultados:

P(a<X<b)=F(b)-F(a)
f(x)= dF(x)
dx

Si la derivada existe.
Actividad
 Realizar ejercicios propuestos.
Esperanza matemática
Definición:
Sea X una variable aleatoria con distribución de
probabilidad f(x). La media o valor esperado de X es:

µ= E(X)= ∑ x f(x)
x
Si X es discreta, y


µ= E(X)= ∫-∞ x f(x) dx

Si X es continua.
Ejemplo
Sea X la variable aleatoria que presenta la vida en horas
de un dispositivo electrónico. La función de densidad de
probabilidad es:

f(x)= 20 000/X3 , x>100


0, En cualquier otro caso.
Encuentre la vida esperada de este dispositivo.
Actividad
 Realizar ejercicios propuestos.
Varianza
Definición

Sea X una variable aleatoria con distribución de


probabilidad f(X) y media µ. La varianza de X es:

σ2 =E[(X-µ) 2 ] = ∑ (x-µ) 2 f(x)


Si es discreta, y

σ2 =E[(X-µ) 2 ] =∫ -∞ (x-µ) 2 f(x) dx
Si x es continua. La raíz cuadrada positiva de la varianza,
σ, se llama la desviación estándar de X.
Teorema

La varianza de una variable aleatoria X está dada


por:

σ2 =E(X 2 )-µ2
Ejemplo
 Sea que la variable aleatoria X represente el número de
automóviles que se utilizan para propósitos de negocios en un
día cualquiera de trabajo. La distribución de probabilidad para
la compañía A esta dada por:

x 1 2 3
F(x) 0.3 0.4 0.3

y para la compañía B es:

x 0 1 2 3 4
F(x) 0.2 0.1 0.3 0.3 0.1

Demuestre que la varianza de la distribución de probabilidad


para la compañía B es mayor que la de la compañía A
Solución
 Para la compañía A
µ=E(x)=(1)(0.3)+(2)(0.4)+(3)(0.3)=2
σ2=∑x=1:3(x-2)2 f(x)
=(1-2)2(0.3)+(2-2)2(0.4)+(3-2)2(0.3)=0.6

 Para la compañía B
Actividad
 Hacer ejercicios propuestos
Ejemplo
La demanda semanal de una empresa refresquera, en
miles de litros, en una cadena local de tiendas, es una
variable aleatoria continua X que tiene la densidad de
probabilidad:

f(x)= 2(x-1), 1<x<2


0, en cualquier otro caso.

Encuentre la media y la varianza de X.


1.4.Conceptos fundamentales de Variables
aleatorias bidimensionales discretas y
continuas.
Distribución de probabilidad conjunta
 Se caracteriza por permitir registrar espacios muestrales
de dos dimensiones.

Ejemplo:
La cantidad de precipitado P y el volumen de gas V que se
librera en un experimento químico controlado, (p,v). O se
podría estar interesado en la dureza H y en la fuerza de
tensión (h,t), etc.
Definición
La función f(x,y) es una distribución de probabilidad
conjunta o función masa de probabilidad de las
variables aleatorias discretas X y Y, si

1. F(x,y) ≥ 0 para toda (x,y).


x y

2. ∑∑ f(x,y)=1.
3. P(X=x,Y=y)=f(x,y).
Para cualquier región A en el plano xy, P[(X,Y) A]= ∑∑
f(x,y).
Ejemplo:
Seleccionan al azar dos repuestos para una pluma de una
caja que contiene 3 repuestos azules, 2 rojos y 3 verdes.
Si x es el número de repuestos azules seleccionados y Y
el de rojos, encuentre: a) la función de probabilidad
conjunta f(x,y) y sus probabilidades

x
f(x,y) 0 1 2
0 3/28 9/28 3/28
1 3/14 3/14
y 2 1/28

Tabla Repuestos
Nota:
 Cuando X y Y son variables aleatorias continuas, la
función de densidad conjunta f(x,y) es una superficie
arriba del plano xy, y P[(X,Y) ∈ A ], donde A es cualquier
región en el plano xy, es igual al volumen del cilindro
recto cuyos límites son la base A y la superficie.
Definición
La función f(x,y) es una función de densidad conjunta de
las variables aleatorias continuas X y Y, si:

1. F(x,y) ≥ 0 para toda (x,y)


∞ ∞
2. ∫- ∞ ∫ - ∞ f(x,y) dx dy = 1
3. P[(X,Y) ∈A] = ∫ ∫ f(x,y)dxdy

Para cualquier región de A en el plano xy.


Ejemplo:
Una compañía de dulces distribuye cajas de chocolates
con una mezcla de cremas, chiclosos y nueces cubiertas,
tanto en chocolate oscuro como en claro. Para el caso de
una caja seleccionada aleatoriamente, sean X y Y,
respectivamente, las proporciones de chocolates oscuros
y claros que son cremas y suponga que la función de
densidad conjunta es:

F(x,y)= 2/5 (2x+3y), 0≤x ≤1, 0 ≤y ≤1


0, en cualquier otro caso
a) Verifique la condición 2 de la definición anterior.
b) Encuentre la P[(X,Y) ∈ A], donde A es la región
{(x,y)|0<x<1/2,1/4<y<1/2}
Unidad II. Distribuciones de
Probabilidad Discretas y Continuas.
Objetivo de la unidad: El estudiante reconocerá las distribuciones
de probabilidad más utilizadas en el diseño de experimentos, para
utilizarlos en la práctica profesional.
2.1. Distribuciones Discretas: Binomial,
Hipergeométrica y Poisson.

 La distribución binomial: es una distribución de


probabilidad discreta que proporciona muchas
aplicaciones. Se asocia con un experimento de múltiples
pasos que se llama experimento binomial.
Propiedades de un experimento binomial
1. El experimento consiste de una secuencia de n ensayos
idénticos.
2. En cada ensayo hay dos resultados posibles. A uno de ellos
se le llama éxito y al otro, fracaso.
3. La probabilidad de éxito, denotada por p, no cambia de un
ensayo a otro. Por consiguiente, la probabilidad de fracaso,
denotada por 1-p, tampoco cambia de un ensayo a otro.
4. Los ensayos son independientes.

 Si están presentes las propiedades 2, 3 y 4, se dice que los


ensayos son generados por un proceso de Bernoulli. Si,
además, la propiedad 1 está presente, se dice que tenemos un
experimento binomial.
Secuencia posible de éxitos y fracasos para un
experimento binomial de 8 ensayos.

Propiedad 1. El experimento consta de n=8 ensayos


idénticos.

Propiedad II. Cada ensayo da como resultado un éxito (S)


o un fracaso (F).

Ensayos 1 2 3 4 5 6 7 8
Resultados S F F S S F S S
El problema de la tienda de ropa
Considere las decisiones de compra de los tres clientes
siguientes que entran en la tienda de ropa. Basado en la
experiencia, el gerente de la tienda estima que la
probabilidad de que un cliente cualquiera haga una
compra es de 0.30 ¿Cuál es la probabilidad de que dos de
los tres clientes siguientes realicen una compra?
Diagrama de árbol
Primer cliente Segundo cliente Tercer cliente Resultado Valor de X
experimental
S S,S,S 3

S S,S,F 2
F
S S,F,S 2
S
F S,F,F 1
F
S S F,S,S 2
F
F,S,F 1
F
F S F,F,S 1

S= Hay compra
F F,F,F 0
F= No hay compra
x= Número de clientes que efectúan una compra
 Número de resultados experimentales que proporcionan
x éxitos en n ensayos.

n = n!
x x!(n-x)!

Donde n!=n(n-1)(n-2)…(2)(1)
Y por definición 0!=1
Ejemplos
 X=2 éxitos en n=3 ensayos

n 3 3! (3)(2)(1)
= = = = 3
x 2 2!(3-2)! (2)(1)(1)

X=3 éxitos en n=3 ensayos


 Resultados de los ensayos
Primer Segundo Tercer Resultado Probabilidad del resultado
cliente cliente cliente experimental experimental
Compra Compra No (S,S,F) pp(1-p)=p2(1-p)=(0.30)2(0.70)
compra = 0.063
Compra No Compra (S,F,S) p(1-p)p=p2(1-p)=(0.30)2(0.70)
compra = 0.063
No Compra Compra (F,S,S) (1-p)pp=p2(1-p)=(0.30)2(0.70)
compra = 0.063

px(1-p)n-x
Función de probabilidad binomial

f(x)= n px(1-p)n-x
x

Donde
x= número de éxitos.
p= probabilidad de un éxito en un ensayo.
n= número de ensayos.
f(x)= probabilidad de x éxitos en n ensayos.
Valor esperado y varianza de la distribución
binomial

E(x)=µ=np

Var(x)= σ2= np(1-p)


Considere un experimento binomial con n= 20 y 0.70
a) Calcule f(12).
b) Estime f(16).
c) Determine P(x≥16).
d) Defina P(x≤15).
e) Calcule E(x).
f) Defina Var(x) y σ.
Actividad
 Realizar ejercicios propuestos.
Distribución de probabilidad
Hipergeométrica
La distribución de probabilidad hipergeométrica mantiene una
relación estrecha con la distribución binomial, pero difiere de ésta en
dos puntos esenciales: sus ensayos no son independientes y su probabilidad
de éxito cambia de un ensayo a otro.

En donde r denota el número de elementos en la población de tamaño N


considerados como éxitos, y N - r denota el número de elementos en la
población considerados fracasos.

La función de probabilidad hipergeométrica se usa para calcular la


probabilidad de que en una muestra aleatoria de n elementos, seleccionados
sin remplazo, se obtengan x elementos etiquetados como éxitos y n - x
elementos marcados como fracasos. Para que este resultado ocurra, se
deben obtener x éxitos de los r éxitos que hay en la población y n - x fracasos
de los N - r fracasos. La función de probabilidad hipergeométrica siguiente
proporciona f (x), la probabilidad de obtener x éxitos en n ensayos.
Función de probabilidad Hipergeométrica

r N-r
x n -x
f(x) =
N
n
Donde:
x= números de éxitos .
n= número de ensayos.
f(x)= probabilidad de x éxitos en n ensayos.
N= número de elementos en la población.
r= número de elementos en la población etiquetados como
éxitos.
Valor esperado y varianza

E(x)=µ= n r
N

Var(x)=σ2= n r 1 - r N-n
N N N-1
Ejemplo
Los fusibles eléctricos producidos por Ontario Electric se
empacan en cajas de 12 unidades cada una. Suponga que un
inspector selecciona al azar tres de los 12 fusibles de una caja
para probarlos sin remplazo. Si ésta contiene exactamente
cinco fusibles averiados,

¿cuál es la probabilidad de que el inspector encuentre


exactamente un fusible defectuoso en los tres que seleccionó?
Ejemplo
Suponga que N= 10 y r=3, calcule las probabilidades
hipergeométricas para los valores siguientes de n y x.

a) n=4, x=1
b) n=2, x=2
c) n=2,x=0
d) n=4, x=2
e) n=4, x=4
Distribución Poisson
Una variable aleatoria discreta que a menudo es útil
para estimar el número de ocurrencias en un
intervalo específico de tiempo o espacio. Por
ejemplo, la variable aleatoria de interés podría ser el
número de llegadas a un centro de lavado automotriz
en una hora, el número de reparaciones necesarias en
10 millas de una autopista o el número de fugas en
100 millas de tubería.
Propiedades de un experimento Poisson

1. La probabilidad de ocurrencia es la misma para


cualquiera dos intervalos de igual longitud.
2. La ocurrencia o no ocurrencia en cualquier intervalo es
independiente de la ocurrencia o no ocurrencia en
cualquier otro intervalo.
Función de probabilidad de Poisson

f(x)= µx e-µ
x!

Donde
f(x)= probabilidad de x ocurrencias en un intervalo.
µ= valor esperado o número medio de ocurrencias en un
intervalo.
e= Número Euler
Nota: Para la distribución de probabilidad de Poisson, x es una
variable aleatoria discreta que indica el número de ocurrencias
en el intervalo. Como no hay un límite superior establecido
para el número de ocurrencias, la función de probabilidad f (x)
es aplicable para los valores x = 0, 1, 2, . . . sin límite. En las
aplicaciones prácticas, x a la larga se volverá lo suficientemente
grande para que f (x) sea aproximadamente cero y la probabilidad
de cualquier valor mayor que x se vuelva insignificante.
Ejemplo
Considere una distribución de Poisson apropiada.
a) Escriba una función de probabilidad de Poisson
apropiada.
b) Calcule f(2).
c) Determine f(1).
d) Calcule P(x≥2)
Actividad
 Realizar los ejercicios propuestos.
2.2. Distribuciones Continuas: Normal,
Exponencial, T Student, F Fisher, Chi
cuadrada.
Distribución de probabilidad normal
La distribución normal describe qué tan probables
son los resultados obtenidos de un muestreo.
La forma de la distribución normal se ilustra por
medio una curva con forma de campana.

Curva de la forma de campana de la distribución normal


Desviación estándar σ

µ
Media
Función de probabilidad

f(x)= 1 e-(x-µ)2 / 2σ2

σ√ 2∏
Donde
µ= media.
σ= desviación estándar
∏= 3.141592
e= 2.71828
 Se formulan varias observaciones a cerca de las características
de la distribución normal.

1. La familia completa de distribuciones normales se diferencia


por medio de dos parámetros: la media µ y las desviación
estándar σ.
2. El punto más alto de la curva normal se encuentra sobre la
media, el cual coincide con la mediana y la moda de la
distribución.
3. La media de la distribución normal puede tener cualquier
valor numérico: negativo, cero o positivo. A continuación se
muestras tres distribuciones normales que tienen la misma
desviación estándar pero tres medias diferentes (-10,0 y 20).
µ=-10 µ=0 µ=20
4. La distribución normal es simétrica: la forma de la curva normal a la
izquierda de la media es una imagen de espejo de la forma de la curva a
la derecha de la media. Los extremos de la curva normal se extienden
hacia el infinito en ambas direcciones y en teoría nunca tocan el eje
horizontal. Como son simétricas, las distribuciones normales no están
sesgadas; la medida de su sesgo es cero.

5. La desviación estándar determina qué tan plana y ancha es la curva


normal. Los valores grandes de la desviación estándar dan como
resultado curvas más anchas y planas, mostrando mayor variabilidad en
los datos. En seguida se muestran dos distribuciones normales con la
misma medida, pero con desviaciones estándares diferentes.
σ=5

σ=10

µ
6. Las probabilidades para la variable aleatoria normal están representadas
por las áreas bajo la curva normal. El área total bajo la curva de una
distribución normal es 1. Como la distribución es simétrica, el área bajo
la curva hacia la izquierda de la media es 0.50 y el área a la derecha
también es 0.50.
7. Los porcentajes de los valores en algunos intervalos de uso común son
los siguientes.
a) 68.3% de los valores de una variable aleatoria normal se sitúan más o
menos a una desviación estándar de su media.
b) 95.4% de los valores de una variable aleatoria normal se encuentran más
o menos a dos desviaciones estándar de su media.
c) 99.7% de los valores de una variable aleatoria normal están más o menos
dentro de tres desviaciones estándar de su media.
Distribución de probabilidad normal
estándar
Se dice que una variable aleatoria que muestra una distribución normal con una media de
cero y una desviación estándar de uno tiene una distribución de probabilidad normal
estándar.
La letra z se usa comúnmente para designar esta variable aleatoria normal. La distribución normal
estándar tiene la misma apariencia que otras distribuciones normales, pero con las
propiedades especiales de σ=1, µ=0.
99.7%

95.4%

68.3%

µ-3σ µ-2σ µ-1σ µ µ+1σ µ+2σ µ+3σ


Función de densidad normal estándar

f(z)= 1 e-z2 /2
√2π

Los cálculos de la probabilidad con cualquier distribución


normal se efectúan al obtener las áreas bajo la gráfica de
la función de densidad de probabilidad.
Ejemplo
Calcule la probabilidad de que z sea menor o igual
que 1 P(z ≤1). Esta probabilidad es el área bajo la
curva normal a la izquierda de z=1.

P(z≤1.00)

0 1
Cálculo de probabilidades para cualquier
distribución de probabilidad normal
Cuando se tiene una distribución normal con cualquier media µ y cualquier
desviación estándar σ, las preguntas de probabilidad acerca de la
distribución se responden convirtiendo primero a la distribución normal
estándar. Luego se usa la tabla de probabilidad normal estándar y los
valores de z apropiados para obtener las probabilidades buscadas. La
fórmula para convertir cualquier variable aleatoria normal x con media µ y
su desviación estándar σ a la variable aleatoria normal z se representa a
continuación.

z= x-µ
σ
Problema de aplicación
Grear Tire Company desarrolló un nuevo neumático radial con
cinturón de acero que se vende a través de una cadena nacional de
tiendas de descuento. Debido a que el neumático es un nuevo
producto, los gerentes de Grear creen que la garantía de millaje
ofrecida con la llanta será un factor importante para su aceptación.
Antes de que la póliza de garantía de millaje de los neumáticos
caduque, los gerentes de Grear quieren información de probabilidad
sobre los x = número de millas que éstos durarán.

A partir de las pruebas de carretera reales con los neumáticos, el


grupo de ingeniería estimó que su millaje es μ = 36 500 millas y que
la desviación estándar es σ = 5 000. Además, los datos recabados
indican que una distribución normal es una suposición razonable.
¿Qué porcentaje de las llantas se espera que dure más de 40 000
millas? En otras palabras, ¿cuál es la probabilidad de que el millaje
de los neumáticos, x, supere la cifra de 40 000?
Actividad
 Realizar los ejercicios propuestos.
Cálculo de probabilidades para la
distribución exponencial

𝑓 𝑥 = 𝛼𝑒 −𝛼𝑥 𝑆𝑖 𝑥 ≥ 0
0 𝐶. 𝑂. 𝐶

𝑃 𝑋 ≤ 𝑥 = 1 − 𝑒 −𝛼𝑥
𝑃 𝑋 > 𝑥 = 1 − 𝑃 𝑋 ≤ 𝑥 = 𝑒 −𝛼𝑥
F(x) ∝= 1 𝜇

Distribución exponencial
Ejemplo
Considere la función de densidad de probabilidad exponencial siguiente.

f(x)=⅛ e-x/8

a) Calcule P(x≤6)
b) Encuentre P(x≤4)
c) Determine P(x≥6)
d) Defina P(4≤x≤6)
Actividad
 Realizar los ejercicios propuestos.
Distribución de probabilidad T Student
 Para muestras de tamaño n≥30, se proporciona una buena
estimación de σ2 al calcular un valor de S2. ¿ Qué le ocurre al
estadístico ( -µ) del teorema del límite central si se reemplaza
σ2 por S2.

 Teorema: Sea Z una variable aleatoria normal estándar y V


una variable aleatoria ji cuadrada con v grados de libertad. Si Z
y V son independientes, entonces la distribución de la variable
aleatoria T, donde:

𝑍
𝑇=
𝑉
𝑣
Ejemplo
 Un fabricante de focos afirma que su producto durará un promedio de 500 horas
de trabajo. Para conservar este promedio, esta persona verifica 25 focos cada mes.
Si el valor t calculado cae entre –t0.05 y t0.05, él se encuentra satisfecho con esta
afirmación. ¿Qué conclusión deberá él sacar de una muestra que tiene una media
= 518 horas y una desviación estándar s= 40 horas? Asuma que la distribución de
los tiempos de vida es aproximadamente normal.
Actividad
 Realizar los ejercicios propuestos.
Distribución chi-cuadrado (ji cuadrado)
 Definición:
Sean x1,x2,…, xn variables independientes que siguen una
distribución N(0,1)

Sea X una nueva variable definida según:

X=x21+x22+…+x2n=∑i=1n x2i

En este caso, se dice que x se distribuye como una Chi-


cuadrado, con n grados de libertad, que representamos
como: X 2n
Función de densidad y representación
gráfica
 Se obtiene a partir de la función de densidad de la
distribución Gamma:
 X-1 ex si x>0
()
f(x)=
0 si x≤0

G(t)=( /(-t)) para >t


 Sustituyendo los valores de =n/2 y = ½ en la función
de densidad, obtenemos las funciones correspondientes
de la distribución Chi- cuadrado.

(1/2)n/2 X(n/2) -1 e X/2 Si X>0


(n/2)
f(x)=
0 Si X≤0
Ejemplo
 La variable aleatoria U sigue una distribución Chi-
cuadrado. Calcular “a” tal que:
P(U>a)= 0.05
a) Para 18 grados de libertad
b) Para 55 grados de libertad
Actividad
 Realizar ejercicios propuestos
Distribución F Fisher
 Se define como la relación de dos variables aleatorias ji
cuadrada independientes, cada una dividida por su número de
grados de libertad.

Sean U y V dos variables aleatorias independientes que tienen


una distribución ji cuadrada con m y n grados de libertad,
respectivamente.

U 2m y V 2n

Sea la variable X definida como X= U / m


V/n
Ejemplo
 Las tablas de la distribución F muestran, m=10 y n=6, el
percentil 90= 2.94; el percentil 95= 4.06. Calcular los
valores de la distribución F de 6 y 10 grados de libertad
que dejan a su izquierda una masa de probabilidad de 0.1
y 0.05 respectivamente.
Actividad
 Realizar ejercicios propuestos
UNIDAD III. Inferencia Estadística.

El estudiante tomará decisiones a partir de las


conclusiones derivadas de las pruebas de hipótesis e
intervalos de confianza de estadísticos muestrales.
3.1.Conceptos fundamentales de Intervalos de
Confianza y Pruebas de Hipótesis: Nivel de
Significancia, p-level, Error Tipo I y Error tipo
II
Estimación por intervalo
 Intervalo dentro del cual se esperaría encontrar el valor del parámetro.
 Los valores de los puntos extremos, dependerán de la media muestral
calculada y de la distribución muestral de .

 Intervalo de confianza (1-α) 100%, (1- α) coeficiente de


confianza o grado de confianza.
 Es mejor tener un 95% de confianza de que la vida
promedio de determinado transistor de televisión es de
entre 6 y 7 años, que 99% de confianza que se ubica entre
3 y 10 años.
Estimación de la media
 La distribución muestral se centra en µ y en la mayoría
de las aplicaciones la varianza es menor que cualesquiera
otros estimadores de µ.
 Es una estimación muy precisa de µ cuando n es grande.

 P(-Zα/2<Z<Zα/2)=1-α,
Intervalo de confianza de µ; conociendo σ
 Si es la media de una muestra aleatoria de
tamaño n de una población con varianza
conocida σ2 , el intervalo de confianza de (1-α)100%
para µ es,
Ejemplo
 Se calcula que la media de los promedios de los puntos
de calidad de una muestra aleatoria de 36 alumnos
universitarios de último año es de 2.6. Encuentre los
intervalos de confianza del 95% y del 99% para la media
del total de alumnos del último año. Asuma que la
desviación estándar de la población es de 0.3.
Teorema
 Si se utiliza como una estimación de µ se
puede tener una confianza del (1- α) 100% de
que el error no excederá Z α/2 σ/√n.

 Se desea saber qué tan grande debe ser una


muestra para asegurar que el error en la
estimación de µ será menor que una cantidad
específica e.
Teorema
 Si se utiliza como una estimación de µ, se
puede tener una confianza del (1-α)100% de
que el error no excederá una cantidad
específica e, cuando el tamaño de la muestra
es:

n= Zα/2σ 2

e
Ejemplo
 ¿Qué tan grande se requiere que sea la muestra del
ejemplo anterior si se desea una confianza del 95% de
que la estimación de µ difiera de esta por menos de 0.05?
Intervalo de confianza para µ; σ
desconocida
Si y s son la media y la desviación estándar
de una muestra aleatoria de una población
normal con varianza desconocida σ2, un intervalo
de confianza del (1- α)100% para µ es:

-tα/2 s/√n < µ< + tα/2 s/√n

Donde tα/2 es el valor t con v=n-1 grados de libertad, lo


que deja un área de α/2 a la derecha.
Ejemplo
 Los contenidos de 7 recipientes similares de ácido
sulfúrico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros.
Encuentre un intervalo de confianza del 95% para la
media de todos los recipientes, suponiendo una
distribución aproximadamente normal.
Límites de tolerancia
 Para una distribución normal de mediciones con la media µ y
la desviación estándar σ desconocidas, los límites de
tolerancia son ± ks, donde k se determina de
tal forma que se pueda, con una confianza de 100
(1-γ)% asegurar que los límites dados contienen
al menos la proporción 1-α de las mediciones.
Ejemplo
 Una máquina produce piezas metálicas de forma cilíndrica.
Se toma una muestra de tales piezas y se encuentra que
sus diámetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99,
1.01 , 1.03 centímetros. Encuentre los límites de
tolerancia del 99%de que contenga el 95% de las piezas
metálicas producidas por esta máquina, suponiendo una
distribución aproximadamente normal.
Estimación de la diferencia entre dos
medias
 Si se tienen dos poblaciones con medias µ1 y µ2 y
varianzas σ12 σ 22, respectivamente, el estimador puntual
de la diferencia entre µ1 y µ2 lo da el estadístico 1- 2.
Para obtener una estimación puntual de µ1-µ2, se
seleccionan dos muestras aleatorias independientes, una
de cada población, de tamaños n1 y n2, y se calculará la
diferencia, 1- 2
 Si las muestras se encuentran distribuidas normalmente,
su desviación estándar es:

σ 1-σ 2 =√(σ1
2/n )+(σ 2/n )
1 2 2
Intervalo de confianza para µ1-µ2;
conociendo σ12 y σ22

Si 1 y 2 son las medias de muestras


aleatorias independientes de tamaños n1 y n2
de poblaciones con varianzas conocidas σ12 y
σ22 respectivamente, un intervalo de confianza
de (1-α)100% para µ1 - µ2 es:

( 1- 2)– zα/2 √((σ12/n1)+(σ22/n2))< µ1 - µ2<( 1- 2) + zα/2 √((σ12/n1)+(σ22/n2))

Donde Zα/2 es el valor de Z que tiene un área de


α/2 a la derecha.
Nota
 El grado de confianza es exacto cuando las muestras se
seleccionan de poblaciones normales. Para poblaciones
que no son normales, el teorema del límite central
proporciona una buena aproximación para muestras de
tamaño razonable.
Ejemplo
 Se aplica una prueba estandarizada de química a 50 niñas
y 75 niños. Las niñas obtienen una calificación promedio
de 76, y los niños 82. Encuentre un intervalo de confianza
del 96% para la diferencia µ1- µ2 , donde µ1 es la
calificación promedio de todos los niños y µ2 es la
calificación promedio de todas las niñas que
pudieron realizar este examen. Suponga que las
desviaciones estándar de las poblaciones para las
niñas y los niños son 6 y 8, respectivamente.
Intervalo de confianza para µ1-µ2; σ12= σ22
pero desconocidas
 Si 1 y 2 son las muestras aleatorias
independientes de tamaño n1 y n2,
respectivamente, de poblaciones
aproximadamente normales con varianzas
iguales pero desconocidas, un intervalo de
confianza de (1-α)100% para µ1-µ2 es:

( 1- 2)-tα/2 SP √((1/n1)+(1/n2))< µ1-µ2<( 1- 2)+tα/2 SP √((1/n1)+(1/n2))

Donde Spes la estimación común de la desviación estándar poblacional y


tα/2 es el valor t con v=n1+n2 – 2 grados de libertad, con un área de α/2 a
la derecha.
 Estimador común para S2p

S2p= (n1-1)S21+ (n2-1)S22


n1+n2-2
Ejemplo 7.7 WALPOLE
Intervalo de confianza para µ1-µ2; σ21≠ σ22
Si 1 y s21, y 2 y s22, son las medias y varianzas de muestras pequeñas
independientes de tamaños n1 y n2, respectivamente, de distribuciones
aproximadamente normales con varianzas diferentes y desconocidas, un
intervalo de confianza aproximado de (1-α)100% para µ1-µ2 esta dado por:

𝑆12 𝑆22 𝑆12 𝑆22


1 − 2 − 𝑡𝛼 + < 𝜇1 − 𝜇2 < 1 − 2 + 𝑡𝛼 +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

Donde 𝑡𝛼/2 es el valor t con,

2
𝑆12 𝑆22
𝑛1 + 𝑛2
𝑣=
2 2
𝑆12 𝑆22
𝑛1 𝑛2
+
𝑛1 − 1 𝑛2 − 1

Grados de libertad, con un área de 𝛼/2 a la derecha.


Ejemplo
En 1980, el departameto de zoología en el Virginia Polytechhic Institute and State University
dirigió un estudio sobre la “Nutrient Retention and Macreoinvertebrate Community
Response to Sewage Stress in a Stream Ecosystem” para estimar la diferencia en la cantidad
de ortofósforo químico medico en dos estaciones diferentes en el río James. El ortofósforo se
mide en miligramos por litro. Se sacaron quince muestras de la estación 1 y 12 de la estación
2. Las 15 primeras tuvieron un contenido promedio de ortofósforo de 3.84 miligramos por
litro y una desviación estándar de 3.07 miligramos por litro, mientras que en las 12 segundas,
estos datos fueron de 1.49 miligramos por litro y 0.80 miligramos por litro, respectivamente,.
Encuentre un intervalo de confianza de 95% para la diferencia en los contenidos promedios
reales de ortofósforo en las dos estaciones, asumiendo que las observaciones surgen de
poblaciones normales con varianzas distintas.
Intervalo de confianza para µD=µ1-µ2 para
observaciones pareadas
 Si d y Sd son la media y la desviación estándar de las
diferencias normalmente distribuidas de n pares
aleatorios de mediciones, un intervalo de confianza del
(1-α)100% para µD= µ1-µ2 es:

𝑆𝑑 𝑆𝑑
𝑑 − 𝑡𝛼 < 𝜇𝐷 < 𝑑 + 𝑡 𝛼
2 𝑛 2 𝑛

Donde 𝑡𝛼/2 es el valor 𝑡 con 𝑣 = 𝑛 − 1 grados de


libertad, con un área de 𝛼 2 a la derecha.
Estimador de S conociendo diferencias
muestrales

𝑛 2 𝑛 2
𝑛 𝑑
𝑖=1 𝑖− 𝑖=1 𝑑𝑖
𝑆𝑑 =
𝑛(𝑛 − 1)
Ejemplo
 En el artículo “Essential Elements in Fresh and Canned Tomatoes”, publicado en el Journal of
Food Science (Vol. 46, 1981), los contenidos de elementos esenciales en jitomates frescos y
enlatados se determinaron mediante el método de espectrofotometría de absorción atómica.
El contenido de cobre en jitomates frescos en comparación con el que los mismos jitomates
registraron después de ser enlatados se muestra a continuación:

Par Jitomates Jitomates di


frescos enlatados
1 0.066 0.085 0.019
2 0.079 0.088 0.009
3 0.069 0.091 0.022
4 0.076 0.096 0.020
5 0.071 0.093 0.022
6 0.087 0.095 0.008
7 0.071 0.079 0.008
8 0.073 0.078 0.005
9 0.067 0.065 -0.002
10 0.062 0.068 0.006
Encuentre un intervalo de confianza del 98% para la
diferencia real en el contenido promedio e cobre en
jitomates enlatados y frescos, suponiendo que la
distribución de las diferencias es normal.
Estimación de una proporción
 Intervalo de confianza para p de una muestra grande. Si 𝑝 es la
proporción de éxitos en una muestra aleatoria de tamaño 𝑛, y 𝑞 =
1 − 𝑝, un intervalo de confianza aproximado de 1 − 𝛼 100% para el
parámetro binomial 𝑃 es:

𝑝𝑞 𝑝𝑞
𝑝 − 𝑍𝛼 𝑛 < 𝑃 < 𝑝 + 𝑍𝛼 𝑛
2 2

Donde 𝑍𝛼 2 es el valor de 𝑍 con un área 𝛼


2a la derecha.
Ejemplo
En una muestra aleatoria de n= 500 familias que poseen
televisiones en la ciudad de Hamilton, Canadá, se
encontró que x= 340 se habían suscrito a la HBO.
Encuentre un intervalo de confianza de 95% para la
proporción actual de familias en esta ciudad que se
suscriben a la HBO.
Teorema
 Si 𝑃 se utiliza como una estimación de 𝑝, se puede
tener una confianza del 1 − 𝛼 100%de que el error
no excederá de 𝑍𝛼 2 𝑝𝑞 𝑛 =e
Teorema
 Si P se utiliza como una estimación de p, se puede entre
una confianza del 1 − 𝛼 100% de que el error será
menor que una cantidad especificada 𝑒 cuando el
tamaño de la muestra sea aproximadamente:

𝑍𝛼 𝑝𝑞
2
 𝑛=
𝑒2
Ejemplo
 ¿Qué tan grande se requiere que sea una muestra en el
ejemplo de los suscritos a HBO si se desea tener una
confianza del 95% de que la estimación de p estará
dentro de 0.02?
Estimación de la diferencia entre dos
proporciones
 Intervalo de confianza para p1-p2 de una muestra grande Si 𝑝1 y 𝑝2 son las
proporciones de éxitos en muestras aleatorias de tamaños 𝑛1 𝑦 𝑛2 , respectivamente,
𝑞1 = 1 − 𝑝1 y 𝑞2 = 1 − 𝑝2 , un intervalo aproximado de confianza del (1 −
Ejemplo
 Se está considerando cambiar el procedimiento de manufactura de partes.
Se toman muestras tanto del procedimiento actual como del nuevo para
determinar si este último resulta ser mejor. Si 75 de los 1500 artículos del
procedimiento actual presentaron defectos y lo mismo sucedió con 80 de
2000 partes del nuevo procedimiento, determine un intervalo de confianza
del 90% para la diferencia real de las fracciones de partes defectuosas entre
los dos procesos.
Estimación de la varianza
 Intervalo de confianza para 𝜎 2 es es la varianza de
una muestra aleatoria de tamaño 𝑛 de una población
normal, un intervalo de confianza del 1 − 𝛼 100%
para 𝜎 2 es:

𝑛−1 𝑆 2 𝑛−1 𝑆 2
 < 𝜎2 <
𝑋𝛼2 2
𝑋1−𝛼
2 2

Donde X2α/2 y X21- α /2 son valores X2 con v=n-1


grados de libertad, con áreas de α/2 y 1- α/2,
respectivamente a la derecha.
Ejemplo
 Los siguientes son los pesos, en decagramos, de 10
paquetes de semillas de pasto distribuidos por
determinada compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9,
45.8, 46.9, 45.2, y 46.0. Encuentre un intervalo de
confianza de 95% para la varianza de todos los paquetes
de semillas de pasto que se distribuyó por esta compañía,
suponiendo una población normal.
Intervalos estadísticos basados en una sola
muestra.
 Hipótesis Estadística: Es una afirmación o conjetura
acerca de una o más poblaciones.

 Hipótesis Nula (Ho): Conjetura que se realiza en forma


tal que especifique un valor exacto del parámetro a
evaluar.

 Hipótesis Alternativa (H1): Es el resultado de rechazar


Ho y admite la posibilidad de varios valores.
Rechazar la hipótesis nula cuando es verdadera se llama
error tipo I.

La aceptación de la hipótesis nula cuando en realidad es


falsa se llama error tipo II.
 Región crítica.
 Región de aceptación.
 Valor crítico.
 Nivel de significancia=Tamaño de la región crítica.
Ejemplo
Se sabe que un tipo de vacuna fría es sólo 25% eficaz después de un periodo de 2 años. Para
determinar si una vacuna nueva y algo más cara es mejor para proporcionar protección
contra el mismo virus durante un periodo más largo, supóngase que se seleccionan 20
personas al azar y se les inyecta ésta. Si más de 8 de los que recibieron la nueva vacuna supera
el periodo de 2 años sin contraer el virus, la nueva vacuna se considerará superior a la que se
usa actualmente. El requisito de que se exceda de 8 es algo arbitrario, pero parece razonable
en el sentido de que representa una modesta ganancia sobre las 5 personas que podría
esperarse recibieran protección si se hubiera inyectado a las 20 con la vacuna que ya está en
uso. La hipótesis alternativa es que la nueva vacuna es de hecho superior. Esto equivale a
probar la hipótesis de que el parámetro binomial para la probabilidad de un éxito en un
intento dado es p=1/4 contra la alterativa p>1/4.

Ho: p= ¼
H1: p> ¼
α= P(error tipo I)
=P(X>8 cuando p=1/4)

=∑x=9:20 b(x;20,1/4)
=0.0409
La probabilidad de cometer un error de tipo II es β

Es imposible calcularla a no ser que se tenga una hipótesis alternativa específica.

Ejemplo: Si se prueba la hipótesis nula de que p= ¼ en contraposición a la hipótesis


alternativa de que p=1/2, entonces se esta en condiciones de calcular la probabilidad de
aceptar Ho cuando en realidad es falsa.

β=P(error tipo II)


=P(X≤8 cuando p=1/2)
=∑ x=0:8 b(x;20,1/2)
=0.2517
Prueba de dos colas
El símbolo de la desigualdad apunta en la dirección de la
región crítica.
Ejemplo

 Calcule las probabilidades de cometer errores tipo I y II


cuando se prueba la hipótesis nula de que µ=68
kilogramos en contra de la alternativa de que µ≠68
kilogramos para la población continua de los pesos de los
estudiantes. Se asume que la desviación estándar de la
población de pesos es σ=3.6, al tomar una muestra de
36 observaciones, si la zona de aceptación esta entre
67<µ<69.

Posteriormente aumente el tamaño de la muestra a 64 e


interprete los resultados.
Ejercicios 315 pag. WALPOLE
Pruebas relacionadas con una sola media
(Varianza conocida)

Es conveniente estandarizar a la media muestral, e incluir


formalmente la variable aleatoria normal estándar Z

𝑍 = 𝜎𝑥−𝜇
𝑛
Pruebas relacionadas con una sola media
(Varianza conocida)
Una muestra aleatoria de 100 muertes registradas en los
Estados Unidos durante el año pasado mostró una vida
promedio de 71.8 años. Suponiendo una desviación
estándar poblacional de 8.9 años, ¿Parecería esto indicar
que la vida promedio hoy en día es mayor que 70 años?
Utilice un nivel de significancia del 0.05.
Ejemplo
Un fabricante de equipo deportivo ha desarrollado un
nuevo sedal sintético para pesca que se considera tiene
una resistencia a la ruptura de 8 kilogramos con una
desviación estándar de 0.5 kilogramos. Pruébese la
hipótesis de que µ=8 kilogramos en contra posición a la
alternativa de que µ≠8 kilogramos si se prueba una
muestra aleatoria de 50 sedales y se encuentra que tiene
una resistencia promedio a la ruptura de 7.8 kilogramos.
Utilice un nivel de significancia del 0.01.
Pruebas sobre una sola media (variancia
desconocida)
 La estructura de la prueba es idéntica que para el caso de σ
conocida con la excepción de que el valor σ en el estadístico
de prueba se remplaza por la estimación calculada S y la
distribución normal estándar se reemplaza por una
distribución t.

−𝜇0
 𝑡=𝑠
𝑛
Ejemplo
 El Edison Electric Institute ha publicado cifras acerca de la cantidad anual de kilowatts-hora
consumida por varios aparatos para el hogar. Se afirma que la aspiradora consume un
promedio de 46 kilovatios-hora al año. Si una muestra aleatoria de 12 hogares incluidos en un
estudio planeado indica que las aspiradoras consumen un promedio de 42 kilovatios – hora al
año con una desviación estándar de 11.9 kilovatios – hora, ¿sugiere esto con un nivel de
significancia de 0.05 que las aspiradoras consumen, en promedio, menos de 46 kilovatios-hora
al año? Suponga que la población de kilovatios-hora es normal.
Pruebas sobre dos medias
Variancias desconocidas
Si se está dispuesto a asumir que las distribuciones son normales y que σ1 = σ2 =σ puede
usarse la prueba t combinada.

1 − 2 − 𝑑0
𝑡=
1 1
𝑆𝑝 +
𝑛1 𝑛2

𝑆12 𝑛1 − 1 + 𝑆22 𝑛2 − 1
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

Se incluye la distribución t y la hipótesis bilateral no se rechaza cuando:

−𝑡𝛼 , 𝑛1 + 𝑛2 − 2 < 𝑡 < 𝑡𝛼 , 𝑛1 + 𝑛2 − 2


2 2
Ejemplo
 Se llevó a cabo un experimento para comparar el deterioro abrasivo de dos materiales
laminados diferentes. Se probaron doce piezas del material 1, exponiendo cada una a una
máquina para medir el deterioro. De la misma manera, se probaron diez piezas del material 2.
En cada caso, se observó, la profundidad del deterioro. Las muestras del material 1 dieron un
deterioro promedio (registrado) de 85 unidades con una desviación estándar muestral de 4,
mientras que las muestras del material 2 dieron un promedio de 81 y una desviación
estándar muestral de 5.¿Puede concluirse en el nivel de significancia de 0.05 que el deterioro
abrasivo del material 1 excede al del material 2 por más de 2 unidades? Asuma que las
poblaciones son aproximadamente normales con variancias iguales.
Observaciones pareadas
 En el documento “Influence of Physucak Restraint and Restraint –Facilitating Drugs on Blood
Measurementes of White Tailed Deer and Other Selected Mammals”, de la virginia Polytechnic
Institute and State University (1976), J.A. Wesson examinó la influencia de la droga
(succinylcholine) en los niveles de circulación de andrógenos en la sangre. Se obtuvieron
muestras de sangre de ciervos salvajes se extrajeron vía la vena yugular inmediatamente
después de una inyección intramuscular de succinylcholine a través de dardos y rifles para
captura. Se obtuvieron nuevas muestras de sangre 30 minitos después de aplicada la inyección
y a continuación se les dejó en libertad. Los niveles de andrógenos al momento de la captura
y 30 minutos más tarde, medidos en nanogramos por mililitro (ng/ml), para 15 ciervos son los
siguientes:

𝑑−𝑑0
 𝑡 = 𝑆𝑑
𝑛
𝑛 𝑛 2 𝑛
𝑖=1 𝑑𝑖 −( 𝑖=1 𝑑𝑖 )
2
 𝑆𝑑 = 𝑛(𝑛−1)
Andrógeno(ng/ml)
Ciervo Al momento de la inyección 30 minutos después di
de la inyección
1 2.76 7.02 4.26
2 5.18 3.10 -2.08
3 2.68 5.44 2.76
4 3.05 3.99 0.94
5 4.10 5.21 1.11
6 7.05 10.26 3.21
7 6.60 13.91 7.31
8 4.79 18.53 13.74
9 7.39 7.91 0.52
10 7.30 4.85 -2.45
11 11.78 11.10 -0.68
12 3.9 3.74 -0.16
13 26.00 94.03 68.03
14 67.48 94.03 26.55
15 17.04 41.70 24.66
 Si se supone que las poblaciones de andrógeno al momento de
la inyección y 30 minutos más tarde tienen distribución normal,
pruébese, en un nivel de significancia del 0.05, si las
concentraciones de andrógeno se alteran después de 30
minutos de inhibición.
Pruebas relacionadas con proporciones

 Todas las empresas manufactureras desean conocer la proporción de artículos defectuosos


cuando se realiza un embarque.
Prueba de una proporción; muestras pequeñas.
1. Ho: p=p0.
2. H1: Las alternativas son: p<p0, p>p0 o p≠0.
3. Elegir el nivel de significancia.
4. Estadístico de prueba: La variable binomial X con p=p0.
5. Cálculos: Encontrar x, la cantidad de éxitos, y calcular el valor apropiado de P.
6. Decisión:Tomar las decisiones apropiadas con base en el valor P.
Ejemplo
 Un constructor afirma que se instalan bombas de
calefacción en el 70% de todos los hogares actualmente
en construcción en la ciudad de Richmond, ¿Estaría usted
de acuerdo con esta afirmación si una investigación
aleatoria de nuevas casas en esta ciudad indica que 8 de
cada 15 tiene instaladas bombas de calefacción? Utilice un
nivel de significancia de 0.10
Prueba de la diferencia de dos proporciones
 Para calcular el valor de Z deben estimarse los parámetros p
y q que aparecen en el radical. Al combinar los datos de
ambas muestras, la estimación combinada de la proporción p
es:
𝑥1 + 𝑥2
𝑝=
𝑛1 + 𝑛2
 Donde x1 y x2 son el número de éxitos en cada una de las dos
muestras. El valor de z para probar p1=p2 se determina:

𝑝1 − 𝑝2
𝑧=
1 1
𝑝𝑞 +
𝑛1 𝑛2
Decisión

p1≠p2 regiones críticas z< -zα/2 y z> zα/2.

p1<p2 región crítica z<-zα

p1>p2 región crítica z>zα


Ejemplo
 En un estudio para estimar la proporción de residentes
de una ciudad y sus suburbios que está de acuerdo con la
construcción de una planta de energía nuclear, se
encontró que 63 de 100 residentes urbanos favorecen la
construcción mientras que 59 de 125 residentes
suburbanos se oponen. ¿Existe alguna diferencia
significativa entre las proporciones de residentes urbanos
y suburbanos que favorecen la construcción de la planta
nuclear ?
Pruebas relacionadas con varianzas
 Estadístico de prueba:

2 (𝑛−1)𝑠2
𝜒 = 𝜎02

Con 𝑣 = 𝑛 − 1
Ejemplo
 Un fabricante de baterías para automóvil asegura que la
duración de sus baterías tiene distribución
aproximadamente normal con una desviación estándar
igual que 0.9 años. Si una muestra aleatoria de 10 de estas
baterías tiene una desviación estándar de 1.2 años. ¿Piensa
usted que 𝜎 > 0.9 años? Utilice un nivel de significancia
de 0.05.
Pruebas sobre diferencia de varianzas
Distribución F
𝐻0 : 𝜎12 = 𝜎22

Regiones críticas:
𝜎12 < 𝜎22 𝑓 < 𝑓1−𝛼 𝑣1 , 𝑣2

𝜎12 > 𝜎22 𝑓 < 𝑓𝛼 𝑣1 , 𝑣2

𝜎12 ≠ 𝜎22 𝑓 < 𝑓1−𝛼/2 𝑣1 , 𝑣2 y 𝑓𝛼 (𝑣1 , 𝑣2 )


2
En donde:

1
𝑓1−𝛼 𝑣1 , 𝑣1 = 𝑓
𝛼 𝑣1 ,𝑣1
Ejemplo
 Se llevó a cabo un experimento para comparar el deterioro abrasivo de dos
materiales laminados diferentes. Se probaron doce piezas del material 1,
exponiendo cada una a una máquina para medir el deterioro. De la misma
manera, se probaron diez piezas del material 2. En cada caso, se observó,
la profundidad del deterioro. Las muestras del material 1 dieron un deterioro
promedio (registrado) de 85 unidades con una desviación estándar muestral
de 4, mientras que las muestras del material 2 dieron un promedio de 81 y
una desviación estándar muestral de 5; y se asumió que las dos varianzas
poblacionales desconocidas eran iguales. ¿Se justifica esta suposición?
Utilice un nivel de significancia de 0.10.
Solución
1. 𝐻0 : 𝜎12 = 𝜎12 .
2. 𝐻1 : 𝜎12 ≠ 𝜎12 .
3. 𝛼 = 0.10.
4. Región crítica: 𝑓0.05 11,9 = 3.11
𝑓0.95 11,9 = 𝑓 1(9,11)=0.34
0.05

5. Cálculos 𝑠12 = 16, 𝑠22 = 25 y de aquí que:


16
𝑓= = 0.64
25
6. No se rechaza 𝐻0 con 𝛼 = 0.10.
UNIDAD IV. PRUEBAS DE BONDAD
DE AJUSTE
El estudiante determinará la distribución de probabilidad que tiene
un conjunto de datos, mediante las pruebas de bondad de ajuste,
para poder realizar simulaciones y pronósticos sobre un proceso
de producción.
Prueba de bondad Kolmogorov
 Hipótesis a contrastar:
H0: Los datos analizados siguen una distribución M.
H1: Los datos analizados no siguen una distribución M.

 Estadístico de contraste:
D= sup1≤i ≤n |Fˆn(xi)-F0(xi)|
Xi= i-ésimo valor observado en la muestra (cuyos valores se han
ordenado de menor a mayor).
Fˆn(xi)= es un estimador de la probabilidad de observar valores
menores o iguales que xi.
F0(x)=Es la probabilidad de observar valores menores o iguales
que xi cuando H0 es cierta.
Notas
 D es la mayor diferencia absoluta observada entre la
frecuencia acumulada observada Fˆn(x) y la frecuencia
acumulada teórica F0(x), obtenida a partir de la
distribución de probabilidad que se específica como
hipótesis nula.

 Si los valores observados de Fˆn(x) son similares a los


esperados de F0(x), el valor D será pequeño. Cuanto
mayor sea la discrepancia entre la distribución empírica y
la teórica, mayor será el valor de D.
Cα α
Modelo 0.1 0.05 0.01
General 1.224 1.358 1.628
Normal 0.819 0.895 1.035
Exponencial 0.990 1.094 1.308
Weibull n=10 0.760 0.819 0.944
Weibull n=20 0.779 0.843 0.973
Weibull n=50 0.790 0.856 0.988
Weubull n=∞ 0.803 0.847 1.007
Distribución que se
contrasta
General. Parámetros 𝑘 𝑛 = 𝑛 + 0.12 + 0.11 𝑛
conocidos
Normal 𝑘 𝑛 = 𝑛 − 0.01 + 0.85
𝑛

Exponencial 𝑘 𝑛 = 𝑛 + 0.12 + 0.11


𝑛

Weibull 𝑘 𝑛 = 𝑛
D+= max 1≤i≤n{ i/n – F0 (xi)}, D-= max
1≤i≤n{F0(xi) - (i-1)/n}

D=max{D+,D-} ; Dα =Cα/k(n)

Por lo tanto, el criterio para la toma de decisión entre las dos


hipótesis será de la forma:
Si D≤Dα No rechazar H0
Si D≥Dα No aceptar H0
Donde el valor de Dα se elige de tal manera que:

P(Rechazar H0/H0 es cierta)=P(D>Dα / Los datos siguen la distribución M)=α


Ejemplo
Determinar si los valores de la primera columna se conforma a una distribución
normal.

Y Y-ordenados Orden F Z F0 D+ D-

6.0 1.9 1 0.1

2.3 2.3 2 0.2

4.8 3.3 3 0.3

5.6 3.4 4 0.4

4.5 4.5 5 0.5

3.4 4.5 6 0.6

3.3 4.8 7 0.7

1.9 4.8 8 0.8

4.8 5.6 9 0.9

4.5 6.0 10 1.0


3.2. Prueba de bondad Chi cuadrada
 La prueba permite comparar la distribución de
frecuencias observadas (Fo) de una variable cualitativa o
cuantitativa, con la distribución de frecuencias de la
misma variable medida en un grupo de referencia; con el
propósito de averiguar si existen diferencias
estadísticamente significativas entre la distribución
observada (Fo) y la distribución esperada (Fe)

Ho: Fo=Fe
H1: F0≠Fe
Procedimiento
1. Confirmar que el propósito del estudio consiste en comparar la distribución observada en la escala de una
variable medida en un grupo en estudio (distribución observada) con la distribución esperada de dicha
variable considerando el antecedente de algún grupo de referencia para verificar si ambas distribuciones
se ajustan bien o no.
2. Disponer de las frecuencias absolutas de la distribución observada en la escala de la variable medida en el
grupo en estudio (distribución observada).
3. Disponer de las frecuencias absolutas o de las relativas (porcentajes o proporciones) de la distribución en
la escala de la variable medida en el grupo de referencia.
4. Calcular las frecuencias esperadas aplicando al total del grupo en estudio las proporciones o porcentajes
de la distribución de referencia, modalidad por modalidad o clase por clase, para obtener las
correspondientes frecuencias esperadas.
5. Utilizar una tabla auxiliar para determinar el valor de Chi cuadrada calculada.
6. Comparar el valor de Chi cuadrada calculada con el valor de Chi cuadrada crítica, usando una tabla de
valores críticos. Identificar el renglón de los grados de libertad (G.L.) correspondientes al número de
modalidades o clases de la variable en estudio mediante la fórmula G.L. = k – 1 (donde: k número de
modalidades o clases)
7. En caso de que el valor de Chi cuadrada calculada rebase al valor crítico de la tabla, rechazar a la hipótesis
estadística nula Ho señalando que el nivel de significancia fue de 0.05; usualmente se acostumbra redactar
lo anterior de la siguiente forma: se rechazó Ho con una p < 0.05; en caso de que el valor calculado haya
sido igual o no hubiera rebasado al valor crítico se señala que no fue posible rechazar la Ho.
8. De acuerdo al paso anterior, establecer la conclusión referente a si ambas distribuciones se ajustan bien o
no.
 El estadístico que nos permite determinar si se acepta o
rechaza la hipótesis es:

2=∑i=1:k (oi-ei)2
ei

oi=Cada una de las frecuencias observadas.


ei= Cada una de las frecuencias esperadas.

v=k-1
 Para un nivel de significancia igual que α se encuentra el
valor critico 2α y entonces 2 >2α constituye la región
critica.
Ejemplo
 Se lanza un dado 120 veces y se registra cada uno de los resultados. Teóricamente,
si el dado no está cargado, se esperaría que cada dado cayera 20 veces. Los
resultados se observan en la tabla. Al comparar las frecuencias observadas con las
correspondientes frecuencias esperadas, se debe decidir si estas discrepancias
tienen posibilidad de ocurrir como resultado de las fluctuaciones muestrales, de que
el dado no está cargado y que la distribución de resultados no es uniforme.

Cara
1 2 3 4 5 6
Observada 20 22 17 18 19 24
Esperada 20 20 20 20 20 20
UNIDAD V. DISEÑO DE EXPERIMENTOS
 Objetivo de la Unidad. El estudiante diseñará
experimentos mediante la utilización de parámetros
estadísticos, para tomar decisiones referentes a dos o
más variables.

5.1.Regresión Lineal
5.3.Diseños 2k
5.4.ANOVA
5.1.Regresión Lineal
En la práctica, con mucha frecuencia es necesario resolver
problemas que implican conjuntos de variables, cuando se
sabe que existe alguna relación inherente entre ellas.

Regresión lineal ajustada: ŷ= a + bx


Coeficientes de regresión

b= n∑i=1:n xiyi – (∑i=1:n xi)(∑i=1:n yi)


n∑i=1:n x2i – (∑i=1:n xi)2

a= ∑i=1:n yi – b ∑i=1:n xi
n
Ejemplo
 Uno de los problemas más desafiantes para el control de
la contaminación del agua lo presenta la industria del
curtido de pieles. Los desechos de esta industria son
químicamente complejos. Se caracterizan por valores
elevados en la demanda de oxígeno bioquímico, los
sólidos volátiles y otras mediciones de contaminación.
Considérense los datos experimentales de la tabla
obtenidos de 33 muestras de desperdicios que se tratan
químicamente en el estudio “Chemical Treatment on
Spent Vegetable Tan Liquor”
Mediciones de sólidos y demanda de oxígeno químico
Reducción de sólidos, x(%) Demanda de oxígeno químico, y (%)

3 5
7 11
11 21
15 16
18 16
27 28
29 27
30 25
30 35
31 30
31 40
32 32
33 34
33 32
34 34
36 37
36 38
36 34
37 36
38 38
39 37
39 36
39 45
40 39
41 41
42 40
42 44
43 37
44 44
45 46
46 46
47 49
50 51
Diseños 2K
 Estudio del efecto sobre una respuesta de k factores, cada
uno en dos niveles (alto y bajo). El diseño factorial
completo requiere que cada uno de los niveles de cada
factor se dé en todos los niveles de todos los otros
factores, es decir 2k tratamientos.

 Los niveles más altos de los factores A, B, C, … , por las


letras a,b,c, … y los niveles más bajos de cada factor por
la notación (1).

 Diseño experimental fraccionado.


Signos para contrastes en un experimento 22 factorial

Combinación de Efecto factorial


tratamiento A B AB
(1)
a
b
ab
Signos para contrastes en un experimento 23 Factorial

Combinación de Efecto factorial


tratamiento A B C AB AC BC ABC
(1)
a
b
c
ab
ac
bc
abc
ANÁLISIS DE LA VARIANZA (ANOVA)
ANOVA UNIFACTORIAL
Análisis de la Varianza.

Técnica de aprendizaje de rejilla.


Experimentos generales de un solo factor
 Ejemplo:
El tiempo de sobrevivencia se mide para dos muestras de
ratones, donde una de las muestras recibió un nuevo suero
para el tratamiento de la leucemia y la otra muestra no.

En este caso se dice que existe un solo factor, llamado


tratamiento, y el factor es de dos niveles.

k>2, se asumirá que existen k muestras de k poblaciones.


Técnica del análisis de variancia

Describe una técnica mediante la cual se analiza la


variación total o dividida en componentes
representativas.
Ejemplo
Supóngase que en un experimento industrial un ingeniero está interesado en cómo varía la
absorción media de humedad en el concreto de entre cinco diferentes mezclas de concreto.
Las mezclas varían en el porcentaje en peso horas. Se decide probar 6 para cada mezcla, lo
que requiere la prueba de un total de 30 muestras. Los datos se registran en la tabla.

Mezcla (% de peso)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 3320 3416 3663 2791 3664 16,854
Media 553.33 569.3 610.5 465.17 610.67 561.8
 Si se tienen 6 observaciones que se toman de cada una
de las 5 poblaciones con medias µ1,µ2,…µ5,
respectivamente. Se desea probar

H0: µ1=µ2=…=µ5
H1: Al menos dos de las medias no son iguales.
Análisis de variancia en una sola dirección
Diseño completamente aleatorizado
 Se seleccionan muestras aleatorias de tamaño n de cada una de las k poblaciones. Las k
diferentes poblaciones se clasifican sobre la base de un criterio único tal como el de
tratamientos o grupos diferentes.

 El termino tratamiento se utiliza para referirse a las diferentes clasificaciones, sea que se trate
de mezclas diferentes, analistas diferentes, fertilizantes diferentes, o regiones diferentes de un
país. Se asumirá que las k poblaciones son independientes y tienen una distribución normal
con medias µ1,µ2,…,µk y variancia común σ2.

H0= µ1=µ2=…= µk
H1= Al menos dos de las medias no son iguales.
 Sea yij la j-ésima observación del tratamiento i-ésimo y se ordenan los datos. Ti es el total de
todas las observaciones en la muestra correspondiente al i-ésimo tratamiento. Cada
observación puede escribirse en la forma: yij=µi + εij.

TRATAMIENTO
1 2 … i …k
y11 y12 … yi1 … yk1
y12 y22 … yi2 … yk2
. . .
.
. . .
.
. . .
.
y1n y2n … yin … yk2
Total T1 . T2 . … Ti. … Tk. T..
Media 1. 2. … 1. … k 1..
 εij mide la desviación de la observación j-ésima de la i-ésima muestra de la
correspondiente media de tratamiento.
 Una forma alterna y preferida de esta ecuación se obtiene al sustituir
µi=µ+αi.

yij= µ+ αi+ εij

µ=(∑i=1:k µi )/k αi = efecto del i - ésimo tratamiento

La hipótesis nula de que las medias de la población k son iguales contra la alternativa de que
al menos dos de las medias son diferentes puede ahora reemplazarse por las hipótesis
equivalentes.
Ho= α1= α2=…= αk=0,
H1= Al menos una de las αi’s no es igual a cero.
Identidad de suma de cuadrados

∑i=1:k∑j=1:n (yij- ..)2=n ∑i=1:k(yij- ..)2 + ∑j=1:n (yij- ..)2

SST= ∑i=1:k∑j=1:n (yij- ..)2 =Suma total de cuadrados.


SSA=n ∑i=1:k(yij- ..)2 =Suma de cuadrados en tratamiento.
SSE= ∑i=1:k∑j=1:n (yij- i)2=Suma de cuadrados del error.

La identidad de suma de cuadrados puede representarse


simbólicamente por la ecuación:

SST=SSA+SSE
Teorema Suma de cuadrados en tratamiento

E(SSA)=(k-1)σ2 + n ∑i=1:k αi2

Cuadrado medio del tratamiento S12=SSA/(k-1)

Cuadrado medio del error S2=SSE/k(n-1)


Fórmulas para el cálculo de la suma de
cuadrados; muestras de iguales tamaños
 SST= (∑i=1:k∑j=1:n y2ij ) – (T2../nk)

 SSA= (∑i=1:k Ti2.)/n - T2../nk

 SSE=SST-SSA
Análisis de variancia para la clasificación de
una dirección

Fuente de Suma de Grados de Cuadrados Calculada


variación cuadrados libertad medios
Tratamientos SSA k-1 S12 = SSA/(k-1) S12 / S2
Error SSE k(n-1) S2 = SSE/(k(n-1))
Total SST nk-1
Ejemplo
 Pruebe la hipótesis de que µ1= µ2=…= µ5 a nivel de significancia de 0.05 para los datos de la
tabla acerca de la absorción de humedad de varios tipos de mezcla de concreto.

Mezcla (% de peso)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 3320 3416 3663 2791 3664 16,854
Media 553.33 569.3 610.5 465.17 610.67 561.8
Fórmulas para el cálculo de la suma de
cuadrados; tamaños desiguales de muestra.

 SST =∑I=1:k∑j=1:ni y2ij - T2/N,

 SSA = ∑I=1:k (Ti 2/ni)-(T2/N),

 SSE = SST-SSA

Los grados de libertad se dividen igual que antes: N-1 para SST, k-1 para SSA y N-1-(k-1)=N-
k para SSE
Ejemplo
 Parte del estudio “Serum Inorganic Phosphorus Levels un Children with Seizure Disorders
Taking Anticonvulsant Drugs”, que se llevó a cabo en la Virginia Polytechnic Institute and State
University en 1982, se diseño para medir los niveles de actividad de fosfata alcalina del
suero(unidades Bessey-Lowry) en niños que padecían ataques convulsivos y quienes habían
recibido terapia anticonvulsionante bajo el cuidado de un especialista privado. Se encontraron
cuarenta y cinco sujetos para el estudio y se clasificaron en cuatro grupos de acuerdo con la
medicina que se les proporcionó:

G-1: Control (sin recibir anticonvulsionantes y sin tener una historia de desórdenes de este tipo),
G-2: fenobarbital,
G-3: carbamazapina
G-4: otros anticonvulsionantes.

A partir de las muestras sanguíneas obtenidas de cada sujeto se determinaron los niveles de
actividad de fosfata alcalina de suero y se registraron en la tabla siguiente. Pruebe la hipótesis,
a nivel de significancia de 0.05, de que el nivel promedio de actividad de la fosfata alcalina en
suero es el mismo para los cuatro grupos anteriores.
Nivel de actividad del suero fosfatado
alcalino

Grupo de medicamento
G-1 G-2 G-3 G-4
49.20 97.50 97.07 62.10 110.60
44.54 105.00 73.40 94.95 57.10
45.80 58.05 68.50 142.50 117.60
95.84 86.60 91.85 53.00 77.71
30.10 58.35 106.60 175.00 150.00
36.50 72.80 0.57 79.50 82.90
82.30 116.70 0.79 29.50 111.50
87.85 45.15 0.77 78.40
105.00 70.35 0.81 127.50
95.22 77.40
Pruebas para la igualdad de varias
variancias
 Supóngase que desea probar la hipótesis nula
Ho: σ12= σ22= …= σk2
H1: No son iguales todas las variancias.

1. Se utiliza la prueba de Bartlett logrando encontrar aproximaciones muy


exactas a los valores críticos para los tamaños diferentes de muestra.
2. Se calculan las k variancias muestrales s21, s22,…, s2k, de muestras de
tamaño n1, n2,…, nk, con ∑i=1:k ni=N.
3. Se combinan las variancias muestrales para dar la estimación
combinada.
S2p= (∑i=1:k(ni-1)si2)/N-k
4. Encontrar b:

b={[(S12)n1-1(S22)n2-1…(Sk2)nk-1]1/(N-k)}/Sp2
5. Para el caso especial cuando n1= n2=…= nk=n, se rechaza Ho al nivel de significancia α si
b<bk(α;n), donde bk(α;n) es el valor crítico que deja un área de tamaño α
en la cola izquierda de la distribución Bartlett.
6. Cuando los tamaños de las muestras son desiguales, se rechaza la
hipótesis nula de significancia α si: b<bk(α;n1, n2,…, nk),donde:

b<bk(α;n1, n2,…, nk)≈ [n1bk(α:n1)+n2bk(α:n2)+…+nkbk(α:nk)]/N

s2p=

b=
Ejemplo
 Utilice la prueba Barlett para probar la hipótesis a nivel de significancia de 0.01, de
que las variancias de la población de los cuatro grupos en el ejemplo del estudio
“Serum Inorganic Phosphorus Levels un Children with Seizure Disorders Taking
Anticonvulsant Drugs”son iguales.
Ejercicios
Comparaciones con un solo grado de
libertad
 No se sabe aún dónde existe la diferencia entre las mezclas.

 Cualquier función lineal de la forma ω=∑i=1:k Ciµi, donde ∑i=1:k Ci=0, recibe el
nombre de una comparación o contraste delas medias de los tratamientos.

 El experimentador puede realizar comparaciones múltiples probando la


significancia de contrastes en las medias de los tratamientos, esto es,
probando una hipótesis del tipo:

H0: ∑i=1:k Ciµi=0,


H1: ∑i=1:k Ciµi≠0,

Donde ∑i=1:k Ci=0. La prueba se realiza calculando primero un contraste


similar en las medias muestrales w= ∑i=1:k Ci i..
 Dado que 1., 2.,…, k. son variables aleatorias independientes que tienen
distribuciones normales con medias µi,µ2,…,µk y variancias σ2/n1, σ2/n2,…,
σ2/nk, respectivamente.

µw=∑i=1:k Ciµi

La suma de cuadrados de contraste (SSw) indica la porción de la suma de


cuadrados de tratamientos SSA que se explica por el contraste en cuestión.

SSw= (∑i=1:k CiTi)2 / n ∑i=1:k Ci2


Los dos contrastes
 ω = ∑i=1:k biµi ω = ∑i=1:k ciµi se dice que son ortogonales si ∑i=1:k biCi/ni=0
o cuando las ni’ s son todas iguales a n, si ∑i=1:k biCi=0.

 Si ω1 y ω2 son ortogonales; las cantidades SSw1 y SSw2 son componentes


de SSA cada una con un solo grado de libertad. La suma de cuadrados de
tratamiento con k-1 grados de libertad puede dividirse cuando mucho en k-
1 sumas de cuadrados de contraste independientes con un solo grado de
libertad que satisfacen la identidad

SSA=SSw1 + SSw2 +…+SSwk-1 si los contrastes son mutuamente ortogonales


uno al otro.

SSw=(∑i=1:k CiTi)2/ n ∑i=1:k Ci2


Ejemplo
 En referencia al problema de absorción de humedad en mezclas de concreto, encuentre la
suma de cuadrados de contraste correspondiente a los contrastes ortogonales
ω1=µ1+µ2-µ3-µ5
ω2=µ1+µ2+µ3+µ5-4µ4
y lleve a cabo las pruebas de significancia apropiadas.

Mezcla (% de peso)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 3320 3416 3663 2791 3664 16,854
Media 553.33 569.3 610.5 465.17 610.67 561.8
Procedimiento de Tukey (el método T)

 Se utiliza la distribución de probabilidad llamada distribución de rango estudentizado. La


distribución depende de dos parámetros: m grados de libertad asociados con el numerador y
grados de libertad asociados con el denominador. Sea Qα,m,v el valor crítico α de cola
superior de la distribución de rango estudentizado con m grados de libertad asociados al
numerador y v grados de libertad asociados con el denominador (análogo a Fa,v1,v2).

Qα,k,v √SSE/n
Supóngase, que k=5 y que 2< 5< 4< 1< 3
Entonces
1. Considere en primer lugar la media más pequeña 2.Si 5- 2≥w, prosiga al paso 2. Sin
embargo, si 5- 2<w, conecte estas primeras dos medias con un segmento de línea. Luego si
es posible extienda este segmento de recta más a la derecha de la i más grande que difiera
de 2 , en menos de w (de modo que la recta pueda conectar dos, tres o incluso más
medias).
2. Ahora siga con 5 y otra vez extienda el segmento de línea hasta la derecha de la i más
grande que difiera de 5 en menos de w (pude que no sea posible trazar esta línea o
alternativamente puede que subraye sólo dos medias o tres o incluso las cuatro medias
restantes).
3. Continúe con 4 y repita y finalmente continúe con 1.
Ejemplo
 Se realizó un experimento para comparar cinco marcas diferentes de filtros de aceite para
automóviles con respecto a su capacidad de atrapar materia extraña. Sea µ
Ejemplo
Se realizó un experimento para comparar cinco marcas diferentes de filtros de aceite para
automóviles con respecto a su capacidad de atrapar materia extraña. Sea µi la cantidad
promedio verdadera de material atrapado por los filtros marca i (i=1,…,5) en condiciones
controladas. Se utilizo una muestra de nueve filtros de cada marca y se obtuvieron las
siguientes cantidades medias muestrales: 1=14.5, 2=13.8, 3=13.3, 4=14.3 y 5=13.1. La
tabla ANOVA muestra el resumen de la primera parte del análisis. Determine si existe
diferencia significativa y cual de las medias es significativamente diferente, si con F0.05,5,40=2.61,
Ho es rechazada a un nivel de 0.05.

Origen de la Grados de Suma de los Media f


variación libertad cuadrados cuadrática
Tratamientos 4 13.32 3.33 37.84
(marcas)
Error 40 3.53 0.088
Total 44 16.85
Análisis de Varianza con varios factores.
 Efectos de n factores(2 factores por ejemplo A y B)
 El diseño factorial puede ser :
1) Completamente aleatorizado , en el cual las diferentes combinaciones
de tratamiento se arreglan aleatoriamente para todas las unidades
experimentales.
2) Bloque completamente aleatorizado, en el cual las combinaciones de
factores se asignan aleatoriamente a los bloques.
Análisis de varianza de dos factores
 Consideremos el caso de n réplicas de las combinaciones de tratamiento determinadas por α
niveles del factor A y b niveles del factor B. Las observaciones pueden clasificarse por medio de
un arreglo rectangular en el cual los renglones representan los niveles del factor A y las columnas
los del factor B.
A B Total Media

Experimento
1 2 de
… bdos factores con n réplicas.

1 y111 y121 y1b1 T1 .. 1..


y112 y122 y1b2
. . .
. . .
y11n y12n y1bn

2 y211 y221 y2b1 T12..


. y212 y222 y2b2 2..

. . . . . .
. . . . . .
y21n y22n y2bn
a Ta.. a..
ya11 ya21 yab1
ya12 ya22 yab2
Total T.1. T.2. …T.b. T…

Media .1. .2. … .b. ...


 Las observaciones en la ij-ésima celda (ij) constituyen una muestra aleatoria de tamaño n de
una población que se supone tiene distribución normal con media µij y varianza σ2. Todas las
ab poblaciones tienen las mismas varianzas σ2.

Tij= suma de las observaciones en la ij-ésima celda.


Ti..=suma de las observaciones para el iésimo nivel del factor A.
T.j.=suma de las observaciones para el j-ésimo nivel del factor B.
T…= suma de todas las abn observaciones.
ij=media de las observaciones en la ij-ésima celda.
i=media de las observaciones para el i-ésimo nivel del factor A.
.j.= media de las observaciones para el j-ésimo nivel del factor B.
…=media de todas las abn observaciones.
 Cada observación de la tablas puede escribirse en la
forma yijk=µ donde
µij=µ+αi+βj+(αβ)ij

Y entonces yijk= µ + αi+βj+(αβ)ij+εijk. Sobre la cual se imponen las


restricciones

∑i=1:α αi=0, ∑j=1:b βj=0, ∑j=1:α (αβ)jj=0, ∑j=1:b (αβ)jj=0,


Las tres hipótesis a ser probadas son las siguientes:
1. H’o: α1=α2=…=αα=0
H’ 1: al menos una de las αi’s no es igual a cero.
2. H”o: β1= β2=…=βb=0
H”1: al menos una de las βj’s no es igual a cero.
3. Ho”’: (αβ)11=(αβ)12=. . . =(αβ)ab=0
H”’1: al menos una de las (αβ)ij’ s no es igual a cero.
Formación de cuadrados medios
 E(S12)=E[SSA/(a-1)]= σ2 + nb (∑i=1:a αi2)/(a-1)

 E(S22)=E[SSB/(b-1)]= σ2 + na (∑j=1:b βj2)/(b-1)

 E(S32)=E[SS(AB)/((a-1)(b-1))]= σ2 + n (∑i=1:a∑j=1:b (αβ)2ij)/((a-1)(b-1))

 E(S2)=E[SSE/(ab(n-1))]= σ2

Las cuatro estimaciones de σ2 son insesgadas cuando Ho’,H”o y H”’0 son verdaderas.
Para probar la hipótesis Ho’, de que los efectos de los factores A son todos iguales que cero, se
calcula la razón f1=s21/s2 la cual es un valor de la variable aleatoria F1 que tiene una distribución F
con α-1 y ab(n-1) grados de libertad cuando H’ 0 es verdadera.

Se rechaza la hipótesis nula a nivel de significancia α cuando f1>fα[a-1, ab(n-1)].

En forma semejante, para probar la hipótesis H”0, de que los efectos del factor B son todos iguales a
cero, se calcula la relación f2=s22/s2 la cual es el valor de la variable aleatoria F2 que tiene distribución
F con b-1 y ab(n-1) grados de libertad cuando H”0 es verdadera. Esta hipótesis se rechaza en el nivel
de significancia α cuando f2>fα[b-1, ab(n-1)].

Finalmente, para probar la hipótesis H”’ o de que los efectos de interacción son todos iguales que
cero, se calcula la razón f3 = s23/s2, la cual es el valor de la variable aleatoria F3 que tiene la
distribución F con (a-1)(b-1) y ab(n-1) grados de libertad cuando H”’o es verdadera. Se concluye que
la interacción está presente cuando f3>fa[(a-1)(b-1), ab(n-1)].

Es conveniente realizar la prueba de interacción antes de intentar hacer inferencias acerca de los
efectos principales.
Análisis de varianza para el experimento de
dos factores con n réplicas
Fuente de Suma de Grados de Cuadrado f calculada
variación cuadrados libertad medio
Efecto
principal

A SSA a-1 s21=SSA/(a-1) f1=s21/s2

B SSB b-1 s22=SSB/(b-1)


f2= s22/s2
Interacción de
dos factores

AB
SS(AB) (a-1)(b-1) S23=SS(AB)/((a-1)(b-1)) f3= s23/s2
Error
SSE ab(n-1) S2=SSE/(ab(n-1))
Total SST abn-1
 En general las sumas de cuadrados se obtienen construyendo la siguiente tabla de totales:

A B Total

1 2 … b

1 T11 T12 T1b T1 ..


2 T21 T22 T2b T2..
. . . . .
. . . . .
a Ta1 Ta2 Tab Ta..

Total T.1. T.2. …T.b. T…


Fórmulas de cálculo de suma de cuadrados
 SST= ∑i=1:a ∑j=1:b ∑k=1:n y2ijk – (T2…/abn)

 SSA= (∑i=1:a Ti2..)/(bn) - (T2…/abn)

 SSB= (∑j=1:b T.j.2)/(an) - (T2…/abn)

 SS(AB)= [(∑i=1:a ∑j=1:b Tij.2)/n] – [(∑i=1:a Ti..2)/bn]- [(∑j=1:b T.j.2)/an]+ [T2…/abn]

 SSE=SST-SSA-SSB-SS(AB)
Ejemplo
 En un experimento llevado a cabo para determinar cual de tres sistemas de misiles
es preferible, se midió el promedio de consumo de los propulsores para 24
encendidos estáticos. Se utilizaron cuatro tipos diferentes de propulsores. En el
experimento se obtuvieron observaciones duplicadas de promedios de consumo en
cada combinación de los tratamientos. Los datos después de codificarse aparecen
en la tabla. Utilice un nivel de significancia de 0.05 para probar las siguientes
hipótesis: a) H’0 no existe diferencia en las tasas medias de consumo del propulsor
cuando se utilizan diferentes misiles; b) H”0: no existe diferencia en las tasas medias
de consumo de los cuatro tipos de propulsor; c) H”’0: no existe interacción entre
los diferentes sistemas de misiles y los diferentes tipos de propulsor.
Sistema Tipo de impulsor
de b1 b2 b3 b4
misiles
a1 34.0 30.1 29.8 29.0
32.7 32.8 26.7 28.9
a2 32.0 30.2 28.7 27.6
33.2 29.8 28.1 27.8
a3 28.4 27.3 29.7 28.8
29.3 28.9 27.3 29.1
Ejercicios
Experimentos de tres factores
 En un experimento con tres factores A, B y C en niveles a,b y c, respectivamente, en un diseño
experimental completamente aleatorizado. Supóngase de nuevo que se tienen n observaciones
para cada una de las abc combinaciones de tratamiento. Se procederá a esbozar las pruebas
de significancia para los tres efectos principales y las interacciones involucradas.

 El modelo para el experimento de tres factores está dado por:

yijkl=µ+αi+βj+γk+(αβ)ij+(αγ)ik+(βγ)jk+(αβγ)ijk+εijkl,

i=1,2,…a;j=1,2,…,b;k=1,2,…,c y l=1,2,…,n, donde αi, βj y γk son los efectos principales; (αβ)ij,


(αγ)ik y (βγ)jk, son los efectos de la interacción de dos factores que tienen la misma
interpretación que en el experimento de dos factores.

(αβγ)ijk recibe el nombre de efecto de interacción de tres factores.


Notación
T…=suma de todas las abcn observaciones.
Ti…=suma de las observaciones para le nivel i-ésimo del factor A.
T.j.=suma de las observaciones para el nivel j-ésimo del factor B.
T..k.=suma de las observaciones para el nivel k-ésimo del factor C.
Tij..=suma de las observaciones para el nivel i-ésimo de A y el nivel j-ésimo de B.
Ti.k.=suma de las observaciones para el nivel i-ésimo de A y el nivel k-ésimo de C.
T.jk.=suma de las observaciones para el nivel j-ésimo de B y el nivel k-ésimo de C.
Tijk.=suma de las observaciones para la ijk-ésimo combinación de tratamiento ijk.
Tablas recomendadas
A B Total
1 2 … b
1 T11k. T12k. T1b.. T1.k.
2 T21k T22k. T1bk. T2.k.
. . . . .
. . . . .
. . . . .
a Ta1k. Ta2k. Tabk Ta.k.
Total T.1k. T.2k. T.bk T..k.
Tablas recomendadas
A B Total
1 2 … b
1 T11.. T12.. T1b.. T1...
2 T21.. T22.. T2b.. T2...
. . . . .
. . . . .
. . . . .
a Ta1.. Ta2.. Tab.. Ta...
Total T.1.. T.2.. T.b. T….
Tablas recomendadas
A C Total
1 2 … c
1 T1.1. T1.2. … T1.c. T1...
2 T2.1 T2.2. … T2.c. T2...
. . . . .
. . . . .
. . . . .
a Ta.1. Ta.2. … Ta.c. Ta...
Total T.1.. T..2. … T..c. T….
Tablas recomendadas
B C Total
1 2 … c
1 T.11. T.12. … T.1c. T1...
2 T.21. T.22. … T.2c. T2...
. . . . .
. . . . .
. . . . .
b T.b1. T.b2. … T.bc. T.b...
Total T..1. T..2. … T..c. T….
Suma de cuadrados y Análisis de varianza
de 3 factores y n réplicas
Ejemplo
 En la producción de un material en particular interesa tres variables: A el efecto del operador (tres
operadores), B el catalizador utilizado en el experimento (tres catalizadores) y el tiempo C de lavado del
producto en seguida del proceso de enfriamiento (15 y 20 minutos). Se realizan tres pruebas en cada
combinación de factores. Se pensó que se debían estudiar todas las interacciones entre los factores. Los
resultados codificados son los siguientes: Realice el análisis de varianza para probar los efectos
significativos.
A Tiempo de lavado, C
15 minutos 20 minutos
B B
1 2 3 1 2 3
1 10.7 10.3 11.2 10.9 10.5 12.2
10.8 10.2 11.6 12.1 11.1 11.7
11.3 10.5 12.0 11.5 10.3 11.0

11.4 10.2 10.7 9.8 12.6 10.8


2 11.8 10.9 10.5 11.3 7.5 10.2
11.5 10.5 10.2 10.9 9.9 11.5

13.6 12.0 11.1 10.7 10.2 11.9


3 14.1 11.6 11.0 11.7 11.5 11.6
14.5 11.5 11.5 12.7 10.9 12.2
C B Total
15 1 2 3
minutos
A
1 32.8 31.0 34.8 98.6
2 34.7 31.6 31.4 97.7
3 42.2 35.1 33.6 110.9
Total 109.7 97.7 99.8 307.2

C B Total
20 1 2 3
minutos
A
1 34.5 31.9 34.9 101.3
2 32.0 30.0 32.5 94.5
3 35.1 32.6 35.7 103.4
Total 101.6 94.5 103.1 299.2
A B Total
1 2 3
A
1 67.3 62.9 69.7 199.9
2 66.7 61.6 63.9 192.2
3 77.3 67.7 69.3 214.3
Total 211.3 192.2 202.9 606.4

A C Total
1 2
A
1 98.6 101.3 199.9
2 97.7 94.5 192.2
3 110.9 103.4 214.3
Total 307.2 299.2 606.4
A C Total
1 2
A
1 98.6 101.3 199.9
2 97.7 94.5 192.2
3 110.9 103.4 214.3
Total 307.2 299.2 606.4
SST= 10.72+10.82+…+12.22 - (604.42/54)=

SSA={(199.992+192.22+214.32)/18} - (604.42/54)=

SSB={(211.32 + 192.22 + 202.92)/18} - (604.42/54)=

SSC= {(307.22+299.22)/27} - (604.42/54)=

SS(AB)=

SS(AC)=

SS(BC)=

SS(ABC)=

SSE=

Vous aimerez peut-être aussi