Vous êtes sur la page 1sur 28

Por: Percy F. Velasquez C.

 Identificar los elementos de la inferencia estadística y su importancia en los


diseños experimentales.
 Explicar el papel de las distribuciones de probabilidad en la inferencia
estadística.
 Describir las pruebas para la media, varianza y una proporción, así como los
conceptos básicos de prueba de hipótesis.
Una población o universo es una colección o
totalidad de posibles individuos, especímenes,
objetos o medidas de interés sobre los que se
hace un estudio. Las poblaciones pueden ser
finitas o infinitas

Población (toda la producción del mes) Muestra (representativa de la


producción del mes)
Aleatoriamente

PARAMETROS
(siempre desconocidos)

ESTADISTICOS
(conocidos)

Inferencia

Figura 2.1. Relación entre población y muestra, parámetros y estadísticos.


POBLACION INFINITA
POBLACION FINITA
tenemos que asumir que tenemos una población grande pero finita.
 Un asunto importante será lograr que las muestras sean representativas, en el sentido de
que tengan los aspectos clave que se desean analizar en la población. Una forma de
lograr esa representatividad es diseñar de manera adecuada un muestreo aleatorio
(azar), donde la selección no se haga con algún sesgo en una dirección que favorezca la
inclusión de ciertos elementos en particular, sino que todos los elementos de la
población tengan las mismas oportunidades de ser incluidos en la muestra
 Existen varios métodos de muestreo aleatorio, por ejemplo:
- El simple
- El estratificado,
- Muestreo sistemático
- Conglomerados
cada uno de ellos logra muestras representativas en función de los objetivos del
estudio y de ciertas circunstancias y características particulares de la población
 El objetivo de la inferencia estadística es hacer afirmaciones validas acerca de la
población o proceso con base en la información contenida en una muestra. Estas
afirmaciones tienen por objetivo caracterizar mejor a la población y, en muchos
casos, coadyuvar en la toma de decisiones. La inferencia estadística por lo general
se divide en estimación y prueba de hipótesis, y se apoya en cantidades o datos
estadísticos calculados a partir de las observaciones en la muestra.
 Objetivos de aprendizaje
 Explicar los elementos de los diseños completamente al azar y el análisis de
varianza.
 Describir las diversas pruebas de rango múltiples y la comparación por contrastes
 Verificar los supuestos del modelo estadístico.
 Es el más simple de todos los diseños que se utilizan para comparar dos o más
tratamientos, dado que solo considera dos fuentes de variabilidad: los tratamientos
y el error aleatorio, este diseño se llama completamente al azar porque todas las
corridas experimentales se realizan en orden aleatorio. De esta manera, si durante
el estudio se hacen en total N pruebas, estas se corren al azar de manera que los
posibles efectos ambientales y temporales se vayan repartiendo equitativamente
entre los tratamientos.
 El Diseño Completamente al Azar, es aquel en el cual los tratamientos son
asignados en forma aleatoria a las unidades experimentales, o viceversa, sin
ninguna restricción, por lo tanto, se considera que es un diseño eficiente cuando
las unidades experimentales de los que se dispone son muy homogéneas. Debido
a su simplicidad, el Diseño Completamente al Azar es usado frecuentemente
cuando el objetivo es comparar más de dos tratamientos
 3.1 Características del diseño:
 Los tratamientos se distribuyen en forma aleatoria en todas las unidades
experimentales, y el número de repeticiones o unidades por tratamiento puede
ser igual o diferente.
 Este diseño es útil cuando las unidades experimentales tienen una variabilidad
uniformemente repartida.
 El diseño completamente al azar proporciona el máximo número de grados de
libertad para la estimación del error experimental; además, no requiere estimar
datos faltantes, es decir, el diseño puede analizarse con diferente número de
repeticiones por tratamiento.
 En este diseño las observaciones Yij se podrán describir con el modelo estadístico
lineal dado por:

𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗
𝑖 = 1, 2, … , 𝑡
ቊ
𝑗 = 1, 2, … , 𝑟

Dónde 𝝁 es el parámetro de escala común a todos los tratamientos, llamado media global, 𝝉𝒊 es un
parámetro que mide el efecto del tratamiento i y 𝜺𝒊𝒋 es el error atribuible a la medición Yij. Este
modelo implica que en el modelo completamente al azar actuaria a lo más dos fuentes de variabilidad,
los tratamientos y el error aleatorio. La media global 𝝁 de la variable independiente no se considera
una fuente de variabilidad por ser una constante común a todos los tratamientos, que hace las veces de
punto de referencia con respecto al cual se comparan las respuestas medias de los tratamientos
 figura 3.1, si la respuesta media de un tratamiento particular 𝝁i, es “muy diferente”de la
respuesta media global 𝝁, es un síntoma de que existe un efecto de dicho tratamiento.

Figura 3.1 Separación de la variación total en sus componentes en un DCA


 VENTAJAS:
 Es simple de planificar.
 El número de repeticiones puede variar de tratamiento a tratamiento.
 Existe más grados de libertad para estimar el error experimental.
 Es flexible en cuanto al número de repeticiones y tratamientos.
 Es útil cuando las unidades experimentales tienen una variabilidad uniforme repartida.
 Cuando se pierde alguna parcela experimental se puede considerar que se tenía
diferente número de repeticiones por tratamiento.
 El error experimental puede obtenerse separadamente para cada tratamiento para
comprobar la suposición de Homogeneidad del error.
 DESVENTAJAS:
 Es más apropiado para pequeño número de tratamientos y para un material
experimental homogéneo y uniformemente distribuido.
 No se puede controlar el Error experimental, por lo tanto, no es un Diseño muy preciso.
 Cuando se tiene diferente número de repeticiones por tratamiento, es necesario
calcular un Error estándar por cada pareja de medias si se quiere comparar sus
diferencias.
 El análisis de varianza (ANOVA) es la técnica central en el análisis de datos
experimentales. La idea general de esta técnica es separar la variación total en las
partes con las que contribuye cada fuente de variación en el experimento. En el
caso del DCA, se separan la variabilidad debida a los tratamientos y la debida al
error. Cuando la primera predomina “claramente” sobre la segunda, es cuando se
concluye que los tratamientos tienen efecto (figura 3.1 b), o dicho de otra manera,
las medias son diferentes. Cuando los tratamientos no dominan (contribuye igual
o menos que el error), se concluye que las medias son iguales (figura 3.1 a).
Representación de la medias y de los efectos de los tratamientos en el DCA
 Hipótesis a probarse es:
 Ho: 𝜏𝑖 = 0
 Ha: 𝜏𝑖 ≠ 0 (al menos uno de los tratamientos es diferente de los otros)
 Nivel de significancia: α= 0.05 ó α= 0.01
𝐶𝑀𝑡𝑟𝑎𝑡
 Estadística de prueba: 𝐹𝑐 =
𝐶𝑀𝑒𝑟𝑟𝑜𝑟

 Regla de decisión:
𝑛
 Si Fc ≤ 𝐹𝑛21,𝛼 , no se rechaza la Ho:
𝑛
 Si Fc > 𝐹𝑛 1,0.05 , se rechaza la Ho, representándose por un asterisco (*), lo cual
2
significa que la prueba es significativa.
𝑛
 Si Fc > 𝐹𝑛 1,0.01 , se rechaza la Ho, representándose por dos asterisco (**), lo cual
2
significa que la prueba es altamente significativa.
 Conclusiones
 En un Centro de Investigación se realiza un estudio para comparar varios
tratamientos que al aplicarse previamente a los frijoles crudos reduzcan su tiempo
de cocción. Estos tratamientos zona base de bicarbonato de sodio (NaHCO3) y
cloruro de sodio o sal común (NaCl). El primer tratamiento (T1) es el control, que
consiste en no aplicar ningún tratamiento. El tratamiento (T2) es el remojo en agua
con bicarbonato de sodio, el T3 es en agua con sal común y el T4 es en agua con
una combinación de ambos ingredientes en proporciones iguales. La variable de
respuesta es el tiempo de cocción en minutos. Los datos se muestran en la
siguiente tabla:
 Conclusión: Se encontró diferencia estadística altamente significativa (P≤0.01)
entre los tratamientos (control, bicarbonato de sodio, cloruro de sodio, agua con sal
con combinación de ambos ingredientes), esto implica que el tiempo de cocción
en minutos son diferentes, esto nos obliga a realizar la prueba post ya que el ANVA
es significativo, y así obtener conclusiones verdaderas para tomar una decisión
adecuada.
 Conclusión: Todo los tratamientos son diferentes con respecto al grupo control o
testigo.