Vous êtes sur la page 1sur 119

UNIVERSIDAD AUTONOMA

GABRIEL RENE MORENO


FACULTAD DE CIENCIAS DE LA
SALUD UNIDAD DE POSTGRADO

Santa Cruz, Bolivia
Septiembre 2011
Estadstica y Principales Diseos
Experimentales
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
INTRODUCCION
El crecimiento constante de la poblacin ha trado como consecuencia ms requerimientos de
alimentos, servicios, espacio, etc., y paralelo a ello una serie de alteraciones que estn repercutiendo de
forma negativa en la poblacin y otras, en s, en la vida misma en el planeta.
Entre otras, lo anterior conlleva a la bsqueda de nuevas alternativas, al planteamiento de diferentes
estrategias de manera que se busca darle respuestas a las progresivas necesidades de la sociedad.,
es decir, existe una bsqueda constante de nuevas verdades, mediante mtodos claros y
especficos, con el fin de crear nuevos hechos y principios en cualquier campo del conocimiento
humano. A esto se le denomina INVESTIGACIN.
La investigacin comienza con la observacin de un fenmeno que captura la atencin
del investigador (Todo investigador debe conocer el problema, enamorarse de problema y casarse
con el problema), al cual el investigador trata de dar una explicacin lo ms acertada posible,
determinar las relaciones con otros fenmenos, etc.
El hecho de buscar explicaciones, relaciones de causalidad que existen entre los fenmenos en la
naturaleza, en muchos casos es difcil lograrlo si no se est en condiciones que pueden ser
controladas por el investigador. Lo anterior conlleva a tratar de simular el fenmeno en
condiciones adecuadas, lo cual se logra mediante la EXPERIMENTACIN.
La experimentacin es instrumento de vital importancia pa r a l a i nve st i gac i n ya que
por me di o de e l l a, el investigador es capaz de simular un fenmeno de inters, lo que
conduce a una investigacin ms rpida, efectiva, de menor riesgo, menor costo y con un rigor
cientfico, siempre y cuando exista una previa y exhaustiva planificacin de la misma.
Existen diferentes tipos de investigaciones que pueden generar conocimientos ya sean stas
bsicas, aplicadas o bien de innovacin tecnolgica; independientemente del conocimiento
que genere una investigacin o del problema que sta resuelva, sta tiene que someterse
a una valoracin cientfica. Para esto la estadstica ofrece herramientas como los DISEOS
EXPERIMENTALES de los cuales el investigador se val e para demost rar sus
conj et uras, acept ar o no una hiptesis, comparar resultados, emitir conclusiones etc.,
acerca del problema o fenmeno en estudio.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Previo a la aplicacin de los diseos experimentales, el investigador debe tener una base
estadstica que le permita o facilite la aplicacin e interpretacin de resultados al aplicar los
diseos experimentales en la investigacin. Es por ello que antes de desarrollar la parte de diseos,
se exponen lo bsico de Estadstica Descriptiva y una parte de Estadstica Inferencial como es
hiptesis.
"Las teoras basadas en ideologas carecen de experimentacin, y por ello, no son ciencia, lo que
no se demuestra con experimento es poltica. Lo que se demuestra con experimentacin, es
ciencia (Robert Laughlin, Premio Nobel de Fsica 1998).
"La verdadera ignorancia no es la ausencia de conocimientos, sino el hecho de rehusarse a
adquirirlos" (Karl Popper)
Ing. M.Sc. Francisco Martnez Solaris

Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior











































APUNTES SOBRE MTODOS ESTADISTICOS

Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Generalmente cuando se escucha la palabra Estadstica inmediatamente se piensa en datos,
cuadros, grficos, etc. En verdad no es una idea equivocada, sino ms bien, una idea popular
de sta, pero no es lo nico y en la concepcin de la Estadstica Moderna tampoco el ms
importante.
Las primeras tcnicas estadsticas consistan principalmente en la organizacin, presentacin
grfica y el clculo de ciertas cantidades "sobresalientes de un grupo de datos. Esta parte de la
disciplina es lo que, en la terminologa moderna, se conoce como Estadstica Descriptiva.
La Estadstica Descriptiva es la rama ms antigua de la Estadstica y tiene por objetivo,
presentar informacin de una manera sencilla y esttica y que al mismo tiempo, sea
aprehensible al ojo humano, es decir, fcil de entender. Aunque su campo de accin se ha
visto reducido, es indudable su utilidad. Para que la Estadstica Descriptiva cumpla su
cometido utiliza tres mtodos, Mtodos Tabulares, Mtodos Grficos y Mtodos Numricos.
Supngase ahora, que se est interesado en saber cul es el ingreso promedio de las personas
que tienen pensin en el mercado los Pozos, de Santa de la Sierra, Bolivia. Supngase adems,
que este sector ha crecido de tal forma que se hace imposible estudiarlas en su totalidad. Por
tal razn se deduce una muestra de esta poblacin por cualquier mecanismo aleatorio y se
realiza la toma de la informacin deseada y se obtiene un dato promedio cualquiera, por
ejemplo, Bs 550. A travs del mtodo de razonamiento que conduce a una extensin de este
resultado a la poblacin de inters, se podra concluir que las personas que tiene pensiones en
dicho mercado, tiene un ingreso promedio de Bs 550.
El mismo hecho de que se est estudiando una fraccin de la poblacin, indica que se tiene
una informacin incompleta y que es, lo comnmente que pasa en la realidad; pero, qu pasa
si el azar proporcion las personas con pensiones que venden ms o bien que venden menos?.
Si se da el primer caso se estara sobreestimando y en el caso contrario subestimando el
ingreso promedio de estas personas. En este momento surge una duda sobre la informacin
que en Estadstica Moderna se la conoce generalmente como Incertidumbre y que siempre
estar presente en conclusiones que se deriven por medio del mtodo inductivo.
Ahora la pregunta que surge es la siguiente, qu papel juega la Estadstica en esto?. El papel
de la Estadstica en este proceso es cuantificar la incertidumbre y la rama de la estadstica que
se encarga de ello se le llama Estadstica Inferencial que utiliza el mtodo Probabilstico.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
En conclusin ya sea porque la se dispone de informacin incompleta, o debido a la propia
variabilidad de la informacin (naturaleza), es muy comn que se arribe a conclusiones a
travs del mtodo inductivo, en el cual las mismas son inciertas. El conjunto de tcnicas que
permite realizar inducciones en las que el grado de incertidumbre es cuantificable, integran la
rama de la Estadstica conocida como Inferencia Estadstica o Estadstica Inductiva o
Inferencial.

POBLACIN, ATRIBUTOS Y VARIABLES
Se dice que los estadsticos extraen datos de las muestras y que esta informacin les sirve para
hacer inferencia sobre la poblacin que la muestra representa. Es as que, los trminos,
muestra y poblacin se consideran relativos.
El concepto de poblacin va a variar de acuerdo al campo de la ciencia donde se aplique.
Desde un punto de vista estadstico, poblacin; es el conjunto de resultados potenciales de un
experimento aleatorio, es decir, todos los valores que puede tomar una caracterstica
(variable).
En palabras ms sencillas se puede decir que poblacin, es un conjunto de entes con
caractersticas propias que los diferencian de otras. Con este concepto se puede tener una
poblacin de rboles, de sillas, de tizas, etc. Un aspecto importante a retomar es que desde el
punto de vista estadstico una poblacin es importante cuando se requiere verificar (medir)
una caracterstica (variable) en ella.

Atributos
Supngase el siguiente ejemplo. Se tiene en un aula de clase un grupo de 20 estudiantes y
suponga adems, que el estudiante de la primera fila es alto, color de piel blanca, cabello
castao, ojos claros, etc. Si a los 20 estudiantes se les considera como una poblacin, se puede
decir que los detalles antes mencionados corresponden a caractersticas propias de un
miembro de esa poblacin, o sea, son atribuciones propias del estudiante en particular.
Con el ejemplo antes citado, se puede tratar de deducir un concepto de Atributo, diciendo que
es una caracterstica propia de cada elemento de una poblacin.
Variable
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Retomando el ejemplo anterior, supngase ahora, que se les pregunta a los cinco primeros
estudiante su estatura los cuales responden de la siguiente manera:
1.76, 1.69, 1.83, 1.72, 1.77
De hecho estas alturas corresponde a atributos de los cinco primeros estudiante. Si se observan
los datos anteriores, se puede constatar que el atributo estatura cambia de un estudiante a otro.
Con esta idea se puede plantear un concepto de variable.
Variable es un atributo medible que cambia de un elemento a otro de la poblacin, es decir, es
toda caracterstica que cambia y que est sujeta a medida o cuenta.
Supngase ahora, que los cincos primeros estudiantes poseen la misma altura, ejemplo, 1.73.
Dado que el atributo altura en este caso no cambia, no se puede considerar como una variable,
pero s, es un atributo. De lo anterior se puede concluir, que una variable siempre ser un
atributo, pero un atributo no siempre es una variable.
Las variables siempre se denotan por la letras maysculas del alfabeto y los valores que toman
(observaciones) con letras minsculas.

ELEMENTOS DE LAS VARIABLES
Siempre que se desee constatar una variable en un elemento de la poblacin de inters, sta
debe de poseer cuatro elementos:
a.- Nombre
b.- Definicin
c.- Conjunto de categoras o valores que puede tomar la variable
d.- Procedimiento que permita clasificarla

Nombre
Cuando un investigador toma los datos correspondiente a una variable, ste tiene que saber el
nombre de la variable, de lo contrario cmo va a tomar informacin de una variable si no sabe
el nombre de sta. En si el nombre est referido a cmo se conoce o se nombra la variable en
el campo del conocimiento que corresponde.


Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Definicin
Viene a ser la esencia de la variable. Todo investigador tiene que definir la (s) variable (s) que
va a estudiar. Este nombre es cmo se concibe la variable en el campo de la ciencia
correspondiente, es decir, cmo se define. Si el concepto no existe, se debe construir el
constructo por parte de investigador.
Por ejemplo, supngase que un investigador est tomando el peso a un grupo de nios, l toma
los datos cuando los nios no han desayunado y sin ropa alguna. Este investigador tiene que
reportar al momento de dar a conocer la informacin cmo lo hizo porque quizs otro
investigador lo puede haber tomado con ropa y despus de desayunar. Inclusive debe de
especificar el equipo con el cual verific el valor de la variable en los elementos de la
poblacin estudiados dado que pueden variar en precisin.
Conjunto de categoras o valores que puede tomar la variable
No es ms que el ser de la variable. Esta se refiere a las categoras convencionalmente
admitida por la sociedad. Por ejemplo; si en un grupo de personas se mide la variable sexo, de
hecho se refiere al sexo anatmico y no al comportamiento sexual, por lo tanto las categoras
que puede tomar son masculino femenino o bien macho hembra.
Si la variable es edad, entonces segn el estado donde se mida puede ser das, semanas,
meses, aos.
Procedimiento que permita clasificarla
Este elemento de las variables en muchos casos es muy complejo, pero se soluciona en parte si
existe una adecuada definicin de la variable que el investigador desee medir. Si se retoma el
ejemplo anterior donde se quiere medir la variable sexo en un grupo de personas. En este caso
la variable se define como sexo anatmico de cada persona que componen al grupo. Ahora
bien, el hecho de que una persona diga que es de sexo masculino no implica que no sea
homosexual, pero no es la conducta sexual la que se est midiendo, sino el sexo anatmico.
Por tal razn, aunque este elemento de la variable es complejo, con una definicin clara de lo
que se desea medir se resuelve.
De acuerdo a los valores que puede tomar una variable, sta se puede clasificar en:
Variables cualitativas: no se pueden medir numricamente, representan caractersticas de las
variables (categoras, por ejemplo: nacionalidad, color de la piel, sexo).
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos
anuales).
Por su parte, las variables cuantitativas se pueden clasificar atendiendo a los valores que
pueden tomar en discretas y continuas:
Discretas: Son todas aquellas que toman valores que se pueden contar, es decir, que se pueden
enumerar (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3...., etc, pero,
por ejemplo, nunca podr ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehculo puede ser 80.3 km/h, 94.57 km/h..., etc.

ESCALAS DE MEDICIN

Medir una variable significa constatar la observacin en los elementos de la poblacin que es
objeto de estudio, es decir, consiste en verificar que valor toma la variable en la unidad de
anlisis. Lo anterior implica que para medir una variable, sta tiene que ser observable en el
mundo real, manteniendo el principio fundamental de la construccin de una variable que
consiste en que sus categoras deben de ser totalmente inclusivas y mutuamente excluyentes.
En Estadstica se definen cuatro niveles o escalas de medicin las cuales son:

a.- Escala Nominal: En esta escala lo nico que puede decirse de una observacin es a cul
de un cierto nmero de categoras pertenece.
En esta escala de medicin la nica relacin que puede establecerse entre observaciones es la
de igualdad y por lo tanto de desigualdad. Dos observaciones son iguales si estn en la misma
categora (llamadas tambin clases) y diferente si no lo estn. Como consecuencia de lo
anterior, la nica estadstica vlida para este tipo de datos es la frecuencia de cada clase.
Ejemplo, supngase que en grupo de personas se desea medir el estado de salud con respecto a
una enfermedad en particular. En este caso la constatacin de la variable (medicin) en los
miembros de la poblacin debe de concluir en que estn o no afectados por la enfermedad.

b.- Escala Ordinal: Las observaciones medidas en esta escala pueden ordenarse de menor a
mayor, y en consecuencia no slo se admiten las relacin de igualdad, sino adems la de
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
mayor qu y menor que. Muchos de los estudios realizados en las Ciencias Sociales producen
observaciones que son medidas bajo esta escala, por lo difcil que es medir actitudes en los
seres humanos.
En esta escala adems de calcularse frecuencias como en la escala nominal, se puede calcular
una medida de tendencia central llamada Mediana.
Un ejemplo clsico de esta escala es la jerarquizacin que existe en la iglesia y el ejrcito.
Coronel > Teniente > Subteniente > Sargento > Cabo > Soldado
c.- Escala de Intervalo: Con observaciones en esta escala no slo se pueden ordenarse las
observaciones, sino que adems puede definirse una unidad de distancia (puede ser arbitraria)
entre ellas. La principal diferencia de esta escala con la de Proporciones es que en la escala de
Intervalo el cero y la unidad de distancia son arbitrarios y, en particular, el cero no
corresponde a una caracterstica fsica de las unidades de medidas. Un ejemplo clsico en esta
escala es la medicin de la temperatura.
Dado que los requisitos indispensables para efectuar sumas y productos son que existan ceros
y una unidad de distancia, con las observaciones medidas bajo esta escala puede calcularse
medidas de tendencia central como la media y de dispersin como la varianza. Por tal razn
esta escala es ms fuerte que la Nominal.
b.- Escala de Proporcin o Razn: En esta escala las observaciones pueden ordenarse y
existen un cero y una unidad de distancia que son inherentes al sistema, es decir, que no son
arbitrarios. Ejemplos tpicos de caractersticas medidas en esta escala el peso de un individuo,
el rendimiento por hectrea de una planta, etc. Esta es la escala de medicin ms fuerte que
existe y por lo tanto permite el clculo de cualquier estadstica.

ORGANIZACIN DE LA INFORMACIN

Resulta de mucha importancia en el campo de la investigacin, utilizar tcnicas que permitan
apreciar de una forma rpida y fcilmente aprehensible un tipo de informacin donde se
resalten los aspectos ms importantes. Estas tcnicas o mtodos debern poseer caractersticas
o propiedades que faciliten lo antes mencionado. Entre estas propiedades se pueden mencionar
las siguientes:
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
1. Que proporcionen la mxima cantidad de informacin contenida en los datos en forma
rpida y fcil de visualizar.
2. Que posean sencillez operativa
3. Que permitan presentar los datos de una manera esttica.
La Estadstica Descriptiva, como se ha mencionado antes, tiene como propsito mostrar la
informacin de forma sencilla, es decir, entendible. Para ello hace uso de tres mtodos los
cuales son: Mtodos Tabulares y Grficos y Mtodos Numricos. Entre los mtodos tabulares
estn las Tablas de Frecuencias o Tablas de Distribucin de Frecuencias.
NOTACIN DE SUMATORIA. PROPIEDADES
Supngase que la variable X, toma los valores de x1, x2, x3, ..., xn. Entonces, la suma de los
valores xi de la variable X sera: x1 + x2+ x3 +... xn.
Con el objeto de expresar esta suma de una manera ms resumida, se hace uso de la letra
griega Sigma mayscula (), la cual es el smbolo utilizado en matemticas para indicar la
suma, de tal manera que:

; donde:
i=1 se lee como la suma de i=1 a i=n de x, lo cual indica que la variable x toma valores para
i=1, 2, 3, ..., n, o sea:



i se llama ndice de suma y es una variable que toma los valores 1, 2, 3, ..., n.
La expresin i=1 indica en este caso que 1 es el valor inicial de i (no siempre el valor inicial
comienza de 1).
La n arriba del signo, indica el ltimo valor de i.
A xi se le llama sumando
Propiedades de la sumatoria
Sean x1, x2,..., xn y y1, y2,..., yn dos conjuntos de datos, y a y b dos constantes
arbitrarias. Entonces:
1.


2. ( )


Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
3.


4. ( )


5. ( )



La demostracin de cada una de estas propiedades se deja como prctica para el estudiante.


Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
METODOS TABULARES
Tablas de Frecuencias Relativas y Absolutas
Como una antesala de lo que son tablas de frecuencias relativas y absolutas se menciona a
continuacin las formas iniciales de presentacin de informacin, sus ventajas y desventajas
de tal manera que el estudiante comprenda la lgica de cada uno y por qu se usa una en vez
de otra.
Una de las primeras formas de presentacin de informacin es el arreglo de los datos el cual es
una de las formas ms sencillas de presentar datos. Pone los valores en orden ascendente o
descendente. Por ejemplo, a continuacin se muestran las concentraciones de cloro en partes
por milln (ppm) de 30 galones de agua tratada.
Concentraciones de cloro en ppm de 30 galones de agua tratada
15.6 16.2 15.8 15.8 15.8 16.3
16.0 15.7 16.0 16.2 16.1 16.8
16.8 16.4 15.2 15.9 15.9 15.9
16.0 15.4 15.7 15.9 16.0 16.3
16.3 16.4 16.6 15.6 15.6 16.9

Una forma sencilla de arreglar estos datos es presentarlos en orden ascendente o descendente.
Si se arreglan de manera ascendente quedaran de la siguiente forma:

15.2 15.7 15.9 16.0 16.2 16.4
15.4 15.7 15.9 16.0 16.3 16.6
15.6 15.8 15.9 16.0 16.3 16.8
15.6 15.8 15.9 16.1 16.3 16.8
15.6 15.8 16.0 16.2 16.4 16.9

Este arreglo de datos ofrece varias ventajas sobre los datos originales o sin arreglar:
- Se pueden localizar rpidamente los valores mnimos y mximos en los datos. En el
ejemplo, el valor mnimo es 15.2 y 16.9 el mximo.
- Los datos se pueden dividir en secciones (clases)
- Fcilmente se puede apreciar que valores se repiten ms de una vez.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Un inconveniente de esta forma de presentacin de informacin es que siempre se sigue
manejando toda la masa de informacin y por lo tanto es muy tedioso emplearla en bases
datos muy grandes. Esto quiere decir, que esta forma de presentacin de informacin no tiene
capacidad de sntesis, de aqu que es preferible presentarlos en Cuadro de distribucin de
frecuencias.
Al nmero de veces que se repite una observacin dentro de una coleccin de datos se le llama
Frecuencia Absoluta (fi). La suma de stas tiene que ser igual al tamao de la coleccin de
datos (fi = n), en este caso 18 + 12 = 30 (total de las observaciones). A la relacin de cada
frecuencia absoluta con respecto al total, se le llama Frecuencia Relativa (fr = fi/fi), la
suma de esta tiene que ser igual a 1 o bien a 100 si se le expresa en porcentaje. Este tipo de
arreglo es importante cuando la coleccin de datos es pequea.
Los datos anteriores arreglados en un cuadro de distribucin de frecuencia se muestran a
continuacin:

xi fi fr xi fi fr
15.2 1 3.33 16.1 1 3.33
15.4 1 3.33 16.2 2 6.67
15.6 3 10.00 16.3 3 10.00
15.7 2 6.67 16.4 2 6.67
15.8 3 10.00 16.6 1 3.33
15.9 4 13.33 16.8 2 6.67
16.0
4 13.33 16.9 1 3.33
Total
18 60.00 Total 12 40.00

Hay autores que consideran la siguiente forma de presentacin de cuadros de frecuencia donde
incluyen elementos que son propios de las Tablas de Frecuencias Absolutas y Relativas. Esto
se muestra a continuacin:





Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior


Variable Frecuencias absolutas Frecuencias relativas
x
i
Simple(fi)
Acumulada
(Fia)
Simple (fr) Acumulada (Fra)
X
1
f
1

f
1

f
r1
= f
1
/ f
i
F
r1

X
2
f
2
f
1
+ f
2
f
r2
= f
2
/ f
i
f
r1
+ f
r2

... ... ...
...
...
X
n-1
f
n-1
f
1
+ f
2
++ f
n-1
f
r-1
= f
n-1
/ f
i
f
r1
+ f
r2
++ fr-1
X
n
f
n
f
i
= n f
rn
= f
n
/ f
i
1 100

Veamos un ejemplo:

Medimos la altura de los nios de una clase con instrumental de precisin y en condiciones
adecuadas, escogiendo a todos sus componentes, 30 sujetos, y obtenemos los siguientes
resultados (m):


Alumno Estatura Alumno Estatura Alumno Estatura
1 1.25 11 1.23 21 1.21
2 1.28 12 1.26 22 1.29
3 1.27 13 1.30 23 1.26
4 1.21 14 1.21 24 1.22
5 1.22 15 1.28 25 1.28
6 1.29 16 1.30 26 1.27
7 1.30 17 1.22 27 1.26
8 1.24 18 1.25 28 1.23
9 1.27 19 1.20 29 1.22
10 1.29 20 1.28 30 1.21


Puesto que todas las tallas estn comprendidas entre 1.20 y 1.30 m., podemos agruparlas por
centmetros formando 11 grupos indicando cuntos nios presentan cada uno de los valores. Si
presentamos esta informacin estructurada (agrupada) en un cuadro de frecuencias
obtendramos la siguiente:

Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Cuadro de frecuencia

Observacin
Frecuencias
fi Fia fr (%) Fra
1.20 1 1 3.33 3.33
1.21 4 5 13.33 16.66
1.22 4 9 13.33 30.00
1.23 2 11 6.67 36.66
1.24 1 12 3.33 40.00
1.25 2 14 6.67 46.66
1.26 3 17 10.00 56.66
1.27 3 20 10.00 66.66
1.28 4 24 13.33 80.00
1.29 3 27 10.00 90.00
1.30 3 30 10.00 100.00
Total
30
100


Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas
veces, entonces conviene agruparlos por intervalos mayores. ya que de otra manera
obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos de
sntesis.
Supongamos que ahora medimos la estatura de los habitantes de una vivienda (tambin 30
personas) y obtenemos los siguientes resultados (m):

Habitante Estatura Habitante Estatura Habitante Estatura
1 1.15 11 1.53 21 1.21
2 1.48 12 1.16 22 1.59
3 1.57 13 1.60 23 1.86
4 1.71 14 1.81 24 1.52
5 1.92 15 1.98 25 1.48
6 1.39 16 1.20 26 1.37
7 1.40 17 1.42 27 1.16
8 1.64 18 1.45 28 1.73
9 1.77 19 1.20 29 1.62
10 1.49 20 1.98 30 1.01
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Los datos son menos homogneos (ms dispersos) que en el caso de los nios de un grupo
escolar (todos de la misma edad) y si presentramos esta informacin en un cuadro de
frecuencia obtendramos 30 lneas (una para cada valor), cada uno de ellos con una frecuencia
absoluta de 1 y con una frecuencia relativa del 3.3%. Esta tabla nos aportara toda
la informacin inicial, pero sera muy difcil de manejar si en vez de 30 personas fueran 300.
3000 o ms: en definitiva, de escaso valor prctico. Lo que quiere decir lo anterior, es que si
bien es cierto que los cuadros de frecuencias tienen ms capacidad de resumir la informacin,
esto no siempre se logra ya que depende de las caractersticas propias de la informacin.
En lugar de ello, podramos agrupar los datos por intervalos llamados tambin Tablas de
Frecuencias Absolutas y Relativas, con lo que la informacin queda ms resumida (se pierde
por tanto algo de informacin), pero es ms manejable e informativa.
Una tabla de frecuencia absoluta y relativa no es ms que la agrupacin de una base de datos
en subgrupos llamados clases o intervalos de clases.
Cada intervalo de clase o clase posee dos elementos, Lmite inferior y Lmite superior. La
semisuma de ambos origina un elemento ms en una tabla de frecuencia absoluta y relativa
denominado Punto medio de clase (PMC) o bien Marca de clase.
El primer tropiezo que se afronta es decidir cuntas grupos o clases debern establecerse y si
stas tendrn la misma anchura. Es recomendable en la prctica utilizar entre 5 y 20 clases
inclusive hay autores que recomiendan hasta 25 clase, y normalmente conviene construirla de
modo que todas las clases tengan la misma anchura. La anchura de clase recibe tambin el
nombre de Intervalo de Clase o bien Amplitud de clase.
Una manera de resolver este problema es utilizar la frmula de Stirling (Sturge) K = 1 + 3.33*
log(n), donde k es el nmero de clases o intervalos que se deben construir. Para el caso en
cuestin sera:
k = 1 + 3.33*log
10
(30) = 5.87. Como se puede recordar que nmero de intervalos viene a ser
una variable cuantitativa discreta, entonces tiene que tomar valores cerrados. De acuerdo a lo
anterior y basado en leyes matemticas se redondea al inmediato superior, es decir, 6. Hay
autores que sugieren siempre esto.
Un segundo problema que se afronta se refiere a la determinacin del Ancho del Intervalo de
Clase. Este problema se resuelve calculando primeramente la diferencia entre el mayor y el
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
menor valor numrico de los datos, llamado tambin Rango, Recorrido o Amplitud (A). En el
caso del ejemplo es: A = 1.98 - 1.01 = 0.97. Esto indica que la suma de las amplitudes de clase
de los intervalos de clase deber cubrir al menos esta diferencia. Si 0.97 se divide entre 6, se
obtiene un resultado de 0.16. Si se multiplica la anchura de clase (Ac) determinada por el
nmero de intervalos K = 6, (al resultado se le llama Rango Ideal) se tiene el siguiente
resultado: 0.16*6 = 0.96. Si se recuerda la amplitud de los datos es de 0.97, por lo tanto esta
anchura de clase (Ac) no es suficiente para cubrirla por tal razn, algunos autores
recomiendan redondearlo al inmediato superior que en este caso sera de 0.17. Repitiendo el
proceso, se tiene que 0.17*6 = 1.02. Un aspecto importante de sealar es que si bien es cierto
que se pasa de 1.98 con 3 centsimas, cubre la amplitud de los datos. Por esto se dice que
Ac*k = al menos debe ser igual a la amplitud de los datos, es decir, no importa si se pasa del
valor mximo.
Un tercer aspecto que hay que resolver es por donde iniciar la construccin de los intervalos
de clases. Para el caso de variables cuantitativas continuas, se habla de una medida de
desplazamiento (MD) que es igual al Rango ideal (RI) menos la Amplitud de los datos (A),
donde RI es igual Ac * k, esto es:
MD = RI A, entonces: MD = [(0.17*6) 0.97]/2 =0.025, o aproximadamente 0.03.
Este es el desplazamiento que debe tener el valor mnimo para iniciar la construccin de los
intervalos. Al construir el primer intervalo, al valor mnimo le restamos el desplazamiento es
decir, 1.01 0.03 = 0.98, ste es el lmite inferior del primer intervalo de clase y su lmite
superior ser 0.98 + Ac, es decir, 0.98 + 0.17 = 115, Para el caso del segundo intervalo de
clase, su lmite inferior es el lmite superior del primer intervalo de clase o sea 115 y el lmite
superior ser 1.15 + 0.17 = 1.32 y as sucesivamente hasta llegar al nmero de intervalos
definidos. Esto es continuidad, ya que no existe ruptura entre intervalos.
Entonces, para este tipo de variable (cuantitativa continua), los intervalos de clases son
abiertos por la izquierda y cerrados por la derecha.
Luego se determina los Puntos Medios de Clase o Marcas de Clase en la segunda columna de
la tabla, esto es: PMC = (Li + LS)/2.
Posteriormente en una tercera columna se determinan las frecuencias absolutas, que en este
caso se define como el nmero de observaciones que caben dentro del intervalo de clase. Para
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
que quepa una observacin dentro de un intervalo de clase en este tipo de variable, ste tiene
que ser mayor que el lmite inferior o menor o igual que el lmite superior.
La tabla antes mencionada quedara de la siguiente forma:


Intervalos de Clase PMC fi fr Fia Fra
0.98 a 1.15 1.065 2 6.67 2 6.67
1.15 a 1.32 1.235 5 16.67 7 23.33
1.32 a 1.49 1.405 8 26.67 15 50.00
1.49 a 1.66 1.575 7 23.33 22 73.33
1.66 a 1.83 1.745 4 13.33 26 86.67
1.83 a 2.00 1.915 4 13.33 30 100
30 100

Para el caso de variables cuantitativas discretas, los intervalos de clases son cerrados por
ambos lados.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
METODOS GRAFICOS

Dentro de las representaciones grficas se pueden mencionar las siguientes:
- Diagrama de puntos
- Pictogramas
- Diagrama de barras sencillas, dobles, mltiples
- Diagrama de sectores torta o pastel (pie)
- Histogramas de frecuencias
- Polgono de frecuencias absolutas relativas
- Polgono de frecuencia acumulada por la izquierda (menor que) u ojiva
- Grficos de lnea, etc.

Para efecto de este texto se desarrollarn los principales como son el Diagrama de Puntos
por su relacin con el Diagrama de dispersin, Histograma de frecuencia, Polgono de
frecuencia, Ojiva y Diagrama de sectores.

Diagrama de Puntos

Sirve para representar grficamente cuadros de frecuencias en las cuales se consideran
nicamente una variable y una cantidad asociada a cada valor de la misma (frecuencias).
Existen dos tipos de diagramas de puntos cuya construccin se detalla enseguida.
La construccin de los diagramas de puntos se realiza de la siguiente manera:
- El primer tipo de diagrama de puntos se construye colocando en el eje horizontal los
valores de la variable y en el eje vertical las cantidades asociadas a stos (frecuencias).
Finalmente, para cada valor de la variable y cada cantidad asociada se dibuja puntos
cuyas alturas corresponde a la magnitud de dicha cantidad.
- Para construir el segundo tipo de diagrama de puntos se colocan en el eje horizontal
los valores de la variable y sobre cada valor se dibuja tantos puntos como veces
aparecen stos.
Para ejemplificar el primer caso se retomar las alturas de los 30 habitantes que han sido
mencionados anteriormente.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
En este caso se puede observar que los valores de la variable altura se encuentran en el eje
horizontal y en el vertical, el nmero de habitantes, y el punto est compuesto por las
coordenadas (altura, Nmero de habitantes con esa altura).


Histograma

Se llama Histograma a la grfica de barras verticales sin espaciamiento entre ellas, construida
colocando en el eje vertical a las frecuencias absolutas relativas y el eje horizontal a los
lmites de clase de una tabla de frecuencias. Lo anterior implica que si los intervalos de clases
son iguales, sobre cada clase se erigen rectngulos cuyas reas son proporcionales a las
frecuencias de clase. Las etapas que se deben de cubrir en la construccin de un histograma
son:
- Colocar en el eje horizontal los lmites de clases
- Colocar en el eje vertical las frecuencias relativas o absolutas.
- Erigir rectngulos cuya base son las clases y su altura las frecuencias que corresponde
a cada clase
Para ejemplificar este mtodo grfico se tomar a la tabla de frecuencia absoluta y
relativa y las frecuencias absolutas asociada a cada clase.

0 0.5 1 1.5 2 2.5
Estatura (mt)
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior



En este caso, dado que se utiliz la frecuencia absoluta para construir el histograma entonces
el histograma toma el nombre de Histograma de Frecuencias Absolutas.

Polgono de Frecuencia

Un polgono de frecuencia es una grfica de lneas rectas que unen los puntos obtenidos al
colocar en el eje horizontal a los valores medios (puntos medios) de clases y en el eje vertical
a las frecuencias absolutas o relativas. Esto equivale a unir los puntos medios de la cara
superior de los rectngulos de un histograma por medio de lneas rectas.
Para cerrar el polgono se adiciona una clase tanto inferior como superior para que el polgono
cierre.

0
1
2
3
4
5
6
7
8
9
F
r
e
c
u
e
n
c
i
a
s

a
b
s
o
l
u
t
a
s

Intervalos de clases
0
1
2
3
4
5
6
7
8
9
F
r
e
c
u
e
n
c
i
a
s

a
b
s
o
l
u
t
a
s

Puntos Medios de Clases
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior

En este caso al igual que el histograma, el polgono retoma el nombre de la frecuencia que se
ha utilizado para construir.

Polgono de Frecuencia Acumulada por la Izquierda o Ojiva

Una Ojiva o Polgono de Frecuencia Acumulada es una grfica construida con segmentos de
lneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los lmites
superiores de clase y en el vertical a las frecuencias acumuladas absolutas o relativas.
Al inicio en el eje horizontal se coloca el lmite inferior de la primera clase y se le asigna una
frecuencia acumulada de cero. Asimismo, por su naturaleza una ojiva es no decreciente.
Retomando como ejemplo la misma tabla de frecuencia absoluta y relativa, se tomarn las
frecuencias absolutas acumuladas por la izquierda o menor que de sta.



Diagrama de Sectores (Torta o pastel)

Este tipo de grfico se utiliza para representar datos cualitativos y cuantitativos discretos. Su
uso ms frecuente es con el propsito de comparar ya sea las categoras que toma una variable
cualitativa o los valores discretos de una variable cuantitativa respecto al total.
Para construir este grfico se utiliza una circunferencia, la cual se divide en sectores de tal
manera que sus medidas angulares centrales y, por ende la superficie del sector circular sean
proporcionales a las magnitudes de los valores de la variable que se trata de representar.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Al total de las frecuencias (fi = n) le corresponde el crculo completo, es decir, los 360
0
de la
circunferencia y por regla de tres simple se determina el nmero de grados que le corresponde
a cada categora o valor discreto en particular.
Ejemplo:
Los datos que se muestran a continuacin corresponden a la distribucin de los docentes de
una universidad en particular, respecto al lugar de realizacin de estudios de diplomados.

Lugar de realizacin del Diplomado n %
Extranjero 19 13.87
Universidad de Inters 87 63.5
Otras universidades bolivianas 31 22.63
Total 137 100

Tratando de representar estos datos en diagrama de sectores se tiene lo siguiente:
Nmero de grados para la categora Extranjero.

=
(19 x 360
0
)
= 49.9 = 50
137

De la manera que quedara de la siguiente forma una vez que se hayan realizado las
operaciones correspondientes:

Lugar de realizacin del Diplomado n Grados
Extranjero 19 50
Universidad de Inters 87 229
Otras universidades bolivianas 31 81
Total 137 360

De forma grfica se vera de la siguiente forma:

Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior




Extranjero
14%
Universidad
de Inters
63%
Otras
universidades
bolivianas
23%
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
MEDIDAS DE TENDENCIA CENTRAL O POSICIN

Como se pudo observar en la unidad anterior los histogramas o distribuciones de frecuencias
presentan formas muy variadas, por lo que no es fcil de comparar dos conjuntos de datos
mediante una inspeccin somera de los histogramas. Por otra parte, una tabla de frecuencia
con 15 a 20 clases puede no ser una representacin suficientemente concisa de los datos. Por
estas razones y por su importancia en posteriores usos es necesario contar con cantidades que
describan sucintamente (rpidamente) el conjunto de datos que se estudia. Son de inters
cantidades que localicen el "centro" de las observaciones (o ms bien de su distribucin de
frecuencias) y la dispersin o variabilidad de las mismas.
A las medidas que localizan el "centro" de los datos se les llama "Medidas de Tendencia
Central" y las que miden la variabilidad de las observaciones se les llama "Medidas de
Dispersin".
Dentro de las medidas de Tendencia Central se pueden mencionar las siguientes:
Media o promedio
Media ponderada
Media Geomtrica
Media Armnica
Media Cuadrtica
Mediana
Moda

Por el grado de aplicabilidad sern desarrollada la siguientes medidas de tendencia central:
media aritmtica, mediana y moda y, como un caso especial de la media aritmtica, la media
ponderada.
Media Aritmtica
Tambin llamada media. Def: La media aritmtica de n observaciones de la variable X se
denotar por , y se define como la suma de ellas dividida por "n". Esto es:



Ejemplo:
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Sean los siguientes datos x1=2, x2=12, x3=9, x4=10, x5=7. La media aritmtica de estos datos
es:


Desde un punto de vista geomtrico, la media aritmtica corresponde al punto de equilibrio de
los datos.
La media aritmtica es la medida descriptiva de tendencia central ms usada. Tiene la ventaj a
de ser fcil de calcular, adems de poseer propiedades tericas excelente desde el punto de
vista de la estadstica inferencia. Su principal desventaja es que, por ser el punto de equilibrio
de los datos es muy sensible a la presencia de observaciones extremas. Por otro lado su
clculo se vuelve tedioso cuando la base de datos es muy grande. Otra desventaja es que no se
puede calcular en datos que tienen intervalos de clases abiertos.
Clculo de la Media Aritmtica en Tablas de Frecuencias
En muchas ocasiones se nos presenta el problema de estimar la media a partir de una tabla de
frecuencias. Esto se da por dos razones:
- Ya se han presentado los datos en forma resumida y no se dispone de las
observaciones originales.
- Cuando se dispone de las observaciones originales, pero su nmero es tan grande que
las operaciones aritmticas necesarias para el clculo de la media requieren de mucho
trabajo. Entonces el uso de una tabla de frecuencias simplifica considerablemente el
trabajo.
Se debe de recordar que cuando se tiene una tabla de frecuencias con k clases se da lo
siguiente:


En una clase se tienen fi observaciones (frecuencia absoluta), las cuales pueden tener
cualquier valor entre el lmite superior e inferior de esa clase. Para calcular de una manera
aproximada la media, se supone que las observaciones se encuentran uniformemente
distribuidas en el intervalo y, por lo tanto, el valor medio de clase (Punto medio de clase o
Marca de Clase) es un valor representativo de esa clase.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Con esta suposicin el clculo de la suma de las observaciones se simplifica de la siguiente
manera:


Esta expresin representara la suma aproximada de las observaciones; por lo tanto, la media
aritmtica se estimara de la siguiente manera:


Todo lo anterior es posible siempre y cuando no se tengan clases abierta en la tabla.

Ejemplo:

Para ejemplificar la media aritmtica para datos tabulados se retomar la tabla de frecuencias
absolutas y relativas que se ha expuesto anteriormente, la cual corresponde a la estatura de 30
personas. Se pide estimar la estatura promedio de estas personas.
Es importante ver que lo que se ha solicitado es una estimacin de la estatura y no una
determinacin ya que en datos lo nico que se puede hacer es una estimacin ya que la
determinacin se la realiza en los datos originales.
Retomando la ecuacin de estimacin de la media aritmtica se tiene lo siguiente:
Intervalos de Clase PMC fi PMC*fi
0.98 a 1.15 1.065 2 2.13
1.15 a 1.32 1.235 5 6.175
1.32 a 1.49 1.405 8 11.24
1.49 a 1.66 1.575 7 11.025
1.66 a 1.83 1.745 4 6.98
1.83 a 2.00 1.915 4 7.66
Total 45.21
Promedio 45.21/30 = 1.507



La estimacin proporcion un valor de 1.507 m/persona. La determinacin del promedio en la
base de datos original, es de 1.513 m/persona. Siempre se observar una diferencia que es
producida por el hecho de que en una tabla de frecuencia lo que se realiza es una estimacin y
no una determinacin. Esta diferencia ser cada vez menor si la medida de desplazamiento
para construir la tabla sea pequea.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Propiedades de la Media Aritmtica

La media aritmtica tiene muchas propiedades sin embargo, solo se expondr una por la
relevancia que tiene a nivel de inferencia y es la siguiente:
- La suma algebraica de las desviaciones de un conjunto de nmeros respecto a su media
aritmtica es cero, es decir: ( )

. Esta es la razn por la cual le media se


la interpreta como el punto de equilibrio de una coleccin de datos numrica y adems,
es por ello que en Estadstica se le conoce como el primer momento.

Mediana
Es el valor de la serie de datos que se sita justamente en el centro de la muestra (un 50% de
valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza
en su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de
veces que se ha repetido).
La mediana (Me) de un conjunto de n nmeros, ordenados de menor a mayor, es el nmero
central en el arreglo. Si n es un nmero non, slo hay un valor central. Si n es un nmero par,
hay dos valores centrales, y la mediana debe tomarse como la media de estos dos valores.
Ejemplo...
1.- Sean la siguiente coleccin de datos: 27, 3.4, 3.2, 3.3, 3.1
El primer paso para determinar la Mediana en datos sin tabular es ordenar los datos en orden
ascendente o descendente de tal forma que:
3.1, 3.2, 3.3, 3.4, 27. Dado que n es un nmero non o impar (n=5), entonces slo hay un valor
central (3.3) y ste es el valor de la mediana.
Me = 3.3
2.- Calcular la mediana para los siguientes datos y ordenados:
151, 152, 153, 158, 162, 167, 167, 167, 168, 173
En este caso n es par (n=10), por lo que hay dos valores centrales, que son 162 y 167.
Entonces partiendo del concepto de Mediana, la Me es la media aritmtica de estos dos
valores ya que antes y despus de ella, no existe ms del 50% de los datos.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Me = (162 + 167)/2 = 164.5. Entonces cuando este sea el caso la Me, se puede determinar de
la siguiente forma:


Cuando los datos son simtricos entre la mediana y la media aritmtica no hay mucha
diferencia; sin embargo, para datos no simtricos es mejor medida de tendencia central la
mediana que la media.
Clculo de la Mediana en datos tabulados
Cuando los datos estn agrupados en clases, es decir, cuando existe una tabla de distribucin
de frecuencias, para estimar la mediana se utiliza la siguiente ecuacin:

( )( )


Donde:
Me = Mediana
a = Lmite inferior de la clase de la Mediana
b = Lmite superior de la clase de la Mediana
c = Frecuencia relativa acumulada una clase antes de la clase de la Mediana
d = Frecuencia relativa de la clase de la Mediana
Como se puede observar todos los insumos requeridos para la determinacin de la Me, estn
en la misma tabla.
Como se ha verificado anteriormente, la mediana es aquella medida de tendencia central que
antes y despus de ella no existe ms del 50% de la informacin, es decir, parte en dos la base
de datos. A partir de esto es que se propuso partir la base de datos en cuatro partes y se le
llam cuartiles, luego en 10 parte y se les llam deciles y luego en 100 partes y se les llam
percentiles. A todo esto se llaman Fractiles, los cuales no se desarrollan en el presente
documento pero si se recomienda revisar cualquiera de la obras citadas al final de este
documento para verificar esta informacin.

Moda
La Moda (Mo) de un conjunto de datos es la observacin o valor (si existe) que ocurre con
mayor frecuencia. Si es un valor nico se dice que la distribucin de frecuencias es unimodal.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Si se tienen dos o ms valores con la misma frecuencia mxima se dice que la distribucin es
bimodal, trimodal, etc. Ejemplo: sean los siguientes datos las calificaciones de un examen:
10, 7, 8, 7, 9, 8, 7, 9.
En este caso la calificacin que ms se repite es 7 ya tiene una frecuencia fi =3, por lo tanto la
Mo es 7.
Sean los siguientes datos:
10, 6, 7, 4, 13, 16, 18
Como se puede observar en estos datos todos tienen una frecuencia absoluta igual a 1, por lo
tanto no tiene moda este conjunto de datos. Las distribuciones de este tipo se les llaman
uniformes.
Sean los datos: 4, 3, 4, 7, 2, 7, 5, 4, 7, 5, 9, 7, 4
Aqu se puede observar que los valores numricos con mayor e igual frecuencia son los
valores 4 y 7 por lo tanto la moda de estos datos es 4 y 7, o sea que una distribucin bimodal.
Cuando los datos se encuentran organizados en Cuadros de frecuencia, la Mo es el valor que
tiene la mayor frecuencia absoluta. Ejemplo:
Los datos que se muestran a continuacin, corresponden a la estatura de 30 personas que
conformaron una muestra. Segn el cuadro de frecuencia donde se presenta esta informacin,
existen 3 valores que tienen la mayor frecuencia absoluta. Estos son 1.21, 1.22 y 1.28 con fi =
4; por lo tanto existen 3 Modas. stas son: 1.21, 122 y 1.28 m, por lo tanto la distribucin es
trimodal.

Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Observacin
Frecuencias
fi fia fr (%) Fra
1.20 1 1 3.33 3.33
1.21 4 5 13.33 16.66
1.22 4 9 13.33 30.00
1.23 2 11 6.67 36.66
1.24 1 12 3.33 40.00
1.25 2 14 6.67 46.66
1.26 3 17 10.00 56.66
1.27 3 20 10.00 66.66
1.28 4 24 13.33 80.00
1.29 3 27 10.00 90.00
1.30 3 30 10.00 100.00
Total 30 100

Cuando la informacin se encuentra organizada en una tabla de frecuencias absoluta y relativa,
la Mo se puede estimar a travs de la siguiente ecuacin:


()
() ()

Donde:
Mo = Moda
Licm = Lmite inferior de la clase modal
Acm = Amplitud de clase de la clase modal
ficm =Frecuencia absoluta de la clase modal
ficprem = Frecuencia absoluta de la clase postmodal
ficpostm = Frecuencia absoluta de la clase postmodal

Ejemplo:

Sea la siguiente tabla de frecuencia absoluta y relativa correspondiente a la variable estatura de
30 personas.
De hecho la variable estatura es una variable cuantitativa continua, adems la tabla lo
demuestra ya que entre los intervalos no existe ruptura, es decir, que el lmite superior de la
primera clase es el inferior de la siguiente clase. Es por ello que se dicen que son abiertos por
la izquierda y cerrados por la derecha.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior

Intervalos de Clase PMC fi
(0.98 a 1.15] 1.065 2
(1.15 a 1.32] 1.235 5
(1.32 a 1.49] 1.405 8
(1.49 a 1.66] 1.575 7
(1.66 a 1.83] 1.745 4
(1.83 a 2.00] 1.915 4

En este caso la clase modal sera aquella que tiene mayor frecuencia absoluta, esta es:

(1.32 a 1.49] =8, entonces partiendo de la ecuacin proporcionada anteriormente:


()
() ()


Mo = 1.32 + 0.17 [(8 - 5)/((8 - 5) + (8 7)) = 1.4475

MEDIDAS DE DISPERSION

Estas son las medidas que miden como se dispersan los datos, generalmente alrededor de una
medida de tendencia central. Entre stas se pueden mencionar las siguientes:
Rango o Amplitud
Desviacin Media y Mediana
Varianza y Desviacin Tpica
Dispersin Relativa
Generalmente las ms utilizadas son: Varianza, Desviacin tpica y Dispersin relativa o
Coeficiente de Variacin y una que en los mtodos tabulares ya se ha utilizado como es el
Rango.

Rango
La Amplitud, Rango o Recorrido de un conjunto de datos es la diferencia entre las
observaciones de mayor y menor valor numrico en el mismo.
R = Valor mximo - Valor mnimo
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Tiene la ventaja de ser fcil su determinacin, pero no es una buena medida de dispersin ya
que solo toma en cuenta dos valores de toda la coleccin y no idea de cmo es la variabilidad
dentro de los datos.

Varianza
La varianza retoma un nombre de acuerdo a dnde se determina. Si la determinacin es en una
poblacin se la llama Varianza Poblacional () y si es en una muestra se le llama Varianza
Muestral (s).
La Varianza Poblacin o Variancia de una poblacin finita de N elementos x1, x2, x3, ...xn; se
define como la media aritmtica del cuadrado de las desviaciones de las observaciones
respecto a su media ; y se determina a travs de la siguiente ecuacin para varianza
poblacional:

( )


En caso de que sea muestral y para datos no organizados en una tabla de frecuencia absoluta y
relativa, se determina de la siguiente forma:


( )



Para datos tabulados, la varianza se determina de la siguiente manera:





Existe una frmula de trabajo mucho ms rpido para determinar la varianza muestral para
datos no tabulados que resulta de desarrollar en trinomio cuadrado perfecto de la ecuacin.
Esta frmula es:






Ejemplo:


Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior

Sean los siguientes datos las estaturas de 30 estudiantes de un saln de clases

Alumno Estatura Alumno Estatura Alumno Estatura
1 1.25 11 1.23 21 1.21
2 1.28 12 1.26 22 1.29
3 1.27 13 1.30 23 1.26
4 1.21 14 1.21 24 1.22
5 1.22 15 1.28 25 1.28
6 1.29 16 1.30 26 1.27
7 1.30 17
1.22
27 1.26
8 1.24 18 1.25 28 1.23
9 1.27 19 1.20 29 1.22
10 1.29 20 1.28 30 1.21





xi = (1.25 + 1.28 + 1.27 + 1.21) = 47.1558
xi = (1.25 + 1.28 + 1.27 + 1.21) = 37.6
n = 30

S =
47.1558 -
(37.6)
30
30-1

S = 0.00105 m

Dado que se determina o se estima la varianza se eleva al cuadrado las unidades originales de
medicin razn por la cual no se debe comparar con la media aritmtica ya que sta es medida
en unidades lineales. Por esta razn, es que se propone una nueva medida de dispersin
llamada Desviacin Tpica.

Desviacin Tpica

No es ms que la raz cuadrada positiva de la varianza. En este sentido se puede hablar
entonces desviacin tpica poblacional y muestral, entonces:
=
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
S = S
Para el caso del ejemplo anterior, S = 0.00105 = 0.0324 m
Este dato indica que los datos se dispersan en promedio 0.0324 m del promedio de la variable
Estatura.
Coeficiente de Variacin

Todas las medidas de dispersin antes descritas son medidas de variacin absoluta. Una
medida de la dispersin relativa de los datos, que toma en cuenta su magnitud, est dada por el
Coeficiente de Variacin.
Coeficiente de Variacin (C.V): Es una medida de dispersin relativa de un conjunto de
datos, que se obtiene dividiendo la desviacin estndar del conjunto datos entre su media
aritmtica.


Cuando se multiplica por 100 se expresa en porcentaje indicando tanto por uno que se alejan
los datos de su media aritmtica.
(

)
Ejemplificando con los datos anteriores se tendra:
C.V = (0.0324/1.253)*100 = 2.586%, indicando con ello que por cada valor de la media los
datos se dispersan en un 2.586% alrededor de ella.
Ejemplo.
Sean la siguiente tabla de frecuencia absoluta y relativa, las estaturas correspondientes a 30
estudiantes. La tabla es la siguiente:
Intervalos de Clase PMC fi
(0.98 a 1.15] 1.065 2
(1.15 a 1.32] 1.235 5
(1.32 a 1.49] 1.405 8
(1.49 a 1.66] 1.575 7
(1.66 a 1.83] 1.745 4
(1.83 a 2.00] 1.915 4

Determine el Coeficiente de Variacin de los datos.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Ntese que solo piden CV, entonces necesitamos dos insumos, la desviacin tpica y la media
aritmtica de los mismos. Como se necesita S, entonces se necesita de S. Entonces realizando
los clculos necesarios en la misma tabla se obtienen todos los insumos para la estimacin del
Coeficiente de variacin como se muestra a continuacin. Note que lo que se hizo fue generar
los componentes de las ecuaciones a determinar:

Intervalos de Clase PMC fi
PMCfi PMCfi
(0.98 a 1.15] 1.065 2 2.2685 2.13
(1.15 a 1.32] 1.235 5 7.6261 6.175
(1.32 a 1.49] 1.405 8 15.792 11.24
(1.49 a 1.66] 1.575 7 17.364 11.03
(1.66 a 1.83] 1.745 4 12.18 6.98
(1.83 a 2.00] 1.915 4 14.669 7.66
Totales 30 69.9 45.21





S =
69.9 -
(45.21)
30
30-1

S = 0.0609
S = 0.0780



45.21/30 = 1.507
(

)

C.V = (0.0078/1.507)*100 = 0.5176


Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
DEFORMACION DE CURVAS UNIMODALES

Una curva unimodal se puede deformar de dos maneras, respecto a un eje horizontal o bien
respecto a un eje vertical.
Cuando se trata de una deformacin horizontal se habla de Asimetra y cuando se habla de
deformacin vertical se habla de Curtosis.

Asimetra (Deformacin Horizontal)

Asimetra es el grado de deformacin horizontal que presente una curva unimodal respecto al
eje horizontal. De acuerdo a ello se puede tener lo siguiente:

Asimetra Positiva: Se dice que una distribucin de frecuencia unimodal presenta asimetra
positiva o a la derecha, si tiene una ramificacin ms extendida hacia la derecha o hacia los
valores grandes de una variable. Esto indica que la variable tiende a tomar valores mayores
que su promedio y la relacin que se establece entre las principales medidas de tendencia
central es la siguiente:

Asimetra Negativa: Una distribucin unimodal tiene asimetra negativa o hacia la izquierda,
si tiene una ramificacin ms extendida hacia la izquierda indicando con ello que la variable
tiende a tomar valores inferiores a su promedio. En este caso, la relacin que se establece
entre las principales medidas de tendencia central es la siguiente:
La siguiente grfica resume la asimetra negativa y positiva
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior



Curva Simtrica: En este caso la variable se deforma proporcionalmente con respecto al eje
horizontal y la relacin que se establece entre las principales medidas de tendencia central es
la siguiente:






Coeficiente de Asimetra
La medida ms usada para cuantificar la asimetra de la distribucin de frecuencias de una
variable X, recibe el nombre de coeficiente de asimetra y que desde el punto de vista de
momento (tercer momento) tiene por ecuacin:


Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior

()


La ecuacin antes expuesta es para datos sin organizar o datos no tabulados. Aqu se puede
observar que si existen observaciones muy grandes en relacin a la media, el coeficiente de
asimetra tendr un valor positivo. Si existen observaciones muy pequeas (menor que la
media), el coeficiente de asimetra ser negativo y, finalmente, si las observaciones estn
simtricamente distribuidas alrededor de la media, el coeficiente de asimetra tendr el valor
de cero.
Ejemplo.
Sea los siguientes datos:
6.2, 7.9, 8.1, 8.5, 8.5, 8.9, 9.1, 10.8
Determine el CAs.
= 8.5
s = 1.29

= 2.1388

xi (xi -x) (xi - x)
6.2 -2.3 -12.167
7.9 -0.6 -0.216
8.1 -0.4 -0.064
8.5 0.0 0.0
8.5 0.0 0.0
8.9 0.4 0.064
9.1 0.6 0.216
10.8 2.3 12.167

= 0

Por lo tanto se puede decir que la distribucin es simtrica, en este caso el promedio, la
mediana y la moda coinciden en el mismo valor, lo cual puede ser verificado.

Para datos organizados en una tabla de frecuencia absoluta y relativa el coeficiente de
asimetra se estimar siempre y cuando la tabla no presente clases abierta, por la siguiente
ecuacin:


Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior

( )


Ejemplo:

Intervalos PMC fi PMC*fi

*fi ( )

fi Fia
(20.5 a 25.5] 23 3 69 1587 -2736.99887 3
(25.5 a 30.5] 28 42 1176 32928 -4357.21344 45
(30.5 a 35.5] 33 21 693 22869 0.5738588 66
(35.5 a 40.5] 38 7 266 10108 1042.84987 73
(40.5 a 45.5] 43 3 129 5547 3279.33151 76
(45.5 a 50.5] 48 2 96 4608 7164.84635 78
(50.5 a 55.5] 53 2 106 5618 16733.8331 80
(55.5 a 60.5] 58 2 116 6728 32393.1814 82
(60.5 a 65.5] 63 1 63 3969 27821.4455 83

83 2714 93962 81341.8493

Obteniendo la informacin necesaria de la tabla:

= 1.9309312; por lo tanto, la asimetra resultante es Positiva, esto quiere


decir que la , lo cual puede demostrarse con la informacin que proporciona la
misma tabla.








Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Medidas de Curtosis (Deformacin Vertical)

Medidas de Curtosis o apuntamiento. Se entiende por Curtosis, la medida de deformacin
vertical de una distribucin de frecuencias, es decir, la medida de apuntamiento o
achatamiento de una distribucin.
La Curtosis mide cuan puntiaguda es una distribucin en general por referencia a la normal.
La forma de medir la Curtosis o apuntamiento puede ser en funcin de momentos o cuartiles.
Curtosis en funcin de Momentos:
En este caso el grado de apuntamiento est dado por:

()

; para datos sin organizar



En caso que los datos estn tabulados (organizados) y si la tabla no presente clases abiertas se
puede estimar Curtosis desde el punto de vista de momento a travs de la siguiente ecuacin:


( )



El coeficiente de Curtosis puede tomar uno de los siguientes valores, indicando con el tipo de
deformacin vertical de la curva unimodal. Estos son:
Kur > 3: Este valor indica que la distribucin es ms apuntada que la normal y recibe el
nombre de Leptocrtica
Kur = 3: En este caso la distribucin es moderadamente apuntada y se llama Mesocrtica (o
apuntamiento normal)

Kur < 3: Este indica que la distribucin es menos apuntada que la normal, o sea achatada y se
llama Platicrtica
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
TEORIA DE PROBABILIDADES
Experimento Aleatorio
En Estadstica, los conjuntos de inters son colecciones de observaciones obtenidas
estudiando el comportamiento de un fenmeno, ya sea en estado natural o bien bajo control.
Al proceso mediante el cual se obtiene observaciones se llama experimento. Los experimentos
u operaciones reales o hipotticas pueden dividirse en dos clases:
- Experimento Determinstico
- Experimento no Determinstico
Un experimento es determinstico si su resultados estn completamente determinados y puede
describirse por una frmula matemtica llamada tambin modelo determinstico (no son de
inters desde el punto de vista estadstico)
Ejemplo...
Supngase que el experimento consiste en lanzar un objeto (piedra) al aire. De hecho sta va a
caer porque posee un peso y por la fuerza de gravedad que ejerce la tierra. De hecho se puede
saber cul es el tiempo que tardar en hacerlo. Este experimento se puede modelar por la
ecuacin de cada libre de los cuerpos. En este caso de hecho se sabe cul ser el resultado que
se obtendr.
Otro ejemplo sera si se lanza una pelota al agua, sta de hecho flotar, en caso de ser de
hierro pues no flotar.
Un experimento es no determinstico si los resultados del experimento no se pueden predecir
con exactitud antes de realizar el experimento.
Ejemplo...
Supngase que un experimento consiste en la aplicacin de un sedante a una persona que tiene
dolor de cabeza. Aqu los posibles resultados pueden ser {sanos, enfermos}. En este caso no
se sabe a ciencia cierta cul de estos dos resultados suceder.
Otro ejemplo sera el lanzamiento de un dado legal. Aqu los resultados posibles son: {1, 2, 3,
4, 5,6}. Se sabe cules son los posibles resultados, pero no se sabe cul precisamente.
En estos ejemplos se puede identificar lo siguiente:
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
.- Cada experimento se puede repetir indefinidamente sin cambiar esencialmente las condiciones.
.- Cada experimento es no determinstico.
.- Cada experimento tiene varios resultados posibles que pueden describirse con anterioridad con
precisin (resultados a priori). Entonces a un experimento que presentas las tres caractersticas
mencionadas anteriormente se llama experimentos aleatorio. En otras palabras, un Experimento
Aleatorio es aqul cuyos resultados no pueden predecirse antes de su realizacin, y por lo
tanto, estn sujetos al azar.

Espacio Muestral y Sucesos Elementales

Como se ha observado anteriormente, un experimento aleatorio tiene varios resultados posibles y
que pueden ser escritos con precisin. Entonces: A todo los resultados posibles asociados a un
experimento aleatorio , se le llama Espacio Muestral y se denotar por M y a cada resultado
de un espacio muestral M se llamar suceso.
Ejemplo...
Extraer un artculo defectuoso de un lote que contiene artculos defectuosos "D" y no
defectuosos "N"
M = {D, N}
.- Lanzamiento de un dado legal
M = {1, 2, 3, 4, 5,6}
.- Lanzamiento de una moneda.... M = {C, S}
.- Designacin de un delegado de un grupo de 50 personas
M = {A1,A2,....,A50} ... Ai = i-sima persona

Los experimentos aleatorios pueden ser simples o compuestos. Experimentos aleatorios simples
son los que se han ejemplificado anteriormente.
Un experimento aleatorio compuesto consiste en dos o ms experimentos simples que puede
ocurrir de forma sucesiva o bien de forma simultnea.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Considrese el caso de experimento aleatorio compuesto: aquellos en que los experimentos
simples estn unidos por la partcula gramatical "o" en el sentido excluyente y aquellos donde los
experimentos simples estn unidos por la partcula gramatical "y".

Experimentos compuestos unidos por la partcula "o" excluyente

Un experimento compuesto , se dice que es una o-combinacin de los experimentos 1 y 2
s, slo s, el experimento ocurre, cuando el experimento 1 2 ocurren (pero no ambos).
Esto quiere decir que ocurren de forma sucesiva pero no al mismo tiempo.
Ejemplo...
Considrese el experimento e consistente en lanzar un dado o una moneda. Determine el espacio
muestral del experimento.
M1 = {1,2,3,4,5,6} ... lanzamiento del dado 1
M2 = {C,S} ... lanzamiento de la moneda 2. Por lo tanto, el espacio muestral asociado a , es la
unin de M1 y M2. Es decir:
M = M1 U M2 = {1, 2, 3, 4, 5, 6, C, S}

Experimentos compuestos unido por la partcula "y"

Un experimento compuesto e, se dice que es un y-combinacin de los experimentos simples
e1 y e2, s y slo s, el experimento e ocurre, cuando el experimento e1 y e2 ocurre. Lo
anterior trae como consecuencia que si el experimento compuesto es una y-combinacin de los
experimentos e1 y e2, el espacio muestral M asociado a e, es el producto cartesiano de los
espacios muestrales M1 y M2 correspondiente a e1 y e2, es decir: M = M1 x M2. Ejemplo...
Se lanza una moneda tres veces. Determine el espacio muestral.
Aqu se puede observar que el experimento e ocurre, si los tres experimentos simples ocurren...
ei = 1,2,3; i= i-simo lanzamiento de la moneda. Esto es:
M1 = {C,S}
M2 = {C,S}
M3 = {C,S}
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
e consiste en realizar el experimento 1, luego 2 y luego 3. Por lo tanto: M = M1 x M2 x M3
M = {CCC, CCS, CSC, SCC, CSS, CSC, SSC, SSS} que resulta del producto cartesiano de los
espacio muestrales simples que conforman al experimento compuesto como se muestra a
continuacin:


M1*M2
M3

M2

C S
M1 C S

CC CCC CCS
C CC CS

CS CSC CSS
S SC SS

SC SCC SCS

SS SSC SSS
Otro ejemplo podra ser el experimento aleatorio compuesto consistente en el lanzamiento de una
moneda y un dado al mismo tiempo.


M2
M1 1 2 3 4 5 6
C (C,1) (C,2) (C,3) (C,4) (C,5) (C,6)
S (S,1) (S,2) (S,3) (S,4) (S,5) (S,6)

En muchos casos un diagrama, conocido con el nombre de Diagrama del rbol, es ms sugerente
para la determinar el espacio muestral de un experimento aleatorio compuesto.
Ejemplo... Determine el espacio muestra M del experimento aleatorio compuesto consistente en
el lanzamiento de tres monedas al mismo tiempo
(2
n
) = 2
4
= 16
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior

En este caso el espacio muestral se obtiene con los resultados que tiene cada rama del rbol, es
decir, M= {CCC, CCS, CSC, SCC, CSS, CSC, SSC, SSS}

Sucesos y Algebra de sucesos (-Algebra de Borel)

Como se ha mencionado anteriormente, un suceso es un resultado de un experimento aleatorio.
Si se ha definido al espacio muestral como todos los posibles resultados de un experimento
aleatorio, es decir, se puede concebir al espacio muestral como un conjunto universo. Si se ve
desde este punto de vista, se puede hablar entonces de subconjunto y elementos de este conjunto
universo llamado espacio muestral. Se llama Evento a cualquier subconjunto del espacio
muestral y se le denota por A, B, C, D, E, F, etc. As, si A es un evento, entonces A c M, y se le
llamar suceso a cada elemento de un espacio muestral y se le designa por w, x, y, etc. Esto es si
x es un suceso, entonces x e M. Un evento con un slo elemento es un evento elemental.
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
Ejemplo: considrese como experimento aleatorio al lanzamiento de un dado y al evento A como
la ocurrencia de un nmero par. Determine el espacio muestral.
M = {1, 2, 3, 4, 5, 6}
A = {2, 4, 6}; entonces se dice que A c M

Dado que ya se ha identificado el espacio muestral como conjunto universal, los eventos como
subconjunto del espacio muestral, se identificar tambin el conjunto vaco (C) de la teora de
conjunto como el evento imposible, esto es, un evento que no se da o sea que no ocurre. Por
ejemplo, lanzar dos dados simultneamente, y sea el evento A: "obtener suma de 14". De hecho
esto nunca va a suceder A = {C}.
Sub-evento: Dados dos eventos, A y B se dice que A est contenido en B o que A es sub-evento
de B, si todo suceso favorable a A, es favorable a B. En otras palabras, si ocurre el evento A,
ocurre el evento B. Esto es: A c B, si wi e A w e B

Ac B
Igualdad de Eventos: Se dice que dos eventos A y B son iguales si, AcB y BcA. Esto es: A =
B = AcB y BcA.
Unin de Eventos: Dados dos eventos A y B, se llama unin de A con B y se denota por AB
al evento formado por los sucesos que pertenecen a A a B , a ambos, es decir:
AB = {wieM /wieA v wieB}.



M
A
B
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior


AB

Interseccin: Dados los eventos A y B, se llama interseccin de A con B, al evento formado por
todos los sucesos favorables a A y a B. Es decir, ambos eventos A y B ocurren. Esto es:
AB = {w e M / w e A . w e B}.

AB

Complemento: Si A es un evento del espacio muestral M, se llama complemento de A, al evento
formado por todos los sucesos que no pertenecen a A. Es decir, no ocurre el evento A. Esto es:
A
c
= M - A = {wi e M / wi e A}


M
A B


M
A B

M
A B
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior

A
c



Eventos Mutuamente Excluyente y colectivamente exhaustivos (complementarios)
Dos eventos A y B definidos en el mismo espacio muestral, se dice que son mutuamente
excluyentes si no pueden ocurrir juntos. Es decir la ocurrencia de uno excluye la ocurrencia del
otro. Es decir, que AB = C

Enfoques de Probabilidades
Definir probabilidad estrictamente es un poco inadecuado. La formulacin axiomtica de la
teora de probabilidades requiere niveles de abstraccin y competencia matemtica fuertes. Sin
embargo, hay autores que plantean enfoques a travs de los cuales se puede abordar las
probabilidades. Estos enfoques son:
1. Enfoque o Probabilidad Clsica (llamada tambin de Laplace o Apriori)
2. Enfoque desde el punto de vista de frecuencia relativa (llamada tambin A posteriori).
3. Probabilidad subjetiva
Enfoque Clsico o A priori: Llamado tambin Este definicin se basa en el supuesto de que
todos los resultados posibles de un experimento aleatorio son igualmente probable, es decir, cada
suceso de un espacio muestral M, tienen la misma posibilidad de ocurrir.
Segn Laplace (1812) la probabilidad de un evento es la razn entre el nmero de casos
(sucesos) favorables y el nmero total de casos (sucesos) posibles, siempre que nada obligue
a creer que alguno de estos sucesos deban de tener preferencia a los dems, lo que hace que
todos sean iguales. Esto es:


M
A
A
c

Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior


Observaciones:

1.- La probabilidad de un evento cualquiera A est comprendido entre 0 y 1. En efecto nA y
n son enteros positivos y 0 s nA s 1. Esto es:
0/n s nA/n s n/n 0 s P[A] s 1
2.- P [A] = 0, si A es un evento imposible A = C; nA = 0, luego P[A] = 0/n = 0
3.- P [A] = 1, si A es el evento seguro (A = M), es decir A = M nA = n P[A] = n/n = 1
4.- Puesto que todos los elementos de M = (w1, w2, ..., wn} son igualmente probables
P[{wi}] = 1/n; i = 1, 2,3,..., n P [M] = P[wi] = 1

Si A es un evento de M P [A] = P [{wi}] wiA

Ejemplo..... Si se lanza una moneda tres veces. Calcular la probabilidad que ocurran:
a.- Dos caras
b.- Al menos dos caras
c.- A lo ms dos caras
El espacio muestral de este experimento lo puede obtener a travs de producto cartesiano o bien
a travs del diagrama del rbol. Determinando el espacio muestral:
M = {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}
a.- A = {CCS, CSC, SCC} P[A] = 3/8
b.- B = {CCC, CCS, CSC, SCC} P[B] = 4/8 = 1/2
c.- C = {CCS, CSC, CSS, SCC, SCS, SSC, SSS} P[C] = 7/8
Ejemplo
Considrese el lanzamiento de dos dados. Calcular la probabilidad de:
a.- Obtener suma 7
b.- Obtener suma 6
c.- Obtener suma mayor que 5
d.- Que el resultado del primer dado sea mayor que el resultado del segundo dado.
A = {(w1,w2) e M / w1 + w2 = 7}
Por: Ing. M.Sc. Francisco Martnez Solaris
Mgs. En Educacin Superior
B = {(wi,w2) e M / w1 + w2 = 6}
C = {(w1,w2) e M / w1 + w2 > 5}
D = {w1,w2) e M / w1 > w2}]
Determinando el espacio muestral a travs del producto cartesiano de los dos espacios
muestrales simples de los experimentos que conforman este experimento compuesto se tendra lo
siguiente:

M2
M1 1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

P[A] = 6/36 = 1/6 (nA) = 6
P[B] = 5/36 (nA) = 5
P[C] = 26/36 (nA) = 26
P[D] = 15/36 (nA) = 15

Probabilidad desde el punto de vista de Frecuencia Relativa (o A posteriori).

Supngase la siguiente pregunta: Cul es la probabilidad de que la mitad o ms de los
estudiantes de Esta2 obtengan notas aprobatorias?. En este caso y en muchos ms, no sirve
de nada enumerar todos los resultados posibles. Como se puede observar esta pregunta no
se puede responder utilizando la definicin clsica de probabilidades, dado que se necesita
mayor informacin. Esto conlleva a la interpretacin de probabilidades en trminos de vista
de frecuencia relativa.
Si un experimento bien definido se repite n veces (n grande): sean nA < n el nmero
de veces que el evento A ocurren los n ensayos, entonces la frecuencia relativa de veces
que ocurre el evento A "nA/n", es la estimacin de la probabilidad que el evento A
ocurra, esto es:
P[A] = nA/n
Observacin:
1.- La frecuencia relativa de un evento, est comprendida entre 0 y 1 0 s P[A] s 1
2. nA/n = 1, s y slo s, el evento A ocurre en las n repeticiones de experimento. En
particular nM/n = 1
Ejemplo.
Sexo
Partido Poltico
A B C D E F Total
Masculino 90 80 65 35 37 13 320
Femenino 15 20 5 10 3 2 55
Total 105 100 70 45 40 15 375

Determine las siguientes probabilidades:
a. Cul es la probabilidad que un miembro seleccionado aleatoriamente
b.- Sea una mujer?
c.- Pertenezca al partido B?
d.- Sea hombre miembro del partido C?
Solucin.....
a.- P[Mujer] = 55/375
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

b.- P[B] = 100/375
c.- P[C] = (70)/375

Definicin Subjetiva de Probabilidad

Probabilidad desde el punto de vista subjetivo est relacionada con una presuncin,
creencia o como algunos autores le llaman corazonada, por lo tanto, puede variar de una
persona a otra.
Dado un experimento determinado, la probabilidad de un evento A es el grado de creencia
asignado a la ocurrencia de este evento por un individuo particular, basado en toda la
evidencia a su disposicin con las siguientes exigencias:
1.- P[A] = 0, representa la certeza que el evento A, no ocurrir
2.- P[A] = 1, representa la certeza que el evento A, s ocurrir

Principales Teoremas de Probabilidad:
1. O s P[A] s 1, para cada evento A en M.
2. P[M] = 1
3. P[AUB] = P[A] + P[B]; siempre y cuando los eventos A y B ocurran por separado o
de forma independiente.
4. P [AUB] = P[A] + P[B] P[AB]; en este caso A y B no son eventos
independientes, es decir, que ocurren al mismo tiempo.
5. Si A = {|}, entonces P[A] = 0
6. Eventos mutuamente excluyentes y colectivamente exhaustivos o complementarios.
Sea A y B, dos eventos en el espacio muestral, se dice que son mutuamente
excluyente si la ocurrencia de uno de ellos elimina la ocurrencia del otro y viceversa
y son complementarios si la suma de sus probabilidades, es decir la unin de ambos,
da como resultado la probabilidad del espacio muestral. Si dos eventos cumplen
estos dos requisitos se dicen que forman una particin del espacio muestral M.
7. Sea A es un evento en M, entonces P[A] = 1 P[A]

Probabilidad Condicional (Dependencia de Eventos)
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior


A menudo sucede que la ocurrencia de un evento depende de la ocurrencia de otro y es de
frecuente inters obtener la probabilidad de un evento, donde dicho evento est
condicionado a la ocurrencia de un subconjunto del espacio muestral (otro evento). Es
decir, que se dice que el evento B ha ocurrido y se quiere saber la probabilidad que ocurra
el evento A.
Sea A y B dos eventos en el espacio muestral M si P [B] = 0, se define la probabilidad
condicional del evento A dado el evento B como:

; P=
Es decir, la probabilidad condicional es una probabilidad calculada en un espacio muestral
reducido, B; pues a partir de la informacin se sabe con probabilidad 1 que el evento B ya
ocurri. En la prctica se puede resolver este problema usando la definicin, esto es
calculando la P [AB] y P [B] con respecto al espacio muestral original, o bien
considerando la probabilidad del evento A con respecto al espacio muestral reducido B, es
decir, del evento que condiciona.
Ejemplo...
Una empresa tiene 300 trabajadores de los cuales 100 son casados y 30 son divorciados. En
dicha empresa trabajan 200 hombres, 85 de los cuales son casados y 95 son solteros. Se
toma un trabajador al azar:
a. Si el trabajador seleccionado es soltero, cul es la probabilidad que sea mujer?
b. Si el trabajador seleccionado es mujer, cul es la probabilidad que sea soltera?
c. Cul es la probabilidad que sea mujer o est casada?
Solucin
Lo primero que se tiene que hacer es extraer la informacin que proporciona el problema y
ver cmo se puede completar la siguiente. Por otro lado se debe de partir del hecho que la
informacin proporcionada se puede clasificar de acuerdo a dos criterios los cuales son: el
sexo de los trabajadores y el estado civil de los mismos. En el caso del ejemplo se dispone
de la siguiente informacin que se encuentra en el siguiente cuadro en forma cursiva. La
restante se puede completar utilizando el concepto de complemento de evento.


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Sexo
Estado Civil
Total
Casado (C) Soltero (D) Divorciado (E)
Femenino (A) 15 75 10 100
Masculino (B) 85 95 20 200
Total 100 170 30 300

Como se puede observar se est totalizando tanto por filas como por columnas, es decir, de
acuerdo a los dos criterios de clasificacin de la informacin. A esto se le llama
probabilidades marginales y a la informacin del interior del cuadro se le llama
probabilidad conjunta de los dos eventos (criterios de clasificacin). Resolviendo el
problema se tiene:
a. Si el trabajador seleccionado es soltero, cul es la probabilidad que sea mujer?.
En este caso el evento condicionante es que el trabajador sea soltero y el evento
dependiente es que sea mujer.
Los problemas de probabilidad de eventos dependientes se pueden resolver de dos manera:
respecto al espacio muestral original y respecto al espacio muestral restringido del evento
que condiciona. Para el primer caso:
(


Para el segundo caso, es decir, respecto al espacio muestral restringido del evento
condicinate se tendra que ver cuntas veces se repite el evento trabajador de sexo
femenino y cuntas veces se repite el evento trabajador soltero. De acuerdo a esto se tiene
que:
(


Como se puede observar ambos resultados coinciden en el mismo resultado.
b. Si el trabajador seleccionado es mujer, cul es la probabilidad que sea soltera?
Esto tiende a confundir pensando que es el mismo del inciso a., sin embargo el evento
condicionante es ahora que el trabajador sea Mujer. De acuerdo a esto se tiene:
(


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

c. Cul es la probabilidad que sea mujer o est casada?

[

] [

] [



Independencia de Sucesos
En probabilidad condicional la ocurrencia de un evento condiciona la probabilidad de un
segundo evento. Sin embargo, hay muchos casos donde los eventos estn totalmente sin
conexin, y la ocurrencia de uno de ellos no cambia la probabilidad de ocurrencia del otro,
en este caso se dice que son independientes.
Sean A y B dos eventos y sea P [B] = 0., A y B son eventos independientes si:
a.- P[A/B] = P[A]
Como consecuencia, si A y B son independientes y
P [A/B] = P[AB]/P[B] = P[A] P[AB] = P[A]P[B] y viceversa
Dos eventos A y B son independientes si se cumple cualquiera de las siguientes
condiciones:
.- P[A/B] = P[A] .- P[B/A] = P[B] .- P[AB] = P[A].P[B]
Ejemplo...
Un impulso elctrico debe de pasar del punto I al II para producir una seal. Para llegar al
punto II debe de pasar por dos componentes electrnicos (E1 y E2). La trayectoria del
impulso se interrumpe si falla cualquiera de los dos componentes. La probabilidad de que el
componente E1 no falle es 0.7 y la probabilidad que el componente E2 no falle es 0.8.
Adems, la probabilidad de que al menos uno no falle es 0.94. Cul es la probabilidad de
que la seal se produzca?
A = Componente E1 no falle = P[A] = 0.7
B = Componente E2 no falle = P[B] = 0.8
P [AUB] = 0.94
Para que se produzca el impulso elctrico, ninguno de los componentes (E1 y E2) deben de
fallar la probabilidad solicitada es P[AB].
P[AUB] = P[A] + P[B] - P[AB]
P [AB] = P[A] + P[B] - P[AUB]
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

= 0.7 + 0.8 - 0.94 = 0.56


Probabilidad Total
Sean A1, A2,..., Ak, eventos que forman una particin del espacio muestral y Sea B un
evento en el espacio muestral. Si P[A1], P[A2],..., P[Ak], P[B/A1], P[B/A2],..., P[B/Ak]
son probabilidades conocidas y se est interesado en la ocurrencia del evento B. Para
obtener esta probabilidad se hace uso del Teorema de Probabilidad Total que partiendo de
las premisas anteriores se enuncia de la siguiente manera:
*

] [

] *

+

Ejemplo:
Un profesor tiene tres secretarias con diferentes niveles de competencia. Las secretarias son
S1, S2, S3. La secretaria S1 ha escrito el 20% de un trabajo, la secretaria S2 el 40% y la
secretaria S3 el 40%. Hay un error ortogrfico que irrita en especial al profesor, y ste ha
calculado que S1 lo comete el 90% de las veces que tiene que escribir la palabra en
cuestin, que S2 lo comete el 40% de las veces, y S3 nunca.
Cul es la probabilidad de que el profesor encuentre el error mencionado?
Obteniendo la informacin que proporciona el problema se tiene:
P [S1] = 0.20; P [S2] = 0.40; P [S3] = 0.40; P [

P [

P
[

; entonces la probabilidad del error es:


P [E] = P [S1]* P [

+ P [S2]* P [

+ P [S3]* P [


P [E] = ((0.20*0.90) + (0.40*0.40) + (0.40*0)) = 0.34
Lo anterior se puede facilitar si se usa un rbol de probabilidades como se muestra a
continuacin:

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior










Supngase ahora que el evento B ya ha ocurrido y se est interesado en saber a cules de
los eventos que forman la particin del espacio muestra se ha debido su ocurrencia. En este
caso se hace uso del Teorema de Bayes que partiendo tambin de las premisas anteriores se
enuncia de la siguiente forma:
*

+
*

+
*


Como se puede observar, el denominador no es ms que la probabilidad B, es decir, la
probabilidad total.
Ejemplo:
Si el profesor encuentra el error mencionado en una pgina del trabajo. Cul es la
probabilidad de que esa pgina la haya escrito secretaria S1?, la secretaria S2?, la
secretaria S3?
[

]
[

]


( )

]
[

]


( )

]
[

]


( )




P [S1] = 0.20
P [S2] = 0.40
P [S3] = 0.40
P [E/S1] = 0.90
P [E/S1] = 0.10
P [E/S2] = 0.40
P [E/S2] = 0.60
P [E/S2] = 1
P [E/S3] = 0
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

REGRESION Y CORRELACION LINEAL SIMPLE

Regresin Lineal Simple

En muchas reas de la investigacin cientfica, la variacin en las mediciones de una
variable en estudio es causada preponderantemente por otras variables relacionadas cuyas
magnitudes cambian en el curso del experimento. La incorporacin explcita de los datos de
estas variables que influyen en el anlisis estadstico, permite conocer la naturaleza de las
relaciones y utilizar esta informacin para mejorar la descripcin y las inferencias de las
variables de inters primario.
Al probar las relaciones entre variables es importante que el valor de la variable pueda ser
predicha de las observaciones de otra variable o an controladas y optimizadas
manipulando los factores de influencia.
El anlisis de regresin es un conjunto de mtodos estadsticos, que tratan con la
formulacin de modelos matemticos que describen las relaciones entre variables y el uso
de estas relaciones modeladas con el propsito de predecir e inferir.
Supuestos del modelo de Regresin Lineal Simple
Al igual que en otros tipos de anlisis estadsticos, el modelo de Regresin Lineal Simple
se basa en ciertos supuestos que a continuacin se detallan.
Supuesto 1. "Y" es una variable aleatoria cuya distribucin probabilstica depende de
"X"
Este supuesto quiere decir que para cualquier valor de "X", "Y" es una variable aleatoria
con cierta distribucin probabilstica con media
y/x
y
y/x.
Note que esta suposicin
solamente implica que "Y" es una variable aleatoria que depende de "X", y no toma en
cuenta la forma lineal. Por otra parte, significa que la variable X se mide sin error y fijada
por el investigador.
Supuesto 2. Modelo de la lnea recta
Esta suposicin requiere que la ecuacin para
y/x
sea una lnea recta, es decir que
y/x
=
0

+
1
X
i
y, por lo tanto, que la ecuacin de dependencia sea Y =
0
+
1
X
i
+ . Con esta
restriccin, la lnea que une a
y/x
debe de ser una recta, por lo tanto se puede tener una de
las siguientes situaciones:
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior


Puede ser que se tenga una relacin positiva entre las variables X y Y, esto quiere decir que
a medida que aumenta X, Y tambin aumenta.
Otra situacin que se puede dar es una relacin inversa, es decir, que a medida que aumenta
X, Y disminuye.
En el ltimo caso se recurre al hecho de que regresin tambin se entiende como la
tangente inversa del ngulo de inclinacin de una recta. En los dos primeros casos las rectas
tienen pendiente y en el tercer caso, no hay pendiente lo cual indica que no existe regresin
lineal entre ambas variables.
Supuesto 3. Homogeneidad de varianza
Esta suposicin es muy importante en el anlisis de regresin. La varianza de la
distribuciones de "Y" son idnticas para todos los valores de "X". En otras palabras, se
supone que
y/x1
=

y/x2
=

y/xn
= , donde es la varianza comn (desconocida) para
todas las distribuciones de "Y", independientemente del valor de "X". Esto quiere decir,
que la media de "Y" se modifica con el valor de "X", pero la varianza se mantiene
constante.
Supuesto 4. Independencia
Los valores de "Y" debern ser estadsticamente independiente. Un ejemplo donde se viola
este supuesto es cuando se realizan mediciones de peso a un mismo individuo en un lapso
menor a una hora.
Supuesto 5. Normalidad
La distribucin de "Y" para cualquier valor de "X" es normal. Esto equivale a suponer que
la variable aleatoria no observable es normal y su media es cero ya que "X" se toma
como variable no aleatoria susceptible a ser manipulada por el investigador.
Todos los supuestos anteriores se pueden resumir en los siguientes:
1. "Y" es una variable aleatoria cuya distribucin probabilstica depende del valor de "X".
Y
X
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

2. La ecuacin de regresin es una lnea recta.
3. Homogeneidad de varianza.
4. Independencia de las observaciones lo que implica que los errores son independientes.
5. Normalidad.
En la Figura 1 se muestran los supuestos de normalidad y homogeneidad de varianza.




Diagrama de Dispersin
Este diagrama tiene por objetivo dar una idea de la posible relacin existente entre la
variable dependiente Y y la independiente X.
Para realizar un diagrama de dispersin se coloca en el eje de las abscisas los valores
correspondiente a la variable independiente X y en el eje de las ordenadas los valores de la
variable dependiente Y. Luego se colocan puntos en la interseccin de los valores de ambas
variables. Un ejemplo de lo anterior se muestra en seguida.
Los datos que se muestran a continuacin corresponden a la produccin en miles de
millones de dlares de 10 empresas y sus costos de produccin de las mismas en miles de
millones de dlares.
Para construir un diagrama de dispersin lo primero que se tiene que hacer es determinar
quin es la variable dependiente y quin es la variable independiente, es decir, establecer la
relacin entre dichas variables. Esta relacin debe ser lo ms natural posible.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

En el caso del problema, es de suponerse que a medida que aumenta la produccin tambin
se incrementarn los costos de produccin por todo lo concerniente a ello (materia prima,
horas hombres, gastos de energa, etc.). Entonces definimos a X, variable independiente, a
la Produccin y a Y, variable dependiente, a los costos de produccin. De acuerdo a esto se
tiene lo siguiente:
Produccin (X)
(miles de millones de $us)
Costo (Y)
(miles de millones $u)
10 3
18 5
12 4
16 5
22 8
36 12
30 10
32 14
26 12
12 3

El diagrama de dispersin quedara de la siguiente forma:


De acuerdo a la informacin que proporciona el diagrama de dispersin se puede observar
que a medida que aumenta la produccin de las industrias, aumentan los costos de
produccin de las mismas, es decir, se concluir que existe una relacin positiva entre estas
variables y adems se puede ver que esta relacin tiende a ser lineal.

0
2
4
6
8
10
12
14
16
0 5 10 15 20 25 30 35 40
C
o
s
t
o

(
M
i
l
e
s

d
e

m
i
l
l
o
n
e
s

$
u
s
)

Produccin (Miles de Millones $us)
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Mtodo de Mnimos Cuadrado
Como lo plantea el supuesto 2 del modelo de regresin lineal simple, "Modelo de la Lnea
Recta", que de existir una relacin entre X y Y, sta debe ser una lnea recta. Entonces a
partir de muestra (x1, y1), (x2, y2),..., (xn, yn), de las variables "X" y "Y", se trata de
obtener una ecuacin que represente la relacin entre dichas variables. El modelo del cual
se habla es de una ecuacin punto pendiente como sigue:
El problema de esta modelo es que sus componentes son parmetros y por lo tanto, son
estados desconocidos de la naturaleza generalmente. Es por ello que es necesario obtener
estimadores de
0
y
1
para estimar adecuadamente la recta de regresin y/xi. El
estimador de y/xi se denota por:


Para llegar a obtener estos estimadores se hace uso de la tcnica propuesta por Carl Gauss
(1777-1855). Este mtodo se basa en la idea de obtener estimadores para los componentes
del modelo que minimicen la suma de cuadrados de las distancias entre los valores
observados (Yi) y los estimados (

). Esto significa que se tiene que minimizar la suma de


cuadrados de las longitudes de los segmentos de las lneas verticales que unen los datos
observados con la recta estimada como se muestra en la Figura 3.

A la tcnica antes mencionada se le denomina "Tcnica de Mnimos Cuadrados". Usando
notacin matemtica, el mtodo de mnimo cuadrados consiste en encontrar los estimadores
de 0 y 1.
Al aplicar la tcnica de mnimos cuadrados se llegan a obtener las ecuaciones de trabajo de

1^ (en este caso se ha omitido los procesos de derivacin mediante el cual se llega a
obtener las frmulas de trabajo). Estas ecuaciones son las siguientes:
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior


()

. Donde:

Coeficiente de Regresin

Intercepto de la recta de estimacin


Ejemplo:
Retomando los datos que se utilizaron para construir el diagrama de dispersin y aclarando
que X es Produccin (miles de millones de $us) y Y Costos (miles de millones de $us)
y haciendo uso de las ecuaciones derivadas a travs de la tcnica de mnimos cuadrados se
tiene lo siguiente:

X Y XY X
2
Y
2


10 3 30 100 9

18 5 90 324 25

12 4 48 144 16

16 5 80 256 25

22 8 176 484 64

36 12 432 1296 144

30 10 300 900 100

32 14 448 1024 196

26 12 312 676 144

12 3 36 144 9
Totales 214 76 1952 5348 732
Promedio 21.4 7.6



()

()

= 0.423738, Coeficiente de regresin


; ( ) ; Intercepto, por lo tanto la


ecuacin de estimacin quedara de la siguiente manera:

; o bien se puede decir que:


Costos = 0.423738 (Produccin) 1.46798
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior


Un aspecto que no se debe olvidar es que el propsito de la Regresin Lineal Simple es el
de predecir el comportamiento de una variable dependiente a travs del conocimiento de
una variable independiente, es por ello que se debe estar seguro que la ecuacin de
estimacin sirve para este propsito (que existe regresin lineal simple). Por esta razn es
que la ecuacin de estimada debe ser sometida a un proceso de validacin.

Validacin de la Ecuacin de Estimacin

Este proceso se puede realizar de dos maneras a saber:
- A travs del Clculo del Coeficiente de Determinacin (R
2
)
- Por medio del Anlisis de Varianza de la Regresin (ANARE)

Coeficiente de Determinacin (R
2
) o Variabilidad (varianza explicada)
El Coeficiente de Determinacin, R
2
, indica el porcentaje de la variabilidad de Y que
puede ser explicada o debida a X, es por ello que mientras ms cerca est del 100% es
mucho mejor. Esto es debido a que se trata de predecir el comportamiento de Y a travs
del conocimiento de X, es por ello que es deseable que el mayor porcentaje de la
variabilidad de la variable dependiente sea debida a X, a tal punto que hay autores que
consideran que la ecuacin es buena o sirve para predecir si R
2
70%.
El coeficiente de Determinacin se calcula a travs de la siguiente ecuacin:


( )

(
()

) (
()


Para el caso del ejemplo anterior el R
2
es el siguiente:


( )

(
()

) (
()



Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Esta dato indica que del 100% de la variabilidad de Y (Costos), el 89.36% es debido a X
(Produccin), por lo tanto tambin se puede concluir que existe un 10.64% de variabilidad
de Y (Costos) que no es debida a X (Produccin), a esto se le conoce como variabilidad no
explicada. En este caso se puede concluir tambin que la ecuacin estimada sirve para
predecir (existe regresin lineal simple.

Anlisis de Varianza de la Regresin Lineal Simple (ANARE)

De forma general se entienden por anlisis de varianza a la particin de la variabilidad total
en fuentes de variacin conocidas que en el caso de regresin lineal son las siguientes:
- debida a la regresin
- debida a otras causas (error)
Para tratar de ser un poco ms explcito, estas dos fuentes de variacin se derivan del
modelo aditivo lineal de la regresin lnea simple el cual es:
Esto tiene correspondencia con una tabla de varianza o salida de
varianza que para regresin lineal simple es la siguiente:
FV gl SC CM Fc Ft
Regresin
1
SCRegresin


(, glreg, glerr)
Error
n-2
SCError




Total n-1 SCTotales

La primera columna encabezada por FV (Fuentes de variacin) es donde se declara las
fuentes de variacin en las que se est partiendo la variabilidad total. Ntese que en esta
tabla no se incluye el efecto de , ya que ste es una constante por lo tanto no es una
fuente de variacin.
La segunda columna encabeza por gl (Grados de Libertad). De forma general grados de
libertad es n-1, para el caso de la fuente de variacin debida a regresin siempre es 1 ya
que son dos los parmetros que se estiman, 0 y 1, por lo tanto, 2-1 = 1. Es por ello que
para el ANARE de regresin lineal simple, esta fuente de variacin siempre tiene 1 grado
de libertad y los grados de libertad del error, siempre en este caso, son n-2. Por n se
entiendo al conjunto de pares de datos X Y.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

La tercera columna es la de Suma de Cuadrados (SC) que vienen a ser los componentes de
las varianza a estimar cuyas ecuaciones de trabajo son las siguientes:


()

)


La cuarta columna es para los Cuadrados Medios (CM) que viene a ser las estimaciones
propiamente dichas de las varianza de cada una de las fuentes de variacin. Estas resultan
de dividir las sumas de cuadrados de stas entre sus grados de libertad.
La quinta columna denominada como Fc se refiere a los F calculados que resultan de
dividir el cuadrado medio de regresin entre el cuadrado medio del error, es decir, de la
variabilidad no debida a la regresin. Es por ello que el error se considera como un trmino
de comparacin entre la variabilidad debida a regresin y el mismo. Si el cuadrado medio
del error es mayor que el cuadrado medio de regresin, el resultado que se obtendr ser
pequeo y posiblemente menor que el valor de la siguiente columna Ft o F de tabla,
valor que se extrae de una tabla de F con un nivel de significancia, grados de libertad de
regresin y los grados de libertad del error.
Para entender mejor lo anterior se debe de partir del juego de hiptesis que se prueba en un
ANARE. Este es:
Ho: 1 = 0
Ha: 1 = 0
La hiptesis nula (Ho) asume el efecto de igual o nulidad de efecto y es la hiptesis que se
somete a prueba. Partiendo del hecho de que asume el efecto de nulidad, en este caso indica
que no existe regresin lineal simple, y asume que la relacin entre X y Y es una lnea recta
sin pendiente, es por ello que es igual a cero.
Por hiptesis alternativa se entiende aquella que contradice a la hiptesis nula y que es
aceptada una vez que se rechaza la hiptesis nula. Es por ello que est como 1 = 0 ya que
una igualdad se contradice con una desigualdad. Esto significa que la recta tiene pendiente,
es decir, que existe regresin lineal simple.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Ahora bien, todo el ANARE se hace para realizar la prueba de hiptesis de que si existe o
no regresin lineal simple.
Se entiende como prueba de hiptesis al proceso a travs del cual se prueba la plausibilidad
de una hiptesis.
Al realizar la prueba de hiptesis se debe llegar una decisin de aceptar o rechazar Ho.
Cundo no se rechaza Ho?, cuando el Fc s Ft y se rechaza cuando el Fc > Ft. A lo anterior
se le llama Regla de Decisin la cual es la siguiente:
No Rechazo de Ho si Fc s Ft
Rechazo de Ho si Fc > Ft
Si la hiptesis nula no se rechaza significa que no existe regresin lineal simple, por lo
tanto la ecuacin estimada no sirve para predecir, si se rechaza Ho, inmediatamente se
acepta la hiptesis alternativa la que indica que s existe regresin lineal simple.
Un aspecto que todava no se ha aclarado es Nivel de Significancia, , entendido como
la probabilidad de tomar una decisin equivocada (conocido tambin como Error Tipo I) es
por ello que los valores del son pequeos s 0.1.
Haciendo el ANARE a un = 0.01 se tiene lo siguiente:

()

= 154.4
(

)


Vaciando esta informacin en la tabla de ANARE se tiene lo siguiente y obteniendo el
valor de F de la tabla correspondiente a: 0.01, 1 y 8 se tiene que este es: 11.26

FV gl SC CM Fc Ft
Regresin 1 137.6897 137.6897 67.0389 11.26
Error 8 16.4310 2.053875
Total 9 154.4

De los resultados de la tabla se puede observar que el Fc es mayor que el Ft lo cual
indica que existe suficiente evidencia para rechazar la hiptesis nula, es decir, que existe
regresin lineal simple y por lo tanto se dice que la ecuacin estimada sirve para predecir el
comportamiento de Costos (Y) a travs del conocimiento de Produccin (X).
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuando se realiza un anlisis de varianza de la regresin se debe emitir una conclusin que
podra ser la siguiente:
De acuerdo al anlisis de varianza realizado se concluye con un 99% de confiabilidad, (1
0.01)*100, que existe regresin lineal simple.
Una vez que se ha comprobado que la ecuacin estimada es buena (hay regresin lineal) el
siguiente paso sera interpretar los componentes de la recta de estimacin.

Interpretacin de los Componentes de la Ecuacin de Estimacin
Cuando se hacer una interpretacin, sta debe ser aplicada al problema en cuestin. En el
caso del ejemplo que se ha venido desarrollando sera el siguiente:

1
: Este es el coeficiente de regresin que indica la cantidad de cambios que experimenta
Y por un cambio en X. En este caso indica que por Un mil millones de dlares que
se incremente la produccin, los costos se incrementarn en 0.423738 miles de
millones de dlares. Esto porque la pendiente encontrada fue positiva, si hubiera sido
negativa, se dira que disminuira esa cantidad.

0
: No siempre tienen interpretacin aplicada al problema, es decir, una interpretacin
lgica, es por ello que comnmente se le interpreta desde el punto de vista matemtico
como el punto donde la recta de estimacin corta al eje de las ordenadas cuando X
toma el valor de cero. En el caso del ejemplo,

0 =-1.46798, esto estara indicando que


cuando la produccin es cero, los costos son de -1.46798 miles de millones de dlares.
Como se ve esta interpretacin carece de lgica lo cual hace que se interprete como se
ha mencionado anteriormente.
Existen casos donde si existe interpretacin lgica como lo muestra el trabajo de
investigacin realizado por Martnez (1995) donde ajust pesos de becerros al nacimiento.

Dibujo de la Recta de Estimacin
Cualquier recta se define por dos puntos y en el caso de la recta de regresin lineal simple,
sta pasa por dos puntos obligados cuyas coordenadas son: ( ) y (

0). La recta de
estimacin debe dibujarse dentro del rea de exploracin, es decir, el rea determinada por
el diagrama de dispersin que donde se tiene informacin de ambas variables.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Para el caso del ejemplo que se ha venido tratando la grfica de la recta de estimacin sera
como se muestra a continuacin.



Regresin no Lineal

Este tipo de regresin no es objeto de desarrollo del presente documento ya que se
consideran para cursos superiores de estadstica lo que se trata es dejar plasmado que una
relacin entre dos variables no siempre es una lnea recta, sta puede ser logartmica,
exponencial o bien cuadrtica o cbica. Uno de los criterios para definir el ajuste de modelo
es el R y adems el Cuadrado Medio del Error del anlisis de varianza. En estos casos el
diagrama de dispersin es importante para determinar esas posibles relaciones.

Regresin Mltiple
No siempre la dependencia en caso de existir se pueda deber a una sola variable, puede ser
que Y como variable dependiente se vea afectada por ms de una variable independiente,
en este caso se habla de regresin lineal mltiple, aspecto que no se desarrolla en este
documento.



y = 0.4237x - 1.468
R = 0.8936
0
2
4
6
8
10
12
14
16
0 5 10 15 20 25 30 35 40
C
o
s
t
o

(
m
i
l
e
s

d
e

m
i
l
l
o
n
e
s

d
e

$
u
s
)

Produccin (miles de millones de $us)
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Correlacin Lineal Simple
As como existen tcnicas que cuantifican los cambios de una variable dependiente por un
nico cambio de la variable independiente, existen tcnicas que cuantifican la asociacin
lineal entre dos variables, esta tcnica es llamada Correlacin Lineal Simple que se exprese
como el coeficiente de correlacin (r). Este coeficiente indica el sentido de la asociacin
como tambin la magnitud de sta, partiendo del hecho que el coeficiente de correlacin
lineal simple toma valores en el rango de: r es 0 r 1. Entre ms se acerca a 1 el valor de r
mayor es la asociacin entre dichas variables.
De acuerdo a lo anterior algunos autores han determinado lo siguiente rangos:

-1 r < -0.8 Asociacin fuerte y
negativa
0 r < 0.4 No hay asociacin
-0.8 r < -
0.4
Asociacin dbil y
negativa
0.4 r <
0.8
Asociacin dbil y positiva
-0.4 r 0 No hay asociacin 0.8 r 1 Asociacin fuerte y
positiva

El coeficiente de Correlacin Lineal Simple se determina a travs de la siguiente ecuacin:


()

(
()

)(
()

)
, que para el caso del ejemplo sera el siguiente:


(
()

)(
()

)
= 0.9452

Este valor indica que existe una asociacin fuerte y positiva entre estas variables, es decir,
entre la produccin y los costos de esas empresas.






Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Diferencias entre Regresin Lineal Simple y Correlacin Lineal Simple

Se pueden llegar a establecer las siguientes diferencias:
Regresin Lineal Simple Correlacin Lineal Simple
Mide la cantidad de cambios en Y por un
nico cambio en X.
Mide asociacin lineal entre dos
variables
Existe una variable dependiente y otra
independiente
Es indistinto x, y y, x
1 puede tomar cualquier valor en la recta
numrica
El coeficiente de correlacin
toma valores en el intervalo -1
r 1

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior












































DISEOS EXPERIMENTALES


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior



1. ASPECTOS GENERALES DE LA EXPERIMENTACIN
Antes de ingresar al anlisis de los principales diseos experimentales, es necesario
establecer el acervo correspondiente en este campo de la Estadstica llamado Diseos
Experimentales que facilite el proceso de aprendizaje que aunado a las bases estadsticas
anteriores conlleven al usuario a un mejor uso el presente material. Es por ello que a
continuacin se detalla lo siguiente:
1.1. Experimento:
Es todo proceso que consiste en la ejecucin de un acto o prueba una o ms veces, cuyo
resultado en cada prueba depende del azar y que genera informacin tanto cualitativa como
cuantitativa segn sea el caso. En s viene a ser aquel proceso intencionado provocado por
el investigador con el fin de estudiar su origen, esencia e interrelacin con otros procesos o
fenmenos.
1.2. Tratamiento:
Es todo elemento o sujeto sometido a estudio o ensayo de comparacin. Viene a ser el
conjunto de condiciones experimentales que el investigador impone a las unidades
experimentales. Ejemplo: efecto de dosis desparasitante, tipo de desparasitante, niveles de
fertilizacin, metodologas de polinizacin, etc.
1.3. Unidad Experimental:
Por unidad experimental (unidad de anlisis porque es la que proporciona informacin al
investigador) se entiende aquella a la cual se le aplica un tratamiento, en s, es el material o
lugar sobre el cual se aplican los tratamientos. Este trmino se utiliza para representar al
conjunto de material experimental al cual se le aplica un tratamiento. Su tamao depende
mucho del tipo de material experimental que se utilice y muchas veces de la esperanza de
vida en el caso de usar seres vivos. Cuando se experimenta con aves, la unidad
experimental puede estar constituida por un grupo de ellas; sin embargo, cuando se puede
experimentar con animales cuya esperanza de vida sea mayor, puede ser que uno solo de
ellos pueda ser considerado como una unidad experimental.
1.4. Factor:
Es un tratamiento que genera ms tratamientos que en los diseos experimentales se
conocen como niveles del factor.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

1.5. Error Experimental:
Es la variacin aleatoria (no explicada) ajena al control razonable del investigador. Este
trmino no es sinnimo de error, si no que forma parte de las caractersticas propias e
innatas de la unidad experimental. Este error no se puede evitar pero si se puede reducir
usando las repeticiones necesarias, usando unidades experimentales los ms
homogneamente posible y manejndolas de manera uniforme, de manera que si se observa
una diferencia entre los tratamientos estudiados, se deba a una bondad de los mismos y no a
consecuencias de un manejo no adecuado de las unidades experimentales. Tiene la funcin
de ser un comparador entre la variacin provocada (explicada o debida a los tratamientos) y
la variacin aleatoria o no explicada en el anlisis de varianza.
1.6. Testigo
El testigo es el tratamiento de comparacin adicional, que no debe faltar en un
experimento; la eleccin del tratamiento testigo es de gran importancia en cualquier
investigacin, ste se constituye como referencial del experimento y sirve para la
comparacin de los tratamientos en prueba.
1.7. Diseos Experimentales:
Es un mtodo cientfico de investigacin que consiste en hacer operaciones prcticas
destinadas a demostrar, comprobar o descubrir fenmenos o principios bsicos. Tiene como
propsito proporcionar la mxima cantidad de informacin a un costo mnimo.
Disear un experimento es planificarlo, qu es lo que se pretende experimentar, es
planearlo de modo que se tenga la secuencia completa de pasos tomados de antemano para
asegurar que la informacin que se obtendr permita un anlisis objetivo que conduzca a
deducciones (demostracin de hiptesis) vlidas con respecto al problema de investigacin
previamente establecido.
1.8. Principios Bsicos de la Experimentacin:
Los principios bsicos de la experimentacin agrcola son tres: Repeticin, Azarizacin y
Control Local.
1.8.1. Repeticin. Es la reproduccin del experimento bsico llamado tambin rplica y
solamente a travs de ella se pueden obtener conclusiones de un fenmeno. Tiene dos
funciones: Proporcionar una estimacin del error experimental y brindar una medicin ms
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

precisa de los efectos de los tratamientos, es decir, que hace posible la prueba de
significancia a travs de la regularidad estadstica.
1.8.2. Azarizacin. En s no es ms que utilizacin del azar, es decir, la casualidad. En
diseos experimentales est referida a la asignacin de los tratamientos a las unidades
experimentales de modo que todas tengan la misma posibilidad de recibir un tratamiento.
Tiene la como funcin hacer vlida la prueba de significancia.
1.8.3. Control Local. Es la cantidad de balanceo, bloqueo o agrupamiento de las unidades
experimentales que se emplean en el diseo adoptado. Tiene la funcin de hacer ms
eficiente el diseo experimental, es decir, hacer ms sensitiva la prueba de significancia
reduciendo con ello la magnitud del error. Los criterios de agrupamiento van a depender del
tipo de ciencia donde se est experimentando. En el caso de los experimentos agrcolas un
criterio de bloqueo puede ser la pendiente de suelo que puede conllevar a una gradiente de
humedad o fertilizacin, direccin del viento, etc.
1.9. Exigencias de la Experimentacin:
Las exigencias de la experimentacin son: Tipicidad, Uniformidad, Grado de Precisin,
Control efectivo de las medidas y observaciones.
1.9.1. Tipicidad. Llamado tambin representatividad, hace mencin que no se pueden
extrapolar resultados a condiciones diferentes a las que se originaron.
1.9.2. Uniformidad. Indica que todas las unidades experimentales deben ser tratadas
uniformemente y que la nica diferencia entre ellos sea los tratamientos que se estn
evaluando en ellas. Esto evita tener resultados enmascarados en los experimentos.
1.9.3. Grado de precisin. Un experimento bien planeado debe permitir al investigador
medir diferencias en los tratamientos con el grado de precisin esperado evitando para ello
comete errores al montar el ensayo y en su misma ejecucin. Esto debe ser una tarea de
primer orden por parte del investigador. Es por ello que se debe tener especial cuidado en la
conduccin y manejo del experimento.
1.9.4. Control efectivo de las medidas y observaciones. Es necesario hacer anotaciones
de las manifestaciones de las unidades experimentales que permitan explicar ciertos
aspectos del experimento.


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

1.10. Anlisis de Varianza
Anlisis de Varianza conocido tambin como ANDEVA o ANOVA, es la particin de la
variabilidad total en fuentes de variacin conocida, fuentes de variacin que se declaran en
un modelo aditivo lineal por lo tanto, una salida de varianza se corresponde con un modelo
aditivo lineal.
De forma general los diseos experimentales como tal se dividen en dos grupos: diseos
experimentales simples y diseos experimentales complejos.
Entre los diseos experimentales simples se tiene al Diseo Completamente al Azar,
Diseo en Bloques Completamente al Azar, Diseo Cuadrado Latino principalmente, a
stos tambin se les conoce como diseos clsicos.

2. DISEO COMPLETAMENTE AL AZAR (DCA) O DISEO CON UN SOLO
CRITERIO DE CLASIFICACIN

Este diseo es el ms simple de todos; en l se asigna al azar los tratamientos a grupos de
unidades experimentales previamente determinadas. Asimismo, todas las variables, excepto
las que estn en estudio se mantienen constantes.
2.1. Cundo utilizar este Diseo?
Este diseo se utiliza cuando las unidades experimentales son homogneas, o sea, que la
nica diferencia que existe son los tratamientos que se aplican a las unidades
experimentales. Este diseo se usa cuando se estudia dos o ms tratamientos bajo las
siguientes condiciones:
- Lugar y unidades experimentales muy uniformes (suelo homogneo, en
laboratorios, invernaderos, galpones, etc.), donde no hay heterogeneidad necesaria
de absorber.
- Cuando sea probable que una parte del experimento se pierda.
- Cuando se tiene un experimento pequeo y donde la mayor precisin de otras
distribuciones no compensan la prdida de grados de libertad en el error.
Este tipo de diseo proporciona el mximo nmero de grados de libertad para la estimacin
del error experimental; adems, no requiere estimar datos faltantes, es decir, puede
analizarse con diferente nmero de repeticiones por tratamiento (diseo desbalanceado).
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

2.2. Modelo Aditivo Lineal del DCA
El concepto de modelo lineal es una rplica de algo; as como un edificio puede ser
representado en una maqueta. Debe evitarse el error de creer que el modelo lineal es el
mundo real; ya que slo es una abstraccin de una realidad que existe en la mente del
hombre con el objetivo de ayudarse en el anlisis de los procesos naturales que afectan por
diversos factores a fuentes de variacin y que dichos modelos son de naturaleza transitoria
y son susceptibles a mejorarse.
La consideracin bsica para un diseo Completamente al Azar es que las observaciones
pueden representarse por medio del modelo estadstico lineal que es el siguiente:

Donde:
Yij = Variable Respuesta
= Efecto comn a todas las observaciones
Ti = Efecto del i-simo tratamiento, i = 1, 2, 3.., t tratamientos
Eij = Erro experimental o error del modelo
2.3. Supuesto del Anlisis de Varianza
Todos los anlisis estadsticos se basan en supuestos y en caso del anlisis de varianza son:
Homogeneidad de Varianza, Normalidad, Aditividad y Linealidad del Modelo, e
Independencia.
2.3.1. Homogeneidad de Varianza:
Las varianzas de las diferentes medas deben ser homogneas. Por lo general, en el anlisis
de varianza, se utiliza un promedio de n varianza (CME) para obtener la mejor
estimacin de la varianza comn. Pero, si las varianzas dentro de los tratamientos fuesen de
hecho distintas, no se tendra justificacin para combinarlas, ya que el promediar varianzas
de tratamientos mayores y menores podra proporcionar resultados engaosos. La
diferencia entre dos tratamientos con varianzas grandes puede ser considerada significativa
cuando en realidad sta puede haber ocurrido por casualidad. Por otra parte, la diferencia
entre dos tratamientos con varianzas pequeas puede ser declarada no significativa cuando
en verdad lo es.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Existen muchas tcnicas para probar homogeneidad de varianza, como la prueba de
Bartlett, Prueba de F, propuesta por R.A. Fischer. Por la rapidez de esta ltima prueba se
propone la misma para efecto del curso, lo cual no desmerece ninguna otra prueba.
La prueba de F propuesta por Fischer se basa en lo siguiente:

()

()

La prueba de hiptesis que se emplea es la siguiente:
Ho:


Ha:


La regla de decisin es la siguiente:
No Rechazo de Ho si Fc s Fo (m-1, n-1)gl. Esto quiere decir que las varianzas son
homogneas.
RHo si Fc > Fo (m-1, n-1)gl, lo cual indica que las varianza no son homogneas.
Box (S/F; citado por Calzada Benza, 1970) mencion que si la razn entre la varianza
mayor y la varianza menor es menor de cuatro, se puede considerar que hay suficiente
homogeneidad de varianza, siendo ste posiblemente un criterio ms rpido para probar
homogeneidad de varianza.
2.3.2. Normalidad:
Los trminos del error son aleatorios, independientes y normalmente distribuidos. Este
supuesto es de gran importancia ya que cuando los datos no se distribuyen normalmente los
coeficientes de variacin son muy elevados. Cuando los datos de una variable no presentan
normalidad, existen algunas tipos de transformaciones en dependencia de la caracterstica
de los datos de la variable en cuestin que la hacen normal.
En verdad este supuesto va ms all de lo planteado, ya que a la distribucin normal se le
conoce tambin como la Ley Normal de los Errores y plantea que errores pequeos tienen
alta probabilidad de ocurrencia en contra posicin a los errores grandes respecto a la media
que tienen baja probabilidad de ocurrencia.
Para probar normalidad tambin existen varias tcnicas entre las que se pueden mencionar
la prueba de Shapiro-Wilk y la de Lilliefors. Si el lector est interesado en profundizar
sobre estas pruebas se le sugiere consultar a Ramrez y Lpez (1993; Mtodos Estadsticos
no Paramtricos)
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

2.3.3. Aditividad y Linealidad del Modelo:
Lo anterior se cumple en el modelo aditivo lineal ya que todos los efectos se suman y son
lineales porque cada uno de los elementos del modelo lineal, estn a la potencia "1".
2.3.4. Independencia:
Est e supuest o i mpl i ca que l os t rmi nos del error son aleatorios, no
correlacionados (independientes) normalmente distribuidos; adems, de las varianzas y las
medias de las distintas muestras.
2.4. Anlisis de varianza para este Diseo
El anlisis de varianza consiste en la particin de la variacin total en fuentes de variacin
conocidas y la que no es conocida se atribuye al

error. El anlisis de varianza separa parte de
la varianza causada por efectos accidentales, no sistemticos (error experimental o
simplemente error) de los causados por efectos sistemticos conocidos (tratamientos).
Antes de mostrar la tabla de anlisis de varianza para e s t e di se o se mues t r a a
c ont i nuaci n un c ua dr o de concentracin de informacin (Cuadro 1) y
posteriormente las ecuaciones trabajo para el mismo.

Cuadro 1. Concentracin de los datos para un Diseo Completamente al Azar con i
tratamiento y j repeticiones.

TRATAMIENTOS
REPETICIONES
Y
i.

1 2 3 j
1 Y
11
Y
12
Y
13
Y
1j
Y
1
.
2 Y
21
Y
22
Y
23
Y
2j
Y
2
.
3 Y
31
Y
32
Y
33
Y
3j
Y
3
.
i Y
i1
Y
i2
Y
i3
Y
ij
Y
i
.
Y
.j
Y
.1
Y
.2
Y
.3
Y
.j
Y..


El modelo lineal para este diseo tiene solo dos fuentes de variacin y es el siguiente:

Las fuentes de variacin son las debidas a los tratamientos y las no debidas a
los tratamientos. La media poblacional no se considera como fuente de
variacin ya que se considera como el efecto comn a todas las observaciones
y es por eso que cuando se calcula las sumas de cuadrados se le resta el factor
de correccin que no es ms que la media o efecto comn de manera que solo
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

queda la variacin debida a la fuente de variacin en cuestin.
El modelo aditivo de un Diseo Completamente al Azar se corresponde con las
salidas de varianza que se muestran en los Cuadro 2 y 3.

Cuadro 2. Salida de varianza para un Diseo Completamente al Azar con igual
nmero de repeticiones (diseo balanceado).

F.V gl SC CM Fc Ft
Tratamiento t-1 SCTRAT.

( )
Error t(r-1) SCError

( )


Total tr-1 SCTotales

Donde:
F.V = Fuente de variacin
gl = Grados de libertad
SC = Suma de Cuadrados
CM = Cuadrado Medio
Fc = F calculado
Ft (o, grados de libertad de tratamientos, grados de libertad del error) = F tabulado que
se encuentra en la tabla de F a un nivel de significancia o (probabilidad de error tipo I),
grados de libertad de los tratamientos y grados de libertad del error
En caso de que los tratamientos tengan diferentes nmero de repeticiones (diseo
desbalanceado) la salida de varianza es la siguiente:

Cuadro 3. Salida de varianza para un Diseo Completamente al Azar con igual
nmero de repeticiones (diseo desbalanceado).

FV gl SC CM Fc Ft
Tratamiento t-1 SCTRAT.


( )
Error n-t SCError




Total n-1 SCTotales

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

2.4.1. Ecuaciones de trabajo

; Factor de correccin si el experimento es balanceado


; Factor de correccin si el experimento es desbalanceado


; Suma de cuadrados totales


; Suma de cuadrado de tratamiento si el experimento es balanceado


; Suma de cuadrados si el experimento es desbalanceado


; Suma de cuadrados del error

2.4.1. Prueba de Hiptesis en el Anlisis de Varianza de un Diseo Completamente al
Azar
En el anlisis de varianza de este diseo se prueba el siguiente juego de hiptesis
estadsticas:
Ho:
1
=
2
=
3
=
i
(T
1
= T
2
= T
3
= T
i
). Esto es lo mismo que:
Ho:
1
-
2
-
3
-
i
= 0 (T
1
- T
2
- T
3
- T
i
= 0).
Ha:
1
-
2
-
3
-
i
= 0 (T
1
= T
2
= T
3
= T
i
).

La hiptesis nula asume el efecto de igual, es decir, que los tratamiento ejercen el mismo
efecto sobre la variable respuesta. Esta es la hiptesis que se somete a prueba y, la hiptesis
alternativa, en su esencia, es la que contradice a la hiptesis nula.
Dado que la hiptesis nula es la que se somete a prueba, entonces puede ser aceptada o
rechazada, si no es rechazada significa que no existe la suficiente evidencia experimental para
hacerlo, en caso de rechazarse, de inmediato se acepta la hiptesis alternativa. Para saber
cundo aceptar o rechazar la hiptesis nula se toma en cuenta la siguiente regla de decisin:

- No Rechazo de Ho (NRHo) si Fc s Ft (F de tablas)
- Rechazo de Ho (Rho) si Fc > Ft (F de tablas),es decir, que Ha es verdadera




Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

2.5. Interpretacin de Resultados
Para una mejor ilustracin de la interpretacin de los resultados de un anlisis en este
diseo, se muestra a continuacin el siguiente ejemplo:
Los datos que se muestran a continuacin corresponden a un estudio donde se
experimentaron con cinco variedades de tomate industrial bajo un diseo completamente al
azar con cuatro repeticiones donde la variable respuesta, entre otras, fue el peso del jugo de
tomate en gramos. Se est interesado en verificar si existen diferencias estadsticas a un
=0.05 entre las variedades de tomates evaluadas.
La informacin obtenida fue la siguiente:
Cuadro 4. Peso de jugo (gramos) de tomate obtenido de cinco variedades de tomate
industrial.
Variedades
Repeticiones
1 2 3 4
Mart 656.3 718.4 586.6 746.2
Topacio 784.4 713.4 915.8 629.6
Estela 924.5 822.8 824.2 978.5
VF-134 534.4 685.1 567.2 655.5
UC - 82 640.7 658.8 532.7 614.4
Adaptado de Pedroza (1998)
En el mismo cuadro de informacin se pueden incluir los totales de tratamiento como
tambin sus varianzas por cada uno de ellos como se muestra en el Cuadro 5.
Cuadro 5. Peso de jugo (gramos) de tomate obtenido de cinco variedades de tomate
industrial con sus totales y varianzas por tratamiento.
Variedades
Repeticiones
Yi. Si
1 2 3 4
UC - 82 640.7 658.8 532.7 614.4 2446.6 3102.56
Mart 656.3 718.4 586.6 746.2 2707.5 5034.40
VF-134 534.4 685.1 567.2 655.5 2442.2 5085.42
Estela 924.5 822.8 824.2 978.5 3550.0 5947.66
Topacio 784.4 713.4 915.8 629.6 3043.2 14680.72

Revisando el supuesto de homogeneidad de varianza y tomando en cuenta lo propuesto por
R. A. Fischer, se relaciona la varianza mayor con la varianza menor, en este caso varianza
del tratamiento correspondiente a la variedad Topacio y la del tratamiento de la variedad
UC-82. Probando Entonces:
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

= 4.7318, (F
0.05
, 3 ,3 =9.277) lo cual hace que no se rechace la hiptesis de
igualdad de varianza lo cual indica que las varianzas de los tratamientos (variedades) son
iguales estadsticamente.
Comenzando a realizar el anlisis de varianza y partiendo del hecho que

,
se tiene lo siguiente:

. Este no es ms que una estimacin de elevada al cuadrado,


es por ello que no se declara como fuente de variacin en la salida de varianza de los
modelos aditivos lineales, adems se debe recordar que varianza desde el punto de variable
aleatoria es: E(X-) que es lo mismos que: E(X) - .
( )

(



Es importante recordar que ninguna de estas sumas de cuadrados puede ser negativas por
ser componentes de varianza y recuerde que varianza no es ms que el promedio de las
desviaciones al cuadrado de una variable respecto a su media y por otra parte, ninguna
suma de cuadrados puede ser mayor que la suma de cuadrados totales.
Adems se puede observar que la Suma de Cuadrados del Error se obtiene por diferencia
entre la Suma de Cuadrados Totales y la de Tratamiento. Esto es producto de la aplicacin
misma de lo que es anlisis de varianza.
Una vez obtenidas las sumas de cuadrados correspondientes, el siguiente paso es construir
la tabla de anlisis de varianza (salida de varianza) la cual queda como se muestra en el
Cuadro 6 una vez que se han determinado los cuadrados medios, el Fc F calculado y el
Ft F de tabla. Adems, es recomendable que esta tabla vaya acompaada del Coeficiente
de Variacin (C.V) el cual se define como la relacin entre la raz cuadrada del Cuadrado
Medio del Error y el Promedio de la Variable respuesta o en estudio.
(

)
(

)
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 6. Salida de varianza para los datos del Cuadro 4.
FV gl SC CM Fc Ft (0.05, 3, 16)
Variedades 3 218983.21 72994.4033 11.50058 3.05556828
Error 16 101552.267 6347.01672

Total 19 320535.477
C.V. = 11.60%
Si se toma en cuenta el juego de hiptesis de este diseo y la regla de decisin se puede
concluir que se rechaza la hiptesis ya que el Fc es mayor que el Ft. A manera de
conclusin se puede decir lo siguiente:
Con un 95% de confiabilidad se concluye que al menos unos de los tratamientos
(variedades de tomates) evaluados ejercen un efecto distinto (P 0.05) sobre la variable
respuesta (peso del jugo de tomate).
Ahora la pregunta es: Cul es ( o son) ese (esos) tratamiento (s) que hizo (hicieron)
rechazar la hiptesis nula?. Esta interrogante no la responde el anlisis de varianza ya que
ste solo prueba si existe o no efecto de la variable independiente sobre la dependiente. Es
por ello que se deben hacer otros anlisis para responder esta interrogante.
Para responder a estas interrogantes existen dos tcnicas principalmente que son las
pruebas a priori o Contrastes Ortogonales y las pruebas a posteriore u obligadas por los
datos llamadas tambin Pruebas de Rangos Mltiples o Separacin de Medias. Estas
ltimas por el grado de uso que tienen en las investigaciones de ndole experimental son
las que se desarrollan a continuacin.

2.6. Pruebas obligadas por los Datos o de Rangos Mltiples
Cuando el anlisis de varianza de un experimento reporta diferencias significativas y son ms
de dos tratamiento, es necesario saber quin produjo el ruido en la prueba de hiptesis que
provoc que la hiptesis nula sea rechazada. Para este fin, existen las llamadas pruebas de
Rangos Mltiples. Entre estas pruebas estn:
Diferencia Mnima Significativa (DMS) (LSD)
Mtodo de Duncan
Mtodo de Student-Newman-Keuls (SNK)
Mtodo de Tukey (Diferencia Significativa Honesta)
Mtodo de Scheff.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cada uno de estos procedimientos de comparacin de medias est basado en un
conj unt o de suposi ci ones, y son usualmente efectivos para fines especficos.
En cualquiera de los casos la hiptesis nula supone la igualdad de las medias y la
alternativa lo contrario y se utilizan siempre y cuando en el anlisis de varianza se rechace la
hiptesis nula. Lo anterior indica que la prueba de hiptesis que se hace es la siguiente:
Ho: | |
Ha: | |=
La hiptesis nula, que es la que se prueba, asume el efecto de igualdad de los promedios a
comparar, es por ello que la diferencia es igual a cero y por lo tanto, la hiptesis alternativa
contradice la hiptesis nula con una desigualdad. Dado que para realizar una separacin de
medias lo primero que se hace una vez obtenidos los promedios es ordenarlos a stos de
forma descendente por lo tanto la regla de decisin se puede establecer de la siguiente
forma:
NRHo = s | |
RHo: Si > | |

2.6.1. Diferencia Mnima Significativa (DMS)
Esta prueba solo debe usarse para comparar medias adyacentes en un arreglo ordenado,
medias por orden de magnitud (de mayor a menor). Cuando DMS se usa
indiscriminadamente para probar todas las diferencias posibles entre las diversas medias,
ciertas diferencias sern significativas, pero no al nivel de significancia que se ha elegido.
El nmero posible de comparaciones de medias tomadas de dos en dos a la vez es igual a
()

. Los especialistas hacen mencin que este mtodo es adecuado para comparar un
tratamiento estndar (testigo) con otros tratamientos.
Esta prueba utiliza un solo comparador y su frmula es la siguiente:

, donde:
DMS = Es el valor crtico de la prueba
to/2 = Valor tabular de t de student para los grados de libertad del error obtenido a un
o/2.
r = nmero de repeticiones
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

2.6.2. Mtodo de Duncan
Esta prueba es ampliamente utilizada entre las di versas pruebas de Rangos
Ml t i pl es. Su mt odo es de naturaleza secuencial, lo que quiere decir, que utiliza un
nuevo valor estudentizado, para cada una de las comparaciones de medias adyacentes
ordenadas por magnitud en orden descendente.
Esta prueba incluye el clculo de las diferencias significativas mnima entre las medias de
tratamiento cuando stas se encuentran dispuestas en orden de magnitud. La frmula
es la siguiente:


Donde:

Es el valor extrado de una tabla especial de rango estudentizado, con los grados de
libertad del error y con la disposicin relativa de las medias en el arreglo.
CMError = Cuadrado Medio del Error
r = Nmero de repeticiones.

2.6.3. Mtodo de Student-Newman-Keuls (SNK)
Es una prueba de carcter secuencial, es decir, que utiliza un nuevo valor estudentizado
para cada comparacin.
Para el clculo de esta prueba se requiere determinar la diferencia mnima significativa
entre las medias del tratamiento cuando stas se encuentran dispuestas en orden de
magnitud. Su frmula es la siguiente:

;
Donde:
qo = Valor obtenido de tablas especiales de rango estudentizado, para los grados de
libertad del error y con la disposicin relativa de las medias en el arreglo
CMError = Cuadrado medio del error
r = nmero de repeticiones


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

2.6.4. Mtodo de Tukey
Este mtodo es un procedimiento basado en el rango

estudentizado

, pero no es secuencial, ya
que utiliza un slo comparador de q ordinario. Sin embargo, el mtodo de Tukey es til en
situaciones en que se desea hacer un primer nfasis en el uso del experimento con un total para
determinar la significancia de los pares de medias. Esta prueba slo es exacta cuando los
grupos tienen igual nmero de elementos y para medias que no han sido ajustadas por
covarianza. Esta prueba se define de la siguiente manera:


Donde:
qo = Valor obtenido de tablas especiales de rango estudentizados, para los grados de
libertad del error y con la disposicin relativa de las medias en el arreglo
CMError = Cuadrado medio del error
r = nmero de repeticiones

2.6.5. Mtodo de Scheff
Se considera un mtodo bastante general que utiliza la distribucin de F de Snedecor. El
mtodo de Scheff puede aplicarse para probar hiptesis generales de que una funcin
lineal de las medias poblacionales es igual a cero. En contraste con las comparaciones
mltiples basadas en rangos estudentizados, el mtodo de Scheff es un mtodo exacto para
medias provenientes de medias de igual o desigual tamao y para medias que han sido
ajustadas por covarianza. Para el clculo se requiere determinar la mnima diferencia
significativa entre las medias de los tratamientos cuando stos se encuentran ordenados en
orden de magnitud. Su valor crtico se determina a travs de la siguiente expresin:
( ) (


Donde:
t = Nmero de tratamientos
F = Valor que se obtiene de la distribucin de F de Snedecor con t-1 y los grados de
libertad del error.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

CError = Cuadrado medio del error, y ri, rj representan el nmero de observaciones usadas
para calcular cada media muestra
De forma general para realizar una comparacin o separacin de medias una vez que se ha
realizado el anlisis de varianza y se ha verificado que existe un rechazo de la hiptesis
nula, se debe seguir el siguiente procedimiento:
- Obtener los promedios de las fuentes de variacin de inters (tratamiento, factor)
- Ordenar los promedios de forma descendente
- Seleccionar la prueba de rangos mltiples a usar
- Determinar el valor crtico de la prueba de seleccionada
- Establecer las comparaciones a realizar segn la prueba seleccionada
- Determinar las diferencias de medias de acuerdo a las comparaciones establecidas
- Contrastar las diferencias de medias con el valor crtico de la prueba
- Establecer el rango de mrito
- Emitir conclusiones segn el rango de mrito
Ejemplo.
A continuacin se aplican todas las pruebas de rangos mltiples antes expuestas de manera
que se pueda realizar una comparacin entre stas. Los promedios por tratamiento son los
que se muestran en el Cuadro 7.
Cuadro 7. Medias por tratamientos y Medias ordenadas por magnitud descendente.
Variedades Totales Promedios Variedades Promedios Ordenados
UC - 82 2446.6 611.65 Estela 887.50
Mart 2707.5 676.88 Topacio 760.80
VF-134 2442.2 610.55 Mart 676.88
Estela 3550.0 887.50 UC - 82 611.65
Topacio 3043.2 760.80 VF-134 610.55

Aplicando DMS a un nivel de significancia o = 0.05 que es el mismo nivel de significancia
que se utiliz para el anlisis de varianza, adems de la siguiente informacin:
CMError = 6347.01672
r = 4
t
o/2(16)
= 2.1199
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior


Por lo tanto el valor crtico de la prueba es de .
A continuacin se presentan en el Cuadro 8 las comparaciones a realizar, las diferencias
entre las medias y el resultado de comparar estas diferencias con el valor crtico de la
prueba de DMS.
Cuadro 8. Resultado de la prueba de DMS para los tratamientos estudiados.
Comparaciones Diferencias de Medias Comparacin segn DMS
Estela versus Topacio 126.70 *
Estela versus Mart 210.63 *
Estela versus UC-82 275.85 *
Estela versus VF-134 276.95 *
Topacio versus Mart 83.93 ns
Topacio versus UC-82 149.15 *
Topacio versus VF-134 150.25 *
Mart versus UC-82 65.23 ns
Mart versus VF-134 66.33 ns
UC-82 versus VF-134 1.10 ns
ns = No significativo * = significativo

Las comparaciones se pueden resumir de acuerdo al siguiente rango de mrito
Variedades Comparacin segn DMS
Estela a
Topacio b
Mart bc
UC - 82 c
VF-134 c
Promedios con literales distintas son estadsticamente diferentes segn el mtodo de DMS (P 0.01).
Interpretando los resultados de la separacin o comparacin de medias segn DMS se
puede decir que la variedad que present mejor comportamiento respecto al peso de jugo
fue Estela con un promedio de 887.50 gramos, promedio que fue diferente (P < 0.05)
estadsticamente a las dems variedades evaluadas. Topacio present comportamiento
estadsticamente igual (P > 0.05) a Mart pero distinto (P < 0.05) a UC-82 y VF-134; estas
tres ltimas se comportaron de igual manera (P > 0.05).

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Aplicando el mtodo de Duncan
Para realizar la prueba de Duncan lo primero que se debe hacer es obtener los valores
estudentizados (

) extrados de la tabla de Duncan con los grado de libertad del error y


con la disposicin relativa de las medias, en este caso, con 5, 4, 3 y 2. Los valores de la
tabla de Duncan y al aplicar su ecuacin,

, se tienen los resultados que


se muestran en el Cuadro 9.
Cuadro 9. Valores estudentizado extrado de la tabla de Duncan y valores crticos de
la prueba segn el nmero de medias a comparar.
Medias a comparar
Nmero de Medias
2 3 4 5
R(0.05, 16) 3 3.15 3.23 3.3
RMS 119.50 125.48 128.66 131.45

Aqu se puede ver el efecto secuencial de Duncan ya que utiliza un comparador distinto
segn el nmero de medias a comparar.
Los resultados de aplicar la prueba son los siguientes:
Cuadro 10. Contrastacin de las diferencias entre medias adyacentes con los valores
crticos de Duncan.
Variedades/Promedios
Estela Topacio Mart UC - 82 VF-134
Valores
Crticos de
Duncan 887.50 760.80 676.88 611.65 610.55
Estela 887.50 0 126.70 ns 210.63* 275.85* 276.95* 131.45
Topacio 760.80 0 83.93ns 149.15* 150.25* 128.66
Mart 676.88 0 65.23 ns 66.33 ns 125.48
UC - 82 611.65 0 1.10 ns 119.50
VF-134 610.55 0
ns = No significativo * = significativo








Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Lo anterior se resume en el siguiente rango de mrito:
Variedades Comparacin segn Duncan
Estela a
Topacio ab
Mart bc
UC - 82 c
VF-134 c
Promedios con literales distintas son estadsticamente diferentes segn el mtodo de Duncan (P 0.05).

Como se puede observar, en este caso los resultados obtenidos son un poco diferentes a los
obtenidos con DMS, en este caso, Estela ejerce el mismo comportamiento que Topacio,
por lo dems, la interpretacin es la misma.
Aplicando la prueba de SNK:
Al igual que la prueba de Duncan, SNK es una prueba secuencial lo que indica que utiliza
un valor diferente para cada comparacin de acuerdo al nmero de medias a comparar. Los
valores qo y valores crticos de SNK al aplicar la ecuacin,

, se
muestran en el Cuadro 11.
Cuadro 11. Valores estudentizados de la tabla de SNK de acuerdo al nmero de
medias adyacentes a comparar y valores crticos de la prueba de SNK.
Medias a comparar
Nmero de Medias
2 3 4 5
q(0.05, 16) 3 3.65 4.05 4.33
RMS 119.50 145.39 161.33 172.48

Los resultados al aplicar la prueba de rangos mltiples de SNK se resumen en el Cuadro 12.
Cuadro 12. Resultados de la comparacin de medias segn el mtodo de SNK.
Variedades/Promedios
Estela Topacio Mart UC - 82 VF-134
Valores
Crticos
de SNK
887.50 760.80 676.88 611.65 610.55
Estela 887.50 0 126.70 ns 210.63* 275.85* 276.95* 172.48
Topacio 760.80 0 83.93 ns 149.15 ns 150.25 ns 161.33
Mart 676.88 0 65.23 ns 66.33 ns 145.39
UC - 82 611.65 0 1.10 ns 119.50
VF-134 610.55 0
ns = No significativo * = significativo
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Lo anterior se resume en el siguiente rango de mrito.
Variedades Comparacin segn SNK
Estela a
Topacio ab
Mart b
UC - 82 b
VF-134 b
Promedios con literales distintas son diferentes segn el mtodo de SNK (P 0.05)
En este caso, los resultados de aplicacin del mtodo de SNK varan con respecto a Duncan
y por ende con DMS, la interpretacin es la misma.

Aplicando el Mtodo de Tukey
Tukey no es un mtodo secuencial, es decir, que utiliza un solo valor estudentizado para
obtener el valor crtico de prueba, utiliza la misma tabla que SNK pero con el nmero
mximo de medias a comparar.
Aplicando ahora el mtodo de Tukey o Diferencia Honesta Mnima se tiene lo siguiente:


qo(0,05, 5, 16) = 4.33


Los resultados de contrastar la diferencia de medias ordenadas con el valor crtico de la
prueba de Tukey se muestra en el Cuadro 13.






Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 13. Resultados de la aplicacin de la prueba de Tukey a los promedios de los
tratamientos estudiados.
Comparaciones Diferencias de Medias
Resultados de la comparacin
segn Tukey
Estela versus Topacio 126.7 ns
Estela versus Mart 210.625 *
Estela versus UC-82 275.85 *
Estela versus VF-134 276.95 *
Topacio versus Mart 83.925 ns
Topacio versus UC-82 149.15 ns
Topacio versus VF-134 150.25 ns
Mart versus UC-82 65.225 ns
Mart versus VF-134 66.325 ns
UC-82 versus VF-134 1.1 ns
ns = No significativo * = significativo

Resumiendo los resultados del Cuadro 13 en un rango de mrito se tiene lo siguiente:
Variedades Comparacin segn Tukey
Estela a
Topacio ab
Mart b
UC - 82 b
VF-134 b
Promedios con literales distintas son estadsticamente diferentes segn el mtodo de Tukey (P 0.05).

Aplicando el Mtodo de Scheff

La prueba de Scheff al igual que Tukey no es una prueba secuencial por lo tanto solo
utiliza un valor de F de Snedecor que se extrae un nivel de significancia o, para el caso
del ejemplo o = 0.05, con los grado de libertad de tratamientos y los del error experimental,
que son los mismos del ANDEVA. Aplicando la ecuacin de Scheff,

( ) (

, se obtiene los resultados que se muestran en el


Cuadro 14 siguiente:
F(0.05, 4, 16) =
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior


( ) (



Cuadro 14. Resultados de la aplicacin de la prueba de Scheff a los promedios de los
tratamientos estudiados.
Comparaciones Diferencias de Medias
Resultados de la comparacin
segn Scheff
Estela versus Topacio 126.7 ns
Estela versus Mart 210.625 *
Estela versus UC-82 275.85 *
Estela versus VF-134 276.95 *
Topacio versus Mart 83.925 ns
Topacio versus UC-82 149.15 ns
Topacio versus VF-134 150.25 ns
Mart versus UC-82 65.225 ns
Mart versus VF-134 66.325 ns
UC-82 versus VF-134 1.1 ns
ns = No significativo * = significativo

Resumiendo los resultados del Cuadro 14 en un rango de mrito se tiene lo siguiente:
Variedades Comparacin segn Scheff
Estela a
Topacio ab
Mart b
UC - 82 b
VF-134 b
Promedios con literales distintas son estadsticamente diferentes segn el mtodo de
Scheff (P 0.05).

2.7. Cundo, Porqu y Cul Prueba de Rangos Mltiples Utilizar?

Todas las pruebas de rangos mltiples o separacin o comparacin de medias se utilizan
siempre y cuando en el anlisis de varianza se rechace la hiptesis ya que este anlisis solo
detecta si existe efecto o no de los tratamientos sometidos a consideracin pero no indica
cul o cules son los tratamientos responsables de este rechazo.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

En el Cuadro 15 se resumen los resultados obtenidos por cada una de las pruebas de
separacin de medias aplicados con el mismo experimento.

Cuadro 15. Resumen de los resultados obtenidos al aplicar las pruebas de rangos
mltiples de DMS, Duncan, SNK, Tukey y Scheff.
Variedades
Prueba de Rangos Mltiples
DMS Duncan SNK Tukey Scheff
Estela a a a a a
Topacio b ab ab ab ab
Mart bc bc b b b
UC - 82 c c b b b
VF-134 c c b b b
Promedios con literales distintas son estadsticamente diferentes (P 0.05).

Segn Martnez Garza (1994) el mtodo de Scheff es ms riguroso para detectar
diferencias significativas y esto se demuestra con los resultados expuestos en el Cuadro 15,
(aunque en este caso coincide tanto con SNK y Tukey debido al nmero de medias que se
compararon, es decir, que si hubieran sido ms medias estos resultados probablemente
seran distintos) es por ello que se recomienda usarlo a un o = 0.1. Por otra parte se ha
podido observar que tanto SNK como Tukey tiende a no detectar diferencias estadstica
donde DMS y Duncan lo han hecho con diferencias mayores.
Una discusin ms fundamentada sobre las separaciones de medias puede encontrarse en
Steel y Torrie (1992) en su obra Bioestadstica: Principios y Procedimientos pero s se
puede deducir que para experimentos en fases exploratorias es recomendable usar pruebas
que no sean tan rigurosas como es DMS, Duncan e inclusive SNK, sin embargo, si este no
es el caso y los promedios no han sido corregidos por efecto de covariable, es
recomendable Tukey y si se requiere una prueba ms rigurosa sin importar si el
experimento es balanceado o no, si los promedios ha sido corregido o no por covariable, es
recomendable usar Scheff.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

3. DISEO EN BLOQUES COMPLETAMENTE AL AZAR (BCA) O CON DOS
CRITERIOS DE CLASIFICACIN
No siempre el material experimental es homogneo limitando en este caso el uso del
Diseo Completamente al Azar (DCA). En estos casos es recomendable usar el Diseo en
Bloques Completamente al Azar.
3.1. Cundo utilizar este diseo?
Este diseo se utiliza cuando el material experimental presenta un factor de estorbo que
no es de inters estudiar pero que s puede afectar los resultados conllevando a conclusiones
erradas o bien los llamados efectos enmascarados. Tiene como principio maximizar la
variabilidad entre bloques y minimizar la variabilidad interbloque o variabilidad interna.
Esto se logra ya que las unidades experimentales dentro de cada bloque son homogneas
pero son heterogneas entre bloques.
Si se habla de un diseo en Bloques Completamente al Azar, deben existir tantas unidades
experimentales dentro de cada bloque como tratamientos se tenga, de manera que cada
tratamiento tenga una repeticin en cada bloque (principio de bloqueo). Esto al mismo
tiempo se vuelve una desventaja para este diseo ya que si se pierde una unidad
experimental o ms, se rompe el principio de bloqueo ya que los tratamientos no tendran el
mismo nmero de repeticiones dentro de cada bloque. Es por ello que en este caso para
analizar este diseo se deben estimar los datos perdidos conllevando a prdidas de grados
de libertad en el error y por ende a un aumento del cuadrado medio del error.
3.2. Modelo Aditivo Lineal de un BCA
El modelo aditivo lineal para este diseo es el siguiente:

Donde:
Yij = Variable respuesta
= Efecto comn a todas las observaciones
Bj = Efecto de la j-sima repeticin; j = 1, 2, 3,...r repeticiones
Ti = Efecto del j-simo tratamiento; i = 1, 2, 3, i, tratamiento
Eij = Error experimental


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

3.3. Anlisis de Varianza para un BCA
Antes de exponer la salida de varianza y las ecuaciones de trabajo, se presenta un cuadro de
concentracin o vaciamiento de informacin.
Cuadro 16. Concentracin de los datos para un Diseo en Bloques Completamente al
Azar (BCA).

TRATAMIENTOS
BLOQUES
Y
i.

1 2 3 j
1 Y
11
Y
12
Y
13
Y
1j
Y
1
.
2 Y
21
Y
22
Y
23
Y
2j
Y
2
.
3 Y
31
Y
32
Y
33
Y
3j
Y
3
.
i Y
i1
Y
i2
Y
i3
Y
ij
Y
i
.
Y
.j
Y
.1
Y
.2
Y
.3
Y
.j
Y..

La salida de varianza de este diseo y de acuerdo a su modelo aditivo lineal es el siguiente:

Cuadro 17. Salida de varianza para un diseo en Bloques Completamente al Azar.
F.V gl SC CM Fc Ft
Bloque r-1 SCBloque CMBloque


( )
Tratamiento t-1 SCTRAT. CMTRAT.

( )
Error (t-1)(r-1) SCError CMError

Total tr-1 SCTotales

En este diseo se prueban dos juegos de hiptesis uno para bloques y otros para
tratamientos. Estas hiptesis son las siguientes:
- Para tratamiento
Ho:
1
-
2
-
3
-
i
= 0 (T
1
- T
2
- T
3
- T
i
= 0)
Ha:
1
-
2
-
3
-
i
= 0(T
1
- T
2
- T
3
- T
i
= 0).
- Para Bloques
Ho: B
1
- B
2
- B
3
- B
j
= 0 (B
1
- B
2
- B
3
- Bj

= 0)
Ha: B
1
- B
2
- B
3
- B
j
= 0 (B
1
- B
2
- B
3
= Bj = 0).
Las ecuaciones de trabajo para realizar el anlisis de varianza de este diseo son las
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

siguientes:

; Factor de Correccin


( )
Ejemplo:
Se llev a cabo un experimento bajo un arreglo en bloques completamente al azar donde se
probaron el efecto siete tratamientos en el rendimiento (tn/ha) de una variedad de caa de
azcar. Realice el anlisis de varianza correspondiente a un o = 0.05 con la siguiente
informacin:
Cuadro 18. Rendimiento (tn/ha) en una variedad de caa de azcar sometida al efecto
de siete tratamientos.
Tratamientos I II III Yi.
1 63.08 51.99 43.43 158.5
2 44.38 49.77 40.29 134.44
3 58.65 52.31 41.84 152.8
4 52.31 59.28 46.28 157.87
5 52.31 53.89 47.55 153.75
6 49.45 32.65 34.55 116.65
7 50.72 57.06 42.80 150.58
Y.j 370.9 356.95 296.74 1024.59
Adaptado de Guzmn (2009)

Aplicando las ecuaciones de trabajo se tiene lo siguiente:

()



(63.08 + 51.99 +42.80) - = 1234.124

(


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior


(


( )

Cuadro 19. Salida de varianza para el ejemplo de Diseos en Bloques Completamente
a Azar.
FV gl SC CM Fc Ft (0.05)
Bloques 2 443.7882 221.8941 8.3866913 3.88529383
Tratamientos 6 472.8412 78.8068667 2.9785779 2.99612038
Error 12 317.4946 26.4578833

Total 20 1234.124

Interpretacin de Resultados
Es necesario recalcar que en un diseo de bloques completamente al azar la variable que se
est bloqueando no es de inters estudiar, en este caso, se est interesado en el efecto que
ejercen los tratamientos en el rendimiento de la variedad de caa de azcar.
Cuando se establece un diseo en bloques completamente al azar, es necesario estar seguro
que en verdad el factor de estorbo existe, caso contrario se pierde grados de libertad en el
error, lo cual hace que las diferencias dentro de los tratamientos (error experimental) sean
mayores con las consecuencias que corresponden ya que se aumenta en el cuadrado medio
del error.
Para el caso del ejemplo, se puede verificar en la salida de varianza que existe diferencias
significativas (P < 0.05) en bloques lo cual indica, que el investigador tena razn en
realizar el bloqueo en el sentido que lo hizo, no hay ms interpretacin que se le pueda dar,
excepto cuando este bloqueo tiene o representa caractersticas de inters que se pueden
utilizar en subsiguientes investigaciones.
Por otra parte, este mismo anlisis indica que los tratamientos estudiados ejercieron el
mismo efecto (P > 0.05) en el comportamiento de la variable respuesta, en este caso, el
rendimiento, es decir que no existen elementos de conviccin para decir lo contrario. Si se
observa esta conclusin est basada en la prueba de hiptesis correspondiente a los
tratamientos y dado que se rechaz la hiptesis nula en el anlisis de varianza, entonces se
est interpretando lo que significa la hiptesis alternativa.
Dado que el anlisis de varianza no report diferencias significativas para tratamientos, no
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

se debe aplicar una prueba de rangos mltiples ya que no hubo rechazo de la hiptesis nula.
En caso de que existan parcelas perdidas en un experimento conducido bajo un arreglo de
bloques completamente al azar se debe tomar la decisin de estimarla o no. Si son todas las
repeticiones de un tratamiento no hay necesidad de estimar ya que se sigue conservando el
principio de bloqueo, caso contrario se debera estimar teniendo en cuenta que por cada
parcela estimada se pierde un grado de libertad en el error y de hecho se aumenta el
cuadrado medio del error.
Uno de los mtodos ms comunes para estimar una parcela perdida es el propuesto por
Yates que se define de la siguiente forma:
( )
()()
; donde:
Yij = Dato perdido
r = nmero de repeticiones (bloques)
= Total del bloque con la parcela o dato faltante
T = nmero de tratamientos
= Total del tratamiento con la parcela o dato faltante

4. DISEO CUADRADO LATINO (DCL)
Anteriormente se han analizado los casos de l os di seos Compl et ament e al Azar
donde el mat eri al experimental tiene que ser homogneo y Bloques al Azar, donde el
material experimental presenta un factor sistemtico o de estorbo. Sin embargo, en la
investigacin se presentan casos donde el material experimental presenta dos tipos de
efectos no sistemticos o sea dos factores de estorbo, que no son de inters en la
investigacin pero pueden afectar los resultados del experimento. Adems, imposibilita el uso
de los diseos antes mencionados.

4.1. Cundo Utilizar este Diseo?
El diseo Cuadrado Latino, es considerado como una variante del diseo Bloques
al Azar. Este diseo es de gran utilidad cuando el material experimental presenta dos efectos
de estorbo. Permite controlar dos efectos sistemticos que afectan al material experimental,
adems del efecto de tratamiento que es el de inters estudiar. Tiene la caracterstica de
controlar los efectos de estorbo a travs de hileras y columna, o sea un doble bloqueo.
Para que los efectos de las hileras y las columnas no se confundan con el de los
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

tratamientos, stos se ubican de tal forma que un tratamiento no se repite en la misma
columna y la misma hilera. Por esta razn, la cantidad de tratamiento coincide con el
mismo nmero de filas y columnas.
La principal restriccin de este diseo es que el nmero de repeticiones es igual al nmero
de tratamiento, si este ltimo es considerable el nmero de repeticiones requerido se vuelve
impracticable. Son pocos usados los Cuadros Latinos 12 x 12, mientras que el tamao ms
comn es desde 5 x 5 hasta 8 X 8. Est e di seo present a hast a ci ert o punt o l a
mi sma desvent aj a que l os Bl oques al Azar de que, el er r or experimental por
unidad, se aumente con el tamao del cuadro, principalmente en diseos agronmicos donde
principal fuente de variacin es el suelo.

4.2. Modelo Aditivo Lineal de para un DCL
El modelo aditivo lineal para este diseo es el siguiente:
Yij
(k)
= + Hi + Cj + Tk(ij) + Eijk
Donde:
Yij
(k)
= Variable respuesta
= Efecto comn a todas las observaciones
Hi = Efecto de la i - sima hilera i = 1, 2, 3,... i hileras
Cj = Efecto de la j-sima columna j = 1, 2, 3, j columnas
Tk
(ij)
= Efecto del k-simo tratamiento en la i-sima hilera y j-sima columna k = 1, 2, 3,
k tratamientos.
Ejk = Error del modelo
En este diseo se prueban hiptesis para columnas, hileras y tratamiento de la misma forma
que se ha hecho anteriormente, es decir, la hiptesis nula asume el efecto de igualdad en
caso y la alternativa su contradiccin.
4.3. Anlisis de Varianza para un diseo Cuadrado Latino DCL
Al igual que los casos anteriores, antes de exponer la salida de varianza, se muestra un
cuadro de concentracin de informacin, que es de donde obtiene como tal al anlisis de
varianza que se debe corresponder con el modelo aditivo lineal.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 20. Cuadro de vaciamiento de informacin para un diseo Cuadrado Latino.
Hileras
Columnas
Yi.
C1 C2 C3 Cj
H1 Y
11
Y
12
Y
13
Y
1j
Y
1
.
H2 Y
21
Y
22
Y
23
Y
2j
Y
2
.
H3 Y
31
Y
32
Y
33
Y
3j
Y
3
.
Hi Y
i1
Y
i2
Y
i3
Y
ij
Y
i
.
Y.j Y.
1
Y.
2
Y.
3
Y.
j
Y..

Los tratamientos estn entre las hileras y las columnas bajo las caractersticas que se han
mencionado anteriormente, es por ello que hay que hacer un resumen de los tratamientos en
otro cuadrado como se muestra a continuacin.
Cuadro 21. Resumen de la informacin de los tratamientos extrado de un diseo
Cuadrado Latino.
Tratamiento
Repeticiones
Yi.
R1 R2 R3 Rj
T1 Y
11
Y
12
Y
13
Y
1j
Y1.
T2 Y
21
Y
22
Y
23
Y
2j
Y2.
T3 Y
31
Y
32
Y
33
Y
3j
Y3.
Tk Y
i1
Y
i2
Y
i3
Y
ij
Y..k

Y..1 Y..2 Y..3 Y..
j
Y

La salida de varianza para un DCL es la siguiente:
Cuadro 22. Salida de varianza para un diseo Cuadrado Latino
FV gl SC CM Fc Ft
Hileras t-1 SCHileras CMHileras


( )
Columnas t-1 SCColumn CMColumn


( )
Tratamiento t-1 SCTRAT. CMTRAT.

( )
Error (t-1)(t-2) SCError CMError

Total t-1 SCTotales

Las ecuaciones de trabajo para el anlisis de varianza de este diseo son las siguientes:

( )


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior


( )

Ejemplo:
Se estudia la eficacia de cuatro frmacos diferentes (F1, F2, F3 y F4) en el tratamiento de
una enfermedad, para ello, se observa el nmero de das que tardan en curar los enfermos
tratados con estos frmacos. Se considera que el factor edad y el factor peso pueden influir
en el experimento, por ello, se controlan estos factores y se consideran cuatro niveles de
edad (E1, E2, E3 y E4) y cuatro de peso (P1, P2, P3 y P4). Los resultados del experimento
diseado segn la tcnica del cuadrado latino se reportan en el Cuadro 23. Qu
conclusiones se deducen del experimento a un nivel de significancia del 5%?
Cuadro 23. Efecto de cuatro frmacos en los das para una curar una enfermedad en
pacientes de cuatro grupos etreos y cuatro tipos de peso.
Peso
Grupo Etreo
E1 E2 E3 E4
P1 10.0 F1 9.5 F2 7.0 F4 11.5 F3
P2 8.0 F2 10.0 F1 8.5 F3 9.0 F4
P3 7.0 F3 6.5 F4 7.0 F1 8.0 F2
P4 6.0 F4 5.0 F3 6.0 F2 9.0 F1

Lo primero que se debe hacer es resumir la informacin para columnas, hileras tratamiento.
La de hileras y columnas sera la siguiente:


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Peso
Grupo Etreo
Yi..
E1 E2 E3 E4
P1 10.0 9.5 7.0 11.5
38.0
P2 8.0 10.0 8.5 9.0
35.5
P3 7.0 6.5 7.0 8.0
28.5
P4 6.0 5.0 6.0 9.0
26.0
Y.j.
31.0 31.0 28.5 37.5 128.0

y la de tratamiento quedara de la siguiente forma:

Frmaco
(Tratamiento)
1 2 3 4 Y..k
F1 10.0 10.0 7.0 9.0 36.0
F2 8.0 9.5 6.0 8.0 31.5
F3 7.0 5.0 8.5 11.5 32.0
F4 6.0 6.5 7.0 9.0 28.5
Con esta informacin se puede realizar el anlisis de varianza

( )


( )


( )


( )


( )
( )

Resumiendo lo anterior en la salida de varianza correspondiente a este diseo se tiene lo
siguiente:



Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 24. Salida de varianza para el diseo Cuadrado Latino del ejemplo.
F.V gl SC CM FC Ft (0.05)
Peso (Hileras) 3 24.125 8.0416667 10.432432 4.757
Grupo Etreo (Columnas) 3 11.125 3.7083333 4.8108108 4.757
Frmaco (Tratamiento) 3 7.125 2.375 3.0810811 4.757
Error 6 4.625 0.7708333

Total 15 47.0

De acuerdo al anlisis de varianza realizado se concluye al 95% de confiabilidad que existe
efecto significativo del peso en los das que tardan los enfermos en curarse, de igual manera
lo hicieron los grupos etreos estudiados. Al revisar el efecto de los frmacos (tratamiento)
se observ que stos ejercieron el mismo efecto en los das para curarse por lo tanto es
indistinto usar uno o el otro.
En este caso, al igual que en los bloques, si existe efecto de hileras o columnas se concluye
nada ms que era necesario bloquear en ese sentido. Si se encuentra efecto de tratamiento,
se debe aplicar alguna prueba de rangos mltiples.



Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

5. DISEOS FACTORIALES
Como se mencion en un principio, todos los diseos hasta ahora desarrollados son diseos
simples donde solo se ha analizado el efecto de tratamiento. Sin embargo, se presentan
situaciones donde la interrogante a investigar se encuentra supeditada por varios factores
controlables, por ejemplo:
- El efecto de diferentes niveles de un tipo de fertilizacin sobre el comportamiento
agronmico de diferentes materiales vegetales de un rubro.
- El efecto de diferentes materiales vegetales en diferentes ambientes, etc.
En la parte introductoria de este documento se mencion que un factor es un tratamiento
que genera ms tratamiento (niveles de un factor). Puede ser que el comportamiento
agronmico de un material vegetal se vea influenciado por algn de nivel de fertilizacin en
conjunto con un medio determinado. Si bien es cierto que en algunos casos se pueden
estudiar por separados tales efectos, el tiempo que se requiere para obtener la repuesta es
mayor y adems muchas veces se necesita aplicar ambos factores para ver el
comportamiento de las interacciones de los niveles de stos.
Es por ello que una de las ventajas de este tipo de diseo es que adems de estudiar los
efectos principales, se pueden estudiar las interacciones de los niveles de los factores
reduciendo el tiempo de experimentacin y adems proporcionando conclusiones ms
concretas en el estudio.
Los diseos factoriales se dividen en diseos factoriales simples y diseos factoriales
complejo. Estos pueden ejecutarse en cualquiera de los diseos simples o clsicos hasta
ahora desarrollado, es decir, que se pueden tener diseos factoriales en un diseo
completamente al azar, en bloques completamente al azar y en cuadrado latino. De igual
forma se puede hacer en los diseos factoriales complejos, todo depende de las
caractersticas del material experimental que se utilice en el experimento.
A continuacin se desarrollan diseos factoriales simples en arreglos completamente al azar
y en bloques completamente al azar.




Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

5.1. Cundo utilizar diseos factoriales simples en un arreglo completamente al
azar?
De cuando utilizar estos diseo se ha expuesto anteriormente por lo tanto solo se desarrolla
lo de completamente al azar. Los diseos factoriales simples en arreglo completamente al
azar se utilizan cuando se est interesado estudiar al mismo tiempo el efecto de dos o ms
factores a un mismo rigor y el material experimental a usar es homogneo, es decir, que las
unidades experimentales no presentan factor de estorbo alguna que pueda afectar los
resultados del experimento.
De forma general los diseos factoriales simples se puede clasificar de acuerdo al nmero
de factores que se estudien o bien de acuerdo a que si se estudian todos los niveles de los
factores (factoriales completos) o se estudian cierto niveles de stos (factoriales
incompletos).
En funcin del nmero de factores que se estudien, los diseos factoriales pueden ser
bifactoriales, trifactoriales, etc. Generalmente es recomendable hasta tres por el efecto de
interpretacin.
Para el anlisis de experimentos factoriales se analizan primero los efectos principales
(factores individuales) y posteriormente las interacciones de los mismos. Hay autores que
mencionan que en caso de existir efecto de las interacciones no tiene sentido estudiar los
factores por separados ya que para ver el efecto en la variable respuesta se requiere de las
interacciones de los niveles de los factores en estudio.
5.2. Arreglo combinatorio
Como se ha mencionado anteriormente, un factor es una clase de tratamiento que genera
ms tratamiento llamados niveles. Un nivel se refiere a los diferentes tratamientos dentro de
un factor y arreglo combinatorio se refiere a la combinacin de los niveles de los factores
en estudio. Suponga que se tiene un factor A con tres niveles (a1, a2, a3) y un factor B con
cuatro niveles (b1, b2, b3, b4). En este caso se tiene un experimento bifactorial 3 x 4. El
arreglo combinatorio de estos dos factores sera el que se muestra en el Cuadro 25.




Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 25. Arreglo combinatorio de un diseo bifactorial 3 x 4.

Factor A
Factor B
b1 b2 b3 b4
a1 a1b1 a1b2 a1b3 a1b4
a2 a2b1 a2b2 a2b3 a2b4
a3 a3b1 a3b2 a3b3 a3b4

5.3. Modelo aditivo lineal
Para representar un experimento factorial se utiliza un modelo lineal que tome en
consideracin la suma de una constante general comn a todas las observaciones ms los
efectos principales de los factores a estudiar as como los efectos secundarios
(interacciones) adicionndole finalmente un efecto aleatorio o error experimental. Adems
se tiene que considerar en el modelo la forma de asignacin de los tratamientos definidos
(interacciones) a las unidades experimentales. Esto quiere decir, que si el material
experimental es homogneo, se har en un arreglo completamente al azar, si hay un factor
de estorbo, entonces se har en bloques completamente al azar, etc.
Es importante mencionar que en este tipo de experimentos factoriales, todos los factores se
estudian bajo un mismo rigor, cosa que no ocurre en los experimentos factoriales complejos
ya que en stos se sacrifica precisin en uno de los factores para estudiar con mayor
precisin el otro.
Supngase que en el ejemplo de arreglo combinatorio expuesto lneas arriba, se lleva a
cabo en un diseo o arreglo completamente al azar, entonces su modelo aditivo lineal sera
el siguiente:
( )
Yijk = Variable respuesta
= Efecto comn a todas las observaciones
Ai = Efecto del i-simo nivel del factor A: i = a1, a2, a3 niveles del factor A
Bj = Efecto del j-simo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B
(A*B)ij = Interaccin del i-simo nivel del factor A con el j-simo nivel del factor B
Eijk = Error del modelo

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

En este diseo se prueban hiptesis tanto para el factor A, factor B y para las interacciones
de los nieve, bajo la misma tipologa desarrollada en este documento (hiptesis nula e
hiptesis alternativa). En caso de rechazo de la hiptesis nula, se debe hacer prueba de
rangos mltiples segn sea el caso
Un cuadro de vaciamiento de informacin para un diseo bifactorial un arreglo
completamente al azar se muestra a continuacin.

Cuadro 26. Cuadro de vaciamiento de informacin para un diseo bifactorial en un
arreglo completamente al azar.
Factor A Factor B
Repeticiones
Yij.
1 2 3 k
a1
b1 Y111 Y112 Y113 Y11k Y11.
b2 Y121 Y122 Y123 Y12k Y12.
b3 Y131 Y132 Y133 Y13k Y13.
bj Y1j1 Y1j2 Y1j3 Y1jk Y1j.
a2
b1 Y211 Y212 Y213 Y21k Y21.
b2 Y221 Y222 Y223 Y22k Y22.
b3 Y231 Y232 Y233 Y23k Y23.
bj Y2j1 Y2j2 Y2j3 Y2jk Y2i.
a3
b1 Y311 Y312 Y313 Y31k Y31.
b2 Y321 Y322 Y323 Y32k Y32.
b3 Y331 Y332 Y333 Y33k Y33.
bj Y3j1 Y3j2 Y3j3 Y3jk Y3j.
ai
b1 Yi11 Yi12 Yi13 Yi1k Yi1.
b2 Yi21 Yi22 Yi23 Yi2k Yi2.
b3 Yi31 Yi32 Yi33 Yi3k Yi3.
bj Yij1 Yij2 Yij3 Yijk Yij.

De este cuadro se extrae la informacin de los efectos principales y secundarios
(interacciones) como se muestra en el Cuadro 27.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 27. Informacin de los efectos principales y de las interacciones entre los
mismos.
Factor A
Factor B
Yi..
b1 b2 b3 b4 bj
a1 Y11. Y12. Y13. Y14. Y1j. Y1..
a2 Y21. Y22. Y23. Y24. Y2j. Y2..
a3 Y31. Y32. Y33. Y34. Y3j. Y3..
ai Yi1. Yi2. Yi3. Yi4. Yij. Yi..
Y.j. Y.1. Y.2. Y.3. Y.4. Y.j. Y

Las ecuaciones de trabajo son las siguientes:

( )



( )



()

( )
( )
La salida de varianza de acuerdo al modelo aditivo lineal sera la que se muestra en el
Cuadro 28.

Cuadro 28. Salida de varianza para un diseo bifactorial en un arreglo
completamente al azar.
F.V gl SC CM Fc Ft
Factor A a-1 SCA

F(o,glA, gl Error)
Factor B b-1 SCB

F(o,glB, gl Error)
A*B (a-1)(b-1) SCAB

( )( )

F(o,glAB, gl Error)
Error ab(r-1) SCError

( )


Total abr-1 SCTotales

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Si el diseo bifactorial se hubiera llevado a cabo en arreglo en bloques completamente al
azar el modelo aditivo lineal es el siguiente:
( )
Yijk = Variable respuesta
= Efecto comn a todas las observaciones
Ai = Efecto del i-simo nivel del factor A: i = a1, a2, a3 niveles del factor A
Bj = Efecto del j-simo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B
(A*B)ij = Interaccin del i-simo nivel del factor A con el j-simo nivel del factor B
k = Efecto de k-simo bloque: k = 1, 2, 3, bloques
Eijk = Error del modelo
Y la salida de varianza sera la que se muestra en el Cuadro 29.

Cuadro 29. Salida de varianza para un diseo bifactorial en un arreglo de bloques
completamente al azar.
F.V gl SC CM Fc Ft
Bloque k-1 SCBloques


F(o, glbloque, gl
Error
Factor A a-1 SCA

F(o,glA, gl Error)
Factor B b-1 SCB

F(o,glB, gl Error)
A*B (a-1)(b-1) SCAB

( )( )

F(o,glAB, gl Error)
Error (ab-1)(r-1) SCError

( )


Total abr-1 SCTotales

En este caso se adicionara una hiptesis ms que sera la de bloque y si hubiera un rechazo
de Ho, la interpretacin sera la misma que se ha mencionado anteriormente.
Ejemplo
Un mdico est interesado en determinar si tanto el estado nutricional como la edad (grupo
etreo) de la madre tiene efecto sobre el peso del recin nacido. Los estados nutricionales
de su inters fueron: Normal, Sobrepeso y Obesa, y los grupos etreos fueron: menores a 15
aos, 15 a 18 aos, 19 a 30 aos y mayores a 30 aos. Seleccion de forma aleatoria cuatro
madres para cada combinacin de los niveles de los dos factores, estado nutricional y grupo
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

etreo). Los pesos obtenidos en gramos fueron los que se reportan en el Cuadro 30.
En este caso se tiene un experimento bifactorial, Estado Nutricional y Grupo Etreo, cada
uno con tres y cuatro niveles, respectivamente. Esto hace que se tenga un bifactorial 3 x 4
(esto vendra a ser un factorial completo asimtrico, asimtrico por no tienen el mismo
nmero de niveles y completo por se estudian todos los niveles que han sido propuestos por
el investigador. Por otra parte se tiene cuatro repeticiones por tratamiento (combinacin),
entonces viene a ser un bifactorial 3 x 4 con 4 repeticiones, haciendo un total de 48
unidades experimentales como se muestra en el Cuadro 30.
Para los datos del Cuadro 30 realice lo siguiente:
a. Proponga y describa un modelo aditivo lineal para el experimento.
b. Proponga los juegos de hiptesis a probar.
c. Realice el anlisis de varianza correspondiente de acuerdo al modelo aditivo lineal
propuesto en el inciso a., a una significancia del 1%. Realice conclusiones.
d. Si existe rechazo de Ho en cualquiera de los factores como en las interacciones de
los mismos, realice la prueba de rangos mltiples de Tukey al 99% de confiabilidad.
Emita conclusiones
Cuadro 30. Pesos de los recin nacidos de acuerdo al estado nutricional de la madre y
al grupo etreo de las mismas.
Estado Nutricional Grupo Etreo
Repeticiones
1 2 3 4
Normal
Menor de 15 1800 1900 1700 2000
15 a 18 2000 2400 2900 3000
19 a 30 3000 2800 2900 3200
Mayor a 30 3100 3300 2600 2800
Con sobrepeso
Menor de 15 2100 1800 1900 2200
15 a 18 2500 2900 3200 2900
19 a 30 2700 2900 3100 3500
Mayor a 30 2900 2600 3200 2700
Obesa
Menor de 15 3000 2800 2400 2500
15 a 18 3100 3300 2900 3400
19 a 30 2800 2500 3200 3100
Mayor a 30 2800 3100 3400 3500


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Dado que este experimento fue realizado en un arreglo completamente al azar no es
necesario totalizar las columnas por lo tanto se procede a continuacin a obtener la
informacin de las interacciones de los niveles de los factores estudiados. Para ello es
necesario totalizar en fila las interacciones como se muestra en el Cuadro 31 posteriormente
hacer en cuadro de las interacciones que conllevaran a los totales de los efectos principales
como se reporta en el Cuadro 32, estos totales se muestran tanto en la suma de las hileras
como de las columnas de acuerdo a como se dispongan los factores (totales marginales) y
los valores de las interacciones estn dentro del cuadro.

Cuadro 31. Datos del experimento con las interacciones totalizadas.
Estado
Nutricional
Grupo
Etreo
Repeticiones
Yij.
1 2 3 4
Normal
Menor de 15 1800 1900 1700 2000 7400
15 a 18 2000 2400 2900 3000 10300
19 a 30 3000 2800 2900 3200 11900
Mayor a 30 3100 3300 2600 2800 11800
Con sobrepeso
Menor de 15 2100 1800 1900 2200 8000
15 a 18 2500 2900 3200 2900 11500
19 a 30 2700 2900 3100 3500 12200
Mayor a 30 2900 2600 3200 2700 11400
Obesa
Menor de 15 3000 2800 2400 2500 10700
15 a 18 3100 3300 2900 3400 12700
19 a 30 2800 2500 3200 3100 11600
Mayor a 30 2800 3100 3400 3500 12800

Cuadro 32. Efectos principales e interacciones de los factores Estado Nutricional y
Grupo Etreo.
Estado
Nutricional
Grupo Etreo (aos)
Yi..
Menor de 15 15 a 18 19 a 30 Mayor a 30
Normal 7400 10300 11900 11800 41400
Con sobrepeso 8000 11500 12200 11400 43100
Obesa 10700 12700 11600 12800 47800
Y.j. 26100 34500 35700 36000 132300



Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Desarrollando las actividades solicitadas para el ejemplo se tiene lo siguiente:
a. Modelo aditivo lineal
( )
Yijk = Variable respuesta (peso de los recin nacidos)
= Efecto comn a todas las observaciones
Ni = Efecto del i-simo estado nutricional; i = Normal, Con sobrepeso y Obesa
Gj = Efecto del j-simo grupo etreo; menores de 15, 15 a 18, 19 a 30 y mayores a 30 aos
(N*E)ij = Efecto de la interaccin del i-simo nivel del factor Estado Nutricional con el j-
simo nivel del factor Grupo Etreo
Eijk = Error del modelo

b. Juego de Hiptesis
Como existen dos factores y sus interacciones, las hiptesis son las siguientes:
Para el factor Estado Nutricional:
Ho: Normal- Sobre peso- Obesa = 0
Ha: Normal- Sobre peso- Obesa = 0
Para el factor Grupo Etreo:
Ho: menores de 15 - 15 a 18 - 19 a 30 - mayores 30 aos = 0
Ha: menores de 15 - 15 a 18 - 19 a 30 - mayores 30 aos = 0
Para las interacciones:
Ho: a1b1 - a1b2 - a1b3 - a1b4 - a3b4 = 0
Ha: a1b1 - a1b2 - a1b3 - a1b4 - a3b4 = 0
c. Anlisis de varianza

( )

( )


( )


( )


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior


( )



(

( )

( )

( )

( )
( )
Con estos clculos se construye la salida o tabla de varianza como se muestra en el Cuadro
33.
Cuadro 33. Salida de varianza para el diseo bifactorial en un DCA del ejemplo.
F.V gl SC CM Fc Ft (0.01)
Estado Nutricional 2 1373750 686875 8.3609467 5.248
Grupo Etreo 3 5510625 1836875 22.359256 4.377
Interaccin 6 1196250 199375 2.4268808 3.351
Error 36 2957500 82152.778

Total 47 11038125

De acuerdo a los resultados del anlisis de varianza se puede concluir con 99% de
confiabilidad que el peso de los recin nacidos se ve afectado por el Estado Nutricional y
por el Grupo Etreo de las madres, es decir, que ejercen efectos significativos (P < 0.01) en
el peso de los recin nacidos, no as las interacciones de los niveles estudiados ya que sta
result ser no significativa. Esto indica que los factores estudiados ejercen efectos aditivos
o bien que actan de forma independiente en la variable respuesta.
d. Separacin de media de Tukey al 99% de confiabilidad
Cuando se dan este tipo de resultados hay que determinar el nivel o niveles de cada factor
que provocaron el rechazo de la hiptesis nula en el anlisis de varianza. Para ello hay que
hacer los ajustes necesarios como se muestra en el Cuadro 34.




Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 34. Ajuste de los efectos principales y secundarios para la separacin de
medias.
Efecto Total Promedio Ajuste
A Yi..


B Y.j.


AB Yij.




Aplicando estos ajustes para los efectos principales se tiene lo siguiente:

Estado Nutricional Totales Promedio
Normal 41400 2587.5
Con sobrepeso 43100 2693.75
Obesa 47800 2987.5

Aplicando Tukey para el factor Estado Nutricional se tiene lo siguiente:



Ordenando los promedios de los niveles del factor Estado Nutricional y estableciendo las
comparaciones correspondiente se tiene lo siguiente:

Estado Nutricional Promedio Comparaciones Diferencias
Resultado
Obesa 2987.5 Obesa-Sobrepeso 293.75 ns
a
Con sobrepeso 2693.75 Obesa- Normal 400 *
ab
Normal 2587.5 Sobrepeso - Normal 106.25 ns
b

En este caso se puede decir que de los niveles del factor Estado Nutricional, solo el nivel
Obesa ejerci un efecto distinto (P <0.01) en el peso de los recin nacidos.
Los ajustes para los niveles del factor Grupo Etreo son los siguientes:
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Grupo Etreo Totales Promedio
Menor de 15 26100 2175
15 a 18 34500 2875
19 a 30 35700 2975
Mayor a 30 36000 3000

Aplicando la Tukey para los niveles del factor Grupo Etreo



Ordenando los promedios de los niveles del factor Grupo Etreo y estableciendo las
comparaciones correspondiente se tiene lo siguiente:

Comparaciones Diferencias
Mayor a 30 - 19 a 30 25 ns
Mayor a 30 - 15 a 18 125 ns
Mayor a 30 - Menor a 15 825*
19 a 30 - 15 a 18 100 ns
19 a 30 - Menor a 15 800 *
15 a 18 - Menor a 15 700 *

Grupo Etreo Promedio Resultado
Mayor a 30 3000 a
19 a 30 2975 a
15 a 18 2875 a
Menor de 15 2175 b

De acuerdo a los resultados de Tukey se puede concluir que de los niveles del factor Grupo
Etreo, solamente uno de stos ejerci un efecto distinto en el peso de los recin nacidos
como las madres menores de 15 aos.

Vous aimerez peut-être aussi