Académique Documents
Professionnel Documents
Culture Documents
Editorial Universitaria
Calle 23 entre F y G, No. 564.
El Vedado, Ciudad de La Habana, CP 10400,
Cuba
Instituto de Ciencia Animal
Departamento de Biomatemática
Mayabeque
2013
Instituto de Ciencia Animal
Departamento de Biomatemática
Mayabeque
2013
Pensamiento
Nunca antes en la historia de la Ciencia y la Estadística ha existido una mayor
necesidad para que haya interacción y colaboración entre científicos y
estadísticos.
Dra. C. Caridad Walkiria Guerra Bustillo, por su ayuda incondicional, por sus
sabios consejos, y estar siempre a mi lado, me demostró que con estudio y
constancia se puede llegar.
Dr. C. José A. Bravo Iglesias por sus observaciones tan oportunas, y siempre
dispuesto a dar un consejo para mejorar el trabajo.
Mi amiga Lic. Lourdes Rodríguez Shade que, aunque siempre está peleando, me
apoyó durante el trabajo de investigación.
Mí siempre amigo Lic. Fermín Raúl Cobo Cuña que me ha soportado durante todo
este tiempo, y por su apoyo en el trabajo de tesis con sus observaciones
oportunas.
Dr. C. Luis Mateo Fraga Benítez por su ayuda y siempre dispuesto a aclarar
cualquier duda.
Muchachitas las técnicas Aida Carmelita Noda Amorós y Lucía Rosario García
Sarduy, las cuales me animaron y me ayudaron en el procesamiento de la
información.
Mis amigas y amigo de la biblioteca del ICA, Yeter Caraballo Rodríguez por su
ayuda incondicional en el procesamiento de la información, a Dianelis Mesa
Travieso por su apoyo, Daniela Rodríguez Carballoza, Ibrain A. Díaz Machado,
Yoandra Figueroa Puentes y Dayami Roque Chao por su ayuda en la búsqueda y
ubicación de la información bibliotecaria.
A mi madre querida
A mi padre
A mis hermanos
A mis amigos
A la Revolución
SÍNTESIS
2.1 Introducción 32
3.1 Introducción 50
4.1 Introducción 84
CONCLUSIONES 99
RECOMENDACIONES 100
REFERENCIAS BIBLIOGRÁFICAS
ANEXOS
ÍNDICE DE ABREVIATURAS
SCerror MLG: Suma de cuadrado del error del Modelo Lineal General.
Tto: Tratamiento.
Tabla 1.3. Modelos más empleados según la metodología del Modelo Lineal
Generalizado.
Tabla 2.3. Bondad de ajuste de la configuración de los datos para los Métodos
Estadísticos no paramétricos.
Tabla 2.4. Bondad de ajuste de las temáticas por revistas donde se aplica los
Métodos Estadísticos no paramétricos.
Tabla 2.8. Resultados de los pesos de las variables por cada dimensión.
Tabla 2.9. Resultados de la Matriz DAFO.
Tabla 3.1. Resumen del cumplimiento de los supuestos teóricos del ANAVA.
Tabla 3.5. Resultados del coeficiente Alfa de Cronbach para los indicadores de los
Diseños Completamente Aleatorizado y Bloques al Azar.
Tabla 3.6. Resultados de los pesos de los indicadores por cada dimensión para
los Diseños Completamente Aleatorizado y Bloques al Azar.
Tabla 3.7. Resultados del coeficiente Alfa de Cronbach para los experimentos con
arreglos factorial de los tratamientos.
Tabla 3.8. Resultados de los pesos de los indicadores por cada dimensión para
los experimentos con arreglo factorial de los tratamientos.
Tabla 4.3. Resultados del coeficiente Alfa de Cronbach para el Modelo Lineal
General y Modelo Lineal Generalizado.
Tabla 4.4. Resultados de los pesos de los indicadores por cada dimensión para el
Modelo Lineal General y el Modelo Lineal Generalizado.
Tabla 4.6. Resultados de los valores de probabilidad de error tipo I para el Modelo
Lineal General y el Modelo Lineal Generalizado.
ÍNDICE DE FIGURAS
Figura 2.3. Revistas por temáticas con aplicación de los Métodos Estadísticos no
paramétricos.
.
Figura 2.4. Temáticas por revistas que emplean Métodos Estadísticos no
paramétricos para el análisis de sus investigaciones.
Figura 3.2. Biplot de los indicadores para los experimentos con arreglo factorial de
los tratamientos.
Figura 4.1. Biplot de los indicadores estadísticos de los Modelos Lineal General y
Lineal Generalizado.
ciencia.
origina en los trabajos de Fisher que, a comienzos del siglo XX, sentaron las
1
El Análisis de Varianza paramétrico es el Método Estadístico más difundido en el
análisis de datos, desarrollado por Fisher en la década de los años 20 del pasado
básicos, en los que se enmarcan: que los errores experimentales deben ser
como la aditividad del modelo. Sin embargo cuando algunos de estos supuestos
la década de los años 50, en estudios relacionados con las Ciencias Sociales, de
aprecia que estos métodos han sido poco aplicados en las investigaciones
2
normales y su eficiencia, recomendó que con muestras pequeñas e
relacionada con plagas agrícolas, por lo que fue más conveniente la aplicación del
3
Fox (2007). En las Ciencias Agropecuarias en Cuba se han encontrado pocas
agropecuarias?
4
Objeto de estudio: La transformación de datos considerando variables discretas y
investigaciones agropecuarias.
Hipótesis
Objetivo general
agropecuarias.
Objetivos específicos
Cuba.
5
categóricas en los Modelos de Análisis de Varianza simple y doble de
efectos fijos.
Novedad científica
Aporte social
6
Aporte práctico
7
CAPÍTULO I
REVISIÓN BIBLIOGRÁFICA
CAPÍTULO I. REVISIÓN BIBLIOGRÁFICA
(Eisenhart, 1947).
Norell (2003). Es descrito por Tejedor (1999); Khan y Rayner (2003) y Spiegel et
sobre la población que se estudia. Según Servy et al. (2007) una prueba
8
Los Métodos Estadísticos no paramétricos resultan una alternativa importante, ya
(Siegel y Castellan 1995, Gómez et al. 2003 y Santos et al. 2005). En este sentido
Guerra et al. (2000) se han referido al respecto, por lo que se resumen en la Tabla
1.1.
9
1.2. Consecuencias del incumplimiento de los supuestos teóricos básicos
La distribución Normal de los errores, señalan Steel y Torrie (1992) y Peña (1994),
tiene poca influencia en el ANAVA para comparar medias, dado que esta técnica
es robusta frente a desviaciones de los errores; sin embargo, plantean que la falta
sobre todo, cuando el número de observaciones de los grupos son muy diferentes,
El incumplimiento de algunos de los supuestos del ANAVA pude afectar tanto los
como rechazar la hipótesis nula siendo verdadera o viceversa, lo que trae consigo
10
resultados falsos en los experimentos que al materializarse en los sistemas de
normalizar la respuesta.
Sin embargo, Peña (1994) ha sugerido que antes de transformar los datos se debe
análisis estadístico.
11
estos supuestos teóricos del ANAVA son satisfechos las inferencias del modelo
Bono y Arnau (1995), realizan un recuento histórico del desarrollo del concepto de
entre otros.
Estos autores señalan que hay dos formas de estimar la potencia, a priori y a
para una potencia adecuada y con este fin se construyen las tablas de potencia.
expresada como 1-β (θ), donde θ representa el valor verdadero del parámetro.
12
Mood y Graybill (1972) y Rodríguez (2008) denotan a la función de potencia como:
nula, por lo que resulta muy conveniente que η (θ) tome valores bajos cuando se
parámetro de no centralidad δ.
13
Este autor se refiere a las tablas de potencia calculadas por Tang en 1938, solo
para los valores de α = 0,01 y 0,05 y reproduce los gráficos de potencia para la
Tamaño muestral, es decir cuanto más grande sea la muestra, mayor será la
potencia.
Nivel de significación, dado que al incrementarse la probabilidad de error tipo I,
la potencia también aumenta.
Tamaño del efecto (TE) o grado en que el fenómeno de interés está presente,
de modo que cuando los efectos son grandes, la potencia se incrementa.
Camacho (2007) en relación con la potencia estadística, coincide con los tres
respuesta estudiada.
14
muestra necesario para hacer la prueba B tan poderosa como la A, al ser la
prueba A de las conocidas, la más poderosa de su tipo (cuando se usa con datos
que satisfacen sus condiciones), al ser la prueba B, que se presta al mismo diseño
de investigación, tan poderosa con Nb casos como la prueba A con Na casos, con
lo que se tiene:
Fraser (1957) y Gibbons (1971) proponen que para obtener una medida asintótica
ARE (en inglés, Asymptotic Relative Efficiency), conocido también como Eficiencia
de Pitman.
20
autor refiere que en el caso de la dócima Friedman esta posee un ARE de 0,955
15
analizan, cuando debe llegarse a una decisión al respecto, hay que considerar tres
factores:
paramétricas.
propuesto por Siegel (1970), Daniel (1978) y Siegel y Castellan (1995), sin
teniendo en cuenta que las exigencias para las pruebas no paramétricas son
16
Generalmente, en la práctica no se tiene en cuenta la relación inversa que existe
para los valores bajos de α se puede obtener valores altos de β que pueden poner
17
Menchaca (1974, 1975); Venereo (1976); Caballero (1979) y Menchaca y Torres
con amplitud.
otros.
agropecuarias
buscar una nueva escala de medida con el objetivo de hacer el análisis más
válido.
normalidad y la heterocedasticidad.
18
Y ( )
0
Yλ = (para Y > 0)
log Y 0
Menchaca (1973) señala que Box y Cox en 1964, consideran una familia
por otra parte Sakia (1992) plantea que esta transformación es conocida
Varianza, siendo una alternativa, siempre que sean bien empleadas, pues se ha
una alternativa razonable para lograr la normalidad, más potente que la mayoría
Según Méndez (2000) cuando los datos son normales, pero las varianzas son
19
cuadrada o inversa), estas se vuelven a comprobar y si las varianzas son
plagas por ser datos discretos por lo regular no cumplen los supuestos teóricos y
Normal.
los resultados.
Es por ello, que se debe propiciar el uso de Métodos Estadísticos alternativos más
como una extensión de los Modelos Lineales Generales clásicos (MLG). Estos
E( Y | X ) g( X) g( )
Donde:
η: predictor lineal
g: función de enlace
Por otra parte Mongotmery et al. (2005) y Faraway (2006) plantean que un MLGnz
y b
F (yІθ, ) = exp + c y,
a
Donde:
Verde (2000) señala que los MLGnz se especifican con tres componentes: el
donde es difícil utilizar el MLG en los Análisis de Varianza y Regresión, porque las
22
Actualmente las Ciencias Agropecuarias demandan de herramientas estadísticas
se remonta a más de un siglo. Una reseña histórica fue trazada por McCullagh y
Nelder en 1989 y Lidsey en 1997 (citados por García, 2002) a partir de diferentes
Tabla 1.3. Modelos más empleados según la metodología del Modelo Lineal
Generalizado.
Distribuciones Tipo de Análisis Autores
Regresión Lineal Legendre y Gauss (siglo XIX)
Múltiple
Normal Análisis de Varianza Fisher (1920- 1935)
para diseños
experimentales
Fisher(1922); Bliss (1935);
Normal ; Binomial ; Berkson (1944); Dike y
Bernuolli ; Poisson Función de Patterson (1952);
Multinomial; Exponencial y verosimilitud Racha (1960); Birch (1963);
Gamma Feig y Zelen (1965); Zippin y
Armitage (1966); Gasser (1967)
y Nelder (1966)
Existen algunas diferencias entre el MLG y el MLGnz, estas están dadas porque
deben distribuir Normal, por tanto la variable debe ser continua, la varianza de los
23
En el caso del MLGnz se puede emplear a cualquier tipo de distribución, que tiene
un predictor lineal asociado a la variable dependiente y por otra parte este modelo
sus características.
Para el análisis del MLGnz se necesita conocer que distribución poseen los datos,
cada una de las distribuciones de errores. Esto no significa que siempre se deba
usar una única función de enlace para una determinada distribución. De hecho,
24
puede ser recomendable comparar diferentes funciones de enlace para un mismo
modelo y ver con cual se obtiene un mejor ajuste del modelo a los datos (Cayuela,
2010).
MLGnz.
Entre las ventajas que ofrece el MLGnz, está que permite emplear una mayor
25
En esencia este modelo descompone la variabilidad de la variable respuesta en
categóricas
26
Según Greene (1999), los modelos de naturaleza categórica son modelos de
teniendo en cuenta estos elementos, Guerra et al. (2010) resumen en la tabla 1.6,
clásicos reportados en esta tabla, los de más amplia aplicación, son los
27
Tabla 1.6. Métodos Estadísticos relacionados con variables cualitativas.
Según número Métodos
de variables Descriptivo Inferencial
Moda, mediana, rango, cuantíles, Dócima de
frecuencias, porcientos. proporciones y
Univariado Tablas de frecuencia. dócimas no
Gráficos de barras, sectores, entre paramétricas.
otros. Series temporales.
Tablas de frecuencia bivariada o Dócima Chi-
tablas de contingencia. cuadrado.
Bivariada Medidas de asociación no Regresión Logit
paramétricas (coeficientes de Regresión Probit
contingencia, Spearman, Kendall, etc)
Gráficos de barras, mosaicos.
Coeficiente de fiabilidad. Regresión Logística
Coeficiente de esfuerzo (Stress). Regresión Poisson
Matriz de correlaciones. Modelo Log lineal
Multivariado Análisis Cluster. Regresión
Análisis de Correspondencia Múltiple. Categórica(CATREG)
Escalamiento Multidimensional (EMD) Modelo Lineal
Escalamiento Óptimo. Generalizado
Mapas Auto Organizados (SOM)
Navarro et al. (2008) indican que la Regresión Categórica (CATREG), trabaja bajo
que está dada, a que este amplía las posibilidades del Modelo de Regresión
simultáneamente.
2010).
variables, porque permite conocer como está estructurada esta relación (Quaglino
son elevadas, además existen altas correlaciones de las variables de cada grupo
entre sí.
29
Mediante este método de reducción de variables se puede eliminar el ineludible
proximidades entre objetos (Linares, 2001; Miret et al., 2002; Mora y González,
Por otra parte Miret et al. (2002) y Miret (2005) señalan que el Escalamiento
manera explícita.
Otros criterios sobre modelos relacionados con las variables cualitativas, son
30
El criterio de experto, a través del Método Delphy, se puede considerar como
un Modelo cualitativo de validación en determinadas situaciones.
categóricas.
31
CAPÍTULO II
LA ENCUESTA ESTADÍSTICA EN LA
CAPTACIÓN DE INFORMACIÓN Y SU USO
CAPÍTULO II. LA ENCUESTA ESTADÍSTICA EN LA CAPTACIÓN DE
INFORMACIÓN Y SU USO
2.1. Introducción
Métodos Estadísticos más empleados, así como las temáticas más abordadas en
Se revisaron 1418 artículos para conocer las temáticas, así como los Métodos
fondo bibliotecario del Instituto de Ciencia Animal. Las revistas revisadas están
emplearon estas revistas por ser las colecciones más completas en el período que
se analiza.
32
Para el estudió se revisaron las revistas:
Agrociencia (México)
Nombre de la revista
paramétricos.
33
Animal. De un total de 89 investigadores, distribuidos en Titulares, Auxiliares,
todas las categorías con la siguiente representación por cada departamento, tabla
2.1.
indicadores:
Departamento.
Empleo de transformaciones.
Número de transformaciones que emplean.
Métodos Estadísticos alternativos que usan.
Sabe que logra con el uso de la transformación de datos.
Interés por continuar con el uso de las transformaciones.
procesamiento.
34
Para procesar la información de las revistas y las encuestas a investigadores se
congruencia de Tucker.
Para interpretar las medidas de calidad del ajuste obtenida del Escalamiento
Multidimensional, Guerra (2009) propone una tabla del Stress; teniendo en cuenta
los valores dados por Kruskal en 1964, (citado por Mora y González, 2009), como
35
SOM-Wald Clusters, que combina de forma ordenada la información local del
temáticas que más abordan estos métodos. En la parte inferior de cada mapa
aparece una escala con matices de colores, de más a menos intenso, si se analiza
de derecha a izquierda.
paramétricos por revistas analizadas. Con esta técnica se obtuvieron las medidas
Tabla 2.3. Bondad del ajuste de la configuración de los datos para los Métodos
Estadísticos no paramétricos.
Medida Resultado
Stress bruto normalizado 0,00092
Dispersión explicada (D.A.F.) 0,99908
Coeficiente de congruencia de 0,99954
Tucker
36
Por otra parte se observa que la dispersión explicada (D.A.F) y el coeficiente de
resultados que se encuentran próximos a 100 %, por lo que logran explicar una
alta variabilidad.
métodos.
El hecho de que la revista Ciencias Biológicas forme un grupo más aislado del
resto de las demás, pudiera estar asociado a que sus investigaciones están más
relacionadas a variables que son de tipo discretas y categóricas, por lo que sus
paramétricos.
37
Figura 2.1. Revistas relacionadas con la aplicación de los Métodos Estadísticos no
paramétricos.
revistas Ciencias Biológicas con las dócimas Prueba Exacta de Fisher, seguida
cuadrado ( 2 ).
1987-1997.
38
Agrociencia Archivo Zootecnia
c3 c3
Com Alea Com Alea
c1 c1
c4 c4
X2 MW X2 MW
c2 c2
KW PE Fisher KW PE Fisher
0 1 3 4 6 7 8 10 11 13 14 0 1 3 4 6 7 8 10 11 13 14
c3 c3
Com Alea Com Alea
c1 c1
c4 c4
X2 MW X2 MW
c2 c2
KW PE Fisher KW PE Fisher
0 3 5 8 11 13 16 19 22 24 27 0,0 0,4 0,9 1,3 1,8 2,2 2,7 3,1 3,6 4,0
c3 c3
Com Alea Com Alea
c1 c1
c4 c4
X2 MW X2 MW
c2 c2
KW PE Fisher KW PE Fisher
0,0 0,9 1,8 2,7 3,6 4,4 5,3 6,2 7,1 8,0 0 3 6 9 12 15 18 21 24 27 30
0 2 5 7 9 12 14 16 18 21 23
Figura 2.2. Métodos Estadísticos no paramétricos más usados en
estudios agropecuarios y biológicos.
39
En la tabla 2.4 se muestra la bondad de ajuste del método, que al igual que en el
considerando el Stress bruto normalizado, así como los resultados obtenidos por
cercanos a 100%.
obtienen mediante la fórmula introducida por Kruskal en 1964, quien ofreció una
Tabla 2.4. Bondad de ajuste de las temáticas por revistas, donde se aplican los
Métodos Estadísticos no paramétricos.
Medida Resultado
Stress bruto normalizado 0,01539
Dispersión explicada (D.A.F.) 0,98461
Coeficiente de congruencia de Tucker 0,99228
40
encuentra Veterinaria de México, que son las que hacen un mayor empleo de la
los objetos A y B como los más similares, entonces las técnicas de Escalamiento
distancia entre ellos sea más pequeña que la distancia entre cualquier otro par de
objetos.
Figura 2.3. Revistas por temáticas con aplicación de los Métodos Estadísticos no
paramétricos.
En la figura 2.4 se visualizan las revistas donde sus temáticas son analizadas por
41
En cada revista las temáticas que más abordan los Métodos Estadísticos no
paramétricos, son aquellas que enfocan su análisis desde el punto de vista teórico,
México.
Sin embargo en otras temáticas que abordan las revistas no hay empleo de
Forraje y la RCCA.
42
Agrociencia Archivo Zootecnia
Past Prod Sem Bi otec Past Prod Sem Bi otec
c6 c6
c4 c4
c1 c1
Est Ovi no Est Ovi no
Prod Lec Prod Lec
Prod Prod
0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0
c4 c4
c1 c1
Est Ovi no Est Ovi no
Prod Lec Prod Lec
Prod Prod
0 2 4 5 7 9 11 13 14 16 18 0,0 0,7 1,3 2,0 2,7 3,3 4,0 4,7 5,3 6,0
c4 c4
c1 c1
Est Ovi no Est Ovi no
Prod Lec Prod Lec
Prod Prod
0 1 2 3 4 5 6 7 8 9 10 0 2 4 6 8 11 13 15 17 19 21
43
2.3.2. Encuesta estadística a los investigadores
porcientos, que según autores como Steel y Torrie (1992), son las
2,90%
Uso de transf. en total
Si
No
97,10%
44
Tabla 2.5. Transformaciones de datos más empleadas según encuesta a los
investigadores.
Transformaciones
arcoseno 1
Dpto. x ( p) Log X (1/x) x Total %
1 3 8 0 0 2 13 18,8
2 10 5 1 0 1 17 24,6
3 8 6 2 1 1 18 26,1
4 1 4 5 0 1 11 15,9
5 1 1 0 0 3 5 7,2
6 0 1 2 1 1 5 7,2
Total 23 25 10 2 9 69 -
% 33,3 36,2 14,5 2,9 13,0 - 100
En la tabla 2.6 se presentan los aspectos más frecuentes manifestados por los
Estadísticos alternativos.
Tabla 2.6. Aspectos más frecuente en las respuestas de las preguntas a los
investigadores.
Aspectos %
Sabe que logra con el uso de la transformación de datos 73
Uso de la transformación de datos en el Modelo de Análisis de
Varianza 81,1
Continuar usando la transformación de datos 73,5
Desconocimiento de Métodos Estadísticos alternativos 62,3
45
consideración lo planteado por Miret (2005), las medidas de calidad de ajuste
logra con el uso de estas. Este análisis se realizó con el objetivo de visualizar las
dimensionalidad.
46
Tabla. 2.8. Resultados de los pesos de las variables por cada dimensión
.
Dimensión
Variables 1 2
1.- Departamento 1,018 -0,232
2.- Necesidad de aplicar transformación de datos -0,518 0,286
3.- Tipo de transformaciones 0,505 0,530
4.- Análisis Estadístico donde utilizas las -0,626 -0,292
transformaciones de datos con más frecuencia
5.- Sabe que logra con el uso de la transformación de -0,031 -0,533
datos
6.- Continuar usando la transformación de datos -0,281 0,308
7.- Métodos estadísticos alternativos -0,068 -0,067
considera que deben ser utilizadas las Fortalezas, con el fin de atenuar las
47
Tabla 2.9. Resultados de la Matriz DAFO
Fortalezas Debilidades
Conocen el por qué se usa la Alta preferencia por el empleo de las
transformación de datos. transformaciones de datos, en lo
Existen Métodos Estadísticos para el fundamental en el Modelo de ANAVA.
análisis de la información. Desconocimiento de Métodos
Existencia de un Dpto. de Estadísticos alternativos de análisis.
Biomatemática. Insuficiente intercambio sobre el
El ICA centro de prestigio nacional e conocimiento del uso de la
internacional. transformación de datos con los
Incremento de grados científicos en investigadores del centro.
los jóvenes.
Doctorado curricular colaborativo en
Biometría único en el país.
Oportunidades Amenazas
Se identifica al Dpto. como el Insuficiente intercambio sobre el uso
escenario más importante para de la transformación de datos con
implementar una estrategia de trabajo profesionales de la Estadística y
estadístico-metodológica. usuarios, en las ciencias
Nuevas líneas de investigación que agropecuarias y afines.
acomete el Dpto. de Biomatemática, Está muy arraigado el uso de los
para dar respuesta a necesidades de Métodos Estadísticos clásicos
las investigaciones en las ciencias paramétricos, sobre todo los Modelos
agropecuarias. de ANAVA y Regresión.
RCCA es la revista de más alto índice
de impacto en el país, en esta rama.
48
2.3.4. Consideraciones parciales
Casi la totalidad de los encuestados (97,10%) conocen el por qué del uso
de las transformaciones de datos, y más del 70% consideran su empleo
para lograr el cumplimiento de los supuestos teóricos del Modelo de
Análisis de Varianza, siendo esta la técnica de uso más frecuente.
49
CAPÍTULO III
MODELOS DE ANÁLISIS DE
VARIANZA PARAMÉTRICO Y NO
PARAMÉTRICO. USO DE LA
TRANSFORMACIÓN DE DATOS
CAPÍTULO III. MODELOS DE ANÁLISIS DE VARIANZA PARAMÉTRICO Y NO
3.1. Introducción
teórico-práctico.
50
3.2. Materiales y métodos
rumiantes.
fitasas).
51
Variables
Número de huevos/aves.
Intensidad de puesta.
Variables
Porciento de puesta.
Números de huevos/aves.
52
Variables
Porciento de puesta.
Porciento viabilidad.
reproductoras lactantes.
Soya.
Variables
Variables
53
Números de crías muertas.
Días de gestación.
Variables
Conteo de levaduras.
Conteo de coliformes.
Conteo de lactobacilos.
Variables
54
Conteo de endosporas, hora 24.
Tratamientos: Dieta basal, dieta basal + C-7, dieta basal + C-65 y dieta basal + la
Variables
55
Variable
Mortalidad.
Canavalia ensiformis.
Variables
Canavalia ensiformis.
Variables
56
Experimento 12: Efecto de germinación en la composición química de granos de
Mucuna.
Variables
Mucuna.
Variables
Dolico.
57
Variables
Albizia Lebbeck.
Variables
58
Tratamientos: Diferentes gramos en la dieta (0, 10 y 15).
Variables
Conteo de levaduras.
50 y 60).
Variables
59
Intervalo de destete/celos en cerdas de 3 y 4 partos.
Variables
Números de destetados.
Intervalo de destete/celos.
épocas de corte.
Variables
Números de tallos/surcos.
Número tallos/macollas.
Número de tallos/surcos.
60
Número de hojas/plantas.
Número de tallos/macollas.
Tratamiento 3: Aplicar 1.5 litros /ha de vitazyme en el surco antes del tape +
Rizobium.
Tratamiento 6: Aplicar 1.5 litros /ha de fitomass-E en el surco antes del tape +
Rizobium.
61
Tratamiento 9: Rizobium + aplicación foliar de una mezcla de 50 % fitomass E y
50% vitazyme por aspersión a inicios de la floración a razón de 1.5 litros/ha.
Variables
Números de vainas/plantas.
Números de plantas/m.
alturas.
Variables
62
Número de hojas (muestreo 3).
Log X.
63
4. Cumplimiento de los supuestos sin transformación (Cumpl S/T).
S/T).
(Potencia C/T).
Friedman, así como para las potencias (sin y con transformación de datos).
de los tratamientos, para los diseños antes mencionados, en este último caso se
n 2
si
k
α 1 i 1
k 1 s2sum
Donde:
EXCEL versión 9.0 (2003). Para el análisis de los supuestos teóricos se empleó el
65
3.3. Resultados y discusión
Log X.
Los resultados del análisis de los supuestos teóricos del ANAVA, se observan en
fueron efectivas.
Tabla 3.1. Resumen del cumplimiento de los supuestos teóricos del ANAVA.
Cumplimiento de los Modelo del ANAVA
supuestos Clasificación Simple Clasificación Doble
%
S/T C/T No. % No. %
No No 69 41 62,1 28 82,4
No Si 13 12 18,2 1 2,9
Si No 2 2 3,0 - -
Si Si 16 11 16,7 5 14,7
Total 100 66 100 34 100
S/T: Sin transformación C/T: Con transformación
En esta misma tabla se observa que el modelo de clasificación doble fue el que
presentó los resultados más bajos, pues en el 82,4% de las variables analizadas
66
las transformaciones no mejoraron el cumplimiento de los supuestos teóricos, solo
Estos resultados coinciden con los obtenidos por De Calzadilla (1999), al estudiar
Otros resultados que coinciden con este análisis fueron los obtenidos por Cabrera
las se encuentran X, X 1, X 0,5 , X 0,375 , log (X+1), log (X+(k/2)), log
cumplimiento de los supuestos del ANAVA. Por otra parte, Font et al. (2007) en un
67
experimento con aves, donde usa las transformaciones X y Log X, sin mejorar
Menchaca (1973) indica que las transformaciones de datos deben ser utilizadas
sentido se busca una transformación que coloque a los datos en una escala tal
los investigadores con los especialistas de Estadística, para definir el método más
excesivo de las mismas sin que se logre el objetivo para el cual fueron propuestas.
68
3.3.1.2. Probabilidad de error tipo I y potencia de la dócima F
criterio de decisión.
En el caso del DBA se observó que de las 34 variables analizadas, para el caso de
coincidencias (97,05%). Este resultado coincide con los obtenidos por Siegel
decisiones.
69
Para verificar si existen cambios significativos entre los valores de probabilidad de
error tipo I de la dócima F de Fisher (con y sin transformación de datos) para los
datos con sus homólogas no paramétricas se aprecia que solo en el DBA (con la
70
presentan probabilidades de error tipo I por encima de 0,05, y la dócima F de
que representa el 65,15%. Por lo que los valores de probabilidad de error tipo I de
cambios significativos.
significativos, lo que se considera que está dado a que cuando se analizan las
71
Tabla 3.4. Resultados de la dócima de McNemar para las potencias de la dócima
F de Fisher.
Diseños Estadístico Valor P
DCA 0,20 0,97
DBA 3,00 0,0001
Ambos 0,11 0,51
uso de las tablas propuestas por Menchaca (1974, 1975); Venereo (1976);
Caballero (1979) y Menchaca y Torres (1985), las que sirven de apoyo para la
72
de eficiencia relativa, dado por el nivel de coincidencia en la toma de
decisiones.
Alfa de Cronbach total que expresa un nivel de fiabilidad excelente (0,94), lo que
Se destaca en la dimensión uno que explica 43% de la varianza total, con un Alfa
73
propuesta por Hair et al. (1999), que considera que el método es aceptable,
Tabla 3.5. Resultados del coeficiente Alfa de Cronbach para los indicadores de los
Diseños Completamente Aleatorizados y Bloques al Azar.
Varianza explicada
Alfa de Total % de la
Dimensión Cronbach (Autovalores) varianza
1 ,880 5,176 43,130
2 ,576 2,120 17,671
Total ,941 7,296 60,800
Los indicadores que presentan mayor peso por cada dimensión se muestran en la
tabla 3.6, en la dimensión uno están los relacionados con la probabilidad de error
con el número de tratamiento (No. tto), tipo de diseño (DCA y DBA) y tipo de
experimento.
Tabla 3.6. Resultados de los pesos de los indicadores por cada dimensión para los
Diseños Completamente Aleatorizados y Bloques al Azar.
Dimensión
Indicadores
1 2
Tipo de experimento -,351 -,673
Cumplimiento de los supuestos sin transformación -,027 ,372
Cumplimiento de los supuestos con transformación -,179 ,329
Probabilidad de error tipo I sin transformación ,923 -,186
Probabilidad de error tipo I con transformación ,952 -,152
Probabilidad de error tipo I no paramétrica ,942 -,068
Potencia sin transformación -,938 ,061
Potencia con transformación -,905 ,122
Tamaño de muestra ,581 -,173
Número de tratamientos ,236 ,764
Diseño ,505 ,730
Distribución -,157 ,439
74
Los indicadores que sobresalen en la dimensión uno presentan correlaciones por
positivas por encima de 0,70 (Anexo 3). Se debe destacar que las altas
Estos resultados coinciden con los obtenidos por Vásquez (2013) cuando realiza
75
Figura 3.1. Biplot de los indicadores analizados.
Se considera que este aspecto está dado por lo señalado por Steel y Torrie
(1992); Peña (1994) y Torres et al. (1998) que plantean que la dócima F de Fisher
afectación, sobre todo, cuando se trabaja con igual número de observaciones por
Por otra parte las altas correlaciones negativas entre la potencia y la probabilidad
de error tipo I para el caso de la dócima no paramétrica, se debe a que está última
presenta una alta Eficiencia Asintótica Relativa (ARE), que es del 95,5%. Esto
significa que para lograr iguales resultados, la dócima no paramétrica debe tener
76
un tamaño de muestra de 100, mientras la paramétrica un tamaño de muestra de
eficiencia.
presente una alta potencia conjuntamente con una baja probabilidad de cometer
error tipo I, manifestada en las altas correlaciones negativas entre las potencias y
relacionados con los DCA y DBA con arreglo factorial de los tratamientos. Al igual
77
una varianza total del 93%, con un Alfa de Cronbach que presenta un nivel de
explicada de 61,31%.
Tabla 3.7. Resultados del coeficiente Alfa de Cronbach para los experimentos con
arreglo factorial de los tratamientos.
Varianza explicada
Alfa de Total % de la
Dimensión Cronbach (Autovalores) varianza
1 ,910 4,905 61,313
2 ,692 2,532 31,654
Total ,989 7,437 92,967
En la tabla 3.8 se presentan los indicadores con mayor peso o ponderación por
con las probabilidades de error tipo I y las potencias, al igual que el análisis
negativas de muy altas a perfectas por encima de 0,90 (Anexo 4), lo que reafirma
distribución de los datos porque fue la misma para todos los casos.
78
Tabla 3.8. Resultados de los pesos de los indicadores por cada dimensión para los
experimentos con arreglo factorial de los tratamientos.
Dimensión
Indicadores
1 2
Tipo de experimento ,219 -,947
Cumplimiento de los supuestos con transformación -,168 ,820
Probabilidad de erro tipo I sin transformación ,983 ,129
Probabilidad de error tipo I con transformación ,983 ,129
Probabilidad de error tipo I no paramétrica ,983 ,130
Potencia sin transformación -,954 -,068
Potencia con transformación -,986 -,108
Tamaño de muestra -,219 ,947
En la figura 3.2 se presenta el Biplot de los indicadores para los experimentos con
agrupación similar entre las probabilidades de error tipo I y las potencias, a las
79
Figura 3.2. Biplot de los indicadores para los experimentos con arreglo factorial de
los tratamientos.
Para confirmar los resultados anteriores y teniendo en cuenta los aspectos que
En la tabla 3.9 se aprecia que el indicador que tiene una influencia significativa
80
sin transformar, resultado que reafirma los obtenidos con anterioridad, pues siguen
81
Cuando se analiza la potencia con transformación, con los mismos indicadores
Al igual que el análisis anterior se observa que el único indicador que tiene una
relación de la potencia (con y sin transformación de los datos) con los indicadores
82
Tabla 3.12. Importancia de los indicadores en CATREG para potencias con
transformación.
Indicadores Importancia
Tipo de experimento -,002
Tamaño de muestra ,069
Número de tratamientos ,014
Diseño ,002
Distribución -,010
Cumplimiento de los supuestos con transformación ,002
Probabilidad de error tipo I con transformación ,926
Los resultados obtenidos con los indicadores en los DCA y DBA y para
ambos diseños con arreglo factorial de los tratamientos, mostraron
resultados similares, en cuanto a la probabilidad de error tipo I, así como las
altas correlaciones negativas entre este indicador y la potencia.
83
CAPÍTULO IV
EL MODELO LINEAL GENERALIZADO.
APLICACIÓN A DIFERENTES
DISTRIBUCIONES.
CAPÍTULO IV. El MODELO LINEAL GENERALIZADO. APLICACIÓN A
DIFERENTES DISTRIBUCIONES.
4.1. Introducción
En este capítulo se emplea el Modelo Lineal Generalizado para las variables con
enlace.
teórico-práctico.
tipo Normal, Binomial y Poisson, por ser estas las más frecuentes en las variables
84
4.2.2. Modelo Lineal Generalizado
Wedderburn (1972) como una extensión del Modelo Lineal General. Este modelo
Yij i e ij
Donde:
: Media general.
eij: efecto del i-ésimo error aleatorio asociado a la j-ésima observación (j = 1,2…n).
i g = g 1
Donde:
85
Tabla 4.1. Distribuciones y funciones de enlace.
Distribución Función de enlace
Normal Identidad:
Poisson Logarítmica: log
Binomial Logística: log
1
1. Tratamiento (Tto)
EXCEL versión 9.0 (2003). Para determinar la suma de cuadrado del error y la
86
probabilidad de error tipo I del MLG, se empleó el paquete estadístico Infostat
(2008). En el caso del MLGnz se empleó el paquete estadístico SAS versión 9.1.3
error tipo I
En la tabla 4.2 se muestran los rangos de probabilidad de error de tipo I para los
decisión, no obstante el MLGnz rechaza a niveles más bajos (<0,01) que el MLG
(<0,05) de probabilidades de error tipo I. Esto puede estar dado a que estos
modelos mantienen cierta relación, pues el MLGnz es una extensión del MLG, con
la característica que no tiene que cumplir los supuestos del ANAVA, y al igual que
el MLG, posee una parte sistémica, según lo planteado por González (2001).
87
Según Ponsot (2009), cuando la variable respuesta se distribuye Normal y siendo
cualquier otro caso, el MLGnz cobra su propio espacio y tanto la estimación de los
parámetros como el ANAVA, deben ser realizados por métodos diferentes a los
propuestos para el MLG. Por lo que los métodos de estimación del MLGnz se
Tabla 4.3. Resultados del coeficiente Alfa de Cronbach para el Modelo Lineal
General y Modelo Lineal Generalizado.
Varianza explicada
Dimensión Alfa de Total % de la
Cronbach (Autovalores) varianza
1 ,814 3,472 43,402
2 ,648 2,309 28,858
Total ,945 5,781 72,260
error tipo I de la dócima F de Fisher del MLG, y la dócima 2 del MLGnz, la suma
88
resultan importantes los indicadores tamaño de muestra y tipo de experimentos
(tabla 4.4).
Tabla 4.4. Resultados de los pesos de los indicadores por cada dimensión para el
Modelo Lineal General y el Modelo Lineal Generalizado.
Dimensión
Indicadores
1 2
Tratamientos ,526 ,350
Tamaño de muestra -,303 ,861
Tipo de experimento -,527 ,719
Probabilidad de error tipo I dócima F de Fisher -,804 ,354
Probabilidad de error tipo I dócima X2 -,795 ,347
Suma de cuadrado del error MLG ,761 ,410
Devianza MLGnz ,696 ,507
Distribución -,696 -,507
altas positivas entre sí como se observa en el Anexo 5. Esto está dado porque se
parte de la misma fuente de información del capítulo anterior y por la relación que
se observa una correlación alta positiva. Se considera que se debe a que estos
de muestras de 3 a 15.
89
En la figura 4.1 se presenta el Biplot de los indicadores analizados a partir de los
Figura 4.1. Biplot de los indicadores estadísticos de los Modelos Lineal General y
Lineal Generalizado.
La distribución de los datos muestra una correlación alta y negativa con la suma
la función de enlace correspondiente; por lo tanto el paso del MLGnz ajustado con
90
la distribución adecuada a los datos, a un ajuste con otra distribución, debe
dos que comprendió los meses junio-julio de 2007. Se empleó un DCA con tres
91
Las variables analizadas fueron:
1. No. tallos.
2. No. rebrotes.
3. No. hojas totales/tallos.
4. No. hojas totales/rebrotes.
5. No. hojas secas/tallos.
6. No. hojas secas/rebrotes.
Yij i e ij
donde:
: media general.
Donde:
92
Para la bondad de ajuste del modelo se tuvieron en cuenta los criterios de
2
Devianza/gl y gl (Chi - cuadrado).
variables No. de tallos y No. rebrotes hojas totales obtienen valores del cociente
2
de la Devianza y de gl cercanos a 1, lo que indica que el modelo para esas
Mora et al. (2007) y Dos Santos y Mora (2007) afirman que cuando estos
un ajuste apropiado.
2 de SCerror
Variables GL Devianza Pearson Desvianza/GL 2 /GL MLG
No. tallos 27 25,95 27,53 0,96 1,01 297,20
No. rebrotes 27 13,05 13,08 0,48 0,48 91,00
No. tallos
hojas totales 27 39,82 41,57 1,47 1,54 1733,71
No. rebrotes
hojas totales 27 19,71 19,92 0,73 0,74 330,11
No. tallos
hojas secas 27 6,32 6,33 0,23 0,23 70,90
No. rebrotes
hojas secas 27 45,29 37,87 1,68 1,40 138,00
93
Los valores por debajo o por encima de uno, son considerados como que existe
variables, No. rebrotes, No. tallos hojas totales, No. tallos hojas secas y No.
situación que se presenta cuando la varianza expresada por los datos es mucho
r=0,649.
probabilidad de error tipo I del MLG y MLGnz son muy diferentes, en este caso la
94
Tabla 4.6. Resultados de los valores de probabilidad de error tipo I para el Modelo
Lineal General y el Modelo Lineal Generalizado.
Valor de Dócima de McNemar
probabilidad de Estadístico Valor P
error tipo I
Variables MLG MLGnz
No. tallos 0,1122 0,0841
No. rebrotes 0,0018 0,0180
No. tallos hojas totales 0,0463 0,0040 0,001 0,78
No. rebrotes hojas totales 0,0001 0,0001
No. tallos hojas secas 0,0026 0,1725
No. rebrotes hojas secas 0,2440 0,1161
una técnica unificadora que agrupa los Modelos de Análisis de Varianza (ANAVA),
más flexible que el MLG, pues la variable respuesta no requiere del cumplimiento
95
indicadores de dispersión, dados por la suma de cuadrado del error y la
Devianza.
variables.
96
- Uso del Modelo de Análisis de Varianza paramétrico (si no son serias
de Varianza.
97
Investigaciones relacionadas con la aplicación del
Modelo de ANAVA
A priori A posteriori
Planeación de
la investigación
Modelo de ANAVA paramétrico
Ejecutar el No
experimento Si
Cumplimiento de los
supuestos teóricos
Obtener los resultados
experimentales
98
CONCLUSIONES
CONCLUSIONES
99
RECOMENDACIONES
RECOMENDACIONES
100
REFERENCIAS
BIBLIOGRÁFICAS
Referencias bibliográficas
Agresti, A. 2007. Categorical Data Analysis. Editorial John Wiley & Sons. 2ª
edition. 349 p.
Balzarini, M.; Di Rienzo, A.; Cazanove, F.; González, L.; Tablada, M.; Guzmán,
W. y Robeldo, W. 2008. InfoStat paquete estadístico InfoStat versión 2008,
Manual de usuario, Grupo InfoStat, FCA, Universidad Nacional de Córdoba,
Argentina 115pp.
Box, G.E.P and Cox, D.R. 1964. An analysis of transformations. Journal of the
Royal Statistical Society. Series B (Methodological) 26(2) 211-252.
Cox, F. and Dunn, T. 2002. An analysis of decathlon data. Journal of the Royal
Statistical Society: Series D (The Statistician) 51(2) 179-18.
Daniel W. W. 1978. Applied No- parametric Statistics. Ed. Houghton Myffin Co.
Boston. 503p.
Di Rienzo; J.A.; Casanoves, F.; González, L.M.; Tablada, E.M; Díaz, M. P.;
Robledo, E.W. y Balzarini, M. G. 2005. Estadística para las Ciencias
Agropecuarias. Edición Electrónica. Sexta Edición. Córdova. Argentina. 347p.
Dos Santos, A. y Mora, F. 2007. Análisis experimental de tratamientos floculantes
de residuos orgánicos derivados de la producción porcina. Revista Ciencia e
Investigación Agraria 34(1) 49-56.
Durbin, J. and Watson, G. S. 1950. Testing for Serial Correlation in Least Squares
Regression, I. Biometrika 37(1) 409–428.
Faraway, J. J. 2006. Extending the Linear Model with R: Generalized linear, mixed
effects and nonparametric regression models. Journal Computational Statistics.
24(2) 369-370.
Font, H.; Torres, V.; Herrera, M. and Rodríguez, R. 2007. Fulfillment of the
normality and the homogeneity of the variance in frequencies of accumulated
measurement of the egg production variable in White Leghorn hens. Cuban J.
Agric. Sci. 41(3) 207-210.
Fraser, D.A.S. 1957. Nonparametric Methods in Statistics, John Wiley & Sons, Inc,
New York, 299p.
Johnston, G. 2000 SAS software to fit the generalized linear model. Consultado
[25/2/09]. [on line]. Disponible en:
http://www.sas.com/rnd/app/papers/genmod.pdf.
Lilliefors, H. 1967. "On the Kolmogorov-Smirnov Test for Normality with Mean and
Variance Unknown," J Am Stat Assoc. 62(318) 399-402.
Linares, G. 2001. Escalamiento Multidimensional: Conceptos y enfoques. Revista
Investigación Operacional. 22(2) 173-183.
Martín, A. y Luna, C.J. 1994 Bioestadística para las ciencias de la salud. 4ª Ed.
Norma, S.A. España.[s/v](1) 133-170.
Mora, F.; Perret, S.; Scapim. A.; Nunes Martins, E. y Paz Molina, M. 2007.
Variabilidad en el florecimiento de procedencia de Eucalyptus cladocalyx en la
Región del Coquimbo. Revista Ciencia de la Investigación Agraria 34(2) 131-
139.
Royston, P. 1982. An extension of Shapiro and Wilk’s W test for normality to large
samples. J. Royal Statistical Soc. Series C. 31(2) 115-124.
SAS, versión 9.1.3, 2007. User’s guide statistics. SAS Institute Inc., Cary, NC, USA
Scheffé, H. 1959. The Analysis of Varianza. John Wiley & Sons, Inc, New York.
477p.
Scheirer, J. C.; Ray, W. S. and Hare, N. 1976. The Analysis of Ranked Data
Derived from Completely Randomized Factorial Designs. Biometrics. 32(2) 429-
434.
SPSS, versión 19.0. 2010. SPSS for Windows. Statistical Package for the Social
Sciences.
Wu, J. and Wong, M. 2003. A Note on Determining the p-Value of Bartlett's Test of
Homogeneity of Variances. Communications in Statistics: Theory & Methods
32(1) 91.
ANEXOS
Anexo. 1. Verificación de los supuestos teóricos básicos y consecuencias de su incumplimiento en el Análisis de Varianza.
Consecuencias del
incumplimiento en el
Supuestos Dócima Estadístico de prueba Características
ANAVA
Normalidad Shapiro-Wilk (1965) modificado Si el valor de P ≤ 0,05 La falta de normalidad
2 se rechaza la hipótesis no afecta demasiado a
por Royston (1982) n de distribución Normal. la prueba F
a x
i i Es una prueba potente Si los datos son muy
i 1 y se recomienda asimétricos influyen en
W
2 cuando el tamaño de el estadístico de la
n muestra es pequeño prueba. Si no hay
x i x n< 30. Salvador y Normalidad, el
i 1 Gargallo (2003) verdadero nivel de
significación es mayor
que el nivel aparente.
ai: coeficiente Esto conlleva a
xi: es el número que rechazar la hipótesis
ocupa la i-ésima posición en nula cuando es
la muestra. verdadera, es decir se
presentan demasiadas
x : media muestral diferencias significativas
que no existen.
D máx Fn X FoX
Kolmogorov-Smirnov Fn (X): Distribución teórica Las únicas premisas
acumulativa observada de la que se necesitan para
muestra tomada al azar. la realización de esta
prueba es que:
Fo (X): Distribución teórica Las mediciones se
Normal. encuentren al menos
en una escala de
intervalo.
Que la medición
considerada sea
básicamente continua.
Además dicha prueba
es aplicable cualquiera
sea el tamaño de la
muestra (Mesa, 1998).
La prueba de
Kolmogorov-Smirnov
Kolmogorov-Smirnov, corregida con la modificación de
D máxFn X ((X x) / s(x))
por Lillefors (1967) Lillierfors es la más
utilizada
y se considera uno de
Donde: es la función de los test más potentes
distribución de una normal para muestra mayores
estándar. de 30 casos.
Homogeneidad Bartlett (1947) Esta prueba da la Morales (2008) y,
de varianza ln 2 (n1) n1 ln2 (n1) posibilidad de decidir si Morales y López (2009),
2
X Bartlett existe señalan que la
(n1) homogeneidad o heterogeneidad en las
k 1
1 heterogeneidad en el varianzas de los
3(k1) (Nk)
error estadístico, que se tratamientos puede
utiliza con más conllevar a una
frecuencia, siendo subestimación de los
Donde: sensible a la falta de errores estándar de los
X2Bartlett : estadístico de esta normalidad (Cox y estimadores de los
prueba.,ln: logaritmo Dunn, 2002) y (Wu y parámetros del modelo.
natural. Wong, 2003)
s2: varianza.
n = tamaño de la muestra
del grupo.
K = número de grupos
N = tamaño total
Levene (1960) k Es menos sensible a la
(N k ) n i ( Z Z ) 2 no normalidad de las
i1
W 2 muestras y una buena
k ni
k 1 Z ij Z i alternativa. (Correa,
i1 j1 2006), señala el autor
Donde: que esta prueba ofrece
Zij puede tener una del as una alternativa más
siguientes tres definiciones: robusta que el
procedimiento de
Bartlett, ya que es poco
Z ij Yij Y i. donde: Y i. es sensible a la desviación
la media en el i-ésimo de la normalidad.
subgrupo.
~ ~
Z ij Yij Yi. donde: Yi. es la
mediana en el i-ésimo
subgrupo.
Z ij Yij Yi . donde: Yi. es el
10% de la media truncada
en el i-ésimo subgrupo.
Z i. es la media del grupo
Z ij
Z .. es la media general de
Z ij
Hartley (1950) 2 Esta prueba se requiere
máx (s i )
Fmáx 2
que todas las
mín(s i ) observaciones en cada
grupo tengan el mismo
estadístico Fmax tamaño. Fue propuesta
(asumiendo independencia por Hartley, (1950) y
de las muestras aleatorias Schuyten, (1990)
tomadas de las poblaciones
normales) es FMáx con k
grados de libertad en el
numerador y grados de ν =
n−1 grados de libertad en el
denominador
Independencia Durbin y Watson (1950) 2 La autocorrelación Las consecuencias
tT surge cuando los inmediatas, producto de
de los errores
t t 1 términos de error del la autocorrelación, es
d t2 modelo no son que los estimadores son
tT 2 independientes entre sí, poco eficientes, ya que
t
es decir, cuando: sus varianzas estarán
t 1 E(uiuj)≠0. para todo i≠j. sobre o subestimada lo
Entonces los errores cual imposibilita utilizar
Donde: t es el residuo
estarán vinculados las pruebas de
estimado para el período t. entre sí. Los contrates “test”
estimadores mínimos estadístico usuales para
cuadráticos ordinarios verificar la validez de
(MCO) obtenidos, bajo las estimaciones. Pero
esta circunstancia, los estimadores siguen
dejan de ser eficientes. siendo lineales,
insesgados y
consistentes pero han
perdido (como
consecuencia de
autocorrelación) su
propiedad de varianza
mínima, pero la
insesgadez será útil
para resolver el
problema Ramírez
(2004).
Anexo 2. Encuesta aplicada a los investigadores
Dpto: ____________________________________________________________
Si __________ No_________
1
1. x _______ 4. _______
X
1
2. arcoseno p _______ 5. _________
x
3. Otros ___________
Si__________ No ___________
Si__________ No ___________