Vous êtes sur la page 1sur 313

UNIVERSIDAD
NACIONAL
DE COLOMBIA
Sede BogJtá

colección textos

J. HUMBERTO MAYORGA A.
Es estadístico con maestría en ciencias-estadística

en la Universidad Nacional de Colombia.

En la actualidad es profesor asociado, vinculado

al departamento de estadística de la Facultad de

Ciencias. Su labor docente, principalmente en las

áreas de teoría estadística, probabilidad y análisis

multivariado, ha estado acompañada por el

desempeño de labores de gestión académica como

director de la carrera de estadística y de actividades

de extensión universitaria en el servicio de

consultoría estadística que el departamento presta

a los sectores público y privado.

Inferencia estadística

J. Humberto Mayorga A.
Profesor del Departamento de Estadistica
Facultad de Ciencias

Inferencia
estadística

Universidad Nacional de Colombia
FACULTAD DE CIENCIAS
BOGOTÁ

Primera edición. Unibiblos dirunibiblo_bog@unal. Humberto Mayorga A. 2004 Bogotá. UNIBIBLOS Director general Francisco Montaña Ibáñez Coordinaci6n editorial Dora Inés Perilla Castillo Revisi6n editorial Fernando Carretero Preparaci6n editorial e impresi6n Universidad Nacional de Colombia.3 00 p. Facultad de Ciencias. Humberto Mayorga A. 2004 XX. 1951- Inferencia estadística 1 J.edu. Colombia.541 M473i 1 2004 .© Universidad Nacional de Colombia Facultad de Ciencias Departamento de Estadística © J.co Carátula Camilo Umaña ISBN 958-701-374-3 ISBN 958-701-138-4 (obra completa) Catalogación en la publicación Universidad Nacional de Colombia Mayorga Alvarez. ISBN: 958-701-374-3 l. Jorge Humberto. -. Departamento de Estadística CDD-21 519. Probabilidades I.Bogotá: Universidad Nacional de Colombia. Estadística matemática 2. Universidad Nacional de Colombia.

Myriam Mayorga (1958-2004) . Héctor Mayorga (1918-2003) y al grato recuerdo de mi hermana. Al eterno recuerdo de mi padre.

. . .3 Preliminares de convergencia de variables aleatorias 12 1. . . .3 El método por analogía . . . .2. . 29 1. . . .1. . .1. 57 2 Estimación puntual de parámetros 65 2. . . . . un requisito de precisión 90 III .5.1 El método de máxima verosimilitud 68 2. . . . . . . .5 Estadísticas de orden. . semirrango y mediana de la muestra. 2 1.4 Características generales de algunas estadísticas. . . . 5. .1 Distribución de las estadísticas de orden . . .1 La inferencia estadística como un soporte epistemológico.2 Criterios para examinar estimadores 89 2. 5 1. . .2 Preliminares de la inferencia estadística . . .1 Concentración.Contenido Prólogo vii Introducción ix 1 Distribuciones Muestrales 1 1.2 Distribución del rango.7 Demostración de los teoremas 34 1. . . .1 Métodos clásicos para construir estimadores 67 2. .1. .3 Distribución de la función de distribución de la muestra . 30 1. .5.1. . .6 Momentos de estadísticas de orden 31 1. 25 1. . . . . . .4 Estimación bayesiana 84 2. . . . . . . . . . . . . . . 17 1. . . . . . 83 2.2 El método de los momentos 79 2.8 Ejercicios . 27 1.

. . 178 3. . . . . . . . . . 149 3.2. ..2. . . . . . . . . . .4.o .3. . . . . . . .2 = 60 227 4.2.8 Demostración de los teoremas . . .1 Intervalos confidenciales para el promedio de una población . .6 Tamaño de la muestra simple bajo Normalidad 175 3.2 Intervalos confidenciales para el cociente de va- rianzas de dos poblaciones independientes 169 3. . . . . . . . .4 Ejercicios .2 Estimación de la proporción poblacional . .3. . . . .2. .2 El método de la variable pivote . . . . . . . 148 3. . . . .1 Elementos básicos . 157 3. . 165 3. .3 Intervalo confidencial para la diferencia de prome- dios basado en una muestra pareada . .3. . . . . . . . .2 Consistencia. . . . . . . . .6 Robustez. .9 Ejercicios . . . . . . un requisito ligado al tamaño de la muestra . . . . 201 4.3. . 165 3. . . . . . . . un requisito de retención de información 96 2.3 Juzgamiento de hipótesis sobre promedios bajo Normalidad218 4. . . . .3 Demostración de los teoremas . . . .. .3.4 Juzgamiento de hipótesis sobre varianzas bajo Normalidad 237 4. . . . . . . . . . .3 Estimación de promedios bajo Normalidad.iv CONTENIDO 2. . 161 3. .1 Juzgamiento de la hipótesis nula Ho : (72 = (76. . .5 Ejemplos numéricos de aplicación . . . . 157 3.5 Completez. . . . . . . . . . . . un requisito de máxima precisión 108 2. . . . . . .2. . 123 2. . . 163 3.4 Estimación de varianzas bajo Normalidad . . . . 182 4 Juzgamiento de hipótesis 187 4.4..1 Conceptos preliminares.3 Suficiencia. . .1 Intervalos confidenciales para la varianza de una población . . 173 3. . . . . . . . . . . .j). . . . . . 126 2. . .4 Varianza mínima. . 189 4. . = j). . 162 3. . . . . .2 Juzgamiento de la hipótesis nula Ho : j).4. .7 Estimación bayesiana por intervalo 177 3. . un requisito de estabilidad. . . . .4 Intervalos confidenciales para la diferencia de prome- dios en poblaciones independientes . . . . 94 2. . . . .l . 218 4.1 Juzgamiento de la hipótesis nula Ho : j). . 237 . . . . . . . . . . . . 135 3 Estimación por intervalo de parámetros 147 3. . .3. un requisito de la distribución muestral116 2. .2 Tests más potentes .

249 4. .9.7 Tamaño de la muestra . . . CONTENIDO v 4. .4. 252 4. 273 4. . . . . .240 4. . . . . . .1 Juzgamiento del ajuste por medio del método de Pearson . .2 Juzgamiento del ajuste por medio del método de Kolmogorov-Smirnov . . 268 4. . .6 Ejemplos numéricos de aplicación. 261 4. . . . . . . . . 280 Bibliografía 289 . . .242 4. . 262 4.9 Juzgamiento del ajuste.246 4. . . . . . . .2 Juzgamiento de homoscedasticidad . .8 Juzgamiento secuencial. .10 Demostración de los teoremas . .11 Ejercicios .9. . .5 Juzgamiento de proporciones . .

dando paso a la utilización del tablero acompañado de la tecnología audiovisual como posibilidad para profundizar algunos de los temas y como medio para tratar las preguntas e inquietudes estudiantiles y no como instrumento transcriptor de frases y gráficas. por sus dificultades y por algunas contradicciones con algunos de sus preconceptos. No pretendo publicar un texto más. las preguntas inteligentes y las respuestas sobresalientes como las equivocadas en las evaluaciones. pues entiendo que. semánticas y con- ceptuales promovidas por la percepción que tengo sobre la estadística y vii . En este libro expreso mis apreciaciones personales. el profesor. animador y crítico. algunos clásicos cuya consulta es obligada y otros de re- ciente edición que han incorporado nuevos desarrollos conceptuales. se convierte solamente en orientador. especialmente con el propósito de optimizar el tiempo y la calidad de la exposición de los temas. como acompañante en la formación profesional.Prólogo La escritura de este libro siempre estuvo animada por el deseo obstinado de secundar el trabajo que realiza el estudiante en el salón de clase y fuera de éste. que por una exposición frente al tablero. Según mi criterio. De esa recopilación mucho se desechó y corrigió. con- ceptos inducidos más por sus dudas. generalmente suscitaron la reflexión acerca de las formas y los contenidos de los guiones de la clase. Con ese espíritu quise que este libro se constituyese en una juiciosa preparación de clase de la asignatura inferencia estadística. pues los hay de una calidad inmejorable. en definitiva. es el estudiante quien aprehende los conceptos como fruto de sus quehaceres académicos. preparación que recopila las memorias de cada una de las oportunidades en las cuales fui el encargado del curso a lo largo de mis años como docente en la U ni- versidad Nacional de Colombia. pues las preguntas de los estudiantes confundidos. El texto pretende apoyar el trabajo académico del curso.

La circunstancia de mi año sabático. . Su contenido y organización responden a la forma tradi- cional como he realizado el curso.VIll PRÓLOGO particularmente sobre la inferencia estadística. hi- zo posible la redacción y digitación de este texto. La versión actual recoge sugerencias de profesores y de estudiantes y las modificaciones fruto de las experiencias en el citado curso. la elaboración de este texto. pues fueron múltiples las ocasiones fallidas de organizar en un libro el material de la clase. creo que debo agradecer a mis alumnos. concepción que he madu- rado y apropiado. versión que sirvió de guía del curso de inferencia estadística dictado durante el primero y segundo semestres de 2003 para las carreras de Matemáticas y Estadística. Finalmente. El texto inicialmente fue publicado por la Facul- tad de Ciencias como notas de clase. y a la Universidad Nacional de Colombia que aceptó como plan de actividades de mi año sabático. pues ellos son el motivo para organizar las ideas que presento en torno a la inferencia estadística. de discusiones informales y dentro de eventos académicos. ad- ministrativos y de servicios de asesoría estadística que la Universidad Nacional me encargó. a partir de las reflexiones con profesores del Depar- tamento de Estadística. a las limitaciones de un semestre académico para su desarrollo y a los requisitos curriculares exigidos a los estudiantes en el mismo. debido a las ocupaciones derivadas de mis compromisos académicos. disfrutado durante el 2002.

El objetivo de esta organización es que la presentación de los temas exhiba continuidad y que las demostraciones y los ejercicios tengan su sitio especial. El estudiante se acerca a un ejercicio con información y trabajo previos. Se adaptaron términos de uso corriente en los textos de estadística a formas idiomáticas que semánticamente sean más fieles al concepto.Introducción Este trabajo ha sido concebido como texto guía en el desarrollo de la asignatura inferencia estadística. Igualmente. Retoma el tema de la convergencia de sucesiones de variables aleatorias. el profesor puede sugerir la realización de alguno o algunos ejercicios cuando haya culminado un tema o parte de éste. ix . se precisaron algunas expresiones comunes para mayor cla- ridad conceptual. y por supuesto los cursos de cálculo. El requisito natural e inmediato para abordar los temas de cada uno de los capítulos del libro es un curso de probabilidad. su organización de ideas y búsqueda de caminos debe evaluar si con los elementos estudiados hasta un cierto punto le es posible abordar el ejercicio particular. Los ejercicios no están ordenados por su complejidad ni por el tema tratado. fundamento del texto. Cada capítulo está estructurado en tres partes: exposición de los temas. El primer capítulo. para no encasillarlos. que cursan los estudiantes del pregrado en Estadística y de la carrera de Matemáticas. Esto no significa que el manejo del texto deba llevarse en el orden propuesto. y expone las ideas preliminares de la inferencia estadística. El texto consta de cuatro capítulos que pueden desarrollarse durante un semestre académico con seis horas semanales de clase tradicional. ubica sintéticamente a la inferencia estadística dentro del problema filosófico secular de la in- ducción. Sin embargo. demostraciones de los teoremas y los ejercicios correspondientes. Puede apoyar igualmente algunos temas de la asignatura estadística matemática de la maestría en Estadística.

x INTRODUCCIÓN

El segundo capítulo presenta los métodos corrientes de construcción de
estimadores y los criterios para examinar las estadísticas en su calidad
de estimadores.
En el tercer capítulo se aborda el método de la variable pivote para
construir intervalos confidenciales y se hace algún énfasis en los inter-
valos confidenciales bajo Normalidad. En el cuarto capítulo se adopta
la expresión juzgamiento de hipótesis a cambio de prueba, docimasia o
cotejo, porque esta acepción está más cerca del sentido de la toma de
decisiones estadísticas e igualmente se da un espacio importante en el
juzgamiento de hipótesis bajo Normalidad.

Capítulo 1

Distribuciones Muestrales

"El conocimiento que tenemos del mundo está basado en la
elaboración de un modelo de la realidad, modelo que puede
cotejarse con la experiencia tan sólo de manera parcial y oca-
sionalmente... Este modelo se construye teniendo en cuenta
la utilización que hacemos del mismo ... ".
Jerome S. Bruner (On Cognitive Growth).

Antes de entrar en materia, es preciso destinar unos párrafos para
introducir un bosquejo del contexto en el cual la inferencia estadística
puede ubicarse, más como exposición de ideas generales que una dis-
quisición filosófica al respecto. Ese contexto está contenido dentro de
un problema más general de carácter epistemológico, que el lector puede
profundizar con las copiosas publicaciones sobre el tema. Posteriormen-
te, por tratarse de uno de los fundamentos sobre el cual la inferencia
estadística erige algunos de sus conceptos, se incluye la sección 1.3 a
manera de un extracto de la convergencia de sucesiones de variables
aleatorias, tema que forma parte de un curso previo de probabilidad,
pero que se retoma por su carácter y por su utilidad próxima.

1

2 CAPÍTULO 1. DISTRIBUCIONES MUESTRA LES

1.1 La inferencia estadística como un soporte
epistemológico

La inferencia inductiva, procedimiento que utiliza la lógica para genera-
lizar a partir de hechos particulares o a partir de la observación de un
número finito de casos, es uno de los temas que ha ocupado a filósofos y
científicos de todos los tiempos, desde la época de Aristóteles, tres siglos
antes de Cristo, hasta la actualidad.
Varios filósofos antiguos formados en el empirismo gnoseológico, con-
vencidos de que la observación era la única fuente segura de conocimien-
to, fueron los primeros en proponer la inducción o inferencia inductiva
como método lógico. Tempranamente, la inducción se convierte en un
tema de mucha controversia que aún se mantiene; si para Aristóteles,
quien planteó inicialmente el procedimiento inductivo, la ciencia es "co-
nocimiento demostrativo" , por el contrario para Sexto Empírico, uno de
los filósofos del escepticismo, la ciencia es "comprensión segura, cierta
e inmutable fundada en la razón". Así, mientras Sexto Empírico recha-
za la validez de la inducción, Filodemo de Gadara, filósofo seguidor del
epicureísmo, defiende la inducción como método pertinente.
y la controversia, llamada el problema de la inducción o también
conocida como el problema de Hume, reside precisamente en que mien-
tras la inferencia deductiva avala la transferencia de la verdad de las
premisas a la conclusión, es decir, a partir de premisas verdaderas toda
deducción es cierta, a costa de no incorporar nada al contenido de las
premisas, la inducción por su parte que va más allá de las premisas,
por su carácter amplificador, puede dar lugar a conclusiones falsas. En
pocas palabras, la controversia se centra en la validez que puedan tener
los razonamientos inductivos, puesto que las conclusiones por medio de
la inducción no siempre serán verdaderas.
Algunos pensadores medievales también se preocuparon de la induc-
ción. El inglés Robert Grosseteste, al utilizar en su trabajo científico los
métodos aplicados por sus discípulos de Oxford en óptica y astronomía,
reabre en la Edad Media el tema de la inducción; si bien varios filósofos
de la época orientaron sus reflexiones hacia los métodos inductivos, los
ensayos y trabajos de Francis Bacon inspirados en la reorganización de
las ciencias naturales, constituyeron el apogeo del método inductivo.
No obstante, según Hume, las leyes científicas no tienen carácter
universal, es decir son válidas únicamente cuando la experiencia ha

1.1. LA INFERENCIA ESTADÍSTICA COMO UN SOPORTE EPISTEMOLÓGICO 3

mostrado su certidumbre y tampoco tienen la función de la previsibili-
dad. Popper, filósofo de la ciencia, conocido por su teoría del método
científico y por su crítica al determinismo histórico, en el mismo senti-
do de Hume, afirma que no puede existir ningún razonamiento válido a
partir de enunciados singulares a leyes universales o a teorías científicas.
Más recientemente, Bertrand Russell mantiene la posición de Hume de
la invalidez de la inducción, pero considera que ella es el camino para
incrementar la probabilidad, como grado racional de creencia, de las
generalizaciones.
La conocida Ley débil de los grandes números incluida en la cuarta
parte del trabajo más sobresaliente de Jacob Bernoulli, Ars Conjectandi,
publicado después de su muerte en 1713, y el también conocido teorema
de Bayes publicado cincuenta años más tarde, aportaron nuevos ele-
mentos a la discusión al constituirse en argumentos matemáticos que

--
sustentan la posibilidad de inferir probabilidades desconocidas a partir
de frecuencias relativas. Sin embargo, según Popper, sustituir la exigen-
cia de verdad por la validez probabilística para las inferencias inductivas
no lo hace un procedimiento legítimo.
Durante las primeras décadas del siglo pasado, a raíz de los impor-
tantes avances de la ciencia ocurridos a finales del siglo XIX y a prin-
cipios del siglo XX, avances que no podían pasar inadvertidos para los
pensadores, obligaron a los filósofos a revisar muchas de las ideas de los
clásicos y es así como un grupo de hombres de ciencia, matemáticos y
filósofos, se organizan en 1922 en torno al físico Moritz Schlick, profesor
de filosofía de la ciencia de la Universidad de Viena, convirtiéndose en
un movimiento filosófico internacional, principal promotor del positivis-
mo lógico (también llamado neopositivismo, neo empirismo o empirismo
lógico), movimiento conocido como Círculo de Viena, conformado entre
otros, además de Schlick, por Hahn, Frank, Neurath, Kraft, Feigl, Wais-
mann, Cadel, y Carnap; Einstein, Russell y Wittgenstein eran conside-
rados miembros honoríficos y Ramsey y Reinchenbach como miembros
simpatizantes del mismo.
Este movimiento filosófico se dedicó a muchos y variados temas de
la filosofía de la ciencia, y por supuesto al problema de la inducción. En
síntesis, puede afirmarse que el hilo conductor de las ideas del Círculo
de Viena fue la defensa de una visión científica del mundo a través de
una ciencia unificada ligado al empleo del análisis lógico en el sentido de
Russell.

4 CAPÍTULO 1. DISTRIBUCIONES MUESTRA LES

Pero, respecto a la inducción, el Círculo no cerró la discusión; concre-
tamente para Popper y sus seguidores, la escuela del refutacionismo, el
método científico no utiliza razonamientos inductivos, sino razonamien-
tos hipotético-deductivos. Así se acopien datos y hechos particulares
dentro del procedimiento de evaluación de una hipótesis que dan paso a
una conclusión de carácter general, no existe como tal un razonamiento
inductivo. Para el refutacionismo, la ciencia se concibe como una suce-
sión de conjeturas y refutaciones: se proponen conjeturas para explicar
los hechos, que luego serán refutadas para promover nuevas conjeturas.
En síntesis, según Popper y su escuela, ninguna teoría científica puede
establecerse en forma concluyente.
Sin embargo, para Feyerabend y Kuhn, en otro momento de gran
controversia en este tema, las décadas del 60 y 70, la práctica científica
no está en correspondencia con este proceder racional ni tampoco puede
lograrlo, porque en gran medida existen supuestos relativos a la objetivi-
dad, a la verdad, al papel de la evidencia y a la invariabilidad semántica.
Según Feyerabend, no existen principios universales de racionalidad cien-
tífica; el crecimiento del conocimiento es siempre específico y diferente
como tampoco sigue un camino de antemano fijado.
Dentro de esta controversia, a la inferencia estadística no se le ha
eximido del problema de la inducción. Ronald Fisher, considerado por
muchos el padre de la estadística, defendió el papel inductivo que conlle-
va el juzgamiento de hipótesis 1. Sin embargo, un sector de científicos y
filósofos consideran que tanto la estimación de parámetros como el juz-
gamiento de hipótesis tienen dirección inductiva pero el razonamiento o
inferencia que se lleva a cabo es de carácter deductivo.
En fin, la historia y la filosofía de la ciencia tuvieron un enorme
auge a lo largo del siglo pasado, continúan acopiando y estructurando
reflexiones y argumentos sobre la inducción, pero al no ser el propósito
de esta sección tratar el proceso lógico de la inducción desde el punto
de vista filosófico, ni tampoco pretender su recuento histórico, ni mucho
menos asumir una posición respecto a ella, se omiten nombres de muy
destacados pensadores contemporáneos. Lo que realmente motiva incluir
los párrafos anteriores es poner de manifiesto de manera muy concisa que
el problema de la inducción es filosófico con 23 siglos de existencia, al
cual generaciones de filósofos y científicos se han dedicado.
y más allá del debate epistemológico y metafísico contemporáneo

1 La denominación juzgamiento de hipótesis se justificará en el capítulo 4.

1.2. PRELIMINARES DE LA INFERENCIA ESTADÍSTICA 5

dentro de la filosofía de la ciencia, gran parte de la ciencia actual frente
a una naturaleza entrelazada de azar concomitante con una variabilidad
inherente, reconoce de una u otra manera que el ensanche de su cuer-
po conceptual requiere la participación imprescindible de la estadística.
Mucho antes de la omnipresencia del computador, de los avances verti-
ginosos de la teoría y de los métodos estadísticos de los últimos tiempos,
Hempel en 1964, en su libro Aspectos de la explicación científica, se
refería a los dos modelos de explicación de tipo estadístico: "El modelo
estadístico deductivo, en el que las regularidades estadísticas son de-
ducidas de otras leyes estadísticas más amplias, y el modelo estadístico
inductivo, en el que los hechos singulares se explican subsumiéndolos
bajo leyes estadísticas".
En esta dirección, cuando en los quehaceres científicos, tecnológicos
o administrativos se recurre a la estadística para organizar y orientar sus
procesos y métodos, y cuando se recurre a ella para apoyar argumentos y
decisiones, ese recurso suele convertirse, desde uno de los puntos de vista,
en un proceso de inducción específicamente que puede clasificarse como
de inducción amplificadora, de manera análoga a como Francis Bacon
vio en la inducción el procedimiento esencial del método experimental,
o convertirse en una serie de actividades ligadas a un procedimiento
propio de la ciencia o la tecnología, en un procedimiento hipotético-
deductivo, como lo entiende la escuela popperiana. Para cualquiera de
los dos puntos de vista que se asuma, la estadística brinda un respaldo
exclusivo en la inferencia.

1.2 Preliminares de la inferencia estadística
Dentro del contexto del parágrafo anterior, cabe formularse varias pre-
guntas:

1. ¿Cuál es el objeto para el cual son válidos los enunciados generales
producto de la inducción, de la decisión o la estimación que realiza
una aplicación estadística?

2. ¿Cuáles son las unidades que permiten obtener la información de
casos particulares como punto inicial en el citado proceso?

3. ¿Cuáles son los principios que rigen este proceso tan particular de
inferencia?

un interlocutor con el inves- tigador. Pero su estricta determinación radica en que cada una de esas unidades será. el lenguaje corriente de la estadística utiliza el término población. La segunda pregunta parece confundirse con la primera. a un gestor o a un tomador de decisiones. Como en casi todas las oportunidades. asociados a varios aspectos. sujeto o caso. es decir. por supuesto. Esas unidades pueden denominarse unidades estadísticas de manera genérica para subsumir en esa denominación otras como unidad experimental. Aunque la pregunta se refiere a esas entidades que corresponden a los hechos particulares. en algunas disciplinas cientí- ficas esas características comunes se denominan criterios de inclusión. para definir concisamente la pertenencia de un elemento al conjunto y para precisar igualmente la pérdida de la calidad de pertenencia del elemento. o cuando la respuesta de la unidad implica su desnaturalización o deterioro. como un proceso comunicativo: el investigador pregunta. de hecho no existe la posibi- lidad de "dialogar" con todas las unidades estadísticas. o cuando los resultados de la investigación se requieren con apremio. Para referirse a ese conjunto mencionado. en últimas. que son examinados durante la primera etapa de la inferencia. unidad de análisis. Por ejemplo. porque la investigación puede entenderse. cuando ese "diálogo" es oneroso. la naturaleza responde. ese agregado o colección de las unidades de interés es. DISTRIBUCIONES MUESTRALES La pregunta (1) indaga por el conjunto de todos los elementos que en un determinado momento interesan a un investigador. a los casos singulares. Interlocutor. se le designa co- rrientemente como muestra. de ma- nera análoga. cuando el tamaño de la población. complementados con los criterios de exclusión. en sentido metafórico. A ese subconjunto de unidades que se aludía como el conjunto finito de casos examinados durante la primera etapa del proceso de inferencia. Al respecto. Elementos diferentes entre sí pero que tienen una o varias características comunes que los hacen miembros del conjunto en consideración. debido a impera- tivos que lo impiden. circunscrito al subconjunto de unidades estadísticas elegidas por medio de procedimientos estadísticos formales. la reunión de todas las unidades posibles constituye ese conjunto que se ha llamado población. es ingente.6 CAPÍTULO 1. igualmente. el objeto receptor del producto del proceso de inducción. . de la decisión o de la estimación. el cardinal del conjunto que reúne a todas las unidades estadísticas. a ese conjunto finito de casos.

Sin em- bargo. decisión y estimación muy característicos. Definición 1. tratados por la inferencia estadística y motivo de la tercera pregunta. se construyen y evalúan posibles estimadores de estos últimos. y que tal como se anunció. 1. La estadística facultada para sustentar y conducir procesos de induc- ción. la descripción y el desarrollo de los citados principios son en definitiva el contenido mismo de este texto. los principios que avalan procesos de carácter es- tadístico. el sentido que la estadística le confiere al término consiste en una traducción de un aspecto de la realidad a un lenguaje simbólico. que habilite procesos de generalización que incluyan sus aspectos fundamentales y que faciliten su descripción o permitan la toma de decisiones. y de igual manera se derivan y evalúan procedimientos que permitan juzgar afir- maciones sobre el modelo. consisten en métodos y criterios relacionados con la construc- ción de estimadores y test y con el examen de la aptitud e idoneidad de los mismos. Para el desarrollo de cada una de sus dos componentes. particularmente dentro del lenguaje científico y tecnológico. modelos que pueden ser explícitos o generales. el vocablo modelo responde a varias acepciones. A partir de su estructura. la inferencia estadística tiene como punto de partida la referencia o el establecimien- to de modelos para representar variables observables o no observables. Una muestra aleatoria es una sucesión finita de . la tercera requiere respuestas a partir de elaboraciones conceptuales. de las expresiones matemáticas asociadas a su naturaleza y con ellas de la presencia y papel que desempeñan los parámetros. como uno de los recursos para representar de manera simplificada su comportamiento.1. En consecuencia. avala y licencia la es- tructura y el funcionamiento de métodos y procedimientos estadísticos. La factibilidad de representar variables muy disímiles asociadas con fenómenos de distintos campos del saber a través de un mismo modelo de probabilidad. pero aquí. le permite a la inferencia estadística detenerse en el modelo mismo para convertirlo en su objeto de estudio.2. de una manera sucinta. las cuales se darán gradualmente con el desarrollo de los capítulos objeto de este texto.2. cuyas respuestas son en últimas acuerdos semánticos. Semánticamente. relativos a la estimación de parámetros y el juzgamiento de hipótesis. cuenta con la inferencia estadística como la fuente conceptual que nutre. se esboza el fundamento de las respuestas. PRELIMINARES DE LA INFERENCIA ESTADÍSTICA 7 A diferencia de las dos preguntas anteriores.

el valor n recibe el nombre de tamaño de la muestra o tamaño muestral. . las explica- ciones o las decisiones a que haya lugar... una sucesión de variables aleatorias Xl.. un aspecto de las unidades estadísticas observado. De manera más general. DISTRIBUCIONES MUESTRALES variables aleatorias Xl.Xn de la defini- ción anterior denominada muestra aleatoria.. . en el sentido que se expone a continuación. que no siempre es posible conocer. Es- ta variable aleatoria que representa una variable en la población suele denominársele igualmente población.X2 .8 CAPÍTULO 1. Entonces. acudir a modelos de probabilidad para emu- lar el comportamiento poblacional es un recurso legítimo que reduce carencias. . por supuesto sobre la base de una escogencia juiciosa del modelo. el discernimiento de la esencia ya no individual sino colectiva de las unidades es en suma el motivo de la investigación o estudio. X 2 .. independientes y con idéntica distribución. puede vincularse con la información específica acopiada de un subconjunto de n unidades es- . ésta referida a una suce- sión de variables aleatorias. Por ello. la sucesión X I . La definición anterior revela que en el contexto estadístico el término muestra presenta dos acepciones: ser un subconjunto de unidades es- tadísticas elegidas por métodos estadísticos formales y la adjetivada co- mo aleatoria expuesta en la definición anterior. Por tanto. el comportamiento de las varia- bles se convierte entonces en un elemento revelador de características y propiedades que sustentan la descripción de la colectividad. . también se de- nomina muestra aleatoria. Lo mismo le ocurre al término población: denota al conjunto completo de unidades estadísticas objeto de estudio y ahora se le concibe como una variable aleatoria. . En el caso de una sucesión finita. Según estas consideraciones. El acceso al estudio de ese conjunto de unidades estadísticas se lleva a cabo mediante el examen de las características o respuestas de sus in- tegrantes. permite aprovechar las virtudes propias del modelo y hace posible la utilización de un lenguaje universal. El comportamiento real de una o varias variables es un compor- tamiento reflejo de la naturaleza de la población. interpretadas como variables.Xn independientes e idénticamente dis- tribuidas. medido o cuantificado en una variable (o varios aspectos utilizando un vector para disponer las variables) se le abstrae como una variable aleatoria (o un vector aleatorio) que tiene asociado un modelo particular. además de ser un elemento del ámbito conceptual de la teoría estadística. X2. . .

X 2 . bidimensional cuando q = 2.. son estadísticas entre otras • Xl + X 2 + .Xn . que puede denotarse como () al cual se le designa como parámetro del modelo. llamadas usualmente parámetros.2. Y así sucesivamente.. + X n = X n n . y sea además t una función de dominio ~n y recorrido ~q con q :s.. .Xn una muestra aleatoria de una población con función de densidad ... una estadística es unidimensional cuando q = 1. X n ) es un vector aleatorio de q componentes.. ni de constantes desconocidas. corres- pondientes a una variable denotada por X.. n. Sea Xl. Como el aspecto determinante en la naturaleza de una estadística es su no dependencia funcional de parámetros..2. 1... Definición 1. .2. En otros términos. X 2 . . por eso es habitual encontrar recurrente- mente la expresión "sea Xl.. . . . y si Xl... . Las constantes constitutivas del modelo pro- babilístico elegido para representar una población... el vector aleatorio t(X l .2. El contexto en el cual se en- cuentre el vocablo población delimita la acepción en uso: un conjunto o una variable aleatoria.. . X 2 . vector de k componentes. una muestra aleatoria de una población cuya función de densidad o función de probabilidad depende de un parámetro ().. La dimensión de la estadística estará dada por el valor de q. q = 1. . Asumiendo el modelo gaussiano para representar una variable en la población.Xn es una muestra aleatoria de la población así modelada..3. X2. . también llamadas parámetros que cuantifican rasgos generales en la po- blación cuando no se asume un modelo específico. X2. se le resalta por medio del siguiente ejemplo. . .2. tal que t(X l . el valor Xi puede entenderse como una realización de la correspondiente variable aleatoria Xi. X2. . . . . se disponen en un vector de k componentes. i = 1.n. ". función que no de- pende de ningún componente del vector (). k = 1.Xn ) recibe el nombre de estadística. .2. En estas condiciones.. .2. Ejemplo 1. . n. PRELIMINARES DE LA INFERENCIA ESTADÍSTICA 9 tadísticas de las cuales se dispone de los valores Xl.Xn .• .

)2 n-1 El contenido semántico que se les da en estadística tanto al término estimar como al término estimación. y (j son las constantes características del modelo gaussiano. antagónica con la peor cualificación de la informa- ción (una escasa cantidad de información de pésima calidad) no es la 2Real Academia Española (2001).p.. Vigesimase- gunda edición. para referirse a su acción o efec- to. Madrid: Espasa Calpe S. no sugiere un cálculo aproximado de un valor como equivocadamente se entiende. la cuarta bidimen- sional y la última de dimensión q = n. circunstancia prácticamente no factible. una cantidad insufi- ciente de información genera estimaciones no fiables. El proceso de inferencia sería inigualable si se contara con toda la in- formación de excelente calidad. Diccionario de la lengua española. .10 CAPÍTULO 1. particularmente las dos siguientes variables aleatorias no son estadísticas: n ¿ t z=l (Xi -Xn)2 (j y i=l (Xi .X2 . . pero sí los hay para el proceso que genera las estimaciones. como las genera una gran cantidad de información de calidad exigua. El significado en mención de aprecio o valor que se da y en que se tasa o considera algo 2 . porque no hay referentes para calificar su aproximación. en llevar a cabo un proceso que exige de manera imprescindible el contar con información de ese algo del cual se quiere fijar su valor..Xn ) Las tres primeras estadísticas son unidimensionales. la calidad de la estimación depende directamente de la calidad original y de la cantidad de información que se posea.1 se adjetivan distintas circunstan- cias en calidad y cantidad de información que constituye el insumo en el proceso de estimación. Puesto que los parámetros p. . A manera de sinopsis. considerando simultáneamente tanto la can- tidad de información como su calidad y utilizando el plano cartesiano para su representación. Debe entender- se como la realización formal de un avalúo. Esta situación ideal. es decir. proviene de una de las acepciones corrientes que tiene el segundo vocablo. en la figura 1. tampoco sugiere un proceso adivinatorio. DISTRIBUCIONES MUESTRALES • (X n . Por tanto.A. S~) • (X 1 . Consecuentemente.

.. única que debe censurarse dentro del proceso de estimación.5.2../ 1 100%¡.... se denomina estimador y a las citadas realizaciones o valores particulares se les conoce como estimaciones. estadística cuyas realizaciones son utilizadas para llevar a cabo estimaciones del parámetro del modelo probabilístico asumido. I I I I o Calidad 100% Figura 1. PRELIMINARES DE LA INFERENCIA ESTADÍSTICA 11 ...-~~~_-_-_-_-_-] ~.. El modelo probabilístico que rige el comportamiento de una estadística o de un estimador se denomina distribución mues- . construcción y calibración de instrumentos para el registro de la informa- ción. Igualmente censurable es contar con una acumulación exorbitante de información de deficiente calidad que no propicia un buen resultado. Definición 1. Definición 1. de la cual este texto no se ocupa porque se pretenden propósitos de otro tipo.2. o de sus componentes. La calidad de la información. debe asegurarse a partir del diseño. ~u I I ~Q).1: Diagrama de calidad y cantidad de información.. ni tampoco mantener el mejor nivel de calidad de la información en una cantidad minúscula de la misma..2.4.. Una estadística con dimensión igual al número total de componentes k del vector e o al número de componentes descono- cidos. 1... dentro de la organización y ejecución de las actividades de acopio de información y durante el proceso de almacenamiento y guarda de la información.

t=l 1. . M{ .. la cual es una sucesión de funciones medibles . . DISTRIBUCIONES MUESTRA LES tral de la respectiva estadística o del respectivo estimador. Por medio de {Xn }. se denotan y definen como 1 n M: . por razones que posteriormente se justificarán. Los momentos muestrales. . a la expresión 1 n n _ 1 ¿(Xi . ..n = X n .. es llamado de manera más corriente promedio muestral o promedio de la muestra. . es preciso abordar de una manera sucinta los tipos de convergencia de variables aleatorias en razón de que posteriormente el crecimiento del tamaño de muestra permite derivar propiedades interesantes de algunas estadísticas... Sea Xl. Por otra parte. ..2. Definición 1. el primer momento ordinario muestral. se describe una sucesión de varia- bles aleatorias Xl.2. como la distribución original de las observaciones o modelo original.n =. y a la distribución muestral de una estadística como la distribución reducida o modelo reducido. r = 1.6. X n una muestra aleatoria de una po- blación con momentos ordinarios y centrales /-l~ y /-lr respectivamente. Algunos autores se refieren a la distribución de la variable aleato- ria que representa a la población.3 Preliminares de convergencia de variables aleatorias Para aprestar los elementos que se requieren en la inferencia estadística.. n = 1. ordinarios y centrales de orden r. Xnf· i=l El caso particular cuando r = 1. cumplen en la muestra funciones análogas a los momentos poblacionales /-l~ y /-lr. y por tanto el propósito de esta sección es presentar los tipos más corrientes de convergencia de variables aleatorias. . ¿(Xi . X 2 .n = - n~" Xi i=l 1 n _ Mr.Xn)2. esto es. .12 CAPÍTULO 1.2. se prefiere como varianza muestral en cambio del segundo momento muestral.. . X 2 .

A. . X n va perdiendo el carácter de variable aleatoria porque su varianza va tendiendo a cero. el conjunto {wIXn(w) = c} E A. PRELIMINARES DE CONVERGENCIA DE VARIABLES ALEATORIAS 13 {X n (w)} definida en un espacio muestral O.3. es decir. se dice que la suceSlOn de variables aleatorias {Xn } converge en probabilidad a la variable aleatoria X. (!r·Como V [Xn ] = ar [1. En primer lugar. puede notarse el decrecimiento de dicha varianza en cuanto n se incre- menta. se afirma que la sucesión de variables aleatorias {Xn } converge casi se- guro a la variable aleatoria X.1. Y teniendo en cuenta que todas las variables aleatorias constituyentes de la sucesión están consi- deradas en el mismo espacio de probabilidad (O. de manera que P [lim X n n-->oo = c] = 1 esté siempre definido. ..X} converge casi seguro a cero. (!rJ. entonces En efecto. Se dice que la sucesión de variables aleatorias {Xn } converge casi seguro a cero o converge a cero con probabilidad uno si: P [lim X n = n-->oo o] = 1. P [ lim X n n-->oo = O] = 1 puesto que P[Xn = O] = 1 .3. y la variable aleatoria particular X están definidas en el mismo espacio de probabilidad. siendo {Xn } una sucesión de variables aleatorias y c un número real. esto es. Si el comportamiento probabilístico de cada una de las variables aleatorias de la sucesión {Xn } se modela por medio de la dis- tribución de Bernoulli de manera que X n "" Ber((!)n). hecho simbolizado como . la variable va asumiendo rasgos de una constante. si la sucesión de variables aleatorias {Xn . . Además. P). En segundo lugar. 1. X 2 . si las variables aleatorias Xl. este tipo de convergencia también se conoce como convergencia fuerte y se simboliza como Ejemplo 1.

X n ). X~k)) ~ g(X1 . . continua. 3. . . ln ~ 1-. convergencia en medida o convergencia débil.. En este caso cada variable de la sucesión de variables aleatorias {Xn } y X poseen el momento ordinario de orden r.Xn ) sean variables aleatorias. se enuncia el siguiente teorema.. . P[Xn =1= O] = P[X =1= O] = 1. X~2).3. Y la función 9 : IR. cuando r = 2.3. . si r = 1 suele decirse que n->oo la sucesión de variables aleatorias {Xn } converge en valor esperado a la variable aleatoria X.. Corolario 1.2. X~2). Para referirse a la convergen- n->oo cia en probabilidad también puede utilizarse convergencia estocástica.14 CAPÍTULO 1. b constantes. lo cual se representa como Xn~X si lim E [(IX n . . k -----7 IR. P[Wn =1= O] = P[W =1= O] = 1..X~k)) como g(X1 . . entonces si X:. X n W n ---+ XW.p ~ X j implica que g(X~l). Particularmente.3.. la convergencia se conoce como convergencia en media cuadrática. 4· ~ ~ ~.. Teorema 1.XI < E] = 1. Siendo las variables aleatorias X~j) . . X 2. k. X n + Wn ~X + W. DISTRIBUCIONES MUESTRALES si lim P [lXn .2. 6. . Específicamente dentro de la convergencia en probabilidad y debido al uso principal que tendrá en la construcción de estimadores por el llamado método de los momentos. para E > O. X2.. entonces 1. p 2. . X~ ~ X2. tal que tanto g(X~l). Si X n ~ X Y W n ~ W. Un tercer tipo de convergencia se conoce como convergencia en momento de orden r . Xj. .. 5. a. De manera similar. aXn + bWn ~ aX + bW.XIY] = O. . . En estas circunstancias se afirma que la sucesión de variables aleatorias converge en momento de orden r a la variable aleatoria X. j = 1.

. Considerando la variable aleato- ria particular X y la sucesión de variables aleatorias {Xn }. continua en cero. 1.3. . donde F(x) es continua. ..\ = n7r. X si y sólo si lim IjJn(t) n-too = ljJ(t) para t E IR Y 1jJ( t) la función característica de la variable aleatoria X.3.3. X n . PRELIMINARES DE CONVERGENCIA DE VARIABLES ALEATORIAS 15 Un cuarto y último tipo de convergencia de variables aleatorias se refiere a una sucesión de variables aleatorias {Xn }. La legitimidad de este proceder es respaldada por motivos de convergencia en distribución. .5 (Teorema de Lévy). De esta manera.. representa una sucesión de variables aleatorias tales . hecho denotado d Xn ---+ X si lim Fn(x) = F(x) para todo x.!!. definidas sobre el mismo espacio de probabilidad. Ejemplo 1.3. y siendo {Mn(t)} la sucesión de funciones generatrices de momentos correspondientes a las variables de la sucesión {X n }.4 (Teorema de Lévy). X n . X si y sólo si lim Mn(t) n-too = M(t) para t real en algún intervalo alrededor de cero y M(t) la función gene- ratriz de momentos de la variable aleatoria X. se considera.. Considerando la variable aleatoria particular X y la sucesión de variables aleatorias {X n }. Versión para funciones genera- trices de momentos.. se demuestra que cuando es apropiada la utilización del modelo Bino- mial. Si Xl. X 2.. cuya función de distribución es F(x). . definidas sobre el mismo espacio de probabilidad. . Teorema 1.6.. cuya correspondien- te sucesión de funciones de distribución Fl (x). y siendo {ljJn (t)} la sucesión de funciones características correspondientes a las variables de la sucesión {Xn }. F 2 (x). En los cursos generales de probabilidad y estadística. n-too Teorema 1. es decir n ---+ 00 y 7r ---+ 0.. la sucesión de variables aleatorias {Xn } converge en distribución a la variable aleatoria X. ... X n . pero el número de repeticiones n es grande y simultáneamente la probabilidad de éxito 7r es muy pequeña. las cuales existen para t real en algún intervalo alrededor de cero. es lícito utilizar el modelo de Poisson con .!!.

7. a la luz del teorema 1.P): .2t) n -~ lim h~O (1 . Sea {Xn } una sucesión de variables aleatorias. Entonces lim n~oo (1 . Teorema 1. y como Mxn(t) = (1. Ejemplo 1. el teorema anterior permite concluir que Y n ~ 1.8. A = n7r. condicionado el producto n7r a permanecer cons- tante en el valor A.Xn es una sucesión de variables alea- torias tales que X n rv x2 (n).16 CAPÍTULO 1.2t)-~. Es decir.7r + 7rett. Fn(x) la función de distribución de X n y F(x) una función de distribución tal que F (x) = O para x < c y F (x) = 1 para x :2: c. En efecto.et)]n = eA(et-l) .. X2. y la va- riable particular X definidas sobre el mismo espacio de probabilidad (D. .. . .3. Esto significa que Fx(x) es una función tal que Fx(x) = O para x < 1 Y Fx(x) = 1 para x :2: 1.7r (1 . como X n rv x2 (n).3. X 2 . Estando las variables aleatorias Xl.7. se trata de una constante igual a t.ht)-* = et siendo h 2 = -h . Si Xl. luego M Xn (t) = (1 . Entre los diferentes tipos de convergencia existen relaciones que es necesario destacar. El examen del lim MYn (t) permite concluir la convergencia enunciada de la suce- n~oo sión. con Yn = ~. X n ~ c si y sólo si lim Fn(x) = F(x) n-too siendo c una constante. DISTRIBUCIONES MUESTRALES que X n rv Bin(n. ~n (1. Xn ~ X rv Poiss(A).3.A. converge en probabilidad al valor 1. la sucesión de variables aleatorias {Yn }. M Yn (t) = (1 .. límite reconocido como la función generatriz de una varia- ble aleatoria con distribución de Poisson con parámetro A.7r)..et)t = n~oo lim n~oo [1 . El siguiente teorema las reúne. En consecuencia.3.9. entonces lim Mxn(t) = n~oo lim [1 . Teorema 1. es decir.~) -~.

además de cumplir funciones análogas a los momentos poblacionales como se incorporó en la definición 1. 3.2. son es- . 4.6. Si {Xn } converge en valor esperado a la variable aleatoria X. im- plica que {Xn } converge en probabilidad a la variable aleatoria X.9 se pueden recapitular en la figura 1. Convergencia en } Convergencia en probabilidad distribución ~~/ Convergencia en valor esperado Figura 1.2: Relaciones entre algunos tipos de convergencia de variables aleatorias.2. Siendo r > s. Si {X n } converge casi seguro a la variable aleatoria X con proba- bilidad 1.3.4. Si {Xn } converge en probabilidad a la variable aleatoria X implica que {Xn } converge en distribución a la variable aleatoria X. implica que {Xn } converge en probabilidad a la variable aleatoria X. ~~---~-. 1. 1. la convergencia de una sucesión de variables alea- torias {Xn } en momento de orden r implica la convergencia de la sucesión en momento de orden s. 2. CARACTERÍSTICAS GENERALES DE ALGUNAS ESTADÍSTICAS 17 1. De manera gráfica las relaciones que enuncia el teorema 1.4 Características generales de algunas esta- dísticas Los momentos muestrales.. Convergencia casi segura .

entonces E[Snl2= E [1 n_ 1~ ~(Xi . también llamado promedio poblacional.4.(E[X r ])2] = ~ [J-l~r . entonces el valor esperado y la varianza del momento muestral ordinario son.n > 1..X n) .1.Xn es una muestra aleatoria de una po- blación representada por la variable aleatoria X con varianza a 2 y con momento ordinario J-l~r' r = 1.18 CAPÍTULO 1. Teorema 1. sus distribuciones muestrales poseen propiedades generales respecto a su posición y a su dispersión en la forma como el siguiente teorema lo indica. n n-1 El tamaño de la muestra es un elemento sustancial tanto para las disquisiciones en la teoría de la estadística como para la utilización de la misma.1. J-l y varianza a 2.. es quizá de las más inquietantes para el investigador en la búsqueda de respaldo a la confiabilidad de su investigación.nl = ~ [E[x2rl .3.4. n Teorema 1. 3 4) .. .(J-l~)2] . y existiendo además el momento central de orden cuatro J-l4. X n es una muestra aleatoria de una po- blación con valor esperado. 2] = a2 V[Snl 2 = -1 ( J-l4 . .4.. respectivamente: E[Mr.J-lrI V[M:.2. por su magnitud.2.a . . E[Xnl = J-l~ = J-l _ a2 V[Xnl = . n -. . Corolario 1. el tamaño muestral es uno de los aspectos con los cuales se certifican o descalifican estudios. en definitiva.X2. . . La pregunta. Si X l . Si Xl. Según las hipótesis del teorema 1. X2. Es. . conocida como varianza poblacional.. .. DISTRIBUCIONES MUESTRALES tadísticas de uso frecuente que con la garantía de la existencia de deter- minados momentos poblacionales. un punto obligado para dilucidar.n I l- .4.

... . X n es una muestra aleatoria de una población con valor esperado ¡. es posible reiterar la convergencia en probabilidad del promedio de la muestra.2 . P Xn ~ ¡.~ ¡.. Modificando parcialmente las condiciones del teorema 1.4 en el sentido de no hacer ninguna mención de la varianza 0.') 50.95 de que el promedio muestral no difiera de ¡. Teorema 1.. .L < E] ~ 1.. Ó = 0.L.L y varianza 0.L en más de una cuarta parte de la desviación estándar? En esta situación. entonces .. la convergencia en probabilidad de los mo- mentos muestrales ordinarios a los momentos poblacionales ordinarios está avalada por el siguiente teorema. Teorema 1.4. X2. lo cual permite determinar la magnitud del tamaño muestral según prefijados requisitos... + .6 (Teorema de Khintchine). Esta cota para el tamaño de la muestra debe entenderse dentro del contexto de una población infinita y una muestra simple. ¡. X2. 1. entonces Xl X2+ Xn P + . Si las varia- bles aleatorias Xl.4. a medida que vaya in- crementándose el tamaño de la muestra. Si Xl. De manera más general. .Xn constituyen una muestra aleatoria de una población con valor esperado ¡.L.250-.4. por lo tanto: 2 0- n > (0 ..)2 (0.. ¿Cuál debe ser el tamaño de la muestra para tener una probabilidad de 0.. .4.. Ejemplo 1... el promedio muestral adquiere unos rasgos propios que los siguientes teoremas describen.L. . E = 0. . Ó > O. n La nota de la demostración del teorema anterior destaca el hecho que P [-E < X n .05 ) = 320.05..5.Ó 2 0- para n entero mayor que &2' E > O. CARACTERÍSTICAS GENERALES DE ALGUNAS ESTADÍSTICAS 19 La incidencia relevante del tamaño de la muestra en la distribu- ción muestral de muchas estadísticas gira alrededor del tema conocido como distribuciones asintóticas.2 . como lo presenta el siguiente teorema.4. En particular.4 (Ley débil de los grandes números).

X j ) = O. Dentro de la citada denominación de teorema del límite central se incluyen variantes como la versión original conocida como la ley de los ... p X n . X 2.4.2. Con la denominación de teorema del límite central debe entenderse más a un conjunto de teoremas concernientes a la convergencia en dis- tribución de la suma de un número creciente de variables aleatorias al modelo gaussiano.10.. 2 Sn ------> a y en consecuencia S~ E. se incluye el siguiente teorema que puede entenderse como una generalización de la citada ley.. .4. entonces .4. p . X n constituyen una muestra aleatoria de una población con valor esperado /-l.. . Si Xl... entonces .2. . Para cerrar esta relación de teoremas que giran alrededor de la idea de la ley débil de los grandes números. .8. L /-li n i=l La ley fuerte de los grandes números es un conjunto de teoremas referentes a la convergencia casi segura de sucesiones de variables alea- torias..j = 1.. pues constituyen puntos de apoyo sustanciales de la inferencia estadística y de las aplicaciones. X 2. . .4. . . Teorema 1. DISTRIBUCIONES MUESTRALES Teorema 1.. Si Xl. X 2. i =J. Si las varia- bles aleatorias Xl. a 2 .X2.9 (Ley fuerte de los grandes números). Teorema 1. . ./-ln ---+ O 1 n siendo 7ln = . . entonces la sucesión {X n . Si Xl. es una sucesión de variables aleatorias tales que E[Xil = /-li Y V[Xil = o'¡ son finitos y p(Xi .s. que a la más popular de sus versiones.Xn es una muestra aleatoria de una población para la cual el momento central /-l2r existe. Es un conjun- to de teoremas fundamentales de la estadística./-l} converge casi seguro a cero. para i. Mr.n ---+ /-ln r = 1. Teorema 1.7. X n es una muestra aleatoria de una población con valor esperado /-l y varianza a 2 .j. El teorema siguiente es el más divulgado de todos y fue enunciado originalmente por Kolmogorov..20 CAPÍTULO 1. entonces 2 a. . .

Lévy en la segunda década del siglo XX. 1. X2. (7 El teorema del límite central es la mejor justificación de la existencia del modelo gaussiano y del énfasis que de él se hace reiteradamente. considerando la variable aleatoria _ X n . se incluyen.J.4. X 2 . las versiones de Lindeberg-Lévy y Lindeberg-Feller. J. . Para finalizar estas consideraciones acerca del teorema del límite central se presenta una versión especial la cual corresponde al teorema de Lindeberg-Feller.W. . encaminado a la búsqueda de una demostración rigurosa.a Vn entonces la sucesión de variables aleatorias {Zn} converge en distribu- ción a una variable aleatoria con distribución Normal estándar.l Zn . . se integran las versiones de Bikelis y aquellas adaptadas para los casos multivariados. Si Xl. que son consecuencia de un trabajo iniciado por Chevyshev y Liapunov a finales del siglo XIX. CARACTERÍSTICAS GENERALES DE ALGUNAS ESTADÍSTICAS 21 errores. derivada de los trabajos de Gauss y Laplace sobre la teoría de errores. Por su parte. resultado al que llegaron de manera independiente J. 1). En pocas palabras. lo admirable del teorema radica en que no importa el modelo regente del comportamiento probabilístico de la población. Por otra parte.Lindeberg y P. es una sucesión de variables aleatorias independientes tales . Si Xl.4. Teorema 1.l) ~ Z rv N(O.l y varianza (72 finitos. y en que la exigencia de finitud del valor esperado y la varianza es fácil satisfacerla en las aplicaciones. . esta difundida versión determina que foCX n . que permitió el surgimiento de las versiones más antiguas referentes a variables con distribución de Bernoulli.11 (Teorema del límite central (Lindeberg-Lévy)).12 (Teorema del límite central (Lindeberg-Feller)). aquellas para el caso de variables dependientes. En particular. debidas a De Moivre y Laplace en los siglos XVI y XVII. Teorema 1. además.4. X n es una muestra aleatoria de una población con valor esperado J.. la versión clásica o teorema de Lindeberg-Lévy... la ver- sión más difundida. corresponde al siguiente teorema.

. debida a Laplace. X n una muestra aleatoria de una población con distribución de Bernoulli con probabilidad de éxito 7r... o proporción en la muestra.. Definición 1.14 (Teorema del límite central (Laplace». X2. (O < 7r < 1) y varianza (J"2 = 7r (1. i = 1. Teorema 1. Siendo Xl.22 CAPÍTULO 1.4..2. 1) Tn si y sólo si para cada E > O.. y a la estadística X n = Pn se le conoce como proporción muestral. Siendo Xl.Li I?ETn (x . Pn -7r Zn = Jn7r(l . y asu- n miendo que T~ 2: (J"'f ----+ 00 y además que max {~} ----+ O cuando i=l l:Si:Sn n T n ----+ 00. para i = 1. El teorema de Lindeberg-Lévy es una forma general que incluye el caso particular cuando Xl. son finitos. .. i=l determinando la variable aleatoria n7r Tn . i = 1. . X 2..2.4.13. X2.7r). siendo Pn = ~ 2: Xi = ~ Y 7r = P[Xi = 1]. Este caso particular corresponde a la versión más antigua del teorema del límite central.. X n es una muestra aleatoria de una población con distribución de Bernoulli de valor esperado JL = 7r. lim ~t n-too T n i=l (r J1X-J. . .¡ti) i=l d ----+ Z ~ N(O. . esta probabilidad recibe el nombre de proporción poblacional.. . n. .7r) V 7r (I:7r) la sucesión de variables aleatorias {Zn} converge en distribución a una variable aleatoria con distribución normal estándar. . DISTRIBUCIONES MUESTRALES que su valor esperado JLi y su varianza (J".2. n Por tanto. .JLi)2 fi(X)dX) = O siendo fi(x) la función de densidad de la variable aleatoria Xi. ... entonces f: (Xi .Xn una muestra aleatoria de una población con distribución .

1.4. CARACTERÍSTICAS GENERALES DE ALGUNAS ESTADÍSTICAS 23

de Bernoulli de valor esperado 1f, entonces

lim ~ P[Tn = k] = lim P[z' S Zn S z"]
n-+oo L.-t n-+oo
an:::;k:::;b n

= <I> (z") - <I>( z')

siendo a n = n1f + z' Jn1f(l - 1f) Y bn = n1f + z" Jn1f(l - 1f).

Este teorema garantiza entonces que siendo a, b enteros tales que
a < b, Y contando con un tamaño de muestra suficientemente grande, la
probabilidad P[a S Tn S b] puede aproximarse por medio de

b - n1f)
<I> ( Jn1f(l _ 1f) - <I>
(a - n1f )
Jn1f(l - 1f) .

b
Sin embargo, como P[a S Tn S b] = I: P[Tn = k], cada término
k=a
P[Tn = k] puede aproximarse por medio del área entre k - ~ y k + ~
bajo la curva de la función de densidad de una variable aleatoria con
distribución normal de valor esperado n1f y varianza n1f(l - 1f), como
se sugiere en la figura 1.3, área equivalente al área bajo la curva de
la función de densidad de una variable aleatoria normal estándar entre
k-!-nn k+!-nn
2 y 2 , de manera que
Jnn(l-n) Jnn(l-n)

b + .! - n1f ) ( a - .! - n1f )
P[a < Tn < b] ~ <I> 2 - <I> 2 .
- - ( Jn1f(l - 1f) Jn1f(l - 1f)

Cuando el comportamiento de una población se asume regido por el
modelo gaussiano, se pueden deducir propiedades específicas adicionales
para el promedio y varianza muestrales, propiedades que hacen explícitas
los siguientes teoremas.

Teorema 1.4.15. Si Xl, X 2 , ... , X n es una muestra aleatoria de una
población con distribución Normal de valor esperado 11 y varianza (72,
entonces
_X n rv N
((72)
11, --;;: .

24 CAPÍTULO 1. DISTRIBUCIONES MUESTRALES

k-!
/ tk' "
k+!

Figura 1.3: Aproximación de la probabilidad P[Tn = k].

Teorema 1.4.16. Si Xl, X 2 , ... , X n es una sucesión de variables alea-
torias independientes tales que Xi rv N (J-li, (77), entonces

u= t
i=l
(Xi:' J-li) 2
t
rv X2 (n ).

Corolario 1.4.17. Cuando la sucesión de variables aleatorias constituye
una muestra aleatoria de una población con distribución Normal, de
valor esperado J-l y varianza (72,

u= t(
t=l
Xi:' J-l) 2 rv x2(n).

Teorema 1.4.18. Si Xl, X 2 , •.. ,Xn es una muestra aleatoria de una
población con distribución Normal de valor esperado J-l y varianza (72,
entonces las estadísticas X n y S; son dos variables aleatorias estadísti-
camente independientes.
Teorema 1.4.19. Si XI,X 2 , ... ,Xn es una muestra aleatoria de una
población Normal de valor esperado J-l y varianza (72, entonces

~ (Xi - Xn)2 = (n -1)S; rv 2( _ 1)
6 (7 2 (7 2 X n .
i=l

Con supuestos menos taxativos, el promedio y la varianza muestrales
presentan un comportamiento muy particular. Los siguientes teoremas
destacan la marcada autonomía de las estadísticas X n y S;.

1.5. ESTADÍSTICAS DE ORDEN 25

Teorema 1.4.20. Si Xl, X 2 , ... , X n es una muestra aleatoria de una
población cuya función de densidad es simétrica, entonces

La expresión usual de la varianza muestral incluye el promedio de la
muestra, es decir, la varianza podría entenderse como función de éste.
Sin embargo, su presencia en la expresión puede considerarse aparente
puesto que la varianza de la muestra puede prescindir del promedio
muestral en la forma como lo garantiza el siguiente teorema 3.

Teorema 1.4.21. Si Xl, X 2 , ... , X n es una muestra aleatoria de una
población para la cual no se asume un modelo de probabilidad específico,
entonces

En síntesis, el promedio y varianza de la muestra son estadísticas
tales que bajo el modelo gaussiano son estadísticamente independientes;
bajo un modelo de probabilidad cuya función de densidad es simétrica,
las estadísticas no están correlacionadas, yen cualquier situación la va-
rianza de la muestra no depende funcionalmente del promedio de la
muestra.

1.5 Estadísticas de orden
Una modalidad especial de estadísticas la integran las llamadas es-
tadísticas de orden. Éstas desempeñan papeles importantes en al-
gunas aplicaciones como en las cartas de control estadístico de la calidad
y como en el fundamento y manejo de algunos conceptos en estadística
no paramétrica. Además de estos y otros usos, las estadísticas de orden
son particularmente los estimadores apropiados de parámetros que rigen
el recorrido de la población y, así mismo, se utilizan en el juzgamiento de
hipótesis referentes a estos parámetros. Por ser estimadores y sustentar
reglas de decisión en poblaciones especiales es menester exponer algunos
elementos y consideraciones acerca de su distribución.

3 Jorge E. Ortiz P. (1999), Promedio aritmético y varianza en grupos finitos de
datos numéricos. Boletín de Matemáticas. Vol. VI, No. 1, pp. 43-51.

26 CAPÍTULO 1. DISTRIBUCIONES MUESTRALES

Definición 1.5.1. La k-ésima estadística de orden, k = 1,2, ... ,n,
correspondiente a una muestra aleatoria Xl, X 2 , ... ,Xn , denotada por
Xk ,n, está definida de la siguiente manera:

Xk,n = min {{Xl, X 2, ... , Xn} - {Xl,n, X 2,n, ... , Xk-l,n}}

siendo
X l,n : mínimo de la muestra

Xn,n : máximo de la muestra

Al conjunto de estadísticas de orden Xl,n, X2,n, ... ,Xn,n se le designa
con el nombre de muestra aleatoria ordenada.

A partir de las estadísticas de orden pueden definirse otras estadísticas
como:

• El rango muestral:

R = Xn,n - Xl,n

• El semirrango muestral:

SR = Xl,n + Xn,n
2

• La mediana muestral:

X!!±.! n , si n es impar
2 '

Me =
X!!2' n + X~+l,n , si n es par
2

• La función de distribución empírica o función de distribu-
ción muestral:
1 n
Fn(x) = -;; , L1(-oo,xj(Xi).
i=l

1.5. ESTADÍSTICAS DE ORDEN 27

Es decir:
0, S2 X < Xl,n

k
,
n

1, si x 2: Xn,n, k = 1,2, ... ,n - 1

1.5.1 Distribución de las estadísticas de orden
Las estadísticas heredan en menor o mayor medida los rasgos del modelo
elegido para representar el comportamiento poblacional. Específicamente,
la distribución muestral de las estadísticas de orden incluye de manera
explícita las funciones de densidad y distribución de la población como
lo registran los siguientes teoremas.

Teorema 1.5.2. Siendo Xl,n, X 2 ,n, ... ,Xn,n las estadísticas de orden
o la muestra ordenada de una población con función de distribución
Fx(x), entonces para k = 1,2, ... ,n

FXk,n (y) = :t (~)
j=k J
[Fx(y)]j[l - Fx(y)]n-j.

Corolario 1.5.3. Para los casos especiales del mínimo y máximo de la
muestra se tiene:

FX1,n (y) = 1- [1 - Fx(y)]n
FXn,n (y) = [Fx(y)t·
Teorema 1.5.4. Siendo Xl, X 2 , .•. , X n una muestra aleatoria de una
población con función de distribución continua Fx(x), la función de
densidad de la k-ésima estadística de orden, k = 1,2, ... ,n, es

La función conjunta de densidad de la j-ésima estadística de orden y la
k-ésima estadística de orden fXj,n,xk,Jx, y) es

Cn,j,k[Fx(x)F-l [Fx (y) - Fx(x)]k-j-l [1- Fx(y)]n-k fx(y)fx (x)I(x,oo) (y)

28 CAPÍTULO 1. DISTRIBUCIONES MUESTRALES

para 1 :S j < k :S n, con Cn,j,k = n!j[(j - 1)!(k - j - 1)!(n - k)!]. La
función conjunta de densidad de las estadísticas de orden es

fX"n,X 2 ,n, ... ,Xn,n (Y1, Y2,"" Yn) rr
= {n! ,=1 fX(Yi)
O
Y1 < Y2 < ... < Yn

en otros casos

Ejemplo 1.5.5. Siendo Xl, X2, ... , X n una muestra aleatoria de una
población con distribución Uniforme en el intervalo (a, (3), determinar
la función de densidad de la k-ésima estadística de orden.

1
fx(x) = j3 _ a 1(a,(3) (x)

x-a
Fx(x) = j3 _ a 1(a,(3) (x) + 1[(3,00) (x)

n., y - a k-1 [ y - a ] n-k [ 1 ]
fXk,n(Y) = fI. 1\1f~ 1.\1 [ (3-a ] 1- (3-a (3_a I (o:,{J)(Y)

n! ..
(1)
a
(3 -
n
(y - a)
k-1
((3 - y)
n-k
I(O:,{J) (y).

La distribución de la k-ésima estadística de orden es la de una variable
aleatoria con distribución Beta en el intervalo (a, (3) con parámetros k
y (n - k + 1), cuando la población es Uniforme en el intervalo (a, (3).

Nota. Una variable aleatoria X con distribución Beta en el intervalo
(0,1) puede generar una variable aleatoria Y con distribución Beta en
el intervalo (a, (3) mediante la relación

y =a + (j3 - a)X.

Teorema 1.5.6. Sea Xl, X 2 , ... , X n , una muestra aleatoria de una po-
blación con función de distribución Fx(x) continua. Para p fijo, si x p
denota al único percentil lOOp poblacional, entonces

P[Xj,n < x p < Xk,n] = L 7 pl(1 - p)n-l.
k-l ( )

I=J

Xrn+l.2 Distribución del rango.XTj+l. En consecuencia. y = t+- 2 2 cuyo jacobiano es ax ax 1 -2 1 ar at =1 ay ay 1 1 2 ar at con lo cual fR.X 1 ..n 2 se considera la siguiente transformación r r x = t -. y) [(~2~i~!J2 [FX(X)]m-l[l .Fx (t .n. para r > 0.n + Xn.T(r. su distribución está totalmente determinada.n y Xn. 2' fXTj. t)dt fr(t) = l: fR. situación en la cual n es par. la determinación de su distribución parte de la consideración de la distribución conjunta de X 1 . t) = n(n-1) [Fx (t +~) . Si éste es entero impar..n .2. Definidas las estadísticas R = Xn.oo) (y).2 fx (x)fx (y)I(x.n (x.~)r-2 fx (t -~) fx (t + ~).xn. se tiene fR(r) = l: fR.y) = n(n -1) [Fx(Y) .Fx(x)t. la mediana es función de las estadísticas de orden X!!o2' n y X!!o+l no Así. . y) = fXrn.n (x. pues corresponde a la distribución de la estadística de orden En la n!l. ESTADÍSTICAS DE ORDEN 29 1. t)dr La distribución de la mediana está dependiendo del tamaño de la mues- tra.5. semirrango y mediana de la muestra Las estadísticas correspondientes al rango y semirrango son funciones del máximo y mínimo muestrales.n(x.T(r. 1.T(r.n T = X 1.n. al tomar n = 2m. Por tanto.5. m = 1.n fX1. FX(X)]m-l fx(x)fx(y) .n.

Considerando la transformación u = X!y... especialmente en métodos y conceptos de la estadística no paramétrica. X n es una muestra aleatoria de una población con función de distribución Fx(x). 2(2m)!_~ 100 [Fx(2u .v)]m-l[1 . . Fx(x)) y por consi- i=l guiente E[Fn(x)] = Fx(x) V[Fn(x)] = F x (x)[1 .Fx(v)]m-l fx(2u . Fx(x)t- k donde k = 0. .8 (Teorema de Glivenko-Cantelli).Fx(x)]...v)fx(v)dv 1.5. Su gráfico se convierte en un indicativo de una primera aproximación al ajuste que brinda el modelo. lim P [ sup IFn(x) . v = y. esto es. . Teorema 1..1. Si Xl. denotando la variable aleatoria Zi = IC-oo.5. entonces p Fn(x) -t Fx(x) para un valor x dado.30 CAPÍTULO 1. X2. En efecto.x] (Xi) n luego Zi rv Ber(Fx(x)). .5.Fx(x)1 < n-->oo -oo<x<oo f] = l. por tanto ¿ Zi rv Bin(n. ..7. para cada f > 0. n Teorema 1. X 2.n.Xn una muestra aleatoria de una población con función de distribución Fx(x). entonces Fn(x) converge uniformemente a Fx(x).3 Distribución de la función de distribución de la muestra La función de distribución empírica o de la muestra tiene varios usos. Algunos aspectos de su distribución se presentan a continuación. Siendo Xl. se tiene que f:E±J¿ (u) = fu (u) 2 = . P [Fn(X) = ~] = (~) [Fx(x)]k[1 . . .. DISTRIBUCIONES MUESTRALES con x < y.2.

1.6. MOMENTOS DE ESTADÍSTICAS DE ORDEN 31

-- Xo

Figura 1.4: Esquema de las funciones de distribución Fn(x) Y Fx(x).

Teorema 1.5.9. Siendo Xl, X 2 , •.. ,Xn una muestra aleatoria de una
población con función de distribución Fx (x), la sucesión de variables
aleatorias
fo[Fn(x) - Fx(x)] }
{ JFx(x)[l - Fx(x)]

converge en distribución a una variable aleatoria con distribución Nor-
mal estándar.

1.6 Momentos de estadísticas de orden
Los teoremas 1.5.2 y 1.5.4 puntualizan respectivamente la función de
distribución y la función de densidad de la k-ésima estadística de or-
den. En principio, garantizada la existencia del momento de interés r
y determinada explícitamente la función de distribución Fx(x), podría
formalizarse el citado momento de la k-ésima estadística de orden con
base en las referidas funciones de distribución o de densidad. Sin embar-
go, su logro depende de la complejidad de la integración requerida para
su cálculo, dado que algunas veces se alcanza únicamente por medio de
integración numérica.
A manera de ejemplo, considerando el comportamiento poblacional como
indiferente para cualquier valor del intervalo (O, 1), el valor esperado, la
varianza y el momento de orden r de la estadística de orden k es factible
determinarlos.

Ejemplo 1.6.1. Siendo X 1 ,n, X2,n, ... ,Xn,n una muestra ordenada de

32 CAPÍTULO 1. DISTRIBUCIONES MUESTRALES

una población con distribución Uniforme en el intervalo (0,1)
k
E[Xk,nl = n +1
k(n-k+1)
V[Xk,nl = (n + 2)(n + 1)2
1
j(n - k + 1)]"2 < k.
p(Xj,n, Xk,n) = [ k(n _ j + 1) , j

En efecto, en primer lugar, de manera general

r n.
E[Xk,nl = (k _ 1)!(n _ k)! , 1 1
O X
r+k-1
(1 - X)
n-k
dx
n!
(k _ 1)!(n _ k)!f3(r + k, n-k + 1)

Y utilizando la relación f3(a, b) = ~~a)~(~: , entonces
E[Xr l= n! r(r+k)r(n-k+1)
k,n (k - 1)!(n - k
n!(r + k - 1)!
1:Sk:Sn
(r + n)!(k - 1)!'
particularmente,

E[X 1- nIkI _ k
k,n - (n + 1)!(k - 1)! - n +1
V [Xk,nl = E[X~,nl - (E[Xk,n])2
E[X 2 1_ n!(k + 2 - 1)! _ k(k + 1)
k,n - (n + 2)!(k - 1)! - (n + 1)(n + 2)
V X _ k(k + 1) k2 k(n - k + 1)
[ k,nl - (n + 1)(n + 2) (n + 1)2 (n + 2)(n + 1)2

Por otra parte, denotando E[Xj,n, Xk,nl = 6., se tiene que

ó. =
n!
-,.
r.
Jo{l Jo .
xJy(y - X)k-J-l(l - y)n-kdxdy

n!
·'J{l y(l-yt- k Jo [r . .]
xJ(y-x)k-J-1dx dy
o

1.6. MOMENTOS DE ESTADÍSTICAS DE ORDEN 33

Realizando la sustitución v =~
y

~ = (j _ l)!(k -7!- l)!(n _ k)! 1 1
k
y(l - yt- [yk,6(j + 1, k - j)] dy
n!
(j _ l)!(k _ j _ l)!(n _ k)!,6(l + j, k - j),6(k + 2, n-k + 1)

j(k+1) -E[X. X 1
(n + l)(n + 2) - ),n, k,n

con lo cual

Cov(X. X ) _ j(k + 1) jk
),n, k,n - (n + l)(n + 2) j<k
(n + 1)2

j(n - k + 1)
j < k.
k(n - j + 1)
Por tanto, como caso especial, la correlación entre el mínimo y máximo
de la muestra bajo comportamiento poblacional Uniforme en el intervalo
(0,1) es
1
p(X1,n, X n,n) = -.
n
Como ya se mencionó, en algunos casos se requiere integración nu-
mérica para determinar momentos de una estadística de orden. Sin
embargo, es posible presentar expresiones que permiten aproximar el
valor esperado y varianza de la k-ésima estadística de orden.
El desarrollo de estas expresiones se basa en una expansión en serie de
Taylor y en que si X es una variable aleatoria con función de distribución
Fx(x) continua, la variable aleatoria Y = Fx(X) tiene distribución
Uniforme en (0,1), entonces

Finalmente se hace una breve alusión a la distribución asintótica de las
estadísticas de orden.

34 CAPÍTULO 1. DISTRIBUCIONES MUESTRALES

El estudio de la distribución asintótica de la k-ésima estadística de
orden incluye dos casos a saber: (1) cuando n tiende a infinito y ~
permanece fijo; (2) cuando n tiende a infinito y k o n-k permanecen
finitos.
Para algunos efectos, el primer caso es de mayor interés; el teorema
siguiente se adscribe a ese caso.

Teorema 1.6.2. Sea Xl, X 2 , ... ,Xn una muestra aleatoria de una po-
blación cuya función de distribución Fx(x) es estrictamente monótona.
Asumiendo que x p es el percentillOOp poblacional, es decir, Fx(x p ) = p,
entonces la estadística de orden [np] + 1 tiene distribución asintótica
Normal con valor esperado x p y varianza ,~(l;-p~,~.

Particularmente, si p = ~ (XO.5 corresponde a la mediana pobla-
cional) y siendo la población Normal con valor esperado f.L y varianza
(12, la mediana muestral tiene distribución Normal con valor esperado f.L
y varianza ~~2 •
Con este teorema relativo a la distribución asintótica de la k-ésima
estadística de orden concluye la introducción a las ideas preliminares de
la inferencia estadística, presentación que además entreabre el contexto
filosófico en el cual se desempeña, que describe las características más
relevantes de algunas estadísticas y registra como estadísticas especiales
a las estadísticas de orden. Con esto se da paso a la exposición de los
argumentos que sustentan las afirmaciones de los enunciados de los teo-
remas relacionados y finalmente a la serie de ejercicios cuyo desarrollo
complementará la reflexión sobre estos temas iniciales y será un compo-
nente más en la aprehensión de los conceptos expuestos en este primer
capítulo.

1.7 Demostración de los teoremas
Teorema 1.3.7 . Sea {Xn } una sucesión de variables aleatorias.

X n L c si y sólo si lim Fn(x) = F(x)
n-tOO

siendo c una constante, Fn(x) la función de distribución de X n y F(x)
una función de distribución tal que F(x) = O para x < c y F(x) = 1
para x ~ c.

1. 7. DEMOSTRACIÓN DE LOS TEOREMAS 35

Demostración. Suponiendo que X n .!!..., e, entonces para E >O
lim P [IX n
n----+CX)
- el < E] = 1= lim P [e - E < X n
n---+oo
< e + E]
= lim [Fn(e + E) - Fn(e - E)]
n-->oo
lim [Fn(e + E)] - lim [Fn(e - E)].
= n---+oo n---+CX)

La imagen de cualquier función de distribución es un valor que pertenece
al intervalo [0,1], luego la única posibilidad para que la igualdad anterior
se dé es que

lim Fn(e
n----+oo
+ E) = 1 Y lim Fn(e - E) = O
n---+oo

hecho revelador de que Fn(x) -----+ F(x), siendo F(x) una función de
distribución tal que
si x < e
si x ~ e
es decir, F(x) es la función de distribución de una constante e.
Suponiendo ahora que Fn(x) -----+ F(x) con F(x) = I[c,oo) (x), es decir

lim Fn(x) = F(x).
n-->oo

Entonces:

lim Fn(e - E) = O para E > O Y lim Fn(e + E) = 1
n-+oo n---+CX)

luego

lim [Fn(e
n--+oo
+ E) - Fn(e - E)] = 1 = lim P [e - E < X n < e + E]
n---+oo

= n-->oo
lim P [lXn - el < E]

lo cual significa que X n .!!..., e. o
Teorema 1.3.9
Algunos apartes de la demostración pueden consultarse en A First Course
in Mathematical Statistics (G. Roussas, pp. 133 a 135) yen Basic Pro-
bability Theory (R. Ash, pp. 204 Y 205).

Teorema 1.4.1. Si Xl, X 2 , .. . , X n es una muestra aleatoria de una
población representada por la variable aleatoria X con varianza 0"2 y

36 CAPÍTULO 1. DISTRIBUCIONES MUESTRA LES

con momento ordinario /-l~r' r = 1,2, ... , entonces el valor esperado y la
varianza del momento muestral ordinario son, respectivamente:

E[M;,nl = /-l~

V [M;,nl = ~ [E[x2rl - (E[X r ])2]

= ~ [/-l~r - (/-l~ )2] .
Demostración. El valor esperado del momento ordinario de orden r
puede determinarse mediante dos argumentos. En primer lugar, uti-
lizando las propiedades del valor esperado se tiene que

E[M;,n[ ~E [~tX[] ~ ~tE[Xn, r=1,2, ...

En segundo lugar, como todas las variables aleatorias de la sucesión
tienen la misma distribución, por constituir una muestra aleatoria,
E[X[] = /-l~, para i = 1,2, ... , n, en consecuencia

,
E[Mr ,nl = -n
l¿n,/-lr = -1(n/-l')_ ,
r - /-lr'
n
i=l

De manera similar puede determinarse la varianza del momento ordi-
nario de orden r. De las propiedades de la varianza se puede afirmar
que

V[M;,n[ ~V [~tX[] ~ >[txr], r = 1,2, ...

y debido a que las variables aleatorias son independientes, pues consti-
tuyen una muestra aleatoria, lo son también las variables Xí, X 2, ... , X~,
con lo cual

V[M;,nl = ~2 t V[X[] = ~2 t [E[X;rl - (E[X[])2]
i=l i=l

y como las variables tienen distribución idéntica,

V[M;,nl = ~2 t
i=l
(/-l~r - (/-l~)2) = ~ (/-l~r - (/-l~)2) . D

después de desarrollar el cuadrado indicado n n n i=l i=l i=l n n n porque ¿(Xi ...E[(X i .-n( X n-l ... ¡.. también llamado promedio poblacional...¡. .t4 - V[Snl n. y por tanto i=l i=l n ¿(Xi .nX n = nX n .t) 2] i=l ~ n ~ 1 [t. i=l Con el anterior recurso.t) 2.Xn es una muestra aleatoria de una po- blación con valor esperado.1 ( ¡.l)S~ + n(X n .¡..¡. X 2..t)2. ¡. de manera que n n n ¿)Xi-¡.t4. ¡. conocida como varianza poblacional.l)S~ + n(X n .t)2.. Demostración..X n ) = ¿ Xi .n .3 n _ 10- 4) . 1.4.. 1')2].n > 1. i=l Sumar y restar X n es el punto de partida en la verificación de la iden- tidad.t)2 = (n .t)2 = ¿ [(Xi . Para determinar el valor esperado de la varianza mues- tral. DEMOSTRACIÓN DE LOS TEOREMAS 37 Teorema 1.X n ) + (X n .2..nX n = 0. 2= E E[Snl [1 - n-l ¿n (Xi ..7. .t y varianza 0..t)2 = I)Xi -X n +X n -¡.3. es necesario previamente verificar la identidad n ¿)Xi . .¡. y existiendo además el momento central de orden cuatro ¡..t)2 = (n . i=l i=l i=l Así mismo. 1')2]].t)]2. entonces 2 =.nE[(Xn . Si Xl.¡.

38 CAPÍTULO 1.tI)2] = V[X n ] y teniendo en cuenta que todas las variables aleatorias de la sucesión tienen la misma distri bución. entonces Xl + X2 + .--+ tI· n Demostración.. tI.-nE2 · De manera que 2 lim P [1 X n-tI I < n--+oo El 2: lim 1 . Utilizando el remplazo E = r :In. .. . DISTRIBUCIONES MUESTRALES Como E[(Xi . como lo manifiesta n el corolario 1.2. .a 2 = 1 n--+oo nE es decir: lim P[iX n n--+oo . + X n P ---=~----'~--. n-1 i=l La demostración del segundo enunciado del teorema es uno de los ejer- cicios de este capítulo. O Teorema 1. . :2 para cada r > o.4.. X n constituyen una muestra aleatoria de una población con valor esperado tI y varianza 0'2. Si las variables aleatorias Xl. la cual asegura que si X es una variable aleatoria con valor esperado tIx Y varianza al finita.. __ __ 0'2 teniendo en cuenta que E[Xnl = tI Y V[Xnl = -. E[S~] = _1_ [~a2 _ n (0'2)] n-1 ~ n = _1_[na 2 _ 0'2] = 0'2. 1 P[lX .tI)2] = V[XiJ. tIl < El 2: 1. r Aplicando esta desigualdad al caso especial de la variable aleatoria X n. La herramienta procedente para sustentar el desarrollo de esta demostración es la desigualdad de Chevyshev. X2.4. tIl < El = 1 lo cual significa que X n !!. se tiene que E > OY 0'2 P[iX n .:nJ 2: 1 . tIl < r . P [IXn .tIxl < raxl 2: 1 . E[(X n .2" para cada r > O.4. como lo afirma la ley débil de los grandes números.

6. Utilizando la función generatriz de momentos de la va- riable que representa a la población Mx(t). con lo cual rr rr n n MxJt) = E [e~Xi] = E [e~x] i=l i=l entonces: MX (t) n = [1 + 1!¡L (!) n + ~E[X2l (!)2 2! n + . Apostol (1988) Calculus Vol 1. col.. jn lim MX (t) = lim n---+oo n n---+oo [1 + n + o (!)] ¡Lt n n = e¡.a. Si se fija la cota en nE 1 . DEMOSTRACIÓN DE LOS TEOREMAS 39 ()2 Nota. nE es decir. O < 6 < 1. Esto significa que -. ellas son indepen- dientes. -. para n > 6E 2 ' o Teorema 1. o en su defecto la función característica rPx (t). . Demostración. s. p Xn ~ ¡L. (O es el símbolo "o pequeña" usado en el estudio de las serieé). D 4Sobre la "notación Q"véase Tom M. Segunda edición.7 se concluye que -. Como las variables constituyen una muestra aleatoria. ()2 P[ -E < X n .. . La cota 1 . entonces -. 1. X 2. p Xn ~ ¡L. X n es una muestra aleatoria de una población con valor esperado ¡L.6..4.3. En otros términos: 1 .¡L < El 2=: 1 .. 351 . -2 crece en cuanto n crece.. . + ~Xn)]. MXn(t) = E [e tXn ] = E [exp (~Xl + ~X2 + . Editorial reverté.tt función generatriz que corresponde a la función generatriz de una cons- tante ¡L. p. ()2 para el cualP[IXn-¡L1 < El2=: 1-6. d X n ~ ¡L y con base en el teorema 1.7. 2 > 1-6.. significa que existe un tamaño de muestra mínimo n.6. Si Xl.

Xn es una muestra aleatoria de una población para la cual el momento central /-l2r existe.4. X n es una muestra aleatoria.. X2. X 2.. X~. considerando la variable aleatoria Zn = X n . demostración que también se puede llevar a cabo utilizando la función característica.X2.9 La demostración puede consultarse en el texto Probability and Statisti- cal Inference (Robert Bartoszynski y Magdalena Niewiadomska-Bugaj (1996)... Como la sucesión Xí. . 430 a 431). entonces sólo resta aplicar el teorema relativo a la ley débil de los grandes números utilizando la sucesión Xí. . Teorema 1. . o n i=l Teorema 1.11. Se apoya la demostración en el desarrollo en serie de McLaurin de la función generatriz de momentos.4.. .. . r = 1. entonces P Mr. . con lo cual se puede afirmar que n ~L [X[] LE [Xí] = /-l~./-l a Vii entonces la sucesión de variables aleatorias {Zn} converge en distribu- ción a una variable aleatoria con distribución Normal estándar. La estrategia para esta demostración consiste en el uso de la función generatriz de momentos y de sus propiedades...2.7. . . Si Xl.n I ----+ I /-lr. . X n es una muestra aleatoria de una población con valor esperado /-l y varianza (72 finitos. pp. X2". Denotando como M Zn (t) la función generatriz de momentos de la . Si X I . DISTRIBUCIONES MUESTRALES Teorema 1. Demostración.. . Demostración. X2".. para lo cual se asume la existencia de la función generatriz de momentos de la pobla- ción.40 CAPÍTULO 1. .. .4. X~ conforma un conjun- to de variables aleatorias independientes e idénticamente distribuidas porque la sucesión Xl.

.. . cuya función generatriz de momentos es MYi (Jn) My (Jn). . . r= 1. X2. o.tr. .t2 (_t_) 2 + ~ ¡..t~ = ¡. n...t3(J3 (_t 31 yn )3 + . . . . entonces El desarrollo en serie de McLaurin de la función generatriz My(t) eva- luada en el valor Jn es My (_t_) = 1 + ¡. .2.2. siendo Yi = Xi.tl _t_ + ~ ¡.7.. ....t3 (_t_) 3 + . las variables Yl .t4t 4 +. . .. n y por tanto. = 1 + -1[12 -t 1 + --¡. ] . n 21 3!yn 4!n ..t3t 1 3 + -¡.Xn son variables aleato- rias independientes por tratarse de una muestra aleatoria. M y (_t ) yn = 1 + ~ (J2 (_t 21 (J2 yn )2 + ~¡. 1. DEMOSTRACIÓN DE LOS TEOREMAS 41 variable aleatoria Zn. i = 1......2. Y2 . si existen ¡... y además la varianza es igual a uno..../!... . Y2 .Yn también lo son. yn (J yn 2! (J2 yn 3! (J3 yn Dado que el valor esperado es igual a cero.Yn tienen la misma distribución. y como las variables Yl .. se tiene: Como las variables de la sucesión Xl. i = 1.

. .t 00. X 2 .. 20. Z rv N(O. . p. Bogotá... tienden a cero cuando n . n->oo n Además. y dado que Mzn(t) = [My CÍn) r. Editorial Limusa..42 CAPÍTULO 1. Tomo 1. Como • 1 t2 11m Mzn(t) = Mz(t) = e 2 n->oo de acuerdo con el teorema de Lévy. Teorema 1. entonces _X n rv N ((J2) IL.. e~t2 se reconoce como la función generatriz de momentos de una variable aleatoria con distribución Normal estándar. DISTRIBUCIONES MUESTRALES Efectuando el remplazo Qn(t) = 1rt2 + 3!fo1L3t3 + 4}n1L4t4 + . t 4 ..: . 5yu Takeuchi (1976). lim { 1 + -en }n = é. X n es una muestra aleatoria de una población con distribución Normal de valor esperado IL y varianza (J2.15.4. Zn ~ Z. . o Teorema 1.12 Los elementos que se requieren para el desarrollo de la demostración de este teorema están más allá del alcance de este texto. y porque 5 siendo {en} una sucesión que tiende a e. Si Xl.4. Mzn(t) = [1 + ~Qn(t)r lim M Zn (t) = lim [1 n->oo n->oo + ~Qn(t)] n n = exp ( n->oo lim Qn(t)) = e~t2 porque los coeficientes de t 3 . . 1). Sucesiones y series. -.

X 2. Siendo Mx(t) = exp (P. . MxJt) = g Mx (~) = g H ~a' m') cxp + = [expH+~a2m')r = exp (P.t + t: t 2 ) lo cual permite deducir que X n rv N (p" ~). X rv N(p" 0.2 ). como las citadas variables están idénticamente distribuidas. entonces . Si Xl.i. 1..t + t0-2t2) la función generatriz de una variable aleatoria X. Nuevamente se elige a la función generatriz de momentos como medio para llevar a cabo esta demostración. Finalmente..7. .4.16. DEMOSTRACIÓN DE LOS TEOREMAS 43 Demostración. o Teorema 1.Xn es una sucesión de variables alea- torias independientes tales que Xi rv N (p. MxJt) = E [e tXn ] = E [cxp (t~ ~Xi) 1 =E [IT ~Xil· ~=l exp Debido a la independencia de las variables que constituyen la muestra aleatoria. o-i). de acuerdo con el modelo gaussiano.

. la función generatriz de momentos M(t. por tanto. 2a En segundo lugar..4. i 1. (X 2 -X n ).xn ) + .. .. ai es una variable aleatoria con distribución Normal estándar.X n ). . i=l En primer lugar. .2.(Xn . . . X n es una muestra aleatoria de una población con distribución Normal de valor esperado ¡..ti. .. t2. . ..¡. t i=l (Xi .2.¡. + t )] Xi _ (Xi . Como la sucesión Zl.t) 2 } d t.X n ).X n ). Demostración. DISTRIBUCIONES MUESTRALES Demostración. al considerar la integral sobre Xi. entonces las estadísticas X n y S~ son dos variables aleatorias estadísti- camente independientes. Z2.n se tiene 1 ¡eX) '2. La variable aleatoria Zi = Xi . Mu(t) n = II E [e tZ¡] n = II Mz¡(t) = IIn ( 1 _1 2t )~ (1 ~ ~ 2t) i=l i=l i=l Hecho que permite concluir que U rv x2 (n)......xn ) . . .t y varianza a 2.:)2] dx. + tn(x n . se puede afirmar que Zl rv X2 (1). it. .. exp { [t + nti _ (it + t2 + . (XI-X n ).n. Si Xl. para i = 1.. (Xl . (X 2 . siendo c = (~a) n y dx = dXl .Xn)2. dx n . puede estable- cerse que Mu(t) = E [e tU ] = E et i=1 [ t Z¡] =E g [n etZi 2] . .7ra n n 2a2 X ... o Teorema 1. Con el concurso de la función generatriz de momentos. .. (X n -X n ) para luego n concluir la independencia entre X n y ¿ (Xi . Zn es una sucesión de variables aleatorias independientes.44 CAPÍTULO 1. . Esta demostración está orientada a la determinación de la independencia de X n .tn ) de las variables aleatorias X n ...:.. X 2. J-oo v.18. es c r J~n exp [fXn + tl(Xl .

t ...1 . l)S~ 2( ) ~ -'-----. . .~. .. .X n ).:.X n ) es un conjunto de variables aleatorias independientes e igualmente lo son X n n y ¿(Xí .t {n + n (tí . X n es una muestra aleatoria de una población Normal de valor esperado J-t y varianza (J2. . DEMOSTRACIÓN DE LOS TEOREMAS 45 que al efectuar el remplazo: 1[ :.:. . entonces ~ (Xi .=l ti n 1=:.(X2 . X n . -)] t + (J2[t+n(t2í -t)]2} .X n ). n .. n í=l La integral anterior puede expresarse como f-00 oo 1 { 1 (x· . Si Xl. X 2.f2i[(J n dXí 2(J2 cuyo valor es finalmente exp J-t[ . (X 2 . (X n . con t = -1:L:>i. 1. .X n ? _ (n . X n .t)] .:1[t + n(ti . (Xl . (J (J 2 r"V í=l . -2 -2 -2 Por consIgUIente. O Teorema 1. entonces í=l hecho que revela plenamente la independencia de las variables aleatorias X n .: t + nti .t) = 0. En consecuencia.Xn)2.7.J-t)2} --exp -[t+n(tí-t)]Xí.X n ) .19. X n y S~ son estadísticamente inde- í=l pendientes. (Xl . (X n . 2n Por consiguiente: n y como ¿ (tí .4. .X n ) ...2:::---'--.X n ) . ...

De la demostración del teorema 1.12t ) ~ es decir: E [ exp [ t (n .4.¡.-l 1 2t t 1 < -. Debido a que n)2 -)2 ¿ (Xi i=l .¡. i=l i=l Por tanto.¡. )2 n(Xn-¡. l)S~]] = (J 2 (_1 - ) n. DISTRIBUCIONES MUESTRALES Demostración. 2 Expresado de otra manera: n - n )2 2 ¿ (Xi - i-l X (n . (J2 entonces _ 1 ) 'i = ( 1 .t)2)] (J 2 [ ( (( n .t rv 2 X (n) Y n(X n .- X n2 - ) + n(X 2 n .?l)Sn rv x2(n _ 1).t)2) ] E [ puesto que X n y S~ son estadísticamente independientes.t (J2 rv X2(1). n ¿ (Xi . ¡.¡.¡.t) 2 i=l (J2 i-l (J2 + (J2 luego E exp t i~(Xi .t) ) ] = E [exp (t (n -(J.)S~) ] (t n(X:.2t E[exp [t (n -(J21) S~]] (1_. o (J 2 (J .3 se tiene que n n ~ 2~ L)Xi .t) = L.)Xi .t) .46 CAPÍTULO 1.t)2 n ¿(Xi-Xn . ¡. exp t (J 2 + t n (X n(J 2. ¡.1) S~ 2 _ E [ .

entonces . . cov(X. En segundo lugar. DEMOSTRACIÓN DE LOS TEOREMAS 47 Teorema 1. cov(X.(nX . Y son dos variables aleatorias independientes. Y finalmente las relaciones -X + = -1. si la función de densidad es simétrica respecto a E[X].+ X +1 ) n l n n n+l 2 nSn+1 = (n .E[X]E[XY] = E[Y]E[X 2] . XY) = E[X2y] . Previamente a aquélla.20. . 1. Demostración. X2. Si X.2 (E[X])3.(E[X])3] = E [X 3] .7.3X2 E[X] + 3X (E[X])2 .(E[X])2] =2E[X]V[X] . Sn) = O. 2 cov(X n . al ser X.2 (E[X])3 = 2E[X] [E[X 2] . .l)Sn2 + -n.3E [X 2] E[X] + 2 (E[X])3 con lo cual E [X3] = 3E [X 2] E[X] .-X n)2 n+l En primer lugar. Si la función de densidad de una variable aleatoria X es simétrica respecto a E[X].E[Y](E[X])2 es decir. cov(X.XY) = E[Y]V[X] 2. X2) = 2E[X]V[X] 3. es necesario aprestar tres elementos: 1. cov(X.E[X]E[X 2] = 2E[X]E[X 2] . Y independientes también lo son X2 y Y. y con el fin de incluirlos en la demostración.(E[X])2] = E[Y]V[X]. Por ello cov(X.( X n+l . Si Xl. X2) = E [X 3] .E[X]E[X 2] = 3E[X 2]E[X] .4. XY) = E[Y] [E[X 2] . La demostración de este teorema se realizará mediante inducción matemática sobre el tamaño de muestra.E[X])3] = O = E [X 3 . E [(X . X n es una muestra aleatoria de una población cuya función de densidad es simétrica.2 (E[X])3 ..

(n + l)X n+1] Realizando los remplazos: -X .n- l)X (nX -n + X n+1 )] n 1 n+1 = (n .X n + 1)2 = (n .l)S~ + (Xn+1 . )2 i=l i=l n+l = ¿:: [(Xi . DISTRIBUCIONES MUESTRALES Por último: .l)S~ + (Xn+1 .-X n )2 + (X n-Xn+ 1) [2X + + (n .X n+1)2] n = (n .48 CAPÍTULO 1.X n ) + (n + 1) (X n . = -1.X n ) ( 1 X n+1 - - Xn ) n+ = (n . X n+1 ) (Xi .X n ) i=l + (X n . l)X n .X n+1) [2Xn+1 + (n . 1 n+1 1 [n X n+l = --1 ¿::Xi = --1 ¿::Xi + X n+1 1= 1 - --1 [nX n + X n+1] n + i=l n+ i=l n+ n+l n+l 2 '"' (X i -X nSn+1=~ .l)Sn2 + --1 n (X + n 1 - -X )2 n n+ . .(. X n+1 ) ¿:: (Xi .n)+12 '"' =~ (Xi-Xn+Xn-Xn+l . i=l nS~+l = (n .Xn)2 + 2 (X n . Xn)2 + 2 (X n .X n+1 ) (Xn+1 . Xn)2 + 2 (X n .X n+1 ) (Xn+1 .X n ) + (n + 1) (X n .X n+l)2 n Como ¿ (Xi . X n) i=l + 2 (X n . X n+1 ) (n + l)X n+1 = nX n + X n+1 y n .-X n )2 + (X n .l)Sn 2 + (X n+1 -)2 - .Xn (X n +1 .l)Sn2 + (X n+1 .X n ) = 0.X n+l n+1 Xn- se tiene 2 nSn+1 = (n .l)Sn2 + ( X n+1 . . .

1)8~ + _1_ (Xn+l - n+1 n+1 Xn)2) = n .) + ( n )2 COV (Xn. X 2) 2 2-1L. 8. . n. 2 2 82 = _1_ ~ (X. 8 2 = cov (Xl + X 2 (Xl . 8~+1) = (n: l)2cOV (Xn.2E[X I ]V[X2] +2E[X2]V[X2]] porque Xl tiene la misma distribución de X 2 y además son variables independientes. t 2 2 i=l 2) COV (x 2.. . = cov (~lXn n+ + -l-Xn+l. Ahora para una muestra de tamaño n + 1.(72) = O Por hipótesis de inducción. 8. (Xn+l . 2cov(X I . cov (Xn. para i = 1. _ X )2 = (Xl .(72 + 2p.7. cov (X n+1.X I X2) + COV (X 2.1 ( 2) + n(n + 1) cov X n+1.(72 .2p. (Xl . xí) . al considerar una muestra de tamaño n = 2.xí) .+1) = .Xn)2) n+1 n+1 n . cov (X n+l . 2X I X 2 + Xi)] = l [COV(XI. 8~) = O Y X n+l .X 2 ' 2 2)2) = lcov (Xl + X 2. y teniendo en cuenta que E[Xi ] = p" V[Xi ] = (72.n )2) X Como cov (Xn. 1. xí ...2E[X2]V[X I ] . 8~) = o.X 2)2) = l [COV (Xl + X2.8n + (n +1 1)2 cOV ( X n+1.Xi)] 1 = 4: [2E[X I ]V[X I ] . ( X n+1 - . .6. (n . cov (X 2. Xi)] + l [cov(x2.2COV(X2. Xn)2) . 8~) = l (2p. (Xn+l ..(72 .2. 8~ son independientes.Xn)2) + (n ~ 1)2 cOV (X n+l ' (Xn+l . DEMOSTRACIÓN DE LOS TEOREMAS 49 Entrando en materia..1cov (Xn. X I X 2 ) + COV (Xl.6.2p.

1\LL)Xi -Xj )2. X~+l) .2X n X n+1 + X~) = COV (Xn+l .Xj) 2 " = ~(Xi .(n + 1)2 Teorema 1. (X n+1 .50 CAPÍTULO 1. .X n ) .1. XnX n+l ) + COV (Xn+I. + 2f. =O n n cov (X n+ l .X~+1 . De manera similar al punto de partida de la demostración del teorema 1.X~) (j2 (j2 = -2E[Xn+I]. - X n2 ) i=l i=l .Xn)2) = COV (X n .X~) = .2 f.O n + O(n +1 1)2 = O. X~+l .4... X~+1) .X j )2 = L [(Xi .+ 2E [Xn] - n n (j2 (j2 = -2f. cov (X n . i=l j=l Demostración.1(j 2 + 2f. .- X n2 ) + n(Xj .2cov (X n . (Xn+l . Si Xl. n n L(Xi . o COV n+l .2X n X n+1 + X~) = COV (X n . X 2 . Xn)2) = COV (Xn+I.X n) = O. XnX n+l ) +COV (Xn.Xn)]2.1(j2 = O luego (-X n + l ..1. S2) . entonces 1 n n S~=<L/ .2cov (Xn+l .(X j . en- i=l tonces n n " ~(Xi . i=l i=l n Desarrollando el cuadrado allí indicado y como ¿ (Xi . X n es una muestra aleatoria de una población para la cual no se asume un modelo de probabilidad específico.4.3.21. DISTRIBUCIONES MUESTRALES Ahora.

.Zn tiene distribución de Bernoulli con parámetro Fx(y). .n. . . . ¿ Zi rv Bin(n..n FXk.n las estadísticas de orden o la muestra ordenada de una población con función de distribución Fx(x).n :S yl ~ p [t.Fx(y)t. .2.Xn.n. en- tonces la función de distribución de la k-ésima estadística de orden co- rresponde a F x . . .2. se construye la variable aleatoria dicotómica Zi = l( -oo.Fx(y)]n. . ¿ Zi representa al número de observa- i=l ciones muestrales menores o iguales al valor específico y. y} es equivalente al evento t~ Zi 2: k }. y] = Fx(y).. i = 1.. Fijando un valor particular y. Como P[Zi = 1] = P[Xi ::." (y) ~ p IXk.n ::. Fx(Y)) dada la independencia citada i=l n de las variables Zl....y] (Xi). Como el evento {X k. 1. Z2. n Adicionalmente. Siendo X 1 . DEMOSTRACIÓN DE LOS TEOREMAS 51 luego n n n n j=l i=l i=l j=l n En consecuencia. Zi 2: k 1 = :t (~) j=k J j [Fx(y)]j [1 . X 2. Teorema 1. o .5.n(y) = :t (~) j=k J j [Fx(y)]j[l. n. entonces para k = 1. Demostración. ..7. Z2. 2... entonces cada una de las va- riables independientes Zl. ..Zn. . .

la función de densidad de la k-ésima estadística de orden.n."" Yn) = {n! fI t=l !X(Yi) Y1 < Y2 < .n.n.l)!(k ..k)!]. Siendo Xl.X2 . < Yn O en otros casos Demostración.. k = 1.Jy) f xk. ..52 CAPÍTULO 1.~_ l\. respecto a los valores particulares de Xk. es fXk.l)!(n . con Cn.n.X n. X 2 .n :S y + h}.1) observaciones de la muestra son menores de y. y + h] Y las restantes (n .Jy + h) .j .n (x.n () y ay Xk. X n una muestra aleatoria de una población con función de distribución continua Fx(x). .k fx(y)fx (x )I(x.n. función que corresponde a la derivada.. . Entonces = ~F () = lim FXk.FX(y)t-kfx(y). La primera afirmación del teorema se refiere a la función de densidad de la estadística Xk.n(y) = (1 .n (Y1. y) es Cn. .n. .oo) (y) para 1 :S j < k :S n..Fx (y)t. de su función de distribución FXk.. una pertenece al intervalo [y.k = n!j[(j .4.k) observaciones son mayores que y + h ". .n y h-+O h = lim p [y :S Xk.. FXk.n :S y + h] h-+O h • • y y+h Por medio de la distribución multinomial se calcula la probabilidad del evento A(h) = {y :S Xk.Xk.[FX(y)]k-l[l. Y2.Fx(x )]k-j-l [1. .\~. .k[Fx (x )]3-1 [Fx(Y) .5. La función conjunta de densidad de las estadísticas de orden es !X 1 . descrito como A(h) :"(k . DISTRIBUCIONES MUESTRALES Teorema 1.j.j.2.n (y). La función conjunta de densidad de la j-ésima estadística de orden y la k-ésima estadística de orden fXj.

n S X + h. v) = F(u.F(x + h. La segunda parte del teorema que enuncia la función conjunta de den- sidad de las estadísticas de orden j y k.Jx. y S Xk.n.n.Fx(y)t. y S Xk.(n _ k)! [F(y)]k-l [F(y + h) . .n (x.k lim F(y + h) .t-+O ht p [x S Xj. y) 6.xk. F(y)] [1 .fx(Y) = fXk. entonces F(x + h.n. y) se demuestra de manera similar. x x+h Xj. y + t) .Xk.k)! Y Y h-+O h (k -1)7~n _ k)! k [FX(y)]k-l [1 . DEMOSTRACIÓN DE LOS TEOREMAS 53 Al reemplazar Fx(v) por F(v). se tiene: .n Tomando 6.n S Y + t] lim h-+O.n (y). t) = {x S Xj.7.F(x.n (u. fXj.F(y)t- y haciendo 6.xk. 1. v).l)!(n .n S y+t} igualmente se calcula por medio de la distribución multinomial. = lim P[A(h)] h-+O h ' 6. k P[A(h)] = (k _ l)!~. y + t) . y) y FXj. = fXj. = n! [F( )]k-l [1 _ F( )t.n S x+h.F(y) (k .t-+O ht La probabilidad del evento A(h. = lim h-+O. y) + F(x.

Fx(y+t)=P5 I Tabla 1.k) de las observaciones pertenecen al intervalo h y las restantes (k .1. x] = h I Fx(x) = PI I (x.Fx(x + h) = P3 I (y.F(y)][l.54 CAPÍTULO 1.t = (j _ l)!l!(k _ j _ l)!l!(n _ k)!PI P2P3 P4P5 Si Cn. t) es [F(x+h) .t--+O ht h--+O. Fx(v) = F(v).k luego · l 1m A(h.y+t]=14 I Fx(y+t)-Fx(y)=P41 (y+t.F(y+t)t. una observación pertenece al intervalo 14 .F(x)][F(y) .1: Luego A(h )] n! (j-I) (k-j-I) (n-k) P[ .Fx(x) = P2 I (x + h. (n . t) = B() x l' 1m D(h.j .1) pertenecen al intervalo h ". t) : "(j . x + h] = h I Fx(x + h) .t--+O lim [F(X + h) .k[Fx(x)jJ-I = B(x). y] = h I Fx(Y) . t) es menester disponer de la relación de probabilidades de pertenencia de una unidad al intervalo correspondiente presentada en la tabla 1. Intervalo Probabilidad I (-00.j. Para el cálculo de la probabilidad del evento A(h.F(x+h)]k-j-I[F(y+t) . t) h--+O.oo)=h I 1.t~O h t . F(X)] [F(y)-F(x+h)t-j-1 [F(Y + t) .1) observaciones pertenecen al intervalo h.t) corresponde a h--+O. una observación pertenece al intervalo h. entonces D(h. DISTRIBUCIONES MUESTRALES Este evento está descrito como A(h. F(Y)] [l-F(y+t)¡n-k h~O.t--+O ht donde lim D~.

n.. DEMOSTRACIÓN DE LOS TEOREMAS 55 Esto es: lim D~.n (YI. fXj.Xk. La última parte es la generalización de los casos anteriores. < Yn' o Teorema 1.OCJ) (y) para 1 ::.n.n.j.. entonces Demostración. .JX. una muestra aleatoria de una po- blación con función de distribución Fx(x) continua.··· .6.2.x p ] (Xi). Como Zi es una variable tal que Zi rv Ber(Fx(xp )).l)!(n . Sea Xl..k[Fx(x)Jl-I[Fx(Y) .j . por tanto P [Xj.Xn... Igualmente.FX(x)]k. . si x p denota al único percentil lOOp poblacional.k fx(y)fx(x)I(x. t) = [jx(x)][Fx(y) _ Fx(x)]k-j-I[jX(Y)][l _ FX(y)]n-k h-+O.5.. .n.t-+O t es decir.j. con el apoyo de la distribución multinomial y teniendo en cuenta que la función conjunta de densidad f X l. n.n. .l)!(k .X2.' .7..n ::. x p ::. Xk.Xn . . 1.k)!]. Yn) = n! rr n i=l fX(Yi) para YI < Y2 < . con Cn. .X2. .Fx(y)t.Xn.. .P[B e ] . i = 1.. se construye la variable aleatoria dicotómica Zi = I(-oo.1 = prAl .Yn) es fácilmente se deduce que fXl.k = n!j[(j . . Y2. j < k ::. Al igual que en una demostración anterior.. X2.n] = P[A n B] = prAl + P[B] . n. Y2..j -l[l. y) es Cn. Para p fijo.n (YI. considerando los eventos ellos son tales que P[A U B] = 1.

l .p)n-l por tanto.. Zn es una mues- tra aleatoria de una población con distribución de Bernoulli de paráme- tro Fx(x). al entenderse que Zl. Z2. j] = t ~=l Zi l=J (7)pl(1. DISTRIBUCIONES MUESTRALES luego p [Xj. Demostración. P [Xj. Como el evento A (similarmente el evento B) puede transcribirse como A : "j o más observaciones son menores o iguales a x p ".n] = L k-l ( l=J 7 ) pl(1.. .= -Zn n siendo Zi = I(-oo.xj(Xi ).X2"". p p Zn -+ Fx(x). Desde este punto de vista. entonces P [Xj.pt.56 CAPÍTULO 1. . .pt.n ~x p] =P [t 2.n ~ X p ].n ~ x ~ Xk. . entonces p Fn(x) ---> Fx(x) para un valor x dado. Siendo X 1 .n ~ xp ~ Xk.7. tl=k (7)pl(1. P [Xj. es decir que Fn(x) -+ Fx(x). tal como se había convenido en la sección refe- rente a la distribución de Fn(x). P [Xk. o Teorema 1. entonces el teorema de Khintchine garantiza que .n ~ Xp ~ Xk.Xn una muestra aleatoria de una población con función de distribución Fx(x). o .n] = P [Xj.n ~ X p] .5.n] = p t l=J l (7)pl(1. La función de distribución empírica puede ser reconocida como: n ¿Zi i=l Fn(x) =.p)n-l y como j < k.

Fx(x)] converge en distribución a una variable aleatoria con distribución Nor- mal estándar. Siendo Xl. . fx(x) = 2x I(O.. 2.Fx(x)) . entonces.8 La demostración puede consultarse en el texto Probability and Statisti- cal Inference (Robert Bartoszynski y Magdalena Niewiadomska-Bugaj (1996) pp.Xn constituyen una muestra aleatoria de una población con función de densidad. la sucesión {Zn}.8.Fx(x)] n son finitos. 3. 1.5. 726 a 729)..8 Ejercicios 1. X 2. Teorema 1. .l) (x) determine la distribución muestral del mínimo de la muestra.Fx(x)] } { JFx(x)[l . .9. Demuestre que el promedio basado en una muestra de tamaño n de una población con valor esperado ¡L y varianza (]'2. Demostración.Fx(x) = y'n[Fn((x) .. con Zn = Fn(x) . converge en media cuadrática a ¡L. . En los términos de la demostración del teorema 1. .5. . X 2 . Demuestre que si la sucesión {Xn } converge en media cuadrática también converge en probabilidad.¡n converge en distribución a una variable aleatoria con distribución Normal estándar. D 1. la sucesión de variables aleatorias y'n[Fn(x) . X n una muestra aleatoria de una población con función de distribución Fx(x).Fx(x)] y'Fx(l-Fx(x)) JFx(l . Si las variables aleatorias Xl. EJERCICIOS 57 Teorema 1.5. a la luz del teorema del límite central (Lindeberg- Lévy) .7 Y teniendo en cuenta que E[Fn(x)] = Fx(x) y V[Fn(x)] = Fx(x)[l .

Xn constituyen una muestra aleatoria de una población con distribución Exponencial de pa- rámetro e. 9. . . Si las variables aleatorias X I . determine la distribución muestral del promedio de la muestra.58 CAPÍTULO 1. Si las variables aleatorias Xl. X2. determine la distribución muestral del mínimo de la muestra. .4. de parámetro determine el valor esperado y la varianza del tiem- po de funcionamiento del dispositivo. 7. que de manera similar. En el laboratorio de control de calidad de una compañía que pro- duce elementos para cierto tipo de retroproyector. Continúe realizando la demostración del teorema 1. Utilizando el modelo Exponencial para describir el tiempo de vida de la bombilla. determine la distribución muestral del recorrido de la muestra. Una muestra de 36 botellas corresponde a la línea antigua de llena- do A.. el contenido de una de ellas se modela como una variable aleatoria con distribución Normal de valor esperado J-l y desviación estándar 4. 6. . X 2 . 1).. que estando el proceso bajo control estadístico el contenido de una de ellas en mI se modela como una variable aleatoria con distribución Normal de valor esperado J-l y desviación estándar 12. se encienden simultáneamente n bombillas..3.X2.. . 8.Xn constituyen una muestra aleatoria de una población con distribución Exponencial de pa- rámetro e. Se considera otra muestra de 49 botellas de la nueva línea de llena- do B. . Si las variables aleatorias Xl. Un dispositivo electrónico opera con base en el funcionamiento de n componentes conectados en serie que funcionan de manera in- dependiente. X n constituyen una muestra aleatoria de una población con distribución Uniforme en el inter- valo (O.. DISTRIBUCIONES MUESTRALES 4. estando el proceso bajo control es- tadístico.. 5. Si el tiempo al fallar de cualquier componente se modela como una variable aleatoria con distribución Exponencial e. . determine el valor esperado del tiempo de vida de la tercera bombilla en fallar. 10. Determine la probabilidad de que los promedios mues- trales difieran a lo sumo en 3 mI.

O2 > 0. . Si las variables aleatorias Xl. ¿cuál es la probabilidad de que el máximo de la muestra exceda a la mediana poblacional? 15. 1. ¿cuál es la probabilidad de que el docente que vigila el examen. Podría pensarse que el modelo para simbolizar el tiempo de permanencia del aspirante en el aula sería el modelo Exponencial doblemente truncado. Con base en el ejercicio 11. es 14.1/ (n . X n constituyen una muestra aleatoria de una población con función de distribución absoluta- mente continua. demuestre que esa correlación tiene como cota inferior a .8. Según el ejercicio 11.. si se adopta el modelo de Pare- to? La función de densidad de una variable aleatoria X con distribu- ción de Pareto con parámetro O = (0 1 . en un aula con 25 aspirantes. Teniendo en cuenta que el tiempo medio de perma- nencia es de dos horas. 01 > 0. . .. ¿cómo cambia la respuesta al mismo y cómo cambia la respuesta al ejercicio 12.oo) (x). . O) = O1 exp (-(XO. Sin embargo.Od) I(lJ¡. 01 E ~. EJERCICIOS 59 11. ¿cuál es el tiempo medio de permanen- cia en el aula del aspirante que se retira en primer lugar? 13. . . 2 2 12. O2 )'. X 2 . 02)'. X 2 . 02 > 0. no tenga que pronunciar la frase: "Por favor suspendan porque el tiempo de examen ha concluido"? La función de densidad de una variable aleatoria X con distribu- ción Exponencial desplazada con parámetro O = (01. Si las variables aleatorias Xl.1).Xn tienen la misma varianza y si la correlación entre cualquier par de variables diferentes tiene el mismo valor. una buena elección la constituye el modelo Exponencial desplazado. El examen de admisión de la Universidad Nacional de Colombia tiene un tiempo límite de dos horas y media y dentro de sus normas se establece que ningún aspirante puede retirarse del aula antes de haber transcurrido una hora de examen. es fx(x. .

Si X 5 es la proporción muestral de amortiguadores de clase A. dado que n ¿ Xi = k. la selección de manera aleatoria y sin remplazo de cinco amortiguadores de un lote de inspección que contiene seis de clase A y ocho de clase B.1 sea superior a 0. La fracción de baldosas de cerámica con imperfectos producidas por una compañía es del 0. determine la distribución muestral correspon- n diente a la estadística Tn = ¿ Xi. con k :s. ¿cuál debe ser el tamaño de la muestra. X n . determine la probabilidad de que Xl = 1. i=l 20..8% cuando el proceso está bajo control estadístico. si la varianza fuese el doble? 22..Xn constituyen una muestra aleatoria de una población con distribución de Bernoulli de pa- rámetro e. . DISTRIBUCIONES MUESTRALES 16. Si las variables aleatorias Xl.2. n. X2. .60 CAPÍTULO 1. X n constituyen una mues- tra aleatoria de una población con valor esperado ¡. X 2 . i=l 18. para ser examinados en el laboratorio. .... X 2 . . i=l 17.t y varianza 4. . X 2 . Determine el tamaño de muestra mínimo para el cual la probabilidad de que la fracción con imperfectos y la proporción de baldosas con imperfectos en la muestra no difieran en más del 1% sea superior a 0. Si las variables aleatorias Xl.. Si las variables aleatorias Xl. determine el valor esperado y la varianza de dicha estadística. X 2 . .95. ..n. determine el tamaño mínimo de la muestra para el cual la proba- bilidad de que el valor esperado y el promedio de la muestra no difieran en más de 0. ... X n constituyen una muestra aleatoria de una población con distribución Binomial negativa de parámetros k y 7r. . la distribución condicional de Xl.. corresponde a una distribución multinomial. .Xn constituyen una muestra aleatoria de una población con distribución de Poisson con pa- rámetro e. Si las variables aleatorias Xl.j=1. . . Con base en el ejercicio 20.. 19. dado que n ¿Xi =j.. .95. demuestre que para cualquier entero positivo k. Un procedimiento de control estadístico de calidad establece para cierto proceso de fabricación. 21.

para establecer el valor mínimo de la probabilidad de que el promedio de las mediciones di- fiera a lo sumo del verdadero valor promedio en Kunidades. . El equipo debe estar calibrado de tal forma que la variabilidad en cada medición.95..Xn y cuál n es la distribución de la estadística ¿ Xi? i=l 28.Xn constituyen una muestra aleatoria de una población con distribución de Bernoulli de pará- metro e.. un tamaño de muestra de 125 láminas. . 26. determine la probabilidad de que el promedio de defectos por lámina en la muestra sea menor de 2. ¿Cuál es la razón de la diferencia de los resultados? 24. ¿Cuál es la razón de la diferencia de los resultados? 25. Si además se ha reconocido que el modelo de Poisson de parámetro 3 es un buen modelo para describir el número de defectos por lámina. 1.8. Un procedimiento de control estadístico de calidad ha establecido para la inspección del proceso de elaboración de láminas de madera aglomerada. Una norma particular de metrología determina que deben realizarse 36 mediciones de la emisión de ondas de un horno de microondas. en razón de que cuenta únicamente con los citados 55 minutos para realizar la diligencia. de- termine cuál debe ser el número de mediciones para que el valor mínimo de la probabilidad de que el promedio de las mediciones difiera a lo sumo del verdadero valor promedio en ~ unidades sea de 0. cuantificada por medio de la desviación estándar.. . ¿cuál es la distribución conjunta de Xl. En el período preelectoral de la elección presidencial del 2002 en . determine la probabilidad de que se requieran más de 55 minutos para atender una cola de 16 clientes. Si las variables aleatorias Xl. 27.. X 2 . . Siendo dos minutos y cuarenta y cinco segundos el tiempo medio de transacción en un cajero electrónico y que el modelo Exponen- cial es un modelo admisible para representar el tiempo que utiliza un cliente en la transacción. X2. es de (7 unidades. Utilice la desigualdad de Chevyshev y el teorema del límite central en forma comparativa. Según el ejercicio 23. EJERCICIOS 61 23. también utilizando en forma comparativa la desigualdad de Chevyshev y el teorema del límite central. pues la persona que ocupa el puesto 16 debe decidir si espera o no.

X 2 ..62 CAPÍTULO 1. X 2 . tales que P[Xi = iJ = P[Xi = -iJ = ~.2X .. 33. 30. X n constituyen una muestra aleatoria de una población con valor esperado 11 y varianza finitos. X 2 . •.. Si las variables aleatorias Xl.2. los estimativos del favoritismo del candidato en defini- tiva elegido estuvieron persistentemente cerca del 52%. E[XiJ = 11 = O. . ¿ Qué puede afirmarse de la simetría de la función de densidad del promedio de una muestra de una población con distribución de Bernoulli de parámetro (). n(n + 1)(2n + 1) i=l t convergen en probabilidad a 11. está definido como Q3 = /-l3/ (]"3.2. constituyen una sucesión de variables aleatorias. .. con momento central /-l3 y varianza (]"2. 32. ¿Con cuál tamaño de muestra se hubiese podido predecir que no habría segun- da vuelta. .k}(X). X n constituyen una muestra aleatoria de una población con función de densidad 1 !x(x) = ¡/{1. demuestre que ¿ _t no converge i=l n en probabilidad a 11 = O. . cuando el tamaño de la muestra crece?6 . Si las variables aleatorias Xl. DISTRIBUCIONES MUESTRA LES Colombia. El tercer momento central es un elemento ligado a la descripción de la simetría de la función de densidad de una variable aleatoria.. . i = 1. entonces n X. . suponiendo como cierta la información que se disponía en ese momento y adoptando una probabilidad del 95%? 29. . .. determine el valor esperado del semirrango de la muestra. 6Un coeficiente de simetría de la función de densidad de una variable aleatoria X. Si las variables Xl. Determine el valor esperado y la varianza de la desviación estándar de una muestra aleatoria de una población con distribución normal de valor esperado 11 y varianza (J2.. muestre que las estadísticas 2 n • ¿iXi n(n + 1) i=l • 6 ~ ~ z . .. 31. .

. X 2. demuestre que la estadística converge en distribución a una variable aleatoria con distribución N ormal estándar.8. 1.. .. determine la probabilidad de que el promedio de la muestra esté entre 495 g y 504 g.¡n (ex n . . X2. Si las variables aleatorias Xl. .. X 2.Xn constituyen una pobla- ción con mediana e. puede modelarse como una variable aleatoria con valor esperado 500 y desviación estándar 10. . La cantidad de café molido que se empaca en bolsas de 500 g me- diante un proceso que. EJERCICIOS 63 34. bajo control estadístico. Con base en una muestra de 100 bolsas... . Si las variables aleatorias Xl. X n constituyen una muestra aleatoria de una población con distribución Uniforme en el inter- valo (O. 38. Si las variables aleatorias Xl. . . Si las variables aleatorias Xl. X n constituyen una muestra aleatoria de una población con distribución Uniforme en el inter- valo (0. X 2. X2. e). 35. demuestre que el máximo de la muestra converge en probabilidad a e. X n constituyen una muestra aleatoria de una población con distribución Exponencial con pa- rámetro e. X n constituyen una muestra aleatoria de una población con distribución de Bernoulli de pará- metro e. Si las variables aleatorias Xl. .. determine el valor al cual la media geométrica de la muestra G n converge en probabilidad 37.. demuestre que la mediana de la muestra con- verge en probabilidad a e.1) ~ Z rv N(O. . 39. . . 1). demuestre que la variable aleatoria Qn = .1). . . 36.

64 CAPÍTULO 1. DISTRIBUCIONES MUESTRALES

40. Si las variables aleatorias Xl, X 2, . .. , X n constituyen una muestra
aleatoria de una población con distribución de Poisson de paráme-
tro (), demuestre que

exp (-X n ) ~ P[X I = O].

41. Si las variables aleatorias Xl, X 2, ... ,Xn constituyen una muestra
aleatoria de una población con función de densidad

fx(x) = xexp( -x) I(o,oo) (x),
determine el valor de la constante d, tal que P [Xn > d] = 0.95.
42. Si las variables aleatorias Xl, X2,"" X n constituyen una muestra
aleatoria de una población con función de densidad

fx(x) = 12x 2 (1 - x) I(O,I) (x),

determine el tamaño de la muestra tal que P [f= Xi > gn] ::; 0.05.
t=l

43. Si Xl, X 2 , .. . , X n es una muestra aleatoria de una población con
distribución Uniforme en el intervalo (O, ()), determine la función
de distribución de la variable aleatoria W n = n(() - Xn,n). ¿Cómo
se distribuye la variable aleatoria a la cual la sucesión de variables
aleatorias W I , W 2 , •.. , W n , .. . converge en distribución?

Capítulo 2

Estimación puntual de
parámetros

En la primera sección del capítulo 1 se anotó que los modelos son ele-
mentos conexos con los quehaceres de la Ciencia. De índole diferente y
con propósitos distintos, los modelos son artificios que cooperan en la
descripción y explicación de la realidad al representarla de una manera
muy peculiar, que posibilitan descripciones y explicaciones generales o
minuciosas, según el propósito.
Entre otras funciones, el modelo subsume, en una especie de ideogra-
ma, una variedad de casos similares. Como modelo especial, el proba-
bilístico, por su parte, simboliza mediante una expresión algebraica el
comportamiento genérico de variables que aluden a mediciones, conteos,
o valoraciones de unidades estadísticas; pero, igualmente, el modelo pro-
babilístico puede entenderse como la representación del compendio de
situaciones individuales, es decir, constituye una familia de modelos par-
ticulares de la misma naturaleza, los cuales pueden singularizarse deter-
minando valores específicos de los parámetros, aquellas constantes que
son elementos integrantes del modelo.
El vocablo puntual, que adjetiva la estimación motivo de este capítulo,
tiene en castellano varias acepciones. El sentido que debe otorgársele
dentro del contexto de la inferencia estadística es el de perteneciente
o relativo al punto, por tratarse de la estimación de un parámetro por
medio de un valor particular de una estadística, un punto del recorrido
de ella, y también para distinguirla de la estimación por intervalo. Por
ello, algunos traductores utilizan la expresión de estimación de punto.

65

66 CAPÍTULO 2. ESTIMACIÓN PUNTUAL DE PARÁMETROS

En ese sentido, la estimación puntual de los parámetros puede in-
terpretarse como la adopción de un modelo individual elegido dentro de
una familia, para representar una realidad particular, elección fruto de
la tasación de los respectivos parámetros por medio de un cálculo rea-
lizado con los valores observados de la muestra aleatoria, a través de la
expresión que define la estadística facultada como estimador.
El objetivo de este capítulo es exponer algunos criterios que permiten
estudiar el desempeño de estadísticas propuestas como estimadores, cri-
terios que, como consecuencia, son algunos de los principios que facultan
definitivamente a una estadística para desempeñarse como estimador.
La estadística propuesta, o en examen, es habitualmente producto de la
utilización de un método de construcción de estimadores. La primera
parte del capítulo está dedicada a la presentación e ilustración de los
métodos más corrientes en la construcción de estimadores; la segunda
parte, substancial del capítulo, está dedicada al estudio de esos criterios
evaluativos de un estimador.
Como ya ha venido insinuándose, se acude al concepto de variable
aleatoria para representar una variable de interés que corresponde a la
respuesta de cualquier unidad estadística. Al denotar se esta variable
como X, su función de densidad 1, su función de distribución, su fun-
ción generatriz de momentos y su función característica serán escritas
casi siempre y de ahora en adelante como fx(x, O), Fx(x, O), Mx(t, O)
Y IjJx(t, O), respectivamente, para enfatizar que las funciones asociadas
al modelo asumido como modelo poblacional dependen, además de los
valores para los cuales existen las mencionadas funciones, de las cons-
tantes inherentes al modelo dispuestas en el vector de k componentes
O = (0 1 , O2 , ... , Ok)'. La finalidad de la estimación puntual de paráme-
tros es estimar de la manera más eficiente los componentes del vector o la
imagen de O bajo una función r( O) del mismo, a partir de la información
disponible en la muestra.
Como preámbulo a la primera sección concerniente a los métodos
tradicionales de construcción de estimadores, se presenta la definición
inicial para la aprehensión de los elementos conceptuales integrantes del
proceso de estimación estadística.
lEste texto, con el objetivo de simplificar el lenguaje, utiliza la expresión función
de densidad para referirse tanto a la función de densidad de una variable aleatoria
continua como a la función de masa, de probabilidad o de cuantía de una varia-
ble aleatoria discreta. El contexto de su utilización revelará el tipo de variable en
referencia o se precisará cuando sea requerido.

2.1. MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 67

Definición 2.0.1. Siendo X una variable aleatoria cuya función de
densidad es fx(x, e), se denomina espacio del parámetro al conjunto
de todos los posibles valores de los componentes del vector e, denotado
como -e ,e- -e IR k .
Ejemplo 2.0.2. El modelo Uniforme es un modelo apto para emular
variables que se distinguen por presentar frecuencias indiferentes para
sus distintos valores. Considerando la variable aleatoria X con distribu-
ción Uniforme en el intervalo (O, e), es evidente, a partir de su función
de densidad
1
fx(x, e) = (j I(o,li) (x),

que el cero es una frontera fija y que el parámetro e se desempeña como
la frontera superior del recorrido de la variable, el cual asume un valor
específico ante una situación también específica. En este caso, el pará-
metro e es un real positivo, por consiguiente, el espacio del parámetro
es el conjunto

Ejemplo 2.0.3. El modelo gaussiano comentado y utilizado profusa-
mente representa variables cuyas frecuencias, con marcada simetría, re-
saltan los valores intermedios y marginan los valores inferiores y superio-
res. Como se sabe, muchas son las variables factibles de ser abstraídas
por este modelo. Considerando la variable aleatoria X con distribución
Normal de valor esperado el y varianza e2 , el se desempeña como punto
de simetría de su función de densidad

Y e2 regula su grado de apuntamiento como consecuencia de su disper-
sión. El modelo admite cualquier real como punto de simetría, mientras
que exige un valor positivo para e2; por consiguiente, el espacio del pa-
rámetro es el conjunto e = {el, e2 1e l E IR, e2 > O}, que gráficamente
presenta la figura 2.1.

2.1 Métodos clásicos para construir estimadores
Previamente al desarrollo de las ideas básicas sobre los criterios capitales
que permiten evaluar la aptitud de una estadística en su encargo como

68 CAPÍTULO 2. ESTIMACIÓN PUNTUAL DE PARÁMETROS

(h ..

01

Figura 2.1: Espacio del parámetro para el modelo gaussiano.

estimador, se presentan tres métodos para producir estimadores: el de
máxima verosimilitud, el de los momentos y el método por analogía.
Una mención adicional a la estimación bayesiana cierra esta sección.

2.1.1 El método de máxima verosimilitud
Con la denominación de método de máxima verosimilitud, resultado
de una amplia aceptación de la traducción por verosimilitud del término
inglés likelihood, se conoce al método de construcción de estimadores
más difundido y tal vez más utilizado. Aunque ya había sido concebido
y empleado por Gauss, se debe realmente a Fisher, quien lo hizo público
en la primera década del siglo XX. Por su fundamento y por producir
estimadores que poseen propiedades especiales, las cuales se estudiarán
más adelante, se convierte en un método con atractivos propios.

Definición 2.1.1. Siendo Xl, X 2 , ... , X n una sucesión de variables alea-
torias idénticamente distribuidas pero no necesariamente independientes,
la función conjunta de densidad de Xl, X 2 , ... , X n se conoce con el nom-
bre de función de verosimilitud de Xl, X 2 , ... , X n .

Definición 2.1.2. Sea Xl, X 2 , . .. ,Xn una muestra aleatoria de una
población con función de densidad fx(x, O), O E e, la función de ve-
rosimilitud de la muestra se denota y corresponde a

rr
n
L(O; Xl, X2,···, Xn ) = fX(Xi, O).
i=l

2.1. MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 69

Recurriendo nuevamente a la primera sección del capítulo 1, para
tener presente el sentido semántico que allí se aclaró, estimar significa
la realización formal de un avalúo como proceso expreso, preciso y de-
terminado que exige contar con información. Los valores particulares
Xl, X2, ... , Xn , valores ya observados de las variables constituyentes de
la muestra aleatoria, son el acervo de información con el cual se cuenta
una vez haya concluido el acopio y registro de la misma en el estudio o
investigación particular. En consecuencia, esos valores pueden asumirse
como fijos en la función de verosimilitud y por eso en muchos textos
se le considera como función de f) exclusivamente y suele expresarse co-
mo L(f)). Este texto utilizará en algunas oportunidades la expresión
condensada L(O) o simplemente L a cambio de L(f); Xl, X2, .. . , x n ).

Definición 2.1.3. Siendo Xl, X 2, .. . , X n una muestra aleatoria de una
población con función de densidad fx(x, f)), con f) E 8, se dice que el
estimador T = t(X I , X2, ... , X n ) es el estimador máximo-verosímil
de O (MLE de O; conservando las siglas inglesas de Maximum-Likelihood
Estimator), si el valor particular de t = t(XI, X2, ... ,xn ) es tal que el
supremum de L,
sup{L(f))If) E 8},

se consigue cuando f) = t, en cuyo caso t se denomina estimación
máximo-verosímil de f).

El derrotero de la estimación máximo-verosímil puede percibirse ini-
cialmente con el siguiente ejemplo.

Ejemplo 2.1.4. Como parte de una estrategia de mercadeo, una marca
de pilas obsequia la persona que presente 10 pilas usadas impresas con el
rótulo de promoción "Sello de oro", un paquete de cuatro pilas nuevas.
Para imprimir en las pilas el rótulo se dispone de una máquina rotu-
ladora que tiene tres niveles: alto, medio y bajo. La máquina estampa
aleatoriamente el rótulo promocional en el nivel alto, medio y bajo, re-
spectivamente, al 75%, 50% y 25% de las pilas. El comité ejecutivo de
la empresa, basado en la información de las ventas, determina el nivel
en que debe operar la rotuladora en un período determinado. Un com-
prador de un paquete desea estimar el nivel en el cual está operando la
rotuladora. Para ello construye la tabla 2.1 basado en que el número
de pilas rotuladas como "Sello de oro" en un paquete de cuatro se puede
modelar como una variable aleatoria X distribuida binomialmente con

062500 0. 4 1 . A diferencia de la anterior. justamente porque para un valor específico x. e = {OIO < O < 1}.375000 0. con base en el número de botellas cuyas tapas contienen la leyenda de la promoción en una canasta de 30 unidades. Si el comprador sólo dispone de un paquete de cuatro pilas para inferir el nivel de la rotuladora. El éxito de la promoción fue tal que una compañía de gaseosas acu- dió a la misma estrategia. .o equivalentemente nivel bajo.421875 0. la rotuladora de la compañía de gaseosas tiene la particularidad de que el nivel de estampación se puede ajustar a cualquier porcentaje. ~}. 2 - 3 '4 o equivalentemente nivel alto. si x = 3 o si x =4 x O O 1 2 3 4 1 4: 0.70 CAPÍTULO 2. el espacio del pará- metro es e = {~. la estimación corresponde a aquella donde la probabilidad es máxima. si x = 2. obsequiando una canasta de 30 unidades a la persona que presente 75 tapas con la leyenda "Apaga gratis tu sed" . ESTIMACIÓN PUNTUAL DE PARÁMETROS n = 4 Y probabilidad de éxito O.250000 0.046875 0.046875 0.003906 0.316406 4: 0. porque el espacio del parámetro es un conjunto infinito.062500 3 0. En este caso. si x = O o si x = 1.210938 0.1: Compilación de valores de una función de densidad Binomial con n = 4 Y probabilidad de éxito O. Igualmente.250000 0. sus estimaciones máximo-verosímiles. Para este caso ya no es posible construir una tabla como la 2. un comprador de una canasta desea estimar el nivel en el cual está operando la rotuladora.316406 0.1.210938 Tabla 2. ~. derivadas de la citada tabla serán: 1 .o equivalentemente nivel medio.421875 0.003906 1 "2 0.

t igualmente hace máximo a lnL(()).3. Como para efectos de esta estimación no existe la posibilidad de elegir valores particulares del parámetro. mencionan el máximo de un conjunto o función. Una columna de una tabla construida con algunos valores de () estaría constituida por un conjunto de valores de funciones de densidad calcu- lados con distintos valores del parámetro () y fijo el valor de x.1. mostraría el máximo del citado conjunto. el cual pertenece al conjunto. Por ejemplo. lo cual significa que el valor más verosímil del nivel de estampación es del 20% cuando se dispone únicamente de la información relativa a una canasta que contiene seis unidades premiadas. denotando como X: número de botellas cuyas tapas contienen la leyenda promocional en una canasta de 30 unidades. a la luz de la definición 2. MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 71 Se podría construir una tabla similar con una selección de valores par- ticulares de (). la mayor probabilidad. Lema 2. . El anterior y los cuatro ejemplos siguientes. indicativa de que su correspondiente valor de () es el valor más verosímil según las condiciones mencionadas.5. función cuya primera derivada es derivada que es nula cuando () = t.1. los valores de la función vistos como los componentes de una fila en una tabla similar a la 2. y en ese punto la función L( ()) tiene máximo.1. si en una canasta se encuentran seis botellas cuyas tapas están marcadas con la leyenda promocional. se acude al cálculo diferencial y de esta forma el valor de () para el cual L(()) sea máxima corresponde al valor más verosímil del nivel de estampación.1. el supremum de dicho conjunto es el mismo máximo. Entonces. teniendo en cuenta que cuando un conjunto posee máximo. 2. son los valores de una función de densidad para un valor específico de (). Leída verticalmente esta tabla. Si t hace máxima a L(()).

X2 = O.l}(X). . .Jln(! !1 O) } J{O.72 CAPÍTULO 2. ¿ Xi i=l i=l O 1-0 ..1. Se toma una muestra de tamaño tres de una pobla- ción con distribución de Poisson de parámetro O.. Ejemplo 2. cuyos resultados son..e)l-x Xn n II [{D. ..1.¿: Xi = ei~1 (1 .e)I-X2 .i~ Xi o02InL(O.30 _ 307e-30] . O e -O) _ (}7 e -30 L((}) -_ ((Pe-O) .Xl. . X2. .. ESTIMACIÓN PUNTUAL DE PARÁMETROS Ejemplo 2. 2!5! L'(O) = O cuando O = O o cuando O = ~.(1-0)2 <O lo cual garantiza la existencia del máximo de ln( L( O. X2.. el valor O = O no es un valor admisible por el modelo de Poisson porque O E e = {OIO > O}.. n ..X2.x n )). 2! O! 5! L'(O) = _1_ [70 6 e. Xl = 2. Luego la estimación máximo- verosímil de O es ~. e (1 . x n ) ~ {[~ x.. Xn ) __ !:) ¿.) ((}5 -. Determinar la estimación máximo-verosímil de O.. Xl. O) = OX(1 .e)I-X1 eX2 (1 .Xn de una población con función de densidad fx(x. Determinar el MLE de () a partir de una muestra aleato- ria Xl.6.((}Oe- . X3 = 5.Jlno e} -~ x. OE e= {OIO E (0.e) i~1 II [{D... .1)} n L(e. Xn ) = eX1 (1 . . X2.• .Xl.Xn)=-~.. --.l} (Xi) In L(O... x" X" .l} (Xi) i=l n n n ¿: Xi n.O)l-X I{O. Luego In L( O) tiene máximo cuando n n ¿Xi n.) o n n uO In L(O'. .>}(x. . 7.2=1 '" Ú Xi O n n 02 i~ Xi n . Xl. X 2 . .Xi i=l .

cuando n Entonces. es decir. proporción muestral. O) = -. 2..1. Es decir..-I{Ü. X2. el estimador i=l máximo-verosímil de O es X n = Pn .. .. . x. X n de una población con función de densidad e-BO x fx(x. . X2. OE e = {OIO > O} con lo cual se garantiza la existencia del máximo de In L( O. . de otra manera.8. .2..X n ) n n en O = ~ ¿ Xi. }(x). . llamado como ya se había anotado. Xl.1. Ejemplo 2. Determinar el MLE de Oa partir de una muestra aleato- ria Xl. MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 73 o. InL(O) tiene máximo en O = ~ ¿ Xi. i=l i=l . el MLE de O es ~ ¿ Xi.1.

X2. ()) = I[()-1. X 2 . se deduce que el MLE de () es n In (TI Xi) . pues la consecución de estimadores de esta naturaleza es en sí uno de los denominados problemas de máximos y mínimos. al hacer uso del cálculo diferencial. Determinar el MLE de () a partir de una muestra aleato- ria Xl. Determinar el MLE de () a partir de una muestra aleatoria Xl. Los siguientes ejemplos muestran una forma alternativa de encontrar un MLE.Xn de una población con función de densidad fx(x.10. .2: Gráfica de la función de densidad correspondiente al ejemplo 2. cuando la función de verosimilitud no sea diferenciable. .10 ..1.9. X n de una población con función de densidad fx(x. ~=l Se evidencia el respaldo que el cálculo diferencial prestó para la cons- trucción de los estimadores máximo-verosímiles en los ejemplos anterio- res... ()) • • ()_l () ()+~ x 2 Figura 2. . Ejemplo 2. () E e = {()I() E lR} fx(x. . () E e = {()I() > O}.74 CAPÍTULO 2. ()) = ()x()-II(o.1. . por ejemplo. no siempre es pertinente la utilización de esta herramienta. Sin embargo. ESTIMACIÓN PUNTUAL DE PARÁMETROS Ejemplo 2.1. Como en los casos anteriores.B+1l(x). tratándose de la herramienta matemática central del procedimiento.l) (x).

X2.3.···. . es razonable asumir como MLE de () a Xl.n - 1 "2 Xl. ~ :S () :S Xi +~ para i = 1. Como el papel que desempeña el parámetro es la determinación de la posición de la función de densidad.n. 2.n + 2· De manera que la función de verosimilitud puede expresarse como L(()) = I[x n.x·t implica () :S Xi + 2 1 1 Y () + 2 2: Xi implica (»x-- .n + "21 () Figura 2..2. . MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 75 n L((). Xn ) = rr I[B_~.3: Gráfica de la función de verosimilitud correspondiente al ejemplo 2. que coincide con el centro del recorrido de la variable. t 2 Luego Xi . entonces 1 1 () .-2 < .n 2 . Xl.. .n +1](()). .1.o+~](Xi) i=l Como L( ()) es distinta de cero cuando () .2..n+ ~ hace máxima la función de verosimilitud.1.~ y Xl.n . 2 :S () :S Xl.. i = 1.~ :S Xi :S () + ~.n _12' xl. cualquier valor entre Xn. particularmente 1 1 xn.10 Como se deduce de la figura 2.n.n +Xn.n . 2 L( ()) • • Xn.

.X2. T n = t(X I .11 El estimador máximo-verosímil de e es Xn. X n ) un MLE de e.. .1.76 CAPÍTULO 2. en particular cuando xn.. . .4: Gráfica de la función de verosimilitud correspondiente al ejemplo 2.n < e... entonces r(Tn ) es el estimador máximo-verosímil de la imagen de e bajo la función r. . e E 8.. ESTIMACIÓN PUNTUAL DE PARÁMETROS Ejemplo 2. X 2.n. Xn ) l)n n = ( (j g 1(0..XI. X 2 .1.. L( e) Xn.O)(X)' e E8 = {ele> O} L(e..0) (Xi)' Como L( e) es distinta de cero cuando O < Xi < e. Teorema 2. Si las variables aleatorias Xl. e). X2..n.12 (Principio de invarianza de un MLE). porque el sup(L( e)) = (x~. X n de una población con función de densidad fx(x. X 2 . entonces L(e. . .X n)= (~)n 1(Xn.11. .OO) (e).e) = ~1(O.1.n) n. X n constituyen una muestra aleatoria de una población con función de densidad fx(x. . Xl.n e Figura 2. Y si r(e) es una función uno a uno.·· . 8 ~ ]R. Determinar el MLE de e a partir de una muestra aleatoria Xl.

Siendo X la variable aleatoria que representa la duración del evento vital o biológico de cualquier unidad estadística. k representada por la variable K puede entenderse como una variable aleatoria y se habla en este caso de una muestra censurada del tipo 1..1.13. . 2. 1 l :s: :s: k. También se presentan situa- ciones en las cuales el estudio finaliza cuando únicamente k :s: n de las unidades estadísticas hayan concluido su observación. En cualquiera de las dos situaciones se habla de una muestra censurada.02. X 2 .r¡(O)).O). el valor Xl. En algunas aplicaciones como las relacionadas con los ensayos clínicos. . . con el análisis de sobrevivencia o con algunas investigaciones de laboratorio. este princIpIO de invarianza de los esti- madores máximo-verosímiles se puede enunciar como lo establece el si- guiente teorema.T n n (2) (k»)' un MLE de O. . Si el número de unidades k necesario para concluir el estudio se fija de antemano y el tiempo correspondiente t representado por la variable T es considerado como una variable aleatoria. T n donde T~j) = tj(X l . porque las (n-k) unidades restantes superaron el tiempo establecido. un esti- mador basado en una muestra aleatoria Xl. .Ok)" Si r(O) = (rl(O). MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 77 De manera más general.. el acopio de la información pertinente consiste en obtener el valor de la medición del tiempo de du- ración de algún evento vital o biológico de cada una de las n unidades estadísticas elegidas como tamaño de muestra. Teorema 2.n representa la duración de la "t-widad con menor valor... pero debido a la finalización del estudio no se conocen con exactitud sus valores. Cuando t se ha establecido como un tiempo fijo.k) unidades. . . Szendo T n = (1) T . X n ) para cualquier 1 :s: j :s: k. . se presenta una breve alusión a las muestras censuradas. Para ce- rrar el estudio del método de máxima verosimilitud. .14 (Estimación en muestras censuradas). . X2.. X2. .. 0= (Ol.n representa la duración . sólo que al finalizar el tiempo t establecido para el estudio.1. entonces el MLE de la imagen de O bajo la función r es Ejemplo 2... . faltando las restantes (n . k < n de las unidades presentan valores en la duración inferiores a t. entonces la muestra recibe el nombre de muestra censurada del tipo 11. X n de una población con función de densidad fx(x.r2(O).1.. .

rr k 1 Xi .n (je~-o.78 CAPÍTULO 2. la función de verosimilitud de las n variables aleatorias es: L(B. la función de verosimi- litud acorde con el tipo de muestra está constituida por el producto de dos factores: n! n (n _ k)!. y así sucesivamente hasta Xk. Para determinar un estimador máximo-verosímil del parámetro.··· .k) unidades tienen una duración mayor al tiempo t. ESTIMACIÓN PUNTUAL DE PARÁMETROS de la unidad con el siguiente valor.k)! [G)' exp ( -~ (t Xin + (n . X2.k)Xk. Considerando como objeto una muestra aleatoria censurada del tipo II. duración que no se puede establecer por la culminación del acopio la de información del estudio. El segundo factor corresponde a la probabilidad de que (n . debido a que P[X > xl = e~~. rr z=l k 1 ~ Xi. ' '-\.n) (exp ( . con función de densidad 1 x fx(x. rr n xk. Las restantes (n . De esta manera. =L i=l i=k+l n! L = (n . la presencia del coeficiente del producto de densidades radica en que hay (n~!k)! formas de tener k unidades de un total de n con tiempos inferi- ores al citado corte.00) (x).X n ) = 1__ n.k) unidades tengan una duración superior a Xk.n e~-o. en estas condiciones. como también asumiendo el modelo del tipo Exponencial para representar la duración del evento como la variable aleatoria X.(n . B) = (/~9 1(0. por tratarse de k-uplas ordenadas sin repetición. y rr i=k+l e~6 Xk n El primer factor es la parte de la función de verosimilitud correspon- diente a las k unidades con duración inferior al tiempo de corte.n. fijando los valores de k y n. se busca estimar el parámetro B.k)! [m t kexp ( -~ Xi.n) ) 1 . :)Xk. Xl.n que representa la duración de la última unidad con mayor duración inferior al tiempo t.n) ) 1 L n! = (n .n (je -0--.

k)Xk. MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 79 Procediendo de la manera usual puede deducirse que el MLE de e con base en una muestra aleatoria censurada del tipo 11.2 y el teorema que se enuncia a continuación. Este texto. 2. . Antes de exponer la idea del método es preciso referenciar dos teoremas que auxilian la fundamentación de método y su aplicación: el teorema 1. En consecuen- cia. SurglO el método más antiguo de construcción de estimadores.14 es realmente un QMLE.1. cuando se realizan algunos estudios basados en simulación o cuando se requiere excesivo cómputo estadístico para determinar una estimación máximo-verosímil y se acude a una función de cuasi verosimilitud para simplificarlo.3. propuesto y utilizado por Pearson a finales del siglo XIX. fundamenta el método y por tanto su procedimiento en la convergencia en probabilidad de los momentos muestrales a sus respectivos momentos poblacionales. bajo este modelo Exponencial es: k ¿ Xi. 2. pero el bosquejo aquí presentado se mantiene. se utiliza la sigla QMLE (Quasi Maximum Likelihood Estimator). cuando hay presencia de datos censurados.2 El método de los momentos Antes de la divulgación del método de máxima verosimilitud. Precisamente para denotar a un estimador de es- ta naturaleza. si se asume otro modelo para describir la duración del evento vital o biológico. el estimador obtenido en el ejemplo 2. La denominada función de verosimilitud en el ejemplo ante- rior referente a una estimación en una muestra censurada no es una función de verosimilitud estrictamente hablando. En casi todos los textos se describe como un método que deduce los estimadores por medio de un eje consistente en igualdades algebraicas de momentos muestrales con momentos poblacionales. Incorrectas funciones de verosimilitud son propias de situa- ciones cuando la función de verosimilitud es supremamente complicada. Es una función de cuasi verosimilitud.1.n T = ~i=_l~_______________ n k Por supuesto. cuyo máximo reside en una estimación cuasi máximo-verosímil.1.n + (n . Nota. denominado el método de los momentos. la determinación del correspondiente MLE de- penderá del referido modelo. sin apartarse radicalmente del proceso tradicional.

lr como lo enuncia el teorema anterior. Sea Xl.4.l2r = E [X ] .7. . J. 01 O2 n~ ~ n 02' i=l 2 ..lr· n i=l El método de los momentos consiste fundamentalmente en determi- nar las estadísticas unidimensionales que convergen en probabilidad a cada componente Oj del parámetro O.f(OI)X 01-1 -02 X ¡ e () (0. ESTIMACIÓN PUNTUAL DE PARÁMETROS Teorema 2.. )r p -tJ. X 2 .lk· Este sistema se fundamenta en los enunciados de los teoremas de Kint- chine (1. Siendo Xl.2.t J. O2 del correspondiente vector O = (0 1 . .6)y 1. debido a la convergencia en probabilidad de los momentos muestrales 1 n Xn -P 01 t. a partir de un sistema de expresiones M{ E. O). también se puede incluir en el sistema de expresiones el hecho que P M r . O) -.80 CAPÍTULO 2.2.15. r = 1.l~ I P I M2 -t J.. para j = 1. .X )2 E. En la determinación de las estadísticas en conside- ración. Existiendo el momento 2r J. .. X n una muestra aleatoria de una población con función de densidad 01 02 f X (x. .02)" Como X '" Gama(Ol.l2 M k' P -t I J. Ejemplo 2. k.1. n 1~( -~ Xi-X n .1. y _ ~ (X. . 01 E[X] = 01 y V[X] = O~ O2 entonces. X 2 .. .. determinar los estimadores de los componentes 0 1 . . .Xn una muestra aleatoria de una población con función de densidad fx(x..16..4. 02).00) x .

Xn)2 i=l Por otra parte.. .X n )2 'n *i~ (Xi . Xn P --:c:.:.- n -+ O2 . En consecuencia: -2 __n__X_n'-'--_ _ E.3. * ¿(Xi .Xn)2 es el estimador por el método de los momentos de O = (0 1 . luego ( ~)2 X - n P -+ 02· 2 También: por tanto. * ¿(Xi . 2.. 1.!2~_ _ E. El método de los momentos posee cierta flexibilidad en la construc- ción de estimadores..1.. MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 81 y con el apoyo del corolario 1. n *¿(Xi. al admitir relativa libertad en la conformación del sistema de expresiones que son el punto de partida del método..Xn)2 i=l En síntesis. Xn luego _ _ _(}.. O2 )'..X n)2 i=l Por lo anterior.3. X~ Xn) ( n * i~(Xi . Muestra de ello es el siguiente ejemplo. 01 .. En algunas oportunidades es posible acudir a otro momento para eludir un obstáculo no advertido.

1.00) (x). i=l Ejemplo 2.19. p 1 - X n ---> e _1__ ~ e. 1 n Luego ( X n . e> o. . X2. .¡ i~(Xi .17.~(Xi .X - n) 2) es el estimador por el método de los mo- mentos de e = (el.82 CAPÍTULO 2.1. i=l .18. Partiendo del hecho de que X n ~ O. X 2. ESTIMACIÓN PUNTUAL DE PARÁMETROS Ejemplo 2.. . e2)'. p X n ---> el 1~ - . Ejemplo 2.Xn una muestra aleatoria de una po- blación Uniforme en el intervalo (-e.1. .'" . X 2. e).Xn una muestra aleatoria de una po- blación con función de densidad fx(x. Determinar por el método de los momentos el estimador de e.Xn es una muestra aleatoria de una población Normal de valor esperado el y varianza e2 . Sea Xl. . Como el segundo momento ordinario es e2 :3 1 n _n~ e2 "xt--->- 2 p i=l 3 y por lo tanto ~n~ ~ X2 ~e.. e) = ee-Bx 1(0. Xn . Sea Xl. -:. Si Xl. Determinar el estimador de la mediana poblacional por medio del método de los momentos.X n n) 2 P ---> e2. . t i=l n Luego 1/ ~ L Xl es el estimador por el método de los momentos de e. al no contener información sobre e se explora en otra dirección.

e) = (j1(o.00) (x). Por tanto. que sus estimaciones estén en afinidad con ellos en el desempeño de funciones similares. Xn. . Un par de ejemplos ilustran la manera como este método particular procede. Sea Xl. Teniendo Xn .1. Xn. e El parámetro determina el valor máximo de la variable aleatoria que representa a la población.20. X 2 .1.n representa al valor máximo en cualquier e muestra. su estimador debe de- l sempeñar una función análoga. en cuenta que la medIana poblaclOnal es -e-' su estImador por el . e) = ee-()x 1(0. derivando una estadística que de manera análoga realice la misma función dentro de la distribución empírica. p ln(2) método de los momentos es X n ln(2) porque X n ln(2) ---+ -e-o 2...Xn una muestra aleatoria de una po- blación con función de densidad fx(x.1. Sea Xl. . es decir. Sugerido por Pleszczynska.puede adoptarse como el n X estimador de e usando el método por analogía. X 2 . . MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 83 Luego 1 es el estimador por el método de los momentos de e. . y es procedente. . e> O. .21. elige el estimador luego de indagar el papel que cumplen los componentes del parámetro dentro del modelo. como su nombre lo indica. ln(2) . por tanto. .n es el estimador de usando el método por analogía.1. Determinar usando el método por analogía un estimador de e.()) (x). Ejemplo 2. . X n una muestra aleatoria de una po- blación con función de densidad 1 fx(x.3 El método por analogía La pretensión primaria al proponer un modelo es lograr la mayor fideli- dad a los hechos. 1 1 Como E[X] = (j' entonces e= E[X]' El parámetro es el recíproco del valor esperado. el método por analogía. . Los paráme- tros de un modelo probabilístico desempeñan funciones muy específicas. Por tanto. que haya concordancia entre los atributos de la realidad y los elementos del modelo que los representan. 2. =. Ejemplo 2.

De la familia de densidades Beta. pero frecuentemente con valores ba- jos y muy raramente con valores altos. la variable 8 es una variable aleatoria continua o discreta. el parámetro e puede modelarse como una variable aleatoria con distribución Beta. Algunas situaciones en la práctica requieren un modelado especial y el enfoque bayesiano es propicio para tal fin. el valor del parámetro B de la función de densidad de una variable Y que contabiliza el número de artículos disconformes en una caja de 48 unidades. el enfoque bayesiano considera una muestra aleatoria de una población con función de den- e sidad fx(x. cuyo pará- metro. variable que tiene una función de densidad ge (B).e)b-1 1(0. B). según el caso.1(1 . si una compañía recibe en su planta de producción materia prima cuyo nivel de calidad.1) (e) densidad para la cual a y b son conocidos y para el caso b es suficiente- mente mayor que a para registrar el sesgo pretendido. cuyo parámetro es totalmente conocido. en esta explicación. Coherentemente. La función ge(B) recibe la denominación de función de densidad a priori de 8. la estimación bayesiana fundamenta su proceder sobre el principio de que información o conocimiento previo sobre algunos rasgos del parámetro son elementos contribuyentes en su estimación. se opta por una individual que preserve los rasgos esperados del parámetro 1 ge (e) = ni 1 \ ea . un valor fijo que pertenece a un conjunto 8. De- pendiendo de la naturaleza de e. pues se inspira en la concepción de la denominada probabilidad subjetiva que el investigador puede alterar a la luz de información o conocimiento adi- cional sobre la naturaleza del fenómeno en estudio. cuya función de densidad manifieste un fuerte sesgo a la derecha. a diferencia de lo tratado hasta el momento.1. entonces para destacar esa índole de variabilidad y de marcada tendencia en la generación de valores bajos. en el control de calidad de la mate- ria prima. medido en términos de la fracción disconforme de artículos. es variable de entrega a entrega. Por ello. . y si ese nivel de calidad es para un período de inspección de lotes. Por ejemplo.4 Estimación bayesiana El enfoque bayesiano en la estadística es un enfoque muy singular.84 CAPÍTULO 2. ESTIMACIÓN PUNTUAL DE PARÁMETROS 2. B). en el sentido de considerar una muestra aleatoria de una población con función de densidad fx(x. en la cual el parámetro es entendido como un valor particular de una variable aleatoria 8.

como comportamien- to poblacional.X2. conviniendo que e es una variable continua. ..Xn (eIXl. .. e) como hasta ahora ha venido concibiéndose. . X2. se selecciona una muestra aleatoria Xl. El hecho que la familia de densidades a la cual pertenece la función de densidad . En el caso asociado en esta descripción.X2.. MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 85 Adoptada la distribución a priori de e. Xn ) y debido a la independencia existente entre las variables aleatorias que conforman la muestra y la variable aleatoria que representa al parámetro e. de una población ya no con función de densi- dad fx(x. sino con fun- ción de densidad fx(xle). .. función de den- sidad condicional que corresponde a f X l. la muestra se selecciona de una población con función de densidad La función de densidad condicional felxl. y el modelo Beta para el comportamiento del parámetro..Xn .. X2. X2. . la función de densidad a posteriori de e. 2.·· .x2.i~ Xi) f3 luego la distribución a posteriori de e es una distribución Beta.Xn (Xl. xnle)ge(e) fXl... . al asumir el modelo de Bernoulli.. C~ Xi + a. . puede expresarse como Particularmente. . X2.xnle=o(Xl. n + b . . . x n ) se le conoce como la función de densidad a posteriori de e. entendida ésta como una función de densidad condicional debido a que depende de los valores de la variable aleatoria e. .1.···..

y r(O) una función del parámetro O. fácilmente puede comprobarse que la distribución a posteriori de e es Beta.24.23. Como se afirmó. si la función de densidad a priori de e. Una familia D de densi- dades se dice que es conjugada para la función de densidad fx(x..1. ge(O) E D Y si felxl...¡o)1ge( e)de J~oo [iDI fX(XiIO)] ge(O)dO Ejemplo 2. respecto a la función de densidad a priori ge (O) es aquel cuya estimación corresponde a E [r( e) [XI. O).1. O). entonces . o que es cerrada bajo muestreo respecto a la función de densidad fx(x. X2. x n ) E D. Sea Xl. X 2 . .Xn una muestra aleatoria de una población con función de densidad fx(x. O). pues se puede simular la distribución a posteriori sin acudir directamente a los resultados del teorema de Bayes. produce un hecho atractivo para la computación estadística. . .22. . El estimador bayesiano para la imagen de O bajo la función r. . O).O)l-X I{O. Definición 2..1.· ... la familia de densidades Beta es con- jugada para la función de densidad de un modelo de Bernoulli. X2. ••• . X 2 . Sea Xl. De lo anteriormente desarrollado se deriva que la familia de densi- dades Beta es conjugada para la función de densidad de un modelo de Bernoulli. Si se asume la función de densidad a priori de e como Uniforme en el intervalo (O.Xnl ~ 1"=' r( e) [iD. .86 CAPÍTULO 2. ge(O) la función de densi- dad a priori de e.x2. ESTIMACIÓN PUNTUAL DE PARÁMETROS a priori de e sea la misma de la función de densidad a posteriori de e. Pero no siempre se cuenta con esta ventaja.xn (OIXI..Xn una muestra aleatoria de una población con función de densidad fx(x. 1) Y la función de densidad fx(xIO) = OX(1 . f x (x. Definición 2.I}(X)..

_i=_l_ __ n.i~ Xi) n ¿Xi+ a i=l En otros términos. el estimador bayesiano correspondiente sería n ¿Xi+ 1 T . es decir la estimación bayesiana de la imagen de bajo la función e r(e) = e(l .+a ei =l n.¿n xi+b- (1 . n+2 y la estimación bayesiana para la varianza de la población e(l .1) como la distribución a priori de e.e). perteneciente a la familia Bernoulli de densi- dades. X2.. MÉTODOS CLÁSICOS PARA CONSTRUIR ESTIMADORES 87 la estimación bayesiana de e corresponde a 1 Jo ¿n x.. . asumiendo el mencionado modelo Uniforme en el in- tervalo (0. _i=_l_ __ n . . n+a+b Puede comprobarse que si se hubiese asumido el modelo uniforme en el intervalo (0. n + b . es n ¿Xi+a 1: .e) i=l 1de 1 [ E [eIX 1 .e).¿ Xi i=l i=l 1 Jo ¿n x.Xnl = ( n n ) (3 ¿ Xi + a.¿n xi+b- (1 .1) como la distribución a priori de e. 2.1. n + b . el estimador bayesiano para e respecto a la función de densidad a priori de e.e) i=l 1 de 1 [ (3 C~ Xi + a .+a-l e ei =l n. se deriva en la forma .

lp(7 2 n(72 + (72 P y varianza (72(72 p n(7~ + (72· Nota.1. en la medida que el tamaño de la muestra se incremente este estimador tiende al estimador máximo-verosímil para O.. . Como f. X n .O)n-¿ Xi] 1. ESTIMACIÓN PUNTUAL DE PARÁMETROS siguiente: r10(1 [ f Xi n E [r(8)[X X Jo ..=1 Xi] dO n [ 1 ¿n x.lp y (7~ son valores fijos y conocidos. Esto quiere decir que si se adopta otra función de pérdida. .. Para finalizar. O) i=l dO (3 C~ Xi + 1 . . una muestra aleatoria de una población con distribución Normal de valor esperado O y varianza (72 asumida como una constante conocida. realmente. X2.=1 dO n n 1 ¿ Xi Jo Oi=l (1 . . por supuesto conocidos.+l n... los estimadores bayesianos definidos en esta sección.X l= .25. La distribución a priori de 8 se establece como Normal de valor esperado f. O) Oi=l (1 . n + 1 . Sea Xl. ¿nXi+] 1 Jo [Oi=l (1 .t Xi] 1=1 (n+3)(n+2) Ejemplo 2. Puede comprobarse que la familia de densidades gaussiana es conjugada para la función de densidad de un modelo gaussiano e igualmente que la distribución a posteriori de 8 es normal de valor esperado 2- n(7pX n + f. son estimadores bayesianos cuyas estimaciones minimizan una función de pérdida particular llamada error cuadrático.O)n-¿ . el estimador bayesiano puede ser de otra naturaleza. .lp y varianza (7~.88 CAPÍTULO 2. . 2.i~ Xi) [t 1=1 Xi + 1] [n + 1..

Contrario a lo que frecuentemente se presenta como propiedades de los estimadores. la estimación correspondiente. Igualmente. este texto las destaca como requisitos para facultar es- tadísticas en su desempeño como estimadores. sobre la naturaleza de su concentración. CRITERIOS PARA EXAMINAR ESTIMADORES 89 2. Así como en una relación comercial el proveedor necesita disponer de evidencias que confirmen la aptitud del producto o la diligencia del ser- vicio. acerca de atri- butos especiales derivados de su construcción. Se trata de un procedimiento análogo a un procedimiento de certifi- cación de calidad que asegura que un producto. consiste en colocar en balanza los requisitos que la estadística cumple. Los requisitos indagan acerca del carácter del centro de gravedad de la distribución muestral de la estadística. etc.2. y aquellos rasgos que menoscaban en algún grado su misión.2 Criterios para examinar estimadores Otorgar facultades a una estadística para que se desempeñe cabalmente como estimador es el resultado del cumplimiento por ésta de cada uno de los requisitos de un conjunto de requisitos deseables para un estimador idóneo. al estimador que satisface el requerimiento de la consistencia. un proceso o un servicio. es- timador consistente. Por ejemplo. Facultar una estadística es en sí acreditar la calidad de un proceso. para que su cliente pueda confiar en su destreza para satisfacer sus expectativas y necesidades. se adjetiva de igual forma: estimación . es decir el valor particular del estimador. de un estimador es menester contar con una relación de sus solvencias para que su uso. sobre el efecto que pueda tener el tamaño de la muestra en su esencia y sobre otras condiciones de mayor abstracción. a semejanza del uso que un cliente le da a un producto o servicio certificado. Es usual en la certificación de estimadores adjetivar al estimador con el requisito que cumple. sujeto al modelo adoptado. satisfaga la precisión y exactitud previstas en el proceso de estimación y tenga en cuenta las limitaciones y particularidades del entorno de su aplicación. cumple los requisitos especificados. la evaluación del costo/beneficio de adoptar un estimador con algunas deficiencias frente a sus virtudes. es decir. sus capacidades. se designará como estimador insesgado al estimador que cumple el requisito del insesgamiento. lo cual genera un factor imprescindi- ble en la cimentación de la confianza en las relaciones cliente/proveedor. 2. un proceso particular de inferencia. para que el usuario pueda aplicarlo con la confianza derivada de la certificación.

si y sólo si Pe [r(e) . según las consideraciones hechas de la dependencia del modelo asumido y de su parámetro inherente. ESTIMACIÓN PUNTUAL DE PARÁMETROS insesgada. si y sólo si Pe [IT2) .2.1. > O Y cada e E 8.] para cada>. si él es más concentrado que cualquier otro estimador para la imagen de e bajo la función r.r(e)1 < IT~2) .3. .Xn una muestra aleatoria de una po- blación con función de densidad fx(x. Sea Xl. >.. estimación consistente.2.t2 Xl. Definición 2.1 Concentración. un requisito de precisión Definición 2. En la definición anterior se utilizó el símbolo Pe en cambio del símbolo usual P. respectivamente. . .. X n ). de una va- riable aleatoria.90 CAPÍTULO 2.1 el estimador T~l) se denomina estimador Pitman más concentrado que el estimador T2) para la imagen de e bajo la función r. . X 2. X n ) dos estimadores para la imagen de e bajo la función r.2..···. Se dice que el estimador T~l) es más concentrado que el estimador T~2). . X 2.Xn ) se denomina el estimador más concentrado para la imagen de e bajo r. e) y r(e) una función del paráme- tro.] 2: Pe [r(e) .2. se describe en primer lugar lo relativo a la concentración de un estimador. r(e)l] 2: ~.2. . X n una muestra aleatoria de una po- blación con función de densidad fx(x. . y T n . en su respectivo espacio. Para dar paso a la exposición de estos requisitos o criterios para el examen de una estadística. . . T n . X 2. la función r(e) una función / (1) _ (2) _ ( del parametro e. Sea Xl. < T~l) < r(e) + >. ·. El estimador T~ = t*(X l .tl(X l . Definición 2.. quiere decir entonces que el citado cálculo alude a cualquier valor del parámetro. modelo que lleva consigo al e parámetro como su componente connatural. al utilizar Ee Y Ve se hace referencia al valor esperado y a la varianza. 2.. para acentuar que el cálculo de la probabilidad allí indicado se basa en un modelo asumido. e). Dentro de la definición 2. X2. por supuesto. >.. función cuyo recorrido es un conjunto de números reales. X2. < T~2) < r(e) + >.2. En este mismo sentido.

saber si el centro de gravedad de la función de densidad de la estadística postulada coincide con el valor del parámetro o con la imagen del pará- metro bajo una función determinada.2. X 2 . O).2. Para una estadística. Según las consideraciones de la definición 2.Xn ) se denomina el estimador Pitman más concentrado para la imagen de O bajo la función r si él es Pitman más concentrado que cualquier otro estimador para imagen de O bajo r. ... En particular. es un ingrediente necesario dentro del examen de idoneidad como estimador. X n ) un estimador de la imagen de O bajo la función r.2. Por ello cobra importancia el requisito de insesgamiento como uno de los elementos para facultar estadísticas. . la diferencia se denomina sesgo del estimador T n para la imagen de O bajo r. es una cualidad deseable dentro de los pormenores de la exactitud que se le exige y. . . de la índole de su valor esperado. Sea Xl.2.4.2.2. 2.. CRITERIOS PARA EXAMINAR ESTIMADORES 91 Definición 2..5. la función r(O) una función del parámetro O y Tn = t(X l .2. . X 2 . Definición 2. por tanto.5 un estimador T n se dice que es un estimador insesgado para la imagen de O bajo la función r. . Definición 2. requisito que a continuación se presenta. . lo es en mayor medida al tornarse en ineludible el conocimiento. si y sólo si Ee[Tnl = r(O). con el máximo detalle posible. El estimador T~ = t*(X l . para todo O E 8.6..7. Una medida de concentración del estimador T n es llamada error cuadrático medio MSE (Mean-Squared Error) definido como El centro de gravedad de la función de densidad de una variable aleatoria es un punto de referencia destacado. Definición 2.Xn una muestra aleatoria de una po- blación con función de densidad fx(x. Dentro de las condiciones de la definición 2. X 2 . . según sea el caso.5.

n.2. entonces Be [Tnl = O.r(O))2] = Ee {[(Tn . .e)(x).5 al estimadorTn = t(XI . X n una muestra aleatoria de una po- blación con función de densidad 1 fx(x. el sesgo pierde interés y no es obstáculo en el buen desempeño del estimador.e) (y) Ee[Xn. si lim {Ee[Tnl . Con base en las consideraciones de la definición 2. O) se le denomina estimador asintóticamente insesgado para la imagen de O bajo la función r. nyn-l f xn. porque en la medida que el tamaño de la muestra se incrementa el sesgo se disipa. O> O. .. En otras oportu- nidades. . si T n es un estimador insesgado para la imagen de O bajo la función r.r(O))f} = Ve[Tnl + B~[Tnl porque (Ee[Tnl .Ee[Tn ]) + (Ee[Tnl.2.n (y) = -----¡¡n J(o. ESTIMACIÓN PUNTUAL DE PARÁMETROS El error cuadrático medio de un estimador T n puede expresarse como la suma de dos componentes: la varianza del estimador T n Y el cuadrado del sesgo del mismo.r(O)} = O n---+oo para todo O E e. Sea Xl.n para O.r(O))Ee [Tn .2. En efecto. Y por tanto MSETn(O) = Ve[Tnl· El requisito de insesgamiento puede cumplirse en muchos casos modi- ficando ligeramente la estadística en consideración. MSETn(O) = Ee [(Tn . .nl = ¡° e n nd = __ on Y y n _O n +1 . . Deter- minar el MSE de Xn.9.Ee[Tnll = O..92 CAPÍTULO 2.O) = 7/(o.X2.Xn ) basado en una muestra aleato- ria de un población con función de densidad fx(x. Por supuesto. X2. Ejemplo 2.8. El método por analogía sugiere el estimador Tn = Xn.. Definición 2.

p (.3. Sin embargo es factible corre- gir esta ligera imperfección construyendo una estadística que cumpla el requisito de insesgamiento. ai En efecto.10.Xn)2 . y si T~i) rv N (O. [IT~i) ~ 01 < . Luego 20 2 MSEXn. 2.n (O) = (n + 1)(n + 2) Ejemplo 2.2. Ejemplo 2.n es un estimador asintóticamente insesgado para O.. estadística con un sesgo que puede pasarse por alto al contar con una muestra grande..11. el insesgamiento de S~ como esti- mador de la varianza poblacional es la razón por la cual S~ se adopta como varianza de la muestra.4. porque Ee [Tn ] = n~ l a 2 . El MLE de a 2 basado en una muestra aleatoria Xl.n On re yn+l dy Jo = _n_ 02 n +2 2 V. [ ~~ < T~i~i~ O < ~ 1 =p (~) . X 2 .. n :t i=l (Xi . Precisamente. Si T~l) y T~2) son dos estimadores insesgados para O cuyas varianzas son respectivamente ai y a~. la estadística S2 = _1_ ~ (X. al). . [X ] . de una población gaussiana de valor esperado ¡. como lo asegura de manera general el teorema 1._n_ 02 _ n 02 _ n 02 e n. si y sólo si < a~. CRITERIOS PARA EXAMINAR ESTIMADORES 93 n O Be[X ]=--0-0=---. y va- rianza a 2 es Tn = .2. X n . E [X2 ] = ~ e n.. ~) = 2p (~) .n n +1 n +1 Claramente.(n+1)2(n+2) . .!.¡.n . _ X ) 2 n n-1L.n+2 (n+1)2 .. como P. Inde- pendientemente del modelo asumido. n.xl = P. 1 . Xn. entonces T~l) es más concentrado que T~2) para O. t n i=l cuenta con una función de densidad cuyo centro de gravedad es justa- mente a 2 .2.

.13. X n ) un estimador para la imagen de O bajo r. ESTIMACIÓN PUNTUAL DE PARÁMETROS siendo <p(v) = J~oo vke-~z2 dz. un requisito ligado al tamaño de la muestra Definición 2. r una función de O. . X 2 .94 CAPÍTULO 2.2.2. X n de una población con función de den- sidad fx(x. Sea T n = t(X l . si lim Po [r(O) . . naturalmente es un estimador consistente simple. Definición 2. n-too para todo O E e. es decir.2. es decir. . Como la consistencia de un estimador es una propiedad inherente a la convergencia. Según las consideraciones de la definición 2. O).12. en síntesis. un estimador consistente en error cuadrático medio es un estimador consistente simple. X 2 . cuando 0"1 < 0"2. entonces Po [IT~l) .01 < A] 2: Po [I T2) . . para todo O E e y E > O. T n es un estimador consistente simple o consistente débil para la imagen de O bajo r.01 < A] 2<p (:1) . construido con base en una muestra aleatoria Xl. . 0"1 0"2 2. 1 2: 2<p (:2) . si la sucesión de estadísticas {Tn } converge en media cuadrática a r( O). si la sucesión de estadísticas {Tn } converge en probabilidad a r( O). 1 <p (~) 2: <p (~) desigualdad que se cumple cuando ~ 2: ~. N ota.2 Consistencia.E < Tn < r(O) n-too + El = 1. T n se denomina estimador consistente en error cuadrático medio para la imagen de O bajo la función r. . Lo contrario no siempre es cierto. . r(0))2] = O.2.12.. Un estimador que haya sido construido por el método de los mo- mentos. si lim Eo [(Tn .

Siendo T2) y T2) dos estimadores GAN para la imagen de O bajo una función r.2.16. Un estimadorTn para la imagen de O bajo la función r con las condiciones de la definición 2.. . 3. O) estadística elegida como estimador para la ima- gen de O bajo una función r.. 2. La sucesión de variables aleatorias {yn[T~ .r(O)]} converge en distribución a una variable aleatoria con distribución Normal de valor esperado cero y varianza 0'*2 (O). . .14. X n de una población con función de densidad fx(x. . X 2. O). . Definición 2.2.14 se denomina estimador CAN (Gonsistent Asymptotically Normal). Siendo T n cualquier otro estimador consistente simple para la ima- gen de O bajo la función r para el cual la sucesión {yn[Tn . Sea T~ = t*(X l . 2.. o T n es GANE. sz para todo O E e. si O'r (O) :S o'~ (O). cuyas varianzas son respectivamente ai (O) y o'~ (O). basados en una muestra aleatoria Xl. X 2. T~ se denomina estimador BAN (Best Asymptotically Normal).2. X n ) una estadística basada en una muestra aleatoria Xl.15. . se dice que TÁ1) es asin- tóticamente más concentrado que TÁ2) . . r(O)]} converge en distribución a una variable aleatoria con distribución Normal de valor esperado cero y varianza 0'2 (O). se tiene que Definición 2. El estimador T~ es consistente simple para la imagen de O bajo la función r. si y sólo si: 1. X 2.2...2. CRITERIOS PARA EXAMINAR ESTIMADORES 95 Definición 2. .Xn de una población con función de densidad fx(x. para todo O E e.

X2.. que lo produjeron. . La idea de suficiencia indaga sobre la pérdida de información. ESTIMACIÓN PUNTUAL DE PARÁMETROS Teorema 2. significa que una estadística suficiente conserva de alguna manera la información contenida en la muestra aleatoria..n . . que para efectos de estimación del parámetro O supone la reducción de los valores observados Xl..Xn en un solo dato: t n = t(Xl. .O) J p(l ~ p/x(xp . insesgamiento o concentración. O).Xn una muestra de una pobla- ción con función de densidad fx(x. .2. entonces la es- tadística de orden X[np]+l. una función continua y positiva en el percentil x p con p un valor fijado de antemano. Xn son valores observados de Xl. x p] ~Z rv N(O.2. citada en el párrafo anterior. El conocimiento de un valor particular t n de una estadística T n no per- mite la identificación de cada uno de los valores muestrales Xl.n es un estimador CAN para el percentil x p con (J2(0) = p~l-p) .. porque varios elementos del espacio de las observa- ciones X pueden tener como imagen el mismo valor t n . elementos éstos que conforman un subconjunto denominado contorno de la estadística T n . . observaciones que pueden considerarse como un elemento del espacio de las observaciones X subconjunto de lR. Xn}. Cualquier contorno de una estadística suficiente posee una propiedad especial: su comportamiento probabilístico no depende del parámetro O.96 CAPÍTULO 2. .Xn . El concepto de suficiencia involucra las observaciones muestrales. es decir. . o dicho de otra manera nfx(xp. . . 2. 1).17. un requisito de retención de informa- ción El concepto de suficiencia que no es tan intuitivo como el concepto de consistencia. n definido como X = {(Xl. En una de sus afirmaciones expresaba que una estadística sufi- ciente es "equivalente. . Esta afirmación permite señalar entonces la importancia de una estadística suficiente y colegir que un buen estimador debe ser función de una estadística con esta propiedad. que a la luz de la afirmación de Fisher.. x2.. en las variables aleatorias que representan a los datos originales. •. X 2. O) [X[np]+l. Xn)IXI. x n ). X2. . para todos los propósitos de estimación.. X2. X 2 .. . . Siendo Xl. a los datos originales de los cuales fue derivada". fue definido por Fisher en 1922. .. Esta idea se abstrae y se formaliza en la siguiente definición.. X2.3 Suficiencia.· ..

.2. X 2 = 1] Po[X l = O. no depende de e para todo valor t n . se tiene que PO[T2 = 1] = PO[X l = 1.e) 1 - 2 De esta manera se concluye que T2 = Xl + X 2 es una estadística suficiente para e.18. CRITERIOS PARA EXAMINAR ESTIMADORES 97 Definición 2. la estadística T~ = X 1 X 2 no es una estadística suficiente . [X = 1 X = OITo = 1] = Po[X l = 1..2. .e) 1 - 2 Po[X l = O. basada en una muestra aleatoria Xl. . X2. Ejemplo 2.2..19. X 2 . X 2 = O] + Po [Xl = O. Una estadística T n = t(Xl. e). Sea Xl.Xn ) se dice que es una estadística suficiente para e. 2. pues la distribución condicional de las variables Xl. Para los valores particulares de la estadística T 2 = O Y T l = 2. ..e) 2e(1 .. X 2 = O] O 1 . . X 2 dados valores particulares de la estadística T 2 no depende de e.e) + e(l . En el caso especial del valor T 2 = 1.e) con lo cual p. si la distribución condicional de las variables aleatorias Xl.Xn de una población con función de densidad fx(x..e) = 2e(1 . X 2 . . . X 2 = 1] = e(l . X 2 una muestra aleatoria de tamaño dos de una población con distribución de Bernoulli de parámetro e. X 2 = 11 T 2 = 1] = Po[T = 1] 2 e(l .e) 2e(1 . Por su parte. T2 = Xl + X 2 es una estadística suficiente para e.2 2 Po [T2 = 1] e(l . X n dado T n = t n .

21 (Criterio de factorización de Fisher-Neyman). Pe[T~ = O] = Pe[XI = 0. Determinar..0)2 = 1 .O) = _0_ Pe[XI = 1. X 2 = O] + Pe [X l = 0. Por fortuna.2. . _ 0(1 . . si las siguientes probabilidades dependen o no del parámetro O. el criterio de Fisher-Neyman es un instrumento seguro para la búsqueda o confirmación de estadísticas suficientes.. dado T n = tn.O Pe[XI = 0.X2 = 11T~ = 1] = 1 Con estos resultados puede deducirse que la estadística T~ = X I X 2 no es una estadística suficiente para O. Sea Xl. 1 _ 02 1+O Pe[X I = 1.. no depende de O.Xn ) es una estadística suficiente para el paráme- tro O si y sólo si la distribución condicional de T~ = t'(XI . Teorema 2. Entonces.. para poder concluir sobre la suficiencia de la estadística.2. porque sólo la construcción de la distribución condi- cional puede resultar dispendiosa. X 2 = 1] = (1 .1 _ 02 1+O . ESTIMACIÓN PUNTUAL DE PARÁMETROS para O.02 Pe[T~ = 1] = 02 . . X 2 = 0IT2 = O] . X n una muestra aleatoria de una población con función de densidad f X (x. X 2 = 11T2 = O] . ..X2 .18 si una estadística es- pecífica es una estadística suficiente. X 2. X 2 dado T~ = t~. X 2 .. _ (1 .0)2 + 2(1 . O).2. Según la definición anterior.0)0 = 1 . apropiada más para señalar la no sufi- ciencia que la suficiencia de una estadística particular. X n . X 2 = 0IT2 = O] . _ 0(1 . Definición 2. X 2 = O] + Pe [Xl = 1. X n ). Versión para estadísticas suficientes unidimensionales. .. siendo T~ cualquier estadística.O) = ~O_ Pe[X I = 0. La estadística produce dos valores: ° y 1. X 2 . . es preciso examinar la distribución condi- cional de Xl. Una estadística T n = t(X I . . . .con base en la definición 2. es decir.1 _ 02 1+O . . no es una tarea fácil en la mayoría de las situaciones. Menos complicado podría resultar el uso de la siguiente definición.20. S ea Xl.98 CAPÍTULO 2.

. T n = t(X l .2. .2. . . 2. ilustra una forma mecánica de determinar estadísticas suficientes con el recurso del criterio de factorización de Fisher-Neyman.18.. ella es suficiente para e.. Siendo T n una estadística.e)n I1 ~=~ I{o.2.l} v g(t Xi. no negativa.19. X2. . . . .Xn ). ejemplo despojado de toda complicación de cálculo. i=l n (1 ~ e)i~l Xi (1.2.. Xn a través de t(Xl.l} (Xi) ~ .X2. En efecto. X2. que depende de e y de Xl.. El ejemplo 2. .Xn una muestra aleatoria de una po- blación con distribución de Bernoulli de parámetro e. X2. e)n]11] (Xil J I¡O.. B v (1.22. generalización del ejemplo 2. el siguiente ejemplo. X 2. e)... . .O) t=l h(Xl.X n ) n Luego el criterio de Fisher-Neyman permite concluir que ¿ Xi es una i=l estadística suficiente para n e. Por el contrario. X 2 ... para centrar la reflexión sobre el concepto a la luz de la definición 2. [e~ l' x..Xn y la función g. X n ).X2.· ... . . Ejemplo 2.19 pretende ser inductor del concepto de la suficiencia de una estadística. CRITERIOS PARA EXAMINAR ESTIMADORES 99 una muestra aleatoria de una población con función de densidad f x (x. porque g es una función no negativa que depende de e y de ¿ Xi Y h depende únicamente de Xl. n Tn = ¿ Xi es una estadística suficiente para e.2. . si y sólo si la función de verosimilitud de la muestra puede ex- presarse como el producto de dos factores: siendo h una función no negativa que depende exclusivamente de Xl. Sea Xl.Xn · i=l .

. X2. x n ) La función h es una función no negativa que depende de Xl. .···.. Sea Xl... T n(m). t m (X1. .szendO T n(i) = ti ( Xl.2.. X n una muestra aleatoria de una población con función de densidad f x (x. . . con los elementos de la definición 2.T~m) = t m (X1. . . . . O). X 2. X n ). ·. i = 1.2. X2. Si las estadísticas T~l) t1(X 1.... X2. .2. .. . x n ). x n ). . X2. . . .. .. Sea Xl. Sea Xl.. X 2. . . . X n ).· . .. T n(2) . . Las estadísticas T~l) = t1(X1.23. se denominan estadísticas conjuntamente suficien- tes para O. . si y sólo si la distribución de Xl.. X2. X n ) constituyen una colección de estadísticas conjuntamente suficientes. X2. X 2. . .Xn).2. t2..···. ..X2. entonces cual- quier transformación uno a uno de T2). . X2...Xn ).. . dado T~l). . T~2). X2. para T n(1) . O). Versión para estadísticas conjuntamente suficientes. Teorema 2..2.. T~m»). ... T~m). T~2) = t2(X1. no depende de O. Xn exclusivamente y g una función no negativa que depende de O y de Xl. . Una colección de estadísticas conjuntamente suficientes corresponde a una estadística Tn de dimensión igual al número de estadísticas unidi- mensionales que conforman la colección.. Xn ) = L puede expresarse como L = g(t1(X1.2. . . m. .. X2. X 2. X n una muestra aleatoria de una población con función de densidad fx(x. es decir. X n una muestra aleatoria de una po- .. Las estadísticas unidi- .. X 2. T n = (T~l). . .. . .26.T~2) = t2(X 1.. .X2. Teorema 2.24. Ejemplo 2. .···. . 0)h(X1. X n ) .. T~m) = t m (X 1. . . .·· .. ESTIMACIÓN PUNTUAL DE PARÁMETROS Definición 2. . Xn a través de t1. menswnales .... Xl. X2.25 (Criterio de Factorización de Fisher-Neyman). si y sólo si la función de verosimilitud de la muestra L(O... T~m) es también un conjunto de estadísticas suficientes. X n .23. T~2) . t m . ..100 CAPÍTULO 2. . .Xn ) constituyen una colección de estadísticas conjuntamente suficientes para O. T2)..

. . . que los estimadores construidos con este procedimiento poseen propiedades especiales que los hacen atractivos. . X 2 .2. . . . esas propiedades van surgiendo con el desarrollo del capítulo. sin pérdida de información respecto al parámetro. X 2 .Xn. valor singular correspondiente a un vector cuyo número de componentes sea inferior a n. CRITERIOS PARA EXAMINAR ESTIMADORES 101 blación Normal de valor esperado JL y varianza (j2. manteniendo intacta la suficiencia.27.n.n). Si T n es una estadística suficiente para e basada en una muestra aleatoria Xl. . La estadística suficiente con menor dimensión y con la máxima reducción de los datos representados por la muestra aleatoria.. n n h(XI. teniendo en cuenta los enunciados de los teoremas 2. . sugiere la noción de estadística suficiente minimal. .2. 2.18. Teorema 2.Xn ) = (Xl. y si T~ es un MLE para e. X 2 . e= (JL. . .Xn ) = 1. y es único.. a la luz de la definición 2. Sin embargo. como lo es también T~2) = (X 1 . Luego ¿ Xi Y ¿ Xl son conjuntamente sufi- i=l i=l cientes para e= (JL.2.Xn .. sin pérdida de información sobre e. En primer lugar. es decir. una estadística suficiente. X 2 .. Sin destacarlas en sec- ción alguna del texto.Xn ) es. el propósito consiste en contar con una estadística que represente la condensación de n datos en uno solo.34. de una población con función de densidad fx(x. ..2. (j2)'. e). un MLE puede ser una estadística sufi- ciente. X2..n. entonces T~ es función de T n . . También son conjuntamente suficientes para e Se anotaba en la parte introductoria del método de máxima verosi- militud. (j2)'.2. .27 y 2. La estadística T~l) = t(Xl.

. n n TI x~! e-nllOnxn TI x~! L(0. .X~)..32.31. O). .. si y sólo si xn = x' n. X n y XL X~. X2...29.XI. . .X2. si y sólo si ellas son función de cualquier otro conjunto de estadísticas suficientes.. . X 2.. cuando Xl.xn ) es función de t(XI.. Ejemplo 2. . si T n es función de cualquier otra estadística sufi- ciente.· . Determinar una estadística suficiente minimal para el parámetro O. X n ) una estadística. . La es- tadística T n = t(X 1 .2. si ella tiene la propiedad tal que el cociente de verosimilitudes L(O.. X 2. X n una muestra aleatoria de una po- blación con función de densidad fx(x.. Teorema 2. X 2. X n es una muestra aleatoria de una población con distribución de Poisson. .X2. O).2. Definición 2. .. .. . .. .2. .. . El cociente de verosimilitudes L(01. . Teorema 2. . Una estadística suficiente T n se denomina sufi- ciente minimal.. . . . .Xn ) i=l = on(xn -XIn) i=l .X2. X~ dos muestras aleatorias de una población con función de densidad fx(x.x~.... . . Una colección de estadísticas conjuntamente sufi- cientes se denomina minimal..X2. X2..2.2.x~..x~. .28.x~. . si y sólo si t(XI. . Xn ) L(O... n _ n L(O.X~) no depende de O..30. X n ) es una estadística suficiente minimal para el parámetro O.102 CAPÍTULO 2. .XI.. si y sólo si T n es una estadística sufi- ciente. Xl.. ESTIMACIÓN PUNTUAL DE PARÁMETROS Definición 2. . Sea Xl.x~) TI Xi! e-nIlOnx'n TI Xi! i=l i=l Este cociente no depende de O.XI. ..xn ) L(OO. .Xn ) = t(x~. Y T n = t(XI. Sean Xl.. . es decir. x n ). X n es una estadística suficiente minimal para O. X2. X 2.x~.

2. CRITERIOS PARA EXAMINAR ESTIMADORES 103 Ejemplo 2. . 2~2 t(Xi .'" .l)s.2.t(Xi . Si T n no es el único MLE para e. a esta familia o a este macromodelo tiene como expresión .JL)2] } Teorema 2. JL)2] = exp {2~2 [t(X~ . por ejemplo.Xl. que agrupan modelos probabilísticos que poseen alguna o algunas ca- racterísticas comunes..33. JL)2 . propuesta por Stacy.n(x . X 2 . "(. {3. es una es- tadística suficiente mini mal. que incluye modelos particu- lares como la distribución Gama. . . e). la denominada distribución Gama generalizada. S~). La estadística (X n . 2. entonces T n es función de una colección minimal de estadísticas conjuntamente suficientes.xn) L(B. la cual es suficiente para el parámetro e = (IL. JL)2 .. Sea T n un MLE para e. X n de una población con función de den- sidad fx(x. Por ejemplo. La razón radica en que el cociente ~ = L(B.x~. x+a y = {3 + "(x + bx2 y siendo y = fx(x) y a.26. ()2) como lo expone el ejemplo 2.JL)2] } = exp {2~2 [(n . La función de densidad que identifica a esta distribución.2. La familia pearsoniana. congrega densidades que satisfacen la ecuación diferencial . la dis- tribución Weibull e incluso la distribución Lognormal entendida como el caso en el cual k -+ oo.x~. la distribución Exponencial.n(xn.34... JL)2 .. entonces existe un estimador máximo- verosímil T~ que es una función de una colección minimal de estadísticas conjuntamente suficientes. b constantes. (n . En otras oportunidades se construye una familia de densidades que se puede entender como un macromodelo puesto que incluye modelos probabilísticos tradicionales como sus casos particulares.2.x~) = exp [2~2 t(X~ . Para propósitos diversos suele constituirse familias de densidades. + n(x' n . l)s~ . .x' n? + n(x' n . estimador basado en una muestra aleatoria Xl.xn)2 . Si T n es el único MLE para e.X2.

-.. " xp)Cj(O) + arO) + b(X1.x2. .. B E e con a.. . C2.2. para b. ESTIMACIÓN PUNTUAL DE PARÁMETROS a f3 ( x ) f3k-1 [( x ) 13] ar(k) -. Ok) dj(x) } . d funciones escogidas convenientemente.. en el estudio de la suficiencia y la completez tiene un singular interés una familia de densidades conocida corrientemente como la familia exponencial de densidades. X2. X2. funczones de Xl. para todo B E e <. que tiene la forma Koopman-Darmois o que pertenece a la clase o fa- milia exponencial p-dimensional de densidades k-paramétrica. k . X 2. dk. .. B) pertenece a la familia exponencial de densidades k-param étri ca.. X 2.2."" x p ya. . .. pertenece a la familia ex- ponencial unidimensional de densidades si la función de densidad fx(x. .35. d 2.xp (Xl. 1(0.104 CAPÍTULO 2.. una función de densidad fx(x.35 detalla.37. B E e <. También particularizando la definición 2. Definición 2. b. a. B) puede expresarse como fx(x. exp [~dj(X1.Xp )' pertenece a la clase o familia p-dimensional de Koopman-Darmois k-paramétrica. . .35.35. . Como caso especial en la definición 2. Esta tendencia a la agrupación de modelos de probabilidad en fami- lias tiene en cada caso propósitos específicos. la función de densidad fx(x..Xp )' un vector aleatorio.2. funciones de B escogidas convenientemente.xp ) se puede expresar como .. si la función de densidad fx 1 . . IR . X p )] . . B) puede expresarse como fx(x. . . . Sea (Xl..2. q. exp . Definición 2. ". Se afir- ma que la función de densidad de (Xl.36.00) (x). x2. como se había mencionado.. .2. B). B) = a(B)b(x)exp[c(B)d(x)]. con x cualquier valor de la variable aleatoria. .. Definición 2. c. X2. dI.. . . f3 y k constantes posi- tivas.. . Concretamente. si fx(x. Ok) b(x )exp {t Cj (0" O2. IR. para todo x. que la definición 2. .2. O) = a (0" O"."" Ck..

. ni al número p de variables aleatorias que constituyen el vector aleatorio.l'~i·}(X)] exp{[lnO][x]} donde a(O) = e-O.. }(x)jx!.38. O) pertenece a la familia exponencial unidimensional de densidades y si Xl.k. 2. la estadística n ¿d(Xd i=l es una estadística suficiente.oo) (x). dj funciones elegidas con- venientemente.oo) (x) = [O]I(o. c(O) = -O.2. Cj. La función de densidad de una variable aleatoria con distribución de Poisson pertenece a la familia exponencial de densidades debido a que OXe-O fx(x. O) = Oe-OXI(o.1. CRITERIOS PARA EXAMINAR ESTIMADORES 105 para todo x. Efectivamente. . y todo O E e ~ JR.oo) (x)exp{[-O][x]} donde a(O) = O.Xn es una muestra aleatoria de una pobla- ción con dicha función de densidad.. . clase o familia exponencial de densidades. X 2. La determinación de k y p será explícita o se podrá deducir del contexto.2.. O) = -. .c(0) = InO. = [e-O] [I{O.I. fx(x. .2.. sin hacer mención al entero k que se refiere al número de componentes del vector O.b(x) = I{O. La función de densidad de una variable aleatoria con distribución Exponencial negativa pertenece a la familia exponencial de densidades.2. . se habla simplemente de clase o familia Koopman-Darmois. d(x) = x. }(x) x..d(x) = x Nota. Ejemplo 2. con a.-I{O. Ejemplo 2. En general. b(x) = I(o. Esta afirmación puede sustentarse utilizando el criterio de factoriza- ción.2. b. Si fx(x.39.

. b(x) = I CO .O) = n//1 /1 \xOl-1(1-x)02-1ICO. 02) = 01 -1.x). d2(X) = In(l.. Nótese que en este caso a(O) = 1/(3(0 1.x)]).···. d 1(x) = lnx. x n) = i[Il b(Xi)' k La estadística ¿ d(Xi ) ha sido denominada por algunos autores como i=l la estadística natural de la familia exponencial unidimensional e igual- mente por las razones de la nota anterior. C2 (0).2. ()) = an(())exp {c(()) i~ d(Xi )} y h(Xl. O) pertenece a la familia exponencial unidimensional de den- sidades. X" ••• . las estadísticas n n n L d1(X L d2(X i ).. . Igualmente. . y en general a la estadística n n ~ d1(Xi ). i ). para efectos de suficiencia.106 CAPÍTULO 2. !x(X.. q(Ol. También al vector 0* = (q (0). O) pertenece a la familia exponencial k-paramétrica de den- sidades.()) = [¡3(():.()2)] [1(0. X2. O) = a(O)b(x)exp{ c(O)d(x)} L(x¡. C2(01..1) (x)] exp{[()l -l][ln(x)] + [()2 -l][ln(l. La función de densidad de una variable aleatoria X 1 fx(x.02).. O) ~ an(O) Úb(xi)exp { c(O) ~ d(Xi) } g C~ d(Xi). Nota. Ck (O))' se le denomina el parámetro natural de la distribución. O2) = O2 .40. ~ dk(Xi ) n)' ( se le conoce como estadística natural k-dimensional para O. con el apoyo del criterio de factorización se deduce que si fx(x. . L dk(X i) i=l i=l i=l . ~ d2(Xi ).l) (x).1. ESTIMACIÓN PUNTUAL DE PARÁMETROS Como fx(x. Ejemplo 2. .. X n. fx(x. En efecto. se le conoce como la estadística natural suficiente de la familia expo- nencial unidimensional. .1)(X) pertenece a la familia exponencial 2-paramétrica de densidades.

Esta propiedad. T n = t(XI. Si específicamente E[Tnl es un valor que no depende de (). T n se denomina estadística auxiliar de primer orden. .. . una muestra aleatoria de una población con función de densidad fx(x. X2. X n una mues- tra aleatoria de una población con función de densidad fx(x. Además se puede demostrar que constituyen una colección minimal. que resalta el anterior teorema.. en el sentido de que una estadística suficiente contiene toda la información respecto al parámetro. Definición 2... no poseer información relativa al parámetro.2. también lo es T~. es menester pre- cisar el término equivalencia y su efecto en la suficiencia. X n ) se denomina estadística auxiliar para el parámetro (). X n ) estadísticas equivalentes. una muestra aleatoria de una población con función de densidad fx(x. se intuye fácilmente porque dado cualquier contorno de la estadística T~ él corresponde al mismo contorno de la estadística T n . . Finalmente. Siendo T~ y T n dos es- tadísticas tales que T~ = t*(X I . .. Entonces la idea contraria a la suficiencia puede formalizarse en la siguiente definición y una utilización particular de ella la precisa el teorema de Basu. Sea Xl. X n ) y T n = t(XI. X 2. (). es un atributo que de alguna manera debe señalarse.2. Siendo . se dice que las dos estadísticas son equivalentes si existe una función 9 uno a uno de tal manera que T~ = g(Tn ). Antes de concluir lo concerniente a la suficiencia.2. X2. CRITERIOS PARA EXAMINAR ESTIMADORES 107 son conjuntamente suficientes para (). Siendo T n = t(X I . X n . existen estadísticas que no contienen dicha información. Teorema 2. debido a la existencia de estadísticas que para efectos de inferencia proporcionan la misma información. . .. X 2. . ...2. . . X n ). X 2. .44 (Teorema de Basu). X2. . . X n ) y T~ = t*(X I ...43. ()).2. X2. . Sea Xl. X 2.. . lo contrario. . ()). . Sea Xl. . X n . . .41. Teorema 2. Igualmente.42.. Sea Xl.. si la suficiencia se asocia con la idea de retención de información. ()). X 2. contrario a lo expresado en esta sección dedicada a la suficiencia. si frn (t) es una función que no depende de ().. 2. Esta propiedad permite construir buenos estimadores a partir de una estadística suficiente. si T n es una es- tadística suficiente para (). . Definición 2. X n .. una muestra aleatoria de una po- blación con función de densidad fx(x.

Por tanto. X 2. 0< t < 1 = P [XI. ejemplo 2. X n ) una estadística suficiente para e..2. pues evidentemente es más preciso aquel estimador que tenga menor varianza. Los estimadores surgidos de esa condición de variabilidad heredan esa misma naturaleza. cuantificarla y en muchos casos mantenerla bajo control son propósitos deseables y además viables.17. ] t." O.Jo Jo e2 e e dx dy = [1 .l)(t) = P [ Xl n Xn'. Ejemplo 2. Cuando se derivaba el estimador por el método de los momentos para el parámetro e bajo el modelo Uniforme en el intervalo (-e. ESTIMACIÓN PUNTUAL DE PARÁMETROS la estadística T n = t(XI .. la función de densidad correspondiente no depende de e. las estadísticas TJI) = XI. un requisito de máxima precisión La variabilidad es en esencia inherente a la estadística. Ejemplo 2.1) (Ji _ ~)n-2 . 2. Entonces T2) y TJ2) son estadísticamente independientes. .2. Siendo Xl. e).l)(t) + I[l. página 82. su razón y su ob- jeto. X2. medida por medio de la varianza.n es una estadística suficiente para e. sólo que para éstos la precisión en su papel de estimar pará- metros es reconocida a través de su variabilidad. .entonces T n Y T~ son variables aleatorias estadística- mente independientes.1.45. entonces X n es una estadística auxiliar de primer orden.n y X nn TJ2) = Xn. .n::. En efecto. . X2. de acuerdo con el teorema de Basu sólo resta mostrar que TJI) es una estadística auxiliar.n son variables aleatorias independientes. Esta sección se enfoca hacia este requisito.. . el método encontró un obstáculo: X n !!.t)n-l] I(o... F T $.(1 . ya que tiene la capacidad de producir estima- ciones más concentradas.'" X n una muestra aleatoria de una población Uniforme en el intervalo (O.oo) (t).46. X n ) una estadística auxiliar para el parámetro e y la estadística T~ = t*(XI.n ::. Como Eo [Xn] = O. e). Allí se afirmó que X n no contenía información sobre e.nl _ rO r ty n(n . Poder conocer su comportamiento. tXn..4 Varianza mínima. . ' Como Xn. se convierte en un criterio de examen de estadísticas.108 CAPÍTULO 2. . Por ello la variabilidad.2.

. e). .. 2.X2. . . . Definición 2. X n de una población con función de densidad fx(x.. e). Ee[T~l = r(e). 3. e).X2. X n una muestra aleatoria de una po- blación con distribución de Bernoulli de parámetro e. X 2. ..Xn ) un estimador insesgado para la imagen de e bajo la función r y T~ = t*(X l . es insesgado de varianza uniformemente mínima UMVUE (Uniformly minimum-variance unbiased) para la imagen de e bajo la función r si y sólo si T~ es un estimador insesgado para la imagen de e bajo r y Ve [T~l :::. T(m)l n entonces. .. . . X n . V¡¡[T~] :::. .. TÁm) = tm(X l .. . Un estimador T~ = t*(X l . Sea Xl. para todo e E e.2. X2. . X 2.2. El proceso de Rao . r : e -----t e* ~ ~. T~ es una estadística. .48. brinda un camino de construcción de un estimador e insesgado para con una varianza menor a la varianza de un estimador insesgado elegido inicialmente. X n una muestra aleatoria de una población con función de densidad fx(x..49 (Teorema de Rao-Blackwell). X 2 .2. se determina la estimación .. ... Sean Xl. r(e) una función de e.. se dice que T n es un estimador uniformemente mejor que T~ si Ve [Tnl :::. ..47.Xn ). las estadísticas T2) = h(Xl . estimadores basados en una muestra aleatoria Xl.. . X n ) cualquier otro estimador insesgado para la imagen de e bajo la función r. . función de estadísticas suficientes solamente. . X n ) un estimador tal que la estimación t~ se deter- mina como t n* -. .. Ve [Tnl sien- do T n = t(X l . Siendo T n Y T~ dos estimadores insesgados para la imagen de e bajo la función r.E e[TT n .. . . A partir de T n = Xl. X 2. X n ) basado en una muestra aleatoria Xl. . . X 2. Ve [T~l.. . .50.Blackwell. de una población con función de densidad fx(x. T(2) Vn IT(l) n . V¡¡[Vn]. CRITERIOS PARA EXAMINAR ESTIMADORES 109 Definición 2.Xn ). . 1..TÁ2) = t2(X l . X 2... . 2. Ejemplo 2. X 2... r(e) una función de e. como un estimador in sesgado para ey de TÁl) = f: Xi i=l una estadística suficiente..2. y siendo la estadística Vn = t(X l ..X2. Teorema 2.2. . X n ) estadísticas conjuntamente suficientes..

f: Xi tI . o)n-tl n-tI n i~ Xi = tI] p.. n . [Xl n = 1 LXi = tI 1 = Po [Xl = 1. [2: -. [Xl t Xi 1 (n: = t1 = O t1 ) +J. i~ Xi = tI] Po Xl = 01 LXi = tI = n - [ i=l Po [2: t=l Xi = tI] Po [Xl = 0.O) .1] t=2 = Po [f: Xi = tI] t=l 0(n-l)ot 1-1(1 . O)(n~I)(O)tl(l_ 0)n-I-t 1 (~)(O)tl(l.110 CAPÍTULO 2. n 1 Po [Xl = O.:---n----=:-----"- i=l Po t=l Xi = tI] Po [Xl = 1.0)n-I-t1+1 t tl-l l (~)Otl (1 ..O) > V[T~l = 0(1 .. (~) En consecuencia.o)n-tl n Luego E.::.. 1 n T*n = -n~ ""' Xi i=l V[Tnl = 0(1 .--. ESTIMACIÓN PUNTUAL DE PARÁMETROS t~ = Eo[TnIT2)l. f: Xi = tI] t=2 Po [f: Xi = tI] ~=l (1..

2. X2.53. {[:O In tx(X. O) = (x-O) 80 -----¡. O) existe para todo x. O)]'} .. X n de una población con función de densidad fx(x. siendo I (O) la información de Fisher acerca del parámetro O en la población. Definición 2. [ (X... en la variable aleatoria X.52. 1 (x_O)2 Ejemplo 2. Si ~ In fx(x.2.¡- 1(0) = E. La información de Fisher acerca del parámetro O en la muestra aleatoria Xl... O) > y para ° todo O E 8 <.2. O) se define como y es equivalente a nI (O). . y para todo O E 8 <.51.o)] . CRITERIOS PARA EXAMINAR ESTIMADORES 111 Definición 2. La información de Fisher acerca del parámetro O en la variable aleatoria X. .-2(x-O) 2(J 8 In f x (x. Sea X una variable aleatoria cuya función de densi- dad fx(x. fx(x.2.O)'] Vf)(X) 1 (J4 (J2 . O).O) = -In(J-lnv27f. IR. también puede definirse como I(O) = -Ef) [::2 Infx(X.. . cuya función de densidad es fx(x. Nota.. O) existe para todo x tal que fx(x.. O) = ícL e-~ con (J conocido. O) es tal que :0 In fx(x.2. [(X . I (O) se define como 1(0) = E. Sea fx(x.~ o)'] = :4 E. la información de Fisher acerca del parámetro O.. V 27W ícL 1 2 Infx(x. lR. O) > 0.

O)dXl dX2 .e)dx 1 . X n ) una estadística. dx n .. Teorema 2. Sea Xl.. . . .O) > O Y para todo OE8~R 2. 3. .. dX n =J.... J t(Xl. Si la variable X que representa a la población es continua :0 J. .. Se habla de un caso regular de estimación o de cumplimiento de condiciones de regularidad cuando el modelo es- cogido para representar el comportamiento de la población y la estadística en consideración cumplen las siguientes condiciones: 1. .. X2. X n ) un estimador para la ima- gen de O bajo la función r y Be(Tn ) el sesgo de T n . Ee [(T . . . x n ) rr i=l fX(Xi. J t(Xl.. Sea Xl. Si la variable X que representa a la población es continua :e j . jITfX(Xi. X2.. ·..e)dX dx j . O) Y T n = t(X l . n = 1 .. análogamente cuando X es discreta. La información de Fisher acerca del parámetro O en la población 1 (O) es finita para todo O E 8. O).· ..112 CAPÍTULO 2. X2. X n una muestra aleatoria de una población con función de densidad f x (x.O) existe para todo x tal que fx(x..54. ESTIMACIÓN PUNTUAL DE PARÁMETROS Definición 2. X2.. r(O) una función de O.2. X 2. O)dXl dX2· . 4.r(0))2] 2': (r'(O) n + B~(Tn))2 nI(O) con B~(Tn) = :oBe(Tn ). . .··· . :0 lnfx(x. dx n. X n una muestra aleatoria de una población con función de densidad fx(x.Xn ) :0 rr 1=1 fX(Xi. j :e ITfX(xi. T n = t(X l ..55 (Desigualdad de Cramer-Rao)..2. .. 1=1 1=1 análogamente cuando X es discreta. . Dentro de un caso regular de estimación.. X2..

nI(O) que corresponde a la versión más difundida entendida como la determi- nación de una cota para la varianza de cualquier estimador insesgado para la imagen de O bajo una función r. cuando y = kX.55 se da cuando En este caso.2.!!. si T n es el esti- mador máximo-verosímil para la imagen de O bajo la función r. La igualdad en el teorema 2. T n es un estimador CAN de manera que vÍn(Tn . El siguiente teorema da fe de ello.2. O) = k(t n . r(O)) . Por tanto. conocida precisamente como la cota de Cramer-Rao. En un caso regular de estimación.56. r(O)). En esta oportunidad se menciona la estimación máximo-verosímil en relación con la consistencia asintóticamente normal. T n es un UMVUE para la imagen de O bajo la función r. E [(~ _ (0))2J = [B~(Tn) + r'(0)]2 B n r nI(O) . ItO)) .2..2. 2. CRITERIOS PARA EXAMINAR ESTIMADORES 113 Dentro de un caso regular de estimación..57. la desigualdad de Cramer- Rao adquiere la versión particular \7¡ (~ ) > (r'(0))2 B n . Corolario 2. si Tn es un estimador inses- gado para la imagen de O bajo una función r. En la desigualdad de Schwarz E[(Xy)2] = E[X 2]E[y2]. N (o. siendo k una constante. como una propiedad particular que en casos especiales presentan los estimadores construidos mediante este procedimiento. cuando existe una constante tal que 8 80 In rr n i=l fx(xi. . Teorema 2.

X n ). 1-X)2} 1..e(l.2.e)l-x 1{o.58.e· Con estos elementos.Xn de una población con función de densidad fx(x.e) ----+ N(O.e) = 7i . . x) In (1 .2.e) 1 e 2(1 .. Pn es un estimador CAN para e. . .e) 2 E e (X . estimadores insesgados para la imagen de e bajo una función r.1} (x) In f X (x. X 2. n Para el modelo de Bernoulli y la estadística ¿ Xi se cumplen las condi- i=l ciones de regularidad.e) ~ N(O.¿ Xi el MLE para e en el caso de n i=l una población de Bernoulli de parámetro e..59..114 CAPÍTULO 2. e(l . Definición 2.e)2 e(l . .e)). . la información de Fisher se puede obtener como sigue: 1(e) = Ee {( e X . entonces fx(x. e) = e X (1. . Esto es y'ii(Pn .e)2 e(l .x ae lnfx(x.e) = e2(1. e).e) a x 1. basados en una muestra aleatoria Xl. .X))2} 1 { 2} Ve(X) = e2(1. e(l . corres- ponde al cociente Ve [T2)] Ve[T~2)] .1. X 2 . La eficiencia relativa de T2) = t2(X I . X 2.Xn ) respecto a T2) = tl(XI . e) = x In e + (1 .e 1 Ee {((1. ESTIMACIÓN PUNTUAL DE PARÁMETROS 1 n Ejemplo 2.e)). Siendo Pn = ..e)x .e)· Luego d y'ii(Pn .

2. T.) '" N (r(o). 9 · ..62. Definición 2. tales que T2) '" N (r(o).. Definición 2. pueden involucrarse elementos adicionales para enriquecer la mencionada comparación. la eficiencia relativa de T. T n se deno- mina estimador eficiente o BR UE (best regular unbiased estimator) para la imagen de O bajo la función r.) respecto a T~l) corresponde a (Ji(O)/n d(O)/m· En estos términos. En un caso regular de estimación la eficiencia de un estimador T n insesgado para la imagen de O bajo una función r se define como Ef (T ) = (r'(O))2 / nI(O) e n Ve [Tn ] .2...2.61. (Ji( O) n cItada efiCIenCIa tenga un valor Igual a uno. t a esta conSI eraClOn e va or e COCIen e (J~(O) se asume en 0 (Ji(O) . . .2. qUIere decir que T. Suponiendo que T~l) y T.). para la imagen de O bajo una función r. como el tamaño de la muestra. (J~O)) asumiendo que (Ji(O) < (J~ (O). caso en el cual (J~ (O) = m· Teniendo en cuenta que (Ji (O) < (J~ (O)... 1 1 d 1 . .) será tan eficiente como T~l) en la medida que la . < 1. si Efe (Tn ) = 1.) sean dos estimadores para la imagen de O bajo una función r.2. o igualmente que a T2) sólo le basta contar con el 90% del tamaño de muestra calculado para T. entonces !!-.) requiere una muestra de un tamaño cercano al 11. si T n un esti- mador insesgado para la imagen de O bajo una función r. Si en gracia m ·d . En un caso regular de estimación. CRITERIOS PARA EXAMINAR ESTIMADORES 115 Siendo la eficiencia relativa un elemento de comparación entre dos estimadores. La eficiencia relativa asintótica de T~2) respecto a T~l).. siendo T2) y T~2) estimadores CAN.11 % mayor que el tamaño de la muestra n calculado con base en el estimador T~l) para tener igual desempeño. es el cociente Definición 2. con varianzas (Ji (O) y (J~ (O) respectivamente.60. (Ji~O)) y T. .

mas no todo UMVUE es BRUE. e) > o.2. e)le E 8} se dice que es una familia de densidades completa. se define como lim Efe (Tn ).2. n--->oo Ejemplo 2. .64. un requisito de la distribución muestral El requerimiento de completez es el menos intuitivo de los requisitos. Sea Xl.2. Definición 2.116 CAPÍTULO 2.e2 n n Luego X n es un BRUE y UMVUE para e. Definición 2.65. En un caso regular de estimación. ESTIMACIÓN PUNTUAL DE PARÁMETROS Nota. la eficiencia asintótica de un estimador T n insesgado para la imagen de e bajo una función r. 2. entonces 2 E[X n ] = e V[X n ] = en de donde 1 e2 -1 . V[X] = e2 . se adapta y configura una formalidad que puede clasificarse como un requisito referente a la familia de densidades correspondiente a la distribución muestral de la estadística en examen.'" . Todo BRUE es un UMVUE. l(e) = ¡}Z. si para todo e E 8.5 Completez. Tomado del análisis funcional.2.63.Xn una muestra aleatoria de una po- blación con función de densidad fx (x. la condición Ee[z(X)] = O implica que Pe[z(X) = O] = 1 para todo x tal que fx(x. y que X n es MLE para e. en lo concerniente a un conjunto com- pleto de elementos de un espacio de Hilbert. n¡p _ ~ = 1 Efe (X n ) = --0'2 .00) ( ) x . e) = 1 ee _lx IJ 1(0. Teniendo en cuenta que E[X] = e. La familia de densidades {fx(x. X2.

. X n es una muestra aleatoria de una población con distribución de Bernoulli de parámetro e..2. n. . X n ) una estadística.9)" 0= t j=O z(j) (~)aj.··. X 2 . Ejemplo 2.. X 2 .67.e)n-Xe XI e E (0. .) (i .. Eo[z(X)] = implica que z(j) = 0. e) = (:) (1 . = z(n) = ° ° Entonces.e)n-j J e~ oY j=o O ~ ~Z(j)(. 2. . puesto que si Eo[z(X)] = ° 0= t z(j) (~) ej (1 .2... . la familia de densidades Binomial es completa. Si Xl.1.2. Tn se dice que es una estadística completa para el parámetro e si la función de densidad fTn (t) pertenece a una familia de densidades completa. Ejemplo 2.1) } es una familia de densidades completa. .66. e) y T n = t(XI. para j = 0. La familia de densidades {fx(x.2. X n una muestra aleatoria de una población con función de densidad fx(x. CRITERIOS PARA EXAMINAR ESTIMADORES 117 Definición 2. la estadística n . Por tanto. J (a= l~e) luego y la única forma de tener esta igualdad es cuando z(O) = z(l) = ..68. X 2 .2.. . Sea Xl..

la función de densidad del máximo de la muestra es fXn.CXJ)(Y) = (jyI(o.n (y) = n[Fx(y)]n-1 fx(Y) 1 ] n-l 1 = n [ (jY (j I(o.70. para todo e > 0.2. e). En efecto. . e) = ~e-ix I(o.CXJ) (y). e). entonces n la estadística ¿ Xi es completa.l = 0. = en Partiendo de la condición fO n Eo [z(Y)] = Jo z(y) en yn-Idy = ° fO en Jo z(y)yn-Idy = ° n = y utilizando el teorema fundamental del cálculo se obtiene que z(e)e n. . .2..118 CAPÍTULO 2. como fY 1 1 Fx(y) = Jo (jdx+I(O. Si Xl. La familia de densidades {fx(x.n es una estadística completa para e. Eo[z(X)] = °= JofCXJ (jz(t)e-{jtdt 1 1 . ESTIMACIÓN PUNTUAL DE PARÁMETROS n es una estadística completa para e.o) (y) n yn-l I(o.Xn es una muestra aleatoria de una po- blación Uniforme en el intervalo (O.o) ( y ) . ¿ Xi rv Bin(n. ° porque Eo[z(X)] = implica que z(y) = para < y < e. con lo cual se concluye que Xn.69. En efecto. Xn. i=l Ejemplo 2. es decir z(e) = 0.CXJ) (x) le> °} es una familia completa. como i=l se confirmó que la familia de densidades Binomial es completa.n es una estadística completa para e. ° ° Ejemplo 2. X2.o)(y) + I(o.

73 (Teorema de Lehmann-Scheffé). Por ello. realmente su importancia radica en este hecho. a priori no es fácil intuir su sentido ni tampoco comprender su inclusión dentro de una lista de requisitos. Si T n es una estadística completa para B.1n or·znsesga do para l a .72. . X n ) un estimador insesgado para la imagen de B bajo la función r. r(B) una función del parámetro B y T n = t(X l . X n una muestra aleatoria de una población con función de densidad f x (x. B) y r una función de B.. . T~m) = tm(X l .. B). función de densidad que pertenece a la familia exponencial de densidades.. X2. . i=l El concepto de completez no dispone de la autonomía de otros requi- sitos en el proceso de facultar estadísticas. Teorema 2.. . . La familia exponencial de densidades ha mostrado un conjunto de propiedades interesantes.2. Sea Xl.Xn ). B E e. X 2. . .. la estadística natural n de la familia ¿ d(Xi ) es una estadística suficiente y completa para B. X2. Sea Xl... X 2. . . .. es obligatoria para la sustentación de uno de los argumentos de la de- mostración del mismo. X 2.. B). X n una muestra aleatoria de una po- blación con función de densidad fx(x.. . X 2. Se puede afirmar que la completez es un requisito indirecto para el exa- men o mejoramiento de la precisión de un estimador. CRITERIOS PARA EXAMINAR ESTIMADORES 119 expresión que corresponde a la transformada de Laplace de una función z(t) con B > O. 2.2.. X 2 .71. T*n = t*('7"'(l) 1n. .2. La integración de la completez al conjunto de requerimien- tos responde a que su participación en la configuración de un UMVUE..Xn ). . . participación expresa en el enunciado del teorema de Lehmann-Scheffé. .. Teorema 2. •. entonces z debe ser la función nula. . . . entonces T n es el único estimador insesgado de la imagen de B bajo la función r. Si las estadísticas T2) = tI (Xl. Como exordio al valioso teorema de Lehmann-Scheffé y como argu- mento en su demostración se presenta el siguiente teorema.1n '7"'(m)) es un es t·zma d '7"'(2) . T~2) = t2(X l . .2. El siguiente teorema amplía ese conjunto in- cluyendo una propiedad adicional que integra la suficiencia y la com- pletez en esta familia. Sea Xl. X n ) constituyen una colección de estadísticas conjuntamente suficientes y completas para B y SZ. Si esta transformación es cero para todo B > O. Teorema 2. .. X n una muestra aleatoria de una población con función de densidad f x (x. .

2. porque Eo [I{o}(X 1 )] = 0. En virtud de estos resultados y con el auxilio del teorema del Lehmann- Scheffé. donde e-o = P[X = O]. I{o}(X 1 ) es un estimador insesgado para e-o. Sea X 1 . ESTIMACIÓN PUNTUAL DE PARÁMETROS imagen de e bajo la función r. 3.71. Ejemplo 2. n LXi i=l es una estadística suficiente y completa para e.2. Ee [1{O} (Xl) I i~ Xi] es una estimación insesgada función de i~ Xi. si el interés se centra en estimar la imagen de bajo la e función r(e) = e-e. 1.X2. teniendo en cuenta lo siguiente: 1.P[X1 = O] = e-o..P[X1 2: 1] + 1. Por otra parte. entonces T~ es UMVUE para la imagen de e bajo la función r. esta última suficiente y i=l completa para e.2. . X n es una función de la estadística ¿ Xi. X n es UMVUE para e. Esta afirmación es cierta. tal como lo garan- tiza el teorema 2.. n 2. .Xn una muestra aleatoria de una po- blación con distribución de Poisson de parámetro e. el proceso de determinar un estimador UMVUE para e-o requiere algunos pasos especiales. X n es UMVUE para e. . Por tanto.74. X n es un estimador insesgado para e.120 CAPÍTULO 2. La familia de densidades a la cual pertenece la densidad de Poisson es una familia exponencial de densidades.

n Si y = ¿ Xi. ~=2 t Xi = t] p()[X I = OlP() [i~ Xi = t] p() [t ~=l Xi = t] Como Xi "-' Poiss(B). luego Y "-' Poiss((n .2. My(t) = e(n-l)()(et-l). [I¡O¡(X¡) 1 ~Xi] ~ O· P. .1)()). [Xl"" 11 ~Xi ~ t] + 1· p() [Xl = 01 tX = t]. . Mz(t) = en()(et-l) .. i=l por tanto. n. . n n] Entonces E() [I{o} (Xl) I i~ Xi = (n. i=2 n Si Z = ¿ Xi.:l ¿ )i=l Xi .. CRITERIOS PARA EXAMINAR ESTIMADORES 121 conforme al teorema de Rao-Blackwel (2. 2..49). ~=l i p() [Xl = O.2. significa que Z "-' Poiss(nB).luego la estadística ( n: 1 ) n ¿ i=l Xi es un estimador insesgado función de una estadística suficiente y completa. E. i = 1. entonces M Xi (t) = e()(et-l).2. por tanto es UMVUE para e-().

_ _ entn-1e-(}tdt t f(n) i=l = c -1. X n es una función de LXi. entonces LXi i=l E(} [~l i~ = e= Xi [~] eE ' T - .2.100 e nt n. n 2.122 CAPÍTULO 2. e) = ee-(}x 1(0.du (utilizando la sustitución u = et) cef(n . 1 e. por tanto.00) (x).e Joroo t1 h(t)dt. LXi i=l es una estadística suficiente y completa para e. .1 . Determinar un UMVUE para e cuando el modelo asumido para representar la población es un modelo Exponencial nega- tivo fx(x. X n es un UMVUE para e· El estimador para e se intuye como ~ con c constante. se tiene que E(}[~l 100 LXi =c o 1 1 .2 e-(}tdt r(n) o ce roo = f(n) Jo u n - 2 u e. el cual es una estadística fun- LXi i=l ción de una estadística suficiente y completa. T= n LXi. es UMVUE para el parámetro e. Por ser insesgado para e. X n es un estimador insesgado para i=l 1 -. fx(x.1 Un estimador insesgado para e es : . i=l Como la suma de variables aleatorias con distribución exponencial es una variable aleatoria con distribución Gama. e) pertenece a la familia exponencial de densidades. ESTIMACIÓN PUNTUAL DE PARÁMETROS Ejemplo 2. n 1.1) ce n>l r(n) n.75.

que se presentan en la sección 2. un estimador T n basado en una muestra aleato- ria Xl. X2. de manera separada por razones académicas. término acuñado por Box. los criterios más conocidos para facultar estadísticas como estimadores de paráme- tros. la realización de una actividad de síntesis conceptual integradora de los requisitos exigibles a los esti- madores. si su desempeño per- manece inalterado ante discrepancias con el modelo original. adquiere un destacado interés cuando no existe plena afinidad entre el comportamiento global e individual de las observaciones de la muestra y el modelo postulado como modelo original de las observaciones. Particularmente. o cuando no hay coherencia total con los supuestos admitidos. recibe la denominación de estimador robusto. es decir que sean robustos. es en sí una propiedad deseable. El modelo define un ambiente y bajo él. O). Este requisito.76. un requisito de estabilidad Este capítulo cierra con una breve exposición de un requisito denomi- nado robustez. de una población con función de densidad fx(x. como igualmente es impreciso el alejamiento del modelo o de los supuestos y como también lo es el no cumplimien- to de los supuestos. 2. . le resta entonces al lector. pero cuya idea ya había sido expresada mucho antes por Pearson. Un procedimiento o método estadístico se denomina robusto. con el apoyo de los ejercicios propuestos y de los que encuentre en otros textos. Definición 2. respaldada por los enunciados de los teoremas incluidos y por los argumentos que los garantizan. CRITERIOS PARA EXAMINAR ESTIMADORES 123 Expuestos.3. valores insólitos bajo el modelo original. Que el desempeño de un estimador o el de un método estadístico sean inalterables frente a ligeras discordancias con el modelo o con los supuestos. .2.2. .6 Robustez. en ciertas opor- tunidades exigible a algunos estimadores y en forma general a algunos procedimientos estadísticos. El alejamiento de un modelo puede tener varias facetas: presencia de outliers. si su desempeño es imperturbable a ligeras discordancias del modelo original o de los supuestos asumidos con la información acopia- da. X n .2.. 2. Los requisitos presentados en el desarrollo de este capítulo de ninguna manera controvierten la afinidad o incompatibilidad entre las observaciones de la muestra y el modelo original.. una estadística exhibe sus atributos y desatinos en la misión de ser un estimador del parámetro característico del modelo. Sin embargo es un criterio vago porque es imprecisa la expresión de- sempeño del estimador.

Definición 2. ante la presencia de discrepancias con el modelo puede menoscabarse su idoneidad. una de ellas en forma particular a través de la contaminación. y las discrepancias con el modelo motivan la consideración de una nueva función de densidad para la variable aleatoria X. El no cumplimiento de los supuestos. O) + Eg(X) elegida g(x) de manera que sea la responsable de generar los valores insólitos. O) = (1 . Las discrepancias con el modelo se pueden teorizar de variadas for- mas. O) = L EjfX (x). j=l j=l Concretamente. si la función de densidad del modelo original es fx(x. si su función de densidad f Xc (x. la homoscedasticidad.. podría ser taxativo: no se cumplen unas condiciones sobre las cuales un procedimiento estadístico se ha estructurado. O) es un combinación lineal de dos o más funciones de densidad. por su parte. menos afectada por dichos valores.124 CAPÍTULO 2. ESTIMACIÓN PUNTUAL DE PARÁMETROS discrepancias en la forma de la densidad. o de remplazarlos . O). de la forma fxc(x. sólo que dentro del contexto del capítulo se desea en un sentido destacar uno basado en la idea de excluir valores extremos. En general. j siendo L Ej = l. valor espe- rado de una variable aleatoria. X 2 . O). Esa falta de robustez de la media de la muestra ha sido paliada por elimi- nación de los valores más extremos. Una variable aleatoria Xc se dice que es una va- riable aleatoria contaminada. X n . más allá de la definición clara y precisa de igualdad de varianzas.E)fx(x. X n posee propiedades inmejorables. ¿pero en qué medida no se cumplen los supuestos? Por ejemplo. entonces X n es altamente sensible frente a las discrepancias citadas. bajo el modelo original cuya función de densidad es fx(x. como el apuntamiento y la simetría entre otras.. O). propiedades válidas únicamente bajo la re- gencia del modelo adoptado. ¿cuándo k poblaciones no tienen la misma variabilidad? Suponiendo que se desea estimar el promedio poblacional. en cuyo caso se hablaría de la no robustez del estimador. son varios los mecanismos de enfrentar la no robustez.77. de una población con fun- ción de densidad fx(x. . . basado en una muestra aleatoria Xl. k k fxc(x. y que asumido el modelo original. o por la utilización de la mediana de la muestra. que el estimador elegido es X n.2.

7. e). y luego considera el promedio aritmético de estas n variables como lo indica su expresión n-[na] } wXn. CRITERIOS PARA EXAMINAR ESTIMADORES 125 para eliminar los outliers o amortiguar su efecto: los estimadores L y en otro sentido hacer una ligera mención de los estimadores M.Xn.a = n _ 2[na] ~ Xi.2[na] estadísticas de orden centrales.2. el mínimo y el máximo de la muestra. Un a-promedio recortado es el promedio aritmético de las n ..n + L Xi. . de una población con función de densidad fx(x. se elimina la fracción a de las observaciones inferiores de la muestra e igualmente se elimina la fracción a de las observaciones superiores de la muestra.n. Definición 2.n. i = 1. O < a < ~. el promedio. Sea Xl. X 2 . i=[na]+l Por otra parte.n. 2.n + [na]Xn-[na].n están determinados.i. es decir. Son ejemplos de estimadores L.78. .n y Xn-[na].. en iXi .•.n . los promedios recortados y los promedios "windsorizados".a = ~ { [na]X[na]+l. Un estimador L para e es una estadística de la forma n Tn = "" ~. basado en una muestra aleato- ria Xl. una muestra ordenada de una población con función de densidad fx(x. . con O < a < ~. Su expresión corresponde a n-[na] -X 1 "" r n. i=[na] +1 Un a-promedio windsorizado no elimina la fracción a de las obser- vaciones inferiores ni de las observaciones superiores de la muestra. X 2 . .2.n. pero deben destacarse. sino que remplaza cada una de ellas por las estadísticas de orden X[na]+l. X n . 2El concepto de parámetro de localización puede consultarse en la definición 3. e). . e un pará- metro de localización2 . respondiendo a esta idea de ex- clusión o remplazo de valores extremos.2a se determina el promedio aritmético que justamente se adjetiva como recortado. .2.n i=l donde los coeficientes Cn.2. .. respectivamente. un estimador M para e.n.. y con la restante fracción de observaciones 1 . e E e ~ ]R.

o es un estimador que es solución de la ecuación n Lh(Xi . entonces r(Tn ) es el estimador máximo- verosímil de la imagen de e bajo la función r. Xl.Xn consti- tuyen una muestra aleatoria de una población con función de densidad fx(x. Como casos especiales se pueden construir estimadores M correspon- dientes a los estimadores máximo-verosímiles tomando h(x. x n ) tiene e máximo en el punto = tn. estimadores muy corrientes en los modelos lineales y en el diseño experimental. de los cuales se destacan el jackknifing y el boostraping. asumiendo que la función r(e) = e* es una función uno a uno. i=l igualmente para una función h predeterminada. equivale a afirmar que ella tiene máximo en .:t In fx(x.. y si r(e) es una función uno a uno. t) = 0. e E e.. Como la función de verosimilitud L(e.X2. T n = t(X 1 . Si las variables aleatorias X 1 . consistentes en pocas palabras en la utilización sistemática de todas las posibles submuestras obtenidas removiendo observaciones de la muestra original y calculando la estimación correspondiente. X 2. e). . . entonces e = r~l(e*). Finalmente... conocidos como métodos de remuestreo.3 Demostración de los teoremas Teorema 2. Entonces el estimador M está dependiendo de una elección de una función H o h según el fin. En primer lugar. . ESTIMACIÓN PUNTUAL DE PARÁMETROS es un estimador que minimiza la suma n LH(Xi . es pertinente señalar que en la actualidad se utilizan procedimientos de mejoramiento de estimadores.1. t) = .12. t) i=l siendo H una función predeterminada.. con dominio e y recorrido e*. t) = (x . e ~ ]R. Demostración. 2. .t)2. X n ) un MLE de e. procedimientos que re- quieren extenso uso de cómputo estadístico. . .126 CAPÍTULO 2. e) como también construir estimadores M corres- pondientes a los denominados estimadores de mínimos cuadrados tomando H(x. . X2.

DEMOSTRACIÓN DE LOS TEOREMAS 127 el punto r-I(O*) = tn. x n ) precisamente O = tn' En conclusión. X2. Como se afirmó.lr = E [(X . el MLE de 0* = r(O) es r(Tn ).-X n )r -1 '~ p --+ J.l2r = E [x2r] . Xl. ~ t (Xi .15.j . .lr· n i=l Demostración. el MLE de 0* es r(Tn ). . 2. Igualmente. en 0* = r(t n ). n " ( Xi . Utilizando el teorema binomial se logra dicho propósito. De esta manera.. uno de ellos hace máxima a L(O.1. J. . Sea Xl. r = 1.2.3. . En segundo lugar. .X n)" ~ ~ t~ G)Xi(-XnY J ~ ~ [~t G)X!(-Xnr-'] = i)-Xnr-jG)~tX1 )=0 z=l = t j=O (~) J (Mj)j (-Xnr. el momento muestral central de orden r puede expresarse en términos de los momentos muestrales ordinarios de menor orden. es decir. . D Teorema 2.. si la función r( O) no es una función uno a uno. cualquiera sea el caso.. de menor orden. la función de vero- similitud tiene máximo en el punto 0= tn' Varios valores de O tienen co- mo imagen a 0* = r(t n ). O). .l Yl puede expresarse en términos de los momentos ordinarios.J. el principio de invarianza se mantiene. Como preparación a la demostración. Existiendo el momento J. X n una muestra aleatoria de una población con función de densidad fx(x. X2.. . hay que tener pre- sente que el momento central de orden r.

X2. X2. x n ). con lo cual Pe [Tn = tl = ¿ L(e. . Teorema 2.. las ideas y los argu- mentos utilizados son similares en los dos casos. Se considera únicamente el caso discreto.X2.. X2. X2. .Xn = xnl = fx(xI. s ::.. X 2 .l~.l2r existe. e) . se denota como A(t). Xn ). T n = t(X I .128 CAPÍTULO 2. . ella es suficiente para e.. Pe [Xl = Xl. . garantizan que Mr = t (~) j=O J (Mj)j (-xny-j p ) t (~) j=O J (f.. X n constituyen una muestra aleatoria.. . se supone la suficiencia de la estadística para concluir que la función de verosimilitud se puede expresar como el producto de factores en la forma indicada. que depende de e y de Xl. llamado un entorno de Tn . si y sólo si la fun- ción de verosimilitud de la muestra puede expresarse como el producto de dos factores: L(e. ..···.lj)j (-f. X2. . no negativa.. la segunda parte se desarrolla en sentido contrario.3.. ·..Xn ).6.ly-j. . .2.··. e) = L(e. X2. ESTIMACIÓN PUNTUAL DE PARÁMETROS Como el momento f. Sea Xl.· .17 Este teorema coincide con el teorema 1.2. porque el caso continuo requiere consideraciones adicionales. Xn y la función g. X2. . X 2 .XI. Siendo una estadística. .· . x n ) tales que t(XI. .. fx(x n . En primer lugar.7 y 1. La demostración se realizará en dos sentidos.2.. como Xl. vista la estadística de orden X[npJ+l. Xl.. Xl. Xn )..Xn ) = g(t(XI. D Teorema 2. e)h(XI. . Para efectos de notación. A(t) .. .4. 2r existen. e).ls Y f. Demostración. .. Xn a través de t(XI. . .Xn ) siendo h una función no negativa que depende exclusivamente de Xl.. sin embargo. al conjunto de valores (Xl. . los momentos f. X n una muestra aleatoria de una población con función de densidad fx(x.··· . x n ) = t.···. Los teoremas 1. . X2. X2. .x n ).n como estimador de x p. X2 = X2.21. e)fx(x2. Antes de abordar la demostración. X2.2.

X 2 = X2.xn)g(t. o o o . e)h(X1. X n ) constituye una colección de estadísticas con- o o o.X n ) ¿: h(X1.X2. porque únicamente depende de los valores particulares Xl.XI. Xl. Xn ) = g(t.e)h(X1. X2. Por otra parte. e).Xn ) A(t) g(t.e) g(t. A(t) entonces Pe [Xl = Xl. Xn ) Pe[Tn = t] ¿: L(e. o o o. o o o . X 2 = X2. X2.X 2 = X2. probabilidad que puede denotarse como h(X1.X2. la probabilidad Pe [Tn = t] al depender del valor t y de e puede denotarse como g(t. se parte del supuesto de que T n es una estadística suficiente para e es decir que Pe [Xl = X1. 2. g(t.e) ¿: h(X1. X2. como se había manifestado.2.Xn ) .X2. e)h(X1. o o o.Xn ) A(t) expresión que no depende del parámetro eo D Teorema 2.Xn = xnlTn = t] no depende de e. Xn ) = L puede expresarse como o o o.Xn = Xn] o o o L(e.X n )g(t.X2.000. o o o . DEMOSTRACIÓN DE LOS TEOREMAS 129 En primer término.000. con lo cual L(B.000. x n ).250 Sea Xl. o o o. o o o. X2.X2 = X2. X2. juntamente suficientes para e.0 oo.Xn = x n ] = Po [Xl = Xl.X2.0 OO.3. si y sólo si la función de verosimilitud de la muestra L(e.Xn = xnlTn = t] = ~ ~ = Pe[X1 = X1. o o o. Xno o o o. partiendo del supuesto de que L(e. o o o .X 2 = X2.B)0 En segundo término. . X2.000. X n = xnlTn = t] = O) Pe [Xl = X1. X n = xnlTn = t] Po[Tn = t] = h(XI.X2. e)o El conjunto de estadísticas T n(1) h(X 1. X2.000. T n(2) t2(X 1. o o o. población con función de densidad fx(x. o o o . Xn ) o o o .X2. ¿: h(X1. o o o.X 2 = X2. Xn ) o o o . Xl. Xl. X2. . Xn ) y considerando un valor particular t (obviamente si (Xl.x n ) = Po [Xl = XI. X2. X2.X2. Xl. X n una muestra aleatoria de una o o o. T~m) = t m (X 1. X2.000 .X n ) A(t) A(t) h(X1. X2. Xn ) rj:.Xn ).

. X2.2. y T n(1) tl(X 1.. X n ) estadísticas conjuntamente suficientes. X n . .. de una población con función de densidad fx(x. . x n ).. ..tm (XI...X2. X2. Xn ) = g(t(XI....T~2) =t2. para el caso de una estadística suficiente unidimensional.Xn ) = t2. X n ) un estimador insesgado para la imagen de e bajo la función r y T~ = t*(X I . T(2) n . . X n ).. x n )).. y es único. t2. X 2. En el caso de ser T~ = t*(X I . .. . entonces e = t* hace máxima a L y por supuesto a g(t(XI.X2. ESTIMACIÓN PUNTUAL DE PARÁMETROS La función h es una función no negativa que depende de Xl. el único MLE de e. X 2. X2. A(t) El desarrollo de la demostración con base en estos elementos es el mismo que se realizó para el caso de una estadística suficiente unidimensional. . . Demostración. Xn )). T(m)] n ..· .. Si T n es una estadística suficiente para e basada en una muestra aleatoria Xl. X2. 'X n ). . Xn a través de tI. . . . .. el conjunto A( t) que para este caso se re- fiere al conjunto de valores (XI. .··· . .. .X2. . . ..Xn ) = t m Y t corresponde al vector t = (tI.. . X 2.X2.. Siendo Xl. . X 2... .2. . . X n ) un estimador tal que la estimación t~ se determina como t n* -.. .. entonces. . La demostración de este teorema es muy similar a la del teorema que hace referencia al criterio de factorización de Fisher- Neyman. Xl.. según el criterio de factorización de Fisher-Neyman.Xn ). con tl(XI. .X2.. T~m) = tm(X I . O Teorema 2.27. e).. .T~m) =tm] =Po[T=t] = LL(B..49...130 CAPÍTULO 2.. . t m )'. . . t2(X1. Xn exclusivamente y g una función no negativa que depende de e y de Xl. .. .Xl.· ..···. t m · Demostración.X2. e) y si T~ es un MLE para e.X2.. .. X2.Xn ).. y siendo la estadística Vn = t(X I . e)h(XI. .Xn ). luego t* es una función de t(XI. . X2.Xn ) = tI. L(e.. E () [TT Vn IT(l) n . . . .. con lo cual Po [T~l) =tl. . ... r(e) una función de e. X2.. . T~m»)'. X n una muestra aleatoria de una población con función de densidad fx(x.. . t2... O Teorema 2. Siendo T n una estadística suficiente para e.xn ). X 2. T n(2) t2 ( X I . Para esta demostración se introducen algunos elementos como el vec- tor T = (T2). .. .. . . entonces T~ es función de T n .X2' . . T2) .

Respecto al punto 2.T~m) una colección de estadísticas conjuntamente suficientes. T~2).3. Demostración. para facilitar la notación. 2. es una estadística suficiente por ser función únicamente de esa colección. tn). cuya función de densidad es fr(t). . . t)dV n ] dtIdt2··· dt m . . El valor esperado EO[VnIT] = c(t) es una función que depende únicamente de los valores particulares de t. .. la colección de estadísticas conjuntamente sufi- cientes se dispone en el vector aleatorio T = (T~I). . .T(V n .. t2. porque J~oo VnfVn. el caso discreto es similar. Como el objeto es concluir que Eo [Eo [VnIT~I). T~m)]] = r(B).. DEMOSTRACIÓN DE LOS TEOREMAS 131 entonces. Eo[T~] = r(B). afirmar que T~ es una estadística función de estadísticas suficientes solamente. T~2). siendo t = (tI. debido a su construcción T~. función de estadísticas suficientes solamente. Respecto al punto 1.. es consecuencia del hecho de ser T~I). . . t)dv n = C(t)fT(t). T~m))'. 2.T(V n .. 1. Eo [Eo [VnI T ]] = Eo [c(T)] = 1:1:···1: c(t)fr(t)dh dt 2··· dt m = 1:1:···1: [1: VnfVn.. T~ es una estadística. se considera sólo el caso en el cual la variable aleatoria que representa a la población es una variable continua. T~2).. intercambiando apropiada- . .

i: [¡: c(t) (vn .T(V n . t)dVn] dtldt2'" dtm i: (vn .c(t))fVn. puesto que E()[c(T)] = r(O) y 2E() [(Vn .T(Vn.fVn.c(T))] = O.r(O))] = O. t)dvn = i: VnfVn.i: i: c(t)(vn . dt m = fVn(v n ).c(T))2] + V()[c(T)] y teniendo en cuenta que E() [(Vn . porque J~'" J~(x.r(O))] = O. como se deduce a continuación. . c(T))2] ~ O. E() [(Vn . así V()[Vn] = E() [(Vn . . E() [(Vn .c(T))] = ~ ~= i: i: .c(T))(c(T) . Regresando al paso en el cual se enunció que V()[Vn] = E() [(Vn .r(()))2] = E() [(Vn . se parte de la conocida adición de un cero. t)dvn = C(t)fT(t) . ESTIMACIÓN PUNTUAL DE PARÁMETROS mente el orden de integración se tiene que E() [E()[VnI T ]] = i: i:'" i: Vn fVn.T(V n .r(()))] = E() [Vnc(T)].r(O))2] = E() [(Vn .T(Vn.T(Vn. t) dt l dt 2'" dtmdv n = i: vnfvn(vn)dvn = E[Vn] = r( ()).T(Vn. Para concluir el desarrollo de lo pertinente al punto 3. t)dvn .c(t))fVn.c(T))(c(T) .c(T))2] + E() [(c(T) .c(T))2] + V()[c(T)].r 2(()) .c(t) i: fVn.c(T))(c(T) .132 CAPÍTULO 2.r(O))2] = E() [(Vn . t) dt l dt 2" .E() [c 2(T) + r 2 (())] = E() [c(T)(Vn .c(t))fVn.c(T) + c(T) .C(t)fT(t) = O Por tanto ~ = E() [c(T)(Vn . t)dvndtldt2'" dtm = i: i: . .T(Vn.

Antes de continuar. . e) ) . D Teorema 2. Ve[Vn]. porque d~ lng(x) = ~(~}.B)) dXl···dx n · Tratándose de un caso regular de estimación. 1: t(Xl. es necesario demostrar que . Dentro de un caso regular de estimación. Ve[Vn] o Ve [Ee [VnIT]] ::. . .55. E [(T _ (e))2] > (r'(e) + B~(Tn))2 e n r . X 2. DEMOSTRACIÓN DE LOS TEOREMAS 133 entonces Ve[c(T)] ::. . e) )(n f X (Xi. En síntesis.. Esta demostración parte de la definición de sesgo y uti- liza las condiciones de regularidad como argumentos para su desarrollo. X 2.2. con B~(Tn) = :eBe(Tn). e) puesto que 8e = (8 i!:I i!:JI 8e In n f x (Xi.3.··· . T n = t(X I . Sea Xl. Dado que Be(Tn ) = Ee(Tn ) . X n ) un estimador para la imagen de e bajo la función r y Be(Tn ) el sesgo de T n . y por tanto. r(e) una función del pa- rámetro e. e). siendo IJI 8 n f x (Xi. g'(x) = (d~ lng(x)) g(x). . :eBe(Tn) + r'(e) = ~. 2. X n una muestra aleatoria de una población con función de densidad fx(x.r(e).xn ) (gfX(Xi. . Demostración. B(}(Tn ) + r(B) = E(}(Tn ) = 1:1: . .. nI(e) .

1 00 con s > lo j=l J Una variable aleatoria X se dice que tiene distribución Zeta con parámetro O.1)] 2 si O > 3. k = 1.00) (x). }(x) en cuyo caso E [X k ] = (~(~)k). o que tiene distribución de Zipf (en honor a George Zipf). ((O) ((O) Explore la forma de estimar puntualmente el parámetro O. con distribución de Pareto es 020~2 fx(x.2) _ [((O .2. ESTIMACIÓN PUNTUAL DE PARÁMETROS aleatoria X. está cons- truido con base en la función zeta de Riemann.. O > 0. si su función de densidad es 1 fx(x.. asumiendo conocido o fijo el valor de O2 . E[X]= ((O) s10>2 V[X] = ((O .. ¿Cuál es el MLE para O? Asumiendo conocido o fijo el valor de 0 1 . muy conocido por sus múltiples aplica- ciones. ¿cuál es el MLE para 0 2 ? ¿ Cuál es el estimador por el método de los momentos para 02? ¿Es procedente la construcción de un estimador por analogía para 02 ? De la misma manera. O2 > O. O2 ).. con O > k + 1. El modelo de Poisson.136 CAPÍTULO 2. utilizado particularmente en lingüística. O) = xO((O) 1{1. O) = x 02 +l 1(01. los componentes del parámetro O = (0 1 . Particu- larmente ((O -1) . incluye una constante O que corresponde tanto al centro de gravedad de la función de densidad de una variable aleatoria regido por este modelo como la cuantificación de la dispersión de la .2. son tales que 01 > 0. . ¿cuál es el MLE para 01? ¿Cuál es el estimador por el método de los momentos para 01 ? ¿Es factible determinar un estimador por analogía para 01 ? 3. función definida como (( s) = L ~. 4. . El modelo Zeta.

¿Cuál es el MLE para e? Cuando se asume conocido o fijo el valor de el. x. }(x). Las dos constantes que intervienen en la naturaleza del modelo. 2. Recordando que la función de densidad de una variable aleatoria X. ¿cuál es el MLE . ¿cuál es el MLE para e? ¿Cuál es el estimador por el método de los momentos para ()? ¿Cuál es el estimador por analogía para e? 5.. . ( 2 ) son tales que el E IR.e) = . dado el caso en el que se asuma conocido o fijo el valor de e2 .. El modelo Gama realmente es una familia de modelos.e-o¡{0. Es necesario diferenciar las formas como se deben estimar las dos constantes que participan en el modelo. (2) son tales que el > o. con distribución gaussiana es 1 (x-01 )2 fx( x e) = e. Señalando que la función de densidad de una variable aleatoria X.U _ eg 01- ( ll) -r(edx 1 1 -02 X ¡ e (0. siendo e > o.1. ¿Cuál es el MLE para e? Para el caso particular en el que se asuma conocido o fijo el valor de el. ¿cuál es el MLE para el? ¿Cuál es el estimador por el método de los momentos para el? ¿ Cuál es el estimador por analogía para el? 6. usualmente llamadas parámetro de forma y parámetro de escala. ¿cuál es el MLE para e2? ¿Cuál es el estimador por el método de los momentos para e2 ? ¿Cuál es el estimador por analogía para e2 ? Del mismo modo. los componentes del parámetro e = (el.00) () x. se pueden estimar de varias maneras. e2 > O.2. 2°2 'y'27re2 ' los componentes del parámetro e = (el. e2 > O. con distribución Gama es f xX. EJERCICIOS 137 misma. Dado que la función de densidad de una variable aleatoria X. con distribución de Poisson es ex fx(x.4. El modelo gaussiano representa una gama amplia de situaciones y es el modelo capital en estadística.

10. O) = _1 _Ix-Oll 20 e 2 °2 Los componentes del parámetro 0= (0 1 . con distribución de Gumbel tiene como función de distribución a Fx(x. ¿cuál tiene menor varianza? 12. 9.exp (x ~2 01 ) ) .. Una variable aleatoria X. Un tramposo juega con una moneda de dos sellos.L y varianza (J2. utiliza una moneda equitativa. Los componentes del parámetro O = (0 1 . pero algunas veces para no despertar sospechas. siendo "( ~ 0. son tales que 01 E ~. 7r 2 (J2 Y además V(X) = ~. teniendo en cuenta que E[X] = 01 + "(0 2 . cuando se asume conocido o fijo el valor de 02. Explore la forma de estimar puntualmente el parámetro O. Igualmente.Xn)2 frente a S. O) = exp ( . Determine una eficiencia especial de *f: i=l (Xi . ¿cuál es el MLE para 01 ? ¿Cuál es el estimador por el método de los momentos para 01 ? ¿Cuál es el estimador por analogía para 01? 7. O2 > O. tiene como función de densidad a fx(x. teniendo en cuenta que E[X] = 01 Y V[X] = 20~. para estimar (J2 cuando se ha asumido un modelo Normal con valor esperado J. 8.. de los dos estimadores para (J2 del ejercicio 10. ESTIMACIÓN PUNTUAL DE PARÁMETROS para fh? ¿ Cuál es el estimador por el método de los momentos para 02? ¿ Cuál es el estimador por analogía para 02? De manera similar. O2 ). O2 > O.138 CAPÍTULO 2. De los dos estimadores para (J2 del ejercicio 9 ¿cuál tiene mayor error cuadrático medio? 11. Explore la forma de estimar puntualmente el parámetro O.577216. O2 ) son tales que 01 E ~. con distribución de Laplace o con dis- tribución Exponencial doble. El objeto de este ejercicio es estimar cuál moneda está utilizando en . Una variable aleatoria X.

y determine su varianza. ¿Es posible construir un estimador insesgado para () que sea fun- ción del mínimo de la muestra? Si es factible. ¿Es consistente este estimador para ()? 18. ¿Es consistente este estimador para ()? 20. sien- do h(n) una función exclusiva del tamaño de la muestra. ()). Determine la varianza del estimador máximo-verosímil para (). ¿cuál elige? 19. (Este ejercicio y los cinco siguientes hacen referencia al ejercicio 15J. estimar el parámetro () cuyo espacio es el conjunto e = {~. .. 1}. Construya un estimador insesgado para (). . . Si las variables aleatorias Xl. o es un estimador asintóticamente insesgado para ()? 14. a partir de los resultados de n lanzamientos de una misma moneda. 16. Entre el estimador del ejercicio 17 y el estimador por el método de los momentos. y concluya si es un estimador consistente para (). ¿El estimador T n del ejercicio 12 es un estimador insesgado. determine la varianza del estimador por el método de los momentos para (). y examine si es un estimador insesgado para (). Considere los estimadores para () de la forma T n = h(n)Xn. 21. basado en la muestra aleatoria.Xn son una muestra aleato- ria de una población con distribución Uniforme en el intervalo (O. basado en la muestra aleatoria. X 2 . EJERCICIOS 139 un momento dado. Compruebe que el MLE para () es 13. que sea función del máximo de la muestra. 15.4. Deter- mine el estimador de esta clase que tenga el menor error cuadrático medio. identifíquelo y de- termine su varianza. Determine el error cuadrático medio del estimador T n del ejercicio anterior. 2. es decir.n. En síntesis. ¿cuál estimador elige como el más apto estimador para ()? . 17.

. . Siendo las variables aleatorias Xl.. . obtenga el MLE. Si las variables aleatorias Xl. determine el MLE para la varianza poblacional. X 2 .1).140 CAPÍTULO 2. X 2 .. 27. X 2 .. 25. basados en una muestra aleatoria de . X n es una muestra aleatoria de una población con función de densidad e fx(x. e E (0.. Si Xl.. 28. e> o determine el MLE de e. X 2 .. . . basados en una muestra aleatoria de tamaño n de una población con distribución de Bernoulli de pará- metro e. . el estimador por el método de los momentos y el estimador por analogía para e. con m conocido.. Si las variables aleatorias Xl. . 30. ¿exis- te una estadística suficiente para (h? 23.. X n una muestra aleato- ria de una población con distribución de Laplace con (h = 1.e). determine el MLE para er + e2 . X 2 . . .oo) (x). Determine la cota de Cramer-Rao para la varianza de los esti- madores insesgados para e. . 26. .Xn constituyen una mues- tra aleatoria de una población con distribución Binomial de valor esperado me y varianza me(1 .Xn es una muestra aleatoria de una población con distribución de Poisson con parámetro A y e = P[Xi = O] = e-A. 24. X2. ESTIMACIÓN PUNTUAL DE PARÁMETROS 22. determine el MLE de e. ¿Existe una estadística suficiente? Si es factible.Xn constituyen una muestra aleatoria de una población con distribución de Bernoulli de pará- metro e. .e) = X2 I[B. mediante dos procedimientos: directa- mente y usando la propiedad de invarianza de los estimadores máximo-verosímiles. Determine la cota de Cramer-Rao para la varianza de los esti- madores insesgados para e.. . Con base en el ejercicio 27. Compruebe que este estimador es una estadística suficiente para e.Xn constituyen una mues- tra aleatoria de una población con distribución gaussiana de valor esperado el y varianza e2 . ¿existe un UMVUE para e? 29. Si las variables aleatorias Xl. determine el UMVUE para e. .. Si Xl.

2. ¿X n es un UMVUE para el promedio poblacional? ¿La varianza de S. Si se asume el modelo gaussiano.4. y se asume que el promedio poblacional es conocido. Teniendo en cuenta el ejercicio 30.f32.? Determine la varianza de T n en términos de f31. (j2. = V[Xil y E [Xil = p" i = 1.. basados en una muestra aleatoria de tamaño n de una población con distribución Gama. ¿existe un UMVUE para (J? 32."" (jn se asumen conocidas.. . X2. X n es una sucesión de variables aleatorias incorre- lacionadas tales que (j. ¿Cuál condición deben cumplir estas cons- tantes para que el estimador T n sea insesgado para p. I:~J i=l Si (jI.. ·. n.n. ¿Se presenta alguna contradicción? 36. f32. ·.. Determine la cota de Cramer-Rao para la varianza de los esti- madores insesgados para el parámetro de escala. . es igual a la correspon- diente cota de Cramer-Rao para los estimadores insesgados para la varianza poblacional? 33. . .(jn' Bajo la restricción del insesgamiento de T n . . n considere el estimador T n = I: f3i X i. .. . cons- i=l tantes determinadas. . ¿existe un UMVUE para la varianza pobla- cional? ¿Qué ocurriría si no se asume que el promedio poblacional es conocido? 34. EJERCICIOS 141 tamaño n de una población con distribución de Poisson de pará- metro (J. . calcule Eo { [:0 In Ix (x. f3n.. use multiplicadores de Lagrange para comprobar que la varianza de T n es mínima cuando l .f3n y (j1. . (J).2. ¿Existe un UMVUE para el parámetro de escala? 35. siendo f31. . una estadística como lo su- giere este ejercicio se denomina BL UE (Best Linear Unbiased Estimator) para p. 2. . Teniendo en cuenta una muestra aleatoria de tamaño n de una po- blación Uniforme en el intervalo (O.(j2. Si Xl...-z f3j = ~ paraj = 1. Si se adopta el modelo gaussiano. . O) r} y compárelo con la varianza del estimador insesgado para (J basado en el máximo de la muestra... 31.

¿es UMVUE para 0(1 . X 2. . Si Xl. ¿X n es BL UE para /. X n es una muestra aleatoria de una población con distribución Beta con parámetro 0= (0 1 . ESTIMACIÓN PUNTUAL DE PARÁMETROS 37. X n es una muestra aleatoria de una población con distribución Uniforme en el intervalo (O. . . que se puede modelar como una variable aleatoria tal que la función de densidad de la variable aleatoria X es fx(x.n. . 43. 42.142 CAPÍTULO 2. Si Xl. .Xn es una muestra aleatoria de una población con distribución Uniforme en el intervalo (O. compruebe que la estadística (Xl.O) = OxfJ-lICü.. X n es una muestra aleatoria de una población con distribución Gama con parámetro O = (0 1 . X 2 .n) es una estadística suficiente para O. ¿la estadística T n = (X n . O).. 0+ 1). . Y = 100X es el contenido porcentual de calcio en cierto com- puesto. O2 ). X n de una población con distribución de Bernoulli de parámetro O. La estadística [n ~ 1 ~Xil. Si Xl. . Xn.. X2.. . G n ) es una estadística suficiente para O? Si se asume conocido 01 .[n(n (~Xi)'l 1 _ 1) basada en una muestra aleatoria Xl. si las varia- bles aleatorias Xl. Muestre que si T n es una estadística completa para O. Teniendo en cuenta lo expuesto en el ejercIcIO 36. Si Xl.l y varianza (J2. . ¿existe un UMVUE para 02 ? 39..O)? 44. ¿existe una estadística suficiente para O? 40. . . X 2. O> O. O2 ) y siendo G n la me- dia geométrica muestral.. X n constituyen una muestra aleatoria de una población con valor esperado /... ¿existe una estadística suficiente para O? 41. .l) (x). y si T~ es otra estadística. X2. .. ella es completa si Tn y T~ son estadísticas equivalentes.l? ¿Se requiere conocer el valor de (J? 38. . O > 0.. X 2. .

X 2 . siendo Xi la variable aleatoria que representa al número de animales de la especie en el i-ésimo cuadrante elegido. Construya un MLE y un UMVUE para la imagen de () bajo la función r. .2. Y n . con m conocido.. X n es una muestra aleatoria de una población con distribución Geométrica con parámetro (). Y2. .()). por la probabilidad de encontrar a lo sumo un ejemplar de la especie. ... Si Xl.. 46. . basa- do en una muestra aleatoria Xl.. () E (0. EJERCICIOS 143 Con base en n determinaciones independientes YI . Si Xl. . El número de animales de cierta especie que se pueden encontrar dentro de un cuadrante (cuadrado ubicado cartográficamente en el área de investigación). . Existe un interés particular dentro de la descripción de la distribución es- pacial. 2. . X 2 . X n .n. X n es una muestra aleatoria de una población con distribución gaussiana de valor esperado () y varianza (). 47. cuya varianza coincida con su correspondiente cota de Cramer-Rao? 45. . . encuentre un MLE y un UMVUE para el contenido medio de calcio. Si las variables aleatorias Xl. ¿de cuál o cuáles estimadores se puede disponer? 49.. ¿es factible determinar un UMVUE para ()m? 50. .. es decir de una pobla- .. X 2 . X n constituyen una muestra aleatoria de una población con distribución Binomial de valor es- perado m() y varianza m()(l . se modela corrientemente como una varia- ble aleatoria con distribución de Poisson de parámetro (). ¿Existe alguna función de () tal que haya un estimador insesgado para la imagen de ().. se desea estimar el tiempo mediano de atención. X 2 .4. completez y suficiencia? 48. por la función r(()) = (1 +())e-o. El tiempo en la atención a un cliente en un banco se puede modelar como una variable aleatoria con distribución Exponencial de valor esperado ~. .. ¿cuál es- timador debe adoptarse en términos de insesgamiento. bajo los mismos términos. . Si en el ejercicio 47 se establece que el valor esperado es () y la va- rianza ()2. i = 1. . es decir.1). Obtenga un MLE y un UMVUE para este tiempo mediano. las cuales se pueden tratar como una muestra aleatoria. . Con base en una muestra de n clientes atendidos.

. si el modelo adoptado para la descripción del tiempo de falla de la probeta es el modelo de Weibull.0)X.. Para el análisis de la fatiga de un material se planea un ensayo con una muestra de n probetas. X n es una muestra aleatoria de una población con distribución Exponencial desplazada con parámetro O = (0 1 .exp [ . O2 ). Xn. establezca un UMVUE para O y un UMVUE para 1 -¡/ . cuya función de densidad es O1 () 1 X fx(x..144 CAPÍTULO 2. 2 52. el cual culmina cuando k de las n probetas hayan fallado.n) un MLE para O? 56. Con base en el ejercicio 52. . Si Xl.n Y Xn. O). . determine una estadística suficiente para O. 0= (0 1 . O) = 0~1 X 1. . . O E (0. . ¿son las estadísticas Xl. . 54. ESTIMACIÓN PUNTUAL DE PARÁMETROS ción con función de densidad fx(x. Si Xl.. O) = ee-(j 1(0. ¿La familia de densidades Gama es cerrada bajo muestreo para la función de densidad de un modelo Exponencial? 55.n. •.00) (x).. X n es una muestra aleatoria de una población con distribución Uniforme en el intervalo (-O. }. 53.1). 57.101{1. Determine el QMLE para O2 suponiendo conocido 01 . determine el estimador bayesiano para el parámetro O de una distribución de Poisson. O2 ). 51. X2. Compruebe que la familia de densidades Gama es conjugada para la función de densidad de un modelo de Poisson. O) = (1 .2. X 2 .( O ) Ih] 1(0.n conjuntamente suficientes para O? ¿La familia a la cual pertenece la función de densidad de la población es una familia completa? ¿Es Tn = max( -Xl. X 2 .. X n es una muestra aleatoria de una población con función de densidad 1 x fx(x.00) (x).• . Si Xl.

( 2 ).4.. Se repite un ensayo de Bernoulli.e2. . . y que ésta es una estadística suficiente y completa para el parámetro e. EJERCICIOS 145 muestre que n y son dos variables estadísticamente independientes.• . 61.e) = exo-II(o. 2. e> o. con probabilidad de éxito e. es decir que ¿la familia de densidades a la cual pertenece la función de densidad de la variable aleatoria X es una familia completa? ¿Es ~=i una estimación insesgada de e? 59. X 2 . .. X n es una muestra aleatoria de una población con distri bución Uniforme en el intervalo (el . basados en una muestra aleatoria Xl. Xn. 58. Si Xl. X2.l) (x). hasta que ocurren exactamente k éxitos.. muestre que las estadísticas XI. .. . X 2 . Compruebe que el MLE para e es una función de la media geométrica muestral. el + ( 2) con el E IR Y e2 > O.. X n es una muestra aleatoria de una población con función de densidad n ¿es L Xi una estadística suficiente y completa para e? Determine i=l n un estimador insesgado para e que sea una función de L Xi tal i=l que él tenga la varianza mínima. Si X es la variable aleatoria que contabiliza el número de ensayos necesarios para obtener los k éxitos. . Si Xl. de una población con función de densidad !x(x. X n . 60.n.n son estadísticas conjuntamente suficientes para e = (el.

. . ..e) = e-(x-O)I(o. . determine un estimador insesgado de varianza mínima para e. ESTIMACIÓN PUNTUAL DE PARÁMETROS 62.oo) (x). Si Xl. Con base en el ejercicio 62.2... . X2. 63. es decir que su función de densidad es 1 fx(x. e) = 7¡!{1. e> 0.O} (x).Xn es una muestra aleatoria de una población con función de densidad fx(x.Xn es una muestra aleatoria de una población con distribución Uniforme discreta con parámetro e. e E IR. 64. . determine una estadística suficiente y completa y un UMVUE para e.146 CAPÍTULO 2. . X 2 . demuestre que el máximo de la muestra es una estadística suficiente y completa.. . Si Xl. .

de ma- nera que sean la licencia para poner en marcha el modelo concebido y responder de manera técnica a las preguntas pertinentes del fenómeno modelado. Algunas investigaciones encuentran en este procedimiento una mejor forma de estimación de parámetros. además de la estimación de un parámetro. una idea de variabilidad asociada a tal es- 147 . el propósito de la inferencia está en el sentido de llevar a cabo un avalúo de ese parámetro por medio de un intervalo. en algunas aplicaciones. porque cumplió el requisito de insesgamiento y esas estimaciones serán de la mayor precisión porque la estadística elegida posee la menor varianza. frente a la declaración de un único valor. y de esa manera está certificada su competencia. y así sustituir esas constantes fun- damentales del modelo por estimaciones válidas y sustentadas. y seguramente tal estimador tiene en su haber otras cualidades primor- diales que lo hacen apto para su labor. Esa certificación brinda el suficiente respaldo para que las estima- ciones gocen de toda la confianza. más útil y provechosa. para declarar. emitiendo ya no un único valor sino un rango de valores como estimación del parámetro.Capítulo 3 Estimación por intervalo de parámetros Una estadística facultada para estimar un parámetro particular pro- ducirá estimaciones alrededor del valor específico del parámetro. Pero no siempre el fin de la inferencia es estimar un parámetro de la forma como hasta este punto se ha considerado. por ello corrientemente suelen dar a conocer el pun- to medio de un intervalo y sus extremos.

1. O).Xn una muestra aleatoria de una población con función de densidad fx(x.1..1. Para comen- zar. 3.4.3. también cuenta con varios métodos para la construcción de esos intervalos de estimación.X2".1.148 CAPÍTULO 3. t2).1. .a)% de confianza. máxime cuando el punto medio corresponde a una estimación puntual de la mejor calidad. . cuyo recorrido es un conjunto de números reales.Xn ) tales que Po [T~1) < T~2)] = 1.X2.a nivel confidencial o confianza. . .. respectivamente.. Definición 3. r(O) una función del paráme- tro.X2. X n una muestra aleatoria de una po- blación con función de densidad fx(x.1. Definición 3... El intervalo aleatorio (T~l). T n(2) -_ t2 ( X 1. T2) Y TJ2) reciben el nombre de límite confidencial inferior y límite confidencial superior. O E e y las estadísticas T n(1) -_ t1(X 1. Un intervalo aleatorio es un intervalo tal que al menos uno de sus extremos es una variable aleatoria. llamados intervalos confidenciales o intervalos de confianza.1. En la definición 3. y el valor 1 . . Sea Xl. r(O) una función cuyo recorrido es un conjunto de números reales. si Po [T2) < r(O) < T~2)] = 1 .a)% de confian- za para la imagen de O bajo r.1 Conceptos preliminares Definición 3. Bajo las consideraciones de la definición 3.5..a probabilidad que no depende de O. T~2)) se denomina in- tervalo confidencial para la imagen de O bajo r del 100(1 . ESTIMACIÓN POR INTERVALO DE PARÁMETROS timación. O). se da paso a la primera fase dentro de la construcción conceptual de la estimación por intervalo de parámetros. Sean X 1.1. Definición 3.Xn ). X2. TJ2)) se denomina estimación por intervalo del 100(1 . . con 8 < r(O) < f3 . de los cuales este texto solamente tratará el método de la variable pivote.2 el in- tervalo (t1.2. Definición 3. intervalo particular del intervalo confidencial (TJ1).. Este proceder especial de estimación conlleva elementos conceptuales propios que este capítulo menciona en su primera parte..2.

1. r (TJl))) es un intervalo confidencial para la imagen de O bajo r. Sea Xl. el interva- lo aleatorio (<5... .6. También si TJ2) = t2(X l .O). probabilidad que no depende de O..a.B) es un intervalo confidencial unilateral del 100(1 . probabilidad que no depende de O. TJ2)) es un intervalo confidencial para O. . . 3. X2. .1.. método que se describe en esta sección.a)% de confianza para la imagen de O bajo r.. . si Po [r(O) < T2)] = 1 .Xn una muestra aleatoria de una po- blación con función de densidad fx(x. sin embargo. Sea Xl. el de mayor tradición y renombre es el método de la variable pivote.X2. . El intervalo aleatorio (TJl). Siendo A(Xl. . Teorema 3. . X2. .Xn ).7. TJl) = tl(X l .2.1.Xn )] = 1 . ..a. a)% de confianza para la imagen de O bajo r.X2. estadísticas tales que (TJ!). probabilidad que no depende de O.a.. cuando la función r es estrictamente decreciente. TJ!) Y TJ2) en la definición 3.. si Po [TJ!) < r(O)] = 1 . T2)) es un intervalo confidencial unilateral del 100(1 . Si r( O) es una función estrictamente monótona con dominio e y recorrido un subconjunto de]R."" X n ) se denomina región confidencial del 100(1 . O). Definición 3. Definición 3. X2..5 reciben respecti- vamente el nombre de límite confidencial inferior unilateral para r(O) y límite confidencial superior unilateral para r(O).2. 3.r ( TJ2))) es un intervalo confidencial para la imagen de O bajo r..8. X2.2 El método de la variable pivote Como se mencionó en la introducción de este capítulo.. El concepto de intervalo confidencial es un caso particular de un concepto más general: la región confidencial.a)% de confianza para el parámetro O.xn ) un subconjunto del espacio de las observaciones X. cuando ésta es estrictamente cre- ciente y (r (T2)) . i = 1. la estimación por intervalo posee varios métodos para la construcción de intervalos confi- denciales. X2.1.. X n una muestra aleatoria de una po- blación con función de densidad fx(x. si Po [O E A(Xl .. . EL MÉTODO DE LA VARIABLE PIVOTE 149 yTJl) una estadística. . .. X 2."" X n ). X n ) es una estadística. (r ( TJ!)) . Y TJi) = ti(X l . A(Xl .

. 3. X n es una muestra aleatoria de una po- blación Normal de valor esperado e y varianza (7"2 conocida. (7" Ejemplo 3. 1). Qx se denomina variable aleatoria pivote (variable pivote) para el parámetro e si la distribución de Qx no depende de e... a través de X n . . QX -. e) (7" es una variable pivote para e. y'nCX n .2.1. Sea Qx = q(B. X n y S~.3.. . X n ) una función de las variables que conforman la muestra aleatoria y del parámetro e. entonces .Xn a través de X n y Sn. ESTIMACIÓN POR INTERVALO DE PARÁMETROS Definición 3. X n . .. Xl.2. En efecto. entonces y'n(X n .·.¡n(Xn-B) y'nCX n . Si Xl. .. Si Xl.2..Xn)2 2.. Debido a que X n y S~ son estadísticamente independientes. . el promedio y varianza muestrales entonces Qx = y'n(X n . (7" n ¿(Xi .. e) rv N(O.2.. X 2 . X 2 . e) (n .150 CAPÍTULO 3. Qx es una función de XI. X2. Ejemplo 3. e) rv t(n _ 1). e) Sn es una variable pivote para e. e).l)S~ i=l (7"2 (7"2 rv x2 (n . (n . X 2 . y'n(X n . . O" '(n-I)SR 2 " (n-I)O" . 1). . y'n(X n . 1). •. X n es una muestra aleatoria de una po- e blación Normal de valor esperado y varianza (7"2.X2. Sea Xl. e) rv N(O. porque además de depender de Xl. X n una muestra aleatoria de una po- blación con función de densidad fx(x. .l)S~ y (7" (7"2 también lo son. . X 2 .. Además: 1.

. Po[a < Qx < b] = 1 .2. y] = Po [Xi::.. . 3. de una población con función de densidad La variable aleatoria Yi = 20 Xi tiene distribución exponencial con pa- rámetro !'hecho que se reconoce de la siguiente manera: Flj(Y) = Po[20Xi ::. X 2 . .a)% para r(O).2Y 1(0. debido a lo siguiente: . . T~2)) será un intervalo confidencial del 100(1 . FYi (y) = Jor?o Oe-Oxidxi. n..2.2. Por tanto. Ejemplo 3.. X n .a continuar con pasos intermedios que consisten en considerar eventos equivalentes hasta determinar el evento tal que y como consecuencia el intervalo aleatorio (T~l).a. .4. Con base en este resultado se establece a n n Qx = ¿Yi = 20¿Xi i=l i=l como una variable aleatoria pivote. :0] = FXi (:0) i = 1. 29 1 1 = "2 e . EL MÉTODO DE LA VARIABLE PIVOTE 151 El método de la variable pivote es el método más utilizado en la cons- trucción de intervalos confidenciales. Determinar un intervalo confidencial para el paráme- tro O basado en una muestra aleatoria Xl. una vez definido el coeficiente 1 . luego 1 lbL flj (y) = O20 e. variable que tiene distribución Ji - cuadrado de parámetro 2n.00) (y). Consiste en partir del paso inicial.

como punto de par- tida en la construcción del intervalo confidencial. (2) la factibilidad de deducir las estadísticas T~l) y T~2) a partir de la variable pivote. . ésta constituye una auténtica variable pivote.152 CAPÍTULO 3. Y2. como a = X~ (2n) y b = xL~ (2n). El método de la variable pivote tiene tres condiciones esenciales: (1) la existencia misma de una variable pivote como tal.a)% para el parámetro e. porque además de ser Po [ x~ (2n) < xL% (2n)]_ 1 2 n ¿ i=l Xi 2 n ¿ i=l Xi - el valor de 1 . i=l 2 ¿ Xi 2 ¿ Xi i=l i=l Eligiendo los valores a.. . b. como que su longitud sea mínima. el intervalo 2 2 aleatorio ( x~ (2n) 2¿Xi n i=l . M Qx (t) = 1 [ (!~t) 1 ] n por ser Y1 . (3) lograr encontrar la variable pivote con una distribución. esta función generatriz de momentos es propia de una variable aleatoria con distribución Ji-cuadrado con 2n grados de libertad. estadísticas que definen en últimas el intervalo confidencial. en cuyo caso es menester llevar a cabo unos pasos adicionales a fin de determinar el intervalo que satisfaga esa condición. Sobra anotar que la anterior elección de a y b es una escogencia particular. b. se considera el evento aleatorio {a < Qx < b}. En consecuencia. en lo posible conocida.a. La pareja (a. . y con base en lo anterior. Po [a < 2e t Xi < b] = Po [na <e< nb ] = 1 .a no está supeditado a ningún valor de e. b) puede ser única cuando se le plantean requerimientos al intervalo.Yn un conjunto de variables aleatorias independientes.. ESTIMACIÓN POR INTERVALO DE PARÁMETROS para t < !' M}i (t) = O~t)' y por tanto. Como la distribución de Qx no depende de e. xL% (2n)) 2¿Xi n i=l es un intervalo confidencial del 100(1. y por supuesto puede adoptarse otra pareja de valores a.

U2.Pe[Ui ~ e.. EL MÉTODO DE LA VARIABLE PIVOTE 153 que permita determinar sus percentiles..FUi (e. para aquellos casos en los cuales la función de distribución tiene una expresión algebraica explícita.. . E [e tRn ] dado que Ul.r ) = 1 . X2. Partiendo del hecho que si X es una variable aleatoria con función de distribución Fx(x.. Un es una muestra aleatoria. . . 3. . etRn ] = E [e tR1 ] E [e tR2 ] . () continua.5 (Una variable pivote general). ]= 1 . Rl. . Ejemplo 3. Siendo Xl.2. X n una muestra aleatoria de una población con función de distribución Fx(x.1). porque FRi(r) = Pe[E¿ ~ r] = Pe[-lnUi ~ r] = Pe[lnUi > -r] r = Pe[Ui > e.r ] = 1. . luego t < 1."" Rn son variables aleatorias independientes e idénticamente distribuidas. . El siguiente ejemplo trata del establecimiento de una variable pivote general. entonces la variable aleatoria Y = Fx(X.2.r luego E¿ rv Exp(l).. ()) tiene distribución Uniforme en el intervalo (0...e.2. n E¿ = -In Ui rv Exp(l). R2. ()) rv Gama(n. es posible construir una variable pivote de la manera siguiente. . i = 1. ()) continua.. Definiendo n n Qx = L Ri = L -lnFx(Xi . 1) i=l i=l porque =E [etRléR2 ..

e) rv U(O.6. siempre y cuando la función de distribución de la población tenga una expresión que permita aplicar el método. La deducción de una variable aleatoria pivote general se basó en que FX(Xi . Para algunos casos particulares..4. e) tiene distribución Uniforme (O. n.Fx(Xi .2. así n n Qx = -In II Fx(Xi . e) o Q'X = -21n II Fx(Xi . e) rv Exp (~). e) rv x2 (2n). i=l i=l Ejemplo 3. n Q'X = -2 ¿ In Fx(Xi . así n Q'X = -2 ¿ In Fx(Xi . regida por el modelo Gama. 1) i=l i=l variable que puede utilizarse como una variable pivote para e. de la misma manera a lo expresado en el ejemplo 3. . . basado en una muestra aleatoria Xl.00) (x).. -21n Fx(Xi . e) para i = 1. ESTIMACIÓN POR INTERVALO DE PARÁMETROS entonces Qx rv Gama(n.2.1). como FX(Xi . Por lo anterior.154 CAPÍTULO 3. i=l Porque.e) rv Gama(n. e) = ee~Ox 1(0. X 2 . ~).2.. la variable n n Qx = ¿Ri = ¿ -lnFx(Xi. 1). por razones expediti- vas. .. U na sutil modificación a la variable aleatoria pivote general.2. El desarrollo del ejemplo 3. e) rv Gama (n. 1).5. e). de una población con función de densidad fx(x. es i=l decir. ésta bajo la distribución Ji-cuadrado. permite la construcción de otra variable aleatoria pivote. produjo un interva- lo confidencial para el parámetro e. tiene distribución Uniforme en el intervalo (0. . 1). gracias a la propiedad fundamental de la función logaritmo. la variable aleatoria pivote se construye a partir de que igualmente 1 . e) rv x2 (2n). forma conveniente para algunos casos individuales. i=l Cualquiera de las variables aleatorias pivotes generales puede expresarse de forma alternativa.Xn . . n con lo cual la variable aleatoria I: -2 In FX(Xi .

la determinación de una variable pivote. e)) 1(0. el parámetro e se denomina parámetro de localización si y sólo si la distribución de X .8.2. i=l A partir de esta variable es fácil determinar un intervalo confidencial para e. Si entonces el es el componente de localización. Cuando e ~ ]R.1h ) 1(0. EL MÉTODO DE LA VARIABLE PIVOTE 155 Como Fx(x. Cuando e ~ ]R. El componente ej de e se denomina componente de escala.2. Sea {fx(x. e)le E e ~ ]Rk} una familia de densi- dades. Sea {fx(x. En efecto. hecho que permite justificar el motivo para la adopción de la variable pivote: n Qx = 2e L Xi rv x2 (2n).e) = (1.e.e o de X + e no depende de e. El componente ej de e se denomina componente de localiza- ción. distribución que no depende del valor de el· Definición 3. (1 .2.l) e igualmente -In (e-ex i ) = eXi tiene dis- tribución Exponencial con parámetro igual a uno. Definición 3. no depende de ej.00) (x).00) (x). e)le E e ~ ]Rk} una familia de densi- dades.ej o de X + ej . ( 2 ). según sea el caso. si y sólo si la distribución de X . no depende de ej. 3. . si y sólo si la distribución de (~) o de (Xe j ).el) rv N(O. el parámetro e se denomina parámetro de escala si y sólo si la distribución de (~) o de (Xe) no depende de e. la variable aleatoria (X . Tales son los casos cuando el parámetro se identifica como parámetro de localización o cuando el parámetro se de- nomina como parámetro de escala.Fx(x. Ejemplo 3. la función que de- sempeña el parámetro en consideración. según sea el caso.9.7. con lo cual e-exi rv U(O.2.00) (x) = e-ex 1(0. es algunas veces una vía para identificar dicha variable. Para coadyuvar en el cumplimiento de la primera condición del método.

2. Fz(z) = Pe[Z :::. e E e ~ ]Rk.e) o L + e). es una vía para la identificación de una variable pivote como se había expresado anteriormente. z] = Pe [X : :. z] = Pe[eX :::. X n una muestra aleatoria de una po- blación conjunción de densidad Jx(x. estadísticas basadas en esta muestra aleatoria.e o T n + e es una variable aleatoria pivote. T~l) Y T~2). Y las estadísticas T n . Teorema 3. si e es un pa- rámetro de escala. Luego Z '" Exp(l). Si Jx(x. 3. . ..00) (x). es una variable (Xi i=l i=l pivote para el parámetro de localización e.. Sea Xl. ~] = Fx (~) = 1. entonces T. T. y lo es también L ~ o eL Xi dependiendo de la situación.z .2. ~ o eXi es una variable aleatoria n n pivote.(l) - nT~2) el ) es una variable aleatoria pivote para el.e). Si e es un parámetro de localización y si T n es MLE de e. ESTIMACIÓN POR INTERVALO DE PARÁMETROS Ejemplo 3.156 CAPÍTULO 3.10. según el caso. X2. el parámetro e es un parámetro de escala dado que la distribución de Z = ex. e) = ee-ex 1(0. De i=l i=l n n manera similar. en o eTn es una variable aleatoria pivote para e. Si el es el componente de localización y T~l) un MLE de el y además si e2 es el componente de escala y T~2) un MLE de e 2. según sea el caso. 1. Si e es un parámetro de escala y si T n es MLE de e. L (Xi . .2. o si éstos son conocidos. Por consiguiente. e. T n .11. si ( ésta no depende de los demás componentes de e. distribución que no depende del valor que asuma el parámetro e. Reconocer a un parámetro como de escala o como un parámetro de localización. no depende de porque e.

. . basado en una muestra aleatoria Xl. Bajo un caso regular de estimación. X n ) es insesgado para la imagen de O bajo una fun- ción r. además de ser una serie de ejemplos en la construcción de intervalos confidenciales.r( O)) r'(O) n converge en distribución a una variable aleatoria con distribución Nor- mal estándar.• .2. si el estimador T n = t(XI .12. es la variable pivote que utiliza este primer caso. O). X n de una población con función de densidad f X (x. X2.3.2.l. X 2 . Qx = fo(X n . 3.2.3 Estimación de promedios bajo Normalidad 3. (1 . Estos intervalos comúnmente se describen en la mayoría de textos de estadística. su inclusión. dependiendo de los supuestos que se hagan sobre la varianza poblacional. . ESTIMACIÓN DE PROMEDIOS BAJO NORMALIDAD 157 Teorema 3. cuya varianza coincide con la cota de Cramer-Rao. Caso 1 Un intervalo confidencial del 100(1 . .1 Intervalos confidenciales para el promedio de una población Sea Xl. entonces la variable aleatoria ynT(O) (7: .. es La variable pivote mencionada en el ejemplo 3.. 3.l y varianza (12. X n una muestra aleatoria de una población con distribu- ción Normal de valor esperado j. Las dos secciones siguientes.l) f"V N(O. cuando se ha asumido el modelo gaussiano como regente del comportamiento probabilístico de la pobla- ción. son fundamentalmente una relación de ejemplos del uso del método de la variable pivote. Se consideran dos casos.3. dedicadas a los intervalos confidenciales bajo Normalidad. 1).. . . de longitud mínima. responde a que esos intervalos son de uso corriente. X 2 . cuando el valor de la varianza (12 es conocido.a)% para j.j..

[-X n + Vn < -fL < -X n + Vn ba] .[Vn < (X n . L¡ = -X n - aa - Vn (- Xn - ba) Vn a = Vn(b .1 fQx (q) a b q Figura 3. .[a< Vn(X. como se ha indicado de manera general. aa - = PJ1.a).fL) < Vn .[aa < Vn(X n . aa) (Xn .fL) < ba] aa .1: Esquema del punto de partida del método de la variable pivote para el caso 1. ba . Vn cuya longitud L¡ es factible hacerla mínima. a = PJ1.Vn .[X n . ESTIMACIÓN POR INTERVALO DE PARÁMETROS El punto de partida del método. .X n . 1. aa] = PJ1. es entonces PJ1. ba.158 CAPÍTULO 3.Vn < fL < X n . Se ha determinado así un intervalo confidencial para fL.-fL) <b] =(l-a) que corresponde gráficamente al esquema que presenta la figura 3. ba] = PJ1. Vn.

3.¿ de longitud mínima bajo el supuesto de que la varianza 0..a)% para ¡. Por consiguiente.3.2 muestra la elección apropiada de a y b para conseguir el intervalo confidencial con la exigencia de longitud mínima.2 es conocida corresponde a . se deduce que Por tanto. y derivando la relación fundamental en términos de b. pero esta última solución no es admisible porque no satisface la relación fundamental entre a y b. b) debe satisfacer para sus compo- nentes la relación fundamental: ¡b fQx(q)dq = 1. Gráficamente. fQx(b) = -8 a ~=--::---:- fQx (a) 8b· Sustituyendo esta última relación se tiene que De esta manera. el intervalo confidencial del 100(1 .a o equivalentemente Acatando esta relación entre a y b. ESTIMACIÓN DE PROMEDIOS BAJO NORMALIDAD 159 Cualquier elección de la pareja (a. o cuando a = b. la figura 3.

se puede deducir el citado intervalo confidencial. El siguiente teorema apresta el fundamento de su construcción.2.. es . n 1 Este intervalo atañe a situaciones más realistas.2 ) o b (Zl_2'.. Un buen estimador de la probabilidad de éxito 7f en un modelo de Ber- noulli. /2 a (-Zl_2'..0:)% para JL de longitud mínima.2: Elección de los valores a y b que minimizan la longitud del intervalo confidencial correspondiente al caso 1.. Sn -X t1_%(n . o por lo menos más corrientes que a la considerada por el caso 1.1) yn' + t1_%(n . cuando la varianza de la población es desconocida.. también llamada proporción poblacional.3 de la página 150. Este estimador derivado con base en el método de máxima verosimilitud goza de buenas propiedades que lo hacen óptimo. A partir de ella y siguiendo prácticamente los mismos pasos y consideraciones del caso 1. (Xn . Caso 2 Un intervalo confidencial del 100(1 . ESTIMACIÓN POR INTERVALO DE PARÁMETROS fQx (q) a a 2 .) q 2 Figura 3. ) yn Sn) . La variable aleatoria pivote para JL que genera este intervalo confidencial es Qx = yn(X n . como ya se había anotado. JL) '"" t(n . Con base en él es factible construir un intervalo confidencial para la proporción poblacional utilizando muestras grandes. es el promedio de la muestra que por su singularidad se le denomina proporción muestral y es denotado como Pn .1) Sn tal como fue mencionada en el ejemplo 3.160 CAPÍTULO 3. .

teniendo en cuenta que y utilizando el teorema 3.a)% de confianza para es e donde I(Tn ) es la información de Fisher evaluada en la estadística T n . es confirmar que npn > 5 Y n(1 . Pn + Z1-'¡ JPn(!: Po)) .3. entonces para un tamaño de muestra suficientemente grande.Rao y que cumple conjuntamente las condi- ciones de regularidad con el modelo probabilístico elegido.Pn) > 5.a)% para 7r es (Pn . X2.. una recomendación práctica para su utilización. según varios autores.2 Estimación de la proporción poblacional Siendo Xl. . 3. 3. un intervalo confidencial del 100(1 .3..3.3. .1.1. ESTIMACIÓN DE PROMEDIOS BAJO NORMALIDAD 161 Teorema 3. JPn(J : Pn). Como este intervalo requiere para su aplicación que el tamaño de la muestra sea grande. el intervalo confidencial para la proporción poblacional es Es decir. un intervalo confidencial de aproximadamente 100(1 . En efecto.Xn una muestra aleatoria de una población con dis- tribución de Bernoulli de parámetro 7r. cuya varianza coin- cide con la cota de Cramer. . Sea T n un MLE insesgado para e. Z1-.

Dn = . --<t 2 l+ --<t n n n n 3.3 Intervalo confidencial para la diferencia de prome- dios basado en una muestra pareada Cuando las variables aleatorias X. (X n .2 p.. Y2 ).) n + z2 a 1.L2)]} 0"1 0"2 0"1 0"2 siendo la constante K = 1/(27fO"iO"2..n + z21-~ 2n V P.Yi. citado en algunos textos..t2 con longitud mínima es - ( Dn . Y representan variables medidas en las mismas unidades y que cuantifican el mismo aspecto de la unidad es- tadística sólo que en circunstancias distintas y cuando la variable aleato- ria Xi . Yl ). ¿ Di. cuya función conjunta de densidad f X. O"r + O"~ .¡. 2 z.2.. ( 1+z1-~ 2 1+Z1-~ l+ z. 2 _ 1 n • Sd.Dn) . Yn ) una mues- tra aleatoria bivariada de una población con distribución Normal bivariada.O) es p.162 CAPÍTULO 3. . la muestra aleatoria (Xl.. y) es Kex p {.2.Y) • D rv N (¡. Y2 ).J1="P).Y (x.(Xn .Dn + tl-~ (n . . . Yi (D = X .t2. Yd.(1-P. 2 2 + Zl-". n+ z21-~ 2n VP.. .. 1 2(1 . . Zl-"....p) [(X-J.3. Siendo la muestra pareada (Xl. Yn ) se denomina muestra pareada.ti . (X 2 . ESTIMACIÓN POR INTERVALO DE PARÁMETROS U n intervalo confidencial también utilizado en la estimación de 7f .ti . n i=l . .="-. 2PO"10"2) 2 1 n .. i = 1.L2)2 -2P(~) (Y-J.td = ¡.1) Sdn - fo .tl-~ (n .¡. el intervalo confidencial del 100(1 .L1)2 _ (Y-J. .) n + z2 ~ a 1.n representa una variable que tenga sentido.a)% de confianza para la diferencia de promedios ¡..1) Sdn) fo siendo • Di = Xi .2 ~ ) ------. .. (X 2 .n = n _ 1 i~(Di .(l-P.. basado en la misma variable pivote VnI(O)(Pn .

Las dos poblaciones son estadísticamen- te independientes. . de longitud .4 Intervalos confidenciales para la diferencia de prome- dios en poblaciones independientes Sean Xl. X 2 .. de longitud mínima. y YI..Xn una muestra aleatoria de tamaño n de una po- blación Normal con valor esperado ¡.t2) puede generarse el inter- valo confidencial correspondiente: Caso 2 Un intervalo del 100(1 . 3. .t2. Ym una muestra aleatoria de tamaño m de una población Normal con valor esperado ¡.¡... Los casos que se consideran a continuación también corresponden a supuestos que se hacen sobre las varianzas poblacionales. . . . Por tanto. constituye un caso particular de un intervalo ya desarrollado.2PO"l0"2 es des- conocida.t2 y varianza O"§. ESTIMACIÓN DE PROMEDIOS BAJO NORMALIDAD 163 La deducción de este intervalo confidencial corresponde a la de un in- tervalo confidencial del 100(1 .a) % para la diferencia de promedios de dos poblaciones independientes.3.t2 bajo Normalidad y asumiendo que la varianza O"i + O"§ .tI .a)% para la diferencia de promedios pobla- cionales correspondientes a dos poblaciones independientes.td = ¡..¡.a)% de confianza para ¡.. cuando O"i y O"§ son conocidas se desarrolla con base en los siguientes elementos: - Ym rv N ( 0"2m2) ¡. A partir de esta variable pivote para (¡.tI .3.. Y2.. Caso 1 U n intervalo confidencial del 100 (1 . 3...tI y varianza O"i..

. .y m) .t1 ( X n-Y ¡.l)S~..:-j=_l_ _ _ _ 2( ) (j 2 "'X m+n-2 (n .n + (m .t1 . bajo el supuesto de que las varianzas poblacionales son desco- nocidas pero iguales.y m)2 (m . El intervalo confidencial para (¡.1) (j m ¿ (Yj . n m -2"" -2 ¿(Xi-X n ) +L. Como las poblaciones son estadísticamente independientes. za común (j2.¡.¡...(¡.m )=1 (j2 (j2 '" x2(m .l)Sr..Xn)2 (n .l)SI..n i=l 2 (j2 -=-----=---.m) . 'es el estimador de la varian- . (X n-Y ..1) S~ m donde Si n+m = (n+m-2 . la variable pivote para ¡. 1) n m n ¿(Xi .t1 .m)-(1l1 ¡.2-. por tanto..164 CAPÍTULO 3.(Yj-Ym ) _ i =_l _ _ _ _----.(¡. se desarrolla teniendo en cuenta lo siguiente: Sea (JI = (j§ = (j2.¡.m '" x2(m + n _ 2) (j2 y a partir de estos resultados.'" X (n .. ESTIMACIÓN POR INTERVALO DE PARÁMETROS mínima.l)S~. entonces .t2) '" t(n + m 2) Qx = Sp.t2 será.1)..t2) basado en esta .1) Sr n + (m .t2) ja' + a' ~ N(O...t1 .n+m n + m 1J1 _ (n .L2) _ aJl+-L QX _ n m (n-1)S? n+(m-1)S~ m (m'+n-2)a 2 ' (Xn ...

X n una muestra aleatoria de una población con dis- tribución Normal de valor esperado J.4. cuando las varianzas poblacionales se asumen distintas y desconocidas. Welch propone que los grados de libertad v deben ser el entero más cercano a (~+~ )2 C~n f + C~)2 n-l m-l De esta manera.4. Dependiendo del .l y varianza (Y2. X2.- (X n . 3..Y m)-t l _S!(n+m-2)Spn+m 2 ' gl -+- n m y como límite confidencial superior a . .a) % de confianza para la diferencia de los promedios de dos poblaciones independientes de longitud mínima..y m) + tl_S!(n + m - 2 2)Spn+m ' gl - n +-.- (X n . el intervalo confidencial en consideración es 3.. Se puede decir que tiene distribución t aproximada con v grados de libertad.4 Estimación de varianzas bajo Normalidad 3. m Caso 3 Un intervalo confidencial del 100 (1 . . está basado en la variable pivote que tiene una distribución similar a la distribución t. ESTIMACIÓN DE VARIANZAS BAJO NORMALIDAD 165 variable pivote tiene como límite confidencial inferior a .1 Intervalos confidenciales para la varianza de una po- blación Sea Xl.

Por tanto. se consideran dos casos: Caso 1 Un intervalo confidencial del 100(1.3.1')') . ESTIMACIÓN POR INTERVALO DE PARÁMETROS supuesto asumido para 1-".166 CAPÍTULO 3. i~ (X~ .1-")2 I=(Xi .1-")2 i=l (]"2 rv x2 (n). [ La longitud del intervalo aleatorio (i~ (x: -1'1' .1-")2] Pa2 ~=l b < (]"2 < ~=l a = 1-a.1-")2 < ~ es decir. (]"2 <b = 1.1-")2 i- nl ] Pa2 a < .a)% para (]"2 cuando 1-" es conocido se basa en la siguiente variable pivote: n ¿(Xi . la determinación del intervalo confidencial es como sigue. I=(Xi . El punto de partida es ¿(Xi . Equivalentemente 1 1] (]"2 =1-a Pa 2 [b < i~(Xi .a [ que corresponde gráficamente al esquema que presenta la figura 3.

manifestado en este punto de la deducción puede minimizarse.4. está sujeta a la relación fundamental entre a y b. fQx (b) oa .fQx (a) fQx(a) = ~b. De la relación fundamental entre a y b se deduce que o 0= fQx (b) oa b .3: Esquema del punto de partida del método de la variable pivote para el caso 1. 3. La lon- gitud mencionada. ESTIMACIÓN DE VARIANZAS BAJO NORMALIDAD 167 fQx (q) a b q Figura 3. Utilizando los recursos del cálculo diferencial.

Algunos autores han desarrollado tablas para este propósito. fQx(q) a 2" b (xi-% (n)) q Figura 3.a). es posible identificar los valores de a y b que cumplen la anterior condición.4. el intervalo confidencial del 100(1 . el intervalo confidencial tiene longitud mínima cuando a 2 fQx(a) = b2 fQx(b).168 CAPÍTULO 3. Corrientemente. cuando .4: Elección corriente de los valores a y b para el intervalo confidencial correspondiente al caso 1. pero es fácil elaborar un programa de computador que los calcule. Establecidos los grados de libertad y en nivel confidencial (1 . Esta limitación menor se elude en la medida que se cuente con una muestra grande. 2 2 tal como lo ilustra la figura 3. En síntesis. es decIr. para muestras grandes se prefiere la elección de a y b como a = x~(n) b = xL~(n). a través de métodos numéricos. 1 1 fQx(a) a2 = b2 fQx(b)· Concretamente. ESTIMACIÓN POR INTERVALO DE PARÁMETROS a 1 1 a Luego oa L¡ = 0. cuando a 2 = b2 oa b.a)% de confianza para .

y m una muestra aleatoria de tamaño m de una población Normal con valor esperado j. y YI . •.ll y varianza (Ji. Las dos poblaciones son estadísticamente independientes.. .ll y j.a)% de confianza para el cociente 2 de varianzas ~ a de dos poblaciones independientes. . al igual que el anterior. 3. debe ser aquel para el cual se cumpla que 3. Los casos que se consideran a continuación también co- rresponden a supuestos que se hacen sobre los promedios poblacionales. . X 2 . ESTIMACIÓN DE VARIANZAS BAJO NORMALIDAD 169 (J2 cuya longitud no es mínima.4.. X n una muestra aleatoria de tamaño n de una po- blación Normal con valor esperado j. usado corrientemente es Caso 2 Un intervalo confidencial del 100(1 . Caso 1 Un intervalo confidencial del 100(1 .2 Intervalos confidenciales para el cociente de varian- zas de dos poblaciones independientes Sean Xl. cuando j.4. Y2 .l2 y varianza (J~.a)% de confianza para (J2 cuando j. El intervalo de longitud mínima.Xn)2 Qx = _i=_l_-----::-_ _ (J2 rv x2 (n -1) y cuya deducción es idéntica al caso l.l es desconocido es intervalo que se puede construir a partir de la variable pivote para (J2: n ¿(Xi .l2 son 2 . .

..f. ) U1 U2 Con base en estas variables y reiterando la independencia estadística de 2 las poblaciones se construye la siguiente variable pivote para ~: a 2 m m ¿ (Yj ..f. n) ¿ (Yj ..f.ll)2/n que corresponde gráficamente al esquema que presenta la figura 3..ld 2/n T = -'::i=:-::-=l'--_ _ __ m ¿ (Yj . surge un intervalo confidencial para el cociente de varianzas debido a que Pa l' 2 a2 a ¿(Xi ..a [ U2 n 2 i~(Xi . 2 f.l2)2/m j=l U 1 j=l Qx = n . 2 U [ j~l (Yj .l2)2/m j=l j=l En efecto...f.ll)2/n m n i=l < 2 Ul -2 <b n i=l ¿(Xi .ld 2/n m 1= 1 .ll)2/(nur) U2 ¿(Xi .f.a~ Ulj=l a<.f.f. n m ¿ (Xi .f....f. ESTIMACIÓN POR INTERVALO DE PARÁMETROS conocidos.. n)..l2)2 /m j=l .f.a... m ft-!fj (m.5..f.ll)2 ¿ (Yj .l2)2/m ¿ (Yj .l2)2/m Pai.f.ll)2/n i=l i=l Al partir de 2 (Yj ¿ ..170 CAPÍTULO 3.. f. es el siguiente: 1 ( i~(Xi .f.l2)2 /(mu~) 2 ¿ (Yj . n). mi <b = l .f.l2)2/m 2 j~l (Yj . 2" n rv F(m.f.f.ld /n i~(Xi .l2)2 /m Para simplificar los pasos posteriores en la construcción del intervalo confidencial en consideración.l2)2 i= 1 2( ) j=1 2 rvX n 2 rvX 2 ( m. ¿(Xi . se establece la sustitución n ¿(Xi .ld 2/n m f!fj (m.

. haciendo uso de los procedi- mientos respectivos del cálculo diferencial. !!. E igualmente esta limitación se soslaya en la medida que se cuente con muestras grandes. o entonces oaL¡ = O. es fácil elaborar un programa de computador que los calcule. luego oa L¡ = T fQx (b) .a).. oa oa .-L¡ = T (!!..5: Esquema del punto de partida del método de la variable pivote para el caso 1.1 . De manera similar al caso de los intervalos confidenciales de longitud mínima para las varianzas bajo normalidad.-b . 3.1) . como lo muestra la figura 3. ESTIMACIÓN DE VARIANZAS BAJO NORMALIDAD 171 a b q Figura 3. cuando fQx(a) = fQx(b). De la misma manera. establecidos los grados de libertad y el nivel confidencial (1 . como en casos anteriores.aT = T(b .. Con ello y la longitud del intervalo L¡ es L¡ = bT . es posible identificar los valores de a y b que cumplen la condición anterior. por medio de métodos numéricos.6.4..a) que se minimiza. o fQx (a) o (fQX (a) ) Como ya se ha establecIdo oa b = fQx (b) .

6: Elección de los valores a y b que minimizan la longitud del intervalo confidencial correspondiente al caso 1.JLd 2In ) i. cuando JLl y JL2 se 0'2 desconocen.del 100(1 .Xn)2/(n -1) ¿(Xi n .1) . corrientemente se utilizan los percentiles a = f2:(m.JL2)2/m 2 Caso 2 Un intervalo confidencial del 100(1 .a)% de confianzas para el cociente 2 de varianzas ~ de dos poblaciones independientes. ( j~l (Yj .JLl)2 In ¿n (Xi .1) j~l (Yj .a)% de confianza es 0'2 ¿n (Xi . n).y m)2 I(m . es ¿(Xi n .. 2 en cuyo caso el intervalo confidencial 0'2 para 3.n). m ( j~/Yj .n). i~l h-2: (m.JL2)2/m 2 j~l (Yj ..172 CAPÍTULO 3.Xn)2/(n -1) ) i=l i=l b m a. 2 b= fl-2:(m.l f2: (m. n) .y m)2 I(m . ESTIMACIÓN POR INTERVALO DE PARÁMETROS fQx (q) a b q Figura 3. Para n y m grandes.

3. Para ello diseñó una muestra en varias etapas y concretamente encontró que 315 abogados de los 509 entrevistados consideraron que el nuevo sistema acusatorio no es un instrumento en la lucha contra la impunidad. en ese momento. un intervalo confi- a2 dencial para 3 a es 2 Sr ' Fa(m-1 n Sr n-1) .n' Fl a(m-1 n-1) ) .m 2 ' . El servicio de asesoría estadística que la Universidad N acional presta a través del Departamento de Estadística realizó en 1997 un estudio de opinión sobre la justicia en Colombia y entre muchos de los interrogantes que el Consejo Superior de la Judicatura quería dilucidar con esta investigación era la percepción de los abogados.96 Y debido a que npn = 315 > 5 Y n(l .5 Ejemplos numéricos de aplicación Ejemplo 3. EJEMPLOS NUMÉRICOS DE APLICACIÓN 173 2 intervalo confidencial basado en la variable pivote para ~ a 2 Para tamaños de muestra suficientemente grandes. (- s2 2. consideran que el nuevo sistema acusatorio no es un instrumento contra la impunidad.Pn) = 194 > 5. entonces se puede estimar con una confianza del 95% que entre el 57.5. puesto que la estimación por .5. Con base en estos resultados se precisa estimar con una confianza del 95% el nivel de asentimiento del nuevo sistema acusatorio por los abogados penalistas.1% de los abogados que se desempeñan en asuntos del derecho penal.66% y el 66.975 = 1. Siendo P509 = 315/509 = 0. fruto de la creación de la Fiscalía. frente al nuevo sistema acusatorio.1.m -2 ' 3. S2 2. y con la adopción de ZO.61886 la proporción de interés en la muestra. que se desempeñan en el área penal.

4 79.4 77.2.9 79. es preciso desarrollar varias activi- dades.Pn + Z1-. Ejemplo 3.4 78.1 77.1 78.9 77.3811) = ( 0.184078 kg. El modelo Normal es una herra- mienta muy utilizada en esta etapa para estimar el promedio del proceso e igualmente para determinar sus cambios.0.1 79.3811 0. entre otras el llamado precontrol.9'.1.2.9 79.9 78.9 78.9 77.4 77.5 79.9 77.9 78.174 CAPÍTULO 3.6 79.1 79.1.8 4 75.9 78. información registrada en la tabla 3.pn)) ( Pn .9 77.3 kg y una desviación estándar de 1.9 6 77.Pn) .6188 * 0.9'. que presenta un promedio de 78.5. En diez períodos de inspec- ción con cinco trozos cada uno. Período Resistencias observadas 1 78. se acopió la información con el propósito de estimar el promedio de resistencia de la fibra. elegidos para la respectiva prueba en el laboratorio.9 78.5766.4 79 7 77. ESTIMACIÓN POR INTERVALO DE PARÁMETROS intervalo de la proporción en mención es vPn(1.5 79. Para cumplir la estimación mencionada.1 3 78. Antes de implementar los gráficos de control.9 75.1: Datos relativos a la información acopiada del ejemplo 3. se analiza la información relativa a la resistencia a la tensión de trozos de fibra.5 Tabla 3.5 2 75.5 5 78.9 78.96 509 = (0.3 77.5 78.2 77.6 77.6 78. VPn(1.96 509 ' 0.9 8 78.3 77.9 78.6610).9 79.1 75. con lo . se consideran las 50 observa- ciones como una sola muestra particular de tamaño 50.5 78.6188 + 1.6 9 78.6188 * 0. Para controlar estadísticamente el proceso de fabricación de un tipo de fibra para la elaboración de alfombras. Z1_.8 78. para el monitoreo de un proceso industrial.5 79.6188 .5.1 79. 2 n 2 n 0.7 10 78.8 79. en kilogramos.7 76.

se trata de un modesto anticipo sin la menor pretensión de lo que significa la determinación del tamaño muestral.L. desconocida la varianza poblacional. 3.a P¡.LI < e] = 1 . Para estimar el parámetro J. Si el lector continúa trabajando sobre conceptos del área de la estadística. P¡.a PJ. promedio poblacional.184078 = ( 78. J. se puede de- ducir el tamaño de una muestra a partir de la expresión de uno de sus intervalos confidenciales. 1) Vii 1.6365). 3. Fijando de antemano como medida de precisión de la estimación de J. dedicada al tamaño de la mues- tra.63 kg puesto que la estimación por inter- valo del 95% de confianza para el promedio de resistencia.L [-Zl-%::n < J.t [IXn . Este tema primordial y complejo es un tema extenso que abarca varios aspectos incluyendo el relativo a la determinación de la numerosi- dad de la muestra propiamente dicha. TAMAÑO DE LA MUESTRA SIMPLE BAJO NORMALIDAD 175 cual se estima con una confianza del 95% que la resistencia media a la tensión está entre 77. tendrá la oportunidad de pro- fundizar sobre este tema fundamental tanto en el diseño como en la ejecución de investigaciones auxiliadas por la estadística. es ~ xn ~) (x n .9634.L el valor Zl-Q ~ = e.1) Vii' + t 1-% (n . t 1 -% (n .009574 V56 . el tamaño de muestra puede ser derivado inmediata- 2 yn .L < Xn+ Zl-~ ::nJ = 1.184078) V56 = (77. Entonces.78.3 + 2.6 Tamaño de la muestra simple bajo Norma- lidad Esta sección es una presentación sucinta. Zl-%::n < J.78.a.96 kg Y 78.6.L .t [Xn .LI < Zl_~ ::nJ = 1.3 .2.X < Zl-~ ::nJ = 1 .a n P¡.t [IX n . J.009574 1.

y el valor de O" usualmente se estima por medio de una muestra llamada muestra piloto. Para estimar la diferencia de promedios entre dos poblaciones independientes. ESTIMACIÓN POR INTERVALO DE PARÁMETROS mente como n = ZI_Q.o") 2 ( __ e 2_ En esta expreSlOn corriente del tamaño de una muestra simple.2 2 2 En el ejercicio 11 de este capítulo se deduce la expresión anterior. y constituye una cota para la diferencia aleatoria IX n . Para estimar la proporción poblacional 7f.176 CAPÍTULO 3./11. e se denomina error máximo admisible en la estimación de /1. o margen de error. Con la denominación de confianza se hace referencia al valor 1 .a. ~ (Zl-eU/2 r n 1 2 1 7f Figura 3. el tamaño de muestra requeri- do es n= ( ZI :2a)2 7f (1-7f) cuyo tamaño más holgado puede adoptarse como n = (ZI: %) 2 (l) .7: Tamaño holgado de la muestra para estimar la proporción poblacional. los tamaños de muestra pueden establecerse como n =m = (Z-e-a)2 (0"1 + 0"2)' 1. en caso de no asumirlo conocido. .

a.. . el) se denomina intervalo bayesiano para e de probabilidad 1 . x n ) y ésta permite deducir directamente un intervalo para estimar el pará- metro e. .xn (eIXl. X n una muestra aleatoria de una po- blación con función de densidad fx(xle).1.a. ge(e) la función de densidad a priori de 8.. Definición 3.x2. X 2 .4 de la página 84 se dedicó a la presentación de algu- nas ideas globales de la estimación bayesiana. Sea Xl. y felxl. su máximo puede determinarse fácilmente en los siguientes términos: g'(7r) = (Zl:~) 2(1 _ 27r) g"(7r) = -2 (Zl:~) 2< O 1 g'(7r) =O cuando 7r = "2 como lo destaca la figura 3.7. cuya interpretación no es la misma que la de .. X2. .. 3.7.1. . Precisamente se definió como función de densidad a posteriori de 8 a la función de densidad condicional felxl. .···. . X2. x n ) la función de densidad a posteriori de 8. 3..x2.7 Estimación bayesiana por intervalo El numeral 2. el) se adopta como una estimación de e con pro- babilidad asociada 1 . . El intervalo (ea.. Sean ea ye l dos valores de la variable aleatoria 8 tales que entonces el intervalo (ea. .7. .. además de otras variables. ESTIMACIÓN BAYESIANA POR INTERVALO 177 pues al ser n una función de 7r.xn (eIXl.

ESTIMACIÓN POR INTERVALO DE PARÁMETROS una estimación por intervalo del 100(1 .a.1. y si la distribución a priori de 8 se establece como Normal de valor esperado f. e). dentro del enfoque bayesiano. y T~i) = ti(X l . el intervalo bayesiano de probabilidad 1 . .L ] = 1 ..L p 0"2 _ O"pO"Zl_%. que la probabi- lidad de que el parámetro se encuentre entre los valores eo y el es 1 .. X n ). f.Xn es una muestra aleatoria de una población con distribución Normal de valor esperado e y varianza 0"2 asumida como una constante conocida. [ 0"* * 0"* * El intervalo bayesiano (e o. 7. ed tiene longitud mínima escogiendo eo - --. mas sería una interpretación errónea si se tratase de una estimación por intervalo. una muestra aleatoria de una po- blación con función de densidad fx(x.. .1.a)% para el mismo parámetro.L < Z < el .L* = Zl-Q<· 0"* 2 0"* 2 De esta forma.a.25 de la página 88.= f. El lector puede contar con una extensa bibli- ografía en el tema.L p 0"2 O"PO"Zl_~) 2 2 l' 2 2 + 1 . ~ y varianza nO"p + O" 2 0"20"2 0"* = + n0"0P 0"2· Entonces P [e o < 8 < el] = p eo ..178 CAPÍTULO 3. X n . . Ejemplo 3. .2. f. X 2 .7. . ( nO"p + O" (n0"0 + 0"2) 2: nO" p + O" (nO"~ + 0"2) 2: Tanto la estimación como los intervalos bayesianos tratados en este texto son menciones tangenciales de unos conceptos que pertenecen a un cuerpo conceptual propio dentro de la estadística: el análisis bayesiano o estadística bayesiana.8 Demostración de los teoremas Teorema 3. . .L* -Zl-Q< Y el ..f. el ejemplo 2.. Sea Xl. nO"ªxn + f. Es válido entonces decir.L 0"2 riori de 8 es Normal de valor esperado f.X2.Lp y varianza O"ª. menciona que la distribución a poste- n0"2 x + f. Si X l .a bajo las condiciones establecidas es nO"ªxn + f. X 2 . si le interesa conocer a profundidad la filosofía y los métodos de este enfoque estadístico. 3.L* = p.

Corno (T2). estadísticas tales que (T2) . entonces Pe [1' ( Tr~l») > l' (T~2»)] = 1 Y el evento aleatorio {r (T.. entonces la variable aleatoria JrllWJ r/(e) (T n - l' (e)) converge en distribución a una variable aleatoria con distribución Nor- mal estándar. cuya varianza coincide con la cota de Cramer-Rao. Si r(e) es una función estrictamente decreciente.12.a = Pe [T2) < e < T~2)] = Pe [1' (T~2») < r(e) < l' (T2»)]. 3. 1. Bajo un caso regular de estimación. e). Demostración.a)% de confianza para la imagen de e bajo la función r.1' (T~2»)) es un intervalo confidencial para la imagen de e bajo 1'. si el estimador T n = t(X 1 . .a)% para la imagen de e bajo la función 1'.Xn ) es insesgado para la imagen de e bajo una fun- ción 1'.a no depende de ey Pe [1' (T~2») < l' (T~l»)] = 1. Como 1 . el intervalo aleatorio (1' (T~1») . basado en una muestra aleatoria X 1 . X 2 . . .~1») > 1'( e) > l' ( T~2») } es equivalente al evento {T2) < e < T~2)}.T~2») es un intervalo confidencial para e.X2 . D Teorema 3. .2. De manera similar. DEMOSTRACIÓN DE LOS TEOREMAS 179 i = L 2. Tr~2») es un intervalo confidencial para e es porque en particular Pe [T~l) < TrF)] = 1. por tanto.1' (T2»)) es un intervalo confidencial del 100(1 ..1' ( T2»)) es un intervalo confidencial para la imagen de e bajo l' cuando la función l' es estrictamente decreciente. cuando ésta es estrictamente cre- ciente y (1' ( Tr~2») .8. . Demostración.Xn de una población con función de densidad f X (x.1' (T~2»)) es un in- tervalo confidencial del 100(1.. (1' (T2») .cuando ésta es una función estrictamente creciente. el in- tervalo aleatorio (1' (Tr~2») . Los argumentos de la demostración de este teorema se basan en ideas circundantes a la información de Fisher y en el teorema . Si r(e) es una función estrictamente monótona con dominio e y recorrido un subconjunto de IR.

i=l . Esta variable tiene valor esperado cero y varianza 1(0).. El elemento original consiste en considerar la variable aleatoria 8 H(X.56. la sucesión de varia- bles aleatorias H(X 1 . como lo asegura el corolario 2. página 113. O) ) = ~n 808 In fx(Xi.O)]. H(X 2 . n) tal que 8 80 In (ngfx(Xi.O) dx = 80(1) = O V[H(X. O). . O)] fx(x. es porque existe una función K (O. O) dx 8 foo 8 = 80 J-oo fx(x. O) = K(O. O) dx 8 foo 80fx(x. . O)] = J-oo 80 [In fx(x.4. n n 8 ¿ H(Xi. ESTIMACIÓN POR INTERVALO DE PARÁMETROS del límite central. página 21.O)dx foo 8 = J-oo 80 fx (x. esto es. 1). Creada de esta forma la variable aleatoria H(X. n) [T n .. n) [T n .H(Xn . O) constituye una muestra aleatoria de manera que aplicando la versión de Lindeberg-Feller del teo- rema del límite central. cuya varianza es la cota de Cramer-Rao. O)] = 1(0)]. O)] i=l ~Z rv N(O. fOO 8 E[H(X.O) = 80 [lnfx(X. O). O) = J-oo 1" I /1\ fx(x. r(O)].2. teorema 1. r(O)] . O).180 CAPÍTULO 3.12. O) = E [H 2 (X. y'n1(0) y'n1(0) Como se afirma que T n es un estimador insesgado para la imagen de O bajo la función r. O) = K(O. n I: H(Xi .O) i~ (j(j [lnfx(Xi.

según el teorema 3. e) expresión de la cual se puede afirmar que nI(e) V[Tn ] = K2(e. permite garantizar. cuya varianza corresponde a la cota de Cramer-Rao. 3. Demostración. entonces para un tamaño de muestra suficientemente grande.r(e) J K2(e. cuya va- rianza es la cota de Cramer-Rao. DEMOSTRACIÓN DE LOS TEOREMAS 181 Por tanto. n) [Tn .Rao y que cumple conjuntamente las condi- ciones de regularidad con el modelo probabilístico elegido. n)V[Tn ] JV[Tn ]' Como T n es insesgado para la imagen de e bajo la función r. 1).e) .3. n)' Entonces i=l K(e.8. n H(Xi .r(e)] --. cuya varianza coin- cide con la cota de Cramer. se presentan algunas consideraciones respecto a la misma.1. que Qx = JnI(e)(Tn . un intervalo confidencial de aproximadamente 100(1 .12.r(e)] T n . Sea T n un MLE insesgado para e. lo cual finalmente permite concluir que Tn-r(e) JnI(e) d (r'(II))2 r'(e) [Tn . (r'(e))2 V[Tn ] = nI(e) . El hecho de que Tn sea MLE e insesgado para e. 1 T n = r(e) + K(e. Más allá de ser una demostración.2. o nI(iJ) Teorema 3.a)% de confianza para e es donde I(Tn ) es la información de Fisher evaluada en la estadística T n . n) t.Z rv N(O.

n.a)% de confianza para e puede realizarse mediante el intervalo confidencial Zl--'" Zl--'" ) Tn . e). y si 2 TAl) = X n. con e una cons- 2 tante.. Tn + 2 . pero pueden utilizarse los valores que generan el intervalo de longitud mínima como en los casos 1 y 2 tratados en el numeral 3. probabilidad que no depende de e y como la información de Fisher es una cantidad positiva Ón = Pe [ a JnI(e) < Tn . En concreto. confidencial para porque sus límites están dependiendo de por medio e de I(e). O < e < 1.n.1.~] =Pe [T - n b JnI(e) <e<T- n JnI(e) a] El intervalo aleatorio que sugiere esta última expresión no es un intervalo e. La probabilidad Ón es cercana a 1 . La elección de a y b puede ser hasta cierto punto arbitraria. . . Si Xl. demuestre que el intervalo (TAl). Pe [a < JnI(e)(Tn . sujeta a la relación entre a y b para garantizar el nivel de confianza Ón .Xn. TA ») es un e intervalo confidencial para y determine el valor esperado de la longitud del intervalo y su nivel confidencial. ESTIMACIÓN POR INTERVALO DE PARÁMETROS converge en distribución a una variable aleatoria con distribución normal estándar. porque en la práctica n es finito.n es una muestra aleatoria ordenada de una población con distribución Uniforme en el intervalo (O. 2. ~<B-Tn<. D 3. TA ) = (l)n e' X n n son estadísticas. .3.9 Ejercicios 1.182 CAPÍTULO 3.a.e) < b] = Ón ~ 1 . luego para un tamaño de muestra suficientemente grande. e. Qx se puede asumir como una variable aleatoria pivote para Entonces. ( JnI(Tn ) JnI(Tn ) tal como lo afirman Bartoszynski y Niewiadomska-Bugaj. una estimación aproximadamente del 100(1 .e < -----=b=] JnI(e) =Pe [. X 2 .n..a.

(Ji." .9. . de una población con función de densi- dad e-el Ix ( x. Xl. ¿es el intervalo aleatorio (Xl. 4.i-21(0. determine un intervalo confidencial para la diferencia fLl . X2.Xn . :1. .Xn .Xn . 5. de UIla población con distribución gaussiana de valor esperado fL y varianza (J2. . Si las variables aleatorias Xl.. X2. respectivamente.n) un intervalo confi- dencial del 100(1 . a partir de una muestra aleatoria Xl. de una pobla- ción con distribución Normal de valor esperado e y varianza ke 2 . ¿cuál es la relación entre el citado valor esperado y el nivel confidencial? 7. bajo el modelo gaussiano.fL2 con base en dos muestras aleatorias independientes de sus respectivas poblaciones cuyas distribuciones son asumidas como gaussianas de valores es- perados fLl. . . 8. Explore la forma de estimar por intervalo el parámetro a partir e. X2. fL2 Y varianzas (JI. EJERCICIOS 183 2. de una muestra aleatoria Xl. desconocida la varianza. e a partir de una muestra aleatoria Xl.. Explore la forma de estimar por intervalo el parámetro y 2 e.. .X2... 6. Considere el intervalo confidencial de longitud mínima para el va- lor esperado.a)% de confianza para e? 3.. proponga una forma e de estimar por intervalo el parámetro 2 . Asumiendo que el es una cantidad conocida.Xn constituyen una muestra aleatoria de una población con función de densidad Ix(x. Consiga una forma de estimar por intervalo el coeficiente de va- riación (J/fL a partir de una muestra aleatoria X l .n + ~ In a.00) (x ).Xn . X2. de una población con distribución de Poisson de parámetro e. c una constante conocida. . Suponiendo que (JI / (Ji = c. conocido el valor de k. e) = e-(x-e) 1(e. . e) -_ r(e2 l ) x el -1 e . . .00) (x).' . ¿ Cómo varía el valor esperado de la longitud del intervalo cuan- do el tamaño de muestra se incrementa? Y además.

Sea Xl. X 2. presentados en el numeral 3.1. . . El número de disconformidades de una baldosa de cerámica se mo- dela para efectos de control de calidad. basado en una muestra aleatoria censurada de una po- blación con función de densidad.a)% de confianza para O. fijo el valor e. Determine un intervalo bayesiano para estimar la tasa de disconformidades por unidad..a)% de confianza para O. La variabilidad propia del proceso de manufactura sugiere reconocer al parámetro como una variable aleatoria. X2. O)..X 2 . como una variable aleatoria con distribución de Poisson. X n . deter- mine un intervalo confidencial del 100(1 . ¿el intervalo aleatorio (Xn.2. de una pobla- ción con distribución de Pareto. una muestra aleatoria de una población con función de densidad Uniforme en el intervalo (O. prefiere utilizar? 11.3. de la página 77. para la cual se propone un modelo Exponencial de pará- metro igual a uno. 12. k una constante conocida. explore la forma de estimar por medio de un intervalo confidencial el parámetro O2 . 10. . basado en una muestra aleatoria Xl. Deduzca la expresión para el tamaño de la muestra simple requeri- do en la estimación de la diferencia de promedios en poblaciones independientes bajo Normalidad. O) = x 02 + l1(01. ESTIMACIÓN POR INTERVALO DE PARÁMETROS 9. .. 13. es decir con función de densidad 020~2 fx(x. determine el tama- ño de muestra mínimo tal que la longitud del intervalo confidencial sea por lo menos lo.~.14. 15.n.. ..O + ~). c~Xn. X n es una muestra aleatoria de una población con función de densidad Uniforme en el intervalo (O .. . ¿Cuál de los dos intervalos confidenciales para la estimación de la proporción poblacional. . Asumiendo 01 como una constante conocida. Deduzca un intervalo confidencial del 100(1 . con base en una muestra aleatoria de tamaño n.n) es un intervalo confiden- cial de longitud mínima para O? Si el espacio del parámetro es 8 = {010 < O :S k}.Xn .00)(x). tal como la presenta el ejemplo 2. Si Xl. 14.184 CAPÍTULO 3.

a)% de confianza para P[X > 1]. . .I) (x).I(O. . . X n es una muestra aleatoria de una población con función de densidad 2x fx(x. 17. Si Xl. e) = (jX o.. . . X n es una muestra aleatoria de una población con función de densidad fx(x. X2. X 2 . .l) (x).e) = eXB-II(o. X n es una muestra aleatoria de una población con función de densidad fx(x.a)% de confianza para basado únicamente en el mínimo de la muestra. Si Xl. 20. 19. con e > o. determine un intervalo bayesiano para e.B)(x). 18. e) = e2I(O.a)% de confianza para e. 3. determine un intervalo confidencial del 100(1 . . . . e) = e exp( -ex)I(o. si la distribución a priori de e es Gama con los componentes del parámetro especificados. X 2 . 100(1.Xn es una muestra aleatoria de una población con función de densidad 1 1 l fx(x.. con e > o. X 2 .oo) (x). determine un intervalo confidencial del 100(1 ..9. determine un intervalo confidencial del 100(1 . Con base en el ejercicio 16. Si Xl. . con e > o..a)% de confianza para e. . determine un intervalo confidencial del e. . EJERCICIOS 185 16. Si Xl.

"Prueba: razón. Pero decidir a favor o en contra de una aseveración que traduce una explicación apriorística de algún fenómeno particular de la realidad. contraste de hipótesis. utiliza un término que dentro de sus muchas acepciones presenta algunas asociadas con el tema. no puede entenderse como un cateo. ninguna de sus acepciones ligadas al tema es sufi- lReal Academia Española (2001). tal vez la forma más cotidiana para referirse al contenido del capítulo.A. Quizás uno de sus sinónimos que mejor resume su sentido es cateo. entre otros. cuya decisión se toma a la luz de la información de la muestra. instrumento u otro medio con que se pretende mostrar y hacer patente la verdad o falsedad de algo. docimasia de hipótesis e incluso cotejo de hipóte- sis. al volver a examinar las acepciones de cada uno de los términos utilizados se encuentra que no ofrecen la precisión semántica necesaria para enmarcar un sistema de conceptos substanciales dentro de la estructura conceptual de la inferencia estadística. Diccionario de la lengua española. señal o muestra que se da de algo" 1. contraste de hipótesis tampoco es una acertada elec- ción para la denominación del tema porque además de utilizar el vocablo contraste. término que podría introducir confusión. Prueba de hipótesis. Madrid: Espasa Calpe S. Indicio. Vigésimasegunda edición. Ensayo o experimento que se hace de algo para saber cómo resultará en su forma definitiva. 187 . como resultado de las traducciones del vocablo inglés test. Sin embargo. muy propio en el planteamiento de hipótesis en los modelos lineales o en el diseño experimental. o testing. argumento. Por otra parte.Capítulo 4 Juzgamiento de hipótesis A este capítulo tradicionalmente se le ha llamado prueba de hipótesis.

consistiría igualmente en un simple sinónimo de contraste. cit). Mostrar notable diferencia. En consecuencia.188 CAPÍTULO 4. Gran diccionario general de la lengua española. la colocaría como sinónimo de prueba. Como juzgamiento es acción y efecto de juzgar. se trata realmente de algo análogo a un juicio. entendiendo que juz- gar significa "deliberar acerca de la culpabilidad de alguien o de la razón que le asiste en un asunto y sentenciar lo procedente. Bogotá. cit). presenta más un sentido de análisis que un sentido de opción por algo a la luz de los hechos. "contrastar: ensayar o comprobar y fijar la ley. porque como se comprenderá. Y de otras de sus acepciones. particu- larmente a un juicio penal.. Docimasia como "arte de ensayar los minerales para determinar la naturaleza y proporción de los metales que contienen" 2. este texto titula al presente capítulo como Juzga- miento de hipótesis. se parte del concepto de hipótesis estadística. Para iniciar la exposición de los conceptos propios del juzgamiento de hipótesis. 2VOX. compararlas teniéndolas a la vista" (Op. pasos y conceptos en el acopio de información. que no introduce elementos adicionales para admitirlo como palabra nuclear. cit). Además. JUZGAMIENTO DE HIPÓTESIS ciente para describir globalmente esta área del conocimiento estadístico. y no habría razones para adoptarla. o condiciones opuestas. Segunda Edición. Cotejo como acción y efecto de cotejar. Editorial Presencia para Colombia. además de tomarse co- mo directriz a una de sus acepciones que condensa la finalidad de un procedimiento de toma de una decisión a favor o en contra de algo. peso y valor de las monedas o de los objetos . su origen etimológico de ensayar o probar. cuando se comparan ambas" (Op. . en la medida que vaya desarrollándose. que la inferencia estadística abstrae y estructura como una de sus partes fundamentales. con otra. siendo cotejar "confrontar algo con otra u otras cosas. su procesamiento y la decisión que se toma ante una afirmación relativa al fenómeno en estu- dio. Comprobar la exactitud o autenti- cidad de algo. es un término más cercano para estimar o para destacar que a la toma de decisiones a partir de la información de la muestra.. juz- gamiento por su parte es un vocablo que permite construir una analogía magistral entre un juicio que se realiza ante un juez y los elementos. En efecto. Decidir en favor o en contra y especialmente pronunciar como juez una sentencia acerca de alguna cuestión o sobre alguno" ( Op. (1991).

Una hipótesis estadística es una aseveración o conjetura acerca de la distribución de una población.1. la aseveración se enuncia después de la abre- viatura Ho o H¡. ELEMENTOS BÁSICOS 189 4. se denota H¡ y se enuncia como e ce -1 -. Definición 4. 4.4.1.1. e' c e se denomina hi- pótesis simple si con dicha aseveración queda plenamente especificada la distribución de la población.. el proceso de llenado debe adecuarse a ese requerimiento y deben planearse y ejecutarse los controles periódicos .1 Elementos básicos Definición 4.1. El juzgamiento de una hipótesis estadística es un proceso que cul- mina con una decisión de rechazar o de no rechazar una hipótesis con base en la información de una muestra aleatoria Xl. Como notación.1.1.1. Ejemplo 4.3.6. La díada de hipótesis nula y alterna constituye el sistema de hipótesis del proceso de juzgamiento de la hipótesis nula. . Una hipótesis H : O E e'. Definición 4. . El diseño de un producto establece un envase de 20 onzas fluidas. X n de una población para la cual se ha asumido un modelo probabilístico cuya fun- ción de densidad es fx(x. afirmación que generalmente está asociada a un subconjunto del espacio del paráme- tro e correspondiente al modelo probabilístico que representa la citada población. En caso contrario se denomina hipóte- sis compuesta. La hipótesis elegida como contraste a la hipótesis nula se denomina hipótesis alterna. en consecuencia. La hipótesis sobre la cual se estructura el proceso de juzgamiento se denomina hipótesis nul(]" se denota Ho y se enuncia como Definición 4. O). e ne -1 -o = 0. sistema que se enuncia como Ho : O E e o frente a Hl : O E el· Definición 4.5. X 2 .1. .2.

puesto que conocida la varianza y admitido = 20 como el valor esperado de la variable que representa el citado contenido. una manera consistiría en idealizar el contenido del producto en el envase como una variable aleatoria y adoptar un modelo proba- bilístico como regente de su comportamiento.5 fl oz. El sistema de hipótesis que origina el procedimiento que permite la toma de decisiones dentro de este proceso industrial particular. si en el instante de cierre del envase posterior al llenado. Para respaldar cualquier decisión con el apoyo de procedimientos es- tadísticos. siendo la preocupación central por aquellos envases que contienen más de 20 fl oz. corresponde a una hi- pótesis compuesta. Continuando dentro de este contexto industrial. se detectan envases con contenido inferior a 18. mediante la utilización de una fo- tocélula. la afirmación de que el proceso de llenado tiende a rebosar el envase. una vez se obtenga y se procese la información pertinente durante los controles. porque se trata de una afirmación que aunque lleva tácita la alusión a una variable con distribución gaussiana de varianza conocida. pues proporcionalmente al contenido adicional generan costos considerables. para dar parte de la no presencia de factores perturbadores del proceso.5 fl oz o más. queda plenamente determinada la distribución de esa variable. puede . no activan señal alguna de la fotocélula. En particular. éstos son trasladados a un proceso de reciclaje prácticamente sin costo al- guno. corresponde a e una hipótesis simple. Para el seguimiento del proceso. traducida como H : e > 20. JUZGAMIENTO DE HIPÓTESIS para tomar las decisiones a que haya lugar sobre los ajustes a las máquinas y al proceso en general. en cada período de control se recoge la información corres- pondiente al contenido de 49 envases elegidos en forma aleatoria dentro del lote de producción. la declaración H : = 20 indicativa de que el proceso de llenado está centrado de acuerdo con el requerimiento del diseño. con la finalidad de decidir si deben realizarse ajustes a las máquinas o al proceso en general. como parte del aprestamiento para el control estadístico de calidad del proceso. Por su parte. con valor esperado y bajo el supuesto de varianza cono- e cida. o.190 CAPÍTULO 4. por el con- trario. no identifica una distribución singular. si se elige el modelo gaussiano como el más idóneo para representar el contenido e mencionado. mientras que los recipientes que contienen 18.

Xn ) E CT. El conjunto CT. X2. cuyos valores particu- lares se generan por un procedimiento aleatorio adicional. 4. El conjunto X .n". . ELEMENTOS BÁSICOS 191 formularse así Ho: 0=20 frente a H1 : e > 20. regla o norma que permite tomar la decisión a que haya lugar.n se denomina región crítica o región de rechazo del test para juzgar a Ho y el test así definido se denomina test no aleatorizado. El proceso de juzgamiento de la hipótesis nula con- lleva un procedimiento. Un test T recibe la denominación de test alea- torizado para el juzgamiento de la hipótesis nula H o.X2.1.1.. representada por la hipótesis alterna H 1 . .8.1.9. Como notación.1. y está definido como T: "Rechazar Ho si y = 1". el test se enuncia después de la letra T. denominado test.n está determinado por su respectivo test así: T: "Rechazar la hipótesis Ho si (Xl...n recibe el nombre de región de aceptación del test para juzgar a Ho. El test utilizado dentro del proceso de juzgamiento de la hipótesis nula H o. Este subconjunto denotado por CT. Definición 4. tiene vinculado un subconjunto del espacio de las observaciones X. sistema entendido como el juzgamiento de la aseveración de que el pro- ceso está controlado o equivalentemente que está centrado en 20 fl oz. . determina la probabilidad de éxito de una variable aleatoria Y con distribución de Bernoulli. si la función '1fJT calculada en los valores observados de una muestra aleatoria. Definición 4. declaración concretada en la hipótesis nula Ho Y enfrentada con una manifestación de una situación alternativa relacionada con la inconve- niencia de producir unidades con contenido superior al establecido por el diseño del producto. x n ) < 1. A la función '1fJT se le denomina función crítica del test aleatorizado T. con O < '1fJT(Xl. .7. .CT. . Definición 4.

con la de- cisión de un juez o tribunal. en el juzgamiento de hipótesis estadísticas se corren riesgos semejantes.27 fl oz. Como en la analogía acogida.1. es factible concluir el correspondiente proceso judicial con una decisión ajustada a las normas procesales y a la naturaleza de las pruebas.1. JUZGAMIENTO DE HIPÓTESIS Como los tests aleatorizados no son del interés de este texto. De manera similar a los errores en los cuales se puede incurrir en el juzgamiento de una persona. CT . el otro en no rechazar una hipótesis nula en el caso de ser falsa. permite no reportar novedad alguna en el desarrollo del proceso. pero en realidad no acertada en cuanto a la verdad de los he- chos. en caso contrario no rechazarla". Cualquier decisión que se tome en el juzgamiento de una hipótesis estadística lleva consigo el riesgo de incurrir en una opción equivocada. norma que permite optar por la exploración y remoción de causas ex- trañas al proceso responsables de la no adecuación a los requerimientos. Un test propuesto para el juzgamiento de Ho dentro del sistema de hipótesis del ejemplo 4.10. . por consi- guiente. el proceso de juzgamiento de una hipótesis nula culmina con una decisión: ya sea rechazar la hipótesis nula cuando hay evidencia estadística para hacerlo o al no contar con dicha eviden- cia para rechazar la hipótesis. el juzgamiento de una persona en un tri- bunal o juzgado. o a los culpables que gozan de libertad ple- na.27. cuando el señalado promedio es a lo sumo 20. la de optar por no rechazarla. Cuando se traducen apartes de las explicaciones previas o provisio- nales de un fenómeno a afirmaciones de carácter estadístico. La región crítica asociada a este test es. X49)lx49 > 20.49 = {(Xl. Así como un proceso judicial termina en forma normal. X2.6 es T : "Rechazar Ho si X49 > 20. Uno de ellos consiste en rechazar una hipótesis nula cuando la hipótesis es verdadera.192 CAPÍTULO 4. verdad que no siempre el juez puede conocer enteramente. por ello repetidamente se mencionan expresiones relativas a los inocentes que se encuentran purgando penas. Por otra parte. Ejemplo 4. cualquiera de las decisiones puede ocasionar una equivocación o error. si el contenido promedio en una muestra aleatoria particular de 49 en- vases supera las 20. debe entenderse que dentro del contenido del presente capítulo el término test hace mención únicamente a los tests no aleatorizados.27}. En este sentido.···.27 fl oz. es decir.

'" . ()) y sea además T un test no aleatorizado para el juzgamiento de la hipótesis nula Ho : () E 8 0 definido como T: "Rechazar Ho si (XI. .. siendo verdadera la hipótesis.n . se designa como error del tipo 11 a la decisión de no rechazar la hipótesis nula siendo ella falsa.1.. La función SZ (XI.X2.X2. o al supuesto de que la afirmación fuese verdadera. debe entenderse que la afirmación de la frase precedente a alguna de las expresiones mencionadas.n siendo C~.xn ) = x~ E CT. siendo cierta la hipótesis . " .12. Sea Xl. Dentro del proceso de juzgamiento de la hipótesis Ho se denomina error del tipo 1 a la decisión de rechazar H o.'" . . el objetivo inmediato es la toma de una decisión frente a la afirmación que determina la hipótesis a la luz de la información conteni- da en los datos acopiados. . ELEMENTOS BÁSICOS 193 cuando se formalizan hipótesis estadísticas. la concisión y denominación de cada uno de estos errores se indica en la definición siguiente. Definición 4.x n ) E CT.n = X .Xn una muestra aleatoria de una población con función de densidad fx(x. éstas heredan la veracidad o falsedad acorde con la explicación apriorística del fenómeno..11. Como los errores en los cuales se puede incurrir cuando se toma la decisión están dependiendo de la real o supuesta veracidad de la hipóte- sis.n SZ x~ E C~. Esa ve- racidad o falsedad inmanentes a la incertidumbre misma que motiva la realización de la investigación no son directamente el objetivo de su juz- gamiento. En este sentido es pertinente precisar que cuando se utilizan expresiones como "bajo la hipótesis . En resumen: Decisión Ro Rechazar Ro No rechazar Ro Cierta Error del tipo 1 Correcta Falsa Correcta Error del tipo JI Definición 4.CT. X 2 . o a otra similar.1. está condi- cionada a la veracidad de la hipótesis en consideración.. 4.. .1.n". asimismo.

. entonces el error del tipo 1 puede calcularse como P(Jo ['l/!T(X~) = 1] . . e). X n una muestra aleatoria de tama- ño 10 de una población con distribución de Bernoulli con parámetro e.n. calcular este error del tipo 1 corresponde al cálculo de la probabilidad de rechazar la hipótesis nula dado que el valor del parámetro es e = eo. el error del tipo 1 no sería único. T "Rechazar Ho si ¿ Xi > 9".13. en una situación relativa a una hi- pótesis nula compuesta. ~ dentro del sistema. Sin embargo. (JE8 -o Ejemplo 4. sería un conjunto de errores del tipo 1. "4 frente a 3 H 1 : e > "4 10 se propone el test. i=l P. el tamaño de la región crítica CT. Sea Xl.. Si la hipótesis nula Ho : e = eo es una hipótesis simple. se adopta como uno de los elementos constituyentes en la construcción.1. Definición 4.14. La siguiente definición hace referencia a ello. X 2 . El máximo del conjunto citado. Para juzgar la hipótesis nula Ho : e s. puesto i=l 10 que ¿ Xi rv Bin(10. Entonces. en la caracterización o en la evaluación de un test. 3 Ho : e s. es decir la aseveración alude que la distribución de la variable representativa de la población está plenamente determinada.1. Dicho de otra manera.. JUZGAMIENTO DE HIPÓTESIS se denomina función crítica del test no aleatorizado T. y si además dicha hipótesis se asume verdadera.194 CAPÍTULO 4. la mayor probabilidad de rechazar la hipótesis nula siendo cierta. que se refiere a una variedad de distribuciones. [~Xi ~ 9] = C~)9' + G~)91O(l ~ 9)° = 109' ~ 99 10 . El tamaño del test T. la probabilidad de error del tipo lo nivel del test T se denota usualmente por a y está definido como a = m~xP(J ['l/!T(X~) = 1] .

conjunto que contiene a 8 1 .] LXi 2: 91= 10 [ i=l ma~ (100 9 (}E(O. entonces el subconjunto de valores de 8 asociados con la falsedad de la hipótesis nula será 8 . a = 0. ¿Cuál de los dos errores que se pueden cometer en el juzgamiento de hipótesis estadísticas es el más grave? La respuesta realmente es que en forma general no se puede evaluar su gravedad. tal vez habitualmente menos aludido que el error del tipo I. pero cuando 8 1 #.01. en cuyo caso el sistema de hipótesis está conformado por hipótesis antitéticas. denotado frecuentemente por {3. si el propósito es remplazar un medicamento existente por uno nuevo con base en el análisis de su eficacia. Entonces cabe preguntarse: ¿qué significa que Ho se considere falsa? Si 8 1 = ~.:¡.244. y evaluar la citada . un poco más complejo porque la probabilidad de no rechazar la hipótesis nula se cal- cula bajo la consideración de que la hipótesis nula es falsa. De manera afín al cálculo del error del tipo I. ELEMENTOS BÁSICOS 195 luego ma~ p(} (}E(O. entonces H o es falsa cuando H 1 sea considerada cierta.05 y a = 0. Este hecho pone de manifiesto que si Ho se asume como falsa no implica necesariamente que H1 sea verdadera.:¡.8~. y aun cuando es un elemento que dentro del proceso de juzgamiento de hipótesis es contro- lable y elegible arbitrariamente.] - (3) 90 10 ) = 10 4" 9 (3) . El error del tipo n. Por ejemplo.1.8 0 . por supuesto debe corresponder a una probabilidad relativamente pequeña. respectivamente. pero igualmente esencial. se puede generar una variedad de errores del tipo n correspondientes a cada situación particular indicativa de la falsedad de la hipótesis nula. podría asumirse el modelo de Bernoulli para representar si la aplicación del medicamento en un tipo de paciente surte el efecto esperado o no. el nivel del test se entiende como la mayor proba- bilidad de tomar una decisión incorrecta asumiendo verdadero cualquier valor del parámetro O asociado con la hipótesis nula. niveles que generalmente se les conoce como niveles del 10%. cada caso particular permitirá valorar las implicaciones de una decisión errónea. En otras palabras. es otro elemen- to constitutivo del proceso de juzgamiento de la hipótesis nula. 5% y 1%. es usual asumirlo como alguno de los tres niveles: a = 0. puntualización ésta que no se puede pasar por alto cuando se realiza el cálculo del error del tipo n. 4.1.9 4" 10 = a ~ 0.

Con la ayuda de la infor- mación financiera de la compañía farmacéutica. De esta manera se controla el error del tipo 1. y el cálculo o la determinación del error del tipo n estaría sujeto a esta elección de a. La primera decisión implica pérdidas para el laboratorio productor. mientras que la segunda involucra pérdida de rentabilidad. mientras que el error del tipo n radica en abstenerse de colocar en el mercado un medicamento más eficaz que el vigente. o se trata de un medicamento para la cura de un determinado tipo de cáncer? Como se deduce de lo anterior. si e denota la probabilidad de que el efecto de la aplicación del nuevo medicamento en un paciente sea el esperado y si el fármaco existente tiene una eficacia cuantificada en eo. La afirmación de que el nuevo medicamento es a lo sumo tan eficaz como el actual. De esta manera. algunos autores sugieren que se establezca el sistema de hipótesis orientado por la con- vención de que el error del tipo 1 es más serio que el error del tipo n. Pero desde el punto de vista de salud pública. mientras que para una situación específica sí existe mayor factibilidad de hacerlo. esta sugerencia es más una invitación a valorar la magnitud de los potenciales errores en . el error del tipo 1 consiste en colocar en el mercado un medicamento con menor o igual eficacia que el actual. puede establecerse el siguiente sistema de hipótesis: Ho : e :S eo frente a H1 : e > eo. o lo que es equivalente se regula el nivel del test. las decisiones pueden valorarse contrariamente. Sin embargo. ¿Es más grave consumir un fármaco de menor calidad que no tener la posibilidad de utilizar uno altamente eficaz? Se obliga precisar con mayor detalle el contexto propio para valorar las implicaciones de la decisión: ¿se trata de un medica- mento contra el resfriado común. puede establecerse cuál decisión sería más costosa. En caso de poder es- tablecer la preponderancia de uno de los dos errores. ésta se encuentra explícita en el párrafo anterior: mantener el medicamento vigente o remplazarlo por el nuevo medicamento. Entonces.196 CAPÍTULO 4. en esta situación particular. Respecto a la decisión que debe tomarse. traducida a lenguaje estadístico corresponde a la hipó- tesis nula en este sistema. JUZGAMIENTO DE HIPÓTESIS eficacia por medio de una muestra de pacientes a los cuales se les ad- ministre el medicamento. no se puede hablar en términos abso- lutos cuál de los errores es más oneroso.

<I> [v'49 (20.5%. Del contenido de la tabla 4.52) = 0. pueden ser calculadas y comparadas para varios valores de (). Si se pretende elegir un test con nivel inferior al 5%.00587.3 (J = 20.10 y estableciendo el valor de la desviación estándar como 0.0034 0.9997 0.20)] = 1 .0677 0.9993 0. para tres test particulares.27.270. porque P2a [X49 > 20. Los temas de próximas secciones están justamente relacionados con la construcción de los mejores tests.9 (J = 20.5372 0.1.6456 0. se deduce la superioridad del tercer test. Retomando el ejemplo 4.0004 7"3 0.2877 0.7432 0.0159 0.5 (J = 20.75 fl oz.1: Compilación de probabilidades de error del tipo II.1 (J = 20.0076 0. construcción basada en métodos . los niveles de los test 72 y 73 son respectivamente del 1.1.00587 De igual manera.75. según algunos supuestos valores de (j.15.6 7"1 0.27J = 1 .1125 0. un caso determinado y no debe tenerse como principio inquebrantable.8477 0.9981 0. los tests en comparación cumplen la exigencia y aunque con mayor error del tipo 1. en caso contrario no rechazarla".255% y 2. 73 : "Rechazar Ha si X49 > 20.0001 Tabla 4.2005 0. tanto la probabilidad de error del tipo 1 como la probabilidad de error del tipo II. 71 : "Rechazar Ha si X49 > 20. en caso contrario no rechazarla".4 (J = 20. ELEMENTOS BÁSICOS 197 Probabilidad de error del tipo 11 Test (J = 19. El nivel del primer test es a = 0.9437 0.3897 0. el tercer test presenta persistentemente los menores valores de la probabilidad de error del tipo II dentro del rango de valores de () señalados en la tabla mencionada.24. 4.0010 7"2 0.1. en caso contrario no rechazarla".9043 0. <I>(2.1 y de los niveles de los tests en con- sideración. utilizando cada uno de los siguientes tests.2 (J = 20. Ejemplo 4.0381 0. 72 : "Rechazar Ha si X49 > 20.21.

definida como 7rT(B) = Po [1PT(X~) = 1] .1. La calidad de un test. El buen uso de la estadística además de ser realizado según principios éticos. Es preciso acudir a los cánones estadísticos para evaluar la condición de cada procedimiento elegible al utilizarlo. no justifica la utilización de cualquier herramienta para abordar la explicación. es examinada desde varios puntos de vista pero connaturalmente desde su capacidad de re- chazar la hipótesis nula bajo presuntos escenarios relativos a valores del parámetro.7rT(B). Definición 4. El tiempo que una persona requiere para comprar una tarjeta de ingreso en el sistema de Transmilenio en la estación de Alcalá durante el 2002. La función de potencia denotada como 7rT (B) es una función con dominio 8 y recorrido el intervalo (0.18. consiste en la elección y aplicación de los mejores procedimientos disponibles para el logro de los objetivos en una situación particular.17. perspectiva conocida como la potencia de un test. al configurarse como la estrategia fun- damental para la toma de decisiones estadísticas. Cada uno de los procedimientos de la inferencia estadística está re- comendado por medio de una certificación relativa a su propósito. las mejores estimaciones por intervalo se logran a través de intervalos confidenciales construidos con base en buenos es- timadores puntuales pero esencialmente por su mínima longitud.16. Siendo 8 1 = 8~ la función f3T(B) = 1 . Sea T un test no aleatorizado para el juzgamiento de Ha con función crítica 1PT(X~). el analista estadístico como el usuario ocasional de la estadística. Los buenos estimadores son elegibles a la luz de los requisitos tratados en el segundo capítulo. ha mostrado un comportamiento que sugiere el modelo Uniforme en el intervalo (O. por su parte. JUZGAMIENTO DE HIPÓTESIS con alcances mucho más generales que lo logrado en el ejemplo inmedi- atamente anterior.1. Ejemplo 4. se tratará a partir de la siguiente definición inicial conocida como función de potencia.1. es llamada curva característica de operación o curva CO del test T. Se afirma .1). des- cripción de un fenómeno o para la toma de decisiones frente a él. La incertidumbre con la cual trabaja tanto el investigador. B) para su descripción. Definición 4. Siendo ésta la directriz de la construcción y evaluación del desempeño de un test.198 CAPÍTULO 4.

9] = Pe[Xn.1. ELEMENTOS BÁSICOS 199 que el tiempo máximo de permanencia en la fila está entre dos y tres minutos. La función de potencia del test propuesto es 7r T (e) = Pe[Xn. y se propone la utilización del test T : "Rechazar Ho si xn. se va a registrar el tiempo empleado por n personas que serán elegidas por medio de un procedimiento especial de muestreo en la rampa de ingreso.n :s. FXn.9 o si xn. 1.9)n + (B 1+ B .9" para el juzgamiento de la hipótesis nula Ho en el sistema Ho: e E [2.1: Gráfico de la función de potencia correspondiente al ejemplo 4.n :s.9] + Pe [Xn.n (2.9.3].9] = 1 + FXn. . 1.1.n (1.n > 2.9.9. e) 7rT (O) = I(0.(2.00) (O) cuya representación gráfica se observa en la figura 4.n > 2. 4.18. 2.1.9] + 1 .n :s. Para evaluar la afirmación y tomar los correctivos del caso.9)n] B I(2.9)n I(1. [2.3] frente a H1 : e rJ.n :s. 1.9.Pe[Xn.9] (O) + [(1.2.9] (O) 1. 1 2 3 4 5 Figura 4. e) .1.

le (O) -o o equivalentemente la curva CO ideal del test T se establecería como f3T(O) = 1 . la función de potencia de un test T sería nAO) = 1 .9 O Figura 4. .le (O).2: Gráfico de la función de potencia ideal correspondiente al ejemplo 4.'lr T(O). Evidentemente.18. La funciónde potencia ideal para el ejemplo anterior tendría la forma que muestra la figura 4.Po ['ljJT(X~) = 1] OES2o OES21 o dicho en otra forma si mª-x 'lrT(O) :S miP. El concepto de la consistencia de un test. contar con una cantidad suficiente de información de excelente calidad.19.1. JUZGAMIENTO DE HIPÓTESIS Idealmente. Definición 4.1. Como se señaló en el capítulo 2. es la formalización y compendio de esta evidencia. El test T con función crítica 'lf\(X~) se dice que es un test insesgado para la hipótesis Ho si mª-xPo ['ljJT(X~) = 1] :S miP. OES2o OES21 El tamaño de la muestra reveló sus efectos en la estimación de pará- metros y ahora nuevamente se manifiesta como un elemento trascenden- tal en la toma de decisiones basadas en información estadística.9 2.200 CAPÍTULO 4. la calidad y la cantidad de información con la cual se cuenta para llevar a cabo procesos de inferencia estadística son dos ejes esenciales sobre los cuales se sustentan los alcances de los procesos.2 'lrT(O) 1 • 1. permite tomar decisiones acertadas sin mayores ries- gos. presentado a través de la siguiente definición.

se considera a Ho Y Hl como hipótesis simples. Teniendo en cuenta un sistema de hipótesis como en el precisado en la definición 4.20.2. de una población con función de densidad fx(x. X n . además de describir perfectamente el compor- tamiento de un test ante cualquier valor del parámetro. n = 1. O). es la directriz de la construcción de tests. TESTS MÁS POTENTES 201 Definición 4. En ese sentido. Definición 4.1fT (Ol) es la . basado en una muestra aleatoria Xl. Si dentro del proceso de juzgamiento de la hipótesis nula H o.1. conformando el sistema de hipótesis Ho: O = 00 frente a Hl : 0=0 1 .1. como ya se mencionó. 1fT ' (00) = a. la expresión potencia del test se deja exclusivamente para referirse al valor de la función de potencia para un elemento particular del espacio del parámetro. Como precisión semántica.2 Tests más potentes La función de potencia. . 2.. .2. Esa construcción o evaluación fija la atención sobre el valor o valores particulares de la función de potencia para uno o varios valores específicos del parámetro.. el test r* con nivel a se dice que es más potente para Ho que cualquier otro test T para H o. la siguiente sección inicia lo pertinente a la idea de test más potente. dicho test recibe la denominación de test consistente para H o. con nivel menor o igual a a. si 1. de inmediato se advierte que 1 .2. lim Po ['l/JTn (X~ = 1)] = lo n-->oo 4. en especial para valores del parámetro asociados con la hipótesis alter- na. para la hi- pótesis nula Ho : O E 8 0 frente a la hipótesis alterna Hl : O E 8 1 = 8~. Siendo T n un test de nivel a.2. así varios autores se re- fieran a ella como la probabilidad de rechazar Ho siendo Hl verdadera. si para cada O E 8 1 . 1fT* (0 1 ) 2: 1fT (0 1 ). 4.•. . .1. X 2 .

. Xl. Si el sistema de hipótesis de juzgamiento de la hipótesis nula Ho es un sistema de hipótesis simples Ho: 0=00 frente a Hl : 0=01 . JUZGAMIENTO DE HIPÓTESIS probabilidad de ocurrencia del error del tipo Il al utilizar el test T.2.. X2. O). X ) n n TI fX(Xi. Ot) i=l Teorema 4. Si el sistema de hipótesis es Ho: 0=00 frente a Hl : 0=01 . . un test más potente de tamaño a es aquel que induce menor j3. tal como lo logra el resaltado test T* de la aludida definición.202 CAPÍTULO 4. X n ) TI fX(Xi. revela un procedimiento para la construcción de tests con menores errores del tipo Il. manteniendo el control del error del tipo 1 viene a cooperar el teorema de Neyman y Pearson. es decir. En estas condiciones.. 00) i=l An = L(Ol. . . X2. . Con el propósito de minimizar el error del tipo Il.. un test definido como T: "Rechazar Ho si An < k" recibe la denominación de test de razón simple de verosimilitudes siendo n L(Oo. Sea Xl.···.2.2. O). X n una muestra aleatoria de una po- blación con función de densidad fx(x.· . . en un sistema de hipótesis simples. Definición 4. . Sea Xl. Xl. que a continuación se presenta y permite deducir una forma de obtención de tests más potentes..3 (Lema de Neyman Pearson). Para aprestar su enunciado es menester contar con la siguiente definición. X2. X n una muestra aleatoria de una población con función de densidad fx(x. X 2 .

.tI· Conviniendo que ¡.Xn es una muestra aleatoria de una po- blación con distribución Normal de valor esperado ¡.. .Od < IIfx(xi'Oo) es decir.t6 . si k > An.. Od > II fX(Xi.. ¡.tI) ti=l Xi .to frente a H1 : ¡. 4. siendo k una constante positiva y 11"7(00 ) = 0:.4..t = ¡. sz k IIfx(xi..tI) < In k"..to . Ejemplo 4. Si Xl... en el sistema H o : ¡.t = ¡.tI > ¡. .2: 2 (¡.t y varianza conocida (72. Simplificadamente equivale al test conseguido a partir de operaciones convenientes n T : "Rechazar H o si LXi> e" . i=l i=l es un test más potente para H o. determinar un test más potente para H o.2. TESTS MÁS POTENTES 203 el test T cuya función crítica corresponde a n n II fX(Xi.to..2. X 2 .. i=l . ( r' si k 0) esto es. El test de razón simple de verosimilitudes para Ho dentro del sistema establecido puede formularse como que equivale a T: "Rechazar Ho si :2 (¡..¡. i=l i=l 'lj!T(X~) = n n 0.. si k < An.

B). Si el sistema de hipótesis en el juzgamiento de la hipótesis nula es Ho : B E 8 0 frente a Hl : B E 8 1 .Xl.""X n ). así PJ. <p (Vn (~ - u /LO)) .1'0) ) Vn(~-JLo) luego n = Zl-a. U La idea de la razón simple de verosimilitudes da pie para presuponer que ese concepto puede originar un concepto más general que abarque aquellas situaciones en las cuales el sistema de hipótesis incluya al menos una hipótesis compuesta.LO [X n > ~] n = 1. . En efecto. .""X n ) = A( Xl.204 CAPÍTULO 4. Sea Xl. . _ BES¿o ~~---- An - su!?L(B.. La siguiente definición formaliza dicho concepto..X2.X2. de donde puede determinarse la constante e u en mención.X2. la razón generalizada de verosimi- litudes hace referencia a un sistema de hipótesis como el mencionado.Xl. con 8 1 = 8 . . X2. JUZGAMIENTO DE HIPÓTESIS La constante c puede ser determinada una vez haya sido adoptado un valor específico de a.8 0 . la razón generalizada de verosimilitudes corres- ponde al cociente s~ L(B. . /Lo) > Zl-a".LO [t ~l Xi > el = a = PJ. Dicho en otros términos: 1.5. X n una muestra aleatoria de una po- blación con función de densidad f x (x." ~ <P ( Vn (~a . BES¿ . pero con la especificidad de estar constituido por hipótesis antitéticas.Xn ) . Definición 4.2.. Nótese que el test también puede enunciarse como T: "Rechazar Ho si Vn (x n .

. U2.tj y desviación estándar O"j. como forma especial de juzgar- la. . O2. entonces la variable aleatoria -21n(AN) converge en distribución a una variable aleatoria con distribución Ji-cuadrado con v grados de libertad. An E (0. siendo L(Ol. un test de razón generalizada de verosimili- tudes puede presentarse en una forma especial correspondiente a T: "Rechazar Ho si . El denominador de An es la función de verosimilitud evaluada en el estimador máximo verosímil de O. .. . ul. Bajo estas condiciones. Bajo condiciones de regularidad.2. y de esta manera se puede establecer una forma especial del test.. Sin embargo algunas veces la exploración de la citada distribución no es factible. v = l -lo.2. Ol. . TESTS MÁS POTENTES 205 Acerca de An objeto de la definición 4. de manera que la variable que represen- ta a la población j tiene valor esperado ¡. X j1 .2.21n(AN) > XLa(v)". Teorema 4.6. Según estas consideraciones. .2. X j2 .UN) la función de verosimilitud de las variables aleatorias Ul.2. .. .5 es conveniente puntualizar lo siguiente: 1. la variable aleatoria -21n(A n ) puede manejarse como una variable aleatoria con distribución Ji-cuadrado. . pero esto no siempre sucede. j = 1. . . . An es un valor particular de la variable aleatoria 2.. El juzgamicnto de la homoscedasticidad ha inducido el desarrollo de varios tests. como lo indica el siguiente teorema.1]. k.2. Este ejemplo. Bajo ciertas condiciones. y por ello en muchas oportunidades es necesario recurrir a tests equivalentes derivados del comportamiento de An.6. Ejemplo 4. pero se puede contar con un tamaño de muestra relativamente grande.. El conocimiento de la distribución de An permite consecuentemente la formulación definitiva del test.. . U2. Se consideran k poblaciones independientes asumiendo para cada una de ellas el modelo gaussiano. correspondiente a la población . UN Y lo el número de componentes especificadas por la hipótesis nula. 3. . 4. dentro del juzgamien- to de la hipótesis nula.Xjnj repre- senta la muestra aleatoria de tamaño nj.7. es una ilustración del teorema 4.

. V2 . - _ .···.2 vk frente a HI : no todas las varianzas son iguales.···. J i=1 nj • La estimación máximo-verosÍmil de (J"J es .Xj)2. . X12. XI2.nl' .tk.206 CAPÍTULO 4. X knk ..2 _ ... j=1 i=1 . J i=1 • La estimación máximo-verosímil del valor común (J"2 bajo la hipó- k nj tesis nula es lv ¿ ¿ (Xji . J-tk. Xl n1 .tj E IR.. X k2 .. Entonces L = k j=1 i=1 1 exp {1__2 (X.ft")2} rr rrnj V27i(J"j J (J"j J . vI . .... ¿ (Xji . supL e La determinación de AN = -o L requiere los siguientes elementos: sup ª nj • La estimación máximo-verosÍmil de ¡. expresada en términos de sus varianzas. especificadas por ésta. ¡.t2. JUZGAMIENTO DE HIPÓTESIS J.. .l.···. Xknk) de las N variables aleatorias X l l .2 _ .. ¡. ' Xkl.. donde N = ¿ nj.•. .. se puede traducir en la hipótesis nula que forma parte del siguiente sistema: = . La función de verosimilitud L = L (J-tl' J-t2. (J"2)I¡. ¿ Xji = Xj. . ar. .Xj)2. XI. n incluye l = 2k componentes. .. a~..tI.. (J"2 > O} determinado por la hipótesis nula. por otra parte denotan- j=1 do por (J"2 el valor común desconocido de las varianzas de cada población.l0 . Xl1.···. incluye lo (k + 1) componentes.. Xk2.. La homoscedasticidad entendida como la característica de que un grupo de poblaciones tienen la misma dispersión.···.i .. 8 0 = {(¡.tj es . a~. Xkl..

si se cuenta con muestras relativamente grandes.(k + 1) = (k . siendo m~Po ["pT (X~) = 1] = a y k una constante OE8 -o positiva. un test T cuya función crítica corresponde a sz k> An sz k < An recibe la denominación de test de razón generalizada de verosimi- litudes de nivel a. .1) grados de libertad.2.2.00) (x).2.lo = 2k . .2. 4. Ejemplo 4. TESTS MÁS POTENTES 207 Con lo anterior pero la determinación de la distribución de AN es una tarea muy in- trincada. La sigla LRT (likelihood ratio test) se utiliza frecuentemente como abreviatura para referirse a un test de razón de verosimilitudes. O) = Oe-ox 1(0. Por ello.9. Conforme con la definición 4. O) definida como fx(x. Por tanto. X 2 . X n es una muestra aleatoria de una po- blación con función de densidad fx(x. Si Xl.8.5.•• . denominación ésta que cubre tanto a los tests de razón simple de vero- similitudes como a los tests de razón generalizada de verosimilitudes. -21n(A N ) converge en distribución a una variable aleatoria con dis- tribución Ji-cuadrado con v = l . se le puede tratar como tal y por consiguiente el test puede enunciarse como T: "Rechazar H o si Definición 4.

n Xn o T: "Rechazar Ho si xn()o < 1 y (()ox n )n e -n(Box n-1) < k"..xn ) BEª- = (! Xn )n e..X1.4. el test de razón generalizada de verosimilitudes se puede enunciar como 1 ()ne-Bonxn T: "Rechazar Ho si =- xn > ()o y (o)n _1 < k" e.X1. Remplazando ()oxn = y.X1.X2.. . ..Xn ) = _ 1 O<B<Bo { ()üe-Bonxn cuando =. En consecuencia. . yn e-n(y-1) < k.n y con el apoyo de la figura 4. JUZGAMIENTO DE HIPÓTESIS determinar un test de razón generalizada de verosimilitudes para el juz- gamiento de Ho en el sistema Ho : () ~ ()o frente a H1 : () > ()o· n -B L: Xi Como L((). el test puede enunciarse como T : "Rechazar Ho si ()ox n < ko" .L(().> ()o Xn ¡ Luego 1 ~ 08e-~onX" cuando =- Xn ~ ()o An 1 cuando =- Xn > ()o Por tanto. si y sólo si y < ko. ..3 1 ( Xn =.208 CAPÍTULO 4.)n e -n cuando =- 1 Xn ~ ()o sup L(().X2. . .X2. nótese que yn e -n(y-1) tiene máximo cuando y = 1 y dado que y < 1. como se deriva de la figura 4.Xn ) = ()ne i=l y además SUE..

1).2. correspondiente al ejemplo 4. según la locali- zación de 00. Definición 4. TESTS MÁS POTENTES 209 L(O) L(O) Figura 4. Si dentro del proceso de juzgamiento de la hipótesis . pues de la última igualdad se obtiene el valor de ko. de la siguiente manera: n porque 00 I: Xi rv Gama(n.2. El nivel de test puede determinarse ahora. 4.10.3: Determinación del supremum para O < 00. siendo por supuesto nko el correspondiente percentil a. A partir de este punto es posible re- i=l definir el test.2.9.

sup 7rT * (O) = ü.4: Representación gráfica de la equivalencia del test de razón generalizada de verosimilitudes con el test final del ejemplo 4.210 CAPÍTULO 4. . UMP.9. oEflo 2.8 0 . para Ho con nivel ü si 1.2. Determinar un UMP para Ho en el sistema de hipó- tesis Ho: 0=00 frente a H 1 : O > 00 . . nula Ho se considera el sistema de hipótesis Ho: O E 8 0 frente a H1 : OE 8 1 siendo 8 1 = 8 . basado en una muestra aleatoria Xl.. JUZGAMIENTO DE HIPÓTESIS yn e -n(y-1) 1 k ko 1 y Figura 4.11.. . 7rT*(O) 2': 7rT (O) para todo O E 8 1 y para todo test T con nivel menor o igual a ü.2. Ejemplo 4. X n de una población con función de densidad fx(x.00) (x). el test T* se denomina test uniformemente más potente. X 2 . O) = Oe-ox 1(0.

4.2. como n T : "Rechazar Ho si 2:= Xi < e". de manera que el test n T: "Rechazar Ho si 2:= Xi < e" i=l es UMP para Ho en el sistema Ho : e = eo frente a HI : e > eo.2. i=l Este test es más potente para Ho en cualquier elección de el > eo. TESTS MÁS POTENTES 211 En el sistema de hipótesis Ho : e = eo frente a HI : e = el y conviniendo que el > eo.3. . página 202). un test más potente para Ho puede obten- erse a partir del lema de Neyman Pearson (teorema 4. Siendo n -()o ¿ Xi e~e i=l An = n -()1 ¿ Xi efe i=l el test más potente para Ho en este último sistema está formulado como eo)n -(()O-()l) f Xi T : "Rechazar Ho si ( el e i=l < k" o T: "Rechazar Ho si tXi < e ~e In [(~l)n k] " i=l lOO o de manera más simple.

. Sea Xl. O). X n ). . i=l L(01.· .14. O)} tiene MLR en la estadística T = t(X l . X2.X2 . X2. . x n ). la constante c puede determinarse de la siguiente forma: a = p. 1. .Xn ) < tal = a entonces el test T: "Rechazar Ho si t(Xl. puesto que 01 < O2 .2.12. Xl. . X n una muestra aleatoria de una población con función de densidad fx(x. ... . Xl.Xl. Xl.X2. X2. .. En efecto.2.. O)}. i=l Teorema 4. ( 0 )..212 CAPÍTULO 4.. La familia de densidades de Poisson tiene razón mo- n nótona de verosimilitudes en 2:= Xi.. Definición 4. .. . O E e ~ IR se dice que tiene razón monótona de verosimilitudes. . Xn ) ( 2 n la cual es una función no creciente de 2:= Xi. .=1 L(02.. en la estadíst. [t Xi < el = ¡O e 1 __ (rtn-le-Ootdt r(n) O c es entonces el percentil a de una Gama(n.. x n ). para un nivel preestablecido del test. X 2. . . .. Una familia de densidades {Jx(x.. x n ) < ta" . .xn ) O 'f Xi e-n(Ol-02) 01 ) . X 2. ..2.· . para cada 01 < O2 o no decreciente de t(Xl.ica T = t(X l . . X2.. Xn ) L(02. .···.. MLR. X2.. X2. O E e ~ IR Y la familia {Jx(x. Xn ) es una función no creciente de t(Xl. Ejemplo 4. JUZGAMIENTO DE HIPÓTESIS Finalmente. el cociente L(Ol. X 2. Si la razón monótona de verosimilitudes es no decreciente y si ta es tal que POo [t(X l . . . para cada 01 < O2.13. X n ) si para dicha estadística.

en el sistema Ho : fJ :S fJo frente a Hl : fJ > fJ o· Teorema 4. . X 2..2. .. en el sistema Ho : fJ :S fJ o frente a Hl : fJ > fJ o· 2. fJ) pertenece a la familia exponencial unidimensional de densidades. fJ)} tiene MLR en la estadística Tn . en- tonces la familia de densidades {fx(x. .. fJ). 4.. X n ) = ¿ d(Xi ). Y fx(x.Xn ) = ¿ d(Xi ) la estadística natural de la i=l familia exponencial. si c( fJ) es una función estrictamente monótona. . Siendo n la estadística natural de la familia T n = t(X l . X n una muestra aleatoria de una población con función de densidad fx(x. . TESTS MÁS POTENTES 213 es UMP para H o . n Siendo T n = t(X l . fJ). i=l entonces 1. Sea Xl.15..X2 . Xn) > ti-a" es UMP para H o.2. fJ E e ~ IR..16. X2.2. fJ) perteneciente a la familia exponencial unidimensional de densidades. X 2. fJ E e ~ IR Y fx(x. Sea Xl. Si c(fJ) es una función monótona creciente de fJ y ti-a tal que . . X n una muestra aleatoria de una población con función de densidad fx(x. .. . .. Si la razón monótona de verosimilitudes es no creciente y si ti-a es tal que entonces el test T: "Rechazar Ho si t(Xl. Teorema 4. .. X2..

Si c( O) es una función monótona decreciente de O y ta tal que POo [t d(Xil < tal ~ <>. JUZGAMIENTO DE HIPÓTESIS el test n T: "Rechazar Ho si L d(xi) > h-a " i=l es UMP para Ho en el sistema Ho : O :S 00 frente a H 1 : O > 00 o en el sistema Ho: 0=00 frente a Hl : O > Oo. es necesario concluir la presentación de .214 CAPÍTULO 4. el test n T: "Rechazar Ho si L d(xi) < ta" i=l es UMP para Ho en el sistema Ho : O :S 00 frente a Hl : O > 00 o en el sistema Ho: 0=00 frente a H 1 : O > Oo· Antes de continuar en la siguiente seCClOn dedicada al estudio de algunos tests bajo normalidad. 2.

Justamente esos programas han incorporado dentro de sus cálculos y por ende dentro de la presentación de los resultados el denominado valor p. . y la realización de los cálculos respectivos y la determinación de los percentiles se logran mediante la utilización de alguno de los múltiples programas de cómputo estadístico que se encuentran en el mercado de software o a disposición en internet. Igualmente. que compara valores de una variable aleatoria. Muchos tests han sido construidos teniendo en cuenta estas sugeren- cias. esa forma final. Entonces. el valor p. como la de muchos tests. debe conocerse la distribución de la es- tadística que lo soporta y ser factible el cálculo de sus percentiles.11.11. la forma estándar que compara el valor de la estadística con algunos de sus percentiles. porque su valor condensa los elementos del test y hace más diligente la decisión. de la siguiente manera: T : "Rechazar H o si el valor p es inferior a a" .2. es decir.2. El test obtenido en el ejemplo 4. la de comparar probabilidades: la probabilidad asociada al valor particular de la estadística tratado como un percentil y la probabilidad que representa el valor a. Tratando al valor particular de la estadística explícito en el test como un percentil de la misma. un test de nivel a puede transformarse a una manera equivalente utilizando el recurso del valor p. debe estar en la forma estándar consistente en la comparación de un valor de una estadística con un percentil de la misma elegido conforme al nivel del test asumido. Esta probabilidad asociada al valor particular de la estadística. para conservar estable un modo común muy difundido y generalmente aceptado. Ejemplo 4. En lo posible. página 210. Un par de ejemplos ilustran mejor la idea del valor p. pre- cisamente para que la utilización del test sea fácil.2. corresponde a una función de la probabilidad de que la variable aleatoria que soporta el test sea menor que el valor específico obtenido de la información de la muestra particular. Para hacer expedito un test. 4. su forma final debe ser preferentemente muy sencilla. puede vérsela de manera equivalente desde otro ángulo. TESTS MÁS POTENTES 215 los conceptos básicos del juzgamiento de hipótesis con una mención del denominado valor p. Este valor puede entenderse como una ayuda muy eficiente en la lectura de los resultados para el juzgamiento de una hipótesis.

El valor p en este caso es p l 1 = P[Wc < wcJ = o r(n) 2 WC (l)n x n-l _!x e 2 dx.Oo).(2n)".1. si W c < x~(2n) implica que p < a y como consecuencia el test puede expresarse equivalentemente como T: "Rechazar Ho si p < a". Ejemplo 4. el seguimiento estadístico de la fase de rotulación del pro- ceso puede estar encauzado por el sistema de hipótesis Ho : 1r :S 0. decoloración o inexistencia) y denotando la probabilidad de éxito como 1r (fracción disconforme).18. rotura. La muestra de 49 envases que señala el ejemplo 4. también puede utilizarse para respaldar el control de las disconformidades en la fase de rotulación del envase. y .2. entonces i=l n la variable que soporta el test W c = 200 2: Xi tiene distribución Ji- i=l cuadrado con 2n grados de libertad. JUZGAMIENTO DE HIPÓTESIS puede modificarse finalmente como a continuación se indica y de allí originar el valor p correspondiente. página 189. conviniendo que el término éxito corresponde a la representación de un envase que revela alguna dis- conformidad en su rótulo (colocación incorrecta. Acudiendo al modelo de Bernoulli. Como la familia de densidades de Bernoulli tiene razón monótona de n verosimilitudes en la estadística W c = 2: Xi (variable que registra i=l el número de envases en la muestra rotulados no apropiadamente).6.216 CAPÍTULO 4.01 frente a Hl : 1r > 0.01. Por supuesto. Con estos elementos el test presenta su forma final T: "Rechazar Ho si W c < x. n Debido a que bajo la hipótesis nula 2: Xi rv Gama(n. puesto que las nor- mas internas de aseguramiento de la calidad admiten a lo sumo el 1% como fracción disconforme en la fase de rotulación y exigen que el test escogido debe tener nivel inferior a 5%.

. 4.0864105914 2 0. porque 0.01) Y i=l que un test con nivel del 5% no es posible conseguirse.2.2: Algunos valores p en el juzgamiento sobre la fracción discon- forme n además la razón es no creciente en L Xi. por tanto. Finalmente. la tabla 4. 49 T : "Rechazar Ho si LXi> 2" i=l equivale a T : "Rechazar Ho si p < 0. y del contenido de la tabla anterior se deduce que a = 0.00013221 significa que en la muestra se encontraron 5 envases rotulados no apro- piadamente y. y la enumeración de algunos valores p. si el monitor de un computador muestra el valor p = 0. no se toma correctivo alguno. TESTS MÁS POTENTES 217 W c P[Wc > W c] O 0. el test correspondiente formulado específicamente para tomar decisiones en la fase de rotulación. Mientras que si p = 0.0014801344 4 0. por ende. El valor p en este caso corresponde a p = 1.0001322100 Tabla 4. entonces un test UMP para i=l Ho en el sistema planteado es T : "Rechazar Ho si Wc > k" . 49 Teniendo en cuenta que bajo la hipótesis nula L Xi rv Bin( 49. la decisión consiste en evaluar las posibles causas atribuibles a la perturbación y de tomar los correctivos a que haya lugar.013084".086410 no es admisible por las normas.2 per- mite dos finalidades: la especificación de a.013084. Por tanto.0130840050 3 0.3888827605 1 0. siguiendo la recomendación de las normas internas.P[Wc :s.0864106 significa que en la muestra se encontraron 2 envases disconformes y.0. wcl.

l = J. Esta sección está dedicada al desarrollo de tests para el juzgamiento de hipótesis referentes a promedios poblacionales y la sección siguiente trata lo pertinente al juzgamiento de hipótesis sobre varianzas.. X2.lo frente a HI : J. La divulgación acentuada que hacen los textos sobre los tests bajo Nor- malidad da pie para que el lector cimiente la idea de que el juzgamiento de hipótesis se reduce únicamente a casos particulares regidos por el mo- delo gaussiano.3 Juzgamiento de hipótesis sobre promedios bajo Normalidad Utilizar el modelo gaussiano como asistente en la toma de decisiones es una práctica común no siempre realizada empleando las mejores premisas.3. . 4. pueden fijarse tres sis- temas de hipótesis en el juzgamiento de esta hipótesis particular: • Sistema A: Ho : J. X n una muestra aleatoria de tamaño n con distribu- ción Normal de valor esperado J. tema que será tratado posterior- mente.218 CAPÍTULO 4.lo frente a HI : J. y que su aplicación está sujeta a los resultados favorables a la normalidad dentro de un proceso de juzgamiento del ajuste al modelo.lo· .1 Juzgamiento de la hipótesis nula Ho : 11 = 110 Siendo Xl. . JUZGAMIENTO DE HIPÓTESIS 4.l < J.l y varianza (7"2.l = J.lo· • Sistema B: Ho : J.. o según argumentos sólidos de tamaño de muestra suficiente que justifican su utilización. La inclusión de dos secciones en este capítulo relativas a algunos tests bajo normalidad debe entenderse como aplicaciones muy especiales de conceptos previos en la construcción de tests bajo el mo- delo soberano de los modelos de probabilidad. bajo la adopción del modelo de Gauss.l > J.

l = J.b(x) = e.. JUZGAMIENTO DE HIPÓTESIS SOBRE PROMEDIOS BAJO NORMALIDAD 219 • Sistema C: Ha : J.···. J.:.c(B) = .¡. considerando la es- tadística n t(X 1 . Considerando específicamente el sistema B.2 ~ . d(x) = x. X n ) = LXi. B) pertenece a la familia ex- ponencial de densidades. V.2 ~ .3. X 2 .l .7rCJ CJ En razón de que c( B) es monótona creciente. B) puede ex- presarse como De esta manera se deduce que fx(x. . Primer supuesto: CJ2 es una cantidad conocida.la· 1.la frente a Hl : J. estableciendo las funciones 1 1(0)2 1(x)2 B a(B) = f2= e. 4. i=l el test n TB : "Rechazar Ha si LXi> k*" i=l es UMP para Ha en el sistema B. fx(x.

Rechazar H o ---..B) n i=l 2(J"2 2} { . Xn ) = (V27i(J") n exp . Bajo la misma SUpOSlClOn de que (J"2 es conocido. finalmente el juzgamiento de Ho : /-l = /-lo dentro del sistema e. Ho: /-l = /-lo frente a HI : /-ll./-lo está apoyado por un test que se deduce de la forma siguiente: L(B. Xl.5 lo representa. JUZGAMIENTO DE HIPÓTESIS donde Zc = X(J"/vn n ./-lo entonces ' TB : "Rechazar Ho si Zc > Zl~a". un test para Ho en el sistema A es TA : "Rechazar Ho si Zc < za" que gráficamente la figura 4. ¿(Xi .220 CAPÍTULO 4. 1 X2.J o Z Figura 4. De manera similar.·· .5: Región crítica del test T A.

exp (n(xn SI - .2 .i~1(Xi-¡.to ./-LO) ) < k implica que 20.Xn)2 + n(xn ./-Lo)2) < k" 20. el test construido con base en la razón generalizada de verosimilitudes está determinado como Te : "Rechazar Ho .(J exp 2(J2 Como n n i=l i=l n n n i=l i=l i=l n = ¿(Xi .2 .tO)2} SUp L y!2. 20- Por tanto./-LO)2 i=l entonces n /-LO?) -_ exp (_ n(x .(J 2(J2 ()=¡.A = -~~~-L = -(-l-)-n--:-{--i"f=--n(-Xi_-xn-j2--Ó-} n 1 y!2.2 pero 2 exp ( - n(xn . JUZGAMIENTO DE HIPÓTESIS SOBRE PROMEDIOS BAJO NORMALIDAD 221 ( l)n exp {.4.3.

(J"2 > a.LO. esta función de potencia se presenta en la figura 4.Lo)) + <I> ( -Zl~% .(J"2)1J.L = J. • Con referencia al sistema e.J.(J"2)1J.L E lR.(J"2 > a frente a H 1 : J.L i J.6.J.L.6: Región crítica del test Te' de potencia de este test se puede establecer fácilmente como 7r TC (O) = <I> ( -Zl~% + Vn(0(J". JUZGA MIENTO DE HIPÓTESIS y consecuentemente que IZel > k*.Lo)) Gráficamente.(J"2 > a}. De esta manera. 2. La función Q Q 2' /2 Rechazar H ° ----.Rechazar H o Z Figura 4. En definitiva se establece el test como Te : "Rechazar H o si IZel > Zl~Q"· 2 que gráficamente está representado por la figura 4.222 CAPÍTULO 4. Segundo supuesto: (J"2 es una cantidad desconocida. estrictamente hablando el sis- tema debería plantearse así: Ho: J.L.(J"2 > a} . Vn(0(J".8 = {(J.LO.L = J.J a L.7.Lo. 80 = {(J.

y por tanto Por otra parte.¿o e Figura 4..¿o bajo el modelo gaussiano asumiendo el supuesto de varianza conocida. JUZGAMIENTO DE HIPÓTESIS SOBRE PROMEDIOS BAJO NORMALIDAD 223 7rT Je) 1 --------------------- ¡. la función de verosimilitud L tiene máximo . porque bajo 8 0..3.7: Forma de la función de potencia del test Te para el juz- gamiento de la hipótesis nula Ho : e = ¡. 4.

lo Y (72 = ~ ¿ (Xi .lo)2 ( f=(Xi.. cuando se especifica un valor de a. .¡n (X n .224 CAPÍTULO 4.X n)2 \~ ¡ t-l 2 I 'S. '"\""'n f-"U.)2 ¿" (Xi-X" i=l .X n)2 ) i=l Entonces... 110) rv t(n-l) Te = f: (X í=l i -X.to)2 ~ ¿ (Xi...1 (Xi . el test de razón generalizada de verosimilitudes para la hipótesis en consideración en el sistema e. En consecuencia._x n ) 2) ~ An = ( tE t=l (Xi ..lO)2. 110)2 n(X. f. Te : "Rechazar Ho si An < k" puede formularse en términos de n(xn .lO)2 n ¿ (x. como Te : "Rechazar Ho si Itcl > t1-Q. JUZGAMIENTO DE HIPÓTESIS n cuando f.f. f. J = (1 + ~(~n-¡. i=l ¿(Xi n . como n(Xn .2 1)". Ahora bien.-xn)2 i=l n-l puesto que cuando esta expresión crece el valor de An decrece.l = f. (n . )2 Sn n-l u(n-l) el test para el juzgamiento de Ho en el sistema e queda establecido como Te : "Rechazar Ho si Itcl > d" o más precisamente. xn)..-¡.to)2 a .

3. el test para juzgar Ho está dado por TB : "Rechazar Ho si te > tl-a(n . no se dispondría de una forma alternativa de decisión equivalente al test Te. La decisión que se tome mediante el test T A.8.9:.1)". bajo el primer supuesto. puede asumirse igualmente mediante su correspondiente valor p. . 2 pero por otra parte como p < a la decisión sería contraria. 4.<I>(ze). • En el sistema B. 2 Y admi- tiendo que p = 1 . de manera que el test para juzgar Ho corresponde a TA : "Rechazar Ho si te < teAn . ante una situación en la cual el valor particular Ze fuese tal que Zl-a < IZe I < Zl-. Ho : /-l = /-lo frente a Hl : /-l > /-lo.1)" .9:. De esta manera. valor que puede calcularse como mientras que el valor p asociado al test TB se obtiene mediante la pro- babilidad y finalmente para el caso del valor p ligado al test Te. puesto que claramente no habría eviden- cia estadística para rechazar la hipótesis nula por ser IZel < Zl_. JUZGAMIENTO DE HIPÓTESIS SOBRE PROMEDIOS BAJO NORMALIDAD 225 • En el sistema A se tiene que Ho : /-l = /-lo frente a Hl : /-l < /-lo. se calcula mediante p = 2(1 .<I>(lzel)) La razón de este cálculo lo sugiere la figura 4.

8: Justificación sobre el valor p asociado al test Tc.10.lo y se presenta en la figura 4. la decisión que se tome mediante el test T c es idéntica a la que se tome mediante la utilización del valor p = 2(1 .l = J. El compendio 1 sintetiza el juzgamiento de la hipótesis nula Ho : J. Las funciones de potencia de los tests T A Y TB se ilustran en las figuras 4....9: Forma de la función de potencia del test TApara el juz- gamiento de la hipótesis nula Ho : O = J.9 y 4.lo bajo el modelo gaussiano.1f>(lzcl)).lo O Figura 4. . JUZGAMIENTO DE HIPÓTESIS z Zl-a /1"" Izcl Zl-~ Figura 4. 1T'TA (O) 1 a J..11.226 CAPÍTULO 4. asumiendo el supuesto de varianza conocida.

l2 < 60 .ll . .lo bajo el modelo gaussiano.f. • Sistema B: Ho : f.l1 .l2 = 60 frente a Ha : f. JUZGAMIENTO DE HIPÓTESIS SOBRE PROMEDIOS BAJO NORMALIDAD 227 7rTB (B) 1 --------------------- a --------- f. Y2 . .2 Juzgamiento de la hipótesis nula Ho : /11 . . sea YI . 4...lo B Figura 4.l2 = 60 frente a Ha : f. X2.l1 y varianza O"I.3.f. asumiendo el supuesto de varianza conocida.10: Forma de la función de potencia del test TE para el juz- gamiento de la hipótesis nula Ho : B = f.l1 .f. Siendo independientes las dos muestras. en los siguientes términos: • Sistema A: H o : f. .f.l2 y varianza O"§. 4. .l2 > 60 .3. Ym una muestra aleatoria de tamaño m. . la hipótesis nula puede juzgarse frente a tres hipótesis alternas. de una población Normal de valor esperado f.ll . De la misma forma. X n una muestra aleatoria de tamaño n de una pobla- ción con distribución Normal de valor esperado f. ./12 = 60 Sea Xl.

l2 = 60 frente a Ha : J. < ta(n .J. JUZGAMIENTO DE HIPÓTESIS J uzgamiento de Ho :J'=J-Lo Sistema A Sistema B Sistema e Ho:J-L=J-Lo Ho:J-L=J-Lo Ho:J-L=J-Lo frente a frente a frente a H¡ :J-L<J-Lo H¡: J-L > J-Lo HI : J-Li J'o Tests Tests TA : "Rechazar Ho si T/\ : "Rechazar Ho si t. • Sistema C: H o : J.1)" Zr o > ZI n Te : "Rechazar Ro si T(' : "Rechazar lI.l2 =1= 60.228 CAPÍTULO 4.1 > ZI_ ~" Figura 4.1)" Iz.. El propósito de expresar la diferencia de promedios poblacionales en términos de 60 tiene el fin de presentar de una manera más general el caso particular muy corriente en el cual la hipótesis nula establece que 60 = O. .1 > t l _" (n .ll .) si It.11: Compendio 1.1)" Zc < kn" TB : "Rechazar Ho si TH : "Hf>chazar Ro si te> tl-n(n .ll .J....

X n . Y m .. YI .0:)% de confianza para el pará- metro (J. Te: "Rechazar Ho si Izcl > ZI_. . T~2)) es un in- tervalo confidencial del 100(1 . . f. Primer supuesto: aI.l2 Y 0.. se pueden derivar los test correspondientes así: TA : "Rechazar Ho si Zc < za"· TB : "Rechazar Ho si Zc > Zl-a".2 . entonces. teniendo en cuenta que las mues- tras aleatorias son independientes. dado que el supuesto de homoscedasticidad declara que las varianzas son iguales. . Y2.f. a§ son constantes conocidas. En efecto. 2 2. . su expre- sión es. un test razonable de nivelo: para el juzgamiento de la hipótesis nula Ho : (J = (Jo. De los inter- valos confidenciales unilaterales también se pueden deducir tests. JUZGAMIENTO DE HIPÓTESIS SOBRE PROMEDIOS BAJO NORMALIDAD 229 l... X2. es un test que da origen a uno equivalente formulado en la forma característica. Se hace esta mención en razón a que existe cierta correspondencia entre la estimación por intervalo y el juzgamiento de hipótesis. . Considerando la variable aleatoria es muy sencillo confirmar que se trata de una variable aleatoria con distribución Normal estándar.l2.ll . . si (TJ!) .. Segundo supuesto: aI = a§ = a2 son constantes desconocidas (ho- moscedasticidad) . Utilizando este recurso. t~2)) "..3. frente a HI : (J =F (Jo descrito como T : "Rechazar Ho si (Jo ~ (t~l). 4.".2'. esta expresión por su condi- ción es una variable pivote para la construcción de un intervalo confidencial para f. de- pende particularmente de f.ll. La función de verosimilitud de Xl. .

(X n . 2 m+n [ ~(Xi-Xn) +f. f. De esta forma.Ll.x n )2 m + j'fl (Yj .l)S?.Ll = f. (Yj .. los estimadores máximo-verosímiles de f. 21 .230 CAPÍTULO 4. (Xi . m±n 2 n+m n±rn e-- supL = 2- ()Eª 2."n)' + j~.n + (m . l/m)') En 8 0 . respectivamente: 1 Xn. Ym . m +n [(n .L= m+n ( m+n i=l j=l - 0'2 = . xn )2 + j~l (Yj .- 1 .Ym)2 + :+r:. los estimadores de f.L2 Y (72 cuando 150 = O son 1 ~ - tXi+ i:Yj) = nXn+mYm J.L2 Y (72 son.Ym)2 } con lo cual -mi" mn (.m] .t.. el sup L corresponde a ()Eªo nl+n -2- m+n n+rn e--2- 27r {i~ (Xi . l)Si.. JUZGA MIENTO DE HIPÓTESIS Al acoger esta suposición de homoscedasticidad pero desconocidos los valores de las varianzas. .Ym An+m = + [ n i~ (Xi . (. Entonces.L = f.(Yj-X ) +m+n(Xn-Y ) n m m m . -)2 1 m+n X n .Ym)2 1 Teniendo en cuenta que . 2 mn .

o-r = o-§. se pueden formular los tests en la forma siguiente: Te : "Rechazar Ha si Itel > tI_S!2 (n + m .2)".2) 0.Xn)2 +¿ (Yj . JUZGAMIENTO DE HIPÓTESIS SOBRE PROMEDIOS BAJO NORMALIDAD 231 n m ¿ (Xi .2)".y m)2 • _i=_I_ _ _ _ _-::--j=_I_ _ _ _ _ rv X2 (n +m . TA : "Rechazar Ha si te < ta(n + m .2)".X n? + ¿ (Yj . puede ser susten- tado mediante argumentos tomados de la explicación teórica del .3. la razón generalizada de verosimilitudes se puede expresar en forma más simple como A partir de ella. Con este complemento.2 Y dada la independencia de las dos variables aleatorias mencionadas.y m)2 82 = i=1 j=1 p n+m-2 El supuesto de homoscedasticidad.4. Es importante hacer notar que la expresión simplificada de Te es donde n m ¿(Xi . TB : "Rechazar Ha si te > tl-a(n + m .

en la forma como se dedujo en este punto relativo al segundo supuesto. que este texto no aborda por no estar dentro del propósito del mismo. 60 e JS2 ~ n + S2 2. que avalen la no existencia de razones para asegurar que una población es más variable que la otra. Dentro de la construcción de tests bajo Normalidad.2. Esta solución utiliza la siguiente estadística: T' = X n-Ym . Esa imposibilidad de la adopción de la homoscedasticidad en el juz- gamiento de la diferencia de promedios poblacionales. el camino estadístico para la adopción de la homoscedasticidad o para descartarla es el juzgamiento de la hipótesis nula 2 2 Ho : 0"1 = 0"2' cuya determinación de tests para tal propósito bajo Normalidad será tratada en el numeral 4. la adopción de la homoscedasticidad encauza la construcción del test sobre las ideas de Gosset para obtener un test fundamentado en la distribución de Student. JUZGA MIENTO DE HIPÓTESIS fenómeno o de la información detallada fruto de un seguimiento permanente del mismo. basada en análisis estadístico secuen- cial. asumiendo el modelo gaussiano. Cuando estos argumentos no están disponibles. A continuación se presenta una solución aproximada al problema.m m . en la actualidad se destaca la solución de Welch. o aun contando con ellos. genera un problema importante en la infe- rencia estadística y por consiguiente en la toma de decisiones en la práctica. no poder asumir el supuesto de homoscedasticidad impide simplificar en for- ma mayúscula muchas etapas en la búsqueda de la distribución de una estadística que soporte el correspondiente test como no ocurre cuando se le asume. Tercer supuesto: O"I =1= O"§ constantes desconocidas. del cual se tiene una solución exacta. para el juzgamiento de la diferencia de prome- dios poblacionales.4.232 CAPÍTULO 4. Dentro de las soluciones. denominado el problema de Behrens-Fisher. 3. la cual se cita en muchos libros de estadística. solución que requiere un tipo de muestras seleccionadas en etapas. (problema de Behrens-Fisher).

1)".2. n} y (m + n . de manera que la variable que representa a la población j tiene valor esperado /1j y desviación estándar (J. Te : "Rechazar Ho si It~1 > tl-~ (f 2 . X j 2. procedimiento trata- do inicialmente por Fisher en la segunda década del siglo XX.1)".3. Welch propone los si- guientes tests: TA : "Rechazar Ho si t~ < ta(f .3. al tratarse de una separación de componentes de una .2. Estos test pueden mejorarse en potencia. Como conclusión esta sección 4. TE : "Rechazar Ho si t~ > tl-a(f .1)".2).'-- El compendio 2. asumiendo el modelo de Gauss para cada una de las k poblaciones independientes. donde f = min {m. proviene de la expresión de la estadística que fundamenta el test correspondiente. . + ---'----m-_-lc. . ../12 = Jo. n}. aparentemente sin vinculación con el sentido de la hipótesis plantea- da. La solución de Welch en este mejoramiento de potencia escoge a f como el entero más próximo a C~n + s~n) 2 f= 2 2 2 2· C~n) C~~m) -n---l. = /1k frente a H1 : no todos los promedios poblacionales son iguales... j = 1.. escogiendo f entre min{m.12...XJ1lJ . es una síntesis del juzgamiento de la hipótesis nula Ho : /11 . La de- nominación de este procedimiento estadístico como análisis de varianza. la muestra aleatoria de tamaño nJ correspondiente a la población j y bajo el supuesto de homoscedasticidad. y siendo X j1 . 4. el procedimiento de juzgamiento de la hipótesis nula que forma parte del sistema Ho : /11 = /12 = . JUZGAMIENTO DE HIPÓTESIS SOBRE PROMEDIOS BAJO NORMALIDAD 233 Esta estadística no tiene distribución t.3 y como generalización del numeral 4.k. el cual se presenta en la figura 4. . se le conoce como análisis de varianza a una vía.

2)" Z.. 2)" Iz.234 CAPÍTULO 4.."" Xl n1 . 'l e - n Tn 1 Tests Tests Tests TA : "Rechazar Hu si TA : "Rechazar Ho si TA : "R{'chazar !Io si t~ < t.. La función de verosimilitud L = L (1-" 1 . I-"k. X knk . varianza. ." Figura 4. Madrid: Espasa Calpe S. 1-"2. X k2 ...·· .1 > t l -1(f _1)" It." TB : "Rechazar Hu si TB : "Rf'chazar Ro si T 13 : •• R t-'chazar Ho si t. JUZGAMIENTO DE HIPÓTESIS Juzgamiento de Ho : Ml -/12 = Jo T 1 1 Sistema A Sistema B Sistema e Ho : ¡. /12 i. Diccionario de la lengua española. ti .i Te : "R('cha7.12: Compendio 2..1)" t. > tl_.. Xkl. X k1 . Xll.(n + m . Vigésimasegunda edición.1 > t l _ .. < z.(n+m-2)" Z.tI . siendo 0"2 el valor común desconocido de las varianzas de cada población 3 Real Academia Española (2001).·.J-L'l = 50 Ho :JIl -J-!2 =c10 frente a frente a fr('Il1..A.··.ar lIo si It..('ehazar Ho ~.(f -1)" t..···. Xk2. 0"2.(n+m . .t> a H I : 111-/1-2 <ou H I : MI -f-L'2 >ou Il] : ji1 ... > 21 _(~ .Xknk) de las n variables aleatorias Xll. > tl-a(f .·· . X 1n1 .·.7 No JI (xn-l/m)-Jol I J'l" + ". <t.." . X 12 . X12.J-l2 = Jo Ro : Jll . Te : "Rechazar Hu si Te : "R..60 I I ~ & = (x" -l/m) -J"1 ~ y~+7.1 > ZI_. concordante con el término análisis que significa "distinción y separación de las partes de un todo hasta llegar a conocer sus principios o elementos "3.

8 0 = {(11.3. es específicamente j=l L = rr rr _ 1 exp j=l i=l vl2ii0- {_~ (Xji -l1j)2} 2 o- con la utilización de esta función se puede establecer que nj • La estimación máximo-verosímil de I1j es ~. (72 > O}.Xj)2 de tal manera que sup L = ª Acorde con la hipótesis nula. (72) 111 E lR. de donde se pueden establecer los siguientes elementos: • La estimación máximo-verosímil del valor común 11 bajo la hipó- tesis nula es *¿nJ i=l x ji = X. JUZGAMIENTO DE HIPÓTESIS SOBRE PROMEDIOS BAJO NORMALIDAD 235 k adoptando la homoscedasticidad y n = ¿ nj. • La estimación máximo-verosímil de 0- 2 bajo la hipótesis nula es *¿ k j=l i=l nj ¿(Xji -x)2. ¿ Xji = Xj J i=l • La estimación máximo-verosímil de 0- 2 es *¿ k nj ¿ j=l i=l (Xji . . denotando por 11 el valor común desco- nocido de los promedios de cada población. 4.

suma de cuadrados entre tratamien- tos) y suma de cuadrados de errores. k k nj ¿ nj(Xj . x)2 1-~ An = ªo - supL . puede expresarse como la adición de dos cantidades. k r~li~(XJl nj ~JJ J ª k nj Algebraicamente. la suma total de cuadrados es el numerador de una varianza muestral particular. k j'fl nj(Xj -x)2 + j'fli~(Xji k nj -Xj)2 l-~ An = k nj [ ¿ ¿(Xji .x)2 +¿ ¿(Xji . la expresión ¿ ¿ (x ji . entonces An = ( 1 + n _ kfe L L (Xjí. x?.Xj)2 j=l i=l Sustituyendo k L nj(Xj-x)2 k-l )-~ j=l k-l k nj por fe. Como estas can- tidades son calculadas a partir de los valores observados de las muestras.Xj)2 j=l í=l n-k . sup L 21ft I:(Xji-X)21-~ exp {_~} j=l i=l 2 ' y en conse- ªo [ n cuencia supL k n j'fl i~ (Xji .Xj)2 j=l j=l i=l conocidas estas últimas como suma de cuadrados entre grupos (en el lenguaje del diseño experimental. llamada suma total de j=l i=l cuadrados. respectivamente. varianza que se descompone entonces en dos partes: una va- rianza entre grupos o tratamientos o intervarianza y una varianza dentro de los grupos o intravarianza. JUZGA MIENTO DE HIPÓTESIS Por tanto.236 CAPÍTULO 4.

Xj) . página 218.Xj) 1 y =_1_i_=--c.. (J2(n .1). el test original T: "Rechazar Ha si An < e" puede reformularse como: T: "Rechazar Ha si fe > h-a((k . Para concluir. X)2 Y LL (X ji . 4. (n .'" X2 (n =-..X)2 =_1---:0--. . los tres sistemas que pueden plantearse son: .4. el cociente Fe tiene distribución F con (k-1) y (n-k) grados de libertad. y sólo resta entonces conocer la distribución de la variable Fe porque ya se manifiesta la forma del test equivalente al test original basado en An.. JUZGAMIENTO DE HIPÓTESIS SOBRE VARIANZAS BAJO NORMALIDAD 237 Visto An de esta manera.k) Por consiguiente..1) k nj 2 ¿ ¿ (X ji .... Según las condiciones establecidas en la sección 4.. bajo la hipótesis nula k ¿ nj (X j . los valores pequeños de la razón generalizada de verosimilitudes son causados por valores grandes de fe. i=l En segundo lugar.j .4.X j )2 j=l j=l i=l está garantizada por la independencia estadística entre las variables alea- . _ nj _ 2 tonas X j y ¿ (X ji .----_ _ _ '" X2 (k =-.j . 4.k))".3.1 Juzgamiento de la hipótesis nula Ha : a2 = a5.1. En primer lugar.1) (J2(k .k)..4 Juzgamiento de hipótesis sobre varianzas bajo Normalidad 4. la independencia de las variables aleatorias k k nj L nj (X j .

1) ~ .. como c( ()) es creciente.210 Y la pertenencia a la familia exponencial de densidades. v = 2 !Jo frente a H 1 ... puede llevarse a cabo por medio de un test derivado de lo siguiente. El juzgamiento de la hipótesis Ho bajo el sistema B.Xn ) (V21i'v'e ) e 20.L es una constante conocida. que equivale a n ¿(Xi .13.238 CAPÍTULO 4. Como n 2 ~... 1. v = 2 !Jo frente a H 1 : !J2 "# !J6.1)2+1n( ~v'8) entonces considerando c( ()) = . " =e ~.L)2 > k". por tanto n TB : "Rechazar Ho si ¿)Xi . con () = !J2. suponiendo f.~.L. Primer supuesto: f... 2 2 H O .f..L)2 TB : "Rech azar HO· 2 SI XC1 = -i=l 2 > x2 1~n (n)" / !Jo que gráficamente está representado por la figura 4..!J 2 < !Jo· 2 • Sistema B: H O ...L conocido.!.!J = !JO frente a H 1 .= f: (Xí~J.. 1 .. ••• . .. X2. ..2 . 1 n L( O. '" (x~J.!. 20..2 .... i=l Este test es un test UMP para Ho en el sistema B.... f.!J 2 > !Jo· 2 • Sistema C: H O .. XI. JUZGAMIENTO DE HIPÓTESIS • Sistema A: ..

4.1.1)".1) o X~2 > xJ(n . a5 Para los sistemas A y e. y XJ es la misma que la de los percentiles que minimizan la longitud del intervalo confidencial para a 2 .1 es desconocido es n L (Xi .1)") que gráficamente están representados en la figura 4.Xn)2 "Rechazar Ha si X~2 = _i=_l_----.4. un test para Ha en el sistema B.c--_ _ > XLa(n . los tests son los siguientes: TA : "Rechazar Ha si X~l < x.1 es una constante desconocida.13: Región crítica del test TB. La solución E = ~ yeS = 1.eS). La escogencia de los percentiles X. 2.(n)".(n) o X~l > XJ(n)".(n .14 donde a = E + (1 . JUZGAI\IIENTO DE HIPÓTESIS SOBRE VARIANZAS BAJO NORMALIDAD 239 Figura 4. cuando f. Te : "Rechazar Ha si X~2 < x. Segundo supuesto: f. Te: "Rechazar Ha si X~l < x. según el supuesto que se adopte acerca de f.(n . .1)".~ debe evitarse para muestras pequenas. Igualmente. TA : "Rechazar Ha si X~2 < x. De modo similar.

correspondiente a la figura 4. 240 CAPÍTULO 4. página 205. Nota. con v = n o v = n . .---J L Rechazar Ho X2(V) Figura 4. corresponde al juzgamiento de la hipótesis nula Ho : (ji= (j~. se resume el juzga- miento de la hipótesis nula Ha : (j2 = (j6' 4. permite utilizar el mismo test para juzgar Ha en el sistema siguiente: rr 2 2 110 : (j ~ (jo frente a H 1 .1 según el caso. Para tal efecto.7.14: Región crítica del test Te. Sin embargo. El teorema utilizado para la construcción del test bajo el Sistema E. (j 2 > (jo' 2 En el compendio 3. JUZGAMIENTO DE HIPÓTESIS E Rechazar H o.. en el caso usual referente a dos poblaciones in- dependientes.2. pueden establecerse tres sistemas de hipótesis: • Sistema A: Ha : (ji = (j~ frente a H1 : (ji < (j~.4.15.2 J uzgamiento de homoscedasticidad El juzgamiento de homoscedasticidad fue tratado en el ejemplo 4.

)2 r--:-j X~l = =. o) Figura 4.4.~.J) a = f + (1 . • Sistema B: Ho : (Ti = (T~ frente a H1 : (Ti > d· • Sistema C: lJ 2 2 110 : (TI = (T2 frente a H1 : (Ti 1= (T~. > x~(n)" : "l{í·dlazar Ho si Te : "Rechazar Ho si < \..1)" X:.1) () si X~.-. JUZGAMIENTO DE HIPÓTESIS SOBRE VARIANZAS BAJO NORMALIDAD 241 J uzgamiento de Sistema A Sistema B Sistema e Hu: aL = a.. > x~(n)" n = (+ (1.1_".15: Compendio 3 ...(71 . < x. < x.1)" X~.ar /lo si Tn : "Rechazar Ho si ..(n)" TU : "Rpcha:.1)" X~.~ n L(:r.2 #.~ __ Tests TA : "lV'('hazar Hu si TA : "Rechazar Ha si \. > \~(n... . J1.} Ho : a 2 = a(~ Ho: (72 = a5 frente a frente a frente a H¡ : aL < al~ H¡ : (J2 > (T(~ H¡ : . < \~(fl -.(n) o si > x¡(n . . -In)' f= (x. 4.

fo(n .1.4.1.2. m . página 227. o porcentaje como ordinalmente se le designa. Presentar algunas ideas en el juzgamiento de la cuantía de una proporción poblacional.1. cuantía que generalmente no es posible determinar para una población particular. en razón de que muchas afirmaciones de la cotidianidad. m . del desarrollo del comercio. Te : "Rechazar Ho si fe < f.1) o fe > fo(n . m .3. Se evitan algunos de- talles considerados en secciones anteriores. pero con base en las consideraciones que se realizan es posible construir con los detalles necesarios los distintos tests requeridos.1)". "Rechazar Ho si fe TB : "Rechazar Ho si fe > h-a(n . es la misma que la de los percentiles de los intervalos confidenciales para el cociente de varianzas de dos poblaciones independientes desarrollados en el numeral 3.1).1. La escogencia de los percentiles f. para proporcionar un elemento descriptivo en la obtención de información o conocimiento sobre el tema en cuestión y su usanza se ha ampliado porque aritméticamente es simple y su comprensión muy generalizada.242 CAPÍTULO 4. en cualquiera de los tres sistemas. Lo mismo que en el caso anterior a = E + (1 .1) bajo las condiciones del numeral 4. Si los tamaÍios de las muestras son relativamente grandes. se pueden usar E = ~ = 5. están basados en el valor de la estadística 2 fe - -~2 82 donde Fe rv F(n . constituye el propósito de esta sección.1.1. JUZGAMIENTO DE HIPÓTESIS Los tests utilizados en el juzgamiento de H o. m . El lenguaje común y el especia- lizado han incorporado tasas y porcentajes con el sentido específico de su campo.(n . pues en este punto ya deben ser familiares la estructura y las rutinas propias del juzgamiento de hi- pótesis. m .5). de los quehaceres de la ciencia recurren a porcentajes y por tanto su empleo es muy amplio. de la actividad industrial. m . . los respectivos tests pueden enunciarse como TA : < fa(n .(n .1) que incluye el test Te.1)". página 169. Entonces.5 Juzgamiento de proporciones El juzgamiento de proporciones poblacionales es un tema muy común en los textos de estadística de todos los niveles. 4.2. m .1)".1.

P-rro [i~ Xi 2: k + 1] r5 = -~---~. el modelo asumido es el modelo de Bernoulli de parámetro K.15.. elegido un nivel del test i=l a. i=l n Bajo la hipótesis nula ¿ Xi rv Bin(n.14 y 4.. Ka). P-rro [i~ Xi 2: k + 1] a . legitiman a ¿ Xi como la estadística que i=l fundamenta el juzgamiento de la hipótesis nula Ha : K = Ka en el sistema Ha : K = Ka frente a H 1 : K > Ka.2. páginas n 212 y 213 respectivamente.2. n por medio de un test establecido como T : "Rechazar Ha si ¿ Xi > k". puede suceder que P..P-rro [t l=l Xi 2: k + 1] P-rro [t l=l Xi = k] . y con el ánimo de determinar plenamente el valor de k. 4.Xi 2 k+ 1] <" < P. En esta situación hay dos soluciones: modificar el valor de a por un valor menor a' o establecer un test aleatorizado.Xi 2 k] es decir. La primera solución es adoptar el nivel a' = P-rro [i~ Xi 2: k + 1] .:---=_--.5.=---=-----~ [t l=l Xi 2: k] . [t. La segunda solución es establecer una función crítica: n 1 si ¿ Xi 2: k +1 i=l n 1jJ(x~) = r5 si ¿ Xi = k i=l n O si ¿ Xi <k i=l La probabilidad de éxito r5 de la variable auxiliar en el test aleatorizado corresponde a: a . La familia de densidades de Bernoulli posee caracterís- ticas especiales. no se puede determinar un valor de k para el cual el nivel del test sea exactamente a. en el sentido que los teoremas 4. [t. JUZGAMIENTO DE PROPORCIONES 243 Para comenzar.

. i=l i=l Recurriendo a otras consideraciones.Xi 2 k+ 1]) +P. Y i=l para el juzgamiento de la referida hipótesis nula en el sistema Ho : 7r = 7ro frente a HI : 7r #.Pno [i~ Xi ~ k + 1] [ n ] o· P" [t. . las cuales encaminan el desarrollo de los tests más difundidos en el juzgamiento de un proporción poblacional.. n a través de un test establecido como T : "Rechazar Ho si LXi < k".Xn una muestra aleatoria de una población con n distribución de Bernoulli de parámetro 7r. referentes a tamaños de muestra grandes. P'o [t. la estadística Pn = ~ LXi. i=l .244 CAPÍTULO 4. Siendo Xl.Xi <k] + P no ['" n 0 X . . por intermedio de un test n n T : "Rechazar Ho si l:= Xi < k l o si l:= Xi > k 2".7ro. JUZGAMIENTO DE HIPÓTESIS De manera que el tamaño del test será: a . Xi k+ 1] 2 = (a -P" [t. = k ] Pno l:= Xi i=l = k i=l + 1 . X2.. [~Xi 2 k+ 1] = o Q Consideraciones similares pueden realizarse en el juzgamiento de la hi- pótesis nula Ho : 7r = 7ro en el sistema Ho : 7r = 7ro frente a HI : 7r < 7ro. se presentan los rasgos generales de la deducción de los tests correspondientes.

es un MLE insesgado para 7T. y siendo 1r(L1r) la correspondiente información de Fisher. 1). según alguno de los siguientes sistemas: • Sistema A: Ho : 7T = 7To frente a H1 : 7T < 7Too • Sistema B: Ho : 7T = 7To frente a H1 : 7T > 7Too • Sistema C: Ho : 7T = 7To frente a H1 : 7T =1= 7Too Basados en la estadística los tests respectivos pueden formularse como TA : "Rechazar Ho si Zc < Za"o TE : "Rechazar Ho si Zc > Zl-a" o Te : "Rechazar Ho si Izcl < Zl--"'-" 2 o El requisito que algunos autores subrayan en la utilización correcta de estos tests consiste en garantizar que npn > 5 y que n(l . ( 7T1-7T ) con lo cual la hipótesis nula Ho : 7T = 7To puede juzgarse atendiendo a este resultado. 4.7T) d ---+ Z rv N(O. JUZGAMIENTO DE PROPORCIONES 245 la proporción muestral.Pn) > 50 .5. ~ f¿ (Pn .

6. X n . los tests para el juzgamiento de la hipótesis nula Ho : Irl . se consideró una submuestra de 64 niñas con Índice igual a siete que registró un promedio de edad de 12. Y2 . Ir2 = 0. entre 1994 y 1996 Y basado en una muestra de 4. Particularmente.) = ~ f j=l }jo Si algún sistema enuncia la hipótesis nula como Ho = IrI ..1.00 Zc = ----¡:::============== n (l_P(l)) + = (1_P(2)) / p(1) n = p(2) siendo p2) = ~ t i=l Xi Y pj.6 años con una desviación estándar de 1. JUZGAMIENTO DE HIPÓTESIS Por último. Particularmente para un análisis puntual. de una población con distribución de Bernoulli de parámetro Ir2.246 CAPÍTULO 4. se considera una muestra aleatoria Xl.Ir2 = 00.P) (~ + ~) 1")(1) + 1")(2) nrn mrm siendo P entendida esta estadística como un esti- n+m mador del valor común Ir = Irl = Ir2. 4. se basan en la estadística (pÁl) . Yrn. cuando se desea juzgar la diferencia entre dos propor- ciones poblacionales correspondientes a dos poblaciones. X2. . se comparó la edad cronológica de niños y niñas con igual maduración esquelética. Dentro del estudio epi- demiológico de salud y mal oclusión dental realizado por la Facultad de Odontología de la Universidad Nacional de Colombia y la Caja de Compensación Familiar Colsubsidio.724 pacientes de su antigua clínica infantil. si los tamaños de las muestras son relativamente grandes. siendo estas poblaciones estadísticamente independientes. la estadística apropiada que fundamenta el respectivo test es p(1) _ p(2) n m Z c= J P(l . El índice de Fishman es un indicador de la madurez esquelética de adolescentes y preadolescentes. . . y paralelamente una . .6 Ejemplos numéricos de aplicación Ejemplo 4. Y una muestra Yl .)) . ..pj..21 años. de una población con distribu- ción de Bernoulli de parámetro Irl.

EJEMPLOS NUMÉRICOS DE APLICACIÓN 247 submuestra de 51 mnos.. Bajo el modelo gaussiano.m.21.l. 50).975 de una distribu- .4 años con una desviación estándar de un año.05 permite adoptar la homoscedasti- cidad como supuesto de juzgamiento de Ha : MI = M2 (el promedio de edad en la cual los niños y las niñas alcanzan un Índice de maduración de siete es el mismo) dentro del sistema Ha : MI = M2 frente a HI : MI -¡ M2· 2 (n-l)s2 +(m-l)s2 .4641 Y teniendo en S2 cuenta que Fe F(63.6 .4 = -8. Dado que 12.14. 4. cornun es t lmaClOn 'ele l ' a vananza es 2 sp = 63x(1. =.8511 x 10.21)2+5axl 64+51-2 1 258746018 .6928 ) 1. para este caso partIcular. éste valor se constituye en evidencia estadística para rechazar la hipótesis nula Ha : MI = M2 dentro del sistema en consideración. ¿es pertinente adoptar la homoscedasticidad? Dentro 2 de su juzgamiento..6. la probabilidad P[Fe > 1. 51 su valor absoluto supera ampliamente al percentil 0.6 . y con este resultado 12. (1.54731294. difiere según el género? En primer lugar. Entonces como Sp = ~~m-2 2.4641J = 0. se acudiría a la solución de Welch para poder contar con los argumentos necesarios para sustentar la afirmación de igualdad de promedios poblacionales. la · .14.4641 64 + . con Índice igual a siete presentó un promedio de edad de 14.121938509)) l4 + II En consecuencia como el valor p para este juzgamiento es 6. S2 = 1 Y fe = ~ = 1. que mostró ser apto para representar la edad cronológica en este nivel de maduración. SI = 1. ¿es razonable afirmar que el promedio de eelad en la cual los niños y las niñas alcanzan un Índice de maduración esquelética de siete.14 .0811587 rv es un valor que al asumir a = 0. Si se pasa por alto la homoscedasticidad o si la decisión respecto a ella hubiese sido contraria.4 = -8.

'l que el prome- dio de producción de leche del otro grupo de vacas fue de 360 1 con una desviación estándar de 45 1.83397. JUZGAMIENTO DE HIPÓTESIS ción t con 112 grados de libertad. ¿Independientemente de la producción lechera. Para evaluar esta circunstancia. La hipótesis de que el efecto de la temperatura no altera la variabilidad de la producción. pues las reses tienden a reducir la ingestión de alimento cuando la tem- peratura aumenta y por consiguiente se ve reducida la producción láctea. pero una de ellas parece ser la temperatura del ambiente. Ejemplo 4. de todas maneras. se tiene lo siguiente: El promedio de producción mensual de las 47 vacas aisladas del calor fue de 597 1 con una desviación estándar de 36 1. mientra. lo cual puede analizarse de manera similar al ejemplo anterior. se puede afirmar que. El estrés afecta de manera importante la producción de leche en el ganado vacuno. durante el mismo período.4641 ) 64_ 63 2 ( 51 + 50 1 ) 2 En consecuencia.11 = /-12.98137059.6. la informa- ción contenida en la muestra respalda cuantitativamente la afirmación motivada por este análisis puntual. cuya protección solar fueron los árboles y ar- bustos presentes en el lugar.. también hay suficiente evidencia estadística para rechazar la hipótesis Ho : ¡'. C~n) C~~m ) -. se .2.-+--. es decir. (}r al manifestarse el sentido de aumento o disminución de la misma. la variabilidad de la producción es prácticamente igual en las dos condiciones de temperatu- ra? Además de preguntarse si ante las condiciones de temperatura del am- biente se modifica la producción lechera. modelada apropiadamente de forma Normal según el test de Lilliefors. bajo esta solución. 2 2 ( 1. Ho : = ()~. porque 2 82 8 ) 2 ~+~ 2 f= ( (~ + ir) = 112. Del acopio de información de la producción de leche de cada una de las vacas.248 CAPÍTULO 4. se construyeron establos con cubierta de material aislante del calor para ubicar durante un mes 47 vacas Holstein de las mismas características que 38 vacas mantenidas en los potreros. el investigador centra su atención sobre la variabilidad de la producción. Las causas que lo producen son de distinta naturaleza. 1.

El tamaño de la muestra es un tema que induce la reflexión en los teóricos y la indagación de su magnitud en los usuarios de la estadística. y. Estimar un pará- metro es una actividad que persigue fines distintos de los del juzgamiento de una afirmación acerca de él. con lo cual fO.54323124 Y que fO. la variabilidad no se modifica de una manera notable. sin mayor pretensión. 4. La solución corriente establece para este caso que fO. sobre dos tamaños de muestra simple bajo la orientación del modelo gaussiano. Como el tamaño de la muestra tiene efectos directos sobre los errores del tipo 1 y del tipo Il.64. sólo se presentan unas minúsculas consideraciones. así como en la calidad de las estimaciones. TAMAÑO DE LA MUESTRA 249 juzga en el sistema Ho: a~ = a~ frente a Hl : a~ i= a~. 4. por tanto.975 (46. Reiterando lo expresado en el capítulo 3. la disposición de lo necesario para el logro de los fines estrictamente no es la misma. fe= ~ = i!~l~ = 0.7. contrariamente.975 (46. 37) = 0.025 (46.37) < fe < fO. con lo cual se puede asegurar que bajo las dos condiciones de temperatura en las cuales permanecen las reses. El tama- ño de la muestra que se utiliza con la finalidad de estimar paráme- tros no necesariamente es el tamaño apto para el juzgamiento de hi- pótesis. corresponde a un asunto de gran amplitud que contiene muchas singula- ridades y por supuesto no puede ser abordado por un texto que tiene otra mira. Entonces. o. Son dos procesos entroncados pero distintos en sus efectos o trascendencias.8880067.025 (46.37) y de allí concluir que no hay la suficiente evidencia estadística para rechazar la homoscedasticidad. 37) = 1. la función de potencia asiste su determinación. .7 Tamaño de la muestra El tamaño de la muestra tiene consecuencias ostensibles en la toma de decisiones. un tamaño elegido para juzgar una hipóte- sis no propiamente es el tamaño adecuado para estimar el parámetro correspondiente.

y'Ti(¡. pero la elección de ¡. como puede ser la de a o la de {3....¿o en el sistema A.. entonces y'Ti(¡. la pre- tensión del menor riesgo en la decisión se materializa en la adopción de probabilidades pequeñas para los errores del tipo 1 y II. Según las consideraciones anteriores. n= [0"(Zl-a+ Zl_¡3)]2 ¡.¿ = ¡..1. por consiguiente.. asumiendo Normalidad y varianza conocida.¿o ~ ¡.¿o en el sistema B.¿*) + Zü] O" Por tanto.. que ..PJL* [y'Ti CXn ~ ¡.¿*) > y'Ti(¡..¿o ~ ¡..¿o ~ O" ~ ¡.. Particularmente..¿* tamaño idéntico al requerido para el juzgamiento de la hipótesis nula Ho : ¡. como se dedujo en la subsección 4.3.¿* no es del todo arbitraria. Si ¡.... el test correspondiente de tamaño a. + Za = Zl-¡3 O" y como Za = ~Zl-a.¿o+ O"za] y'Ti _ .¿* que acompaña las reflexiones alrededor del error del tipo II.¿o ~ ¡.¿*) ~ Zl-ü = zl-¡3 O" de donde finalmente.¿o) < Z O" a" que puede enunciarse igualmente como T : "Rechazar Ho si x n < ¡.¿* . la probabilidad del error del tipo II sería.:.¿ fuese igual a ¡.. JUZGAMIENTO DE HIPÓTESIS Usualmente se suele asumir un valor de a deseado y a partir de él ajustar un tamaño muestral para obtener un pretendido valor de (3.¿ = ¡.¿o). ¡..:-----. es T : "Rechazar Ho si y'Ti(x n ~ ¡. n 2:¡. el juzgamiento de la hipótesis nula Ho : ¡.. requiere un tamaño de muestra específico.. La determinación de ¡.¿* (¡.¿o + O"Zü" y'Ti . Concretamente.¿*) ~~--=-------....¡. (3=PJL* [X .250 CAPÍTULO 4..

y debido a que Z(3 = -Zl-(3. permaneciendo constantes los valores de la desviación estándar y los percentiles seña- lados. Fijar el valor de /L* cercano a /Lo. Al igual que el caso anterior se asume el modelo gaussiano y adicionalmente el conocimiento de las varianzas poblacionales y (T~. 4. pues lo magnifica sobremanera.3. (Ti El test TB desarrollado en el numeral 4. luego al +a 2 n 15* . tiene un efecto extraordinario en el tamaño de la muestra./L2 = Jo.JO = Zl-a + Zl-(3. En este sentido. en consecuencia. f3 = Po* Con lo cual se puede afirmar que Jo . TAMAÑO DE LA MUESTRA 251 corresponda al valor de f3 deseado.7. la probabilidad del error del tipo II sería.15* 2 2 + Zl-ü = Z(3. - Y n) > ¡.2. considerando m = n puede formularse de otra manera como TB : "Rec h azar H ' (- o SI Xn ./L2 fuese igual a 15*. Otra situación particular la constituye el establecimiento del tamaño de muestra adecuado para juzgar la hipótesis nula Ho : /Ll . en el sistema B. con lo cual se deduce que PfI 2 al +a 22 n Cada una de las dos muestras debe entonces contar con n unidades para cumplir cabalmente las exigencias relacionadas con las probabilidades .:== 2 2 + Zl-a = -Zl-(3. la respuesta a la pregunta ¿qué tan sensible debe ser el test? es la única vía que proporciona los elementos y argumentos para la escogencia de /L*. uO + V(Ti + (T~ n " Zl-a· Si /Ll . entonces PfI al JO - +a2 n 15* --. debe responder a razones de índole de sensibilidad del test.

Como punto de partida en la construcción del concepto de juzga- miento secuencial de hipótesis.8. se encuentran procedimientos basados en tests llamados se- cuenciales surgidos de la idea de Wald. . se presenta la siguiente definición inicial que detalla la idea de una clase particular de tests secuenciales. . el) i=l . en el sistema A. dentro de la temá- tica conocida como análisis secuencial que incluye también estimación de parámetros. et) y denotando la razón de verosimilitudes Aj. e). 4. e) = fx(x. ..252 CAPÍTULO 4. Esta expresión es igualmente válida para el cálculo del número de unidades estadísticas que deben seleccionarse en cada una de las dos poblaciones.X1.. La sensibilidad del test. estableciendo el sistema de hipótesis Ho : fx(x. Siendo Xl. .2..1.X2. X 2 . eo ) L(eO. como j TI fx(x. un test secuencial requiere menor número de observaciones muestrales que un test basado en una muestra aleatoria de tamaño fijo.8 J uzgamiento secuencial Como formas especiales de juzgamiento de hipótesis. recono- cida como tests secuenciales de razón de verosimilitudes. . e) = fx(x.. fijando los valores ""o y ""1 tales que ""o < ""1. ..Xj) i=l Aj = L(fh.X1.. . En términos generales. es la determinante del valor 5*./12 = 50. JUZGAMIENTO DE HIPÓTESIS de los errores en la decisión. Estas formas especiales de juzgamiento de hipótesis utilizan explícitamente tanto la probabilidad del error del tipo 1 como la probabilidad del error del tipo II fijando de antemano sus valores.. . de manera que el tamaño de la muestra no está predeterminado sino que ahora depende de Q y (3 y la decisión final está sujeta a decisiones previas tomadas en pasos consecutivos dentro del proceso. para el caso del juzgamiento de la hipótesis nula Ho : /11 . X j una muestra aleatoria de ta- maño j de una población con función de densidad f x (x. . para j = 1.Xj) j TI fx(x. Definición 4.X2. eo ) frente a H1 : fx(x. denominada originalmente como tests secuenciales de razón de probabilidad (SPRT Sequential Probabi- litY Ratio Test). como en el caso anterior.

n i=l Como a y (3 han sido establecidos de antemano. /'\:1). ()0) dX 1 dX2 .. An S /'\:0.2. j = 1. La región crítica C T de un test secuencial T está conformada por la unión de las regiones CT.. La región de aceptación del test secuencial T. para los cuales el teorema siguiente facilita una aproximación..1} describe el subconjunto del espacio de las observaciones.n = {X~IAj E (/'\:0. .. dX n (3 = f 1 f:r fx(xi.n y CT. los cuales definen plenamente el test secuencial. el juzgamiento secuencial establece previamente los valores de a y (3 manejando así simultáneamente los errores del tipo 1 y del tipo II y la delimitación del tamaño de la muestra sujeta a esas determinaciones previas. . An 2: /'\:1. ()1) dx 1 dX2 . 4.1}.n . n . JUZGAMIENTO SECUENCIAL 253 al test descrito por T : "Rechazar Ho en el paso j si Aj S /'\:0. cuyos elementos facultan al test secuencial para rechazar la hipótesis nula en el sistema de hipótesis establecido. n=l Ar. dx n . .8. de manera similar a su región crítica es siendo AT. el paso siguiente consiste en la concreción de esos valores.8.. . j = 1. denotada por A T .n no están totalmente especificados y requieren para su determinación los valores de las constantes /'\:0 y /'\:1..n = {X~IAj E (/'\:0. Corno se comentó al iniciar la sección 4.n i=l fx(xi..n a saber: donde la región CT. f:r n=l Cr. En consecuencia. /'\:1).. Entonces. los conjuntos AT. .2. no rechazar Ho si Aj 2: /'\:L incluir la observación Xj+1 Y calcular la nueva razón de verosimilitudes Aj+1 para continuar en el paso j +1 si /'\:0 < Aj < /'\:1 " se le denomina test secuencial de razón de verosimilitudes. a = f 1.

J1 Y ""1 ~ -(3 .4.6 Q Y ""1* = T 1-Q ' respec t'zvamen t e.. o: 1-(3 [1-01]j 1-00 Asumiendo que 00 < 01 . que definen un test secuencial T. y aproxi- ma dos 1os va1ores ""o Y ""1.Oo]j A' . JUZGAMIENTO DE HIPÓT~~SIS Teorema 4.8.8. de una población con distribución de Bernoulli de parámetro O.Xn una muestra aleatoria de tamaño n.2. 1 el test secuencial T rechaza Ho : O = 00 si Aj :s. -> 1n [~] + J. puede formularse en los siguientes términos. entonces i=~~ < 1 Y ~~g::::~:)l < 1. X 2 . In [~] O -1.Od] i~l x. . ""o.6' es decir. Definidos los tamaños de los errores a y (3. los tamaños 0:* y (3* correspondientes a los valores por ""o y ""i son tales que a * + (3* < o: + (3. Sea Xl. Ejemplo 4. Definidos los tamaños de los errores o: y (3. J [1 . por ""o* = 1-. Definida la razón de verosimilitudes rr j O~i(l .3.OO)l-xi 00 (1. j [01(1 .01)1-x i 1. el test rechaza Ho si Aj :s. Al utilizar la aproximación derivada anteriormente. si j 1n [01(1 O0(1 .254 CAPÍTULO 4.O) 00 )] L: X2 . 1~. o: 1-1 2=1 . .00 ) 0 rr i=l O~i(l . . los valores ""o y ""1. si j [ 000(1-0d]i~lXi 1(1-0 0) :s. pueden aproximarse mediante o: 1-0: ""o ~ 1 . Teorema 4. _i=_l_ _ _ _ __ J .8. luego el test secuencial rechaza la hipótesis nula Ho : 0= 00 . Un test secuencial T para el juzgamiento de la hipótesis Ho : 0=00 en el sistema de hipótesis simples Ho: 0=00 jrentea H 1 : 0=0 1 habiendo definido previamente o: y (3. n un valor no prefijado.

no rechazar Ho i=l j en el paso j si ¿ Xi :S 00 + bj .el) el test no rechaza la hipótesis nula si j ¿Xi :S ao + bj.8. JUZGAMIENTO SECUENCIAL 255 Denotando por In [~] al = y por In [e 1 (1-eol ] eo(l-eIl el test rechaza la hipótesis nula si j ¿Xi:2: al + bj. si Denotando por -In (T) ao = In [e 1 (1-eol ] . incluir la observación Xj+1 para i=l j+1 calcular el nuevo valor ¿ Xi Y continuar en el paso j + 1. si i=l j ao + bj < ¿ Xi < al + bj" . eO(l. el test secuencial se puede formular de manera simplificada como j T : "En el paso j rechazar Ho si ¿ Xi :2: al + bj.=1 . . es decir. al utilizar la aproximación derivada anteriormente. el test no rechaza Ho si Aj :2: 1ft. igualmente. i=l Por otra parte. el test secuencial no rechaza la hipótesis nula. i=l En síntesis. si Aj :2: '"'1. 4.

.. ... JUZGAMIENTO DE HIPÓTESIS De manera gráfica puede entenderse el test como lo muestra la figura 4. Ejemplo 4.(Xi -"o . . Un test secuencial T para el juzgamiento de la hipótesis Ho : f) = ¡.Lo frente a HI : f) = ¡. - Rechazar Ho _..Xn una muestra aleatoria de tamaño n. . siendo e una constante conocida y definidos previamente O' y (3.8... _.5. - _...16: Representación del test secuencial del ejemplo 4. X 2 ..- _.... ...(Xi -1.... N o rechazar H o 1 2 3 4 5 6 7 8 9 10 J Figura 4.8.. _ .Lo + C(J.. j i~ Xii . puede formularse en los siguientes términos: En primer lugar. Continuar .ca)' . .....o)2) 1 ..256 CAPÍTULO 4. ..- . Sea Xl.. .. ..... de una población con distribución gaussiana de valor esperado f) y varianza (J2 conocida..t. Aj = cxp [2~2 (t.....4.Lo en el sistema de hipótesis simples Ho : f) = ¡. _.. . ... n un valor no prefijado.16...... . . .

.ta) > . 4.6 a) + j -2e) ".tu) E (--In e 1-. el test secuencial se puede formular de manera simplifi- cada corno T . . + 1.2 calcular el }. Corno la decisión de rechazar o no rechazar la hipótesis nula puede ser pronta.¡..- < . si j (Xi . j 2: -'-----'----'- i=1 (J" e ..ta) :"En el paso J rechazar Ha SI 6 (J" 1 2:: --In e (a) + .a) + J.=1 j 2: -'-------'- . 2 i=l Recapitulando.6 a) + j~.B' es decir.ta) 2: -'-----'----'.8. si (Xi . en el juzgarniento secuencial tiene un sentido singular. J.6 a) + . SI.-11n (1--.. ~ 1-jJ e J-.ta. (J" 1 (a) (Xi . pero también tardía después de haber observado un número considerable de unidades.=1 )+1 ~ (Xi .. el ... el test rechaza Ha si Aj ::.6 e--In . ~ (Xi . el test no rechaza Ha si Aj 2:: l~a. 1~.-e2 . es decir.. el test secuencial no rechaza la hipótesis nula si Aj 2:: /'\. 2 i=1 no rechazarla si ~ 6 j (Xi .¡.6 o rechazar la hipótesis nula. (J" _~ In (1 e - .a.- .¡. si a <-- -1-.ta) ::. 1=1 El tamaño de la muestra que siempre ha sido un interrogante ma- yúsculo. .+ j-.¡..e -. al utilizar la aproximación obtenida anteriormente.ta) para cont·rnuar en e1 paso J.¡. 2 e 1 (1-.. /'\. JUZGAMIENTO SECUENCIAL 257 El test secuencial T rechaza Ha : () = ¡. es decir tornada con muy pocas unidades observadas.1n (J"c 1 (1 -.¡. va1or 6 (J" . que al utilizar la aproximación obtenida anteriormente. igualmente. si Aj ::..6 - En segundo lugar.1.

no rechazar Ha : e = ea. y si N es una variable aleatoria cuyo recorrido es el conjunto de los naturales y cuyos valores n. 3 . y precisamente para es- tos procedimientos de tipo secuencial se asume como una variable aleato- ria.. puesto que el tamaño de la muestra final como no está predeterminado ya no es un número fijo sino variable porque depende de Aj. . . .Z. es una sucesión de variables aleatorias independientes e idénticamente distribuidas. si LYi :::: In Ka. incluir la observación Yj+l para calcular la i=1 ]+1 nueva razón de verosimilitudes LYi' para continuar en el paso i=1 j j + 1. . 2 . .258 CAPÍTULO 4.1 se puede demostrar que tanto Eoo [N] como EOl [N] son finitos.. Y2. En términos de la definición 4. · · · . Mediante la llamada ecuación de Wald es posible establecer aproximaciones a estos valores esperados del tama- ño de muestra. JUZGAMIENTO DE HIPÓTESIS interrogante cambia de ¿cuál será el número de unidades que se debe elegir? a ¿cuántas unidades en promedio se deben elegir?. Y 2 . YrL' entonces E [t Y¡ 1~ 1¡E[N]. . cuando el test secuencial . Teorema 4. Yr¿. y sus valores considerados como observaciones de la variable aleatoria N. i=1 Como el tamaño de muestra no está prefijado. denotada como N.O¡) .8. De esta ma- i=l nera el test secuencial se puede enunciar como j T : "Rechazar Ha : e = ea.8. dependen de las variables Y 1 ... = 1. Si la sucesión Y1 . tales que E[iYi 1] y E[Yi] = r¡ son finitos.. i=l j si LYi :::: In Kl. . r t E lec uan d o 1a sus t't" 1 uClOn Yi = 1n [fX(Xi. si In Ka < L Yi < In K 1" . 1a razon ' j de verosimilitudes Aj se puede expresar como Aj = L Yi.6 (Ecuación de Wald)...Ool] fX(Xi.. .

] ~ t ~ t (1 . Eeo [f Yi] ~ t=l In ""o e igualmente EOl [i~ Yi] ~ In"" 1. 4. X 2. en el sistema de hipótesis Ho : () = 75 frente a H1 : () = 80. EOl [N] ~ E [Y. JUZGAMIENTO SECUENCIAL 259 conduce a rechazar la hipótesis nula. 0:) In [T ] 1. . entonces siendo r la probabilidad de rechazar la hipótesis nula. 13) In [~] + 13 In [T] 2. 13) In ""o + 13 In ""1 (1 .Xn una muestra aleatoria de una po- blación con distribución gaussiana de valor esperado () y varianza cono- cida a 2 . P [i~ Yi :S In ""o] = 1 Y i~ Yi tiende a tomar valores cercanos a In ""o y cuando el test conduce a no rechazar la hipótesis nula P [i~ Yi 2': In ""1] = 1 Y i~ Yi tiende a tomar valores cercanos a In ""l. Con estas consideraciones..r) In "" 1 .8. Sea Xl. . r¡ Luego o: In ""o + (1 ..7.] ~ E [Y. .] el t el t Ejemplo 4. Eoo[N] ~ E [Y. 0:) In "" 1 o: In [ ~] + (1 .] ~ E [Y.8. el tamaño de muestra esperado E[N] = E [f Yi] i=l r¡ de manera que su valor puede aproximarse como E [N] ~ r In ""o + (1 . Determinar el tamaño de la muestra requerido para el juzga- miento de la hipótesis nula H o. Usando la ecuación de Wald.

75)] 5 PO=80 [Xn < cJ = 0. X Xi..j3) In (1 ~ j3) + j31n (1 ~ a)] = 8..64485348 de donde se deduce que yIn = 3.05 = PO=80 [yIn(X n . En general. si el sistema de hipótesis se formula.2. a = 0. /LI 2a Luego 1 2 E¡.8206 ~ 6 = EOl[N] ~ -2 [(1.80)) = 0.75)) = 0.to [Yi] = 2(]"2 (¡..3538 ~ 9.05. n = 16.. entonces Eoo [N] ~ 2 [a In (1 ~ j3) + (1 - a) In (1 ~ a)] 5. ¡.2 = 1. siendo ¡.to frente a HI : e = ¡. entonces n = 15.80)] 5 5 ' Luego <I> ( y1n(c . ).99 Y <I> ( y1n(c .tI = 80.01.2(]"2 (¡.tI . j3 = 0. .7704332.. determinar los tamaños de muestra esperados si el test que se va utilizar es un test secuencial... (]"2 = 25. ( /LO)]. I En el caso particular ¡.05 = -1. JUZGAMIENTO DE HIPÓTESIS con las siguientes condiciones: a = 0. como Ho: e = ¡. j3 = 0... /Lo) .3. EO=75 [Yi] 2' E O=80[Yi] = -~..01.97120048. .99 = 2.80) < y1n(c ..05 5 5 es decir.. y1n(c .tI . Yi = 1 [( ILo2 - -----:2 2) P'1 - 2Xi (ILo .to = 75.80) 5 = ZO. ¡. Yi = In [IIx (Xi.260 CAPÍTULO 4. es decir. Entonces PO=75 [Xn > cJ = 0.05.326347 Y 5 = ZO. (]"2 = 25.75) y1n(c .to) 1 2 E¡.to < ¡. IL] )] . El test T: "Rechazar Ho si xn > c" es un test equivalente al test de razón simple de verosimilitudes.tI. Igualmente. .tI.tl [Yi] = .01 = PO=75 [yIn(X~ -75) > y1n(c .

La tradición de un mo- delo para representar una variable puede ser un argumento importante. porque permite la comparación de resultados de distintas investigaciones o estudios.9 Juzgamiento del ajuste Al constituir distintas formas de teorizar y de aplicar conceptos. la elección debe responder tanto a razones es- tadísticas como a argumentos no estadísticos. se continúa con la siguiente sección dedicada al juzgamiento del ajuste. esta propiedad de necesitar un tamaño esperado de la mues- tra menor al tamaño de la muestra que requieren los tests que deben determinar previamente el tamaño citado. como la manera propia de representar el comportamiento de una variable y más específicamente para representarlo en la acepción de población. 4. por ello en rei- teradas ocasiones este texto se ha referido al modelo de probabilidad elegido. JUZGAMIENTO DEL AJUSTE 261 En general. Terminada esta breve presentación de la idea central de un test se- cuencial. se construyen buenos intervalos confi- denciales para alguna función del parámetro o para sus componentes. Pero al lado de razones propias de la naturaleza del fenómeno. hay instrumentos estadísticos que permiten valorar la aptitud del modelo . en los detalles del conocimiento del fenómeno dentro del cual se modela una variable se encuentran argumentos de mayor significación para señalar a un modelo en particular. como la concepción bayesiana. es una propiedad que carac- teriza a los tests secuenciales. algunas áreas de la estadística prescinden de los modelos de probabilidad mientras que otras. pero por tratarse de una tarea de adopción de un paradigma lo más fiel a la realidad en estudio. Pero indiscutiblemente a la esencia misma de la inferencia estadística son inherentes los modelos probabilísticos. ¿cuál debe ser el modelo adecuado? Por supuesto que hay innumerables distribuciones estadísticas que pueden servir de modelo para representar una población específica.9. 4. en un caso particular. posi- ciones que no rivalizan dentro de una concepción unitaria de la es- tadística. pero no siempre debe ser el único argumento. extien- den su tarea. Indiscutible- mente. Con la elección de un modelo se buscan o evalúan estadísticas para su certificación como estimadores. Pero. se apoya el juzgamiento de una hipótesis relativa precisamente al modelo elegido.

. el test de Normalidad de Anderson- Darling. 2. e) para todo x..1 Juzgamiento del ajuste por medio del método de Pearson Propuesta a principio del siglo XX por Pearson. tests entre otros que el lector podrá estudiar y profundizar en un curso de estadística no paramétrica principalmente.. . . asumida como modelo para la población. que poseen propiedades especiales y las hacen en cierta forma más demandadas. . principalmente al modelo gaussiano. 4. . Este texto solamente introduce las ideas pertinentes al tema por medio de los tests. j = 1. como uno de los procedimientos más tradicionales para el examen de la calidad del ajuste y el test de Kolmogorov-Smirnov. se fija una partición del recorrido de la variable que va a ser representada por la variable aleatoria X.262 CAPÍTULO 4.Nk )' tiene distribución multinomial con pará- metro . partición constituida por k clases disjuntas y se considera además una muestra aleatoria Xl.. aun cuando un concepto paralelo al tema venía desarrollándose en el siglo anterior: la estimación de una función de densidad. Se tra- ta de un variado repertorio de procedimientos con la denominación de bondad del ajuste. de tamaño n de una población cuya función de densidad no se conoce. la decisión frente a la elección de un modelo propuesto corresponde al juzgamiento de la hipótesis "el modelo candidato interpreta adecuadamente el comportamiento poblacional". El lector encontrará una profusa bibliografía acerca del ajuste a modelos proba- bilísticos.. Sin embargo es necesario mencionar la existen- cia de tests como los de Lilliefors. el vector aleatorio V = (Ni. construidos sobre diversos puntos de vista. En términos muy concretos. . N 2 .9.k. . Para dar inicio a las consideraciones del juzgamiento del ajuste. . que se traduce en la mayoría de las veces a través de la función de distribución como Ho : Fx(x) = Fo(x. JUZGAMIENTO DE HIPÓTESIS de ser emulado por la información disponible en la muestra. conocido como pruebas de Normalidad. X2. frente a alguna hipótesis alterna apropiada. es la forma pionera de los tests de juzgamientos del ajuste. de Pearson. pruebas especiales para el juzgamiento de la Normalidad como la de Shapiro-Wilk o la de Martínez-Iglewics. Siendo N j la variable que contabiliza el número de observaciones muestrales que pertenecen a la j-ésima clase ej. X n .

En otras palabras.1f2. es cotejar la frecuencia N j . TI nj! i=l j=l El j-ésimo componente del vector e... Entonces.2. Y j=l k por otra parte ¿ nj n. . n nj .. . . nj E {O. en con- sonancia con el enunciado del teorema 4. anterior a la existencia de conceptos como la razón generalizada de verosimilitudes. probabilidad que se calcula por supuesto por medio del modelo en consideración. De esta manera.9. porque bajo la adopción del modelo. . el sistema de hipótesis que incluye la hipótesis nula reformulada puede plantearse como H O :1fj=1fJ.2. denomi- nada j-ésima frecuencia observada con la frecuencia n1fJ conocida co- mo j-ésima frecuencia esperada. JUZGAMIENTO DEL AJUSTE 263 k e= (1f1. j=1.1fk)'. 1. puede enunciarse como La idea de Pearson. cuyos componentes son tales que ¿ 1fj = 1.6 página 205. n}. su j=l función de densidad es: __kn_'-II 1fj - . . .k frente a H1 : 1fj # 1fJ. j=l J que al contar con un tamaño de muestra suficientemente grande. el test de razón generalizada de verosimilitudes será T: "Rechazar H o si An = nn II :J0) k ( nj < c ". 1fj denota la probabilidad de que una observación muestral pertenezca a la clase j..'" .. . 4. j = 1.k.2..

es decir.k. basada en los resultados de una entrevista a 950 empleados del sector manufacturero. X 2 . Pearson sintetiza su idea en la estadística L (N k j .1).9.3. es decir.. por tanto. luego la adopción del modelo se desecha si k (N. ... . La Estadística de Pearson converge en distribución a una variable aleatoria con distribución Ji-cuadrado con (k .1) de una variable que toma valores en el mismo intervalo. la proporción de la prima legal que el asalariado dedica a pagar obligaciones económicas contraídas anteriormente es una de las variables de interés para un estudio sociológico.Xn . con lo cual se establece la Estadística de Pearson.1. JUZGA MIENTO DE HIPÓTESIS E[Nj ] = mrJ. de tamaño n de una población Uniforme en el intervalo (0. fe). . En segundo lugar se considera una muestra aleatoria Xl. Como preparación a la evaluación del ajuste al modelo Uniforme en el intervalo (0.2.= J i i k ~ k dx=- 1 k' j = 1.1). y a partir de ella se determina cada una de las variables N j . en- cuentran razonable el uso del modelo Uniforme para describir rasgos de . mientras que los valores grandes son evidencias estadísticas de no coherencia con el modelo. _ n1["0)2 '~ "' J n1["0 J > x1-oJk 2 . .264 CAPÍTULO 4. De manera particular. de manera que ° 1[". J=l J Ejemplo 4. como se señaló anterior- mente. el subintervalo j-ésimo es (2if.1) grados de libertad. mrJ)2 j=l n1["° J ' pues valores pequeños de ella se constituyen en argumentos a favor de la hipótesis nula. se establece una partición que por comodidad puede consistir de subintervalos de igual amplitud. que en general se le entiende como ajuste. . de cuyos resulta- dos se extrae la tabla 4. de no ajuste. Los teóricos sociales encargados de la conducción del estudio no encuen- tran razones especiales para afirmar que la proporción de la prima dedi- cada a cubrir obligaciones económicas contraídas tenga una distribución con algún sesgo o que tenga un apuntamiento especial.

este aspecto de los empleados.4.4: Elementos para el cálculo del valor de la Estadística de Pear- son correspondiente al ejemplo 4.3: Distribución del número de empleados según el porcentaje de la prima que dedican al pago de sus obligaciones económicas adquiridas.1) = 4 grados de libertad.9.9.33684211 3 (0. (nj . decisión idéntica si se utiliza el valor p cuyo valor corresponde .48778 corresponde al percentil 95 de una variable con dis- tribución Ji-cuadrado con (k .33684211 Total 2.2] 174 190 1. .8.0. al ser el valor de la Estadística de Pearson menor que el mencionado percentil.08421053 5 (0.0. se concluye que no hay evidencia estadística para rechazar el modelo uniforme para caracterizar con propiedad la proporción de la prima de los empleados dedicada a cubrir obligaciones económicas con- traídas.npi~)2 I j I Clase j I nj I n1rJ I npiC!1 1 [0.18947368 Tabla 4.0. 4.1.6] 194 190 0.6.4 presenta tanto las frecuencias observadas y esperadas corno los sumandos para la determinación del valor de la Estadística de Pear- son.0] 198 190 0.8] 186 190 0.4] 198 190 0.2. El valor 9.JUZGAMIENTO DEL AJUSTE 265 Porcentaje Número de dedicado Empleados Más de hasta O 20 162 20 40 210 40 60 194 60 80 186 80 100 198 Total 950 Tabla 4.34736842 2 (0. La tabla 4.0.1. derivados de la información precedente.08421053 4 (0. por tanto.

L) -- CJ 2] d x -_ ([> (X-j --JI) -([> (X j -1 .5: Distribución del número de pacientes según la capacidad pulmonar total. exceptuándose el primero y el último. de tamaño n de una población cuya densidad se des- conoce y a partir de ella se determina cada una de las variables N j . .J. . y seguidamente se considera una muestra aleatoria Xl. de una variable de interés.- vI21iCJ 2 J.. a los cuales se les realizó un examen para determinar la CPT. JUZGA MIENTO DE I1IPÓTgSIS a 0. Igualmente como preparación a la evaluación del ajuste al modelo gaussiano con valor esperado J. ..266 CAPÍTULO 4.. la CPT tiene como promedio 5. . se ha resumido la información de esta variable en la tabla 4. - J _¡Xj x' -- 1 [1 (x - exp . k.L) CJ CJ )-1 j = 1. X 2 . en un estudio neumológico. Específicamente. es una de las variables relevantes.2.70095688. Ejemplo 4.00 y x~ = 00. como se ha señalado. la CPT (capacidad pul- monar total) definida como el volumen máximo que los pulmones pueden alcanzar con el máximo esfuerzo. sin antecedentes neumológicos. con una desviación estándar de 150 mI.Xn . De una muestra de 270 pacientes. .L y varianza CJ2 totalmente es- pecificados. se determina una partición de la recta real que por comodidad puede consistir de k subintervalos disjuntos de igual amplitud. En los adultos.5.2. para establecer la correspondiente estadística de Pearson. . con x~ = . es un intervalo cuya probabilidad es o ]f.9.800 mI. CPT(ml) Número de Pacientes Menos de 5 400 12 de 5 400 a 5 500 46 de 5 500 a 5 700 78 de 5 700 a 5 850 80 de 5 850 a 6 000 39 de 6000 y más 15 Total 270 Tabla 4. El subinter- valo j-ésimo (xj -1' xj).

204702137 55.26957697 0. se conduye que no hay evidencia estadística para rechazar el modelo gaussiano como modelo apto para caracterizar la CPT.07785468 5. muchas veces se candidatiza a la familia de modelos y no a un miembro particular de ella.9.2 = (150)2.00] 20 0.86917443 0.5400] 2 0. en el segundo. En estos ejemplos se proporcionaron explícitamente los valores de los componentes del parámetro.j = 5800 Y e2 = 0. lo cual implica la estimación de componentes del parámetro. será una elección acertada como modelo para representar la capaci- dad pulmonar total de pacientes que cumplen los criterios de inclusión definidos para el estudio? La tabla 4.5550] 15 0. En el primer caso. por tanto. decisión que equivale a utilizar el valor p cuyo valor es 0.9. derivados de la información precedente. al ser el valor de la estadística de Pearson menor que el mencionado percentil.800 y desviación estándar de 150.npi~)2 npi~ 1 ( -00.03421478 0.86935135 Total 3. (h = O y fh = 1.12213300 0.278230122 75. Sin embargo no siempre ocurre que el modelo en elección esté completamente especi- ficado.22819633 Tabla 4.66485144.82584251 3 (5550.40486834 4 (5700. y de esta manera se afecta la distribución de la Estadística de Pearson.6 presenta tanto las frecuencias observadas y esperadas como los sumandos para la determinación del valor de la Estadística de Pear- son.378066128 102.091211282 24.2.1) = 5 grados de libertad.043959905 11. JUZGAMIENTO DEL AJUSTE 267 ¿El modelo gaussiano de valor esperado 5.62704613 0. 4. pues se reducen los grados de libertad en el número de componentes estimados.6: Elementos para el cálculo del valor de la Estadística de Pear- son correspondiente al ejemplo 4.05 5 (5850. bajo el modelo en consideración por supuesto.003830425 1. La demostración de esta afirmación está en concordancia con el teorema .5850] 102 0.90188334 2 (5400.6000] 71 0.0705 corresponde al percentil 95 de una variable con dis- tribución Ji-cuadrado con (k .22619140 6 (6000.5700] 60 0.9680E . el = f. (nj . El valor 11.

Fo(x. Kolmogorov condensó su idea en la estadística Dn = sup IFn(x) .l = 5800 Y (J = 150. JUZGAMIENTO DE HIPÓTESIS 4.l y (J por sus respectivas estimaciones.2 Juzgamiento del ajuste por medio del método de Kolmogorov-Smirnov Como se manifestó en el numeral anterior. a finales del mencionado decenio..9. porque si la mayor diferencia entre la distribución propuesta y la función de distribución empírica es relativamente pequeña. por su parte. B)I -oo<x<oo que luego Smirnov. B) para algún x.268 CAPÍTULO 4. Con esta modificación en los grados de libertad y la sustitución de J.88 Y 8270 = 182. la decisión frente a la elec- ción de un modelo propuesto. traducida generalmente a través de la función de distribución. B) para todo x frente a H 1 : Fx(x) . el procedimiento es el mismo que el seguido en los dos ejemplos anteriores. las demás diferencias . la idea de Kolmogorov. Del mismo teorema se puede afirmar que valores pequeños de la estadística Dn son argumentos estadísticos a favor de la hipótesis nula. A diferencia de la idea de Pearson que coteja las frecuencias observadas con las frecuencias esperadas. estadística cuya distribución depende directamente del tamaño de la muestra como lo garantiza el teorema de Glivenko- Cantelli.¡.. coteja la función de distribución correspondiente al modelo postulado con la función de distribución empírica. B) para todo x. Entonces. habría sido necesario estimar los dos componentes del parámetro. si en el ejemplo anterior no se hubiesen especificado los valores de J. El método de Kolmogorov-Smirnov evalúa el ajuste a modelos que repre- senten variables continuas y juzga la hipótesis nula Ho : Fx(x) = Fo(x. dentro del sistema de hipótesis Ho : Fx(x) = Fo(x. que para este caso son X270 = 5698.6 Y está fuera de los alcances de este texto. la hizo extensiva a otros propósitos. equivale al juzgamiento de la hipótesis "el modelo candidato interpreta adecuadamente el comportamiento pobla- cional".2. 4.45. Fo(x. A principio de la década del 30 del siglo pasado. y como consecuencia los grados de libertad disminuirían de 5 a 3.

4. Como sup 1F25(X) . entonces para cada v > O. mientras que valores grandes de la estadística se constituyen en evidencias es- tadísticas para prescindir del modelo propuesto como representante del comportamiento poblacional. 77 a 81). por tanto.Fo(x. una muestra de 25 baldosas de cerámica de un lote de producción fueron seleccionadas para identificar el modelo apropiado para describir la variabilidad del grosor de la baldosa que ella alcanza al final del proceso de fabricación. el tamaño del test puede establecerse mediante la expresión Ejemplo 4. la función de distribución correspondien- te al modelo en consideración y las diferencias entre ellas. La función h( v) fue tabulada por Smirnov a mediados del siglo pasa- do y muchos programas de cómputo estadístico han incluido algoritmos para la determinación de los respectivos percentiles y el cálculo de los valores p. Gib- bons (1971) pp. Teniendo en cuenta infor- mación que acopia el Departamento de control de calidad. decisión que se adopta cuando d n > c. que el lec- tor puede consultar en Nonparametric Statistical Inference (J. JUZGAMIENTO DEL AJUSTE 269 también serán pequeñas y. fJ) es una función de distribución continua.05 y el percentil 95 de la distribución . fJ)1 = 0. el modelo es pertinente. El siguiente teorema presenta una aproxi- mación cuando el tamaño de muestra es relativamente grande. Utilizando la aproximación ofrecida por el teorema anterior. e igualmente algunos textos.7 presenta los valores particulares de la muestra ordenados.9.9. la función empírica. En pocas palabras. cuando la calidad del ajuste no es satisfactoria se descarta el modelo propuesto. Para ilustrar la parte operativa del ajuste por el método de Kolmogorov-Smirnov.3. principalmente los textos de es- tadística no paramétrica. La distribución muestral de Dn tiene una expresión engorrosa.4. es razonable pensar que el grosor tiene un comportamiento uniforme entre 90 y 110 milímetros. Si Fo(x.9. La tabla 4. incluyen tablas que permiten determinar los percentiles correspondientes. D. Teorema 4.

90 0.02 106 0.03 102 0.01 98 0.03 94 0. 8) IF25 (X) . El juzgamiento del ajuste de una variable discreta mediante el .85 0.20 0.20 0.72 0.01 100 0.76 0.01 109 0.60 0.95 0.55 0.01 107 0. Sprent (1993)).01 108 0.05 104 0.36 0.10 0.56 0.60 0.02 109 0.20 0.02 104 0.25 0.28 0.70 0.04 0.02 93 0. 8)1 91 0.01 92 0.270 CAPÍTULO 4.65 0. JUZGAMIENTO DE HIPÓTESIS Valores ordenados F 25 (X) F o (x.00 0.05 0.95 0.01 110 1. del grosor de la baldosa.03 95 0.44 0.12 0.Fo(x.110) para describir las irregularidades.96 0.52 0.70 0.08 0.96 0.02 97 0.238 (valor tomado de la tabla III de Applied Nonparametric Statistical M ethods (P.7: Valores muestrales ordenados del grosor de las baldosas y sus respectivos valores de las funciones de distribución.88 0.15 0.40 0.35 0.48 0.00 1.02 101 0.00 Tabla 4.32 0.45 0.25 0.04 107 0.40 0.00 95 0.85 0.03 96 0.84 0.30 0.84 0.72 0. N ata.28 0. respecto al estándar.00 99 0.20 0.70 0.02 104 0.00 94 0.80 0.50 0. no hay evidencia estadística para desechar el modelo uniforme en el intervalo (90.04 103 0.72 0. de Dn es 0.

en la descripción o explicación de un fenómeno ese proceso modelador debe estar inspirado en un principio de economía que permite simplificar al máximo los conceptos. Sin embargo. que aparece por primera vez en este texto en la página 1 cuando se cita una frase del psicólogo Jerome Seymour Bruner. polémico filósofo del siglo XIV ya lo advertía con su famosa Ley de parsimonia que corrientemente se le conoce como Navaja de Ockham. con la cual se encabeza el capítulo 1. corno los puntos de referencia para tornar la decisión. JUZGAMIENTO DEL AJUSTE 271 método de Pearson no tiene restricción alguna. un sinnúmero de elementos. El método de juzgamiento del ajuste mediante la estadística de K olmogorov-Smirnov se ha establecido sobre la consideración de que Fo(x. agregados a voluntad o en coherencia con otros. a voluntad. elementos y relaciones del modelo. pues cuenta con herramientas que le permiten elaborar ilimitadamente mundos virtuales donde puede incorporar. no hay que multiplicar las cosas sin necesidad. que consiste en la inutilidad de multiplicar los ele- mentos explicativos o descriptivos de algún fenómeno. semánticas. Pero tal vez no sea la mejor ruta el excesivo detalle y meticulosidad en la elaboración del modelo. 4. en fin. algunos autores corno Noether han demostrado que se puede utilizar el procedimiento para ajuste de modelos discretos. Aunque en el modelado de la realidad se incluyen elementos no reales y se excluyen realidades que se suponen o se demuestran que son superfiuas. sólo la que le es común a cualquier tipo de variable: tamaño de una muestra relativamente grande. relaciones. La mente humana puede construir modelos tan artificiosos y comple- jos como quiera. normas. para generar la dinámica propia de ese mundo virtual.9. tratándose de encontrar un paradigma que a manera de una réplica ofrezca alternativas de explicación de la realidad. una precisión acerca del vocablo modelo. O) es continua. de reproducción simplificada de los rasgos y características de ella. para que sea legítimo el uso de los percentiles de una variable aleatoria con distribución Ji-cuadrado. propiedades. y entenderse en este texto como la intención sana de formular modelos y teorías que busquen . Para finalizar este capítulo y por consiguiente al contenido del libro. Y que se menciona con frecuencia de manera explícita o tácita en todos los capítulos y que incluso también en estos últimos párrafos se hace alusión a él. pero que el nivel del test se altera. enunciada como "Entia non sunt multiplicanda sine necessitate" que puede traducirse co- mo. Guillermo de Ockham. o el cálculo de los valores p a través de ella.

los modelos probabilísticos no están exentos de construirse de manera exagerada y compleja complicando posiblemente su manejo. cuando los modelos usuales y tradicionales no colman las expectati- vas de los investigadores y analistas estadísticos en casos específicos. Por ello la propuesta de modelos sencillos para representar una población particu- lar. con parsimonia en sus parámetros. expresiones que de- penden principalmente de parámetros que habilitan la identificación de miembros de una familia particular de modelos. "La mayoría de las ideas fundamentales de la ciencia son esencialmente sencillas y por lo general pueden ser expresadas en un lenguaje comprensible para todos". La sencillez del modelo despojado de lo superfluo. Como modelos que son. Los modelos probabilísticos. es un reto interesante para una mente inquieta que ve en la naturaleza la fuente de inspiración y el motivo de sus reflexiones estadísticas. son modelos especiales que intentan reproducir un comportamien- to exclusivo de variabilidad. JUZGAMIENTO DE HIPÓTESIS explicar los hechos utilizando el mínimo de presupuestos. como se ha afirmado a lo largo de este texto. lo hace útil.272 CAPÍTULO 4. lo enaltece. lo hace atractivo. Albert Einstein . modelos que incorporan expresiones mate- máticas propias que lo identifican y lo caracterizan.

Bo)}. se considera cualquier test T' para el juz- gamiento de la hipótesis nula.10.=1 es un test más potente para H o . e).Xn una muestra aleatoria de una po- blación con función de densidad f X (x. 4.B¡) < gfX(Xi. se tienen los siguientes elementos: l. Demostración.n asociada al test T. Paralelamente al test T. Si el sistema de hipótesis es Ho: e = eo frente a Hl : e = el. k gfX(Xi.. X 2 .. 3. E ~ {x.B¡) ~ gfx(Xi. cuya función crítica es 1{!r (x~). Sea Xl. Además de la región crítica Cr. DEMOSTRACIÓN DE LOS TEOREMAS 273 4.3.=1 . . siendo k una constante positiva y 7r r (e o) = 0:.2.BO)}. se establecen los siguientes conjuntos. con función crítica CPr' (x~) y nivel 0:.=1 . el test T cuya función crítica corresponde a n n 82 . k gfx(Xi. D ~ {x. disyuntos entre sí y disyuntos con Cr. .10 Demostración de los teoremas Teorema 4.. 1{!r(X~) puede considerarse una variable aleatoria con distribución de Bernoulli cuya probabilidad de éxito bajo o es e .. Como preparación para la demostración.n.=1 n n . 2. .

. El símbolo J corresponde a la integral múltiple sobre el conjunto A A y dx~ representa a dX1 dX2 .n ... 2=1 Como X =G T . ~= J ['Ij!T(X~) <PT/(X~)J fr e T...1 o en otros términos concluir que Eel ['Ij!T(X~)J 2" Ee1 [<PT/(X~)J ... JUZGAMIENTO DE HIPÓTESIS 4.274 CAPÍTULO 4. 'lj!T(X~) = O. Para ello. CPT'(X~)l frfX(Xi.. 'lj!T(X~) = 1 Y cuando x~ E D. e1)dx~. entonces.e o ).. CPT./ [1./ [-CPT.n - 2=1 fx(xi. <PT/(X~)] fr fx(xi.(x~)l frr'«(xi. 11 Adicionalmente. e1)dx~1 E 2=1 cuando x~ E GT.Ee 1 [<PT/(X~)] = Ee ['Ij!T(X~) . 6.eddx~ > .n Cr. el)dx~ D 2=1 + J['Ij!T(X~) <PT/(X~)J fr . eddx~l + J['Ij!T(X~) <PT/(X~)] fr .eddx~ .=1 D 7=1 + .CPT'(X~)J frfX(Xi.(x~)l llfx(:1./ [~T(X~) . y i=l i=l con ello k . fx(xi.CPT'(X~)J frfX(Xi.=1 .¡... E .eu)dx../ [1. k TI fx(xi..i. U D U E. i=l i=1 cr. dx.2.ed > TI fx(xi.n. la demostración gira alrededor de la diferencia: ~ = Ee 1 ['Ij!T(X~)] . fx(xi.n J [1..<PT/(X~)] = J['Ij!T(X~) X .eddx~ +. El objeto de la demostración es simple: concluir que 7r T (e 1 ) 2" 7r T /(e 1 ) tal como lo estipula la definición 4. 1 = CT.eddx~. cuando x~ E GT .

n es un .eo)dx~. <PTI(X~)J TI: fx(xi.<PTI(X~)l gfX(Xi.<PTI(X~)l frfX(Xi. se puede afirmar que ~1 2: O.=1 D 1.<PTI(X~)l frfX(Xi.n +/ [l/)T(X~) .eo)dX~ CT. 4. DEMOSTRACIÓN DE LOS TEOREMAS 275 n n Igualmente.=1 D.<PTI(X~)l frfX(Xi. el) = TI fx(xi. k J[-<PTI(X~)J TI:fx(xi. TI fx(xi. ~2 = a-a = O Y como k~l > ~2. cuando x~ E E. el) > .<PTI(x~)l frfX(Xi.10.eo)dx~ E 1=1 = EOo ['l/)T(X~) . D 2=! > D 2=1 n n Finalmente.2 = / [l/)T(X~) .eo)dx~ + / [-<PTI(x~)l frfX(Xi.n 1. <PTI(X~)J TI: fx(xi. eo)dx~. k TI fX(Xi.eo)dx~ = D.<PTI(X~)l· Como los tests tienen el mismo nivel.1> / [1. eddx~ 2=1 = J[1/JT(X~) E . con lo cual i=l i=l k J[1j)T(X~) E .=1 +/ [l/)T(X~) . i=l i=l por tanto.eo)dx~ CT. ea).eddx~ J[-<PTI(X~)J TI:fx(xi. ea). luego conclusión que garantiza que el test T cuya región crítica es CT. 2 ~' 1. 2=1 Teniendo en cuenta las desigualdades descritas.eO)dx~ D 1=1 +/ [l/)T(X~) . cuando x~ E D entonces -k TI fx(xi. kD.

en el sistema Ho : (J :S. 419 Y 420). . X 2 . (J E e <:. IR Y la familia {Jx(x. X 2 .' . o Teorema 4. 1.14. X n una muestra aleatoria de una población con función de densidad fx(x. . . en el sistema Ho : (J :S. Si la razón monótona de verosimilitudes es no decreciente y si ta es tal que POo[t(X I . X2. .. .··· .. . pp. JUZGAMIENTO DE HIPÓTESIS test más potente para Ho : (J = (Jo frente a HI : (J = (JI..2. (J)} tiene MLR en la estadística T = t(X I . Si la razón monótona de verosimilitudes es no creciente y si tI-a es tal que P OO [t(X I .Xn ). .2. x n ) < ta" es UMP para Ho.···. Teorema 4.. x n ) > tI-a" es UMP para Ho.X2.·· ..276 CAPÍTULO 4.6 Su demostración puede consultarse en Mathematical Statistics (Wilks (1962). (Jo frente a HI : (J > (Jo· .Xn ) > tI-al = a. (Jo frente a HI : (J > (Jo. entonces el test T: "Rechazar Ho si t(XI. X2. X2. (J).. 2. Sea Xl. X n ) < tal = a entonces el test T: "Rechazar Ho si t(XI.

equivale a afirmar que t(Xl. x n ) > tI-e". entiene MLR en la estadística T = t(X l . Asumiendo que la hipótesis nula es cierta. Dado que la fa- milia {Jx(x. con ellos se formula un nuevo sistema de hipótesis simples como: Hó : e = el frente a H. porque el test es más potente para cualquier elección de el.Xn ) < K. Este test es UMP para Ho en el sistema Ho : e ~ eo frente a Hl : e > eo.. el test se puede formular de manera equivalente como T : "Rechazar Hó si t(Xl. . entonces . Definidos los tamaños de los errores a y {3. " L(e2 . X2. Por tanto.8. . . X n )..X n ) es un test más potente para Hó en el nuevo sistema.Xl. .10.17. X 2 . DEMOSTRACIÓN DE LOS TEOREMAS 277 Demostración. .X2. 4. sujetos a que el ~ eo < e2. Sean fh y e2 dos valores de e de manera que el ~ eo e e y 2 > o... que definen un test secuencial T. . X2. los valores K. 1-{3 Demostración. como lo indica la figura 4. . O Teorema 4. .o Y K.2. . y suponiendo que el cociente de verosimilitudes es una función no cre- ciente de t(Xl..l ~-- {3 . El lema de Neyman-Pearson garantiza que el test T : "R h H*· \ ec azar o SI An = L(e l .. pueden aproximarse mediante a 1-a K.·· . x n ).. x n ) > h-a". : e = e2 . . e debido a que el test no depende de el ni de 2 . .Xl. El otro numeral del enunciado del teorema se demuestra de igual manera.l. e2 E e. y K.X2.o ~-. afirmar que la razón de verosimilitudes An < K. X2....

8 CT. ~o f¡ n=1 TI: fx(xi. ~o· Por otra parte. es decir 1 .278 CAPÍTULO 4. Luego o: o: :s. ~o rr n i=1 fx(xi.n i=1 1 ) dx I dX2' . 8d· Por tanto.(3).(3 :s. 80 ) :s. o: :s.17: Esquema de un cociente no creciente de verosimilitudes como función de los valores de la estadística T n . dX n = (1 . la probabilidad de no rechazar Ho siendo ella verdadera . (3). ~0(1. Además rr i=1 n fx(xi.n i=1 1 ) dx l dX2'" dX n corresponde a la probabilidad de rechazar Ho cuando Hl se considera cierta. 8 CT. porque f¡ n=1 TI: fx(xi.. JUZGAMIENTO DE HIPÓTESIS An k tI-a t Figura 4.

los tamaños 0* y (3* correspondientes a los valores por i'í:o y i'í:Í son tales que 0* + (3* < o + (3.. Bo)dx l dX2'" dX n :s: ~ f fe. _0_ 1 . C. 1 (3 n=1 T. respectiva- men~..8.n' A.. i'í:o cotas que se pueden asumir como aproximaciones a i'í:o Y i'í:1. 1 . Y i'í:1* = T 1-0. BI) dx 1 dX2 . A. rr n-1 Gr. Sean e. Dtfinidos los tamaños de los errores o y (3.n rr z=1 !X(Xi.10.(3*).8.. DEMOSTRACIÓN DE LOS TEOREMAS 279 corresponde a y como en los casos de no rechazo de la hipótesis nula. dx n .. 4.2.' respec t'zvamen t e. y aproxi- ma d os los va lores i'í:o Y i'í:1. B1)dx1 dX2'" dX n = _0_(1 .3.n i~1 !X(Xi. O Teorema 4.(3 . n n i=1 i=1 entonces Luego 1-0 es decir.n rr . De acuerdo con uno de los pasos de la demostración del teorema 4. i'í:1 :s: -(3-' tiene entonces una cota inferior 1~¡3 y i'í:1 tiene una cota superior 1~Q.n las regiones críticas y de acep- tación correspondientes a los niveles 0* y (3* derivados de los valores i'í:o y i'í:i· 0* = f Ir. por i'í:o* = 1-13 o..(3 f r n=1 ) G' T. Demostración. z=1 !X(Xi.

OO)dXl dX2·· .n i=l {3 Concretamente de lo anterior. se determina el siguiente sistema de hipótesis Ha : O ::. O) para represen- tar el comportamiento de una población. 1-a~ -(3. Od dx dX2··· dX n l n = 1-a * --{3 n=l A.n t=l A su vez.(3*) y (1 _ a*) ~ 1 -{3 a .. n=l "'.280 CAPÍTULO 4. 1 ~ {3(1 . 00 frente a Hl : O > Oo.a* = f 1 fr n=l * A. dX n lOOr n ~ ~aLJA* rrfX(Xi.. Formalice un test con nivel a para el juzgamiento de Ha dentro de este sistema de hipótesis.. JUZGAMIENTO DE HIPÓTESIS De modo similar. 2. basado en una muestra aleatoria de tamaño n de esta población.11 Ejercicios 1... Con base en estas desigualdades es fácil comprobar que a* + {3* ::.n i=l fX(Xi.01)dxldx2···dxn. Con base en las consideraciones del ejercicio 1. Adoptando el modelo Uniforme en el intervalo (O.~ J) * r rr fX(Xi. para la cual se conjetura además que el valor del parámetro no excede 00 . D 4. 1 .. formalice un test con nivel a para el juzgamiento de Ha dentro del sistema de hipó- tesis Ha: 0=00 frente a Hl : O -# Oo· . a* ::. a + {3.

Al adoptar la distribución de Poisson con parámetro O para mode- lar una población particular. ¿La familia de densidades de Cauchy es una familia que tiene MLR en alguna estadística 7 6. si es preciso introducir un componente del parámetro para indicar el desplazamiento. o por el contrario es inocuo hacerlo y . En particular. 4. 5. regido por este modelo resulta algunas veces interesante evaluar el hecho de si para un caso individual el desplazamiento es un elemento significativo dentro del modelado. Establezca una expresión algebraica para la función de potencia del test determinado en el ejercicio 1.XER ¿Bajo el siguiente sistema de hipótesis es posible determinar un UMP de nivel a para el juzgamiento de Ho basado en una muestra aleatoria de tamaño n Ho: O = O jrentea Hl : O > 07 7. mencionado en los ejercicios del primer capítulo y en un ejemplo de este capítulo tiene diversas aplicaciones. 4. es decir. determine un test con nivel a basado en una mues- tra aleatoria de tamaño n de la citada población.11. La distribución de Cauchy es un modelo muy singular debido a sus particularidades de no existencia de sus momentos. El modelo Exponencial desplazado.Oo· Para tal efecto. conviene proveer un test que permita decidir sobre la hipótesis nula Ho dentro del sistema Ho: O = 00 jrentea Hl : O =1. Considere la distribución particular de Cauchy 1 jx(x) = 7f[l+(x_O)2]. EJERCICIOS 281 3.

Determine un test de ni- vel cercano a a y su función de potencia. Bosqueje la curva de operación OC. si se asume que J-l1 y J-l2 son desconocidos pero iguales? 11.1) y que repre- senta la denominada fracción no conforme de materia prima. JUZGAMIENTO DE HIPÓTESIS de esta manera simplificar el modelo elegido. de productos en proceso o de productos terminados. 9. e2) reserva el primer componente para referirse precisamente al desplazamiento. según el objetivo y momento de su aplicación. ¿Cambiará radicalmente el test para homoscedasticidad en dos poblaciones Normales. En el lenguaje del juzgamiento de hipótesis corresponde al sistema Ho : el = o jrentea H1 : el > o. Determine una expresión para el cálculo del tamaño de muestra apropiado para el juzgamiento de la hipótesis nula Ho : 1f = 1fo en . página 240. Una modalidad característica de procedimientos en el control es- tadístico de la calidad se ha denominado muestreo para la acep- tación de lotes. parámetro cuyo espacio corresponde al intervalo (0. Teniendo presente que el parámetro e = (el. 8. 10.2. cons- truya un test de nivel a para este propósito.282 CAPÍTULO 4.4. Desarrolle un test para el juzgamiento de la homoscedasticidad como el presentado en el numeral 4. dentro de la cual se menciona un procedimiento particular correspondiente al juzgamiento de la hipótesis Ho dentro del sistema Ho: e < eo jrentea H1 : e 2 eo. asumiendo que J-l1 y J-l2 son valores conocidos. que dentro del modelo de Bernoulli corresponde a la probabilidad de éxito.

. 12. desarrolle un test utilizando otros medios para el juzgamiento de la hipótesis nula en el citado sistema.. 13. Determine un test para tal fin. X2.Xn. .. . e + 1). e) = e(l . e). por medio de un test construido considerando un tamaño de mues- tra grande.x)e-II(o. .11. Si no es así. k~. ea... X 2 . Si Xl. Fijando el valor k. rámetro entonces use este hecho para derivar de allí un test para juzgar la hipótesis nula Ha : e = ea dentro del sistema de hipótesis Ha : e = ea frente a HI : e -¡. . 4.I)(X). con e > O.n) es un intervalo confidencial para el pa- e. .. 14. Sea Xl. ea dentro del sistema de hipótesis Ha : e ::. X 2 .n. con . Sea Xl. ea frente a HI : e > ea. Pero previo a ello y dentro del análisis de su ajuste se desea contar con un test que juzgue la hipótesis nula Ha : e ::. X n es una muestra aleatoria de una población con función de densidad Uniforme en el intervalo (e. X n una muestra aleatoria de una población con función de densidad Uniforme en el intervalo (O. Este modelo se propone como emulador del comportamiento de la fracción no conforme de la materia prima que recibe cierta com- pañía para utilizarlo como la distribución a priori de 8. X n una muestra aleatoria de una población con función de densidad fx(x. EJERCICIOS 283 el sistema Ha : 7r = 7ro frente a HI : 7r > 7ro. . siendo 7r la probabilidad de éxito o proporción pobla- cional. si (Xn.

284 CAPÍTULO 4.. 60 frente a HI : J. La contaminación de los ríos es un desastre para la humanidad. determine un test para el juzgamiento de la hipótesis nula Ho : p = O dentro del sistema de hipótesis Ho: p = O frente a HI : P -=1. . El río Bogotá recibe en casi todo su recorrido desechos que trastornan .. Determine la función de potencia del test correspondiente al juz- gamiento de la hipótesis nula Ho : J. .lI .lI . Yn ) es una muestra aleatoria de una población Normal bivariada.. (Xn .l2 ::. bajo Normalidad. YI ). Si (Xl.Xn es una muestra aleatoria de una población con función de densidad fx(x.. . . 15. . o. JUZGAMIENTO DE HIPÓTESIS () E lR.l2 > 60.. 16. determine un test para el juzgamiento de la hipótesis nula Ho : () = O dentro del sistema de hipótesis Ho : () = O frente a HI : () > O.J.l2 ::.J.J.lI . (X 2 . X 2 . Si Xl. y con base en dos muestras seleccionadas de dos poblaciones independientes y homoscedásticas... .()) = ()exp(-()x)I(o.oo)(x). 1. 60 dentro del sistema de hipótesis Ho : J. Exprese esa función de potencia en términos de 60. determine la función de potencia de un test para el juzgamiento de la hipótesis nula Ho : () = 1 dentro del sistema de hipótesis Ho : () = 1 frente a HI : () -=1. 17. Y2 ). 18..

19.Lo.L i. decisión que debe tomarse a través de un test estadístico basado en una muestra de tamaño n. que no debe exceder J..3.Lo bajo Normalidad y conocido el valor de (J. 1fTJ()) es decreciente en el intervalo (-00. es . Si una autoridad de salud pública tiene que evaluar el nivel de contaminación del río en un punto especial y tomar decisiones al respecto.L = J.L. correspondiente al sistema e para el juzgamiento de la hipótesis nula Ho : () = J. 1fTe (()) es simétrica respecto a J. Muestre que la función de potencia del test Te... página 218. J...J. cumple las siguientes propiedades: a..Lo frente a la hipótesis alterna Hl : J. 4. 20. Muestre que la expresión algebraica que permite el cálculo del valor p al utilizar el test Te en el juzgamiento de la hipótesis nula Ho : J.Lo) = a.. presentada en la sección 4. Desarrolle un test de nivel a para el juzgamiento de la hipótesis nula Ho : () <:::: J. 1fTe (J. (}->-oo (}->oo C.LO. 00 ). bajo N ormalidad asumiendo el segundo supuesto. 1fT (J.Lo partes por millón por litro de agua.Lo bajo Normalidad y adoptando el primer supuesto.Lo frente a la hipótesis alterna H 1 : () > J.. lim 1fTc (()) = 1 Y lim 1fTJ()) = 1. y particularmente sobre el contenido promedio de plomo J. 1f T (()) es creciente.11.Lo) Y creciente en el intervalo (J. Muestre que la función de potencia del test es función que cumple las siguientes propiedades: a. b.Lo) = a. c. lleve a cabo una reflexión sobre los valores del error del tipo 1 que deben adoptarse..Lo.. b.. 21. lim 1fT (()) = O Y lim 1fT (()) = 1. EJERCICIOS 285 extraordinariamente la vida del río.. (}->-oo (}->oo d..1..

1) grados de libertad. con distribución Ji-cuadrado con (n -1) grados de libertad. Muestre que la expresión algebraica de la función de potencia al utilizar el test Te para juzgar la hipótesis nula Ho : a 2 = a5 frente a la hipótesis alterna H 1 : (]"2 i= (]"5. 24. 22. Se cuenta con recursos económicos únicamente para seleccionar N = n + m unidades estadísticas para el juzgamiento de la hi- pótesis nula Ho : J-LI = J-L2 concerniente a la "comparación de los promedios poblacionales" de dos poblaciones independientes regi- das por el modelo gaussiano y conocidos los valores de ar y a~.O. JUZGAMIENTO DE HIPÓTESIS siendo F(n-I)(X) la función de distribución de una variable aleato- ria X.1) grados de libertad. al utilizar el test T para juzgar la hipótesis nula Ho : a 2 'S a5 frente a la hipótesis alterna Ho : a 2 > a5. bajo Normalidad asumiendo desconocido el valor promedio poblacional es a 2 ao22X1 . Deduzca las propiedades de esta función de potencia.(n . determine la expresión para el cálculo del correspondiente valor p. determine la expresión para el cálculo del correspondiente valor p. con distribución Ji-cuadrado con (n . 23. Respecto al ejercicio 24. 26. Respecto al ejercicio 22. 25. bajo Normalidad asumien- do desconocido el valor del promedio poblacional y eligiendo los valores E = Ó = ~ es 2 'lfTC(a) = 1-F(n-I) (a5xL9.I) ( siendo F(n-I) (x) la función de distribución de una variable aleato- ria X. Muestre que la expresión algebraica de la función de potencia. con distribución t con (n .1) ) 2 'lfT(a ) = 1 . frente a la hipótesis alterna HI : J-LI i= J-L2.286 CAPÍTULO 4. F(n-.(n ~2 -1)) +F(n-I) (a5X~(n 2a 2 -1)) siendo F(n-I) (x) la función de distribución de una variable aleato- ria X. Deduzca las propiedades de esta función de potencia. ¿Cómo deben elegirse los tamaños de las muestras n y m para mantener las características del test desarrollado para el mencionado juzgamiento? .

11. Determine un test secuencial para el juzgamiento de la hipótesis nula Ho : e = eo. 28. 4. determine un test e más potente para juzgar la hipótesis nula Ho : = 1 si el modelo asumido es un modelo cuya función de densidad es fx(x. determine un test más potente e para el juzgamiento de la hipótesis nula Ho : = 1. . siendo C > O una constante conocida? 29. basado en una muestra aleatoria de una población con distribución de Poisson de parámetro e. dentro del sistema de hipótesis Ho: e = 1 frente a Hl : e = 2. Ho : f1l = Cf12. 30.. 32. X n es una muestra aleatoria de una población con distribución Beta con el = 2 = e e. muestre que el test uniforme más potente para juzgar la hipótesis nula dentro del sistema Ho: e = 1 frente a Hl : e < 1 está basado en una estadística suficiente para e. e> O. X2. Dentro del sistema de hipótesis del ejercicio 30. ¿Existe algún impedimento en el desarrollo de un test para el juz- gamiento de una hipótesis nula más general. Si Xl. EJERCICIOS 287 27. que la del ejercicio 27. . Teniendo en cuenta el ejercicio 31.e) = eXB-lI(o. frente a la hipótesis alterna Hl : f1l i= 2f12. . Desarrolle un test para el juzgamiento de la hipótesis nula Ho : til = 2ti2 bajo la regencia del modelo gaussiano correspon- diente a dos poblaciones independientes de las cuales se conocen los valores de (TI y (T§. 31. . en el sistema de hipótesis simples Ho: e = eo frente a Hl : e = el.l)(X).

En un estudio de opinión se realizaron 6.. Puede entonces asumirse el modelo Bernoulli con parámetro (). ¿exis- te un test uniforme más potente para juzgar la hipótesis nula Ho : () = ()o. Si Xl. . . y juzgar la hipótesis nula Ho : () = ~. El auditor estadístico considera que el porcentaje de no respuesta está muy elevado.288 CAPÍTULO 4. por tanto.¡-. y propone juzgar la afirmación de la compañía por medio de una muestra seleccionada de los registros de las llamadas realizadas por los entrevistadores para comprobar la no respuesta. los resultados se refieren a las entrevistas rea- lizadas a personas mayores de 18 años correspondiente al restante porcentaje.348 llamadas telefónicas y la firma encuestadora informa que el 25% de las llamadas fueron fallidas y. Determine un test que permita el juzgamiento de esta hipótesis. . X 2 . 34. frente a la hipótesis alterna HI : () "1= ()o? .Xn es una muestra aleatoria de una población con distribución gaussiana de valor esperado cero y varianza (). JUZGA MIENTO DE HIPÓTESIS 33. dentro del sistema de hipótesis 1 Ho : () = - 4 frente a 1 HI : () < :.

An Introduction to Mathematical Statistics. Madrid: Aguilar. [3] Barndorff-Nielsen (1978). M. New York: John Wiley. Statistical Decision Theory and Bayesian Analysis. Robert Eric. [6] Beard. Probability and Statistical Inference.Bibliografía [1] Arthanari. Métodos matemáticos de estadística. D. (1965). New York: John Wiley. and Yadolah Dodge (1981). [4] Barnett. 3rd ed. New York: John Wiley. 2nd ed. New York: John Wiley. [2] Ash B. London : Jo1m Wiley. second ed. (1985). [8] Bernardo. Mass: Blaisdell. Andrain F. James O. Inc. [10] Cramer. [5] Bartoszynski. Waltham. Bayesian Theory. H. Pentikainen. Robert (1970). and Pesonen E. New York: Springer-Verlag. T. (1984) Risk Theory: the Stochastics Basis of Insurance. Harald (1960). Magdalena (1996). Victor David (1975) Comparative Statistical Inference. Ole Information and Exponential Fami- lies: in Statistical Theory. London: Chap- man and Hall. New York: John Wiley & Sons. José Miguel and Smith. S. [9] Brunk. Basic Probability Theory. 289 . (1994). [7] Berger. Mathematical Pro- gramming in statistics. Robert and Niewiadomska-Bugaj. T.

[24] Gmurman. 3rd ed. Mass. New York: John Wiley. [14] Dorea.: Addison-Wesley. [23] Guenther. En- glewood Cliffs: Prentice-Hall. New York: John Wiley. [18] EIlis. [16] Edwards. (1962). Concepts of Statistical Inference. and Pesonen M. [19] Feller. Cambridge: Cambridge University Press. Probabilidad y estadística. (1965). Statisticallnference: Basic Concepts. Anthony William Fairbank (1972). Introduction to Statistical Inference. Harold (1963). Chris D. [22] Freeman. Rio de Janeiro: Instituto de Matematica Pura e Aplicada. 3a ed. and Mishra Satya N. New York: Chapman and Hall. The Statistical Method in Business. William (1968). [21] Freund. An Introduction to Probability Theory and its Applications. [20] Fisz.290 BIBLIOGRAFÍA [11] Cramer. [17] Ekeblad. Richard B. Likelihood: an Ac- count of the Statistical Concept of Likelihood and its Application to Scientific Inference. Chang Chung Yu (1995). Harald (1972). New York: John Willey. Morris (1988). Pmctical Risk Theory for Actuaries. Traducción de Anselmo Calleja. William C. 6a ed. [12] Daykin. Moscú: Mir. (1962). John E. Rea- ding. Frederick A. Madrid: Aguilar.. Probability Theory and Mathematical Statistics. Mathematical Statistics. New York: McGraw-Hill. T. Marek (1967). Modem Mathe- matical Statistics. (1944). Elementos de la teoría de probabilidades y algunas de sus aplicaciones. Teoría de las probabilidades y estadística matemática. [13] De Groot. Traducción de Akp Grdian. Applications of Probability and Inference of Business and Other Problems. Wilmington: Addison-Wesley Iberoamericana. Englewood Cliffs: Prentice-Hall. [15] Dudewics Edward J. Pentikainen. (1998). Vladimir Efimovich (1974). New York: John Wiley. (1975). . Teoria assintotica das estatisticas.

Introduction to Probability Theory and Statistical Inference. and Craig. Erich Leo (1983). Sigapore: McGraw-Hill. Statistical Inference. Vladimir Efimovich (1975). (1974). and Wolfe. (1984). [35] Parzen. Franklin A. The Emergence of Probability: a Philosophical Study of Early Ideas about Probability. (1954). . S. Traducción de Akp Grdian. [31] Larson. 3rd eel. Ronald H. Modern Probability Theory and its Appli- cations. anel Boes. [33] Mood. Robb John (1982). 2nd ed. [27] Hettmansperger. Introduction to Statistical Inference. New York: John Wiley. New York: John Wiley. Vijak K. Inter- national eel. (1995). New York: John Wiley. Introd7Lction to the Theory of Statistics. Graybill. [26] Hacking. Thomas P. New York: John Wiley. Theory of Point Estimation. BIBLIOGRAFÍA 291 [25] Gmurman. Statistical Inference Based on Ranks. [36] Randles. Problemas de la teoría de las probabilidades y de estadística matemática. Robert J. [32] Lehmann. [38] SerfEng. [30] Keeping E. New York: John Wilcy. [34] Muirhead. Introduction to the Theory of Nonpammetric Statistics. Allen T. Introduction to Ma- thematical Statistics. Harold J. (1984). New York: D. Douglas A. Alexaneler McFarlane. [29] Hogg. Cambridge: Cambridge University Press. Prentice Hall. Introduction to Mathematical Statistics. (1962). 5a ed. Aspects of M7Lltivariate Statistical Theory. [37] Rohatgi. New York: John Wiley. Moscú: Mir. Ian (1987). Robert V. (1979). Induction and Statistical Infercncc. New York: John Wiley. Emanucl (1971). (1980). Approximation Theorems of Mathemati- cal Statistic8. [28] Hoel Paul G. (1974). Dua- ne C. Van Nostrand. New York: John Wiley. New York: John Wiley.

(1967). [45] Zacks. Martin Abba (1993). Cambridge: Cambridge University Press. (1950). . Aram J. E. New York: Springer-Verlag. C. Howard G. An lntroduction to Probability and Ma- thematical Statistics. S. (1986). [44] Wilks. Traducción de Manuel Urrutia Avisrror. New York: Academic Press. Madrid: Anaya Multimedia. Princeton: Princeton U niversity Press. 2nd ed. S. 2nd ed. [41] Thomasian. Mathematical Statistics. [43] Weatherburn. New York: McGraw-Hill. New York: Wiley. (1969). A First Course in Mathematical Statis- tics. The Structure of Probability Theory with Applications. J. Shelemyahu (1971). Tools for Statistical lnference: Me- thods for the Exploration of Posterior Distributions and Likelihood Functions. [40] Tennant-Smith. Estadística: teoría. problemas y aplica- ciones en BASle.292 BIBLIOGRAFÍA [39] Tanner. (1962). [42] Tucker. The Theory of Statistical lnference.

15 27 en media cuadrática. completez. 281 consistencia. 155 de localización. 155 desigualdad concentración. 136 en probabilidad. 136. 6 caso curva regular de estimación. 112 característica de operación. 148 de Cauchy. 14 de las estadísticas de orden. 112 Beta. 113 problema de. 6 de inclusión. 138 contorno. Indice de Materias análisis en valor esperado. 135 confianza.. 13 de la mediana muestral. 13 del rango. 184 en medida. 262 de exclusión. 138 débil. 59. 233 estocástica. 14 de Poisson. 14 de varianza a una vía. 14 de Zipf. en distribución. 13 de Laplace. 232 desigualdad de. 107 Cramer-Rao Behrens-Fisher cota de. 90 de Cramer-Rao. 112 condiciones de regularidad distribución cumplimiento de. 29 con probabilidad uno. 96 de la función de distribución convergenCIa empírica. 14 cota Basu de Cramer-Rao. 30 casi segura. 29 293 . 14 de Pareto. 112 bondad criterios del ajuste. 198 de escala. 116 198 componente CO del test. 113 teorema de. 137 en momento de orden r. 94 de Gumbel.

12 161 reducida.95 del tipo 11.95 asintótica. 91 de Pearson. 138 equivalentes. 11 eficiencia asin tóticamen te asintótica. 141 error cuadrático medio. 12 por intervalo. 176 consistente espacio débil. 29 estadísticas exponencial desplazada. 11 gaussiana. 102 máximo-verosímil. 107 de mínimos cuadrados.125 suficiente. 106 L. 114 BAN. 97. 264. 109 k-dimensional. 177 normal bivariada. 25. 96 en error cuadrático medio. 59 conjuntamente suficientes. 148 estimador. 266 insesgado de varianza uniforme- natural. 115 asintóticamente insesgado. 116 más concentrado. 95 de un estimador. 115 bayesiano. 10. 12 en muestras censuradas. 193 CANE. 69 Zeta. 106 M. 98 más concentrado. 100 exponencial doble. 77 U niforme discreta. 107 eficiencia de un. 107 Gama. 90 minimal. 26 insesgado. 91 BRUE. del parámetro. 11 7 eficiente. 106 mente mínima. 86 equivalencia. 67 94 estadística. 137 estimación.95 máximo admisible. 136 por intervalo. 96 el más concentrado. 9 simple. 115 completa. 115 contorno de la. 137 bayesiana. 146 máximo-verosímil. 107 BLUE.125 suficiente. 90 de orden. 92 relativa. 162 cuasi máximo-verosímil. 69 .294 ÍNDICE DE MATERIAS del semirrango. 94 auxiliar. 126 de primer orden. 94 de las observaciones. 193 CAN. 84 muestral. de las observaciones. 79 original de la proporción poblacional. 115 del tipo 1.

69 empírica. 189 103 homoscedasticidad. 189 conjugada. 189 de densidades pearsoniana. 68 QMLE. 261 98. 262 del test aleatorizado. 149 información de. 252 del test no aleatorizado. 229. 84 de. 123 UMVUE. 148 unidimensional de densidades. del ajuste. 268 de distribución Koopman-Darmois . 109 hipótesis estimar. 116 nula. 86 simple. 111 p-dimensional de densidades. 91 de potencia. 148 Fisher unilateral. 240 de densidades k-paramétrica. 189 completa.79 de la muestra. método a priori. teorema de. 191 secuencial. 231 exponencial juzgamiento de la. 198 más concentrado. 90 de verosimilitud. 30 mejor. 26 el más concentrado. ÍNDICE DE MATERIAS 295 MLE. intervalo 104 aleatorio. 79 Khintchine. bayesiano. 68 robusto. 189 cerrada bajo muestreo. 111 Fisher-N eyman juzgamiento criterio de factorización de. 86 juzgamiento de una. 26 Pitman muestral. 177 104 confidencial. información 104 de Fisher. 194 de cuasi verosimilitud. sistema de. 189 de densidades estadística. 19 de densidad Kolmogorov-Smirnov a posteriori. 10 alterna.109 G livenko-Cantelli uniformemente teorema de. 85 juzgamiento del ajuste. 189 familia compuesta. 100 método de Kolmogorov-Smirno1 función 268 crítica método de Pearson.

12 teorema de. 135 parámetro. 59. 155 de Poisson. 194 mínimo Normal de la muestra. teorema aleatoria. 149 estimación en. 137 gaussiano. 148 por analogía. 22 máximo simple de la muestra. 176 proporción en la. 83 del test. teorema del. 149 piloto. 9 de Pareto. 15 reducido. 19 de estadísticas de orden. 162 superior unilateral. 104 Gama. 148 pareada. teorema de. 26 21 censurada. 7. 175 mediana tamaño. 8 muestral. ordenada. 12 Ley Zeta. 12 central muestra. 26 tamaño de la. 162 Lindeberg-Lévy. 31 fuerte muestrales de los grandes números. 20 centrales. 77 superior. 68 confidencial. 26 bivariada. 162 modelo. 26 tamaño de la. 12 límite ordinarios.296 ÍNDICE DE MATERIAS familia o clase exponencial desplazado. 77 confidencial del tipo 1. 77 inferior. 149 lema de. 7 del. 155 . 77 inferior unilateral.21 bivariada. 119 probabilístico. 59 p-dimensional. 65 Lévy. 79 nivel de máxima verosimilitud. 148 del tipo II. 6 Lindeberg-Feller. 249 poblacional. 65. 136 de localización. 136 débil momentos de los grandes números. 271 Beta. 202 de los momentos. 34 método N eyman Pearson de la variable pivote. 137 Lehmann-Scheffé original. 135 de escala.

215 de aceptación. 194 MLR. 22. método sesgo del estimador. 202 muestral. 194 valor p. 160 LRT. 194 muestral. 210 monótona rk verosimilitudes 212 ' uniformemente más potente. 18. 194 de error del tipo 1. 150 . 194 probabilidad del test. teorema de. 6 tamaüo principio de la muestra. 8. 194 Rao. 26 juzgamiento del ajuste. 191 tamaüo de la. 22.Blackwell. 207 estimación de la. 191 promedio función crítica del. 175 76 de la región crítica. 106 robustez. 73 insesgado. 204 tamaño del. 149 unidades estadísticas. 207 windsordizado. 191 rango muestral. 161 más potente. 262 nivel del. 266 semirrango muestral. 37 de razón generalizada de ve- recortado. 125 rosimilitudes. 191 de la muestra. 191 robusto. de la muestra simple. 96 población. 8 procedimiento test. 12 curva CO del. 191 pivote. 262 suficiencia. 125 de razón simple de verosimi- proporción litudes. 123 aleatorizado. 91 de. 191 variable de rechazo. 6 crítica. 26 función crítica del. 200 poblacional. 194 no aleatorizado. 109 secuencial razón de razón de verosimilitu- generalizada de verosimilitu- des. 201 pruebas de Normalidad. 264. 201 muestral. 253 des. 212 UMP. 210 región confidencial. 12 consistente. ÍNDICE DE MATERIAS 297 natural. 198 poblacional. 249 de invarianza de un MLE. 123 Pearson estadística de.

37 Wald. 108 muestral. ecuación de. 232 . 150 varianza mínima. 149 variable aleatoria contaminada.298 ÍNDICE DE MATERIAS general. 124 pivote. solución de. 258 Welch. 18. 153 método de la. 12 poblacional.

Inferencia estadística SE TERMINÓ DE IMPRIMIR EN BOGOTÁ EL MES DE JULIO DE 2004 EN LAS PRENSAS EDITORIALES DE UNIBIBLOS. UNIVERSIDAD NACIONAL DE COLOMBIA .