Académique Documents
Professionnel Documents
Culture Documents
p
c
c
Asignatura: Estadística
Temario
Grupo:
Grupo: LI-131
³Es mejor morir de pie, que vivir siempre de rodillas´ ±Emiliano Zapata
c
p
c
p
c
c
ÍNDICE:
I.c Información general de la asignatura.
a)Ficha de identificación
b)Descripción
c)Propósito
II.c Competencias a desarrollar
III.c Temario
IV.c Metodología de trabajo
V.c Evaluación
VI.c Material de apoyo
VII.c Desarrollo de contenidos por unidad
a) Unidad 1: Estadística descriptiva
b) Unidad 2: Distribuciones Muestrales Introducción
c) Unidad 3: Teoría de la Estimación Introducción
d) Unidad 4:Pruebas de hipótesis
Ônexo: Formularios (archivos PDF y Tablas Z y gl.)
c
p
c
p
c
c
Presentación:
I. Información general de la asignatura.
a)c Ficha de identificación:
b)c Descripción:
Dentro de una sociedad que está en constante cambio y reestructuración existen variables
que permiten un cambio, sea mínimo o grande, dentro de la misma.Estos cambios, así como
la constante forma en que cambia el entorno en todo sentido y estratos (cultural, social,
tecnológico, político, educativo) hacen que los elementos cuantitativos cambien de la
misma manera, es por eso que se debe tener en cuenta la precisión con que éstos datos
actuaran sobre las decisiones que se tomen a futuro.
La estadística, como un elemento de utilería básico para poder llevar a cabo la tarea de
recopilar, analizar, sistematizar, sintetizar e interpretar los datos o elementos que son
cuantificables para poder interpretarlos de forma sencilla, clara y tangible para poder
sustentar una decisión a posteriori y saber desde donde podemos tomar medidas
estratégicas para la solución óptima de un problema.
c
p
c
p
c
c
c)c Propósito:
Los propósitos de la asignatura en relación al tronco básico son que los estudiantes:
II. Competencia.
Competencia general:
-Ejecutar los métodos y procesos de análisis estadístico para verificar los eventos dentro de
un contexto.
Competencias específicas:
-Hacer uso de las herramientas y conceptos indispensables para la representación numérica
y gráfica de los datos recopilados y analizados dentro de un entorno.
c
p
c
p
c
c
III. Temario.
Unidad 1 Estadística descriptiva
c
p
c
p
c
c
c
p
!
c
p
c
c
Los procesos a modelar con técnicas estadísticas suelen ser altamente complejos y son
difíciles de caracterizar pues es habitual que dependan de muchas variables, que es lo usual
al trabajar con datos reales.
Como nuestro deseo es que el alumno adquiera un aprendizaje significativo nos hemos
propuesto incidir en nuevas metodologías didácticas en la impartición de esta asignatura de
Estadística en la UES. Los alumnos, previamente, reciben materiales que les permiten
conocer los principios que establecela Estadística y colecciones de datos experimentales
para su análisis. De esta manera van a adquirir una información teórica y práctica, objetiva
y científica sobre el tema, para así conseguir los objetivos cognoscitivos que nos
proponemos.
Por tanto, para trabajar con datos reales se tienen en cuenta los conocimientos que poseen
los estudiantes de informática y en el manejo y utilización de programas de ordenador
(como son, por ejemplo, MINITAB, EXCEL, MATLAB o MAPLE), conocimientos y
habilidades que han adquirido en asignaturas ya cursadas previamente, como
sonprogramación y Matemáticas.
c
p
"
c
p
c
c
V. Evaluación.
Para que el alumno pueda aprobar la asignatura de Estadística, deberá cumplir con todos y
cada uno de los lineamientos e imperativos acordados a principio del semestre, para poder
obtener, sin mayor dificultad, la calificación mínima que estipula la UES.
Que el alumno entregue en tiempo y con las característica necesarias, todos y cada uno de
los ejercicios que se les pida subir al blog y los que se hacen durante la clase.
Asistir puntual a las cátedras e impulsar el interés del alumno en la interacción durante la
clase, esto a partir de la relación alumno-profesor.
También deberán trabajar en equipos para poder obtener un mayor rendimiento entre
alumnos, así como la interacción con los demás compañeros de clase, esto, con el objetivo
de tener una mejor relación y aprendan a trabajar en equipos.
Ôctividad Porcentaje
Prácticas 50%
Examen 50%
Total 100%
Alatorre F., S., et.al. Introducción a los Métodos Estadísticos. Universidad Pedagógica
Nacional. México. (3 volúmenes. Sistema de Educación a Distancia.)
c
p
#
c
p
c
c
Bibliografía complementaria:
c
p
$
c
p
c
c
Propósito:
^c Que el alumno aprenda a identificar los conceptos básicos de la estadística.
^c Visualizar el campo e importancia de la estadística.
^c Aplicar el conocimiento con prácticas y experimentos aleatorios.
Competencia específica:
Hacer uso de las herramientas y conceptos indispensables para la representación numérica y
gráfica de los datos recopilados y analizados dentro de un entorno.
Introducción:
La estadística como un concepto básico entre la sociedad, representa a la manera con que se
frecuenta e incide en un evento o la forma en que se cuantifica un hecho de cualquier
índole. Así que para un mejor entendimiento de lo que es en esencia la estadística,
aplicaremos los elementos y herramientas básicas para su entendimiento.
Asimismo, aprenderemos y conoceremos cuáles son los campos donde se puede aplicar la
estadística y cómo interactúa, sobre todo, a nivel social.
Estadística
³Ciencia que se ocupa del estudio de fenómenos de tipo genérico, normalmente complejos
y enmarcados en un universo variable, mediante el empleo de modelos de reducción de la
información y de análisis de validación de los resultados en términos de representatividad´.
La información puede ser numérica, alfabética o simbólica. Consta de las fases de recogida
de información, de análisis y de presentación e interpretación de los resultados y
elaboración de métodos.
Definida así la Estadística se evita hacer mención a sí es o no una rama de las matemáticas,
visión que consideramos innecesariamente limitada, al tiempo que se establece su carácter
genérico y su campo de acción en el estudio de fenómenos complejos ubicados en un
universo amplio y variable. Con esta afirmación, de complejidad, se introduce el factor de
c
p
c
p
c
c
incertidumbre que acompaña a los fenómenos aleatorios pero sin limitar el campo de la
Estadística de forma quepuede aplicarse también a fenómenos determinísticos.
Etimología:
El término alemán statistik, que fue primeramente introducido por Gottfried Achenwall
(1749), designaba originalmente el análisis de datos del Estado, es decir, la "ciencia del
Estado" (también llamada aritmética política de su traducción directa del inglés). No fue
hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar y
clasificar datos. Este concepto fue introducido por el inglés John Sinclair.
En su origen, por tanto, la Estadística estuvo asociada a los Estados, para ser utilizados por
el gobierno y cuerpos administrativos (a menudo centralizados). La colección de datos
acerca de estados y localidades continúa ampliamente a través de los servicios de
estadística nacionales e internacionales. En particular, los censos suministran información
regular acerca de la población.
Orígenes:
Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la
combinación de observaciones desde los principios de la teoría de probabilidades. Laplace
representó la ley de probabilidades de errores mediante una curva y dedujo una fórmula
para la media de tres observaciones. También, en 1871, obtiene la fórmula para la ley de
facilidad del error (término introducido por Lagrange, 1744) pero con ecuaciones
inmanejables. Daniel Bernoulli (1778) introduce el principio del máximo producto de las
probabilidades de un sistema de errores concurrentes.
El método de mínimos cuadrados, el cual fue usado para minimizar los errores en
mediciones, fue publicado independientemente por Adrien-Marie Legendre (1805), Robert
Adrain (1808), y Carl Friedrich Gauss (1809). Gauss había usado el método en su famosa
predicción de la localización del planeta enanoCeres en 1801. Pruebas adicionales fueron
escritas por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837),
Friedrich Bessel (1838), W.F. Donkin (1844, 1856), John Herschel (1850) y Morgan
Crofton (1870). Otros contribuidores fueron Ellis (1844), Augustus De Morgan (1864),
Glaisher (1872) y Giovanni Schiaparelli (1875). La fórmula de Peters para r, el probable
error de una observación simple es bien conocido.
El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833),
Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl
Pearson. Augustus De Morgan y George Boole mejoraron la presentación de la teoría.
Adolphe Quetelet (1796-1874), fue otro importante fundador de la estadística y quien
introdujo la noción del «hombre promedio» (l¶homme moyen) como un medio de entender
c
p
c
p
c
c
los fenómenos sociales complejos tales como tasas de criminalidad, tasas de matrimonio o
tasas de suicidios
Personajes relevantes:
Christiaan Huygens Pierre Simon Laplace Gottfried Achenwall
Padre de la estadística
c
p
c
p
c
c
^c Ciencias actuariales
^c Física estadística
^c Estadística industrial
^c Estadística Espacial
^c Matemáticas Estadística
^c Estadística en Medicina
^c Estadística en Medicina Veterinaria y Zootecnia
^c Estadística en Nutrición
^c Estadística en Agronomía
^c Estadística en Planificación
^c Estadística en Investigación
^c Estadística en Restauración de Obras
^c Estadística en Literatura
^c Estadística en Astronomía
^c Estadística en la Antropología (Antropometría)
^c Estadística en Historia
^c Estadística militar
^c Geoestadística
^c Bioestadística
^c Estadísticas de Negocios
^c Estadística Computacional
^c Estadística en las Ciencias de la Salud
^c Investigación de Operaciones
^c Estadísticas de Consultoría
^c Estadística de la educación, la enseñanza, y la formación
^c Estadística en la comercialización o mercadotecnia
^c Cienciometría
^c Estadística del Medio Ambiente
^c Estadística en Epidemiología
^c Minería de datos (aplica estadística y reconocimiento de patrones para el
conocimiento de datos)
^c Econometría (Estadística económica)
^c Estadística en Ingeniería
^c Geografía y Sistemas de información geográfica, más específicamente en Análisis
espacial
^c Demografía
^c Estadística en psicología (Psicometría)
^c Calidad y productividad
^c Estadísticas sociales (para todas las ciencias sociales)
^c Cultura estadística
^c Encuestas por Muestreo
c
p
c
p
c
c
Importancia:
Kendall y Buckland definen la estadística como un valor resumido, calculado, como base
en una muestra de observaciones que generalmente, aunque no por necesidad, se considera
como una estimación de parámetro de determinada población; es decir, una función de
valores de muestra.
La importancia que tiene está relacionada con el área o áreas en las que se puede aplicar,
debido a que está presente en todas las áreas del saber.
La estadística es una ciencia de aplicación práctica casi universal en todos los campos
científicos:
c
p
c
p
c
c
* En las ciencias médicas: permite establecer pautas sobre la evolución de las enfermedades
y los enfermos, los índices de mortalidad asociados a procesos morbosos, el grado de
eficacia de un medicamento, etcétera.
c
p
!
c
p
c
c
c
p
"
c
p
c
c
p
p cc c c
c
c c c c c
cc p c
c(
c
ccc c
cccc c
c
p
#
c
p
c
c
Suele iniciarse con una fijación de objetivos o algunas preguntas como ¿cuál será la media
de esta población respecto a tal característica?, ¿se parecen estas dos poblaciones?, ¿hay
alguna relación entre... ?
Se analizan también en este punto los medios de los que se dispone y el procedimiento a
seguir.
Elaboración de un modelo
Extracción de la muestra
c
p
$
c
p
c
c
¿Se han preguntado alguna vez para qué sirven las encuestas que a veces se hacen en la
calle?, ¿Cómo saber si una estación de radio es mejor que otra? , ¿Cuál candidato puede
ganar? Bueno, en realidad todo comienza con la recaudación de datos.
Los datos es información que se recoge, esto puede ser opinión de las personas sobre un
tema, edad o sexo de encuestados, dónde viven, cuántas personas viven en una casa, qué
tipo de sangre tiene un grupo de personas, etc.
Hay tanta información que puede servirle a diferentes profesionales para sacar datos que
son útiles en la toma de decisiones, para resolver problemas, o cualquier otro elemento que
así lo amerite.
Se preguntarán qué hacen estas personas con la información que han recogido. Se te
explicará. Una vez que se haya recogido toda la información, se procede a crear una base de
datos, donde se registran todos los datos obtenidos. Algunas veces, si los datos son muy
complicados, se codifican, esto quiere decir que se le coloca una palabra clave que
identifica un título muy largo. Cuando ya está elaborada la base de datos se parece a una
tabla.
1 8 azul 3 Perro
2 6 verde 0 Perro
3 7 rojo 7 Gato
4 7 amarillo 4 Perro
5 9 verde 3 ninguno
6 8 azul 1 gato
7 9 rojo 0 pez
8 8 morado 2 perro
9 6 azul 3 pez
10 7 verde 1 ninguno
Con esta tabla no se puede hacer mucho, pero es importante para registrar los datos. A
partir de esta base de datos se puede hacer una tabla de frecuencias. Para determinar la
frecuencia de "algo" o el número de veces que se produce un fenómeno (el fenómeno puede
ser "el color preferido de los niños de un salón", "la edad de un grupo de sujetos", "el tipo
c
p
c
p
c
c
de animal que tiene en casa", "la cantidad de inasistencias a clase", o cualquier otro
fenómeno). Vemos ahora qué pasa con nuestra base de datos:
Con los datos obtenidos elaboramos una serie de tablas. Con los datos de las tablas
fabricamos unos gráficos (también llamados figuras) de frecuencia que podrás observar al
lado de cada tabla.
Pero esto no nos dice nada si no "analizamos" los datos. Analizar significa sacar
conclusiones de la información expuesta. Este análisis está debajo de la tabla y el gráfico.
Tabla 1.
Frecuencia de colores preferidos del grupo estudiado
Color Frecuencia
Rojo 2
Azul 3
Verde 3
Morado 1
Amarillo 1
Figura 1.
Frecuencia de colores preferidos del grupo estudiado.
Se puede observar que los colores preferidos de me mayor frecuencia son el Azul y el
Verde, cada uno con una frecuencia de 3.
Tabla 2.
Frecuencia de inasistencia a clase del grupo estudiado
c
p
c
p
c
c
Figura 2.
Frecuencia de inasistencia a clase del grupo estudiado
^c Ahora, recuerden lo siguiente, los investigadores nunca colocan las tablas y los
gráficos juntos, porque en realidad dicen lo mismo, corrientemente se utiliza o una
tabla y su análisis, o un gráfico y su análisis.
Nota: también que el título de la tabla va encima de ésta, mientras que el título de la
figura va por debajo. El título, de ambas, sólo lleva la primera palabra en mayúscula
y no va subrayado.
^c Creemos que ha sido fácil lo que les enseñamos, ahora les toca a ustedes hacer una
tabla de frecuencias y su respectiva figura.
c
p
c
p
c
c
Tabla 3.
Frecuencia del tipo de animal que tiene el grupo estudiado
Figura 3.
Frecuencia del tipo de animal que tiene el grupo estudiado
Vamos a ver, por ejemplo, la edad de los niños y el tipo de animal que tienen en casa, o el
tipo de animal que tienen en casa y la edad de los niños. Utilizaremos la misma base de
datos de antes.
c
p
c
p
c
c
Tabla 4.
Frecuencia del tipo de animal que tiene el grupo estudiado según su edad
Figura 4.
Frecuencia del tipo de animal que tiene el grupo estudiado según su edad
Tabla 5.
Frecuencia del tipo de animal que tiene el grupo estudiado según su edad
c
p
c
p
c
c
Figura 5.
Frecuencia del tipo de animal que tiene el grupo estudiado según su edad.
Con la elaboración de las tablas y gráficos se facilita obtener información. Podemos hasta
decir que la mayoría de los niños de 8 años tienen perros en su casa.
Intervalos o clases:
m°
2
c
p
c
p
c
c
Población o UniversoObjetivo.
Población Finita
Población Infinita.
Muestra
Muestra No Probabilística
Muestra Probabilística
Unidad de Ônálisis
c
p
!
c
p
c
c
ciudad de Lima y se define la unidad de análisis ³hotel´, en cada uno de los hoteles
de la ciudad, se solicita la siguiente información:
Variable
Variables Cualitativas
Son aquellas variables que expresan categorías o atributos y que por tanto su medida
no tiene un carácter numérico, por su naturaleza, estas variables pueden ser:
c
p
"
c
p
c
c
Variables Cuantitativas
Son variables que toman valores que se expresan en números enteros. Ejemplo:
Número de habitaciones.
Número de empleados.
Total de clientes atendidos durante el mes de Julio.
Se aprecia que estas variables no pueden tomar valores fraccionarios.
Son aquellas variables que sus cantidades se expresan con números reales, es decir,
tienen parte fraccionaria. Ejemplo:
Observación
Parámetro:
Ejemplo:
Número de habitaciones promedio en los hoteles de la ciudad de Lima.
Número de empleados promedio de los hoteles de la ciudad de Lima.
c
p
#
c
p
c
c
Promedio de clientes atendidos por los hoteles de Lima durante el mes de Julio.
Ingresos promedio de los hoteles de la ciudad de Lima en el mes de Julio.
Estadístico:
ORGÔNIZÔCION Y PRESENTÔCION DE
DÔTOS: Tablas de Información Estadística
1. Número de cuadro
Es un código de identificación que permite citarlo cuantas veces sea necesario a lo largo
de los comentarios de un informe.
2. Título
c
p
$
c
p
c
c
3. Encabezamiento
Es la descripción resumida sobre contenido de las filas y columnas que contiene el cuadro
de información.
Anote las aclaraciones sobre términos, siglas, abreviaturas usadas. También precisar
las unidades de medida y equivalencias que se están utilizando para expresar cantidades.
6. Fuente
7. Elaboración
8. Fecha
Registre la fecha en que se realizó el cuadro para dejar constancia del evento y
poder actualizar de ser pertinente
c
p
c
p
c
c
NÚMERO Cuadro No 01
TÍTULO
¿Qué? Número de turistas extranjeros que fueron atendidos
¿Dónde? en el hotel CONFORT
¿Cómo? según nacionalidad por
sexo (1)
¿Cuándo?( Periodo: Febrero 2006)
FECHA 01.03.2006
c
p
c
p
c
c
Son estadígrafos de posición que son interpretados como valores que permiten resumir a un
conjunto de datos dispersos, podría asumirse que estas medidas equivalen a un centro de
gravedad que adoptan un valor representativo para todo un conjunto de datos
predeterminados. Estas medidas son:
La media aritmética:
La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el
número de sumandos.
La media resume en un valor las características de una variable teniendo en cuenta todos
los casos. Solamente puede utilizarse con variables cuantitativas.
Ejemplo: Durante los últimos 32 días el valor de las compras en periódicos fue:
{ 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8,
6.8, 7.2, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1,
8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 }
c
p
c
p
c
c
Ejemplo: Para los gastos diarios en periódicos del hotel agrupados en una tabla de
frecuencia:
Intervalo 10
Xi fi hi Fi Hi
8
5.2 - 6.1 5.65 3 0.094 3 0.094
6
6.1 - 7.0 6.55 5 0.156 8 0.250
4
7.0 - 7.9 7.45 9 0.281 17 0.531
2
7.9 - 8.8 8.35 7 0.219 24 0.750
0
8.8 - 9.7 9.25 5 0.156 29 0.906 7.4 8.3 10.1
5.65 6.55 5 5 9.25 5
9.7 - 10.6 10.15 3 0.094 32 1.000
TOTAL 32 1.000
7.87
El promedio aritmético
es:
Durante los 32 días el hotel tuvo un gasto promedio en periódicos de 7.87 soles
c
p
c
p
c
c
Inconvenientes de su uso
^c Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en
situaciones muy diversas, tiene también algunos inconvenientes, como son:
Para datos agrupados en intervalos (variables continuas) su valor oscila en función
de la cantidad y amplitud de los intervalos que se consideren.
c
p
c
p
c
c
valores altos tienen más peso que los valores cercanos a cero. Por ejemplo, en el
cálculo del salario medio de un empresa, el salario de un alto directivo que gane
1.000.000 de ¼ tiene tanto peso como el de diez empleados "normales" que ganen
1.000 ¼. En otras palabras, se ve muy afectada por valores extremos.
La mediana
Donde:
Li = Límite Inferior del intervalo que contiene a la Mediana
Fi-1 = Frecuencia Acumulada en la clase anterior i-ésima
fi = Frecuencia en la clase que contiene a la mediana
Hi-1 = Frecuencia Relativa Acumulada en la clase anterior i-ésima
hi = Frecuencia Relativa en la clase que contiene a la mediana
c =Tamaño del intervalo de clase.
c
p
c
p
c
c
Ejemplo: Para los gastos diarios en periódicos del hotel en una tabla de frecuencia:
Intervalo 10
Xi fi hi Fi Hi
8
5.2 - 6.1 5.65 3 0.094 3 0.094
6
6.1 - 7.0 6.55 5 0.156 8 0.250
4
7.0 - 7.9 7.45 9 0.281 17 0.531
2
7.9 - 8.8 8.35 7 0.219 24 0.750
0
8.8 - 9.7 9.25 5 0.156 29 0.906 10.1
5.65 6.55 7.45 8.35 9.25 5
9.7 - 10.6 10.15 3 0.094 32 1.000
TOTAL 32 1.000
Me=7.8
La moda
Es el valor, clase o categoría que ocurre con mayor frecuencia y sus características son:
-c Puede no existir o existir más de una moda
-c Su valor no se ve afectado por los valores extremos en los datos
-c Se utiliza para analizar tanto la información cualitativa como la cuantitativa
-c Es una medida ³inestable´ cuando en número de datos es reducido.
c
p
"
c
p
c
c
Ejemplo: El gasto diario en periódicos del hotel ³AAA´ agrupados en una tabla de
frecuencia:
Intervalo 10
Xi fi hi Fi Hi
8
5.2 - 6.1 5.65 3 0.094 3 0.094
6
6.1 - 7.0 6.55 5 0.156 8 0.250
4
7.0 - 7.9 7.45 9 0.281 17 0.531
2
7.9 - 8.8 8.35 7 0.219 24 0.750
0
8.8 - 9.7 9.25 5 0.156 29 0.906 5.65 6.55 7.45 8.35 10.1
9.25 5
9.7 - 10.6 10.15 3 0.094 32 1.000
TOTAL 32 1.000
Mo=7.6
d2= 9-7 = c= 0.9 = Tamaño de Intervalo de
d1= 9-5 = 4 2 Clase
La moda estimada utilizando estos datos agrupados es:
7.6
^c Cálculo sencillo.
^c Interpretación muy clara.
^c Al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es
por ello el parámetro más utilizado cuando al resumir una población no es posible
realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las
características más frecuentes de determinado sector social. Esto se conoce
informalmente como "retrato robot".
c
p
#
c
p
c
c
Inconvenientes
1.5Medidas de dispersión.
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la
variabilidad de una distribución, indicando por medio de un número, si las diferentes
puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor,
mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe
si todos los casos son parecidos o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la
media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma
de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar
este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y
otra es tomando las desviaciones al cuadrado (Varianza).
A
Ejemplo
Para una muestra (8,7,6,9,4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario
inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran
en un rango de:
A%&$'%
c
p
$
c
p
c
c
å
cc c c
Propiedades
M = + c
Ejemplos:
c
p
c
p
c
c
Datos no agrupados:
D
c
p
c
p
c
c
p
aa
aa
aa
Primero hemos declarado un vector con nombre X, donde introduzco los números de la
serie. Luego con el comando stdev se hallará la desviación típica.
c
p
c
p
c
c
Propósito:
^c Que el alumno aplique el conocimiento básico para aplicarlo en el estudio de las
poblaciones y las muestras.
^c Identificar dentro de un caso, los datos agrupados y no agrupados para su
concentración y estudio
Competencia específica:
Hacer uso de las herramientas y conceptos indispensables para la representación numérica y
gráfica de los datos recopilados y analizados dentro de un entorno.
Introducción:
En estudios pasados de Estadísticas centramos nuestra atención en técnicas que describen
los datos, tales como organizar datos en distribuciones de frecuencias y calcular diferentes
promedios y medidas de variabilidad. Estábamos concentrados en describir algo que ya
ocurrió.
A menudo no es factible estudiar la población entera. Algunas de las razones por lo que es
necesario muestrear son:
El ejemplo de los ratings de eficiencia muestra como las medias de muestras de un tamaño
específico varían de muestra a muestra. La media de la primera muestra fue 101 y la media
de la segunda fue 99.5. En una tercera muestra probablemente resultaría una media
c
p
c
p
c
c
diferente. Si organizamos las medias de todas las posibles muestras de tamaño 2 en una
distribución de probabilidad, obtendremos la distribución muestral de las medias.
Distribución muestral de las medias. Es una distribución de probabilidad de todas las
posibles medias muestrales, de un tamaño de muestra dado, seleccionadas de una
población.
Con esta distribución podíamos calcular la probabilidad de algún evento relacionado con la
variable aleatoria, mediante la siguiente fórmula:
En donde z es una variable estandarizada con media igual a cero y varianza igual a uno.
Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio,
utilizando la tabla de la distribución z.
Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier tamaño
de una población normal, la distribución muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la formula de la distribución normal
con y , entonces la fórmula para calcular la probabilidad del
comportamiento del estadístico, en este caso la media de la muestra , quedaría de la
siguiente manera:
Ejemplo:
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación estándarc cc
horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida
promedio de menos de 775 horas.
c
p
c
p
c
c
!
m m mm m
Ejemplo:
Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con
una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen
200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine:
a.c El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
b.c El número de medias muestrales que caen por debajo de 172 centímetros.
!
Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo
sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a
calcular el denominador de Z para sólo sustituirlo en cada inciso.
mc c
c
p
c
p
c
c
b.c
c
p
!
c
p
c
c
Suponga que la tabla siguiente muestra la antiguedad en años en el trabajo de tres maestros
universitarios de matemáticas:
A 6
B 4
C 2
!
Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles de
tamaño 2, con sus respectivas medias muestrales.
A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3
c
p
"
c
p
c
c
Si utilizamos la fórmula del error estándar sin el factor de correción tendriamos que:
Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección
obtendremos el valor correcto:
c
p
#
c
p
c
c
UnimportanteresultadoenProbabilidadesyEstadísticaeselllamadoTeoremadel
LímiteCentralquedicequesideunapoblacióninfinitaconmedia'yvarianza 2se
extraenmuestrasaleatoriasdetamañon ,entonceslamediamuestralsecomporta
aproximadamentecomounavariablealeatorianormalconmediaigualalamedia
poblacionalyconvarianzaigualalavarianzapoblacionaldivididaporeltamañodela
muestra,siemprequen seagrande. Loimportantedeesteresultadoesquees
independientedelaformadeladistribucióndelapoblación.Esdecir,
Cuandonesgrande.Estandarizando,estoesequivalentea:
Silapoblaciónesbastantesimétricaentonces,untamañodemuestrande
aproximadamente 30essuficienteparaunabuenaaproximaciónalanormal. Sila
poblaciónesbastanteasimétrica,entonceseltamañodemuestradebesermuchomás grande.
EnMINITABsepuedetratardecorroborarelTeoremadelLímiteCentralatravés
deunprocesodesimulación.
EjemploConsiderarunapoblaciónqueconsistede3,4,6,8,10,11,12,15,20.
Primerocalculamoslamediaydesviaciónestándardedichapoblación.
!! !!! !! !
Notarque' 9.89y 5.42.
Segundo,extraemos30muestrasdetamaño4dedichapoblación,ejecutando4vecesla
siguientesecuenciaCalcðRandomDataðSamplefromcolumns.Guardarcadaunade
las4observacionesdelasmuestrasen4columnasdistintas:Obs1,Obs2,Obs3,yObs4.
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporción de artículos defectuosos o la proporción de alumnos
reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribución se genera de igual manera que la
distribución muestral de medias, a excepción de que al extraer las muestras de la población
se calcula el estadístico proporción (p=x/n en donde "x" es el número de éxitos u
observaciones de interés y "n" el tamaño de la muestra) en lugar del estadístico media.
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos. Se
van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución
muestral de proporciones para el número de piezas defectuosas.
c
p
c
p
c
c
c c c c
cc
p=P
2
La varianza de la distribución binomial es = npq, por lo que la varianza de la
2
distribución muestral de proporciones es p =(Pq)/n. Si se sustituten los valores en esta
fórmula tenemos que:
c
p
c
p
c
c
Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos.
Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la
proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solución:
Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la
aproximación de la distribución normal a la binomial y el segundo utilizando la fórmula de
la distribución muestral de proporciones.
c
p
c
p
c
c
Datos:
n=800 estudiantes
p=0.60
p(x< 440) = ?
p(x< 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al
extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.
Datos:
n=800 estudiantes
P=0.60
p= 0.55
p(p< 0.55) = ?
c
p
c
p
c
c
Ejemplo:
Datos:
n=150 personas
p=0.03
x= (0.04)(150) = 6 personas
c
p
c
p
c
c
p(x>6) = ?
p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al
extraer una muestra de 150 personas, mas de 6 presentarán una reacción adversa.
Datos:
n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?
c
p
c
p
c
c
Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad
del 17% de que al tomar una muestra de 150 personas se tenga una proporción mayor de
0.04 presentando una reacción adversa.
Ejemplo:
Se sabe que la verdadera proporción de los componentes defectuosos fabricados por una
firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60
tenga:
!
a.c Datos:
n= 60 artículos
P=0.04
p= 0.03
p(p<0.03) = ?
c
p
!
c
p
c
c
b.c Datos:
n= 60 artículos
P=0.04
p= 0.01 y 0.05
p(0.01<p<0.05) = ?
Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviación
estándar 1, y la segunda con media 2 y desviación estándar 2. Más aún, se elige una
muestra aleatoria de tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada
muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama
distribución muestral de las diferencias entre medias o la distribución muestral del
estadístico
c
p
"
c
p
c
c
Ejemplo:
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una
escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que
tanto para niños como para niñas los pesos siguen una distribución normal. El promedio de
los pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su desviación
estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas del sexto
grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si
representa el promedio de los pesos de 20 niños y es el promedio de los pesos de una
muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los 20
niños sea al menos 20 libras más grande que el de las 25 niñas.
c
p
#
c
p
c
c
Solución:
Datos:
1= 100 libras
2 = 85 libras
1= 14.142 libras
2= 12.247 libras
n1 = 20 niños
n2 = 25 niñas
=?
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al
menos 20 libras más grande que el de la muestra de las niñas es 0.1056.
Ejemplo:
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una
desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años
con una desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria
de 34 tubos de la compañía A tenga una vida promedio de al menos un año más que la de
una muestra aleatoria de 40 tubos de la compañía B.
Solución:
c
p
$
c
p
c
c
Datos:
A= 7.2 años
B = 6.7 años
A= 0.8 años
B= 0.7 años
nA = 34 tubos
nB = 40 tubos
=?
Ejemplo:
Solución:
c
p
!
c
p
c
c
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos
poblaciones, por lo que se supondrán que son iguales.
Datos:
1= 1.23 Km/Lto
2= 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
a.c =?
b.c ?
c
p
!
c
p
c
c
c
p
!
c
p
c
c
Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus
opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato.
Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que
sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100
hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine
la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de
las mujeres.
Solución:
Datos:
PH = 0.12
PM = 0.10
nH = 100
nM = 100
p(pH-pM 0.03) = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución
binomial y se está utilizando la distribución normal.
c
p
!
c
p
c
c
Ejemplo:
Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron
despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo
menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria de 320
trabajadores de entre todos los empleados despedidos entre 1979 y 1984. ¿Cuál sería la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo
menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o
más?
Solución:
En este ejercicio se cuenta únicamente con una población, de la cual se están extrayendo
dos muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas
dos muestras, por lo que se debe de utilizar la distribución muestral de proporciones con
P1= P2, ya que es una misma población.
Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de
trabajadores despedidos entre 1979 y 1984 que estuvieron desempleados por un período de
por lo menos dos años, sólo se conoce la
p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa proporción.
c
p
!
c
p
c
c
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo
menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o
más?, la palabra difiera quiere decir que puede existir una diferencia a favor de la muestra
uno, o a favor de la muestra dos, por lo que se tendrán que calcular dos áreas en la
distribución y al final sumarlas.
Datos:
p1 = 0.20
n1 = 320 trabajadores
n2 = 320 trabajadores
P1 = P2
c
p
!
c
p
c
c
Ejemplo:
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de
cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120
objetos de cada máquina:
Solución:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
c
p
!!
c
p
c
c
b.c p(p1-p2
0.15)=?
c
p
!"
c
p
c
c
Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviación
estándar 1, y la segunda con media 2 y desviación estándar 2. Más aún, se elige una
muestra aleatoria de tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada
muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama
distribución muestral de las diferencias entre medias o la distribución muestral del
estadístico
c
p
!#
c
p
c
c
Ejemplo:
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una
escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que
tanto para niños como para niñas los pesos siguen una distribución normal. El promedio de
los pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su desviación
estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas del sexto
grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si
representa el promedio de los pesos de 20 niños y es el promedio de los pesos de una
muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los 20
niños sea al menos 20 libras más grande que el de las 25 niñas.
!
Datos:
1= 100 libras
2 = 85 libras
1= 14.142 libras
2= 12.247 libras
n1 = 20 niños
n2 = 25 niñas
=?
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al
menos 20 libras más grande que el de la muestra de las niñas es 0.1056.
c
p
!$
c
p
c
c
Ejemplo:
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una
desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años
con una desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria
de 34 tubos de la compañía A tenga una vida promedio de al menos un año más que la de
una muestra aleatoria de 40 tubos de la compañía B.
!
Datos:
A= 7.2 años
B = 6.7 años
A= 0.8 años
B= 0.7 años
nA = 34 tubos
nB = 40 tubos
=?
c
p
"
c
p
c
c
Ejemplo:
!
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos
poblaciones, por lo que se supondrán que son iguales.
Datos:
1= 1.23 Km/Lto
2= 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
a.c =?
c
p
"
c
p
c
c
b.c
Para poder trabajar con ella necesitamos conocer la función de distribución asociada, para
esto estudiaremos la distribución chi cuadrado.
c
p
"
c
p
c
c
Se dice que una variable aleatoria X sigue una distribución ji cuadrado con k grados de
libertad, cuando su función de densidad está dada por la fórmula:
è =
è =
÷ ÷
Dado lo complicado de la expresión utilizaremos una tabla para conocer los valores que nos
interesen.
1.c Si X es una variable con distribución ji cuadrado con k grados de libertad, su media
es k y su varianza 2k.
2.c Una variable ji cuadrado no toma valores negativos.
3.c Su gráfica es de las de tipo de curvas sesgadas a la derecha.
4.c A medida que aumentan los grados de libertad la curva se va haciendo más
simétrica y su cola derecha se va extendiendo.
5.c Por cada valor de k hay una distribución distinta.
6.c k es el único parámetro asociado a la distribución.
c
p
"
c
p
c
c
c
p
"
c
p
c
c
c
p
"
c
p
c
c
c
p
"!
c
p
c
c
c
p
""
c
p
c
c
Propósito:
^c Aprender cómo acoplar los elementos de una población o una muestra
^c Inferir en los parámetros de un problema
^c Conocer los métodos y formas de presentar dicha información
Competencia específica:
Hacer uso de las herramientas y conceptos indispensables para la representación numérica y
gráfica de los datos recopilados y analizados dentro de un entorno.
Introducción:
En todo este tema vamos a suponer que estamos estudiando una población cuya
distribución es conocida excepto en un parámetro al que llamaremos . A
la distribución de la población la denotaremos por f(x).
Diremos que nos encontramos ante un problema de estimación cuando, dada una
población con una distribución f(x) donde es un parámetro desconocido, aventuremos o
infiramos en base a los datos muestrales el valor de . Si al inferir el
parámetro damos un único valor estaremos ante un problema de estimación puntual.
Estimador puntual R¨zâ1 , â2 ,..., â : será una función de la muestra aleatoria (un
estadístico) que utilizaremos para estimar el valor del parámetro .
Estimación R¨ : valor obtenido del estimador al sustituir por los valores de una muestra
completa.
Un estimador es, por tanto, un estadístico y, por ello, es una v.a. con una determinada
distribución de probabilidad llamada distribución muestral.
Dado un parámetro, podríamos utilizar distintos estimadores puntuales para estimarlo. Por
ejemplo, para estimar la varianza de la población podemos utilizar la varianza muestral o la
cuasi-varianza muestral. ¿Cuál es mejor? Veamos a continuación como comprobar si un
estadístico es un buen estimador de un parámetro. Para ello le exigiremos una serie de
propiedades. Como el estadístico es una variable aleatoria, las propiedades se las tenemos
que exigir a su distribución de probabilidad.
c
p
"#
c
p
c
c
Eficiente o con varianza mínima.- Suponga que 1 y 2 son dos estimadores insesgados
de . Entonces, aun cuando la distribución de cada estimador esté centrada en el valor
verdadero de , las dispersiones de las distribuciones alrededor del valor verdadero pueden
ser diferentes.
Entre todos los estimadores de que son insesgados, seleccione al que tenga varianza
mínima. El resultante recibe el nombre de estimador insesgado con varianza mínima
(MVUE, minimum variance unbiased estimator) de .
Tiene sentido pensar que un estimador con un error estándar menor tendrá una mayor
oportunidad de producir una estimación mas cercana al parámetro de población que se esta
considerando.
Como se puede observar las dos distribuciones tienen un mismo valor en el parámetro sólo
que la distribución muestral de medias tiene una menor varianza, por lo que la media se
convierte en un estimador eficiente e insesgado.
c
p
"$
c
p
c
c
Estimación Puntual
La inferencia estadística está casi siempre concentrada en obtener algún tipo de conclusión
acerca de uno o más parámetros (características poblacionales). Para hacerlo, se requiere
que un investigador obtenga datos muestrales de cada una de las poblaciones en estudio.
Entonces, las conclusiones pueden estar basadas en los valores calculados de varias
cantidades muestrales . Po ejemplo, representamos con (parámetro) el verdadero
promedio de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas
de semiconductores. Podría tomarse una muestra aleatoria de 10 conexiones para
determinar la resistencia a la ruptura de cada una, y la media muestral de la resistencia a la
ruptura se podía emplear para sacar una conclusión acerca del valor de . De forma
c
p
#
c
p
c
c
Ejemplo:
En el futuro habrá cada vez más interés en desarrollar aleaciones de Mg de bajo costo, para
varios procesos de fundición. En consecuencia, es importante contar con métodos prácticos
para determinar varias propiedades mecánicas de esas aleaciones. Examine la siguiente
muestra de mediciones del módulo de elasticidad obtenidos de un proceso de fundición a
presión:
Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar
+ error de estimación
entonces el estimador preciso sería uno que produzca sólo pequeñas diferencias de
estimación, de modo que los valores estimados se acerquen al valor verdadero.
Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información
alguna sobre la precisión y confiabilidad de la estimación. Por ejemplo, imagine que se usa
el estadístico para calcular un estimado puntual de la resistencia real a la ruptura de
toallas de papel de cierta marca, y suponga que = 9322.7. Debido a la variabilidad de la
muestra, nunca se tendrá el caso de que = . El estimado puntual nada dice sobre lo
cercano que esta de . Una alternativa para reportar un solo valor del parámetro que se
c
p
#
c
p
c
c
Existen varias tablas en las cuales podemos encontrar el valor de z, según sea el área
proporcionada por la misma. En esta sección se realizará un ejemplo para encontrar el valor
de z utilizando tres tablas diferentes.
c
p
#
c
p
c
c
Ejemplo:
!
Se utilizará la tabla que tiene el área bajo la curva de - hasta z. Si lo vemos gráficamente
sería:
En base a la tabla que se esta utilizando, se tendrá que buscar el área de 0.975, ya que cada
extremo o cola de la curva tiene un valor de 0.025.
!
c
p
#
c
p
c
c
En este caso sólo se tendrá que buscar adentro de la tabla el área de 0.475 y el resultado del
valor de z será el mismo, para este ejemplo 1.96.
!
Independientemente del valor del Nivel de Confianza este será el procedimiento a seguir
para localizar a z. En el caso de que no se encuentre el valor exacto se tendrá que interpolar.
c
p
#
c
p
c
c
una desviación típica dada por la siguiente expresión: . Esto se representa como
En una distribución ! ~ "(0, 1) puede calcularse fácilmente un intervalo dentro del cual
"caigan" un determinado porcentaje de las observaciones, esto es, es sencillo hallar 1 y 2
tales que P[1 z 2] = 1 - Į, donde (1 - Į)·100 es el porcentaje deseado.
c
p
#
c
p
c
c
Į/2 = Į / 2
As :
c
p
#!
c
p
c
c
Aproximaciones para el valor Į / 2 para los niveles de confianza estándar son 1,96 para 1 í
Į = 95% y 2,576 para 1 í Į = 99%.[5]
El intervalo de confianza para estimar una proporción , conocida una proporción muestral
de una muestra de tamaño , a un nivel de confianza del (1-Į)·100% es:
Se hace una distinción entre los casos de conocida y desconocida al calcular las
estimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza
el teorema del límite central, mientras que para desconocida se hace uso de la
distribución muestral de la variable aleatoria t. Sin embargo, el uso de la distribución t se
basa en la premisa de que el muestreo se realiza de una distribución normal. En tanto que la
distribución tenga forma aproximada de campana, los intervalos de confianza se pueden
calcular cuando la varianza se desconoce mediante el uso de la distribución t y se puede
esperar buenos resultados.
c
p
#"
c
p
c
c
Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se
pueda suponer, con desconocida y n 30, s puede reemplazar a y se puede utilizar el
intervalo de confianza:
Por lo general éste se denomina como un m m m
m #m . La
justificación yace sólo en la presunción de que con una muestra grande como 30, s estará
muy cerca de la real y de esta manera el teorema del límite central sigue valiendo. Se
debe hacer énfasis en que esto es solo una aproximación y que la calidad de este enfoque
mejora a medida que el tamaño de la muestra crece más.
Ejemplos:
1.c El contenido de siete contenedores similares de ácido sulfúrico son 9.8, 10.2, 10.4,
9.8, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la
media de todos los contenedores si se supone una distribución aproximadamente
normal.
Solución:
10 y s= 0.283
Con un nivel de confianza del 95% se sabe que el promedio del contenido de los
contenedores está entre 9.47 y 10.26 litros.
c
p
##
c
p
c
c
!
9.8525 y s= 0.0965
Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustión residual
promedio se encuentra entre 9.8073 y 9.8977 segundos.
c
p
#$
c
p
c
c
Ejemplos:
c
p
$
c
p
c
c
!
n=500
p = 15/500 = 0.03
z(0.90) = 1.645
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos
que no pasan la prueba en esa población esta entre 0.0237 y 0.0376.
c En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se
encontraron 20 defectuosas. Si la proporción de pilas defectuosas en esa muestra
se usa para estimar , que vendrá a ser la proporción verdadera de todas las pilas
defectuosas tipo B fabricadas por la Everlast Company, encuentre el máximo error
de estimación tal que se pueda tener un 95% de confianza en que dista menos
de de
!
p=x/n = 20/400=0.05
z(0.95)=1.96
Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista
menos de 0.021 de En otras palabras, si p=0.05 se usa para estimar P, el error
máximo de estimación será aproximadamente 0.021 con un nivel de confianza del
95%.
c
p
$
c
p
c
c
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del
95% se sabe que la proporción de pilas defectuosas de esta compañía está entre
0.029 y 0.071.
!
P= 60/300 = 0.20
Z(0.90) = 1.645
0.162<P<0.238
Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer el
despeje nos queda las dos proporciones poblacionales y es precisamente lo que queremos
estimar, por lo que se utilizarán las proporciones de la muestra como estimadores
puntuales:
c
p
$
c
p
c
c
Ejemplos:
!
-0.0017<P1-P2<0.0217
Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo
procedimiento producirá una disminución significativa en la proporción de artículos
defectuosos comparado con el método existente.
2.c Un artículo relacionado con la salud, reporta los siguientes datos sobre la incidencia
de disfunciones importantes entre recién nacidos con madres fumadoras de
marihuana y de madres que no la fumaban:
Usuaria No Usuaria
c
p
$
c
p
c
c
!
-0.0064<P1-P2<0.0212
c caciones independientes
c
p
$
c
p
c
c
Ejemplo: Dos universidades públicas tienen dos métodos distintos para inscribir a sus
alumnos. Los dos desean comprobar el tiempo promedio que toma la inscripción de los
alumnos. En cada universidad se tomaron los tiempos de inscripción de 31 alumnos
tomados al azar. Las medias y desviaciones típicas muestrales fueron: , ,
, . Si se supone que el muestreo se llevó a cabo en dos poblaciones normales e
independientes, obtener los intervalos de confianza al nivel de riesgo 0'05 para la diferencia
entre las medias del tiempo de inscripción para las dos universidades,
Para el apartado a
c
p
$
c
p
c
c
z 1
21 2
2 1
2 ( 1)
21 2
O 1 1 1
2
2 1
2
Despejando 2 tenemos:
( 1)
2 ( 1)
2
2 1 2 2 1 1
1 1
1
2 2
Es decir,
2 2
( 1 )
( 1 )
1
2 2 1 , 2
1 1
1
2
2
c
p
$!
c
p
c
c
Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura superior a las
mujeres en la población española. Según las últimas tablas en el servicio militar, los
varones entre 18 y 20 años presentan una varianza de 0'0529. de las mujeres no tenemos
información, por ello tomamos una muestra de 101 mujeres entre 18 y 20 años y obtenemos
1 0'18 ¿Entre qué valores se encontrará la verdadera varianza a un nivel de 0'95 de
confianza?
2
1 0'95
1 0'975
100 0 '025 74'22
2
Sustituyendo en el intervalo tendremos:
21
12
% 1,u 1
u2 1
22
12
21 1
21 1
,
22 u2 1 % 1,u 1 u2 1 % 1,u 1
p p
1
2 2
c
p
$"
c
p
c
c
Ejemplo: Con los datos del ejemplo de la pag. 11 , calcular el intervalo de confianza para el
cociente de varianzas al nivel de confianza 0'95. ¿Podríamos aceptar la suposición de que
las varianzas poblacionales son iguales?
1 0'95 1 0'975 ·30,300 '975 2'07 y
2
p 1 1
0 025
%30 ,300 025
2 %30,300 975 2 07
2 31 2 u 2 31 2
21
2 3 5 47
u2 1
u 3 9 3
1 30 u 1 30
5'47 1 5'47 1
,
9'3 2'07 9'3 1 2'07
0'284,1'218
c
p
$#
c
p
c
c
Propósito:
^c Aprender cómo acoplar los elementos de una población o una muestra
^c Inferir en los parámetros de un problema
^c Conocer los métodos y formas de presentar dicha información
Competencia específica:
Hacer uso de las herramientas y conceptos indispensables para la representación numérica y
gráfica de los datos recopilados y analizados dentro de un entorno.
Introducción:
Las secciones anteriores han mostrado cómo puede estimarse un parámetro a partir de los
datos contenidos en una muestra. Puede encontrarse ya sea un sólo número (estimador
puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos
problemas de ingeniería, ciencia, y administración, requieren que se tome una decisión
entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe el
nombre de hipótesis. Este es uno de los aspectos más útiles de la inferencia estadística,
puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el
mundo de la ingeniería, pueden formularse como problemas de prueba de hipótesis.
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones.
Ho; = 50 cm/s
H1; 50 cm/s
c
p
$$
c
p
c
c
Es importante recordar que las hipótesis siempre son proposiciones sobre la población o
distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parámetro de la población especificado en la hipótesis nula se determina en una de tres
maneras diferentes:
1.c Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hipótesis usualmente es determinar si ha
cambiado el valor del parámetro.
2.c Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría
o modelo.
3.c Cuando el valor del parámetro proviene de consideraciones externas, tales como las
especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta
situación, el objetivo usual de la prueba de hipótesis es probar el cumplimiento de
las especificaciones.
Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el
nombre de prueba de hipótesis. Los procedimientos de prueba de hipótesis dependen del
empleo de la información contenida en la muestra aleatoria de la población de interés. Si
esta información es consistente con la hipótesis, se concluye que ésta es verdadera; sin
embargo si esta información es inconsistente con la hipótesis, se concluye que esta es falsa.
Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en particular nunca
puede conocerse con certidumbre, a menos que pueda examinarse a toda la población.
Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es necesario
desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la probabilidad de
llegar a una conclusión equivocada.
La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de
poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
c
p
c
p
c
c
Concepto
Una prueba de hipótesis estadística es una conjetura de una o más poblaciones. Nunca se
sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se
examine la población entera. Esto por su puesto sería impráctico en la mayoría de las
situaciones. En su lugar, se toma una muestra aleatoria de la población de interés y se
utilizan los datos que contiene tal muestra para proporcionar evidencia que confirme o no la
hipótesis. La evidencia de la muestra que es un constante con la hipótesis planteada
conduce a un rechazo de la misma mientras que la evidencia que apoya la hipótesis
conduce a su aceptación.
Por cada tipo de prueba de hipótesis se puede calcular una prueba estadística apropiada.
Esta prueba estadística mide el acercamiento del calor de la muestra (como un promedio) a
la hipótesis nula. La prueba estadística, sigue una distribución estadística bien conocida
(normal, etc.) o se puede desarrollar una distribución para la prueba estadística particular.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en
la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se
puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de
la región de rechazo.
c
p
c
p
c
c
Para que las reglas de decisión sean buenas, deben diseñarse de modo que
minimicen los errores de decisión, y no es una cuestión sencilla, por que para cualquier
tamaño de la muestra, un intento de disminuir un tipo de error suele ir acompañado de un
crecimiento del otro tipo. En la práctica un tipo de error puede ser más grave que el otro, y
debe alcanzarse un compromiso que disminuya el error más grave , la única forma de
disminuir ambos a la vez es aumentar el tamaño de la muestra, que no siempre es posible.
El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera.
También es conocido como ó nivel de significancia.
Si tuviéramos un nivel de confianza del 95% entonces el nivel de significancia sería del
5%. Análogamente si se tiene un nivel de confianza del 90% entonces el nivel de
significancia sería del 10%.
El error tipo II ó error se define como la aceptación de la hipótesis nula cuando ésta es
falsa.
Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que
determinan si la decisión final es correcta o errónea.
1.c Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad
de uno por lo general tiene como resultado un aumento en la probabilidad del otro.
2.c El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I,
siempre se puede reducir al ajustar el o los valores críticos.
3.c Un aumento en el tamaño muestral reducirá
c
p
c
p
c
c
y de forma simultánea.
NIVE DE SIGNIFICÔNCIÔ
c
p
c
p
c
c
En este problema la fabrica de llantas tiene dos turnos de operarios, turno de día y turno
mixto. Se selecciona una muestra aleatoria de 100 llantas producidas por cada turno para
ayudar al gerente a sacar conclusiones de cada una de las siguientes preguntas:
1.-¿ Es la duración promedio de las llantas producidas en el turno de día igual a 25 000
millas?
2.- ¿Es la duración promedio de las llantas producidas en el turno mixto menor de 25 000
millas?
3.-¿ Se revienta más de un 8% de las llantas producidas por el turno de día antes de las
10 000 millas?
En la fábrica de llantas las hipótesis nula y alternativa para el problema se plantearon como
sigue:
'
ȝ = 25 000
'
ȝ 25 000
Dado que ya se tiene la distribución normal, los valores críticos se pueden expresar en
unidades de desviación. Una región de rechazo de 0.25 en cada cola de la distribución
normal, da por resultado un área de .475 entre la media hipotética y el valor crítico. Si se
busca está área en la distribución normal, se encuentra que los valores críticos que dividen
las regiones de rechazo y no rechazo son + 1.96 y - 1.96
c
p
c
p
c
c
o si Z < - 1.96
=
Para una muestra de 100, si se selecciona un nivel de significancía de .05, los valores
críticos de la distribución con 100-1= 99 grados de libertad se puede obtener como se
indica en la siguiente tabla:
c
p
c
p
c
c
como esta prueba de dos colas, la región de rechazo de .05 se vuelve a dividir en dos partes
iguales de .025 cada una. Con el uso de las tablas para , los valores críticos son ±1.984 y
+1.984. la regla para la decisión es:
Rechazar Ho si >+1.984
( - 1.984
De lo contrario, no rechazar Ho
los resultados de la muestra para el turno de día fueron =25 430 millas, =4 000 millas
y = 100. Puesto que se esta probando si la media es diferente a 25 000 millas, se tiene
con la ecuación
c
p
!
c
p
c
c
= = + 1.075
Dado que = 1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza ' .
Por ello, la de cisión de no rechazar la hipótesis nula Ho. En conclusión es que la duración
promedio de las llantas es 25 000 millas. A fin de tener en cuenta la posibilidad de un error
de tipo II , este enunciado se puede redactar como ³no hay pruebas de que la duración
promedio de las llantas sea diferente a 25 000 millas en las llantas producidas en el turno de
día´.
El concepto de prueba de hipótesis se puede utilizar para probar hipótesis en relación con
datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fabrica de llantas
quería determinar la proporción de llantas que se reventaban antes de 10,000 millas. Este es
un ejemplo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a
la proporción de los valores que tienen una característica particular.
c
p
"
c
p
c
c
En donde
= =
Ahora se determinará si el proceso funciona correctamente para las llantas producidas para
el turno de día. Los resultados del turno de día índican que cinco llantas en una muestra de
100 se reventaron antes de 10,000 millas para este problema, si se selecciona un nivel de
significancía de .05, las regiones de rechazo y no rechazo se establecerían como a
continuación se muestra:
= = .05
y entonces,
= = = = -1.107
c
p
#
c
p
c
c
EJEMP O 1: Se afirma que, de todas las familias que salen de Cumana por lo menos el
30 % se mudan a Maracaibo. Si una muestra de 600 mudanzas tomada al azar de los
registros de la Alcaldía de Cumana revela que de los permisos de mudanza autorizados 153
fueron para Maracaibo, pruebe la hipótesis nula = 0.30 contra la hipótesis alternativa <
30 con un nivel de significancia del 1 %.
t 153
800,.. 0.255,.. 0.30,.. 0.70,..! 2.33,. 153.
600
ipótesis:
'0 : 0.30
' 1 : c 0.30
O también Ôplicando:
t
0.255 0.300 0.045 0.045
! ! 2.41
. 0.3 0.7 0.00035 0.0187
600
c
p
$
c
p
c
c
D en donde 2.41 cae fuera del área de aceptación, por lo tanto, se cumple que
1 : c 0.30 , es decir, menos del 30 % de las familias que salen de Cumana, se mudan a
Maracaibo.
PARA LA MEDIA
"##"#"##"$%&' '"'%"
("#) ' # *"##"$
% '""#"# #
1) Ho: m = m0
H1: m > m0
2) Ho: m = m0
H1: m < m0
3) Ho: m = m0
H1: m ¹ m0
Las pruebas de hipótesis para la media se basan en el estadístico dado por la media muestral
cuya distribución tiende a la distribución normal (m, s
Cuando la varianza s
"##"$) '-)-"-#&'
# ./"##$ '%# "#
" #% *'
Para el caso de las hipótesis Ho: m = m0 contra H1: m > m0 vimos, al analizar las mejores
pruebas, que la mejor región crítica de tamaño a consistía en rechazar H0 si la media
c
p
c
p
c
c
muestral era mayor o igual que una constante c dada por . Por lo tanto, una vez tomada la
muestra y obtenidos los valores x1, x2, , xn, se calcula la media muestral dada por:
Para el caso de las hipótesis Ho: m = m0 contra H1: m < m0 la mejor región crítica de
tamaño a consiste en rechazar H0 si la media muestral es menor o igual que una constante c
dada por . Por lo tanto, una vez tomada la muestra y obtenidos los valores x1, x2, , xn, se
calcula la media muestral , y los criterios de decisión sería los siguientes:
Por último, si las hipótesis fueran Ho:m = m0 contra H1:m ¹ m0 la mejor región crítica de
tamaño a (aunque no es uniformemente más potente como en el caso de las dos anteriores)
consiste en rechazar H0 si la media muestral es menor o igual que una constante c1 ó
mayor igual que otra constante c2. Por lo tanto, una vez tomada la muestra y obtenidos los
valores x1, x2, , xn, se calcula la media muestral , y los criterios de decisión serían los
siguientes:
Ejemplo. Un inspector de pesos y medidas visita una planta de empacado para verificar que
el peso neto de las cajas sea el indicado en la etiqueta. El gerente de la planta asegura al
c
p
c
p
c
c
inspector que el peso promedio de cada caja es de 750 gramos con una desviación estándar
de 5 gr. El inspector selecciona, al azar, 100 cajas y encuentra que el peso promedio es de
748 gr. Bajo estas condiciones y usando un nivel de significancia de 0.05,¿Qué actitud debe
tomar el inspector?.
Solución. Este problema lo podemos plantear como una prueba de hipótesis del siguiente
tipo:
1) Ho: m = m0 = 750
con n = 100, a = 0.05, s = 5 gramos. Se tiene que Z0.05 = 1.645. Por lo tanto, la región
crítica está dada por = 750 - 1.645 x 5/10 =749.18. Por lo tanto como la media muestral es
748 gramos, se rechaza la hipótesis de que el promedio de cada caja sea 750 gramos. Por lo
tanto, deben tomarse las medias necesarias para corregir esta situación, que va en contra de
los intereses del consumidor. Usando los otros criterios de aceptación tenemos que Z = -
4.0 y el valor P es aproximadamente cero (P = 0.0).
Si tenemos las hipótesis Ho:m = m0 contra H1:m > m0 la mejor región crítica de tamaño a
consiste en rechazar H0 si la media muestral es mayor o igual que la constante c, que en
este caso está dada por . Por lo tanto, una vez tomada la muestra y obtenidos los valores x1,
x2, , xn, se calculan la media muestral y la varianza muestral s
#)#
Para el caso de las hipótesis Ho: m = m0 contra H1: m < m0 la mejor región crítica de
tamaño a consiste en rechazar H0 si la media muestral es menor o igual que una constante c
c
p
c
p
c
c
dada por . Por lo tanto, una vez tomada la muestra y obtenidos los valores x1, x2, , xn, se
calculan la media muestral y la varianza muestral S
Por último, si las hipótesis fueran Ho:m = m0 contra H1:m ¹ m0 la mejor región crítica de
tamaño a (aunque no es uniformemente más potente como en el caso de las dos anteriores)
consiste en rechazar H0 si la media muestral es menor o igual que una constante c1 ó
mayor igual que otra constante c2. Por lo tanto, una vez tomada la muestra y obtenidos los
valores x1, x2, , xn, se calcula la media muestral , y los criterios de decisión serían los
siguientes:
Ejemplo. Un modelo físico sugiere que el aumento medio de temperatura en el agua usada
como enfriador en una cámara de un compresor no debería ser mayor de 5°C. Los
aumentos de temperatura en el refrigerante medidos en 8 períodos de funcionamiento del
compresor fueron de 6.4, 4.3, 5.7, 4.9, 6.5, 5.9, 6.4 y 5.1 grados centígrados. Con un nivel
de significancia del 5%, cree Usted que los datos contradicen la información del modelo
físico?
Solución. Este problema lo podemos plantear como una prueba de hipótesis del siguiente
tipo:
con n = 8, a = 0.05. La hipótesis nula se plantea como menor o igual a m0, que es una
hipótesis compuesta. Sin embargo, para la realización de la prueba, se tomará el máximo
aumento permisible en la temperatura que sería m = m0 = 5, con lo cual la hipótesis se
convierte en una hipótesis simple. Se tiene que: = 5.65, s
! $!
$$!!
0# ##$ ," ("
)# 0# ##"##' ') #
# " ("# $ "-*-)&''#) ##
) ' , ##/ # $/# -)
&'%#
c
p
c
p
c
c
c
p
c
p
c
c
c
p
c
p
c
c
c
p
!
c
p
c
c
c
p
"
c
p
c
c
Es considerada como una prueba no paramétrica que mide la discrepancia entre una
distribución observada y otra teórica, indicando en qué medida las diferencias existentes
entre ambas, de haberlas, se deben al azar.
2
2
1
2 2
Se rechaza '0 cuando ; u 1 . En caso contrario se acepta.
Donde representa el valor proporcionado por las tablas, según el nivel de significación
elegido.
Cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están ambas
distribuciones.
Ejemplo:
Si un ingeniero de control de calidad toma una muestra de 10 neumáticos que salen de una
línea de ensamblaje y él desea verificar sobre la base de los datos que siguen, los números
c
p
#
c
p
c
c
de llantas con defectos observadas en 200 días, si es cierto que el 5% de todos los
neumáticos tienen defecto; es
Número de unidades con defecto Número de muestras decir, si el muestrea una
población binomial con n = 10 y
0 138
= 0.05
1 53
2 ó más 9
Establecer la hipótesis
c
p
$
c
p
c
c
2
2
1
g,l = k- m ± 1 = (3 ± 0- 1) =2
5.99
2
2
1
c
p
c
p
c
c
Para poder calcular las frecuencias esperadas tenemos que calcular las
probabilidades utilizaremos la formula de la binomial
( ) O ( ) (1 )
donde = 10 = 0.05
( 0) z
10
0 0.05 0 ( 1 0.05) 10 0
= 0.599
(1) z
10
1 0.051 (1 0.05)10 1 = 0 .315
Ahora ya
podemos
encontrar las
frecuencias esperadas:
c
p
c
p
c
c
2 ó más 9 17,2
Como 8.26 es mayor que 5.99, se rechaza la hipótesis nula con un nivel de significancia
de 0.05.
Conclusión
c
p
c
p
c
c
Probar si los datos de los errores se ajustan a una distribución de Poisson. Use p = 0.05.
( ( )2
2
gl. = 9-1-1=7
02,05 ;7 14,067
c
p
c
p
c
c
Región de rechazo = ç 2
| 2
14,067
Para poder calcular las frecuencias esperadas tenemos que calcular las probabilidades
utilizaremos la formula de la distribución de Poisson:
O O
( ; O )
!
Conclusión: La población se comporta como una distribución de Poisson con media 3,04
Ejemplo 3.
c
p
c
p
c
c
Hipótesis nula: de que los porcentajes del semestre pasado son los mismos que en el
semestre antepasado.
u2 = 27,178
Como tenemos 4 categorías y ningún parámetro estimado los grados de libertad serán: 4-0-
1= 3
u 02,05 ;3 12,84
Problema 4.-
c
p
c
p
c
c
Problema 5.-
Con base en los datos muestrales la hipótesis nula se rechaza o no rechaza. Nunca se
puede aceptar la hipótesis nula como verdadera para demostrar sin lugar a dudas que
la hipótesis es verdadera se tendría que conocer el parámetro de la población. El no
rechazo solamente significa que la evidencia muestral no es lo suficientemente
fuerte como para llevar a su rechazo.
c
p
!
c
p
c
c
Ho: ' = 16
Ha: ' 16
c
p
"
c
p
c
c
Z, t, Å2, F
Por ejemplo en la prueba de hipótesis para la media, la estadística de prueba Z se
calcula por:
â
El nivel de significancia se define con la letra griega alfa ( ).Se le llama también
nivel de riesgo.
No hay un nivel de significancia que se aplique a todas las pruebas. Se toma la
decisión de utilizar los niveles 0.05 ( que con frecuencia se conoce como un nivel
del 5%), .01, 0.10, o cualquiera entre 0 y 1 a elección de la persona que realiza la
prueba.
La zona de rechazo son los valores de la estadística de prueba para los cuales se
rechaza la hipótesis nula. La regla de decisión en la prueba de hipótesis, puede
establecerse de tres maneras:
( conocida ó 30 )
2
c
p
#
c
p
c
c
c1c,c"2c c c
c+-$c c cc
c c5
c
c c
c
c
cc c3c7c'".2c c1c,c"2c c c
c+-$c cccc
c c5
c
c c
c
c
cc c3c8c
ëc (c
3c c (c 3c c (c
#.-c
#/0-c #/0-c
)*+c,c##+-c )*+c,c##+-c
1c,c"2c
ccc'".2c #c ".2c
p c
c.-$c cc c5
c c
c
c
c cc c
6c".2c cc( c
c c c
c
p
$
c
p
c
c
c
p
c
p
c
c
c
p
c
p
c
c
Tabla Z:
c
p
c