Estadistica Inferencial

SPSS Instituto Superior “Hipólito Unanue”
SPSS
Inferencia Estadística
1. Inferencia.
La principal utilidad de la estadística considerada como herramienta de ayuda en las

ciencias biosanitarias consiste en extraer conclusiones a partir de unas hipótesis
previas realizadas sobre una muestra representativa y accesible de la población. En
general, las respuestas que se buscan se desea aplicarlas sobre toda la población y
ésta no es accesible, por lo que hay que trabajar con una muestra representativa de
la misma. A los elementos constituyentes de esa muestra serán a los que se aplicarán
los tests estadísticos que permitirán obtener respuestas y conclusiones extrapolables
a la población general. Debido a que se trabaja con una muestra, las conclusiones
que se extraigan y que se proyectaran sobre la población estarán afectadas por una
cierta “imprecisión” y siempre, aunque sea con una baja probabilidad, se correrá un
cierto riesgo de alcanzar una conclusión errónea.
La estadística inferencial se propone probar o rechazar una hipótesis formulada

previamente. Esta hipótesis, en general, se formula en el sentido de que “no hay
diferencia” entre lo que se está estudiando sea la diferencia entre dos medias, la
asociación entre variables cualitativas o cuantitativas, la distribución respecto a una
gaussiana, etc. Es la denominada hipótesis nula (H0). Los tests estadísticos se
realizan con el fin de aceptar o rechazar esta H0 (si se rechaza H0 lo que se hace es
aceptar la hipótesis alternativa, H1: ”si hay diferencia” ).
Los tests estadísticos pueden clasificarse en paramétricos y no paramétricos. Si se

realizan tests estadísticos paramétricos, que en principio son los más aconsejables,
habrá que comprobar el cumplimiento, principalmente, de dos hipótesis además de la
de muestreo aleatorio:
• Gaussianidad de cada una de las variables cuantitativas implicadas

• Homocedasticidad o igualdad de las varianzas entre aquellos conjuntos de datos
pertenecientes a la misma variable medidos en grupos diferentes (por ejemplo, la
edad medida en cuatro grupos de edad). La gaussianidad se analiza mediante el
test de Kolmogorov-Smirnov o bien con los coeficientes de sesgo y apuntamiento.
En este caso H0 es: “la distribución estudiada no se aparta de la gaussiana de
forma significativa”.
Los tests estadísticos evalúan el error tipo I (o error α) que se comete al rechazar H0
cuando esta es cierta (Esto es, decir que hay diferencias cuando no las hay). Es el
valor habitualmente designado como p (y que en SPSS se especifica bajo el epígrafe:
Sig.). Habitualmente se considera que, para poder decir que se rechaza H0, p ha de
ser inferior a 0,05; esto significa que el mayor riesgo a equivocarse que se está
dispuesto a asumir diciendo que hay diferencia (en este caso respecto de la
gaussiana) cuando realmente no la había es del 5 %; o sea de 1 en 20.
Se denomina error tipo II (o error β) al error que se comete al aceptar H0 cuando es
falsa (esto es, que habiendo diferencias no son detectadas).
-1-
La homocedasticidad puede estudiarse en cada test paramétrico que se solicite por
medio del test de Levene ( H0: todas las varianzas que se comparan son similares). Si
al hacer el test de Levene el valor de p, o sea el de Sig en SPSS, es < 0,05 se
rechazará la H0 de que no había diferencia entre las varianzas y se aceptará la
hipótesis alternativa de que hay diferencia entre las varianzas estudiadas).
Este test se solicita en SPSS en Analizar / Estadísticos Descriptivos / Explorar.
Se mostrara la siguiente ventana.
Colocando la variable cuantitativa en la ventana “Lista de Dependientes” y la

cualitativa (la variable que separa los grupos en los que se desea investigar la
homogeneidad de las varianzas) en “Lista de Factores”.
Después clic en el botón “Gráficos”

y seleccionar “Ninguna” dentro del
recuadro “Dispersión versus nivel
con prueba de Levene”.
Cuando se comparan dos series de

datos (estadística bivariante)
pueden darse tres casos:
-2-
a) Una variable cuantitativa y la otra cualitativa, esta última con dos categorías.
b) Dos variables cualitativas.
c) Dos variables cuantitativas.
2. Una variable cuantitativa y la otra cualitativa con dos categorías.
Por ejemplo, se desea saber si la media de nivel de ingresos (variable cuantitativa) en

hombres y mujeres es similar. La variable cuantitativa es el nivel de ingresos pues, en
principio, puede tomar cualquier valor; tan sólo está limitado por la resolución de los
instrumentos de medida. La variable cualitativa es el sexo, con dos categorías: hombre
y mujer (que pueden codificarse como “0” y “1”).
Si el muestreo ha sido aleatorio y se ha comprobado que la distribución de la variable

cuantitativa es gaussiana en los dos grupos, se puede efectuar el test t de Student
para muestras independientes:
Menú Analizar / Comparar medias y luego la opción de Prueba T para muestras

independientes.
Se mostrara la siguiente ventana.

En el recuadro superior Variables de prueba se introduce la variable cuantitativa y en
Variables de Agrupación, la variable cualitativa.
-3-
En ese momento se activa el botón Definir Grupos
donde se introducen los códigos de codificación de
los grupos a analizar (en el ejemplo anterior:
Group1=0 y Group 2=1). Posteriormente, se pulsa
Continue y OK.
En la pantalla de resultados tras la descriptiva de la

serie cuantitativa en cada grupo se muestra el test de
Levene de igualdad de varianzas.
Si p>0,05 (no se rechaza H0) quiere decir que las

varianzas son similares y se lee en la línea de varianzas iguales. En caso contrario,
se lee en la línea de varianzas no iguales (SPSS incluye una modificación del test t de
Student (test paramétrico) para que pueda emplearse aun cuando no se cumple una
de las hipótesis de aplicación de la misma: la de homocedasticidad o igualdad de
varianzas. El valor de p (Sig.) Inferior a 0,05 fue establecido como significativo por
Fisher como el valor más conveniente en investigación en ciencias biomédicas pero
no es inflexible y en algunos casos puede tomarse 0,1 como límite de significación.
Existe un caso especial que es cuando cada sujeto de la investigación es medido en
dos momentos diferentes y se quiere saber si la media de una variable determinada
es diferente en los dos momentos considerados. En este caso, tras la comprobación
de la hipótesis de gaussianidad en cada una de las series se ha de realizar un test t
de Student para muestras emparejadas.
3. Estimación de parámetros.
Consiste en aproximar el valor desconocido de un parámetro mediante el valor del

estadístico.
 Parámetro: es una medida de resumen que describe una característica de toda

una población.
 Estadístico: es una medida de resumen que describe una característica de una
sola muestra de la población.
Un parámetro se puede estimar usando dos métodos de estimación: estimación

puntual y estimación mediante un intervalo.
Estimación puntual.
Este método de estimación consiste en asignar al parámetro desconocido el valor del

estadístico calculado en base a una muestra.
Parámetros Estadísticos
µ: Media poblacional X: Media muestral
ó: Desviación estándar poblacional S: Desviación estándar de muestra
ó 2: Varianza poblacional S2: Varianza muestral
¶:Proporción poblacional P: Proporción muestral
µ1 - µ2: Diferencia de Medias
x1-x2: Diferencia de medias muéstrales
Poblacionales
¶1-¶2: Diferencia de proporciones p1-p2: Diferencia de proporciones
Poblacionales muéstrales
-4-
El programa de SPSS solo realiza estimaciones mediante intervalos de confianza de
la Medida Poblacional y diferencia de medias poblacionales, también es posible
realizar estimaciones de intervalos de confianza para una y dos proporciones,
utilizando la opción de prueba T para una muestra y dos muestras, (como se sabe la
prueba T es indicado solo para realizar inferencia acerca de una o dos medias
poblacionales, pero si las muestras son grandes, el valor de la prueba T se aproxima
a la prueba de Z es la prueba indicada tanto para medias como para proporciones)
pero esto solo es recomendable para muestras extremadamente grandes, de tamaño
mayores o iguales a 1000, para muestras menores se recomienda utilizar otros
paquetes estadísticos en cuanto a la estimación mediante un intervalo de una o dos
proporciones.
Estimación de una media poblacional mediante un intervalo de confianza.
Casos:
Caso 1: si se conoce la desviación estándar poblacional (), se debe usar la distribución
del estadístico Z.
Caso 2: si no conoce la desviación estándar poblacional (), se debe usar la distribución

del estadístico t.
Ejercicio 6.1.
Se desea estimar el verdadero ingreso promedio del estudiante con un nivel de

confianza del 98%.
Como no se conoce la desviación estándar poblacional se usa el estadístico t student,

para ellos.
Ir al menú analizar, comparar medias, prueba t para una muestra.
En el recuadro de dialogo contrastar variables: nivel de ingresos. Y en Valor de prueba

ingresar el valor de 0.
-5-
Pulsar botón opciones y digitar 98% y luego clic en continuar y aceptar.
En el visor de resultados se tiene la siguiente tabla.
A un nivel de confianza del 98%, se tima que la media poblacional del ingreso por
estudiante se encuentra contenido entre 1280,35 y 16663,77.
Estimación de diferencia de medias poblacionales mediante un intervalo de

confianza.
Ejemplo 6.2.
Se desea estimar la diferencia entre los ingresos promedios de hombres y mujeres

mediante un intervalo del 98% de confianza.
Ir al menú analizar, comparar medias, prueba t para muestras independientes.
En el cuadro de dialogo de Prueba T para muestras independientes.
En la opción de contrastar variables pasar la variable de nivel de ingresos.
En la opción de variable de agrupación arrastrar la variable Sexo.
-6-
Luego clic en el botón de opciones y digitar 98%.
Clic en el botón de continuar.
Ahora clic en el botón de Definir Grupos y definir los

grupos que se están comparando: 1: Masculino, 2:
Femenino, luego clic en continuar y luego en Aceptar.
Se obtiene la siguiente tabla.
A un nivel de confianza del 98 % se estima que la verdadera diferencia de eingresos

promedios entre hombres y mujeres se encuentra el contenido entre -428,4 y 389,868
(se utiliza el primer intervalo estimado, debido al que el sig correspondiente a la prueba
-7-
de levente = 0.422 > 0.02, por lo que concluye que las varianzas son homogéneas).
Como el intervalo estimado contiene el cero, concluimos que los ingresos promedios
de hombres y mujeres son similares.
Prueba de Hipótesis Acerca de una Media poblacional
Para realizar un contraste acerca de una media poblacional se dispone de los

estadísticos z y t student, los casos en los que se emplean cualquiera de estos
estadísticos se muestran a continuación.
Caso 1: si se conoce la desviación estándar poblacional.
Se emplea el Estadístico z cuya fórmula es:
Caso 2: si no se conoce la desviación estándar poblacional
Se emplea el Estadístico y student cuya fórmula es.
En caso no se conozca la desviación estándar poblacional y la muestra sea grande

(n>=30), se acostumbra aproximar el estadístico t al estadístico z, es decir se emplea
es estadístico z, en estos casos no tomaremos en cuenta el tamaño de muestra, si
solo se usara el estadístico z en caso se conozca la desviación estándar poblacional.
Ejemplo 6.3
Un investigador afirma que el consumo mensual de promedio de cerveza es mayor a

15 litros. Para comprobar su afirmación, selecciona una muestra de 50 personas. En
base a los estudios anteriores se determinó que la desviación estándar del consumo
mensual de cerveza es 3 litros. Pruebe la afirmación del investigador con un nivel de
significación 5%.
Ho: µ<=15
H1: µ>15
a = 0.05
Estadístico de prueba
Como se conoce la desviación estándar poblacional se usara el estadístico Z.
Hallamos el valor de la media muestral usando el SPSS:
-8-
Menú Analizar, estadísticos descriptivos y clic en la opción de frecuencias.
Seleccionamos la variable de litros de cerveza/mes.
Clic en la opción Estadísticos y seleccionamos Media, continuar y OK.
Clic en el botón de continuar y luego clic en el botón de Aceptar.
Calculo del estadístico de prueba.
Cálculo del valor critico Z usando SPSS:
Eligiendo la opción de Transformar, calcular variable, en la opción de Grupo de

Funciones seleccionar la opción de GL inversos, y ne la categoría de Funciones y
variables espéciales seleccionar la opción de ldf. Normal la probabilidad acumulada
p es igual a 0.95, la media cero y desviación estándar igual a 1, colocamos un nombre
cualquiera en variable de destino y aceptar se obtiene:
-9-
Valor critico Z=1.645.
Como el valor del estadístico Z igual a 2.216 es mayor a 1.645, se rechaza Ho.
A un nivel de significación 5%, existen suficientes evidencias para afirmar que el

consumo mensual promedio de cerveza es mayor de 15 litros.
Otra Forma: 1.645
Regla de decisión:
Si sig < 0.05, se rechaza Ho.

Si sig > 0.05, no se rechaza Ho.
Calculo de P-valor con el SPSS.
Eligiendo la opción de transformar, calcular la variable, en la opción de grupo de

Funciones FDA y FDA no centradas, y en funciones y variables especiales la opcion
de cdf.Normal el valor de c es igual al valor del estadístico z= 2.216, la media cero y
desviación estándar igual a 1, colocamos un nombre cualquiera en variable de destino
y aceptar se obtiene:
-10-
Se obtiene que sig es igual a 0.0133, como es inferior a 0.05, se rechaza la Hipótesis
nula.
Ejemplo 6.4.
Un investigador afirma que el ingreso por persona promedio es inferior a 1000 nuevos
soles.
Para comprobar su afirmación, selecciona una muestra de 50 personas. Pruebe la
afirmación del investigador con un nivel de significación 2%.
Ho: µ >= 1000

H1: µ < 1000
a = 0.02
Estadístico de prueba.
Como no se conoce la desviación estándar poblacional, se usara el estadístico T.
Ir al menú Analizar y clic en comparar medias, prueba t para una muestra.
En el cuadro de dialogo Variables de Prueba ingresar la variable de Nivel de Ingresos

y en la opción de Valor de prueba ingresar el número 15.
-11-
Clic en el botón de opciones y digitar 98%, luego clic en continuar y luego clic en
Aceptar.
Teniendo el siguiente resultado.
Calculo del P-Valor para la prueba T student en base a la salida SPSS.
Los resultados del programa SPSS para la prueba de T student arrojan una valor sig,
(P-Valor), valido solo para una prueba bilateral. En la tabla se muestran los cálculos
del p-valor para la prueba unilateral derecha e izquierda en función del p-valor bilateral
arrojado por el programa.
Hipótesis Alternativa Signo estadístico t P-value

 +o- Sig (bilateral)
> positivo P=sig/2
> negativo P=1-sig/2
< positivo P=1-sig/2
< negativo P=sig/2
-12-
En nuestro caso el signo de la hipótesis alternativa es “<” y el signo del estasitico t es
positivo por lo tanto el p-value p es igual a 1-0.00/2 = 1 < 0.05.
No se rechaza la hipótesis nula, a un nivel de significación del 5% no existen

evidencias para afirmar que el ingreso promedio es inferior a 1000.
Prueba de Hipótesis acerca una proporción poblacional.
Para el caso de contraste acerca de una proporción poblacional se usa es estadístico

z cuya fórmula es:
Prueba de Hipótesis acerca de la diferencia de dos medias poblacionales.
Caso 1: si se conocen las varianzas de ambas poblacionales
Estadístico de Prueba.
Caso 2: si no se conocen las varianzas de ambas poblacional pero son similares
Estadístico de prueba.
Que tiene una distribución t student con n1+n2-2 grados de libertad.
Caso 3: si no se conocen las varianzas de ambas poblaciones pero son diferentes
Estadístico de Prueba.
-13-
Ejemplo 6.6
Pruebe el nivel de ingresos de las personas con educación secundaria es superior al

nivel de ingresos con educación primaria, use un nivel de significación 5%.
Ir al menú de analizar luego comparar medias, ahora seleccionar la opción de prueba

T para muestras independientes.
En la ventana que se muestra en la opción de Variables para contrastar seleccionar

la variable de Nivel de Ingresos y en variables de agrupación la variable de Grado de
instrucción.
Clic en el botón de opciones e ingresar el valor de 95 %.
Luego clic en el botón de definir grupos y en la ventana que se muestra ingresar el

valor de 1: Primaria, 2: Secundaria.
-14-
Clic en el botón de continuar y luego clic en el botón de Aceptar.
Se tendrá en siguiente resultados.
Prueba de muestras independientes
Prueba de
Levene de
calidad de
varianzas prueba t para la igualdad de medias
95% de intervalo de
Sig. confianza de la
(bilater Diferencia de Diferencia de diferencia
F Sig. t gl al) medias error estándar Inferior Superior
Nivel de ingresos Se
asumen
,761 ,391 1,710 26 ,099 373,758 218,580 -75,540 823,055
varianza
s iguales
No se
asumen 6,9
1,513 ,175 373,758 247,003 -211,827 959,342
varianza 12
s iguales
En primer lugar debemos determinar estadísticamente si es que las varianzas

poblaconales so similares o no:
Prueba de homogfeneidad de varianzas.
Ho: ó21 = ó 22
H1: ó21 ≠ ó22
a=0.05
Sig. = 0.391 > 0.05, no se rechaza Ho.
Se concluye que las varianzas son iguales.
-15-
Prueba de comparación de los ingresos promedios.
Ho:U2 <= U1
H1: U2 > U1
a=0.05
sig= 0.099/2=0.0495 < 0.05, se rechaza Ho, a un nivel de significación 5% existen
suficientes evidencias para afirmar que el ingreso mensual promedio de las personas
con educación secundaria es mayor que el de las personas con educación primaria.
Ejemplo 6.7
Pruebe si el porcentaje de mujeres que tienen Hábito de fumar es diferente al

porcentaje de hombres que tienen hábito de fumar. Use un nivel de significación de
3%.
Para calcular los porcentajes muéstrales de hombres y mujeres que tienen el hábito
de fumar.
Ir al menú de analizar, estadísticas descriptivas, y tablas de contingencia.
En la opción de Filas agregar la variable de Habito de Fumar, en la opción de

Columnas la variable de Sexo.
Luego clic en el botón de casillas. En la opción de porcentaje seleccionar la opción de

Columna.
-16-
Clic en el botón de continuar y luego clic en el botón de aceptar.
Se obtiene la siguiente tabla.
p1= 0.667, p2=0.647
11 + 22
𝑝= = 0.66
33 + 27
0.667 − 0.647
Z= = 0.141
√0.66 ∗ (1 − 0.66) ∗ ( 1 + 1
33 17
Como el valor del estadístico z igual a 0.141 está entre -1.96 y 1.96, no se rechaza la
hipótesis nula, a un nivel de significación 5% no existen evidencias de que existan
diferencias significativas ente los porcentajes de hombres y mujeres que tienen el
habito de fumar.
4. Prueba T para muestras relacionadas.
La prueba T para dos muestras relacionadas permite contrastar hipótesis referidas a

la diferencia entre dos medias relacionadas.
Ahora disponemos de una población de diferencias con media µD obtenida al respetar

las puntuaciones del mismo grupo de casos de dos variables diferentes o en la misma
variable media en dos momento diferentes (de ahí que hablemos de muestras
relacionadas). De esa población de diferencias extraemos una muestra aleatoria de
tamaño n y utilizamos la media de esa n diferencias para contrastar la hipótesis de
que la media µD de la población de diferencias vale cero.
Desde el punto de vista estadístico, este contraste es idéntico al presentado en el

apartado Prueba T para muestra. La única diferencia existente entre ambos contrastes
es que allí tuvimos una muestra de puntuaciones obtenidas al medir una sola variable
y ahora tenemos dos muestras relacionadas (o una muestra de pares de
puntuaciones) que convertimos en una sola muestra de diferencias restando las
puntuaciones de cada par.
Al igual que antes, para que el valor T ajuste apropiadamente al modelo de distribución
de probabilidad t de Student, es necesario que la población de diferencias se normal.
No obstante, con tamaños muéstrales grandes el ajuste del estadístico T a la
-17-
distribución t de Student es lo suficiente bueno incluso con poblaciones originales
alejadas de la normalidad.
Ejemplo 6.8
Para este ejemplo abrir el archivo dieta.sav
Se desea determinar si la dieta recomendad por un conocido nutricionista es eficaz

para la reducción de peso. Se aplicó esta dieta a un grupo de 47 personas durante un
periodo de 6 meses obteniéndose información tanto del peso antes de la dieta y
después de aplicar la dieta.
En el cuadro de dialogo Prueba T para muestras relacionadas.
En la ventana que se muestra seleccionar las variables peso inicial y peso final y
trasladarlas a la lista de variables emparejadas.
Clic en el botón de Aceptar y se muestran las siguientes tablas.
Se observa que el peso promedio de las personas después de la dieta es menor que
el peso promedio al antes de la dieta, con la prueba t student comprobaremos si esa
diferencia es significativa.
La tabla ofrece el coeficiente de correlación de Pearson ente ambas variables. La

interpretación de este indicador lo veremos más adelante.
-18-
La tabla incluye en la primera mitad teres estadísticos referidos a las diferencias ente
cada par de puntuaciones, la media, la desviación típica y el error típico de la media.
La siguiente columna contiene el intervalo de confianza para la diferencia entre las

medias: podemos estimar con una confianza del 95 por ciento, que la verdadera
diferencia entre las medias de los pesos antes de la dieta y después de la dieta se
encuentra ente 8,10192 y 10,62149 kilogramos. La segunda mitad de la tabla informa
sobre el valor del estadístico t, sus grados de libertad (gl) y el nivel crítico bilateral (Sig.
bilateral). El valor del nivel crítico 0.000 es menor de 0.05, por lo que podemos
rechazar la hipótesis de igualdad de medias y concluimos que el peso medio después
de la dieta es inferior que el peso medio antes de la dieta, es decir la dieta es eficaz
en la reducción del peso.
Ejemplo 6.9
Abrir archivo peso.sav Supongamos que estamos interesados en averiguar si el peso

promedio de los recién nacidos es igual a 2500 gramos. Para comprobarlo
seleccionamos una muestra de 50 recién nacidos. Asumiendo que el peso de los
recién nacidos sigue una distribución normal. La prueba de t de Student sobre una
muestra se utiliza para contrastar la hipótesis nula de la que la muestra procede de
una población en el que el peso promedio de los recién nacidos es a los más 2500
gramos.
Ho: µ <= 2500

Ho: µ > 2500
En el cuadro de dialogo de Prueba T para una muestra (Menú analizar / Comparar

medias / Prueba T para un muestra), seleccionar las variables peso y trasladarla a
la lista Contrastar variables.
Introducción el valor 2500 en el cuadro de texto Valor de Prueba.
-19-
Aceptando estos valores, el visor de resultados ofrece la información que muestran
las siguientes tablas.
La tabla incluye el número de casos validos sobre el que se basa los cálculos (346),
la media de la variable peso (3299,9364), la desviación estándar (150,20744) y el error
típico de la media (8,07520)
La tabla ofrece un resumen de la prueba T encabezado con una línea que nos
recuerda cual es el valor propuesto para la media poblacional (Valor de prueba =
2500). Las primeras columnas contiene el valor del estadístico (t=99,061), sus grados
de libertad (gl = 345) y el nivel crítico bilateral (Significación Bilateral = 0.000). El nivel
crítico muestra el grado de compatibilidad ente el valor poblacional propuesto y la
información muestral disponible: si el nivel crítico es pequeño (generalmente menor
que 0.05), concluiremos que los datos se muestran incompatibles con la hipótesis de
que el verdadero valor de la media poblacional es el propuesto. En nuestro ejemplo,
el nivel crítico vale 0.000, puesto que es menor a 0.05 rechazamos la Ho, se concluye
que el peso promedio de recién nacido es diferente de 2500 gramos.
La siguiente columna de la tabla contiene la diferencia entre la media muestral y el

valor de prueba (Diferencia de medias = 799.93642). Esta diferencia es el numerador
de la prueba T. Y a continuación aparecen los límites inferior (784.0536) y superior
(815.96) del intervalo de confianza (calculado al 95 por ciento) para la diferencia entre
la media muestral y el valor de prueba. Si los límites incluyen el valor cero (como no
ocurre en nuestro ejemplo), podemos concluir que los datos muestrales son
compatibles con el valor poblacional propuesto y, en consecuencia, mantener Ho; si
los limites no incluye el valor cero, debemos concluir que los datos son incompatibles
con el valor propuesto y, consecuente, rechazar Ho.
Ejemplo 6.10
Con el archivo de peso1.sav

Supongamos que estamos interesados en probar si existen diferencias significativas
entre los pesos promedios de recién nacidos de sexo masculino y femenino
En el cuadro de dialogo Prueba T para una muestra. (Menú analizar / Comparar

medias / Prueba T para un muestra).
-20-
Trasladar la variable peso a la lista de Variables de prueba y la variable de sexo a la
opción de Variable de agrupación.
Luego clic en el botón de Definir Grupos e ingresar los valores de 1 y 2 en Grupo 1 y

Grupo 2.
Clic en el botón de continuar y clic en el botón de Aceptar. Aceptando estas

condiciones el visor muestra los siguientes resultados.
Se observa que el peso de los recién nacidos de sexo femenino superan ligeramente
al peso promedio de los recién nacidos de sexo masculino. Para probar si esa
diferencia es estadísticamente significativa procedemos a realizar la prueba de
hipótesis correspondiente; pero antes de realizar la prueba t para muestras
independientes se debe de comprobar si es que las varianzas son homogéneas o no
y para ello realizamos la prueba de homogeneidad de varianzas de levene.
-21-
Prueba de muestras independientes
Prueba de Levene
de calidad de
varianzas prueba t para la igualdad de medias
95% de intervalo de
Diferencia confianza de la
Sig. Diferencia de error diferencia
F Sig. t gl (bilateral) de medias estándar Inferior Superior
Peso recién Se asumen

nacido varianzas ,664 ,419 -,251 48 ,803 -42,201 168,353 -380,697 296,295
iguales
No se
asumen
-,253 46,580 ,801 -42,201 166,871 -377,983 293,580
varianzas
iguales
La tabla ofrece en primer lugar el contraste de Levene (F) sobre homogeneidad o

igualdad de varianzas, el resultado de este contraste es el que nos permite decidir si
podemos o no suponer que las varianzas poblacionales son iguales, si la probabilidad
asociada al estadístico de Levente es mayo que 0.05, podremos suponer que las
varianza poblacionales son iguales, si la probabilidad asociada al estadístico de
Levene es menor que 0.05 rechazaremos la hipótesis de igualdad de varianzas y
supondremos que son distintas.
Las columnas siguientes contienen el estadístico t, sus grados de libertad (gl), el nivel
crítico bilateral (Significación bilateral), la diferencia entre el salario medio de cada
grupo, el error típico de esa diferencia, y los límites inferior y superior del intervalo de
confianza al 95 %. Toda esta información está calculada tanto para el caso de
varianzas poblacionales iguales (línea encabezada Asumiendo varianzas iguales)
En el ejemplo, la probabilidad asociada al estadístico de Levene (0.419) es mayor que

0.05, por lo que no debemos rechazar la hipótesis de igualdad de varianzas y,
consecuentemente, utilizar la información de la fila encabezada asumiendo varianzas
iguales: el estadístico t toma el valor de -0.251 y tiene asociado un nivel crítico bilateral
de 0.803. Este valor es justamente el que nos informa sobre el grado de compatibilidad
existente entre la diferencia observada entre las medias muestrales de los grupos
comparados y la hipótesis nula de que las medias poblacionales son iguales. Puesto
que 0.803 es mayor que 0.05, no podeos rechazar la hipótesis de igualdad de medias
y concluimos que el peso medio recién nacidos de ambos sexos son similares.
Los límites del intervalo de confianza nos permiten estimar que la verdadera diferencia
entre el peso medio de la población de recién nacidos se sexo femenino y el peso
medio de la población de recién nacidos de sexo masculino se encuentra entre -
380.697 y 296.295 gramos. El hecho de que el intervalo obtenido incluya el valor cero
también nos permite no rechazar la hipótesis de igualdad de medias.
-22-

Estadistica Inferencial

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estadistica Inferencial

Transféré par

Droits d'auteur :

Formats disponibles

SPSS Instituto Superior “Hipólito Unanue”

La principal utilidad de la estadística considerada como herramienta de ayuda en las

La estadística inferencial se propone probar o rechazar una hipótesis formulada

Los tests estadísticos pueden clasificarse en paramétricos y no paramétricos. Si se

• Gaussianidad de cada una de las variables cuantitativas implicadas

Este test se solicita en SPSS en Analizar / Estadísticos Descriptivos / Explorar.

Se mostrara la siguiente ventana.

Colocando la variable cuantitativa en la ventana “Lista de Dependientes” y la

Después clic en el botón “Gráficos”

Cuando se comparan dos series de

2. Una variable cuantitativa y la otra cualitativa con dos categorías.

Por ejemplo, se desea saber si la media de nivel de ingresos (variable cuantitativa) en

Si el muestreo ha sido aleatorio y se ha comprobado que la distribución de la variable

Menú Analizar / Comparar medias y luego la opción de Prueba T para muestras

Se mostrara la siguiente ventana.

En la pantalla de resultados tras la descriptiva de la

Si p>0,05 (no se rechaza H0) quiere decir que las

Consiste en aproximar el valor desconocido de un parámetro mediante el valor del

 Parámetro: es una medida de resumen que describe una característica de toda

Un parámetro se puede estimar usando dos métodos de estimación: estimación

Este método de estimación consiste en asignar al parámetro desconocido el valor del

Estimación de una media poblacional mediante un intervalo de confianza.

Caso 2: si no conoce la desviación estándar poblacional (), se debe usar la distribución

Se desea estimar el verdadero ingreso promedio del estudiante con un nivel de

Como no se conoce la desviación estándar poblacional se usa el estadístico t student,

Ir al menú analizar, comparar medias, prueba t para una muestra.

En el recuadro de dialogo contrastar variables: nivel de ingresos. Y en Valor de prueba

En el visor de resultados se tiene la siguiente tabla.

Estimación de diferencia de medias poblacionales mediante un intervalo de

Se desea estimar la diferencia entre los ingresos promedios de hombres y mujeres

Ir al menú analizar, comparar medias, prueba t para muestras independientes.

En el cuadro de dialogo de Prueba T para muestras independientes.

En la opción de contrastar variables pasar la variable de nivel de ingresos.

En la opción de variable de agrupación arrastrar la variable Sexo.

Luego clic en el botón de opciones y digitar 98%.

Clic en el botón de continuar.

Ahora clic en el botón de Definir Grupos y definir los

Se obtiene la siguiente tabla.

A un nivel de confianza del 98 % se estima que la verdadera diferencia de eingresos

Prueba de Hipótesis Acerca de una Media poblacional

Para realizar un contraste acerca de una media poblacional se dispone de los

Caso 1: si se conoce la desviación estándar poblacional.

Se emplea el Estadístico z cuya fórmula es:

Caso 2: si no se conoce la desviación estándar poblacional

Se emplea el Estadístico y student cuya fórmula es.

En caso no se conozca la desviación estándar poblacional y la muestra sea grande

Un investigador afirma que el consumo mensual de promedio de cerveza es mayor a

Seleccionamos la variable de litros de cerveza/mes.

Clic en la opción Estadísticos y seleccionamos Media, continuar y OK.

Clic en el botón de continuar y luego clic en el botón de Aceptar.

Calculo del estadístico de prueba.

Cálculo del valor critico Z usando SPSS:

Eligiendo la opción de Transformar, calcular variable, en la opción de Grupo de

Valor critico Z=1.645.

A un nivel de significación 5%, existen suficientes evidencias para afirmar que el

Otra Forma: 1.645

Si sig < 0.05, se rechaza Ho.

Calculo de P-valor con el SPSS.

Eligiendo la opción de transformar, calcular la variable, en la opción de grupo de

Ho: µ >= 1000

Como no se conoce la desviación estándar poblacional, se usara el estadístico T.

Ir al menú Analizar y clic en comparar medias, prueba t para una muestra.

En el cuadro de dialogo Variables de Prueba ingresar la variable de Nivel de Ingresos

Teniendo el siguiente resultado.