Vous êtes sur la page 1sur 59

MATEMTICAS Y TECNOLOGA CON

CALCULADORA GRFICA

5. ESTADSTICA Y PROBABILIDAD
CON LA FX9860G SLIM

DIVISIN DIDCTICA

MAURICIO CONTRERAS
MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

ESTADSTICA DESCRIPTIVA Y REGRESIN CON LA FX9860G SLIM


Introduccin
Vamos a estudiar a continuacin las utilidades estadsticas de la calculadora FX9860G SLIM que incorpora
una hoja de clculo especialmente adecuada para el trabajo en Estadstica.

1.- Estadstica descriptiva


1. MEDIA Y DESVIACIN TPICA

En un estudio gentico, la comida regular se coloca en cada uno de 20 frascos y se anota el nmero de
moscas de un genotipo particular que comen de cada frasco. Se cuenta tambin el nmero de moscas
para otro conjunto de 20 frascos que contienen zumo de vino. Los datos recogidos son los siguientes:

Nmero de moscas (comida regular)


15 20 31 16 22 22 23 33 38 28
25 20 21 23 29 26 40 20 19 31

Nmero de moscas (Zumo de vino)


6 19 0 2 11 12 13 12 5 16
2 7 13 20 18 19 19 9 9 9

a. Haz una comparacin visual de las dispersiones respecto a sus centros de las dos distribuciones.

b. Calcula la media y la desviacin tpica para cada conjunto de datos.

a) Abrimos el Editor de Hoja de calculo SSHT. Introducimos la primera lista de datos en la columna A y la
segunda lista en la columna B de la siguiente forma:

Para representar los datos grficamente, accedemos al men GRAPH. Asignamos el primer grfico,
GPH1 a la columna A y el segundo grfico, GPH2 a la columna B y seleccionamos el diagrama de cajas
[MedBox] como tipo de grfico.

Los diagramas de caja para cada conjunto de datos son los siguientes:

CEFIRE DE GODELLA / CASIO Pg. 1


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

comida regular zumo de vino

Una comparacin grfica puede obtenerse al dibujar ambos grficos en la misma pantalla. Elegimos
SEL para seleccionar los dos grficos, tal como sigue:

Observa que los centros de las medianas de ambas distribuciones son diferentes (estn representadas
por lineas verticales en el centro de las cajas). Los datos de las moscas asociadas al zumo de vino
(grfico de abajo) representa un conjunto ms simtrico, ya que la lnea que representa a la mediana
est exactamente en el centro de la caja. Ambos conjuntos de datos parecen estar dispersos de la
misma forma. Pulsando [SHIFT] [F1] (TRACE] podemos recorrer los diagramas de caja y ver las
diferencias entre los parmetros.

Un diagrama de cajas es una representacin grfica de los datos que usa cinco medidas, la media, el
primer y el tercer cuartil y el mximo y el mnimo de los datos. Los cuartiles dividen el conjunto de datos
en cuatro partes iguales. El segundo cuartil es la mediana. Un diagrama de caja ayuda a visualizar el
centro, la dispersin y la simetra del conjunto de datos. En este ejemplo, la construccin de los
diagramas de caja permite comparar las dispersiones respecto al centro de las dos distribuciones.
Observa que en el conjunto de moscas que comen la comida regular, el mnimo es 15 y el mximo es
40. La mediana es 23 moscas.

Por otra parte, para el conjunto de moscas que toman zumo de vino, el mnimo es 0 y el mximo es 20.
La mediana es 11,5 moscas. Q1 y Q3 son los cuartiles.

CEFIRE DE GODELLA / CASIO Pg. 2


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

b) Pulsando [1Var] despus de dibujar los diagramas de caja correspondientes a cada conjunto de datos,
podemos ver los estadsticos univariantes asociados a los datos elegidos. Obtenemos los siguientes
parmetros estadsticos correspondientes a cada conjunto de datos:

comida regular zumo de vino

Observa que en el conjunto de moscas que comen comida regular, la media x es 25.1 y la desviacin
tpica x n 1 es 6.8433602. En el conjunto de moscas que toman zumo de vino, la media x es 11.05 y
la desviacin tpica x n 1 es 6.19401238.

Una observacin que podemos hacer es que las desviaciones tpicas de ambos conjuntos de datos
difieren tan solo en 0.65. Una perspectiva grfica puede ayudar tambin a hacer esta observacin. En
los diagramas de caja vemos que la dispersin de cada conjunto de datos es aproximadamente la
misma.

Observamos tambin que la media del nmero de moscas que comen comida regular es mayor que la
media del nmero de moscas que toman zumo de vino. Esta observacin es tambin consistente con
los diagramas de caja obtenidos.

Mara inspecciona los precios para un cuarto de cierta marca de aceite de motor. Los datos, en dlares
por cuarto, se resumen en la siguiente tabla:

Precio por cuarto 0.99 1.09 1.19 1.29 1.39 1.49


FRECUENCIA 2 3 7 10 14 4

a. Representa los datos grficamente.

b. Cul es la media y la desviacin tpica de los precios?

a) En este ejemplo, nuestros datos incluyen informacin del precio y frecuencia. Un histograma es un
grfico que puede resumir esta informacin. Los precios por cuarto se sealan en el eje horizontal y las
frecuencias en el eje vertical.
En el editor de Hoja de clculo, introducimos los precios en la columna A y las correspondientes
frecuencias en la columna B. Para el grfico de los datos, seleccionamos histograma [HIST]. En la
siguiente pantalla indicamos el inicio del histograma y la anchura de cada intervalo de datos:

Si recorremos mediante [TRACE] el histograma de izquierda a derecha, para cada intervalo, la


calculadora muestra el extremo de la izquierda como x y la frecuencia del intervalo como f, tal como se
muestra en la siguiente pantalla:

CEFIRE DE GODELLA / CASIO Pg. 3


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

b) La media de los precios x es aproximadamente $1.2975 y la desviacin tpica de los precios x n 1 es


aproximadamente 0.13085027. La baja desviacin tpica nos dice que el precio no est demasiano
disperso y se acerca a la media. Tenemos la siguiente pantalla:

Para estudiar la composicin de las familias de Winslow, Arizona, se seleccionaron al azar 40


matrimonios anotndose el nmero de nios por familia. Los datos obtenidos son los siguientes:

3 1 0 4 1 3 2 2 0 2 0 2 2 1
4 3 1 1 3 4 2 1 3 0 1 0 2 5
1 2 3 0 0 1 2 3 1 2 0 2

a. Construye un histograma para representar los datos.


b. Calcula la media de nios por familia.
c. Calcula la desviacin tpica del nmero de nios por familia.

a) La frecuencia de cada uno de los datos es 1, porque cada dato representa el nmero de nios en una
sola familia. Como los datos son enteros, ajustamos la configuracin del histograma de forma que la
anchura de cada barra sea 1.

El histograma obtenido es el siguiente:

b) El nmero medio de nios por familia es, aproximadamente, 175 o redondeando, 2 por familia.

c) La desviacin tpica del nmero de nios por familia es alrededor de 1,32. Tenemos la siguiente pantalla
de parmetros estadsticos:

Nota: Las respuestas a los tres ejercicios anteriores se pueden obtener tambin introduciendo los datos en
el men STAT. Los grficos y clculos se obtienen usando comandos similares.

CEFIRE DE GODELLA / CASIO Pg. 4


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

ACTIVIDADES:
1. Considera los siguientes datos:
LLUVIA MENSUAL EN SEATTLE, WASHINGTON
JAN FEB MAR APR MAY JUNE JULY AUG SEPT OCT NOV DEC
5.4 4.0 3.8 2.5 1.8 1.6 0.9 1.2 1.9 3.3 5.7 6.0

LLUVIA MENSUAL EN PHEONIX, ARIZONA


JAN FEB MAR APR MAY JUNE JULY AUG SEPT OCT NOV DEC
0.7 0.7 0.9 0.2 0.1 0.1 0.8 1.0 0.9 0.7 0.7 1.0

a. Haz una comparacin visual de las dispersiones respecto al centro de las dos distribuciones.

b. Calcula la media y la desviacin tpica para cada conjunto de datos.


2. Los siguientes datos son los resultados de un examen en una clase de Estadstica:

PUNTUACIONES EN EL TEST ( en %) 99 74 85 93 80 70
NMERO DE ESTUDIANTES 2 3 7 10 14 4

Cul es la media y la desviacin tpica de las puntuaciones del test?

SOLUCIONES:
Actividad 1.

a) Los diagramas de caja son los de la siguiente figura. Elige SEL para que se muestren simultneamente
los dos grficos en la pantalla:

El diagrama de caja de arriba corresponde a la lluvia en Seattle. El mnimo y mximo valor son 0.9 y 6
respectivamente, con mediana 2.9.

Por otra parte, el diagrama de caja de abajo corresponde a la lluvia en Arizona. Observa que el mnimo
y el mximo valor son pequeos en comparacin con los de Seattle, 0.1 y 1 respectivamente, con
mediana 0.7.

CEFIRE DE GODELLA / CASIO Pg. 5


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

b) Para los datos de lluvia en Seattle, la media x es 3.175 y la desviacin tpica x n 1 es 1.80711975.
Por otro lado, para los datos de Arizona, la media x es 0.65 y la desviacin tpica x n 1 es 0.33. La
lluvia en Seattle es ms dispersa, tiene mayor desviacin tpica. Estos resultados se confirman por la
forma de los diagramas de caja.

Seattle Arizona

Actividad 2.

a) Tenemos la siguiente configuracin para dibujar el histograma:

El histograma de las puntuaciones del test es el siguiente:

b) La media de las puntuaciones del test es aproximadamente 83.625, mientras que la desviacin tpica es
aproximadamente 8.11673642.

2. USANDO LA HOJA DE CLCULO PARA HALLAR MEDIA Y DESVIACIN TPICA

La media con la hoja de clculo

Cmo se calcula la media? La media de un conjunto de datos se obtiene mediante la frmula:


n

x i
= i =1

n
es decir, se suman todos los datos y el valor resultante se divide entre el nmero de datos.

CEFIRE DE GODELLA / CASIO Pg. 6


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

a) Cinco estudiantes miden el tiempo que utilizan en ir a la escuela por la maana. Sus datos se muestran
en la siguiente tabla, en la que se indican sus nombres (en la columna A) y sus tiempos (en la columna
B). Para calcular la media, mueve el cursor hasta la celda C1.

Pulsa = para introducir la frmula de la funcin. Al hacerlo se muestra una barra de mens como la
siguiente:

Pulsa ahora (CEL) para abrir un men con seis funciones de hoja de clculo:

Pulsa (Mean). Teclea el rango de valores B1 a B5 en nuestro caso y pulsa l. Aparece el resultado.

Observa que tecleando el nombre de la funcin y los parmetros =CellMean(B1:B5) obtienes una
resultado idntico, pero acabas con un mensaje de error. La funcin media debe ser seleccionada
desde el men.

b) Incrementa uno de los valores con 1 unidad. Qu le ocurre a la media? Cambiando diferentes valores
en la columna B, se obtienen diferentes efectos?

c) Incrementa todos los valores 1 unidad. Qu le ocurre a la media?

d) La media de un conjunto de valores es 63. Incrementa un valor en 5. Disminuye otro valor en 5. Predice
el valor de la media.

e) Pregunta el nmero de calzado de los alumnos de tu clase. Teclea sus respuestas en una hoja de
clculo. Calcula el nmero medio de calzado de tu clase.

f) Usando una balanza, pesa a los estudiantes de tu clase. Puedes introducir sus pesos en una hoja de
clculo. Calcula la media.

g) Selecciona todos los estudiantes con los zapatos del mismo nmero de calzado. Pesa sus zapatos.
Calcula su media. Comprueba que si el tamao de los zapatos es exactamente igual a la media de los
tamaos, su peso medio es exactamente igual a la media de los pesos de todos los zapatos. Si la
diferencia de tamaos respecto a la media es la ms grande, cabe esperar que tambin lo sea la
diferencia en pesos.

CEFIRE DE GODELLA / CASIO Pg. 7


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

La desviacin tpica con la hoja de clculo

Observa la siguiente figura. Los dos conjuntos de datos tienen la misma media.

Sin embargo, los valores de la columna A a la izquierda son ms dispersos respecto de la media que los de
la derecha. Expresamos este hecho mediante la desviacin tpica que mide la dispersin de los datos
respecto de la media. Se calcula con la frmula:

(x i )2
= i =1

n
a) Para calcular la desviacin tpica del conjunto de datos de la derecha con la hoja de clculo, sigue los
siguientes pasos:

1. Calcula la media en la celda B1.


2. Calcula la diferencia entre los valores y la media (en la celda C1). Despus copia la frmula de C1 a
la columna C, tomando la referencia a B1 como referencia absoluta $B$1
3. Calcula los cuadrados de los valores de la columna C en la columna D.
4. Suma los cuadrados (pon el resultado en la celda E1).
5. Divide el resultado por el nmero de elementos (en la celda F1).
6. Calcula la raz cuadrado del resultado anterior (en la celda G1).

La desviacin tpica de dicho conjunto de datos es 1.4142.

b) Calcula la media y la desviacin tpica para los datos de la izquierda. Observa que, aunque la media es
la misma, la desviacin tpica es diferente:

La desviacin tpica, 8.3666, es ahora mucho mayor, porque los datos estn ms dispersos.

c) Los clculos anteriores muestran el algoritmo completo para obtener la desviacin tpica. Pero no
necesitamos realizarlos con tanto detalle. La hoja de clculo dispone de una funcin que permite el
clculo directo.

Por ejemplo, supongamos que hemos introducido los datos en la columna A.

CEFIRE DE GODELLA / CASIO Pg. 8


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Pulsa [F6] (para que aparezca ms opciones del men desplegable). En dicho men, pulsa CALC para
mostrar su submen. En el submen selecciona 1VAR. La nueva ventana obtenida es la siguiente:

En ella podemos observar los valores de los distintos parmetros estadsticos.

d) Halla la desviacin tpica del conjunto anterior en la celda G1. Selecciona al azar dos celdas en la
columna A. Aumenta un valor en 7 unidades. Disminuye el otro valor en 7 unidades. La media queda
igual. Qu ocurre con la desviacin tpica?

e) Se divide la clase en cuatro grupos de estudiantes. Cada grupo puede cambiar una par diferente de
celdas:

1. Aumenta A1 en 4 unidades; disminuye A4 en 4 unidades.

2. Disminuye A1 en 4 unidades; aumenta A4 en 4 unidades.

3. Aumenta A2 en 6 unidades; disminuye A3 en 6 unidades.

4. Disminuye A2 en 6 unidades; aumenta A3 en 6 unidades.

Observa que todos los pares de operaciones preservan la media.

Cada grupo referir a los otros lo que ocurre con la desviacin tpica: Aumenta? Disminuye?

Cuando los valores cambiados estn cerca de la media, la desviacin tpica disminuye. Cuando los valores
estn lejos de la media, la desviacin tpica aumenta.

CEFIRE DE GODELLA / CASIO Pg. 9


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

2. Anlisis de regresin

1. REGRESIN LINEAL I

Considera los datos de la siguiente tabla que representan los valores de las acciones de la compaa
Vanguard Index Trust desde 1987 a 1997.

a) Llamamos x=aos e y=valor de las acciones de Vanguar Index Trust. Dibuja un diagrama de dispersin
para estos datos.

b) Calcula la pendiente de la recta que pasa por los dos puntos que representan el valor de la accin en
1987 y en 1991. Haz lo mismo para los puntos que representan los datos en 1991 y en 1995.

c) Cul de las pendientes calculadas en (b) es mayor en valor absoluto? Qu significa esto?

d) Halla la recta que mejor se ajusta a los datos. Cul es esta recta? Interpreta la pendiente de esta recta.

e) Si tu fueras un dirigente de esta empresa, cul de las tres pendientes que has calculado utilizaras
para convencer a alguien para invertir?

f) Cul es la tendencia en los datos?

g) Suponiendo que la tendencia continua, cul ser el valor de la accin en 2006?

Valor
AO (dlares)
1987 54.26
1988 63.07
1989 82.81
1990 80.08
1991 103.27
1992 113.20
1993 123.11
1994 130.29
1995 170.32
1996 185.81
1997 201.40

Solucin:

Abrimos el Editor de Hoja de clculo e introducimos los datos. Introducimos los aos en la primera columna
y los valores de las acciones en la segunda columna, tal como se indica en la figura:

a) Pulsamos GRPH y SET para configurar los rangos de celdas del diagrama de puntos:

CEFIRE DE GODELLA / CASIO Pg. 10


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

b) Calculamos las pendientes de las rectas en el Editor RUN. La pendiente de la recta que une los puntos
(1987,54.26) y (1991,103.27) se calculan as:

La pendiente de la recta es 12.2525. Por otro lado, la recta que une los puntos (1991, 103.27) y
(1995,170.32) tiene pendiente 16.7625 y se calcula as:

c) La pendiente de la recta que une los puntos (1991, 103.27) y (1995,170.32) es mayor en valor absoluto
que la pendiente de la recta que une (1987,54.26) y (1991,103.27). Esto significa que entre los aos
1991 y 1995, el valor de cada una de las acciones aument alrededor de 16.7625 dlares por trmino
medio. Este valor es superior en 4.51 al comprendido entre los aos 1987 y 1991, en los cuales el valor
de cada accin aument alrededor de 12.2525 dlares por trmino medio).

d) Para hacer la recta de mejor ajuste, introducimos el comando Linear regression mientras el grfico de
dispersin se muestra en pantalla:

La recta de mejor ajuste es y = 14.6313636x29026.801. La recta se dibuja en el diagrama de puntos,


tal como vemos en la siguiente figura:

La pendiente de la recta de mejor ajuste puede interpretarse como el incremento medio del valor de la
accin para un ao; en nuestro caso este incremento es de 14.6313636 dollars, aproximadamente.

Cul es la bondad del ajuste? La respuesta se puede obtener calculando el coeficiente de correlacin r
que es la medida de la intensidad de la relacin lineal que existe entre dos variables. Cuanto ms
prximo a 1 sea el valor de r ms perfecta es la relacin lineal entre las variables. En la pantalla
obtenida anteriormente, hemos visto que r es 0.98126479, lo que indica que el ajuste lineal entre las dos
variables es bueno.

e) Puede ser ms razonable usar la pendiente 14.6313636 de la recta de mejor ajuste, la cual indica el
crecimiento en el valor de la accin para un incremento de x de un ao y muestra la tendencia de los
datos.

f) La tendencia de los datos es que el valor de la accin aumenta cuando x aumenta.

CEFIRE DE GODELLA / CASIO Pg. 11


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

g) Suponiendo que la tendencia continua, podemos usar la recta de mejor ajuste para determinar el valor
de la accin en 2006.

Primero, copiamos los clculos que hemos obtenido respecto de la recta de mejor ajuste en el men
grfico con el Editor de Hoja de clculo.

A continuacin dibujamos el grfico (en la pantalla de la izquierda en la siguiente figura). Despus,


pulsamos [SHIFT] (G-Solv) y [Y-CAL], lo que nos permite aproximar el valor de la accin sustituyendo el
ao 1997 usando la recta de mejor ajuste (pantalla de la derecha en la figura).

Podemos indicar el valor de x, por ejemplo, x=2006, y la calculadora muestra el correspondiente valor
de en el grfico.

En el ao 2006, el valor aproximado de la accin es de $323.71.

El valor de y correspondiente a x = 2006 usando la recta de mejor ajuste puede tambin obtenerse en el
Editor RUN, usando el comando OPTN STAT como se muestra a continuacin:

En el Editor RUN, tambin puede obtener el valor de x correspondiente a un valor dado de y. Por
ejemplo, el apartado (g) que hemos visto puede sustituirse por el siguiente:

h) Suponiendo que la tendencia continua, cuando el valor de la accin valdr aproximadamente $500?

En el Editor RUN, obtenemos el siguiente clculo:

Usando la recta de regresin, estimamos que el valor de la accin puede valer alrededor de $500 en el
ao 2018.

CEFIRE DE GODELLA / CASIO Pg. 12


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Observaciones: Observa que los clculos en el Editor RUN pertenecen a los datos guardados en el Editor
de Hoja de clculo (como los clculos que hemos visto en las dos pantallas anteriores), pero no puede ser
utilizado en el modo eactivity. Este puede ser utilizado solamente cuando usamos el Editor de Hoja de
clculo del men principal.

ACTIVIDAD
Los siguientes datos indican el nmero de personas muertas a causa del SIDA en Estados Unidos desde
1982 hasta 1992.

aos 1982 1983 1985 1986 1987 1988 1989 1990 1991 1992
Muertos 843 1651 6681 11535 15451 19656 26151 28053 30579 22660

a) Basndote en estos datos, compara el nmero de muertos interpolado en 1990 con el dato real 28053.

b) Usa el modelo de regresin lineal para estimar el nmero de muertos a causa del SIDA en el ao 2006.

c) Si la tendencia continua, es posible que los muertos a causa del SIDA lleguen a 200000? En qu
ao?

Solucin:

a) En el Editor de Hoja de clculo, introducimos los datos y dibujamos el diagrama de dispersin.

Entonces la recta de mejor ajuste es la siguiente, dibujada sobre el diagrama de dispersin:

La recta de regresin es y = 3067.32267x 6079000. Usando la recta de regresin, el nmero


interpolado de muertos en 1990 es 24,607.77. El nmero real de muertos es 28053. Una diferencia de
aproximadamente 3445. Observa que la recta que hemos obtenido tiene coeficiente de correlacin, r =
0.94, lo que sugiere una correlacin positiva alta; no es perfecta, esperamos que exista alguna
diferencia entre los datos interpolados y los valores reales.

b) El nmero estimado de muertos en 2006 es alrededor de 73,685.

CEFIRE DE GODELLA / CASIO Pg. 13


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

c) En el Editor RUN, obtenemos aproximadamente que en 2047, los muertos sern alrededor de 200,000.

2. REGRESIN LINEAL II

Las pepitas de oro

Hay un rio cerca del campus. La mina de oro cercana est agotada desde hace algunos aos, pero algunos
buscadores de oro ocasionales refinan el agua del rio para buscar pepitas de oro. Los estudiantes han
creado un Club de Buscadores de Oro como una especie de entretenimiento que puede tambin ayudarles
a recoger fondos para la fiesta de Navidad. Van en fines de semana, refinan la arena del rio y consiguen
records en sus hazaas (ver la tabla de la hoja de clculo).

Como vemos en la tabla, no todos los miembros del club son igual de activos. Fiona la presidenta del club
opina que hay una relacin entre el nmero de visitas al ro y la cantidad de oro recolectado por cada
persona. Quiere demostrarlo a los otros. Ha estudiado un curso de Estadstica y quiere aprovechar su
conocimiento del mtodo denominado Regresin Lineal.

a) Fiona introduce los datos en una hoja de calculo de su calculadora. Primero muestra a los otros que los
datos pueden representarse en forma de nube de puntos. Para hacerlo, selecciona [GRAPH]. Del
submen selecciona [SET].

Los das consumidos en el ro forman la variable independiente x (las celdas B2 a B11), la cuenta de
pepitas de oro forma la variable dependiente y (las celdas C2 a C11). Regresando al submen grfico y
seleccionado q el grfico aparece en pantalla.

CEFIRE DE GODELLA / CASIO Pg. 14


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

La grfica consiste en puntos aislados, uno por cada buscador de oro. Si la forma de la nube no es
complicada, tiene una tendencia: para valores muy grandes de x, los valores de y tienden a ser muy
grandes.

Esta tendencia puede expresarse por una recta de regresin, cuya ecuacin general es y = ax + b
donde y representa la cuenta aproximada de pepitas encontradas en x das. Los parmetros a y b se
calculan desde la tabla de valores usando las frmulas:

n n n
n xi y i xi . y i
a = =1 i =1 i =1
i
2
n
n
n xi2 xi
i =1 i =1
n n

yi x i
b= i =1
a i =1

n n
En general, hemos de considerar todos los n pares de elementos de los dos conjuntos x1, x2, x3, , xn
(nmero de visitas al ro por persona) y y1, y2, y3, , yn (nmero de pepitas de oro encontradas por cada
individuo). Combinando los nmeros y usando las frmulas, obtenemos el resultado.

Fiona no se asusta de estas espantosas frmulas, porque sabe que la calculadora puede obtener a y b
directamente. Para hacerlo, pulsa [CALC]. El nuevo men aparece en la parte inferior de la pantalla:

Despus pulsa w (x), la calculadora muestra el siguiente resultado:

La funcin que permite aproximar el nmero de pepitas de oro despus de x das est definida como y =
2.13871549x 1.7604383. Para ver su grfica, pulsa [DRAW].

ACTIVIDAD
Cuntas pepitas podemos esperar encontrar despus de 30 das de bsqueda?

Solucin:
Como hemos hecho una estimacin, no necesitamos clculos muy exactos. Dos cifras decimales son
suficientes: (2.14 x 30)- 1.76 = 62.4 Esperamos encontrar alrededor de 62 pepitas.

CEFIRE DE GODELLA / CASIO Pg. 15


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

El fertilizante
Durante los ltimos aos, un granjero est utilizando un fertilizante en sus campos. Mantiene registros de la
cantidad de fertilizante usado (en toneladas) y produccin (en toneladas de cosecha). La tabla muestra
estos registros.

a) Usando regresin lineal, muestra la dependencia entre las cantidades de fertilizante y las cosechas.
Dibuja el diagrama de puntos.
b) Haz el clculo correspondiente. Registra los parmetros a y b.
c) Dibuja la recta de regresin.
d) El granjero ha aceptado una oferta de un comprador a granel de 80 toneladas de productos de la ltima
cosecha. Cuntas toneladas de fertilizante es recomendable que compre el granjero?

Solucin:
El parmetro a vale 21.2, b vale 19.6. Hemos de resolver la ecuacin 80 = 21.2x + 19.6. El resultado es
2.84 (aproximadamente 3 toneladas).

Resistencia deportiva
En un acontecimiento deportivo, un mdico del equipo mide el tiempo empleado por los deportistas de
diferente edad en una carrera. Todos los deportistas empiezan en el mismo momento. El mdico del equipo
anota el tiempo que tarda cada persona en pararse por estar exhausto. Los registros son los de la siguiente
hoja de clculo.

a) Dibuja un diagrama de dispersin basado en estos datos. Haz el clculo de los parmetros de la recta
de regresin y dibjala.
b) Cunto tiempo cabe esperar que resista una persona de 40 aos?
c) Qu edad aproximada corresponde a un tiempo de resistencia de 19 minutos?
d) Por qu la recta de regresin es decreciente?

Solucin:
a) El parmetro a es aproximadamente igual a -0.32; b es aproximadamente igual a 28.15:
y = -0.32x +28.15
y = 15.35
b) La persona de 40 aos puede resistir alrededor de 15 minutos.
c) Como a = -0.32 y b = 28.15, hemos de resolver la ecuacin: 19 = -0.32x + 28.15, cuya solucin es x =
28.125. La persona capaz de resistir 19 minutos tiene, aproximadamente, 28 aos de edad.
d) La duracin de la carrera decrece con la edad. Por ello, la recta de regresin es decreciente.

CEFIRE DE GODELLA / CASIO Pg. 16


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

3. COEFICIENTE DE CORRELACIN I

Las pepitas de oro 2

Recuerda los datos del problema Las pepitas de oro"

Por qu Fiona confa en la existencia de una relacin entre las dos variables? Porque conoce la forma de
obtener el coeficiente de correlacin con su calculadora.

Para ver la relacin entre dos conjuntos de nmeros, los datos deben ser introducidos en una tabla de hoja
de clculo de la calculadora. Para ello, selecciona [CALC]. En el submen CALC, primero selecciona [SET]
para especificar el rango de valores

Selecciona el rango B2 a B11 para la x; y el rango C2 a C11 para la y. Sin especificar ambos rangos, la
calculadora mostrara un mensaje de error o producira resultados incorrectos.

Regresa a la hoja seleccionando [EXE]. Selecciona [CALC] [REG]. El siguiente submen ofrece una
variedad de mtodos de regresin. Elegimos el ms sencillo, la regresin lineal pulsando [x].

El clculo es ejecutado.

Observa el valor de r obtenido. Este valor se llama coeficiente de correlacin y su frmula es


verdaderamente compleja:

n n n
n xi y i xi . y i
r= i =1 i =1 i =1
n 2 n 2 n 2 n
2

n xi xi n y i y i
i =1 i =1 i =1 i =1

CEFIRE DE GODELLA / CASIO Pg. 17


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Por tanto, hemos de considerar todos los n pares de elementos de los dos conjuntos x1, x2, x3, , xn (el
nmero de visitas al ro por persona) y y1, y2, y3, , yn (el nmero de pepitas de oro encontradas por cada
individuo). Sustituyendo los datos en la frmula anterior obtenemos el resultado. Afortunadamente, la
calculadora permite su obtencin, siempre que especifiquemos los rangos de x y de y. El resultado es
siempre un nmero real entre 1 y +1 (0.92383508 en nuestro caso). Los valores 1 y +1 (y valores
cercanos a los extremos del intervalo) indican una relacin entre los conjuntos de datos comparados. Los
valores del centro del intervalo indican que no hay una relacin (con valores 0 o cercanos a 0).

El fertilizante 2
Recuerda los datos del problema El fertilizante. Se muestran en la siguiente tabla.

Calcula el coeficiente de correlacin y utiliza el resultado para extraer una conclusin sobre la fiabilidad de
la estimacin para el presente ao (evaluando los parmetros a y b de la recta de regresin). Observa que
la especificacin del rango es fundamental porque tenemos tres columnas de nmeros. Nuestros rangos a
seleccionar son la cantidad de fertilizante (B2 a B6) y la cosecha (C2 a C6).

Resistencia deportiva 2
Recuerda los datos del problema Resistencia deportiva

Calcula el coeficiente de correlacin entre los dos conjuntos de datos. Podemos utilizar lar regresin lineal
para hacer estimaciones en este caso?

Estatura y televisin

Un grupo de estudiantes recoge datos sobre su estatura (en metros) y la cantidad de horas de ven la
televisin diariamente. Estn interesados en ver si hay una relacin entre estos dos conjuntos de datos.

El coeficiente de correlacin r = 0.2367005 indica que no hay una relacin importante. Lo mismo podemos
observar en el diagrama de dispersin.

CEFIRE DE GODELLA / CASIO Pg. 18


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

En este caso se dice que no hay correlacin entre las variables. En general esto ocurre cuando el
coeficiente de correlacin r toma valores cercanos a 0.

4. COEFICIENTE DE CORRELACIN II

Las granjas en EEUU

Los siguientes datos indican el nmero de granjas en los Estados Unidos durante los aos 1910 a 1999:

Aos 1910 1920 1930 1940 1950 1959 1969 1978 1987 1999
Nmero de granjas 6.4 6.5 6.3 6.1 5.4 3.7 2.7 2.3 2.1 1.9
(en millones)

a. Dibuja un diagrama de dispersin de los datos.


b. Determina la funcin que mejor se ajusta a los datos.
c. Usa la respuesta del apartado (b) para estimar el nmero de granjas en 1900 y en 1975.

Solucin:

a) Accedemos al Editor de Hoja de clculo. Tomamos como coordenada x de cada punto el nmero de
aos transcurridos desde 1900 y como coordenada y el nmero de granjas. Los aos los introducimos
en la columna A (1910 se introduce como 10, 1920 como 20 y as sucesivamente) y el nmero de
granjas en millones lo introducimos en la columna B:

Para dibujar el diagrama de dispersin, accedemos al men GRPH. Asignamos el primer grfico, GPH1
y especificamos las columnas que representan la x y la y, seleccionamos [Scatter] como tipo de grfico.

Observa que el grfico de puntos puede recorrerse con las teclas de cursor, lo que es una buena forma
de consultar los datos introducidos.

CEFIRE DE GODELLA / CASIO Pg. 19


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

b) Una vez dibujado el grfico, el siguiente paso consiste en explorar la relacin entre x e y buscando
funciones que ajusten los datos aproximadamente. Pulsamos [CALC] y elegimos el tipo de funcin.

Por ejemplo, supongamos que seleccionamos el modelo lineal. Los coeficientes de regresin se
calculan de la siguiente forma:

El modelo lineal obtenido es y =-0.0640032x + 7.80897744. Observa que el coeficiente de correlacin r


es aproximadamente -0.9538903. El coeficiente de correlacin mide el grado de bondad del ajuste por
una funcin lineal. En principio, observamos que el valor r 0.95 indica una muy buena regresin;
pero es posible que los datos se puedan ajustar por otro modelo funcional. De hecho, si dibujamos la
recta sobre la nube de puntos, podemos observar que la recta no parece ajustarse del todo bien.
Algunos puntos no estn en la recta; de hecho, la nube de puntos no se parece mucho a una recta.

As, un ajuste mejor se puede obtener mediante una curva. Experimentamos otros tipos de funciones
(cuadrticas, exponenciales, cbicas, curticas) y observamos la calidad del ajuste.
En las siguientes pantallas se muestran los modelos de regresin exponencial y cuadrtico:

Como en el modelo lineal, observamos que algunos puntos no estn cerca de las curvas exponencial y
cuadrtica. Los coeficientes de correlacin correspondientes a los modelos exponencial y cuadrtico
son aproximadamente 0.9532007 y 0.9560633 (alrededor de -0.95, la misma aproximacin que la
obtenida con el modelo lineal)

Otra exploracin produce los siguientes resultados: con la curva cbica se obtiene r - 0.9911923 y con
la curva curtica r - 0.9955864101. En ambos casos se obtiene un coeficiente de regresin: r 0.99,
que es muy cercano a 1. Sin embargo, el valor de r para la curva curtica es ms cercano a 1 que el
de la curva cbica. Por tanto, el mejor ajuste es aparentemente la curva curtica!

La funcin curtica de ajuste ptimo viene dada por la expresin:

0.000000089162x4 + 0.000009047x3- 0.003424x2+ 0.13022957x + 5.33504058

CEFIRE DE GODELLA / CASIO Pg. 20


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Los valores negativos de r indican que la relacin entre x e y es inversa. As, cuando x crece, la y
decrece. Esta relacin puede visualizarse en el diagrama de puntos. Observa que el valor de r no
aparece en estas pantallas. En realidad, no es necesario conocerlo. Basta saber el valor de r2, para
conocer la calidad del ajuste. Como el valor de r2 es cercano a 1, el ajuste es bueno.

Una buena forma de visualizar el ajuste por la curva es dibujarla sobre la nube de puntos. Esto es
especialmente til para comparar los grficos de los diferentes modelos funcionales respecto de los
datos.

Una vez obtenido y guardado en memoria el diagrama de dispersin con el nombre Pict1, pulsamos
[OPTN]:

El diagrama se puede usar ahora como dibujo [SHIFT SET UP] de la siguiente forma:

Los modelos funcionales obtenidos por regresin se pueden copiar a la lista de funciones grficas y se
pueden guardar como pantallas de dibujo.

Por ejemplo, copiamos las funciones cbica y curtica obtenidas por regresin al Editor de Grficos.
Asignamos los trazos ---- para la funcin cbica y __ para la funcin curtica. Pulsamos [DefG] para
dibujar ambos grficos con el diagrama de puntos como dibujo:

Podemos visualizar que ambas curvas de ajuste pasan muy cerca de los puntos y confirma esto que las
dos podran usarse como curvas de ajuste.

Es difcil averiguar, en algunos casos, qu modelo es mejor usar, fijndose solamente en los grficos o
en la forma de las nubes de puntos. Para decidir, por ejemplo, cul de los dos modelos anteriores
(cbico o curtico) es mejor, hemos de referirnos al valor del coeficiente de correlacin para determinar
la funcin de mejor ajuste.

CEFIRE DE GODELLA / CASIO Pg. 21


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

c) Usamos la funcin curtica obtenida en (b) para estimar el nmero de granjas en 1900 y en 1975.
Despus de pulsar [DefG], pulsamos [DRAW], despus [SHIFT G-Solv Y-Cal]. Especificamos el valor de
x para obtener el correspondiente valor de y.

En el ao 1900, habrn alrededor de 5.335 millones de granjas, y en 1975, alrededor de 2.477 millones
de granjas.

El ndice de Precios al Consumo


Los siguiente datos indican los niveles del ndice de Precios al Consumo (IPC) en Diciembre de distintos
aos:
Ao 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
IPC 121.2 128.0 134.8 137.2 139.0 143.0 147.1 150.2 156.5 158.9
a. Dibuja un diagrama de puntos de los datos.

b. Determina el modelo (exponencial, logartmico, potencial o lineal) que mejor describe la relacin entre
los aos y el IPC.

c. Usa el modelo obtenido en (b) para predecir el IPC para Diciembre de 2006.

Solucin:
a) Accedemos al Editor de Hoja de clculo, e introducimos los aos en la primera columna y los niveles del
IPC en la segunda columna. Aplicamos la siguiente frmula de sucesin para generar los aos,
pulsando [EDIT] y despus [SEQ].

El diagrama de puntos es el siguiente:

b) Los coeficientes de regresin para varios tipos de regresin son los siguientes:

CEFIRE DE GODELLA / CASIO Pg. 22


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Resumimos los resultados obtenidos en la siguiente tabla:

Tipo de curva COEFICIENTE DE CORRELACIN


Potencial 0.98788553
Exponencial 0.98783476
Logartmica 0.99129492
Lineal 0.99127019

Los cuatro tipos de curvas dan una buena correlacin. El hecho de que r
sea positiva indica que la relacin entre x e y es directa. Cuando x crece, y
crece. El valor de r para todas las curvas es cercano a 1; sin embargo, el
mejor ajuste es aparentemente la curva logartmica. El modelo logartmico
es: 59682.713 + 7870.94425 ln x. El grfico de la curva logartmica
superpuesto en el diagrama de dispersin es el siguiente:

c) Usamos el modelo logartmico para determinar el nivel del IPC en 2006. Obtenemos aproximadamente
167.1435873.

Observaciones:
Los clculos y grficos de regresin obtenidos en el Editor de Hoja de clculo se pueden obtener tambin
en el Editor STAT usando los mismos comandos. Adems, cuando trabajamos fuera de una hoja de
eactivity, es posible usar el modelo funcional para hacer clculos a travs de los editores GRAPH, TABLE
y RUN. Para hacer esto, la funcin debe copiarse primero en el Editor de Grficos.

Por ejemplo, en el apartado (c) del problema anterior, calculamos el valor de y para x=2006 en el Editor
RUN, de la siguiente forma:

Trabajando en el Editor GRAPH o RUN podemos no slo hayar la y, sino tambin la x.

Por ejemplo, supongamos que queremos determinar aproximadamente en qu ao el IPC ser 180.
Usando el Editor RUN, la respuesta es el ao 2009: En el Editor GRAPH obtenemos una respuesta similar
usando una ventana apropiada:

CEFIRE DE GODELLA / CASIO Pg. 23


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

DISTRIBUCIONES DE PROBABILIDAD CON LA FX9860G SLIM


Introduccin
La palabra azar tambin puede significar una cierta desviacin respecto de la uniformidad. Cuando vemos
un grupo de cinco personas, registramos diferencias en sus estaturas y pesos bastantes fuertes. Al mismo
tiempo, un grupo de cinco nios es aparentemente ms pequeo que un grupo de cinco adultos. La
distribucin de estaturas de cinco personas se puede caracterizar como una distribucin de probabilidad.
Vamos a estudiar a continuacin las utilidades de la nueva calculadora FX9860G SLIM para el anlisis de
distribuciones de probabilidad.

1.- Distribuciones de probabilidad I


1. MEDIA Y DESVIACIN TPICA. DISTRIBUCIN NORMAL
Recoge informacin sobre las estaturas de los compaeros de tu clase. Crea 10 grupos de estaturas, cada
uno de 5 cm de anchura, centrados en la media (por ejemplo, si la media es 170 cm, los grupos van desde
menos de 150 hasta ms de 190). Para cada grupo, cuenta el nmero de personas que tienen esa
estatura. Escribe los resultados en una tabla de hoja de clculo (tambin llamada tabla de frecuencias, que
muestra las frecuencias de los estudiantes que tienen la misma estatura). Representa grficamente los
resultados.

La forma real del grfico depende de las personas que hay en cada clase, pero, en general, los valores
cercanos a la media son los ms frecuentes y los valores alejados de la media tienen un carcter ms
excepcional. Por tanto, el grfico obtenido puede ser diferente al siguiente, pero tendr una forma bastante
similar: los resultados ms frecuentes en el centro y los menos frecuentes en los extremos.

Fija el rango de las celdas de tu grfico (graph1) de forma que sea similar al anterior. Dependiendo de las
medidas reales de tu clase, los valores de Ymin e Ymax sern diferentes. La forma ideal de la distribucin de
un conjunto de datos est expresada por una funcin llamada distribucin normal.

Pulsa [DIST] y despus [NORM]. De nuevo pulsa [Npd] para la distribucin de probabilidad normal.

La pantalla muestra ahora el significado de cada tem. La variable x representa los datos, la desviacin
tpica, la media. Mueve el cursor hacia abajo para seleccionar Execute y pulsa [DRAW]. Para =1 y = 0,
el grfico de la funcin es el siguiente:

CEFIRE DE GODELLA / CASIO Pg. 24


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Cambiando y resultan diferentes formas de la funcin de distribucin normal. Su frmula es:


( x )2
1
f ( x) = e 2 2

2
Observa que la curva es simtrica respecto de la media . Como representa una distribucin de
probabilidad, la media y valores cercanos son ms probables. Los valores ms alejados de la media son
menos probables. Esto se corresponde con la experiencia: los valores extremos son ms raros.

ACTIVIDADES
1) Calcula la desviacin tpica y la media para los datos de tu clase. Dibuja el grfico con una
configuracion apropiada para tus valores, usando la herramienta STAT.

2) Cambia el valor de . Qu efectos tienen los cambios?

3) De la misma forma, cambia el valor de . Qu efectos tienen los cambios?

Soluciones

a. Selecciona STAT de la pantalla de mens. Despus pulsa F5, despus F1 y de nuevo F1. Asigna tus
valores para la media y desviacin tpica. Mueve el cursor para ejecutar y despus selecciona F6
(DRAW). No olvides configurar las dimensiones de la pantalla con los valores apropiados usando V-
Window. En general, el intervalo de valores de x ser simtrico entorno a la media . Los valores
recomendados de x estn en el intervalo (3, + 3).

b. Cada cambio de mueve los valores ms probables hacia la izquierda o hacia la derecha, de forma que
la media siempre se mantiene como el valor ms probable.

c. El crecimiento de incrementa el intervalo de valores probables y la curva se vuelve aplastada. El


decrecimiento de hace que la curva se haga ms estrecha, porque el intervalo de valores con alta
probabilidad se encoge.

2. DISTRIBUCIN DE POISSON
La distribucin normal no es la nica. Hay otra muy frecuente que es la distribucin de Poisson. Por
ejemplo, el nmero de nios en las familias sigue esta distribucin. Intenta llamar a todas las familias
que conoces, averigua si tienen nios o no y forma una tabla con los datos. Dibuja un diagrama de
dispersin con los datos.

Las figuras reales varan segn pases (y segn regiones), pero siempre aparece una forma similar. La
curva crece cerca de la media porque las familias con un nmero de nios medio son ms frecuentes.
En la figura, las familias con 1-2 nios son ms frecuentes. Despus la curva cae constantemente. La
probabilidad de valores muy altos es muy pequea, pero nunca cero. (Alguna vez se han publicado
noticias de familias con 18 o 23 nios)

CEFIRE DE GODELLA / CASIO Pg. 25


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

La funcin de la distribucin de Poisson se expresa por la frmula:


x e
P ( x) =
x!
donde x es el conjunto de nmeros naturales (0, 1, 2, 3, ) y es la media (un nmero no negativo,
posiblemente con una cierta cantidad de decimales).

La grfica para =1.5 es la siguiente:

Las diferentes distribuciones de probabilidad de Poisson dependen del valor de su media . Para ver
esta influencia inicia la aplicacin STAT en la pantalla de mens. En la columna List1 introduce los
valores 0, 1, 2, 3, 4, 5, 6, que son los posibles hijos de las familias. Pulsa [DIST] [POISN] [Ppd]. En la
siguiente pantalla, en la lnea introduce el valor 1,5. Mueve el cursor hasta la lnea Execute y pulsa
[F1] (CALC). Aparece una pantalla en la que se indica que si la media fuera =1.5, entonces la
probabilidad de que una familia tenga 1 nio es 0.3346 (aproximadamente 1/3); la probabilidad de que
una familia tenga 3 nios es 0.1255 (aproximadamente 1/8).

Pulsa [EXIT] y en la pantalla de la distribucin de Poisson, cambia el valor de por 2 y activa la opcin
Execute moviendo el cursor y presionando [F1] (CALC). La columna que aparece recalcula las
probabilidades.

Para dibujar el grfico, copia la nueva lista de probabilidades a la List2 de la ventana STAT. Despus,
pulsa [GRPH] [SEL] [DRAW]. El nuevo grfico aparece en pantalla.

ACTIVIDADES

1) Cambia el valor de la media a 1.5, 2.3, 3, 4, 5. Dibuja los grficos correspondientes. Qu


conclusiones puedes hacer acerca de la distribucin de probabilidad de Poisson?

2) Pregunta a tus compaeros de clase sobre el nmero de coches en sus familias. Haz una tabla de
frecuencias para ningn coche, un coche, dos coches, etc. Dibuja un diagrama de dispersin
usando la tabla de la hoja de clculo. Cul es vuestra estimacin de la media de coches por familia?

3) Vigila durante una hora un semforo cercano. Cuenta el nmero de coches lo cruzan en verde en una
direccin particular. Registra los datos en una tabla. Despus de dejar el cruce, calcula las frecuencias
para cada nmero de coches que han pasado (0, 1, 2, 3, ...). Dibuja un diagrama de dispersin usando
una hoja de clculo. Qu puedes decir sobre la distribucin de probabilidad?

CEFIRE DE GODELLA / CASIO Pg. 26


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Soluciones

1) Con el crecimiento de la media, la probabilidad de que ocurran nmeros altos crece (con el mximo
cerca de la media). En general, conforme la curva que conecta los puntos del diagrama de dispersin se
hace cada vez ms achatada, su pico se hace ms y ms bajo.

3) Con tus resultados, podemos estimar el nmero de coches que atraviesan el cruce a la misma hora el
dia siguiente.

2.- Distribuciones de probabilidad II


1. MEDIA Y DESVIACIN TPICA. DISTRIBUCIN NORMAL

Una agencia de consumidores pregunt a 2750 familias que vivan en una pequea poblacin sobre el
nmero de aparatos de televisin que posean. La siguiente tabla muestra la distribucin de frecuencias de
los datos recogidos por la agencia.

Nmero de aparatos de TV propios 0 1 2 3 4 5 6 7


Nmero de familias 120 970 730 410 270 150 75 25

a. Construye una tabla de distribucin de probabilidad para el nmero de aparatos de TV propios de estas
familias.
b. Haz una representacin grfica de la distribucin de probabilidad.
c. Si x representa el nmero de aparatos de TV propios para una familia seleccionada al azar entre las de
la poblacin, halla las siguientes probabilidades:
1. P(x=1) 2. P(x>2) 3. P(x 1) 4. P(1 x 3)
d. Calcula la media y la desviacin tpica para la distribucin de probabilidad.

Solucin:

a) Abrimos el Editor de Hoja de clculo.

Sea x el nmero de aparatos de TV propios de una familia seleccionada al azar entre las de esta poblacin.
Introducimos los valores de x en la columna A y el nmero de familias (que es la frecuencia de cada grupo
de televisiones) en la columna B, tal como sigue:

Primero convertimos las frecuencias de la columna B en frecuencias relativas y las guardamos en la


columna C. Dividimos cada celda de la columna B por 1750, el nmero total de familias que participan en el
estudio. Introducimos [= $B1 2750] y situamos el cursor en la tercera columna primera fila, es decir en la
celda C1. El resultado correspondiente aparece en la posicin indicada y la frmula introducida tambin
aparece (en la parte inferior derecha de la pantalla).

Copiamos esta frmula a las sucesivas filas de la tercera columna. Haciendo esto obtenemos las
frecuencias relativas correspondientes a todas las entradas de la columna B:

CEFIRE DE GODELLA / CASIO Pg. 27


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Construyendo la distribucin de probabilidad con el Editor de Hoja de clculo, descubrimos, exploramos y


verificamos fcilmente las caractersticas de la distribucin de probabilidad de una variable aleatoria
discreta. Por ejemplo, las frecuencias relativas o probabilidades aproximadas obtenidas de la muestra estn
comprendidas entre 0 y 1. As mismo, la suma de las probabilidades asignadas a todos los posibles valores
es igual a 1.

La suma de celdas en la hoja de clculo se puede obtener usando el comando [= Cel Sum]. Las referencias
de las celdas a sumar (consistentes en la letra de la columna y el nmero de la fila) deben especificarse. En
la pantalla de la derecha de la figura anterior vemos que la suma de las probabilidades de una distribucin
de probabilidad es igual a 1.

b) La distribucin de probabilidad de una variable aleatoria discreta se puede representar grficamente


usando un histograma.

Para dibujar el histograma a partir de los datos, accedemos al men GRPH. Asignamos a los datos el primer
grfico, GPH1. Especificamos las columnas que representan los valores de x y las frecuencias relativas,
despus seleccionamos histograma [Hist] como el tipo de grfico:

El histograma se muestra en pantalla. Usamos una anchura de 1 para cada barra del grfico.

c)
1. P(x=1)
La probabilidad de que una familia tenga exactamente un aparato de televisin se puede obtener
directamente de la hoja de clculo. Esto tambin se puede obtener recorriendo el histograma mediante
[Trace]. En el histograma podemos ver que hay ms familias que tienen un slo aparato de TV.

CEFIRE DE GODELLA / CASIO Pg. 28


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

2. P(x>2)
La probabilidad de que una familia tenga ms de dos aparatos de TV se obtiene sumando las
probabilidades de que tenga tres, cuatro, cinco, seis y siete aparatos de televisin. As,

P(x>2) = P(x=3) + P(x=4) + P(x=5) + P(x=6) + P(x=7)

Usando la calculadora, sumamos las filas 4 a 8 de la columna C de la hoja de clculo, de acuerdo con la
frmula: P(x=3) + P(x=4) + P(x=5) + P(x=6) + P(x=7). Guardamos la suma en una posicin libre de la hoja
de clculo:

El resultado es P(x>2) = 0.3381.


3. P(x 1)
La probabilidd de que una familia tenga menos de un aparato de televisin se calcula as: P(x 1) = P(x=0)
+ P(x= 1). Usando la calculadora, sumamos las filas 1 y 2 de la columna C de la hoja de clculo, de acuerdo
con la frmula P(x=0) + P(x=1). El resultado es P(x 1) = 0.3963.

4. P(1 x 3)
La probabilidad de que una familia tenga entre uno y tres aparatos de TV se obtiene sumando las
probabilidades de que tenga uno, dos y tres aparatos.

P(1 x 3) = P(x=1) + P(x=2) + P(x=3)

Sumamos las filas 2, 3 y 4 de la columna C de la hoja de clculo, de acuerdo con la frmula P(x=1) + P(x=2)
+ P(x=3):

El resultado obtenido es P(1 x 3) = 0.7672.

d) Los clculos 1Var se pueden usar para determinar alguna informacin sobre la distribucin de
probabilidad. Pulsamos [CALC 1Var] despus de ajustar las preferencias de clculo (pantalla de la izquierda
en la siguiente figura). El nmero medio de televisiones por familia es 2,2 aproximadamente. Este tambin
es el valor esperado de x, es decir E(x) = 2.2. La desviacin tpica es 1.47.

Observaciones: En el estudio de distribuciones de frecuencia, es de gran ayuda obtener la distribucin de


probabilidades acumuladas. Veamos un ejemplo en el Editor de Hoja de clculo.

CEFIRE DE GODELLA / CASIO Pg. 29


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Primero copiamos la primera entrada de la columna de las frecuencias relativas, en este caso C1, en la
primera fila de la cuarta columna, D1, en la cual almacenamos las frecuencias acumuladas relativas.

Usando [= GRAB] introducimos la frmula de la suma para la primera y segunda frecuencias relativas, D1 +
C2 y almacenamos el resultado en D2:

Repetimos esta frmula a lo largo de la cuarta columna, con los comandos Copiar y Pegar. En la tercera fila
de la cuarta columna, tenemos la suma de la primera y tercera frecuencias relativas, D2+C3; en la cuarta
fila, D3+C4 y as sucesivamente. En la ltima entrada tenemos que la suma de todas las frecuencias
relativas es igual a 1.

El grfico de la distribucin de probabilidad acumulada es como sigue:

Podemos responder la pregunta del tem c del apartado 3, P(x 1) = 0.3963636364 usando la opcin
[Trace] para recorrer el grfico de la distribucin de probabilidad acumulada:

Observacin: Despus de introducir los datos, podemos guardar toda la informacin en el men de hoja de
clculo. Llamamos al archivo TVSETS. De la misma forma, llamamos al archivo de la siguiente actividad
Machines.

CEFIRE DE GODELLA / CASIO Pg. 30


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

ACTIVIDAD
Deportes Elmo vende mquinas de ejercicio. En das diferentes, venden diferentes cantidades de estas
mquinas. La tabla que sigue recoge la informacin del nmero de mquinas vendidas por da y las
probabilidades correspondientes.

Mquinas vendidas por dia 4 5 6 7 8 9 10


Probabilidad 0.08 0.11 0.14 0.19 0.20 0.16 0.12

a. Haz una representacin grfica de la distribucin de probabilidad.


b. Determina la probabilidad de que el nmero de mquinas vendidas por da sea
1. exactamente 6
2. menor que 7
3. entre 5 y 8
4. a lo sumo 6
c. Calcula la media y desviacin tpica de la distribucin de probabilidad

Solucin:
a) Sea x el nmero de mquinas vendidas por da. Abrimos el Editor de Hoja de clculo e introducimos los
valores de x en la primera columna y las probabilidades en la segunda columna.

b) El histograma es el siguiente:

La configuracin utilizada es la siguiente:

c)
1. La probabilidad de que el nmero de mquinas de ejercicio vendidas por dia sea exactamente 6 es 0.14.
Este valor se puede obtener directamente de la hoja de clculo. El valor tambin aparece cuando
recorremos el histograma mediante la opcin [Trace].

CEFIRE DE GODELLA / CASIO Pg. 31


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

2. La probabilidad de que el nmero de mquinas de ejercicio vendidas por da sea menor que 7 viene dada
por
P(x<7) = P(x=6) + P(x=5) + P(x=4) = 0.33,

ya que P(x=3) = P(x=2) = P(x=1)= 0.

Como se ve en la pantalla anterior, sumamos desde la primera hasta la tercera filas de la columna B.

3. La probabilidad de que el nmero de mquinas de ejercicio vendidas por da est entre 5 y 8 viene dada
por
P(5 x 8) = P(x=5) + P(x=6) + P(x=7)+ P(x=8)

El resultado se obtiene sumando desde la segunda fila hasta la quinta fila de la columna B.

4. La probabilidad de que el nmero de mquinas vendidas por da sea como mucho 6 se obtiene a travs
de la frmula
P(x 6) = P(x=4) + P(x=5) + P(x=6) = 0.33

que se ha calculado en el apartado (2).

c) La media y desviacin tpica se obtiene de la pantalla 1VAR como se muestra a continuacin:

La media es 7.28 y la desviacin tpica es 1.77245592.

Observaciones:

Los clculos estadsticos y grficos relativos a las distribuciones de probabilidad obtenidas en el Editor de
Hoja de clculo tambin se pueden obtener en el Editor STAT usando los mismos pasos, aunque hay
algunos cambios en los comandos:

Los valores de x se almacenan en la List1 y las frecuencias en la List2. Considera por ejemplo, la actividad
inicial (aparatos de televisin). Los datos se introducen as:

Las frecuencias se convierten en frecuencias relativas y se almacenan en la List3, usando el comando:

CEFIRE DE GODELLA / CASIO Pg. 32


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

El comando acumulativo [CUML] produce la distribucin de probabilidad de la List4. Observa que la suma
de todas las frecuencias relativas es igual a 1.

MUESTRAS ALEATORIAS CON LA FX9860G SLIM


Introduccin
En las siguientes actividades, veremos como utilizar la calculadora FX9860G SLIM para generar nmeros
aleatorios, efectuar simulaciones y resolver problemas de probabilidad mediante simulaciones.

1.- Muestras aleatorias I


1. NMEROS ALEATORIOS
La palabra azar es bastante popular y su significado en la vida real difiere parcialmente del que tiene en
Estadstica. Cuando alguien dice: paseando por la calle me he encontrado por azar con Juliana, no
menciona las docenas (posiblemente centenares) de personas conocidas que han pasado tambin por la
calle. Todas estas personas tambin podran haber tenido un encuentro al azar. En la estadstica no
matemtica, la estadstica de la calle, todos los encuentros se producen por azar. Para simular la realidad,
podemos utilizar los nmeros aleatorios.

a) Para generar un nmero aleatorio, pulsa [OPTN] y selecciona el men [PROB]. Pulsa [F4] (Ran#) y
[EXE]. Aparece en pantalla un nmero entre 0 y 1.

Observa que los valores 0 y 1 nunca aparecen. Solo se generan valores interiores del intervalo [0, 1].

Recoge los resultados de tu clase. Habis obtenido el mismo nmero?

Es posible obtener el mismo nmero, pero poco probable. El conjunto de nmeros aleatorios de la
calculadora es grande. Una misma aparicin de un nmero no se excluye, pero su probabilidad es
extremadamente baja.

b) Todos los nmeros aleatorios tienen la forma 0.xxxxxxxx. El primer dgito es siempre cero pero los
dgitos posteriores varan. Selecciona un dgito de 0 a 9. Genera nmeros aleatorios hasta que el dgito que
has elegido aparezca como primer decimal despus del punto. Cuenta el nmero de pruebas necesario
para que esto ocurra. Para generar el siguiente nmero aleatorio, simplemente basta que pulses [EXE].

CEFIRE DE GODELLA / CASIO Pg. 33


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Repite el experimento anterior 10 veces. Registra las longitudes de los intervalos entre dos apariciones
consecutivas de nmeros aleatorios con el mismo primer dgito decimal. Observas una regularidad en
la longitud de los intervalos?

La ruptura entre dos primeros dgitos idnticos puede ser de cualquier longitud. Esta propiedad garantiza
que los nmeros son realmente aleatorios.

c) Sita 10 valores aleatorios en una tabla de hoja de clculo. Dibuja un diagrama de dispersin. Observa
que sus puntos no crean ninguna forma regular. Esto es otra indicacin de que los nmeros son aleatorios.

d) Calcula la media de los diez intervalos que has registrado. Compara tus resultados con los de tus
compaeros de clase. La media no estar lejos de 0.5.

Esto naturalmente slo ocurre para grandes cantidades de nmeros aleatorios. Entonces, la media de los
diez nmeros aleatorios es 0.496. El valor de la media puede variar en las cercanas de 0.5, pudiendo ser
mayor o menor dependiendo de la combinacin aleatoria.

Toma los dos ltimos dgitos del ao en que has nacido. (Si es 1987, usa 87). Genera nmeros
aleatorios hasta que aparezca el primero de los dos dgitos. Haz una conjetura: cuntos nmeros
aleatorios (por trmino medio) tienes que seleccionar hasta que aparezca tu par de dgitos?

Como hay 100 pares diferentes de dgitos (desde 00 hasta 99) escritos en orden aleatorio, tu par puede
aparecer (en trmino medio) como el quincuagsimo. Si no has tenido suerte, repite la experiencia un
nmero mayor de veces.

Generacin de nmeros aleatorios enteros

Los nmeros aleatorios entre 0 y 1 no son bonitos. Si necesitamos nmeros aletorios, sus valores son
bastante diferentes. Por ejemplo:

Lanzando una moneda generamos uno de dos resultados que denotamos como 0 y 1.

Lanzando un dado generamos un nmero aleatorio entre 1 y 6.

En la Loto los nmeros dependen del pais en que se juega.

CEFIRE DE GODELLA / CASIO Pg. 34


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

As, preferimos tener la posibilidad de transformar los valores generados por la calculadora para nuestro
intervalo.

a) En principio expandimos el intervalo de nmeros aleatorios desde 0 hasta 2. El mtodo es simple:


multiplicar por 2 los nmeros aleatorios del intervalo [0, 1]. El valor puede ser desde 0 hasta 2, excluyendo
los extremos del intervalo. As, cada uno de ellos empieza por 0 o por 1 antes del punto decimal.

b) El mtodo anterior genera nmeros aleatorios apropiados, pero su formato es bastante complejo. Son
difciles de leer. Buscamos resultados que contengan lo que necesitamos. Para ello, la parte decimal
puede ser truncada, es decir, eliminada. El nmero entero (0 o 1) es el nico que nos interesa. La
funcin INT permite esto. Pertenece a las funciones numricas. Cuando la ventana RUN-MATH est
abierta, pulsa [F4] (NUM). Aparece el submen numrico. Pulsa [F2] para seleccionar el segundo tem
(INT). A continuacin escribe (2x. Despus pulsa [EXIT] [F3] (PROB) y pulsa [F4] (Ran#). Cierra
parntesis y pulsa [EXE]. Un nmero aleatorio 0 o 1 aparece en pantalla. Pulsando [EXE] varias veces
generas nmeros aleatorios con el mismo formato.

c) Primero necesitamos expandir el intervalo para tener 6 valores diferentes. As, 6xRan# es la frmula
apropiada.

El primer nmero generado por esta frmula vara entre 0 y 5. As, sumando uno al resultado podemos
producir nmeros entre 1 y 6.

ACTIVIDADES
a) Truncando los nmeros de la actividad anterior, genera nmeros aleatorios enteros entre 1 y 6.

b) En la Loto de Eslovaquia, la gente apuesta seis nmeros entre 1 y 49. Busca una estrategia para
generarlos, sabiendo que los 6 nmeros deben ser diferentes.

c) Usando tu generador de nmeros aleatorios, selecciona al azar cinco estudiantes de tu clase.

d) Podemos saltar u omitir algn nmero generado por un generador de nmeros aleatorios?

CEFIRE DE GODELLA / CASIO Pg. 35


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Solucin

a) Usa la frmula INT(6*Ran# + 1)

b) El primer nmero es seleccionado al azar. El segundo es generado (y solamente elegido si difiere del
primero). El tercero debe diferir de los dos seleccionados anteriormente. Esto se repite hasta que se
generan seis dgitos diferentes.

c) Asigna un nmero de orden a cada uno de tus compaeros de clase (por ejemplo, usando el orden
alfabtico). Construye un generador de nmeros aleatorios. Genera cinco nmeros aleatorios diferentes.

d) No es recomendable. Puedes introducir elementos que eliminen la aleatoriedad.

2.- Muestras aleatorias II


1. MUESTREO CON LA CALCULADORA GRFICA
Suponemos que una factoria de chocolate produce 5000 piezas de chocolate diarias. La divisin de control
de calidad decide seleccionar al azar 50 piezas (el 1%) de chocolate para su inspeccin de calidad diaria
(antes de analizar los datos estadsticamente).

Como es usual, hoy el inspector de calidad ha numerado las piezas de chocolate de acuerdo con su orden
de produccin, es decir, la primera pieza de chocolate producida en el da tiene el nmero 1, la segunda el
nmero 2 y as sucesivamente. Usando la calculadora grfica, puede seleccionar 50 piezas de las 5000
usando la funcin [Ran#].

Abre el Editor RUN. Pulsa [OPTN] [F6] [Z] [F3] [PROB] [F4] [Ran#] y despus pulsa [EXE]. Pulsando varias
veces obtendrs una pantalla similar a esta:

Observa que cada pulsacin de [Ran#] produce diferentes dgitos decimales y siempre se cumple la
desigualdad:
0 < Ran# < 1

Podemos ayudar al inspector para adaptar esta salida a sus necesidades de muestreo. Si multiplicamos
[Ran#] por 5000 aseguramos que cada salida estar comprendida entre 0 y 5000.

0 < 5000Ran# < 5000

Podemos ajustar la funicin [Ran#] para ayudarle a seleccionar su muestra aleatoria. Pulsa [EXIT] [F4]
[NUM] [F2] [Int], seguida de la expresin 5000Ran#, y smale 1.

El inspector puede ahora generar 50 nmeros aleatorios diferentes del 1 al 5000 en la ventana [Run]
pulsando [EXE] 50 veces. Es mucho ms ventajoso y eficiente usar una hoja de clculo para introducir los
datos del muestreo recordando los resultados del test de calidad del chocolate y adems sirve para hacer
un anlisis estadstico.

CEFIRE DE GODELLA / CASIO Pg. 36


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

ACTIVIDAD 1
Usa el men Hoja de clculo de la calculadora grfica para ayudar al inspector a seleccionar al azar 50
chocolates para su test de hoy.

Solucin:

a) Abre el men Hoja de clculo y guarda la hoja actual con el nombre Act1A. Para ello, pulsa [F1] [FILE]
[F3] [SVAS] y en la siguiente pantalla introduce el nombre Act1A. Usamos la columna A para generar
nmeros aleatorios y la llamaremos Random. Tambin conseguiremos la muestra en la columna B y la
llamaremos Sample. Para escribir el nombre de la columna, basta situar el cursor en la primera celda y con
el teclado alfabtico teclear el nombre entre comillas (Random o Sample). Despus, mueve el cursor
hasta la primera celda vaca de la columna Random.

Introduce la frmula Int(5000Ran#)+1 en la celda seleccionada A2. Es similar a como la habamos


introducido antes. Cuando pulsamos [EXE] se genera un nmero aleatorio.

b) Para esta actividad vamos a generar 49 nmeros aleatorios ms y de una forma rpida. Sita el cursor en
la celda A3 y selecciona (EDIT) (FILL). Introduce la frmula =Int(5000Ran#)+1 (en la lnea encabezada por
[Formula]) y en el rango de celdas [Cell Range] escribe A3:A51. Pulsa [EXE] para generar los otros 49
nmeros aleatorios.

c) A continuacin guardamos los nmeros de la columna Random en una lista antes de renombrar el
mismo conjunto de nmeros para la columna Sample. Mueve el cursor a la primera celda, A2, de
Random y pulsa [SHIFT] [8] (CLIP). Con la celda A2 seleccionada, mueve el cursor hacia abajo hasta el
ltimo nmero situado en la calda A51. En la parte inferior izquierda de la pantalla se muestra el rango de
celdas seleccionadas: A2:A51.

Para guardar estos nmeros en una lista, pulsa [STO] [LIST] y en la siguiente pantalla guarda los nmeros
en la lista [List1].

CEFIRE DE GODELLA / CASIO Pg. 37


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Ves a la primera celda vaca de la columna Sample y pulsa [RCL] [LIST]. En la siguiente pantalla introduce
el nombre de la lista a recuperar [List1] y comprueba que en la lnea 1st Cell pone B2. Pulsa [EXE] para
obtener los valores de la columna Sample.

d) Finalmente, ordenamos los nmeros de la columna Sample en orden ascendente y observamos


posibles repeticiones de nmeros. Ves a la primera celda de la columna Sample, pulsa [SHIFT] [8] y
mueve el cursor hasta la ltima celda no vaca, la celda B51. Para ordenar la columna, selecciona [EDIT]
[SRTA], despus explora la columna y averigua si hay algn nmero repetido.

Los nmeros aleatorios obtenidos en nuestro caso no contienen repeticiones, pero si vemos nmeros
repetidos, volvemos a empezar por el apartado (C).

Por lo tanto, conforme con los nmeros aleatorios que hemos generado, el inspector de calidad puede
inspeccionar los chocolates producidos de acuerdo con el orden mostrado en la columna Sample de la
hoja de clculo Act1A.

El inspector de calidad puede usar siempre esta misma hoja para seleccionar una muestra aleatoria para su
trabajo cada da y despus estudiar los logros en calidad.

ACTIVIDAD 2
La factora a veces produce entre 4000 y 4500 piezas de chocolate diarias, aparte de las usuales 5000. El
tamao de la muestra requerido para el test de calidad es siempre el 1% de la produccin diaria. En el test,
cada pieza de chocolate pasa el test (logra 1 punto) o no lo pasa (logra 0 puntos). No ms de un 8% de la
muestra falla el test de calidad diariamente. El siguiente es el plan diario de produccin para los prximos 5
das.

Da 1 2 3 4 5
Produccin de Chocolate 5000 4000 4500 5000 5000

Improvisa la hoja de clculo para ayudar el inspector en su trabajo.

Solucin:

En resumen aqu estn los tamaos necesarios de las muestras diarias y el 8% del tamao de la muestra.

Dia1 Dia2 Da3 Dia4 Dia5


Produccin de Chocolate 5000 4000 4500 5000 5000
Tamao de la muestra 50 40 45 50 50
8% del tamao de la muestra 4 3.2 3.6 4 4

a) Abre el Editor de Hoja de clculo y guarda la nueva hoja con el nombre Act2A. Consideramos la
producicn diaria como parmetro en la generacin del nmero aleatorio. La celda A2 la usamos para
registrar la produccin diaria. Tambin usamos la columna B como una columna indexada para facilitar
referencia a la produccin y a los nmeros aleatorios. Empezamos con la produccin diaria de 5000 para el
Dia1.

CEFIRE DE GODELLA / CASIO Pg. 38


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

b) Las columna Random y Sample son colocadas en las columnas C y D respectivamente. Para generar
50 nmeros aleatorios, sita el cursor en la celda C2, pulsa [EDIT] seguido de [FILL]. Esta vez introducimos
la frmula =Int($A$2Ran#)+1 en la lnea [Formula] y el rango de celdas C2:C51 en la lnea [Cell Range].

c) Aqu hemos generado 50 nmeros aleatorios para el Dia1. De nuevo guardamos los nmeros de la
columna Random en la lista [List1] antes de recolocar el mismo conjunto de nmeros en la columna
Sample, ordenar dichos nmeros y chequearlos para ver si hay nmeros repetidos. Primero regresa a la
hoja de clculo de trabajo:

Sita el cursor en la celda C2 y pulsa [SHIFT] [8] (CLIP), despus mueve el cursor hacia abajo hasta la
celda C51. Con el rango de celdas C2:C51 seleccionado, pulsa [STO] [LIST] y guarda estos nmeros en la
lista [List1].

Pulsa [EXE] para regresar a la hoja de clculo de trabajo. Ves a la primera celda vaca de la columna
Sample, pulsa [RCL] [LIST] para recuperar las entradas de la lista [List1].

d) Ahora ordenados los nmeros de la columna Sample en orden ascendente y chequeamos posibles
repeticiones de nmeros. De nuevo usa [SHIFT] [8] para seleccionar desde la celda D2 hasta la celda D51 y
ordenar la columna con [EDIT] [SRTA], despus explora la lista para ver posibles repeticiones de nmeros.

e) Aadimos otras dos columnas llamadas Test para registrar el resultado del test de calidad, y otra
llamada #of 0 para calcular el nmero de 0 (fallos en el test.) La columna #of 0 actual consta de la celda
$A$2
F2 que cuenta el nmero de fallos con la frmula -CellSum(E2:E51). Ahora el inspector puede usar
100
esta hoja de clculo para su trabajo diario.

CEFIRE DE GODELLA / CASIO Pg. 39


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Dia1

Para la discusin de esta actividad, usamos los nmeros aleatorios generados antes para el test de calidad
del Dia1 y los resultados del test se supone que son los siguientes.

La media de los resultados de los chocolates producidos el Dia1 que pasan la inspeccin de calidad es
necesaria. Podemos guardar los nmeros aleatorios y los resultados del test en las listas [List1] y [List2]
usando [SHIFT] [8] (CLIP) y [STO].

Tambin guardamos la muestra aleatoria del Dia1 y los resultados del test en las listas [List1] y [List2].

Dia2

Cambia la produccin diaria en la celda A2 por 4000. Repite el proceso de los apartados C) y (D), pero
considera solo los primeros 40 nmeros en la columna Random. La muestra aleatoria no est afectada en
este caso aunque generamos 50 nmeros aleatorios. Tambin, usa [List3] como lista de almacenamiento
temporal.

Cuando pegamos las entradas de la lista [List3] en la columna Sample, los contenidos de las celdas D2 a
D41 son reemplazados con el nuevo conjunto de nmeros aleatorios. Podemos usar la columna Index
como gua para seleccionar la nueva generacin de 40 nmeros aleatorios, para ordenarlos y evitar
seleccionar las celdas D42 a D51.

Asumimos los resultados del test como los resultados actuales. Los contenidos de las celdas E42 a E51
deben ser eliminados para asegurar que se muestre el nmero correcto de 0.

CEFIRE DE GODELLA / CASIO Pg. 40


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

El nmero de 0 registrado es 4, que indica los chocolates producidos el Dia2 que no pasan la inspeccin de
calidad. Ahora guardamos los nmeros aleatorios y el test en las listas [List3] y [List4].

Con similar aproximacin, seleccionamos la muestra aleatoria apropiada para los dias Dia3, Dia4 y Dia5,
guardamos los correspondientes nmeros aleatorios y los resultados correspondientes en las listas [List5] y
[List6] para Dia3, [List7] y [List8] para Dia4, y [List9] y [List10] para Dia5.

El mtodo de muestreo que hemos usado anteriormente se llama muestreo aleatorio simple. Otro mtodo
de muestreo aleatorio es el muestreo estratificado que se basa en identificar los estratos. Ejemplos de
estratos son hombres y mujeres, o obeso y no-obeso. Un muestreo estratificado se hace separando
muestras aleatorias simples para cada uno de los estratos. Si conocemos las proporciones en la poblacin
de las distintas categoras, podemos asegurar que las proporciones se reproducirn para la muestra.

ACTIVIDAD 3
Supongamos que la poblacin de estudiantes de tu instituto puede ser descrita como sigue:

Estudiantes chicos Estudiantes chicas


45% 55%

Usa muestreo estratificado para elegir una muestra aleatoria de 40 estudiantes.

Solucin:

En este caso, podemos elegir una muestra aleatoria simple de 4045%=18 estudiantes chicos y otra
muestra aleatoria simple de 4055%=22 estudiantes chicas.

ACTIVIDAD 4
Suponiendo que la poblacin de estudiantes de un instituto es 1750 y la composicin chicoschicas es
como se describe a continuacin

Estudiantes chicos Estudiantes chicas


38% 62%

Usa la hoja de clculo para seleccionar una muestra estratificada de 50 estudiantes para medir la
preferencia de los estudiantes entre chocolate con almendras y chocolate con leche. Disea una hoja de
clculo para registrar las respuestas.

Solucin

Peimero seleccionamos la muestra estratificada y despus usamos la tcnica de la Actividad 2 en la


muestra. En resumen, aqu est la informacion sobre las dos categoras.

Male students Female students


% of population 38% 62%
Of 1750 population (%1750) 665 1085
Stratified sample size (%50) 19 31

Puedes usar el Editor RUN para calcular la informacin relevante que se muestra en la tabla anterior.

CEFIRE DE GODELLA / CASIO Pg. 41


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Una posible forma de disear la hoja de clculo es la siguiente:

Abrimos la Hoja de clculo. Usamos las columnas A y B para registrar la poblacin y el tamao en la
muestra de cada estrato, tambin tenemos ms control de los parmetros.

Utiliza la tercera columna para ndice y la cuarta columna para generar nmeros aleatorios. E primer
lugar, selecciona la muestra aleatoria de estudiantes chicos con la frmula =Int($B$2Ran#)+1 para el
rango D2 a D20 (tamao de la muestra de 19.)

Crea dos columnas ms denominadas Chicos y Chicas. Copia, pega y ordena los nmeros de la
columna Chicos con los mtodos usados en la Actividad 2. Despus selecciona la muestra aleatoria
de chicas con la frmula =Int($B$3Ran#)+1 para el rango D2 a D32 (tamao de la muestra de 31) de
la columna Random y copia y ordena los nmeros en la columna Chicas.

Usa la columna F para registrar las respuestas de los estudiantes chicos para el cuestionario y la
columna H para las respuestas de las chicas. A continuacin se muestran hojas de clculo de posibles
respuestas donde 1 indica estudiantes que prefieren chocolate con almendras y 2 estudiantes que
prefieren chocolate con leche.

CEFIRE DE GODELLA / CASIO Pg. 42


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

INFERENCIA ESTADSTICA CON LA FX9860G SLIM

Introduccin
A continuacin estudiaremos algunas de las posibilidades de la calculadora grfica FX9860G SLIM para el
estudio de la Inferencia Estadstica en ESO y Bachillerato

1. ESTIMACIN ESTADSTICA

La Estadstica estudia situaciones y muestras de la vida real para extraer conclusiones relevantes basadas
en los datos recogidos. Todos sabemos que los datos reales no son constantes. La gente nace, crece, se
mueve de un lugar a otro, pero no se libera de su peso. Por esta razn una cuestin aparentemente trivial
puede ser difcil de resolver completamente. Dice: Cul es el peso medio de la poblacin?

Primero, pesando miles (posiblemente, centenares o miles de millones) de personas es una prdida de
tiempo. No podemos garantizar que algunos ciudadanos rehusen a hacerlo. Si todos aceptan, cul ser la
ltima medida? Hasta que el ltimo valor no sea determinado, la primera persona puede haber engordado
(o adelgazado) algunos kilos y tendramos que volver a empezar. Si todos aceptan medir su peso el 17 de
Septiembre a las 8:30, no estamos seguros de que su balanza est asegurada. Por otra parte, debemos
recoger y evaluar todos los datos. Para esto necesitamos bastante tiempo. Adems, el valor que tomamos
como correcto de un dato puede que en el momento del clculo ya no sea correcto.

Por esta razn, en Estadstica simplificamos el trabajo. En vez de perseguir soluciones ideales e irreales,
simplificamos los trabajos, buscamos hiptesis para sus respuestas e intentamos estimar un nivel de
precisin en el que las respuestas puedan ser asumidas como suficientemente correctas.

Vamos a resolver un problema similar: Cul es el numero total de mascotas de los estudiantes de este
instituto?

Solucin:

El mtodo ms realista consiste en preguntar a todos los estudiantes sobre el nmero de mascotas que
tienen. Como hemos dicho antes, esto es una prdida de tiempo y no tenemos un 100% de garantas de
que el resultado sea correcto.

Un segundo mtodo est basado en seleccionar una muestra apropiada. Nuestra clase puede serlo. Por las
siguientes razones:

Tenemos una proporcin bastante razonable del conjunto de estudiantes y, por tanto, los resultados
pueden ser una buena imagen de la situacin real.

No tenemos una especial preferencia. Es probable que no tengamos muchas mas ni muchas menos
mascotas que los estudiantes de otras clases.

Observa que la segunda suposicin no siempre es verdadera. Si nuestra clase es especial (por ejemplo,
orientada hacia la Biologa) algunos estudiantes tendrn extremado inters en los animales y no
formaremos una muestra correcta. O, si media clase est formada por un grupo de estudiantes con un
inusual alto nivel de alergia a las pieles. En ambos casos, le evaluacin ser negativa por una mala
seleccin de los individuos de la muestra. Es ms apropiado encontrar otro grupomuestra ms similar a la
media de los estudiantes.

La clase de 30 estudiantes recoge el nmero de mascotas en una tabla de hoja de clculo. Suponiendo
que la clase es una clase media, cuntas mascotas habrn entre todos los 480 estudiantes del
instituto?

La media es 2.6 mascotas por estudiante, lo que se recoge en la celda C2 como se muestra a
continuacin:

CEFIRE DE GODELLA / CASIO Pg. 43


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Con 480 estudiantes en el instituto, el resultado es 2.6 x 480 = 1248 animales.

Otro valor que podemos hallar el la desviacin tpica. Este parmetros se calcula automticamente
pulsando [CALC] y despus [1VAR].

En esta lista, el valor indicado de la desviacin tpica es xn = 1.83666364.

Es difcil confiar en el resultado (1248 animales) sin alguna reservas. Podemos hacer una estimacin
del error?

En Estadstica, la estimacin se deriva del denominado error estndar de la media x que se define
como:

x =
n
donde es la desviacin tpica y n es el tamao de la muestra.

Calcula el error estndar sabiendo que la desviacin tpica es 1.836 y que la muestra consta de 30
estudiantes:
1.836
x = = 0.335
30
Uno puede difcilmente esperar que entre todos los estudiantes tengan exactamente 1248 mascotas. Al
mismo tiempo, nos gustara tener cierta confianza en el resultado. Podemos suponer que si no es
exactamente 1248, entonces es un intervalo al cual pertenece el valor correcto. Ciertamente, podra ser
entre 0 y 3 millones, pero esta es una estimacin demasiado basta.

Usando el error estndar, podemos calcular dos importantes valores:

Intervalo de confianza del 95%:



X 1.96
n
Intervalo de confianza del 99%:

X 2.58
n
Tambin, los intervalos son calculados sabiendo la media, la desviacin tpica y el tamao de la
muestra.

Observa que, por consenso entre estadsticos, los clculos se suponen aceptables cuando la muestra
es bastante grande (por ejemplo, teniendo al menos 30 elementos). Esto ocurre en nuestra muestra.

CEFIRE DE GODELLA / CASIO Pg. 44


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Con un 95% de confianza, el nmero medio de mascotas por estudiante est comprendido entre 1.945 y
3.255.

1.836
2.6 1.96
30 = 1.945
X 1.96 =
n 2.6 + 1.96 1.836 3.255
30

Multiplicando estos lmites del intervalo de confianza por 480 estudiantes, obtenemos 933 y 1562
mascotas como lmites de nuestro intervalo de confianza.

Los resultados son ahora 1.738 y 3.462. Esto implica que el nmero de mascotas est comprendido
entre 834 y 1662. Como antes, los lmites para el intervalo de confianza del 99% resultan de multiplicar
los lmites para la media por estudiante (que son 1.738 y 3.462) por 480.

ACTIVIDADES

o Usando una hoja de clculo, calcula la media de mascotas y la desviacin tpica para la muestra
formada por tu grupo de clase. Forma un grupo de al menos 30 personas para hacer una muestra
suficientemente grande para futuros clculos.

o Usando los datos del apartado anterior, calcula el error estndar. Estima el nmero de mascotas que
tienen los estudiantes de tu instituto con un intervalo de confianza del 95%.

o Un examen a 49 fumadores muestra que su gasto medio en cigarrillos es $20 por semana con una
desviacin tpica de $5. Usando un nivel de confianza de 0.95, cul es el gasto individual en cigarrillos
por semana?

Soluciones:

3) Entre $18.60 y $21.40.

2. INTERVALO DE CONFIANZA PARA LA MEDIA

ACTIVIDAD 1

Supongamos que se selecciona una muestra aleatoria de 64 dulces y la media de masa de estos dulces es
de 0.932 gramos y el valor de la desviacin tpica s es 0,1 gramos. Halla el intervalo de confianza del 95%
para la media de masa de la poblacin.

Solucin:

La media de la muestra es x =0.932, la desviacin tpica de la muestra es s=0.1 y el tamao de la muestra


es n=64.

Como la varianza de la poblacin es conocida y el tamao de la muestra es > 30, podemos sustituir la
desviacin tpica de la poblacin por s. Por lo tanto el intervalo de confianza del 95% puede calcularse
como sigue, donde z 0.025 denota el valor tal que P( Z < z 0.025 ) =0.95 donde Z ~ N(0,1) .

s s
x z0.025 , x + z0.025 .
n n
Podemos hallar el mismo intervalo de confianza con la calculadora grfica. Abre el men [STAT]. Aparece la
siguiente pantalla:

CEFIRE DE GODELLA / CASIO Pg. 45


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Ahora pulsa [F4] [INTR] [F1] [Z] [F1] [1S] para seleccionar el comando 1-sample Z interval. En la lnea
[Data] de la siguiente pantalla, seleciona Variable. Introduce los valores de los parmetros que se indican en
la pantalla de la derecha de la siguiente figura y pulsa [EXE].

En la siguiente pantalla vemos que los extremos inferior (left) y superior (right) del intervalo de confianza son
0.9075 y 0.9565 con 4 decimales exactos.

En resumen, el intervalo de confianza del 95% para la masa media de los dulces es, aproximadamente,
(0.9075, 0.9565) , o 0.9075 < < 0.9565 .
Frecuentemente el tamao de la muestra se ve obligado por algunos factores y puede ser menor que 30.
Cuando una muestra pequea es elegida de una poblacin normal con varianza desconocida, es ms
apropiado utilizar una distribucin t de Student para hallar el intervalo de confianza.

ACTIVIDAD 2

Supongamos que debido a restricciones de tiempo, una muestra aleatoria de 16 dulces es elegida de entre
los 64 de la actividad 1 anterior. Se mide la masa de cada dulce, x (gramos), y las medidas se resumen por
los parmetros x =13.3 y x 2 =15.13. Suponiendo que la media de la masa sigue una distribucin
normal, halla el intervalo de confianza del 95% para la media de la poblacin. Da el intervalo de confianza
con 3 decimales exactos.

Solucin:

Aunque la media y la varianza de la muestra no son conocidas, podemos calcularlas fcilmente en el Editor
RUN de la calculadora.

Del clculo hallamos la media de la muestra x =0.83125 y la varianza de la muestra s 2 =0.271625 de


donde obtenemos la desviacin tpica muestral s=0.52118, con 5 decimales exactos.

[Nota] La varianza de la muestra se halla con la frmula:

CEFIRE DE GODELLA / CASIO Pg. 46


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

n x 2 ( x ) 2 1 ( x )
2

s =
2

n(n 1)
=
n 1
x n .
2


Este intervalo de confianza se basar en la distribucin t15, y el intervalo de confianza del 95% se puede
calcular usando la frmula:
s s
x c , x +c .

n n

Donde c es el punto para el cual la probabilidad es p=0.975 en una distribucin t de Student con 15 grados
de libertad. La probabilidad es 0.975 porque la probabilidad de 1-0.95=0.05 en dos ramas de la distribucin
simtrica implica 0.025 en la rama superior y de aqu que p=0.975.

Podemos hallar el mismo intervalo de confianza con la calculadora grfica. Abre el men [STAT]. Pulsa [F4]
[INTR] [F2] [t] [F1] [1S] para seleccionar el comando 1-sample t interval. En la lnea [Data] de la siguiente
pantalla selecciona Variable. Selecciona [C-Level] como 0.95. Teclea en x =0.83125 (valor que hemos
obtenido ahora), y como es un intervalo de confianza basado en la distribucin t de Student, introduce la
desviacin tpica muestral s=0.52118 en lugar de la desconocida (aparece como x n 1 en la
calculadora.)

Al pulsar [EXE] obtenemos que los extremos inferior y superior del intervalo de confianza son 0.554 y 1.109
respectivamente, con 3 decimales exactos.

En resumen, el intervalo de confianza del 95% para la media de la masa en la poblacin es


0.554 < < 1.109 .

En la siguiente actividad veremos el uso de la hoja de clculo para resolver este tipo de problemas.

ACTIVIDAD 3

Supongamos que una compaa que produce dulces necesita hallar la media de masa de los dulces que
produce para poder imprimir este dato en la envoltura. Como la factora produce 10000 piezas de dulces por
da, elegir una muestra aleatoria es la aproximacin ms factible. Su jefe de marketing decide elegir una
muestra aleatoria de 40 dulces para esta tarea.

Usa la calculadora grfica para:

i. Seleccionar una muestra aleatoria de 40 piezas de dulces.

ii. Registrar la masa de cada dulce y calcular el resumen de parmetros estadsticos de los datos.

c) Hallar el intervalo de confianza del 99% para la media de la poblacin.

Despus, discute con tus compaeros sobre la media de masa poblacional obtenida.

CEFIRE DE GODELLA / CASIO Pg. 47


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Solucin:

a. Empezamos seleccionando al azar 40 nmeros usando la funcin [Ran#]. Observa que las salidas
tienen diez dgitos decimales diferentes y que siempre se cumple esta desigualdad:

0 < Ran# < 1

Cuando multiplicamos [Ran#] por 10000, obtenemos 0<10000Ran#<10000. Si utilizamos la funcin


parte entera [Int] (que est localizable en la pantalla RUN), seguida de la expresin 10000Ran#, y
sumamos 1, obtenemos una expresin que produce valores enteros entre 1 y 10000, ambos inclusive.

Esta expresin puede obtenerse tambin en la hoja de clculo. Abrimos el Editor de Hoja de clculo.
Dejamos la columna A para ser usada despus y nombramos la columna B como Random. Para
generar en la columna Random 40 nmeros enteros desde 1 hasta 10000, selecciona [EDIT] seguido
de [FILL]. Despus, en la lnea Frmula, introduce la frmula =Int(10000Ran#)+1 y en la lnea [Cell
Range] introduce el rango de celdas B2:B41.

Habiendo generado los 40 nmeros al azar, guardamos estos nmeros en la lista [List1] antes de
recuperar el mismo conjunto de nmeros en la columna C. En la columna ordenaremos los nmeros en
orden ascendente y chequearemos alguna posible repeticin de los nmeros.

Ves a la celda B2, pulsa [SHIFT] [8] (CLIP), despus mueve el cursor hacia abajo hasta la celda B41.
Con el rango de celdas B2:B41 seleccionado, pulsa [STO] [LIST] para guardar estos nmeros en la lista
[List1].

Pulsa [EXE] para regresar a la hoja de clculo y llama Sample a la columna C; despu ves a la
primera celda vaca en la columna Sample y pulsa [RCL] [LIST] para pegar los datos de la lista [List1].

CEFIRE DE GODELLA / CASIO Pg. 48


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Para ordenar la columna Sample, usa tambin [SHIFT] [8] (CLIP) para seleccionar las celdas C2 a
C41 y ordena la columna con [EDIT] [SRTA]; despus explora y localiza posibles repeticiones de
nmeros.

La lista no tiene nmeros repetidos y, por tanto, hemos seleccionado una muestra aleatoria de 40
dulces. Observamos que el primer dulce que ha sido pesado es el que se ha producido en el lugar 207,
el segundo dulce ha sido el que ocupa el lugar de produccin 268 y as sucesivamente (ver la columna
Sample)

b. Para empezar a registrar las masas de la muestra, cremos una columna denominada Mass para
guardar los datos de las masas de los dulces. Despus iniciamos la introduccin de las masas de los
dulces producidos en los lugares 207, 268, 341 9437 y 9768. Supongamos que los datos parciales
que se muestran en la figura, en gramos, son los datos recogidos actualmente (explora la columna
Mass ) .

Para tener un significado de la muestra, calculamos el resumen de parmetros estadsticos. Mientras se


visualiza la pantalla de hoja de clculo, pulsa [CALC] [SET] para hallar el resumen de estadsticos de los
datos registrados en las celdas D2 a D41.

Despus selecciona [1 VAR] y aparecern en pantalla los estadsticos de la muestra.

Observa que tenemos x =8.05125 y x n 1 =0.03428294.

c. Podemos improvisar una hoja de clculo para halalr los extremos del intervalo de confianza para la
media de la masa de los dulces. Para esta actividad usamos la columna A para los percentiles de las
distribuciones normal y t de Student, como se muestra en la pantalla de la izquierda. Tambin
arreglamos la hoja de clculo para usar el percentil apropiado (ver la celda F2) basado en el tamao de
la muestra introducido. La regla general es que si la muestra tiene ms de 30 datos, los percentiles
estn basados en la distribucin normal estndar.

CEFIRE DE GODELLA / CASIO Pg. 49


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

En una situacin de la vida real como en esta actividad, la varianza es raramente conocida. Cuando
esto ocurre usamos la desviacin tpica muestral s para reemplazar a , independientemente del
tamao de la muestra. Despus el intervalo de confianza se calcula como sigue, donde p es el percentil
apropiado.
s s
x p , x+ p
n n

Teniendo en cuenta esto, las expresiones para hallar los extremos inferior y superior del intervalo de
confianza se introducen, en este caso, en las celdas E4 y F4 como sigue.

Observa que actualmente x toma el valor 8.05125, y xn 1 es 0.03428294 cuando calculamos el


resumen de estadsticos para la media de masa. Tambin, introducimos ambos x y xn 1 en las
celdas E4 y F4 con el CATLOG (pulsando [SHIFT] [4].

Para esta actividad el tamao de la muestra (40) se considera grande y por tanto, la media de la
muestra se calcular con una distribucin normal. De la tabla de la distribucin normal estndar
obtenemos que el percentil que corresponde al intervalo de confianza del 99% es 2.576.

Puesto que la media de la muestra se considera que sigue una distribucin normal, introducimos el valor
2.576 en la celda A2, seguida por el tamao de la muestra 40. Como observamos, los extremos inferior
y superior del intervalo de confianza son 8.0372 y 8.0652 respectivamente, lo que dice que el intervalo
de confianza del 99% para la masa media de la poblacin es (8.0372, 8.0652) .

Es decir, con una confianza del 99% la media de la masa de la poblacin pertenecer al intervalo
anterior. La compaa podr imprimir en el envoltorio que la masa media es 8.05g, con 2 decimales
exactos.

Aparentemente la forma rpida para encontrar el intervalo de confianza de la Actividad 3 es usando la


funcin [INTR] en el modo [STAT], como vimos en la Actividad 1. En primer lugar, almacenamos los
datos de las celdas D2 a D41 en la lista [List2]. Despus, abrimos el men [STAT] para iniciar el Editor
de Listas.

Pulsamos [INTR] [Z] [1-S] para introducir el comando 1-sample Z interval. En la lnea Data selecciona
List, en la lnea CLevel introduce 0.99, en la lnea introduce s=0.03428294 como aproximacin de
(ya que la desviacin tpica poblacional es desconocida), en la lnea List introduce la lista List2, deja la
frecuencia Freq=1 y pulsa [EXE]. El intervalo de confianza obtenido debe ser el mismo que el
encontrado en la Actividad 3.

CEFIRE DE GODELLA / CASIO Pg. 50


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Hallar el intervalo de confianza usando el mtodo anterior es ms rpido, pero la creacin de una hoja
de clculo es ms interactivo, verstil y flexible. Por otra parte, los datos y clculos estn disponibles
para revisarse en la misma ventana.

ACTIVIDADES
1) La variable aleatoria Y sigue una distribucin normal con media y varianza desconocida. Una muestra
de 200 observaciones de Y da como resultado y =541.2, y 2 =1831.42. Halla:
a) Un intervalo de confianza del 90% para la media .
b) Un intervalo de confianza del 98% para la media .
2) Haz de nuevo la Actividad 3, pero seleccionando una muestra aleatoria solamente de tamao 18.

Soluciones:
a. La media de la muestra y s se pueden calcular fcilmente con el Editor RUN.

Obtenemos que la media de la muestra es x 2.7060 y s1.3579.

Usando la opcin [INTR], obtenemos que el intervalo de confianza para la media del 90% es (2.548,
2.864) y el intervalo de confianza para la media del 98% es (2.483, 2.929), con 3 decimales exactos.

b. Con la muestra de tamao 18, es ms apropiado el intervalo de confianza basado en la distribucin t17
de Student. De la tabla obtenemos que el percentil para 17 grados de libertad y probabilidad de 0.995
es 2.898. Podemos crear una hoja de clculo similar a la de la Actividad 3 para resolver el problema,
pero para la discusin de esta solucin usaremos la hoja de clculo de la Actividad 3 en la que
introduciremos el nuevo percentil y el nuevo tamao de la muestra.

CEFIRE DE GODELLA / CASIO Pg. 51


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

El intervalo de confianza del 99% para la media de la poblacin resulta ser (8.0278, 8.0746).

3. TESTS DE HIPTESIS I

ACTIVIDAD 1

La estatura media de un equipo de hockey es 182 cm con una desviacin tpica de 4.1 cm; el peso
medio es 77 kg con una desviacin tpica de 3.5 kg. Un equipo de hockey ha adquirido recientemente a
10 nuevos jugadores. Sus datos estn en la siguiente tabla:

El entrenador presume de que las presentes medias son ptimas para su estrategia de juego. Sabe que
su asistente es hbil en Estadstica y le pregunta sobre si las medias de los nuevos jugadores se
ajustan o no a la situacin actual del equipo.

1. Ayuda al asistente a formular la hiptesis nula sobre las estaturas de los jugadores.

2. Es un test unilateral o bilateral?

3. El test es bilateral. Suponiendo el nivel de significacin 0.05, qu valor crtico debemos usar?

Soluciones:

1. No hay diferencia significativa entre la estatura de los antiguos jugadores y de la de los nuevos.

2. El problema es bilateral. Estamos interesados en alguna diferencia (ambos lados) y se supone que una
media de los jugadores ms baja que la antigua causara problemas.

Los problemas unilaterales presuponen que es importante una cierta diferencia, pero no la otra. (Por
ejemplo, el entrenador no debe tener jugadores peores de los que ya tiene, pero no debe preocuparse si
los nuevos son mejores).

3. La regin de no rechazo de la hiptesis nula es el intervalo desde 1.96 hasta +1.96.

CEFIRE DE GODELLA / CASIO Pg. 52


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

ACTIVIDAD 2

Una hiptesis nula correcta dice: No hay diferencia significativa entre la estatura de la media de los
jugadores y la de los nuevos jugadores.

Decidimos usar el nivel de significacin 0.05 para aceptarla o rechazarla. Ahora calcularemos el estadstico
z del test. Su formula es
_
X
z=

n
_
donde X es la media de la muestra (por ejemplo la estatura media de los nuevos jugadores), es la media
de la poblacin (en nuestro caso 182 cm), es la desviacin tpica de la poblacin (en nuestro caso 4.1), y
n es el nmero de jugadores en nuestra muestra (en este caso, 10).

Calcula el estadstico z en una hoja de clculo, usando los datos introducidos. Primero, calcula la media de
estaturas de los nuevos jugadores en la celda B12. Despus con la celda seleccionada, pulsa [EDIT] [CELL]
[CEL] [Mean] para que aparezca en pantalla el comando (CellMean). Introduce el rango B2:B11, cierra
parntesis y pulsa [EXE]. La media es 183.9.

El valor de z puede calcularse en la celda B13.

ACTIVIDADES
a) El valor de z es 1.4654. Interpreta el resultado.

b) Formula la hiptesis nula para el peso de los jugadores. Es un problema unilateral o bilateral?

Soluciones:

a. El valor de la variable Y est entre 1.96 y 1.96. La hiptesis nula se acepta. La diferencia en estaturas
no es significativa.

b. No hay una diferencia significativa entre el peso medio del equipo y el de los nuevos jugadores.

ACTIVIDAD 3
Usando los datos de la hoja de clculo, calcula el estadstico del test para el peso de los jugadores. Como
dijimos en una actividad anterior, el peso medio de los jugadores es 77 kg con una desviacin tpica de 3,5
kg.

ACTIVIDADES
a) z = 2.7105. Interpreta el resultado.
b) Odo el ltimo resultado, el entrenador dice: Necesito hombres duros. Si tengo en cuenta solamente
estos, son dbiles. Interpreta sus palabras en trminos estadsticos.

CEFIRE DE GODELLA / CASIO Pg. 53


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Soluciones:

a) La hiptesis nula debe ser rechazada. Hay diferencias significativas entre el peso de los antiguos y
nuevos jugadores.

b) El problema est cambiado para un test unilateral. La hiptesis nula es ahora: El peso medio de los
nuevos jugadores no es significativamente inferior al de todos los jugadores. El valor crtico para su
rechazo es 1.645.

ACTIVIDAD 4
Un fabricante de telfonos mviles anuncia que el 96% de sus telfonos mviles (con un 5% de desviacin
tpica) pueden funcionar regularmente tras caerse de una altura de 2 metros. Para demostrar esto, invita a
los representantes de los comerciantes y selecciona al azar 100 nuevos telfonos mviles de la lnea de
produccin. Todos han sido lanzados de un armario de 2 metros de altura hasta el suelo. Cinco de ellos (es
decir, el 5%) no funcionan despus del lanzamiento. Puede ser aceptado como correcto el anuncio del
fabricante?

a) Formula la hiptesis nula.

b) Es un test unilateral o bilateral?

c) Indica los datos necesarios para calcular el estadstico z del test.

Solucin:

a. El nmero de telfonos mviles rotos no es significativamente diferente del 5%.

b. El test es unilateral. Tenemos solamente inters en los peores resultados del test, no en los positivos.
As, su valor crtico es 1.645.
_
c. Usando X = 95, = 96, = 5, y n = 100, calculamos el estadstico del test con la frmula:
_
X
z=

n
El anuncio debe ser rechazado. El valor crtico para el test unilateral es 1.645. El estadstico del test es
z=2. El valor cae en la regin de rechazo.

4. TESTS DE HIPTESIS II

EJEMPLO
Un estudio indica que los adultos en Amrica dedican una media de 18 horas por semana a actividades de
tiempo libre. Un investigador busca el test de este anuncio. Toma una muestra de 10 adultos y les pregunta
sobre el tiempo que dedican por semana a actividades de tiempo libre. Sus respuestas (en horas) son las
siguientes:

14 25 22 38 16 26 19 23 41 33

Suponemos que el tiempo dedicado a actividades de tiempo libre por todos los adultos sigue una
distribucin normal. Usando el nivel de significacin del 5%, podemos concluir que el anuncio de este
estudio es verdadero?

CEFIRE DE GODELLA / CASIO Pg. 54


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Solucin:

Sea = 18 horas la media de horas que los adultos de Amrica dedican por semana a actividades de
tiempo libre. Sea x la correspondiente media para la muestra.

Vamos a poner a prueba si la media de horas que los adultos americanos dedican a actividades de tiempo
libre es o no 18 horas. Nuestras hiptesis nula y alternativa son las siguientes:

Hiptesis nula: H 0 : 0 = 18 (la media de horas que los adultos americanos dedican por semana a
actividades de tiempo libre es 18 horas)

Hiptesis alternativa: H1 : 18 (la media de horas que los adultos americanos dedican por semana a
actividades de tiempo libre es diferente de 18 horas)

En el Editor [STAT], introducimos los datos en la lista List 1 como sigue:

En las pantallas de la figura, observa que uno de los tems del men es [TEST]. Seleccionando este men
podemos ver los procedimientos de test de hiptesis disponibles. Elegimos el test t de Student pulsando [t],
en particular elegimos one-sample t test pulsando [1-S]:

Usualmente, las condiciones bajo las cuales se usa la distribucin t de Student para hacer tests de hiptesis
sobre la media son las siguientes:

1. Si el tamao de la muestra no es demasiado grande (la mayora de las veces menor que 30),

2. La desviacin tpica de la poblacin es desconocida y

3. La poblacin de la que se extrae la muestra sigue una distribucin normal.

Introducimos el valor 0 = 18 , la hiptesis alternativa 0 e indicamos que nuestros datos aparecen en


la lista List 1. Despus situamos el cursor en la lnea [Execute]:

Cuando el test es ejecutado, podemos mostrar los clculos (eligiendo [CALC]) o mostrar el grfico (eligiendo
[DRAW]).

CEFIRE DE GODELLA / CASIO Pg. 55


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

La media para la muestra es x = 25.7, y la desviacin tpica de la poblacin x n-1 es 9.0437. El valor del
estadstico del test es t = 2.692.

Ahora, determinamos las regiones de rechazo y no rechazo. El nivel de significacin es 0.05. El signo en
la hiptesis alternativa indica que el test es bilateral con dos regiones de rechazo, una en cada lado de la
curva de la distribucin t de Student para la media muestral x . Como el rea total de ambas regiones de
rechazo es 0.05, el rea de la regin de rechazo en cada lado es 0.025. El nmero de grados de libertad es
n1 = 9 , (donde n es el tamao de la muestra). Hay dos puntos crticos que separan las regiones de
rechazo y de no rechazo. De la tabla de la distribucin t de Student obtenemos que los puntos crticos son
2.262 y 2.262.

El valor del estadstico del test t = 2.692 cae en la rama de la derecha de la curva, despus del valor crtico
2.262, lo que indica que pertenece a la regin de rechazo. Consecuentemente, rechazamos H0. Concluimos
que la media de horas que los adultos americanos dedican por semana a actividades de tiempo libre no es
18 horas.

El grfico muestra que es un test bilateral. Seleccionando [T] podemos visualizar el estadstico del test:

ACTIVIDADES
1) Una compaa anuncia que sus yogures bajos en caloras contienen, por trmino medio, a lo sumo 150
caloras por unidad. Una agencia de consumidores decide investigar si la afirmacin de este anuncio es
no cierta. Una muestra aleatoria de 10 yogures produce los siguientes datos de caloras.

147 159 153 146 144 161 163 153 143 158

Con un nivel de significacin del 2.5% investiga si la afirmacin de la compaa es cierta. Suponemos
que el nmero de caloras para cada yogur producido por esta compaa sigue aproximadamente una
distribucin normal.

2) Registramos de un anuncio de un supermercado que sus consumidores gastan una media de $65 por
compra. Recientemente, el jefe del almacn ha iniciado una promocin para animar a ms
consumidores a gastar ms dinero en el supermercado: cada cliente recibir puntos basados en el
dinero total gastado en el supermercado, y estos puntos pueden ser canjeados por productos del
almacn. Para averiguar si la promocin est funcionando, el jefe toma una muestra de 12 clientes. Los
siguientes datos indican el dinero gastado, en dlares, por esos clientes en el supermercado durante
sus compras:

90 67 150 27 102 41 34 55 74 58 120 82


Suponemos que el dinero gastado por todos los consumidores de este supermercado sigue una
distribucin normal. Usando un nivel de significacin del 1%, podemos concluir que la cantidad media
de dinero gastado por todos los clientes de este supermercado despus de la campaa iniciada es ms
de $65?

CEFIRE DE GODELLA / CASIO Pg. 56


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

Soluciones:

1) Testearemos si los yogures bajos en caloras contienen, por trmino medio, a lo sumo 150 caloras por
unidad. Nuestras hiptesis nula y alternativa son las siguientes:

Hiptesis nula: H 0 : 150 (la media de caloras por yogur es como mucho 150 caloras)

Hiptesis alternativa: H1 : > 150 (la media de caloras por yogur es mayor de 150 caloras)

Tras introducir los datos en la lista List 1 del Editor [STAT], introducimos la siguiente informacin
despus de acceder al men [TEST] (ignora los mensajes de error pulsando [EXIT])

Introducimos el valor 0 = 150 , la hiptesis alternativa > 150 e indicamos que nuestros datos
aparecen en la lista List 1.

Nuestros clculos dan los siguientes resultados:

La media de la muestra es x = 152.7, y la desviacin tpica de la poblacin x n-1 es 7.3794.

El valor del estadstico del test es t = 1.1570248.

En este problema, el nivel de significacin es 0.025. El signo > en la hiptesis alternativa indica que el
test es unilateral por la derecha y la regin de rechazo queda en la reama de la derecha de la curva de
la distribucin t de Student. El rea de la rama de la derecha es 0.025 y los grados de libertad son n -1 =
9. De la tabla de la distribucin t de Student deducimos que el valor crtico de t para 9 grados de libertad
y rea 0.025 por la rama de la derecha es 2.262.

El estadstico del test es 1.1570248 y es menor que el valor crtico 2.262, obtenido de la tabla de la
distribucin t de Student. Cae fuera de la regin de rechazo. Consecuentemente, aceptamos H0. As,
concluimos que la media de caloras por yogur es como mucho de 150 caloras.

A partir de la grfica del test, vemos el valor del estadstico del test y el hecho de que es un test
unilateral con cola a la derecha.

CEFIRE DE GODELLA / CASIO Pg. 57


MATEMTICAS Y TECNOLOGA CON CALCULADORA GRFICA Enero/Febrero 2008

2) Para este problema, testearemos si la cantidad media de dinero gastado por todos los clientes del
supermercado tras la campaa iniciada es ms de $65. Nuestras hiptesis nula y alternativa son las
siguientes:

Hiptesis nula: H 0 : > 65 (la cantidad media de dinero es mayor que 65)

Hiptesis alternativa: H1 : < 65 (la cantidad media de dinero es menor de 65)

En el Editor [STAT], introducimos el valor 0 = 65 , la hiptesis alternativa < 65 e indicamos que


nuestros datos aparecen en la lista List 1, tras acceder al men [TEST].

Los clculos son los siguientes:

La media de la muestra es x = 75, y la desviacin tpica de la poblacin x n-1 es 36.366818. El valor del
estadstico del test es t = 0.9525446.

El nivel de significacin es 0.01. El signo < en la hiptesis alternativa indica que el test es unilateral con cola
a la izquierda, con la regin de rechazo en la cola de la izquierda de la curva de la distribucin t de Student.
Para hallar el valor crtico de t, necesitamos conocer el rea en la cola de la izquierda y los grados de
libertad.

En nuestro caso, el rea en la cola de la izquierda es 0.01, y los grados de libertad son n -1 =12-1 =11. De
la tabla de la distribucin t de Student, el valor crtico de t es 2.718. El valor de t es 0.9525446 mayor que -
2.718 y cae fuera de la regin de rechazo. Por tanto, aceptamos H0 y concluimos que la cantidad media de
dinero gastado por todos los clientes de este supermercado tras la campaa publicitaria es mayor de $65.

El grfico del test muestra el estadstico del test y el hecho de que el test es unilateral con cola a la
izquierda.

CEFIRE DE GODELLA / CASIO Pg. 58

Vous aimerez peut-être aussi