Vous êtes sur la page 1sur 20

Distribuccin binomial

Captulo

Introduccin

Secciones

Introduccin
1.1 Ideas de la estadstica
1.2 Organizacin de las ideas estadsticas
1.3 Datos y escalas de medicin
1.4 Planeacin de un estudio estadstico

Antecedentes

1.5 Simulacin (mtodos de Monte Carlo)

Concepto de variable.
Manejo bsico de una computadora para acceder a Excel y a Internet.

Objetivos
Proporcionar elementos para:

Exponer las caractersticas distintivas de los diversos escenarios donde se usa


la estadstica.

Presentar algunas de las ideas esenciales en que se sustenta y describir las


ramas en que se divide.

Analizar el origen y el tipo de datos con los que se trabaja, as como sus distintas escalas de medicin.

Proporcionar, mediante algunos ejemplos, una introduccin a los mtodos de


Monte Carlo.

Introduccin
La estadstica se concibe popularmente como cifras numricas y grficas; stas, ms bien,
son algunos de los resultados de emplear una coleccin de ideas y mtodos que configuran
dicha disciplina.
La estadstica ayuda a tomar decisiones ante circunstancias cuyas caractersticas distintivas son incertidumbre y variabilidad. La primera caracterstica se origina en la imposibilidad de considerar todos los factores involucrados, dada la complejidad del entorno en
general. La segunda, se debe a la variacin inherente en todo aquello que ocurre natural

Captulo 1 Introduccin

o cotidianamente, e, incluso, en aquello que se fabrica, independientemente del rigor con


que se fijen y se lleven a cabo las condiciones de produccin.
Con el fin de abordar la incertidumbre, la estadstica se vale del clculo de probabilidades, creando modelos que permiten estimar los riesgos implicados en la toma de decisiones.
Si se considera que: 1) prcticamente todas las ciencias naturales, exactas, sociales, econmicas, de la conducta y cualquier evento de la cotidianidad, pueden enmarcarse bajo incertidumbre y variabilidad, y 2), que la toma de decisiones es indispensable y que tiene un efecto en
la vida diaria, se puede empezar a vislumbrar la importancia del estudio de la estadstica.

1.1 Ideas de la estadstica


Debido a que la informacin es la materia prima en la toma de decisiones, y a que los resultados de aplicar una tcnica estadstica no son ms exactos que los datos o hechos en los que se
basa, puede entenderse que el primer paso sea la planeacin y obtencin de informacin consistente.
En general, sta es voluminosa y carente de significado a primera vista. Conviene, por tanto,
incorporar la idea de orden, y en consecuencia proceder a ordenarla. Una vez hecho esto se
debe resumir la informacin, a fin de poderla manejar de manera ms sencilla y gil. Con esto
se pueden distinguir algunas ideas de la estadstica: planeacin, obtencin, orden y resumen de
informacin, que dan lugar a tcnicas o mtodos que arrojan cifras numricas, tablas y grficas,
cuya interpretacin adecuada permite describir la situacin de donde vienen los datos.
Los datos, sin embargo, no siempre son suficientes, debido a la complejidad de las situaciones en general. En consecuencia, ser inevitable trabajar bajo incertidumbre, y, por
lo tanto, que los resultados numricos a los que se llegue no sean puntuales o categricos!
Ejemplos de esto son: el resultado del lanzamiento de una moneda, el que la bolsa de valores baje o suba, el que las especificaciones de un producto manufacturado estn dadas
dentro de un cierto intervalo de valores, el que el candidato de un cierto partido poltico
gane una eleccin popular, el resultado de una operacin quirrgica, el movimiento en el
aire de una partcula de polvo, el que se presente un terremoto, etctera.
A este tipo de fenmenos se les conoce genricamente como aleatorios o fortuitos, con
el fin de diferenciarlos de los que se han estudiado previamente, por ejemplo en fsica y qumica, y que suelen llamarse determinsticos, ya que hay leyes bien establecidas que permiten
calcular, si se cumplen ciertas condiciones, los resultados de manera exacta. No obstante, como
se ver en seguida, aun en esos casos es inevitable trabajar bajo incertidumbre, debido a
varias causas, como la imposibilidad de cumplir con las condiciones requeridas; otras ms
son la precisin de los instrumentos con los que se trabaja, las condiciones naturales y las
fallas humanas. Para ver esto, se emplea un ejemplo sencillo de la fsica elemental, cuyos
resultados por lo regular pueden considerarse exactos.
Ejemplo 1.1 La ley de Ohm establece que: V=RI, por lo cual, si I=5 mA y

R=1 k, entonces V=0.0051 000 =5 volts.

El resultado anterior es vlido siempre y cuando la resistencia que se emplee valga


exactamente 1 k. Sin embargo, en la prctica se sabe que una resistencia se especifica
por su valor nominal (que significa valor promedio) y su tolerancia (por ejemplo 10%, 5% o 1%).
R = 1000 50
Si se asume que la resistencia que se usa tiene una
tolerancia de 5%, el clculo anterior arrojara:
V=0.005(1 00050)=50.25 volts. Es decir, que tener incertidumbre en el valor exacto de
R, provoca variabilidad en los resultados (voltaje).
De un resultado preciso de 5 volts se ha pasado a
Resistencia elctrica
una estimacin mediante un rango de valores:
[4.75, 5.25] volts.

1.2 Organizacin de las ideas estadsticas

Debido a la vaguedad o incertidumbre de los resultados, la estadstica se vale del clculo de probabilidades, ya que ste surge y se desarrolla alrededor de fenmenos aleatorios
(juegos de azar), logrando un concepto para cuantificar la incertidumbre, llamado probabilidad, que suele definirse como la medida de lo posible. La estadstica y el clculo de probabilidades proporcionan conceptos y mtodos para estudiar y modelar la variabilidad, y
para medir la incertidumbre de los fenmenos aleatorios. Esto da lugar a expresar el riesgo
de las decisiones que se tomen al usar los valores que se empleen como resultados.

1.2 Organizacin de las ideas estadsticas


De acuerdo con el tipo de situacin y los objetivos del estudio, la estadstica se divide
habitualmente en estadstica descriptiva e inferencial. Se busca, sin embargo, resaltar una
serie de tcnicas estadsticas conocidas como anlisis exploratorio de datos, ya que tienen
elementos, mtodos y objetivos propios que pueden complementar la estadstica descriptiva e inferencial. Se empezar entonces con el anlisis exploratorio de datos y luego con
las divisiones tradicionales.

Anlisis exploratorio de datos


El anlisis exploratorio de datos (AED) es la parte ms actual de las tcnicas estadsticas,
caracterizada por su sencillez debida principalmente a: 1) el empleo de grficas y la
reduccin del uso de frmulas algebraicas, y 2) a que requiere muy pocas consideraciones
previas sobre los datos. Estos dos aspectos hacen del AED un elemento ideal en la exploracin preliminar de un conjunto de datos.
El AED enfatiza la importancia de organizar y desplegar los datos grficamente,
de modo tal que se puedan percibir valores distintivos, como valores extremos, atpicos
(valores especiales), conglomerados (grupos de datos muy cercanos entre s) y brechas (separaciones de magnitud considerable entre conglomerados), as como la identificacin
de patrones globales. Esto da lugar al planteamiento de preguntas que quiz no hubieran
surgido antes.
Por ejemplo, si un conjunto de datos tiene la representacin grfica llamada de puntos:

10

15

20

25

30

35

Independientemente de lo que representen los datos, se puede apreciar en el diagrama


que hay un valor considerablemente mayor que todos (30) y que puede verse como atpico;
que se tienen dos conglomerados o racimos (un grupo de 5 valores iguales y un grupo
de 3 valores iguales), y que hay brechas entre los valores de 7 y 11, y 11 y 30. A partir de
esto, se puede aadir que el valor atpico es prcticamente 3 veces ms grande que el valor ms cercano a l, y que convendra averiguar las caractersticas de los racimos y qu
representan los huecos.
En otro caso, se puede considerar que se tienen las siguientes grficas de tallos y hojas. La lectura de los valores se hace con el primer nmero de la columna de la izquierda
y alguno de los de las columnas derechas; por ejemplo, en el arreglo de campana, en la
segunda fila, el primer elemento es 6, y si se toma la tercera columna de la derecha, es 9;
entonces se tiene el valor 69:

Captulo 1 Introduccin

6|9
representa 69

5
6
7
8
9

4
6 9 9
2 4 4 5 5 9
1 1 7
8

Forma de campana

4|5
representa 45

2
3
4
5
6
7
8
9

5
2
0
4
1
0
2
4

5 8 9
3 4 4 5 8 9
3 4 5 9
1 3 8
1 3 4 4 5 6 8 8
3 5

Forma de U

En el primer caso se puede ver que los valores de los datos son ms o menos simtricos,
balanceados los bajos con los altos. En el segundo caso, los datos siguen una distribucin
en forma de U, y puede deberse a que subyacen en realidad dos grupos, cada uno en forma
de campana. Por tanto, cuando una grfica tiene forma de U, conviene ver si hay alguna
razn para tratar las observaciones como dos grupos separados.

Estadstica descriptiva
La estadstica descriptiva se emplea para describir las caractersticas bsicas de los datos
en estudio. Por medio de grficas y valores numricos calculados algebraicamente (media, desviacin estndar, proporcin, etc.), proporciona resmenes simples de los datos de
que se dispone. En la estadstica descriptiva simplemente se describe lo que son o lo que
muestran los datos. Por tanto, puede decirse que la estadstica descriptiva es una serie de
mtodos para organizar, resumir y presentar datos de manera informativa.
Por ejemplo, en un centro de verificacin vehicular se pueden registrar las emisiones
de HC y CO de un lote de automviles de pasajeros. Se pueden usar estos datos para
analizar el promedio de emisiones del lote, hablar acerca de los mrgenes de emisiones o
presentar cualesquiera otras medidas de datos para el lote con base en el registro.
La mayor parte de las estadsticas deportivas, como el promedio de bateo, rebotes y
nmero de goles, son estadsticas descriptivas, porque se usan para describir el esfuerzo
de un individuo o de un equipo. Muchos de los datos estadsticos generados en la industria
y los negocios son descriptivos. Podran incluir el nmero de empleados en vacaciones
durante el mes de diciembre, el promedio de salario en un rea administrativa, las ventas
corporativas para 2011 y el promedio de calificacin de satisfaccin gerencial sobre un
censo de las actitudes de los empleados de la compaa.
Conjuntamente con el anlisis exploratorio de datos, la estadstica descriptiva forma
hoy en da las bases de prcticamente cualquier anlisis cuantitativo de datos.

Estadstica inferencial

Sinnimos de Inferir:
Concluir
Deducir
Colegir
Derivar
Predecir
Desprender

Mientras que en la estadstica descriptiva el resumen de los datos no pretende ni implica ir


ms all de los datos de que se dispone, en la estadstica inferencial el objetivo es describir
la poblacin totalidad de los elementos de inters, con base en la informacin obtenida
mediante la observacin de relativamente pocos elementos individuales de la poblacin
(muestra). A este proceso se le llama estimacin de parmetros poblacionales.
Una aplicacin de la estadstica inferencial puede ser en una investigacin farmacutica. Para probar un nuevo medicamento, los investigadores pueden disear experimentos
con un cierto nmero de pacientes, seleccionados al azar a fin de que la muestra sea representativa, y as reducir (no eliminar) la incertidumbre; tratar de llegar a conclusiones y
hacer inferencias acerca de la poblacin a la que va dirigido el medicamento.
Los investigadores de mercado utilizan estadstica inferencial para estudiar la repercusin de la publicidad en diferentes segmentos del mercado, mediante muestras aleatorias
de dichos segmentos.

1.3 Datos y escalas de medicin

Estadstica inferencial y probabilidad


Observe que en estadstica
inferencial se estudia la muestra, pero
el objetivo principal lo constituye la
poblacin.

Se pueden distinguir dos aspectos bsicos de la estadstica inferencial: primero, el hecho


de que la recoleccin de los datos debe realizarse de tal modo que la muestra obtenida sea
representativa de la poblacin subyacente, y, segundo, el que los procedimientos inferenciales deban permitir enunciar conclusiones respecto de la poblacin, con cierto nivel de
confianza.
El primer aspecto se resuelve al tomar muestras aleatorias de la poblacin (vea captulo 2),
con lo cual se prepara el camino para resolver el segundo aspecto, mediante el uso de la teora de la probabilidad. Esto es as debido a que en la teora de la probabilidad se parte del hecho de que se conocen las propiedades de la poblacin en estudio y se formulan y responden
preguntas en trminos de probabilidades, en relacin con una muestra tomada aleatoria o casusticamente de la poblacin. Estos resultados son empleados por la estadstica inferencial, ya
que se trata del proceso inverso: ir de la muestra a la poblacin con cierta probabilidad (nivel
de confianza). Con esto se puede ver la importancia de que la muestra sea aleatoria, ya que de
otra manera sera imposible usar la teora de la probabilidad. La figura 1.1 ilustra esto.
Poblacin

Estadstica
inferencial

Probabilidad
Muestra aleatoria

Figura 1.1
Relacin entre estadstica inferencial y probabilidad

Actividad 1.1 A una muestra aleatoria de 400 personas se les dio a probar una
nueva sopa instantnea. De las 400 personas 250 dijeron que era buena; 50 opinaron
que era regular y el resto de las personas no dieron ninguna opinin. Con base en
los resultados de la muestra, infiera la reaccin de todos los clientes potenciales de la
nueva sopa.

1.3 Datos y escalas de medicin


Siendo los datos los hechos y nmeros que se renen, analizan e interpretan, conviene
reflexionar acerca de ellos; para esto, se empezar atendiendo su origen y tipo.

Origen de los datos


Observe que en estadstica una
poblacin no necesariamente es de
personas.

En cuanto al origen de los datos, puede ser un conjunto de personas, animales, plantas,
objetos o incluso nmeros correspondientes a mediciones, dependiendo de dnde se centre
el inters del estudio. Independientemente de la naturaleza de los elementos (entidades)
del conjunto de estudio, a la totalidad suele llamrsele poblacin. As, una poblacin pueden

Captulo 1

Introduccin

ser los jugadores que han ganado el ttulo de goleo en cada una de las copas del mundo
que se han realizado; los coyotes de la Reserva de la Biosfera de Mapim, en Durango; la
cosecha de aguacate de una huerta en el estado de Michoacn; un lote de productos manufacturados en un turno en una empresa, o las concentraciones de ozono medidas cada
hora en un cierto da de la semana en una ciudad altamente contaminada, como el Distrito
Federal, Guadalajara o Monterrey.
Como se ha visto anteriormente, no siempre es posible estudiar a toda la poblacin, de
modo que usualmente se emplea un subconjunto de elementos, en cuyo caso se dice que
se emplea una muestra.

En resumen, 1) los datos pueden tener prcticamente cualquier origen, lo cual permite
ver la universalidad de la estadstica, y 2) es importante establecer si corresponden a la
poblacin o a una muestra de sta.

Ventana al conocimiento
Desde los tiempos ms remotos, ha sido funcin de los gobiernos llevar a cabo registros de poblacin, ganado, tierras, cosechas, impuestos, etc. Contar y medir estos hechos, sin embargo, genera muchas clases de datos numricos y actividades a
realizar con ellos. No resulta entonces extrao saber que en
el siglo XVI el trmino estadstica se deriv del vocablo italiano
statista (estadista), ya que a fin de cuentas es quien se encarga
de administrar el stato (estado). A esta primera etapa del desarrollo de la estadstica se le conoce como de los censos.
Los gobiernos de hoy en da siguen siendo los ms
grandes recolectores de informacin, y para ello cuentan

con diferentes secretaras e institutos; por mencionar slo


dos, en Mxico se tiene la Secretara de Hacienda y Crdito
Pblico (SHCP) y el Instituto Nacional de Estadstica, Geografa e Informtica (INEGI).
Despus del Estado se pueden considerar como recolectores importantes de informacin las universidades; las
organizaciones deportivas, la industria, el comercio, las
aseguradoras de vidas y bienes, las agencias especializadas en encuestas entre las que destacan, a nivel internacional, Gallup, y a nivel nacional, Demotecnia de Mara
de las Heras, etctera.

Existen algunas fuentes de datos ya recabados a donde se puede acudir a consultarlos.


Se dan en seguida algunos sitios de inters.

Sitios en los que se pueden encontrar datos e informacin de inters:


www.inegi.gob.mx
www.femexfut.org.mx
www.unam.mx/
www.imp.mx/petroleo
www.uacm.edu.mx
www.conacyt.mx

1.3 Datos y escalas de medicin

Tipo de datos
El tipo de datos lo definen los atributos en los que se tiene inters respecto a los elementos
de la poblacin. As, en la poblacin de campeones de goleo, un atributo puede ser el nombre y otro la nacionalidad; uno ms el nmero de goles anotados, y otros dos el nmero de
minutos jugados y los minutos en que anotaron sus goles. Cualquiera que sea el atributo o
caracterstica, se puede esperar variacin en los resultados: es difcil que la nacionalidad de
los anotadores sea la misma, que el nmero de goles con el que ganaron sea igual y, todava ms difcil, que las anotaciones hayan sido en el mismo minuto. Se puede entonces ver
el atributo de inters como una variable. As, se tiene la variable nacionalidad, la variable
minutos jugados, etctera.
Las variables pueden clasificarse como cualitativas o cuantitativas. En una variable cualitativa, la medicin describe un elemento, colocndolo en una categora o grupo. En una variable cuantitativa, en cambio, la medicin da valores numricos con los cuales pueden realizarse operaciones, como la suma o el promedio. Siguiendo el ejemplo de los campeones de
goleo, variables como el nombre y la nacionalidad son cualitativas, mientras que el nmero
de anotaciones y el nmero de minutos jugados corresponden a variables cuantitativas.
Quizs hasta ahora el trmino medicin se asocie, en matemticas, con comparar una
cantidad con su respectiva unidad, con el fin de averiguar cuntas veces la segunda est contenida en la primera. En este orden de ideas, se concibe una escala como una sucesin ordenada
de valores consecutivos, cuya diferencia de dos cualesquiera es la unidad. Esto funciona bien
para las variables cuantitativas en donde la medicin da lugar a nmeros; no obstante, a fin
de abarcar las variables cualitativas, se amplan a continuacin los conceptos de medicin y
de escalas.

Escalas de medicin: nominal, ordinal,


de intervalo y de razn
N O
o r
m d
i
i
n n
a a
l
l

I
n
t
e
r
v
a
l
o

R
a
z

La medicin se define como el acto de asignar nombres o nmeros a los elementos de la


poblacin de inters, de acuerdo con ciertas reglas; sin embargo, no siempre se tienen unidades de medida para establecer cuntas veces es mayor un nombre que otro. Atendiendo
a la relacin entre los nombres o nmeros asignados, se tienen diferentes escalas o niveles
de medicin. Tales escalas son: nominal, ordinal, de intervalo y de razn (puede usarse el
recurso mnemnico no ir para recordar las escalas).

Escala nominal
En algunos casos los atributos de inters o las variables consisten en nombres o etiquetas,
y las observaciones (mediciones) nicamente se pueden clasificar. No hay, sin embargo,
un orden particular para las distintas clasificaciones o categoras. Por ejemplo, si se tiene
inters en el sexo de los pollos recin nacidos, la variable sexo se puede clasificar en pollo
y polla, pero el orden no tiene un significado relevante, ya que pudo haberse dado como
polla y pollo. Tambin pudo haberse clasificado la variable sexo como A o B. Si por
simplicidad se hubiera clasificado como 1 o 2, tales nmeros slo serviran para indicar
las categoras, ya que si se realizaran clculos aritmticos con estos cdigos, los resultados
no tendran un significado numrico.
En la escala nominal la medicin consiste en asignar smbolos que pueden ser letras,
nombres o incluso nmeros (sin que haya relaciones matemticas entre ellos). Se puede, sin
embargo, contar el nmero de observaciones de cada clase o categora, y utilizar las frecuencias o porcentajes de las categoras en alguna actividad de presentacin o de anlisis.
Por ejemplo, se puede contar cuntos pollos y cuntas pollas resultaron en una nidada.
Por ejemplo, se desea conocer el tipo de calculadora que usan los estudiantes de una
facultad de ingeniera. Se puede tomar como variable la marca, por lo que una clasifica-

Captulo 1 Introduccin

Elementos

Estudiantes

Elementos

Estudiantes

Variable

Calculadora

Variable

Calculadora

Datos

CASIO

HP

TEXAS

OTRA

Relacin

a)
Figura 1.2a)
Escala nominal

Mutuamente excluyente
Un elemento o su medicin pertenece
nicamente a una categora.

Exhaustivas
Cada elemento debe pertenecer a una
de las categoras.

Datos

CASIO

HP

TEXAS

OTRA

215

322

925

156

Relacin

Ninguna

b)

cin posible (valores de la variable) es: CASIO, HP, TEXAS, OTRA. Las observaciones
que se obtendran en una encuesta entre los estudiantes seran los nombres: CASIO, HP,
TEXAS, OTRA.
El nombre de los datos no permite establecer unidades, ni decir que uno es mayor o
menor que otro; por tanto, no pueden ordenarse ni mucho menos realizarse clculos numricos con ellos (la ordenacin CASIO, HP, TEXAS, OTRA en la figura 1.2a) es arbitraria).
El conteo, sin embargo, del nmero de estudiantes que usan cada tipo de calculadora (figura 1.2b), puede servir para algn tipo de ordenacin o anlisis en la presentacin de los
resultados de la encuesta.
En general, las categoras de esta escala son mutuamente excluyentes, esto es, que cualquiera de los elementos pertenece a solamente una de las categoras. Una calculadora no
puede ser TEXAS y HP.
Las categoras son tambin exhaustivas; esto es, que cada miembro de la poblacin o de
la muestra debe aparecer en una de las categoras. As, si una calculadora no es CASIO, ni
HP, ni TEXAS, cae entonces en la categora OTRA.
En resumen, las caractersticas de las variables del nivel ordinal son:
1. Las categoras que se usan para las variables son mutuamente excluyentes y exhaustivas. Un objeto pertenece a una y slo una categora.
2. Las categoras no guardan un orden lgico entre ellas que permita, por ejemplo,
ordenarlas.

Escala ordinal
Al igual que en la escala nominal, la medicin en la escala ordinal consiste en asignar
smbolos que pueden ser letras, nombres o incluso nmeros. Ejemplos de datos que corresponden a esta escala son las encuestas que hacen los sitios de Internet (Yahoo, Msn,
Hotmail, etc.), en las que se pide categorizar una pelcula, un artculo publicado por ellos
o una opinin respecto de una propuesta de ley. Otro ejemplo se da en la tabla 1.1, que es
una lista de los valores del atributo o variable desempeo con que los alumnos clasificaron
al profesor que les imparti el curso de probabilidad. Cada estudiante en la clase contest
a la pregunta Cmo consideras el desempeo del profesor del curso de probabilidad? Se
les recomend que utilizaran los siguientes criterios: asistencia y puntualidad; respeto
hacia los alumnos; dominio del tema; didctica y congruencia de los exmenes que aplic.
El resultado de aplicar estos criterios debera clasificar al profesor como excelente, muy
bueno, bueno, regular o malo.

1.3 Datos y escalas de medicin

Tabla 1.1
Desempeo
Excelente
Muy bueno

Resultados de la evaluacin de un profesor


de probabilidad
Nmero de alumnos (cuenta)
5
25

Bueno

Regular

Malo

Total

42

A diferencia de la escala nominal, se puede distinguir una relacin entre las clasificaciones, ya que excelente es mejor que muy bueno, muy bueno es mejor que bueno,
y as sucesivamente. Esta relacin entre los valores de la variable desempeo puede expresarse mediante el smbolo relacional > (se lee mayor que):
excelente > muy bueno > bueno > regular > malo
Sin embargo, ya que no hay unidades, no se pueden distinguir las diferencias entre
atributos. Es la diferencia entre excelente y muy bueno la misma que entre muy
bueno y bueno? No se puede decir.
Si se sustituye excelente con 5 y muy bueno con 4, y as sucesivamente, se puede
concluir que la calificacin de 5 es mejor que la calificacin de 4, pero no se puede agregar
una connotacin numrica que indique qu tanto es mejor 5 que 4. Ms an, no se
puede concluir que una calificacin de 4 (que corresponde a muy bueno) sea necesariamente dos veces mejor que una calificacin de 2 (que corresponde a regular). Como en
la asignacin con palabras, slo se puede concluir que una calificacin de 4 es mejor que
una calificacin de 2, pero no cun mejor es.
Observe que, al igual que en la escala ordinal, el conteo de las observaciones de cada
categora da la frecuencia (vea la tabla 1.1), lo cual permite un cierto manejo de las categoras; por ejemplo, presentarlas grficamente.
En resumen, las caractersticas de las variables del nivel ordinal son:
1. Las categoras son mutuamente excluyentes y exhaustivas.
2. Las categoras pueden ordenarse de mayor a menor (o viceversa), de acuerdo con la
caracterstica especial que poseen.

Escala de intervalo

Escalas de temperaturas.

La escala de intervalo posee todas las caractersticas de la escala ordinal, con la propiedad adicional de que los nombres o smbolos asignados son generalmente nmeros, y la
diferencia entre dos de ellos da resultados significativos, ya que hay una unidad de medida comn y constante. Un ejemplo de medicin con escala de intervalo es la lectura de
temperaturas en grados Celsius o Fahrenheit. Suponga que las temperaturas mximas
en Celaya en cuatro das de invierno sean 15, 20, 16 y 21 grados Celsius. Estas temperaturas se pueden ordenar fcilmente, pero tambin se puede determinar la diferencia entre
temperaturas y darle un sentido; por ejemplo, la diferencia entre 15 y 16 grados Celsius
es la misma que entre 30 y 31 grados Celsius, independientemente de la posicin que ocupan ambas parejas en la escala. Consecuentemente la diferencia, por ejemplo, entre 13 y
20 grados Celsius, es la misma que entre 22 y 29 grados Celsius. Asimismo, la suma y la

10

Captulo 1 Introduccin

media aritmtica tienen sentido. Por lo tanto, suele hablarse de la temperatura media, por
ejemplo en el invierno en una cierta ciudad.
Por otro lado, para la escala de intervalo no hay un punto inicial intrnseco o natural.
El cero es un punto elegido arbitrariamente y no representa la ausencia de la condicin.
En la escala de temperatura Celsius, el valor de cero grados Celsius no indica la ausencia
de calor. Esta falta de un cero natural impide que se pueda decir o establecer que 80 grados
sea dos veces ms caliente que 40 grados, aun siendo el valor del atributo dos veces mayor
(vea ejemplo 1.2).

En resumen, las propiedades de la escala de intervalo son:


1. Las categoras son mutuamente excluyentes y exhaustivas.
2. Las categoras estn ordenadas de acuerdo con la cantidad de la caracterstica que
poseen.
3. Diferencias iguales en las caractersticas estn representadas por diferencias iguales
en los nmeros asignados a las categoras.

Ejemplo 1.2 Para elevar la temperatura de un cuerpo de 40 a 80C, se requiere el doble


de calor que para elevar la temperatura del mismo cuerpo de 40 a 60C; sin embargo, el
cuerpo no tendr el doble de calor a 80 que a 40C, debido a que a 40C tena una cantidad de calor, digamos 100 Kcal y para llevarlo a 80C, pudieron requerirse 500 Kcal;
luego entonces, tiene 500 + 100 = 600 Kcal. Para llevarlo de 40 a 60C se requirieron
250 Kcal. Consecuentemente el calor a 60C es 250 + 100 = 350 Kcal.

Actividad 1.2 Los ceros de las escalas Celsius y Fahrenheit, representan la misma

temperatura?
Conoce alguna escala de medicin de temperatura con un cero que signifique ausencia de calor?

Escala de razn

Escala de gramos.

La escala de razn es el nivel de medicin ms alto;


tiene todas las caractersticas de la escala de intervalo, pero, adems, tiene un punto cero natural o terico. Por consiguiente, adems de las diferencias y
las sumas, la multiplicacin y la divisin de los datos
tienen significado numrico racional. Variables como
unidades de produccin e ingresos de una empresa
o negocio se expresan como medidas de razn. Si se
tienen cero unidades de produccin no se tiene ninguna unidad. Mediciones tales como la longitud y
el peso tambin se miden en escala de razn, puesto
que en ambos casos hay un cero terico que significa
Escala de centmetros.
ausencia del atributo. La relacin entre dos nmeros
tambin tiene sentido. Si Federico gana 30 000 pesos
al mes y Antonio gana 10 000 pesos al mes, entonces Federico gana el triple de lo que gana
Antonio (vea actividad 1.3).

1.3 Datos y escalas de medicin

11

En resumen, las propiedades de la escala de razn son:


1. Las categoras son mutuamente excluyentes y exhaustivas.
2. Las categoras estn ordenadas de acuerdo con la cantidad de la caracterstica que
poseen.
3. Diferencias iguales en la caracterstica estn representadas por diferencias iguales
en los nmeros asignados a las caractersticas.
4. El punto cero refleja la ausencia de esa caracterstica.

Actividad 1.3 Discutir con sus compaeros sobre la siguiente pregunta:

Es el capital de Federico el triple del capital de Antonio?

Por qu son importantes las escalas de medicin?


La relevancia de las escalas de medicin de los datos, es que indican los clculos y las
actividades grficas que se pueden realizar con ellos para poderlos explorar, organizar,
resumir y presentar. De la misma forma, las diferentes pruebas de inferencia estadstica
aplicables a los datos, exigen diferentes niveles de medicin. Mientras que la mayora de
las pruebas estadsticas en ingeniera y ciencias exigen mediciones de intervalo o de razn
(pruebas paramtricas), hay otras pruebas que se han diseado para las ciencias de la conducta que utilizan datos nominales u ordinales (pruebas no paramtricas).
Actividad 1.4 Establecer el nivel de medicin de la escala que se utiliza para las

fechas.
Ejemplo 1.3 Mostrar que en las escalas de razn (centgrada y Fahrenheit) las pro-

porciones de diferencias de temperatura son independientes de la unidad de medida y del


punto cero.
Solucin
Algunas equivalencias entre las escalas Celsius y Fahrenheit son:
Celsius
Fahrenheit

0
32

10
50

20
68

30
86

40
104

100
212

La proporcin de las diferencias entre las lecturas de una escala es igual a la proporcin entre las diferencias correspondientes de la otra. Por ejemplo, en la escala centgrada
la proporcin de las diferencias entre 40 y 20, y 10 y 0 es

40 20
=2
10 0
Las lecturas correspondientes en la escala Fahrenheit son: 104, 68, 50 y 32, de donde

104 68
=2
50 32

Si bien no es una prueba formal, estos ejemplos pueden ayudar a plantear la prueba de
manera matemtica, en caso de ser de inters.

12

Captulo 1 Introduccin

Actividad 1.5 Si se tuviera una escala de temperatura cuyo cero representara au-

sencia de calor, convertira esto a las temperaturas registradas en datos de nivel de


razn? Busque en internet si existe este tipo de escala y en dnde se usa.

Actividad 1.6 Clasifique los siguientes datos con alguno de los cuatro niveles de

medicin vistos:



Los grados en el ejrcito (cabo, sargento, soldado raso).


El estatus socioeconmico.
La medida de la cintura de una persona.
El diagnstico de un paciente como esquizofrnico, paranoico, maniaco-depresivo o
neurtico.
Los nmeros de los uniformes de los futbolistas.
Las placas de los automviles.
La densidad de una sustancia.

1.4 Planeacin de un estudio estadstico


Al recolectar datos para un estudio estadstico se debe distinguir el tipo de estudio que se quiere llevar a cabo; es posible tener dos tipos: estudios experimentales y estudios observacionales.

Estudio experimental
En un estudio experimental se impone deliberadamente un tratamiento en los elementos,
a fin de observar un cambio posible en la respuesta o variable medida. Como un ejemplo
se puede citar un estudio comunitario que se llev a cabo en Chile en 1994 para determinar la efectividad del uso de productos lcteos fluorados (PLF), distribuidos mediante
programas nacionales de alimentacin complementaria, con el fin de lograr una disminucin de la caries dental infantil en zonas rurales (http://ccp.ucr.ac.cr/cursos/epidistancia/
contenido/7_epidemiologia.htm). Se determinaron los ndices de prevalencia de caries dental de dos comunidades rurales: en una, los nios recibieron PLF y en otra no (comunidad
testigo). Despus de tres aos se compararon los ndices de prevalencia de caries dental en
ambas comunidades y se analizaron los resultados a fin de concluir y tomar decisiones.
Dada la complejidad de este tipo de estudios, el diseo del experimento requiere controlar
algunas otras posibles causas del efecto. En experimentos mdicos una de estas causas es el
efecto placebo, que consiste en el mejoramiento o respuesta favorable del paciente cuando en
realidad est recibiendo una pldora de azcar (factor psicolgico). A fin de reducir este tipo
de efectos se recurre a asignacin aleatoria (esto es, a un proceso casustico cuidadosamente
aplicado) que le da a cada sujeto la misma probabilidad (oportunidad) de recibir el tratamiento
o el placebo, y generalmente se tiene una evaluacin doblemente ciega (esto es, un arreglo
bajo el cual ningn sujeto, ni los mdicos que los evalan, saben quines han estado recibiendo el tratamiento real y quines el placebo). En esas condiciones, como se ha dicho dicho
anteriormente, el resultado obtenido podra ser evaluado usando la teora de la probabilidad.

Estudio observacional
En un estudio de observacin, las observaciones o mediciones de los elementos se verifican
de modo tal que no se modifica la respuesta o variable medida. Ejemplos de este tipo son
los estudios astronmicos y los censos. Un ejemplo clsico de un estudio observacional es

1.5 Simulacin (mtodos de Monte Carlo)

13

el que explora la correlacin entre fumar y el cncer de pulmn. En este caso, los investigadores recogeran, a lo largo del tiempo, observaciones de fumadores y no fumadores, y
luego observaran los casos de cncer de pulmn que ocurrieron en ambos grupos.
Debido a la complejidad de las situaciones, al volumen masivo de datos que pueden
obtenerse y a la incertidumbre, la computadora se ha convertido hoy en da en una herramienta fundamental en el manejo y la presentacin de la informacin. Ms an, permite
simular las situaciones y obtener estimaciones de problemas que de otra manera sera
prcticamente imposible abordar.

1.5 Simulacin (mtodos de Monte Carlo)


La simulacin representa hoy en da una de las herramientas didcticas y de clculo ms
importantes de la estadstica. Puede verse como una reproduccin numrica o representacin de un fenmeno del mundo real. Se emplea para dar solucin a prcticamente cualquier tipo de problema, ya sea aleatorio o determinstico. Una caracterstica distintiva es el
empleo de nmeros aleatorios, y suele llamrseles mtodos de Monte Carlo, en referencia
con el casino de Monte Carlo, en Mnaco. A continuacin se resuelven dos ejemplos a fin
de mostrar estos mtodos.
Nicholas C.
Metropolis
(1915-1999)
Conocido por sus contribuciones originales al campo de las matemticas y la
fsica, siendo algunas de
ellas el mtodo de Monte
Carlo y el desarrollo de
las primeras computadoras digitales electrnicas
de alta velocidad. MANIAC I
y MANIAC II.

Ejemplo 1.4 (Con informacin de J.A. Paulos. Ms all de los nmeros, Barcelona, 1993,
Tusquets, 166-168.) Se sabe que un jugador de bsquetbol encesta 40% de sus tiros. Si en
un partido hace 20 tiros, cul es la probabilidad de que enceste exactamente 9 veces? Hay
clculos estndar que permiten obtener la respuesta (en Excel la instruccin =DISTR.
BINOM(9,20,0.4,FALSO) da como resultado 0.15973848, vea captulo 8). Hay, sin embargo, otro mtodo que, aunque en este caso no es necesario, a veces es el nico mtodo
de abordar un problema. En el caso planteado supondra pedir al jugador que jugara
unos 10 000 partidos de 20 tiros para poder determinar el porcentaje de veces en las que
encesta exactamente 9 veces.
Como la propuesta anterior es imposible para un ser humano, podra simularse la situacin y obtener una estimacin del resultado. Para ello se considera que un tiro del
jugador puede simularse, por ejemplo, generando aleatoriamente un nmero comprendido
entre 1 y 10; esto puede llevarse a cabo mediante la instruccin en Excel: =ALEATORIO.
ENTRE(1,10), como se ve en seguida:

Puede verse esta instruccin de Excel, equivalente a lanzar un dado de 10 caras en una de
las cuales hay un punto, en otra dos puntos, etc., y anotar el nmero de puntos de la cara
del dado que qued hacia arriba en el lanzamiento (8 en el ejemplo).
De los 10 nmeros posibles, 4 cualesquiera de ellos representan 40%; dgase entonces
que sean 1, 2, 3 y 4. Por lo tanto, si sale alguno de ellos se interpreta como que el jugador
encest; si sale en cambio alguno de los restantes nmeros: 5, 6, 7, 8, 9 o 10, se dice que el
jugador fall el tiro. Para simular 20 tiros (un juego), llvese el puntero al pequeo cuadro
negro ubicado en la esquina inferior derecha de la celda A1, con lo que la forma del puntero cambiar a una cruz negra , como se indica en la siguiente figura:

D un clic y arrastre el ratn hacia la derecha hasta la celda T1. En las celdas A1 a T1 se
obtendr un grupo de 20 nmeros aleatorios:

14

Captulo 1 Introduccin

Se cuenta la cantidad de nmeros menores o iguales a 4, representando el resultado del


nmero de encestes (6).
El siguiente paso es instruir a la mquina (vea actividad 1.7) para que repita las operaciones anteriores 1 000 veces, que sume en cuntos juegos hubo 9 encestes y luego divida
este nmero entre 1 000, siendo el resultado la respuesta al problema.
NOTA: si la versin de Excel utilizada no acepta la instruccin =ALEATORIO.ENTRE
(1,10), puede usarse la instruccin equivalente =ENTERO(ALEATORIO()*10)+1.

Actividad 1.7 Para llevar a cabo la simulacin de 1000 partidos descritos en el

ejemplo 1.4, siga las siguientes instrucciones en Excel:


S
 eale las celdas A1 a T1 (genere un marco negro que cubre las celdas).
Arrastre el pequeo cuadro negro de la esquina inferior derecha del marco (est en
la celda T1) hasta la celda T1000.
Escriba la instruccin: =SI(CONTAR.SI(A1:T1,<=4)=9,1,0) en la celda U1. sta
indica que si hay 9 nmeros menores o iguales a 4 entre las celdas A1 y T1 se escriba en la celda U1 el 1, y en caso contrario, el 0.
Arrastre el cuadro negro de la esquina inferior derecha de la celda U1 hasta la celda
U1000.
Escriba la instruccin: =SUMA(U1:U1 000)/1000 en la celda U1001. Esto le indica a la mquina que sume los valores de las celdas U1 a U1000, y que divida el
resultado entre 1000.
En la celda U1001 obtendr la aproximacin a la probabilidad de que el jugador enceste 9 de 20 tiros en un partido. Al oprimir la tecla F9 se modificarn los 20000
nmeros aleatorios (1000 partidos) y se obtendr una nueva aproximacin. Con este
procedimiento, calcule la probabilidad en 10000 partidos.

Ejemplo 1.5 El clculo de ha llamado la atencin a mltiples matemticos a lo largo


de todos los siglos. Existen numerosos algoritmos para aproximar este valor; mediante
la simulacin se puede tambin obtener una aproximacin. Para ello, considere que en un
cuadrado de lado 1 se inscribe un crculo cuyo dimetro tambin es 1. Se eligen aleatoriamente puntos dentro del cuadrado. Como es obvio, algunos caern dentro del crculo. El
nmero de puntos que caigan dentro del crculo dividido entre el nmero total de puntos
generados es una aproximacin al rea del crculo. Multiplicando esta aproximacin por 4
se obtiene una aproximacin a . El programa 1.1 del sitio web del libro permite ensayar
con diferente nmero de puntos aleatorios. A continuacin se muestran dos resultados con
1 000 y 10 000 puntos aleatorios.

1.5

Simulacin (mtodos de Monte Carlo)

15

Se sugiere ensayar con un nmero de lanzamientos que pueden ir desde 1 hasta 100 000
o ms. Ensaye, divirtase y concluya.
El clculo de puede parecer trivial; no obstante, da una idea de la sencillez y del
poder de los mtodos de Monte Carlo. Por ejemplo, puede utilizarse para calcular el rea
2
bajo la curva de la funcin 1 e x (curva de Gauss), la cual no puede ser integrada ana2
2
lticamente y los valores reportados en tablas (vea apndice D) se calculan por mtodos de
integracin muy sofsticados llamados numricas. Con los mtodos de Monte Carlo puede
obtenerse una aproximacin tan buena como se desee dependiento del nmero de puntos
del instrumento de clculo. El programa 5.3 permite ensayar con esta y otras funciones,
como se ve en la siguiente intefase.

Ventana al conocimiento
El mtodo de Monte Carlo es un mtodo no determinstico o estadstico numrico usado para aproximar expresiones matemticas complejas y costosas de evaluar con exactitud. El mtodo se llam as en referencia al Casino de Monte Carlo
(Principado de Mnaco), por ser la capital del juego de azar, y ser la ruleta (cono de los casinos) un generador simple
de nmeros aleatorios. El nombre y el desarrollo sistemtico de los mtodos de Monte Carlo datan aproximadamente de
1944, y se mejoraron enormemente con el desarrollo de la computadora.

El uso de los mtodos de Monte Carlo como herramienta de investigacin, proviene del trabajo realizado en Los lamos
en el desarrollo de la bomba atmica durante la Segunda Guerra Mundial. Este trabajo conllevaba la simulacin de problemas probabilsticos de hidrodinmica concernientes a la difusin de neutrones en el material de fusin, la cual posee un
comportamiento eminentemente aleatorio. En la actualidad es parte fundamental de los algoritmos de trazado de rayos
para la generacin de imgenes sintticas y de la solucin de mltiples problemas.

16

Captulo 1

Introduccin

Glosario
Anlisis exploratorio de datos Mtodos tabulares, grficos y
numricos para explorar datos.
Conjunto de datos
estudio.

Todos los datos reunidos en determinado

Datos Los hechos y nmeros que se renen, analizan e interpretan.


Elemento

Las entidades acerca de las que se renen datos.

Escala de intervalo Una escala de medicin para una variable que


tiene las propiedades de los datos ordinales y el intervalo entre
observaciones se expresa en trminos de una unidad comn y
fija de medida. Los datos de intervalo siempre son numricos.

Escala ordinal Una escala de medicin para una variable que tiene las propiedades de los datos nominales y se puede emplear
para clasificar u ordenar los datos. Los datos ordinales podran
ser o no numricos.
Estadstica descriptiva
para resumir datos.

Mtodos tabulares, grficos y numricos

Estadstica inferencial Proceso de reunir datos obtenidos de


una muestra para hacer estimaciones acerca de las caractersticas de una poblacin.
Muestra

Un subconjunto de la poblacin.

Escala de razn Una escala de medicin para una variable que


tiene las propiedades de los datos de intervalo y el cociente
de dos valores es significativo. Los datos de razn siempre son
numricos.

Observacin

Escala nominal Una escala de medicin para una variable que


utiliza una etiqueta o nombre para identificar un atributo
de un elemento. Los datos nominales pueden ser o no numricos.

Variable cualitativa

Resultado de una medicin.

Poblacin El conjunto de todos los elementos de inters en determinado estudio.


Variable

Un atributo de inters de los elementos.

Variable cuantitativa

Una variable con valores cualitativos.


Variable con valores cuantitativos.

Problemas
1.1 Elabore una lista de 5 fenmenos determinsticos y 5 fenmenos aleatorios o casusticos.

Determinsticos
Aleatorios

1.2 La cada de los cuerpos es un fenmeno generalmente determinstico. Revise las condiciones bajo las cuales se
cumplen las leyes que gobiernan este fenmeno. Discuta en equipo las siguientes preguntas: en realidad cree
que se puedan cumplir esas condiciones? Esperara entonces valores exactos al aplicar las leyes? Cmo es
que utilizando esas leyes de la fsica se pudo poner un hombre en la luna y regresarlo a la Tierra?
1.3 Explique la diferencia entre una muestra y una poblacin.
1.4 A qu rama de la estadstica corresponden los siguientes resultados:
a) La Tierra se ha calentado en los ltimos 100 aos alrededor de medio grado Celsius. De seguir esta tendencia, para el ao 2100 el planeta se calentara entre 2 y 4.5 grados Celsius, con lo que aumentara el nivel
del mar, cambiando los patrones de lluvia y aumentando los eventos climticos, como las ondas de calor,
las lluvias torrenciales y las sequas, por ejemplo. (Con informacin de Cecilia Conde, Mxico y el cambio
climtico global, Direccin General de Divulgacin de la Ciencia, UNAM, 2006, p. 18.)

Problemas

b)

Ventas de autos de enero a junio (unidades)

1 200 000
1 000 000
800 000

2007
2008

600 000
400 000
200 000

rc
a

do

ex
p

or

ta
ci

no
in
te
r

do
Me

Me

rc
a

n
ci
uc

Pr
od

Ve
n

na
l

n
rta

Ex

a
ta
s

Ve
n

na
cio

ci

r
tri

dis

po

rta

bu
ido

do

po
Im

Na

cio

na
le

co
p
bli
al
ta
s

c) Pronstico del estado del tiempo:

d) Resultados del torneo interliga Grupo 1.


LUGAR

CLUB

JJ

JG

JE

JP

GF

GC

DIF

PTS

PROD

66.67%

66.67%

-1

66.67%

-4

0.00%

19

19

DYNAMO

3
GUADALAJARA

2
ATLANTE

4
DC UNITED

Total:

Con informacin de www.femexfut.org.mx


e) Censos de poblacin y vivienda.
1.5 Explique la diferencia entre datos cualitativos y datos cuantitativos.
1.6 Establezca si cada una de las siguientes variables es cualitativa o cuantitativa, e indique la escala de medicin
apropiada para cada una.
Edad

Sexo

Lugar en la familia

Marca de automvil

17

18

Captulo 1

Introduccin

1.7 Indique si cada una de las siguientes variables es cualitativa o cuantitativa, y establezca la escala de medicin
apropiada para cada una.
Forma de pago (efectivo,
cheque, tarjeta de crdito)

Tamao de la bebida (pequea,


mediana o grande)

Talla y cintura
de la persona

Temperatura
ambiente

1.8 Enliste las cuatro escalas de medicin y d un ejemplo para cada una.
1.9 Defina con sus palabras los trminos mutuamente excluyente y exhaustivo en relacin con las escalas de medicin.
1.10 Con los datos de encuestas nacionales o del almanaque mundial, o de publicaciones, peridicos o revistas, d
ejemplos donde se estn usando las diferentes escalas de medicin.
1.11 Para medir el grado de aceptacin de una nueva disposicin en una ciudad, se solicit a los ciudadanos que
anotaran el nmero que corresponde a su grado:
Totalmente de acuerdo

+2

De acuerdo

+1

Indiferente

En desacuerdo

Totalmente en desacuerdo

a) Establezca el tipo de escala que estn empleando las autoridades de la ciudad en esta encuesta.
b) El hecho de utilizar valores positivos, negativos y el cero la hace una escala de intervalo o de razn? Discuta la respuesta en equipo.
1.12 Discuta si el transportador (instrumento para medir ngulos) es una escala de razn o de intervalo.
1.13 Las puntuaciones en muchas pruebas de inteligencia son reportadas como coeficiente intelectual (CI). Los profesionales de la salud consideran que una diferencia entre un CI de 100 y uno de 80 es parecida a la existente
entre los CI de 120 y 100. Un CI de 0 no existe, debido a la manera en que se estructuran la mayora de las
pruebas de inteligencia. Discuta qu tipo de escala usan los profesionales de la salud.
1.14 Indique el tipo de estudio (experimental u observacional) que crea que se realiz en los siguientes casos:
a) A un grupo de 100 personas que desean bajar de peso se les dividi aleatoriamente en dos grupos de 50 cada
uno. Uno de los grupos recibi una serie de plticas motivacionales y el otro grupo no. Despus de cierto
tiempo se compararon las reducciones de peso de ambos grupos.
b) El estudio realizado por el Instituto Nacional de la Juventud en 2007, sobre la violencia en el noviazgo,
arroj, entre otros, los siguientes resultados:
En 2007, alrededor de 1.8% de la poblacin joven de entre 15 y 24 aos que tuvo un noviazgo ese ao, fue
forzada una o varias veces a tener relaciones sexuales en contra de su voluntad, y 16.5% de las chicas dijeron
que fue por parte de su pareja.
El 43% de los jvenes mexicanos ha tenido relaciones sexuales, y 77% ha utilizado algn mtodo anticonceptivo, siendo el condn el ms utilizado (94.6%), seguido de las pastillas (27.2%) y el retiro o coito
interrumpido con un 24%.
c) Los censos nacionales de cualquier tipo.

Proyectos abiertos

19

Proyectos abiertos

Proyecto 1.1 Equilibrio nmerico


hombre-mujer despus de una guerra civil
Suponga que despus de una guerra civil, un pas qued con
un nmero reducido de hombres. Los asesores del nuevo gobierno le sugieren adoptar la poltica de obligar a las parejas
a tener hijos hasta que les nazca el primer varn y, una vez
que esto ocurra, cesar de tener hijos. Elabore una simulacin
con el fin de determinar si esta poltica permitir restablecer
el equilibrio numrico hombre-mujer.
Sugerencia: Se puede ver el nacimiento de un hijo (hombre
o mujer) equivalente a lanzar una moneda. Interpretando sol
(S) como hombre y guila (A) como mujer, se lanza una moneda hasta que sale el primer sol y se registra el nmero de
lanzamientos. Un resultado posible es: AAS, y el registro sera
3; esto es, a una pareja la poltica de poblacin le demand
o permiti tener tres hijos. Se repite este proceso aleatorio
cientos de veces y se analizan los resultados. Dado que lanzar una moneda tantas veces resultara tedioso, se recurre a
Excel. La instruccin bsica para generar un nmero aleatorio
entre 0 y 1 es: =ALEATORIO(). De este modo, si el resultado
es menor que 0.5, puede considerarse mujer (M), y en caso
contrario, hombre (H). Un ensayo se ilustra en la figura de
arriba.

Mediante el arrastre horizontal se puede repetir la operacin anterior varias veces, por ejemplo 2. Para el registro
del sexo en la repeticin doble puede usarse la instruccin:
=SI(A1=H,1,SI(B1)=H,2,3)), que cuenta si hombre se
present en el primer lanzamiento o en el segundo, y en caso
contrario quedara como que naci en el tercero (lo cual pudo
no ser cierto):

a) Siguiendo las instrucciones bsicas dadas antes, simule


1000 parejas.
b) Cuntos hombres naceran en la simulacin del inciso a)?
c) Determine la proporcin de hombres y mujeres en la simulacin del inciso a).
d) Decida si la asesora dada al presidente permitir tener en
el futuro un equilibrio entre hombres y mujeres.

Proyecto 1.2 Distribucin de datos


Realice un anlisis exploratorio de los siguientes datos presentados como diagramas de tallos y hojas. Asigne un nombre

a la forma de los diagramas, segn sugiere la distribucin de


los nmeros.

a) Nmero de pelculas vistas el ao pasado


por cada estudiante.
2|3
representa
23

0 1

1 1

2 2

7 8

Forma de:

b) ltimos dos dgitos del nmero


de telfono de los estudiantes.

9
3|8
representa
38

6 6

9 9

7 8

5 8

3 8

Forma de:

Vous aimerez peut-être aussi