Académique Documents
Professionnel Documents
Culture Documents
SAETA-
Probabilidad y Estadística
(Basado en la Reforma del Bachillerato Tecnológico 2004)
Guía d i d á c t i ca
Compiladores:
Alejandro Acebo Gutiérrez
Rubén Henríquez
Francisco Romo Romero
Tirso Cuevas Nolasco
Raúl Arellano Ibarra
Ernesto Zamora Hernández
Junio de 2006
DIRECTORIO
REGISTRO No. IV
SEP / SEMS / DGETA
JOSE MARIA IBARRARAN No. 804
COL. SAN JOSE INSURGENTES SUR.
06720, MÉXICO, D.F.
TEL. 01 5 328 10 00 y 01 5 328 10 97
ISBN
2
Se autoriza la reproducción del contenido con fines educativos que no
implique lucro directo ó indirecto, siempre y cuando se cite la fuente,
previa autorización por escrito de la DGETA.
COMITÉ EDITORIAL
3
GUÍA DE CONTENIDOS
Pág.
Introducción _____________________________________________ 9
Cálculos ______________________________________________ 16
Promedios _____________________________________________ 33
Media ________________________________________________ 33
Mediana ______________________________________________ 34
4
Moda _________________________________________________ 35
Dispersión _____________________________________________ 55
Rango ________________________________________________ 56
Varianza ______________________________________________ 61
PROBABILIDAD ______________________________________________ 70
Introducción ____________________________________________ 70
Combinaciones _________________________________________ 85
5
Teorema de Bayes _____________________________________ 110
6
INTRODUCCIÓN
El presente trabajo esta dirigido a los estudiantes del SAETA que cursan el Bachillerato
firme intención de que sirva de guía y que con las actividades que desarrollaras te permitirán
adquirir los conocimientos que competen a los contenidos del programa de estudios de la
punto de iniciar.
Con el desarrollo de los contenidos programáticos dentro y fuera del aula, tú como
7
MENSAJE
VARIABLES Y REPRESENTACIONES
INTRODUCCIÓN
8
Estadística: Es un método científico que recopila, organiza, analiza e interpreta los datos
obtenidos para tener conocimiento de los hechos pasados, para prever situaciones futuras y
tomar decisiones en base a la experiencia.
Este último tipo de estadística no la utilizaremos en éste curso, pero hagamos un ejercicio
para analizar cuál es la diferencia entre estos dos tipos de estadística:
9
______________________________________________________________________
______________________________________________________________________
Población: Es el conjunto de todos los elementos, medidas, individuos y objetos que tienen
una característica en común, pero en muchas ocasiones debido a limitaciones de tiempo o
de recursos no se puede trabajar con la totalidad de la población.
Muestra: Es la parte de una población que podemos utilizar para obtener conclusiones de
toda una población sin tener que analizar su totalidad.
a) Validez. Debe representar a la población, esto es, ha de pertenecer a ésta y ser elegida al
azar o 67en forma aleatoria, para que todos los elementos de la población tengan la misma
probabilidad de ser considerados.
b) Confiable. Los resultados que se obtengan deben poder generalizarse a toda la población
con cierto grado de precisión.
En las VARIABLES CATEGÓRICAS los valores pueden ser EXPRESIONES y también estas
expresiones pueden ser sustituidas por SÍMBOLOS que nos permiten diferenciar la categoría
a la que pertenece cada individuo, la cual está determinada por el valor de la variable.
10
Si queremos saber la forma en que se trasladan los estudiantes del CBTA-XALISCO para
recibir sus clases grupales; preguntaremos a cada estudiante del grupo, si usualmente se
trasladan de su casa a la escuela CAMINANDO o EN ALGÚN VEHICULO, por lo tanto los
valores de la variable serán (C) "caminando" o (V) " Vehículo" y se clasifican a los alumnos en
éstas dos categorías.
Otro ejemplo:
Si quisiéramos conocer la materia que prefieren los estudiantes de una lista de 4 materias en
donde se incluyen Ciencias Sociales, Matemáticas, Ciencias Naturales y Español; En este
caso la materia de preferencia puede tomar cuatro valores: (CS) que es Ciencias Sociales;
(M) que es Matemáticas, (CN) Ciencias Naturales y (E) será Español. Es claro pues que la
variable, materia de preferencia clasifica a los estudiantes en cuatro categorías.
Observa que los valores que pueden tomar las variables en los ejemplos anteriores son
EXPRESIONES y que estas expresiones han sido sustituidas por SÍMBOLOS que nos
permiten diferenciar la categoría a la que pertenece cada individuo, la cual está determinada
por el valor de la variable. Los ejemplos anteriores son VARIABLES CATEGÓRICAS
NOMINALES.
Otro ejemplo:
Si queremos saber cómo se alimentan los estudiantes del CBTA-XALISCO, para relacionarlo
con el aprovechamiento escolar, preguntaremos cada semana a todos los estudiante del
grupo, cuáles alimentos ingirieron durante la semana y clasificamos la variable calidad de la
alimentación de la siguiente manera: “MD” al alumno que se alimentó muy deficientemente,
“D” el de alimentación deficiente, “R” el de alimentación regular, “B” el de alimentación buena
y “MB” el de alimentación muy buena. Con esto todos los estudiantes del grupo, quedarán
distribuidos en cinco posibles categorías.
Observa que los valores de las variables también son EXPRESIONES, sin embargo, entre los
valores de estos dos ejemplos últimos hay UN ORDEN. Los ejemplos anteriores SON
VARIABLES CATEGÓRICAS ORDINALES.
______________________________________________________________________
11
______________________________________________________________________
En las variables numéricas, sus valores no son expresiones sino NUMEROS y es en donde
además tiene sentido efectuar operaciones aritméticas con ellos y compararlos.
12
Si los valores de la variable son NÚMEROS ENTEROS, se llamará NUMÉRICA DISCRETA,
pero si los valores de la variable pueden tomar CUALQUIER VALOR NUMÉRICO en algún
intervalo de números reales (con decimales o fracciones), la variable será NUMÉRICA
CONTINUA.
Si queremos saber el número de hermanos de los alumnos del CBTA-XALISCO. Serán desde
cero en adelante y como es lógico no puede haber medio hermano o tres cuartos de
hermano, por lo tanto la variable número de hermanos es una variable numérica discreta.
Si queremos saber la estatura de los alumnos del quinto semestre con una aproximación a
milímetros, tendríamos que utilizar una regla de dos metros y dividida en centímetros y
milímetros. Los valores posibles de la variable serán todos los números pertenecientes a
algún intervalo.
Otro ejemplo es El peso que tienen las personas que asisten a un evento será también una
variable numérica continua, pues podrán pesar kilos, con gramos y hasta miligramos,
dependiendo de la precisión que queramos los resultados.
Si observas estas variables numéricas pueden tomar cualquier valor en algún intervalo.
13
d) El daño causado a los pulmones de los jóvenes que fuman.
Variable: _______________________________________
e) Tipo de material con el que se construyen los techos de las viviendas de una localidad.
Variable: ________________________________
Variable: _______________________________________
Variable: ______________________________________
Variable: ______________________________________
REDONDEO DE DATOS
Dado que estaremos dando nuestras respuestas finales con dos decimales y en ciertas
ocasiones hasta con cuatro cifras decimales, necesitamos decidir cómo determinar el valor de
los últimos dígitos.
Primer ejemplo cuando el residuo es menor que 0.5: 34.01350 = 34.01 es la respuesta
potencial y .350 el residuo; como .350 es menor que 0.5, el último dígito de la respuesta
potencial permanece sin cambio y la respuesta final es 34.01
Segundo ejemplo cuando el residuo es mayor que 0.5: 34.01761 34.01 es la respuesta
potencial y .761 el residuo; como .761 es mayor que 0.5, al último dígito de la respuesta
potencial debemos sumar 1 al último dígito, por lo que la respuesta correcta es 34.02
Tercer ejemplo cuando el residuo es igual a 0.5 y el último dígito de la respuesta potencial es
impar: 43.07500 43.07 es la respuesta potencial y .500 el residuo; como es impar el último
dígito de la respuesta potencial se AUMENTA 1, por lo que la respuesta correcta es 43.08
Cuarto ejemplo cuando el residuo es igual a 0.5 y el último dígito de la respuesta potencial es
par: 17.06500 17.06 es la respuesta potencial y .500 el residuo; como es par el último dígito
de la respuesta potencial NO se aumenta 1, por lo que la respuesta correcta es 17.06
14
Siguiendo los mismos principios anteriores, si tenemos una cifra de 0.7544762 su respuesta
correcta es 0.7545; en cambio si es 0.1136211 la respuesta correcta es 0.1136; si tenemos
que 0.3463500 lo correcto será 0.3464; finalmente si tenemos 0.7728500 lo correcto será
0.7728.
NOTACIÓN SISTEMATIZADA
En estadística, por lo general, trabajamos con datos agrupados resultantes de medir una o
más variables. Con gran frecuencia, los datos se obtienen de las muestras y en ocasiones de
las poblaciones. Para fines matemáticos, generalmente se utiliza la letra mayúscula X y a
veces la Y, para representar la(s) variable(s). Así, si estuviéramos midiendo la edad de los
sujetos, haríamos que X represente la variable “edad”. Si existen muchos valores de la
variable agregamos un subíndice al símbolo X. Ilustramos este proceso en la siguiente tabla,
la cual contiene las edades de seis sujetos:
15
Cuando esto ocurre, necesitamos decidir la cantidad de cifras decimales que utilizaremos
para el residuo.
En las ciencias físicas, por lo general, se utiliza el mismo número de cifras significativas que
tienen los datos en bruto, Por ejemplo, si medimos el peso de cinco sujetos hasta tres cifras
significativas (173, 156, 162, 165, y 175 libras) y queremos calcular el promedio de estos
pesos, nuestra respuesta debe contener sólo tres cifras significativas. Así
X
X 173 156 162 165 175 831
166.2 166
N 5 5
La respuesta de 166.2 se redondea a tres cifras significativas, dando un resultado final de 166
libras. Por varias razones y mas por continuar una tradición, en el presente curso de
estadística utilizaremos DOS cifras decimales redondeadas cuando el resultado tenga
ENTEROS y CUATRO cifras decimales cuando NO EXISTAN ENTEROS, sin importar las
cifras significativas de los datos en bruto. Así cuando se pida que el resultado tenga dos cifras
decimales, debemos realizar los cálculos intermedios con al menos CUATRO cifras decimales
y redondear la respuesta final a dos cifras.
CÁLCULOS
Una de las operaciones que se realizan con más frecuencia en estadística consiste en sumar
todos o una parte de los datos que pertenecen a una distribución. Como no es práctico
escribir “suma de todos los datos” cada vez que se necesite emplear esta operación,
particularmente en las ecuaciones, se utiliza una abreviatura simbólica. La letra griega
mayúscula sigma ( ∑ ) indica la operación de sumatoria. La frase algebraica utilizada para la
sumatoria es:
N
X
i 1
i
Esta expresión se lee como “la suma de la variable X de i = 1 a N”. Las notaciones que
aparecen arriba y debajo del signo de la sumatoria indican los datos que deben incluirse en la
operación. El término que aparece debajo del signo de la sumatoria nos indica el primer dato
en esta operación, y el término que se encuentra arriba de dicho signo indica el último dato.
Así, esta frase señala que debemos sumar los datos X, comenzando con el primero y
concluyendo con el N-ésimo dato.
Así. N
X
i 1
i X 1 X 2 X 3 ... X N Ecuación de una sumatoria
Al “aplicar la sumatoria” a los datos de las edades de la tabla anterior, tenemos que:
N
X
i 1
i X1 X 2 X 3 X 4 X 5 X 6 =
8 + 10 + 7 + 6 + 10 + 12 = 53
Cuando la sumatoria se realiza con todos los datos (de 1 a N), es frecuente que la propia
frase de esta operación se abrevie, omitiendo las notaciones arriba y abajo del signo de la
suma, al igual que el subíndice
N i. Así.
X i X
Se abrevia con frecuencia como
i 1
En el ejemplo anterior, = 53 Esta expresión indica que la suma de todos los datos X es
53. X
16
Observa que no es necesario que la sumatoria se realice de 1 a N, Por ejemplo, podríamos
querer sumar sólo el segundo, tercer, cuarto y quinto dato. Recuerda que la notación
debajo del signo de la sumatoria nos dice dónde comenzar la suma, y el término arriba de
5 terminarla.
dicho signo nos dice dónde
Utilizaríamos el símbolo Xi
i 2
Para los datos anteriores, tenemos que:
X i X 2 X 3 X 4 X 5 10 7 6 10 33
3
X
i 1
Resolvamos algunos ejemplos:
i
i 1
Para los siguientes datos, determine X1= 10, X2 = 12, X3 = 13, X4= 18
3
Por lo tanto: X
i 1
i 10 12 13 35
4
Para los siguientes datos, determine
X6=31
X
i 2
i 3: X 1=20, X2=24, X3=25, X4=28, X5=30,
Por lo tanto: X
i 2
i 3 (24 25 28) 3 80
4
Para los siguientes datos, determine
X6=31
(X
i 2
i 3) X 1=20, X2=24, X3=25, X4=28, X5=30,
4
Por lo tanto: ( X
i 2
i 3) (24 3) (25 3) (28 3) 86
Existen otros dos tipos de sumatorias que veremos con frecuencia en estadística y son: ∑X 2 y
(∑X)2. Aunque se parecen, son distintos y, en general, proporcionan diferentes respuestas.
El símbolo ∑X2 (suma de los cuadrados de los datos X) indica que primero debemos elevar el
cuadrado de los datos X y luego sumarlos. Así:,
X 2
X 12 X 22 X 32 ... X N2
El símbolo (∑X)2, o (el cuadrado de la suma de los datos X), indica que primero debemos
sumar los datos X y luego elevar al cuadrado la suma resultante. Así,
( X ) 2 ( X 1 X 2 X 3 ... X N ) 2
La confusión es muy común cometerlo, sobre todo cuando se calculan las desviaciones
estándar, eso lo analizaremos un poco mas adelante.
ACTIVIDADES DE APRENDIZAJE “CÁLCULO”
17
7
X
i 3
i
(X
i 1
i 12)
X
i 2
i 205
6
( X i ) 8
2
i 2
5
( X i ) 2 510
i 1
DISTRIBUCIONES DE FRECUENCIAS
18
La Tabla de Distribución de Datos o Tabla de Distribución de Frecuencias, además de ser un
instrumento útil para resumir un conjunto de datos obtenidos en una investigación, es una
herramienta muy importante con que cuenta la estadística para realizar las observaciones de
manera rápida y sencilla.
Para construir dicha Tabla realizaremos siete pasos y para tu mejor aprendizaje,
desarrollaremos un ejemplo con una variable numérica continua, ya que deseamos conocer el
“tiempo en minutos que emplearon para estudiar” 50 estudiantes del CBTA en la materia de
estadística 1.
La recopilación de los datos consiste en asistir al grupo de estudiantes y obtener los valores
mediante una pregunta abierta sobre el tiempo en minutos que emplearon para estudiar el
tema de estadística o si desconfiamos, podemos medir directamente el tiempo durante las
asesorías que emplearon cada uno de los alumnos al estudiar estadística. En resumen para
recopilar los datos debemos "asistir" al lugar donde vamos a 'tomar" o "levantar" los datos.
Esto puede ser mediante entrevistas, cuestionarios, observaciones o mediciones directas a
los individuos o cosas que corresponda nuestra variable.
Supongamos que los 50 datos obtenidos en nuestra variable: tiempo de estudio de la materia
de estadística en minutos fueron los siguientes y que corresponden a los 50 estudiantes:
75 60 80 67 81 71 74 63 72 70
76 62 82 63 81 66 78 68 80 74
67 74 84 70 63 77 68 82 74 72
76 64 75 80 69 85 71 79 60 74
83 75 67 72 78 64 77 81 76 70
La Ordenación de los datos consiste en colocar los datos tomados en orden creciente (de
menor a mayor) o decreciente (de menor a mayor). Nosotros los vamos a ordenar en forma
creciente y sobre todo "contando" y "anotando" los que se repitan, que será la frecuencia.
Ordenación de datos:
DISTRIBUCIÓN DE FRECUENCIAS
19
Tiempo empleado en minutos Conteo Frecuencia
60 // 2
62 / 1
63 /// 3
64 // 2
66 / 1
67 /// 3
68 // 2
69 / 1
70 /// 3
71 // 2
72 /// 3
74 ///// 5
75 /// 3
76 /// 3
77 // 2
78 // 2
79 / 1
80 /// 3
81 /// 3
82 // 2
83 / 1
84 / 1
85 / 1
Total 50
Es importante que la suma total sea igual al número de datos que tomamos en la
investigación.
Q = 1+ 3.322 (og. 50) observa que obtendremos el logaritmo de 50. En una calculadora el
logaritmo de 50 es 1.69897... Redondeando su valor será 1.70 Este valor lo multiplicamos por
3.322 y nos da en la calculadora 5.64... Que redondeado será 5.64 y finalmente le sumamos
1 a dicha cantidad arrojándonos = 6.64 Si el número que nos arroje la formula tiene su
20
primera decimal igual o mayor que .5 se aumenta el entero. Así en nuestro ejemplo tenemos
que 6.6 seria igual a 7.
En resumen y de acuerdo a la formula el número de intervalos será de 7
Resulta claro que si lo ancho del intervalo es de 4 y el número de intervalos son 7; (4 ) (7) =
28 se cubrirá todo el rango que es de 25.
Debemos hacer uso de los Límites reales Inferiores (L.R.I.), quitando 0.5 al dato más chico
que en nuestro caso es de 60 minutos. Por lo tanto será de 59.5 el L.R.I. Luego a este se le
suma lo ancho del intervalo que es de 4 resultando 63.5 que es el Límite Real Superior
(L.R.S.) por lo que ahora si podemos decir que los dos datos 64 se deberán anotarse en el
2do. Intervalo que iniciaría en 63.5 hasta 67.5 como límite real superior.
Ahora si podemos construir cada uno de los intervalos con sus límites reales inferiores y
limites reales superiores.
Recuerda que el ancho de cada intervalo es de 4 y que en total son siete (7) intervalos de
acuerdo a las operaciones realizadas anteriormente:
INTERVALOS DE CLASE
Límite Real Inferior Límite Real Superior
59.5 63.5
63.5
71.5
71.5
79.5
87.5
60 a 64
64 a 68
Intervalos 68 a 72
72 a etc…
21
Rango = 25 = 3.57 redondeando será igual a 4
Número de intervalos = 7
La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los límites
reales inferiores más los límites reales superiores, dividiendo el resultado entre dos.
Hagámoslo practicando...Llena los espacios que faltan. Se suma 59.5 + 63.5 = 123 = 61.5
2
Intervalos de Clase
L.R. Inferior L.R. Superior MARCA DE CLASE
59.5 63.5 61.5
63.5 67.5
67.5 71.5
71.5 75.5
75.5 79.5
79.5 83.5
83.5 87.5 85.5
22
¿CÓMO PODEMOS PRESENTAR LOS DATOS DE UNA
VARIABLE NUMÉRICA EN UNA GRÁFICAS?
HISTOGRAMA y POLÍGONO DE FRECUENCIAS.
HISTOGRAMA DE FRECUENCIAS:
Este tipo de gráfica consiste en una serie de rectángulos trazados en un sistema de
coordenadas cartesianas o rectangulares. Para realizar el histograma es necesario agrupar
los datos en intervalos de clase, con sus límites reales inferiores y superiores, además de su
frecuencia absoluta.
Los rectángulos tienen sus bases sobre el eje horizontal con centros en las marcas de clase
y su longitud es igual a la anchura de los intervalos de clase. La altura de cada rectángulo
corresponde al valor de la frecuencia que tenga el intervalo que representa. En éstos
histogramas los rectángulos se trazan adyacentes entre si.
F 23
R
E
14 -
12 -
10 -
8 -
6 -
4 -
2 -
0 -
59.5 63.5 67.5 71.5 75.5 79.5 83.5 87.5
61.5
Si observas en el eje vertical de las "Y", se ubican las frecuencias absolutas, mientras que en
el eje horizontal de las "X" se ubican los intervalos de clase en donde cada límite real superior
corresponde al límite real inferior del siguiente intervalo. Las marcas de clase (61.5) aunque
es permitido no escribirse en el histograma, se pueden ubicar ya que corresponde al punto
medio de cada intervalo.
Como habrás observado, el histograma nos ayuda a mostrar la frecuencia absoluta con que
se presentan algunos datos; otra forma de gráfica son los…
14 -
F
R 12 -
E
C 10 -
U
E 8 -
N
C 6 -
I
A
4 -
S
2 -
POLÍGONOS DE FRECUENCIA.
24
Los polígonos de frecuencia también se construyen a partir de datos con variables
cuantitativas o numéricas y se puede realizar a partir de un histograma si se desea.
Una vez trazado el histograma, se localizan los puntos medios o marcas de clase en la
parte superior de cada uno de los rectángulos o intervalos de clase. Se trazan segmentos de
recta que unen cada punto medio de cada uno de los intervalos.
Este polígono se encierra uniendo con el eje horizontal en el punto que corresponde al punto
medio de un rectángulo imaginario y adyacente al histograma, esto se hace en los extremos
izquierdos y derechos del polígono.
Construyamos un polígono....
Para trazar el polígono de frecuencia unimos con rectas los puntos medios o marcas de clase
con su frecuencia absoluta respectiva, en donde estaban la parte alta de los rectángulos del
histograma.
ACTIVIDADES DE APRENDIZAJE: Dibuja en ésta hoja el HISTOGRAMA y el POLIGONO
DE FRECUENCIAS del ejercicio de la página 16.
25
POLÍGONO DE FRECUENCIAS. “Estatura de 55 estudiantes”
Escribe las conclusiones más importantes que nos indican las gráficas anteriores:
______________________________________________________________________
______________________________________________________________________
26
porcentajes de los valores incluidos en los intervalos de clase, por lo que también se le llama
Distribución Porcentual.
SIGAMOS PRACTICANDO Y APRENDIENDO.
Del 1er. y 2do Intervalos; Frecuencia Relativa de clase = 6 = 0.12 x 100 = 12 %
50
Del 6to intervalo; La Frecuencia Relativa = 9 = 0.18 x 100 = 18 %
50
Con todos los datos anteriores, finalmente construyamos nuestra…
Con los datos anteriores terminamos los componentes principales del cuadro que también
recibe el nombre de... "TABLA DE DISTRIBUCIÓN DE FRECUENCIAS" por lo que...
Ya podemos obtener algunas CONCLUSIONES de nuestra investigación.
Te recordamos que los 50 datos son del tiempo en minutos dedicado a estudiar estadística
por los estudiantes. Si analizamos detenidamente sus datos, podemos ver que el mayor
número de casos (frecuencia absoluta) es 11 y dedican de 71.5 a 75.5 minutos en estudiar
(su intervalo) pero además representan el mayor porcentaje con un 22% del total.
27
Caso contrario, son lo que dedican de 83.5 a 87.5 minutos en estudiar pues únicamente son 2
y representan un 4 % del total.
Si observamos en global el cuadro, podemos decir que la mayoría de los estudiantes (Los
intervalos 3,4 y 5) dedican de 67.5 a 79.5 minutos en estudiar y representan el 54 % del total.
1) siguiendo los siete pasos para una variable numérica, ordena los datos de la siguiente
variable y realiza las operaciones correspondientes hasta obtener completa la "tabla de
distribución de frecuencias" de las “Estaturas de 55 estudiantes” con aproximación de un
centímetro. Datos:
154 165 156 160 159 170 151 163 166 166 153
160 173 160 161 166 162 153 163 156 170 165
159 168 149 163 169 157 162 159 168 155 163
161 161 174 160 168 152 169 165 156 166 166
162 160 170 163 168 157 165 159 163 160 160
Aquí realiza los siete pasos y tus cálculos correctamente hasta llenar tu Tabla de distribución
de frecuencias
Paso 1 Ordenación de datos.
TOTAL =
PRINCIPALES CONCLUSIONES:
28
1.____________________________________________________________________
2.____________________________________________________________________
3_____________________________________________________________________
29
Ahora estudiemos como se construye la DISTRIBUCIÓN DE FRECUENCIA ACUMULADA y
su gráfica LA OJIVA además de la FRECUENCIA RELATIVA ACUMULADA.
La frecuencia total de todos los valores menores que el límite real superior de un determinado
intervalo de clase, es conocida como frecuencia acumulada incluyendo hasta este intervalo.
Lo anterior lo comprenderás mejor si nos ayudas a resolver el ejemplo que sigue:
Si tomamos los datos obtenidos al medir el “tiempo en minutos que emplearon los estudiantes
en ir de su casa a la escuela”. Se construye la siguiente tabla de distribución de frecuencias y
una columna que corresponde a la distribución de frecuencia acumulada y otra a la
frecuencia relativa acumulada.
Concluyen los datos que faltan en la frecuencia acumulada de clase, de tal forma que sumen
un total de 243. En la columna de frecuencia acumulada relativa, también calcula los espacios
que faltan hasta que obtengas el 100%
Para entender la forma en que se traza una ojiva, considere el ejemplo de los datos obtenidos
al registrar el tiempo empleado por los estudiantes para ir de su casa a la escuela.
Primero se coloca un punto sobre el eje horizontal donde está el 9.5, puesto que no hay
observaciones de ésta o de inferior magnitud. Luego se traza el siguiente punto en el 12.5 a la
altura del 3, esto se puede hacer porque hay 3 registros iguales o menores de 12.5 de esta
manera se continúan representando el resto de los puntos.
30
Ejemplo: Tomando como base la distribución de frecuencia acumulada del ejemplo anterior, y
el tiempo en minutos que emplean los integrantes de un grupo de estudiantes de ir de su
casa a la escuela, construyamos la ojiva correspondiente:
50
45
40
FRECUENCIA ACUMULADA
35
30
25
20
15
10
0
9.5 12.5 15.5 18.5 21.5 24.5 27.5 30.5 33.5
INTERVALO DE CLASE
En esta página transfiere los datos de la tabla de distribución de frecuencias del ejercicio de la
página 16 y en las dos columnas últimas obtén la FRECUENCIA ACUMULADA y la
FRECUENCIA RELATIVA ACUMULADA, además construye su gráfica llamada OJIVA.
31
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
100%
T O T A L: 55 227
32
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIOS
En estadística al promedio se le conoce como medida de tendencia central, ya que
está localizado hacia el medio o centro de una distribución, en la que la mayoría de los
valores tenderán a concentrarse. Entre los más comunes se pueden mencionar: la media
aritmética, la mediana y la moda
Media Aritmética
Moda
LA MEDIA ( X ).
X = X 1 X 2 X 3 ... Xn
n
Donde:
X = 30 32 32 32 32 34 34 34 34 34 34 36 36 36 36 36 38 38 38 40
20
696
X= = 34.8
20
Obsérvese que la “media” no necesariamente tiene que ser uno de los valores de la muestra.
Una manera más sencilla de encontrar esta “media aritmética” es multiplicando cada dato por
su frecuencia y continuar el proceso respectivo, como se ilustra a continuación:
2. Cuando algunos valores extremos son incluidos en los datos, la media puede llegar a
ser menos representativa del conjunto de valores.
34
3. La mediana en algunos casos, no puede ser calculada exactamente como sí puede
serlo la media.
^
LA MODA ( X ) (Mo)
La moda se define como el valor que tiene la mayor frecuencia (o que se repite mas) en un
grupo de datos,
Hay casos en que la moda no es única, esto es, puede ser bimodal con dos modas, o trimodal
con tres modas. También hay casos en que la moda no existe.
La moda no existe.
Otro ejemplo: 10,12, 14, 16, 17, 17, 18, 19, 20, 20, 21.
1. La moda representa más elementos que cualquier otro valor dentro de un conjunto de
datos.
En comparación con la media y la mediana, la moda es la menos útil para la mayoría de los
problemas estadísticos, ya que no se inclina por un análisis matemático, en el mismo sentido
que lo hacen las otras dos. Sin embargo, desde un punto de vista puramente descriptivo, la
moda es indicativa del valor típico en términos del valor que se presenta con mayor
frecuencia. La moda es más útil cuando uno o dos valores, o un grupo de éstos, ocurren con
35
mayores frecuencias que otros. Por el contrario, cuando la mayoría o todos los valores se
presentan casi con la misma frecuencia, la moda no sirve para describir datos.
ACTIVIDADES DE APRENDIZAJE:
1) Calcula la media aritmética, la mediana y la moda de las series de valores siguientes:
a) 2, 3, 7, 4, 5, 4, 8.
b) 1, 9, 9, 4, 3, 5, 2, 7, 6.
36
Mediana = _________________________________________________ = ________
TH, TH, TC, TA, TC, TA, TT, TT, TC, TH, TC, TA, TT, TC, TC, TA.
Si los datos o valores han sido agrupados en intervalos de clase, entonces se considera que
todos los valores incluidos dentro de un determinado intervalo son iguales o están
representados por el punto medio del intervalo o la marca de clase. En este caso se procede
a multiplicar cada punto medio por su respectiva frecuencia. Luego se suman estos
productos, para finalmente dividir este resultado entre el total de datos.
X
( f )( X )
n
Donde
f = Frecuencias absolutas de los intervalos.
X = Marca de clase o punto medio.
n = La suma de las frecuencias.
37
MEDIANA PARA DATOS AGRUPADOS
Cuando Los datos simples son agrupados en una distribución de frecuencias, cada uno de los
valores pierde su identidad en la tabla, significando que la mediana de los datos simples
puede no ser igual a la mediana obtenida de una distribución de frecuencias del mismo
conjunto de datos. Es importante mencionar, que la mediana de los datos agrupados es una
aproximación de la verdadera mediana. La aproximación puede ser obtenida mediante el uso
de la siguiente fórmula:
n
2 c
Me Li (i )
Fme
n
c
Donde: Me Li 2 (i )
Me = Mediana fme
Li = Límite real inferior de la clase que contiene la mediana.
Cuando la moda se calcula a través de la fórmula para datos agrupados, los valores y
frecuencia en la clase modal y las frecuencias en las clases inmediatamente antes y después
de la clase modal, son también empleadas. Por lo tanto se aplica la siguiente fórmula.
d1
Mo Li (i)
d1 d 2
Donde:
Mo = Moda
38
d1 = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase
contigua inferior.
Su fórmula es… X
( f )( X )
n
Esta expresión no se puede aplicar directamente, ya que únicamente se cuenta con el dato
del denominador, esto es n = 50, pero no se tiene el dato del numerador. Para ello se agrega
una columna a la tabla, donde se proporcionan los datos agrupados en intervalos. Esta
columna se construye multiplicando el punto medio de cada intervalo por su respectiva
frecuencia y cuando se tengan todos los productos, se procede a obtener la suma de ellos. La
tabla original ya con la columna Fx y la suma de ésta queda de la siguiente manera.
I x f f’ F fx
30.5 – 33.5 32 1 .02 1 32
33.5 – 36.5 35 2 .04 3 70
36.5 – 39.5 38 6 .12 9 228
39.5 – 42.5 41 11 .22 20 451
39
42.5 – 45.5 44 16 .32 36 704
45.5 – 48.5 47 9 .18 45 423
48.5 – 51.5 50 4 .08 49 200
51.5 – 54.5 53 1 .02 50 53
TOTAL = 50 1 o 100 2161
Entonces:
_ 2161
X = = 43.22 será el resultado de la media aritmética
50
MÁS ACTIVIDADES DE APRENDIZAJE:
Calcula la media aritmética de los tres ejercicios siguientes.
De la página 16…
De la pagina 18…
TOTAL = 55
De la página 23…
9.5 – 12.5 11 3
12.5 – 15.5 14 4
40
T O T A L: 47
I x f f’’ F
30.5 – 33.5 32 1 .02 1
33.5 – 36.5 35 2 .04 3
36.5 – 39.5 38 6 .12 9
39.5 – 42.5 41 11 .22 20
42.5 – 45.5 44 16 .32 36
45.5 – 48.5 47 9 .18 45
48.5 – 51.5 50 4 .08 49
51.5 – 54.5 53 1 .02 50
TOTAL = 50 1
42.5 – 45.5 44 16 32 36
Como 20 casos (1+2+6+11) caen por debajo del L.R.I. de la mediana, necesitamos 5 datos
más, para llegar a 25. Dado que existen 16 casos (frecuencia) en el intervalo y éste tiene 3 de
amplitud o ancho, hacemos una regla de tres.
16 es a 3 como 5 es a x
16 : 3 :: 5 : x x= (3)(5) = 15 = 0.9375
16 16
41
Ahora utilicemos la fórmula para determinar la mediana en datos agrupados:
n
c
Me Li 2 (i )
Fme
25 20 5 15 15
Me = 42.5+ ( 3 ) = 42.5 + ( 3 ) = 42.5 + = 42.5 +
16 16 16 16
42
De la página 16…
De la pagina 18…
De la página 23…
9.5 – 12.5 11 3
12.5 –15.5 14 4
15.5 – 18.5 17 6
18.5 – 21.5 20 7
21.5 – 24.5 23 9
24.5 – 27.5 26 8
27.5 – 30.5 29 5
30.5 – 33.5 32 3
33.5 – 36.5 35 2
T O T A L: 47
43
CALCULO DE LA MODA para datos agrupados.
Para determinar el valor de la moda, habrá que observar las columnas “ f ” y seleccionar el
intervalo que presenta la mayor frecuencia. En este caso, el intervalo que donde está incluida
la moda es:
d1
Mo Li (i)
1
d d 2
Para determinar los valores de cada término en esta expresión, se requiere además del
intervalo donde está localizada la moda, de las celdas inmediata inferior y superior que queda
como sigue:
Li = 42.5
d1 = 16 - 11 = 5
d2 = 16 – 9 = 7
i =3
5 5
Mo = 42.5 + (3) Mo = 42.5 + ( 3 )
5 7 12
15
Mo = 42.5 + = 42.5 + 1.25 = 43.75
12
44
MÁS ACTIVIDADES DE APRENDIZAJE:
Calcula la MODA de los tres ejercicios que se han presentado.
De la página 16…
Intervalos de Clase Marca de Frecuencia
L.R.I. L.R.S. Clase (x ) Absoluta (f )
59.5 - 63.5 61.5 6
63.5 - 67.5 65.5 6
67.5 - 71.5 69.5 8
71.5 - 75.5 73.5 11
75.5 - 79.5 77.5 8
79.5 - 83.5 81.5 9
83.5 - 87.5 85.5 2
TOTAL = 50
De la pagina 18…
De la página 23…
Intervalo de clase Marca Frecuencia
L.R.I. L.R.S. de clase (x) de clase (f)
9.5 – 12.5 11 3
12.5 –15.5 14 4
15.5 – 18.5 17 6
18.5 – 21.5 20 7
21.5 – 24.5 23 9
24.5 – 27.5 26 8
27.5 – 30.5 29 5
30.5 – 33.5 32 3
33.5 – 36.5 35 2
T O T A L: 47
45
REALIZA LA SIGUIENTE ACTIVIDAD DE APRENDIZAJE:
Edades:
36, 53, 35, 28, 30, 36, 45, 29, 43, 28,
30, 46, 39, 54, 47, 44, 34, 40, 50, 38,
47, 56, 48, 42, 39, 47, 53, 51, 38, 29,
48, 52, 47, 46, 41, 40, 45, 39, 47, 38.
______________________________________________________________________
______________________________________________________________________
46
AHORA PARA DATOS AGRUPADOS. Realiza la Tabla de distribución de frecuencias con
los 7 pasos:
PASO 1. Ordenación de datos:
47
Realiza tus operaciones en orden y limpieza hasta llenar la tabla de frecuencias
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
“Edades de los maestros del C.B.T.a.”
Intervalos de Marca Frecuencia Frecuenc Frecuencia (f )(x)
Clase de Absoluta (f) ia Acumulada
L.R.I. Clase Relativa (F)
L.R.S (X) (f’)
MEDIANA:
MODA:
48
FINALMENTE REALIZA UNA COMPARACIÓN DE LOS TRES EJERCICIOS
ANTERIORES, COMPARANDO SU MEDIA MEDIANA Y MODA DE CADA UNO
De la página 16
Intervalos de Clase Marca de Frecuencia
L.R.I. L.R.S. Clase (x ) Absoluta (f )
59.5 - 63.5 61.5 6
63.5 - 67.5 65.5 6
67.5 - 71.5 69.5 8 Media = ____________
71.5 - 75.5 73.5 11
75.5 - 79.5 77.5 8 Mediana=:___________
79.5 - 83.5 81.5 9
83.5 - 87.5 85.5 2 Moda=_____________
TOTAL = 50
De la pagina 18
Intervalos de Clase Marca de Frecuencia
L.R.I. L.R.S. Clase (x) Absoluta (f)
148.5 152.5 150.5 3
152.5 156.5 154.5 7 Media = ____________
156.5 160.5 158.5 13
160.5 164.5 162.5 12 Mediana=:___________
164.5 168.5 166.5 13
168.5 172.5 170.5 5 Moda=_____________
172.5 176.5 174.5 2
TOTAL = 55
De la página 29…
Intervalo de clase Marca Frecuencia
de clase (x) de clase (f)
9.5 – 12.5 11 3
12.5 –15.5 14 4
15.5 – 18.5 17 6
18.5 – 21.5 20 7 Media = ____________
21.5 – 24.5 23 9
24.5 – 27.5 26 8 Mediana=:___________
27.5 – 30.5 29 5
30.5 – 33.5 32 3 Moda=_____________
33.5 – 36.5 35 2
T O T A L: 47
49
CUARTILES, DECILES Y PERCENTILES:
La mediana no es más que uno de muchos fractiles; éstos dividen los datos en dos o más
partes, tan iguales “como sea posible”. Entre ellos también encontramos los cuartiles,
deciles y percentiles, que pretenden dividir los datos en cuatro, diez, y cien partes. Hasta
hace poco, los fractiles se manejaban principalmente para distribuciones de conjuntos
numerosos de datos.
El cuartil se utiliza a fin de conocer los intervalos dentro de los cuales quedan representados
proporcionalmente los términos de una distribución, para esto, se divide la distribución de
frecuencias en 4 partes iguales, cada una contiene IGUAL NÚMERO DE OBSERVACIONES
(el 25% del total). Los puntos de separación de los valores de X se llaman CUARTILES.
El primer cuartil corresponde al 25% y se designa con Q1.
El segundo cuartil se designa con Q2 que representa el valor de 50% y coincide con la
mediana.
El tercer cuartil es Q3 representa el 75% de las observaciones.
Para el cálculo de los cuartiles dividimos los datos en CUATRO PARTES IGUALES. Para
ilustrar dicho procedimiento tenemos la siguiente figura:
72 74 75 77 78 79 82 85 86 90 93 94
n = 12
Se puede apreciar que las líneas punteadas dividen los datos en cuatro partes iguales. Si
determinamos que los puntos centrales entre 75 y 77, 79 y 82, y 86 y 90 sean los tres
cuartiles, tenemos:
75 77 79 82 86 90
Q1 76 Q2 80.5 Q3 88
2 2 2
Es evidente que Q2 = 80.5, también es la mediana y se puede verificar con facilidad que se
satisfacen las tres propiedades de los cuartiles. Todo lo anterior funcionó muy bien porque los
doce datos resultó ser múltiplo de 4. No obstante ¿Qué podemos hacer si fueran 11 datos?
Como los siguientes.
50
72 74 75 78 79 82 85 86 90 93 94 observa que son 11 datos
n = 11 72 74 75 78 79 82 85 86 90 93 94
El cuartil inferior (Q1) es la mediana de los cinco valores por debajo de la mediana,
esto es, 75.
Y el cuartil superior (Q3) es la mediana de los cinco valores por arriba de la mediana, o sea,
90.
51
AHORA TE TOCA REALIZAR LAS ACTIVIDADES DE APRENDIZAJE:
Realiza un esquema o dibujo de cada uno de los ejercicios, aun lado de la página
a) Calcula a mediana (Q2) y los cuartiles (Q1) y (Q3) de las siguientes calificaciones de nueve
alumnos en una prueba de matemáticas.
b) Calcula los tres cuartiles de las siguientes lecturas de presión de nueve personas después
de haber efectuado ejercicios de esfuerzo;
104, 100, 98, 111, 191, 94, 103, 96, 108 y 99.
52
REGRESIÓN LINEAL
Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los
supuestos del error:
Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:
Regresión lineal simple. Sólo se maneja una variable independiente, por lo que sólo cuenta
con dos parámetros.
Regresión lineal múltiple. Maneja varias variables independientes. Cuenta con varios
parámetros.
Para calcular los parámetros debe tomarse en cuenta que se está refiriendo a matrices:
53
Ahora estudiemos las…
54
MEDIDAS DE DISPERSIÓN
A menudo escuchamos que en los países latinoamericanos existe mucha DIFERENCIA entre
los ingresos que perciben por ejemplo los políticos y los trabajadores de otra clase social de
la población. Esas diferencias tienen sus raíces en distintos fenómenos sociales, políticos y
económicos; sin embargo, un economista diría “el ingreso per cápita en los países
latinoamericanos está más DISPERSO que el ingreso per cápita de los países
desarrollados”.
El concepto de DISPERSIÓN resulta importante en casi todos los estudios, ya que puede
darse el caso de poblaciones con igual valor central (Media aritmética, Mediana o Moda),
pero una puede estar más DISPERSA que la otra, es decir, los promedios nos sirven para
describir los datos representados por la tendencia central del conjunto. Por lo tanto, el
promedio no logra por si mismo describir completamente a una colección de datos; se
necesitan otros valores que nos indiquen el grado en que las observaciones estudiadas se
apartan o VARÍAN con respecto al valor central, es decir, el GRADO DE VARIACIÓN O
DISPERSIÓN.
Con los siguientes datos de dos poblaciones, analicemos primeramente sus medias
aritméticas:
Población A) : 1 (7) , 2 (11), 3 (13), 4 (9), 5 (5), 6( 3), 7( 2), 8(1) = 169 = 3.31
51
n = 51
15 --
13 -- Histograma de los datos de la población A
11 --
Frecuencia 9 -- Media aritmética (promedio) = 3.31
7 --
5 --
3 --
1 --
1 2 3 4 5 6 7 8
55
Población B) : 1 ( 3 ), 2 ( 9 ), 3 ( 15 ), 4 ( 12 ), 5 ( 9 ) = 159 = 3.31 igual que la población
A
48
n = 48
15--
13-- Histograma de los datos de la población B
11--
Frecuencia 9--
7-- Media aritmética (promedio) = 3.31
5--
3--
1--
1 2 3 4 5
No obstante que en las dos poblaciones se obtuvo una media aritmética igual de 3.31; al
observar los dos histogramas nos damos cuenta que no son iguales PERO...
______________________________________________________________________
Por tal motivo las medidas de tendencia central, no dicen nada por sí mismas, por lo que se
deben calcular las MEDIDAS DE DISPERSIÓN o LAS VARIACIONES de los datos. Por su
cálculo las MEDIDAS DE DISPERSIÓN se dividen en absolutas y relativas, aún que existen
mas, estudiaremos las siguientes:
RANGO O RECORRIDO:
Por lo tanto y como 8 > 5, podemos señalar con seguridad que los datos de la primera
población A), está más dispersa o desviados que los datos de la segunda población B).
57
AHORA ESTUDIAREMOS OTRAS
x
1 2 4 4.9 7 8 9
Según la fórmula anterior, desvío es igual al dato menos la media aritmética por lo tanto
tenemos:
58
La desviación de cada dato será:
Calculo del desvío
Datos d = X1 -x desvío =
1 1 – 4.9 = - 3.9
2 2 – 4.9 = -2.9 Suman
2 2 – 4.9 = -2.9 – 10.6
4 4 – 4.9 = -0.9
5 5 – 4.9 = 0.1
5 5 – 4.9 = 0.1
7 7 – 4.9 = 2.1
Suman
7 7 – 4.9 = 2.1 + 10.6
8 8 – 4.9 = 3.1
9 8 – 4.9 = 3.1
49/10= -10.6
4.9 +10.6= 0.0
De acuerdo a los resultados de la tabla ¿Cuál es el dato que está más disperso?
Es el número 1, porque independientemente de su signo, su valor absoluto es el mas alto y es
de – 3.9 de desvío.
Ahora ¿Cuál es el dato menos disperso?. Es el número 5 porque está más cerca de la media
aritmética y tiene un desvío de 0.1.
Por otro lado, al sumar los resultados NEGATIVOS de los desvíos nos arroja un valor de –
10.6 y al sumar los resultados POSITIVOS de los desvíos también nos da un valor de + 10.6
por lo tanto, se comprueba que la diferencia de los desvíos negativos y los positivos, nos da
cero o en su defecto tiende a ser cero.
59
DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTANDAR O TÍPICA Y COEFICIENTE
DE VARIACIÓN
CON D A T O S N O A G R U P A D O S
DESVIACIÓN MEDIA.:
60
Sigamos el mismo ejemplo y AUMENTEMOS UNA COLUMNA para los valores absolutos
al cuadro anterior:
Desviación media es igual a... La suma de los valores absolutos entre el número de muestras
Otra forma de hacerlo, es elevar al cuadrado los desvíos, por lo que surge la...
VARIANZA (S2) : Que es la media aritmética (promedio) de los cuadrados de los desvíos y
su fórmula es la siguiente:
N
(x 1 x )2
S2 i 1 Suma de desvíos al cuadrado
Número de datos
N
Sigamos el mismo ejemplo para calcular la varianza ( S2 ):
AUMENTAMOS OTRA COLUMNA a la tabla, ahora para los desvíos al cuadrado
61
Calculamos la varianza según la fórmula anterior y tenemos:
Número de datos 6
Este tipo de coeficiente es muy útil para medir la DISPERSIÓN RELATIVA en base a la
desviación estándar y la media y sirve básicamente para comparar muestras distintas en
términos numéricos adimensionales, es decir, que mientras las demás medidas de dispersión
tienen unidades, el coeficiente de variación carece de ellas.
C. V =
11.77 . = 0.033
354.17
También se puede expresar en porcentaje al multiplicar por 100 esto es, (0.033) (100) =
3.30%
C.V. = 3.30 %
RANGO INTERCUARTIL
62
Cuando habiéndose aplicado la media aritmética se quiere evitar la influencia de los valores
extremos, se analiza únicamente la situación intermedia de la distribución de frecuencias
aplicando el RANGO INTERCUARTIL.
Rango semiintercuartil QD = Q3 - Q1
Hagamos un ejemplo:
n = 12 72 74 75 77 78 79 82 85 86 90 93 94
75 77 79 82 86 90
Q1 76 Q2 80.5 Q3 88
2 2 2
Rango intercuartil Q = Q3 – Q1
Q =88 – 76 = 12
QD =12 = 6
2
El rango semiintercuartil (desviación cuartil) mide la dispersión con mayor precisión que el
rango, sin embargo, presenta las limitaciones siguientes:
c) Igual que la mediana, no tiene propiedades que permitan su uso en las relaciones
matemáticas que utiliza la estadística
Percentiles
Por ejemplo, el percentil 80, p80, es un número que supera al 80% de los datos de la
distribución. Los percentiles también se llaman centiles.
63
Ja, Ja, Ja, eso está
fácil y entendible
aceboman
Ja, Ja,Ja
64
SIGAMOS PRACTICANDO PARA OBTENER LAS MEDIDAS DE DISPERSIÓN
PARA DATOS NO AGRUPADOS
Los siguientes datos son las edades de dos grupos de estudiantes del SAETA-XALISCO, de
la generación Agosto -2001. A cada uno de los grupos le obtendrás las medidas de dispersión
siguientes:
DESVIOS de cada edad, DESVIACIÓN MEDIA, VARIANZA,
DESVIACIÓN ESTÁNDAR Y COEFICIENTE DE VARIACIÓN
16 16 18 19 19 15 15 15 16 16
19 19 20 21 21 17 17 17 18 18
22 22 22 22 23 18 18 19 19 19
27 29 29 30 32 19 20 20 21 21
21 22 22 29 30
65
En la siguiente página…
REALIZA TUS CÁLCULOS DE ACUERDO A LAS FÓRMULAS CORRESPONDIENTES,
HASTA OBTENER SUS RESULTADOS PARA CADA GRUPO.
AHORA CONTESTA ¿CUÁL DE LOS DOS GRUPOS TIENE SUS DATOS MÁS
DISPERSOS?
Respuesta: _______________
Porque?___________________________________________________
66
FINALMENTE OBTENGAMOS LAS MEDIADAS DE DISPERSIÓN
PARA DATOS AGRUPAD OS
Completa las siguientes filas de las columnas para que calcules la Desviación media (dm), la
Varianza (S2) la Desviación estándar o típica ( S ).
Intervalo Marc Frecuen Frecuen Valor Frecuen Desvío Frec. por
clase a de cia cia por absoluto cia por s al desvíos
clase marca del desvíos cuadra al
(estaturas ) (alumno
(X) de clase desvío do cuadrad
s) f X1 X o
(f)(X) X1 X
2
(f) X1 X
f
XX 2
f x1 x
=
i 1
Formula para obtener la desviación media dm N
f (x
i 1
1 x)2
Formula para obtener la varianza = S2
N
N
f (x
i 1
1 X )2
S
N
67
Formula para obtener la desviación estandar (S) =
S
Formula para obtener el coeficiente de variación en porcentaje C.V . (100)
X
RESULTADOS
Desviación media =_______________
Varianza = ____________________
Coeficiente de variación =
ACTIVIDADES DE APRENDIZAJE:
_______________
Calcula las medidas de dispersión (desviación media, varianza, desviación estándar y
coeficiente de variación) de los siguientes dos ejercicios.
De la página 16…
Intervalos de Marca Frecuencia
Clase de Clase Absoluta
(x) (f )
59.5 - 63.5 61.5 6
63.5 - 67.5 65.5 6
67.5 - 71.5 69.5 8
71.5 - 75.5 73.5 11
75.5 - 79.5 77.5 8
79.5 - 83.5 81.5 9
83.5 - 87.5 85.5 2
TOTAL = 50
RESULTADOS
Desviación media =_______________
Varianza = ____________________
Desviación estándar =
______________
Coeficiente de variación =
_______________
68
De la pagina …18
Intervalos de Marca Frecuencia
Clase de Absoluta (f)
Clase
(x)
148.5 150.5 3
152.5
152.5 154.5 7
156.5
156.5 158.5 13
160.5
160.5 162.5 12
164.5
164.5 166.5 13
168.5
168.5 170.5 5
172.5
172.5 174.5 2
176.5
TOTAL = 55
RESULTADOS
Desviación media =_______________
Varianza = ____________________
Desviación estándar =
______________
Coeficiente de variación =
_______________
69
PROBABILIDAD
I N T R O D U C C I Ó N:
CONCEPTOS BÁSICOS
Con el objeto de familiarizarse con el concepto de la probabilidad comenzaremos por dar una
definición de probabilidad que sólo es válida cuando todos los resultados son igualmente
probables.
La experiencia justifica esta igualdad, pues a medida que n se hace mayor, la frecuencia
relativa se aproxima más a la probabilidad matemática. Este concepto se utiliza para definir la
razón citada como probabilidad empírica, algunos autores la citan como FORMULA
BÁSICA de la probabilidad.
Otro concepto importante es que la probabilidad de que suceda un evento es un número real
entre cero y uno. Entre más pequeño sea este número, el evento es menos probable, y entre
más cercano a uno sea este número, el evento es más probable. Cuando la probabilidad es
igual a ½ el evento tiene la misma probabilidad de ocurrir que de no ocurrir.
Así la posibilidad de que al tirar el dado el resultado sea 2 o 5 es de 2/6 = 1/3 que sería igual
al 33.33 % ya que se dividió 1/3 por 100.
70
¿Cuál es la probabilidad de obtener un número impar al lanzar un dado?.
S = ( 1, 2, 3, 4, 5, 6 ) E = ( 1, 3, 5, ) p(E)= 3 = 1
6 2
La probabilidad es de ½ o 0.5 en porcentaje será el 50%
¿Cuál es la probabilidad de extraer una ficha de dominó con 7 puntos de una caja, sin ver?.
S = (6,6), (6,5), (6,4), (6,3), (6,2), (6,1), (6,0), (5,5), (5,4), (5,3), (5,2), (5,1), (5,0), (4,4),
(4,3), (4,2), (4,1), (4,0), (3,3), (3,2), (3,1), (3,0), (2,2), (2,1), (2,0), (1,1), (1,0), (0,0)
71
MODELOS MATEMÁTICOS
Axiomas de Kolmogorov
p(S)=1
Tercer axioma
Si A1, A2 ... son sucesos mutuamente excluyentes (incompatibles dos a dos,
disjuntos o de intersección vacía dos a dos), entonces:
72
PERMUTACIONES Y COMBINACIONES
En el estudio de “lo que es posible” hay esencialmente dos tipos de problemas. Existe el
problema de hacer una lista de todo lo que puede suceder en una situación determinada y se
tiene el problema de determinar cuántas cosas diferentes pueden suceder. El segundo tipo de
problema es de especial importancia porque hay muchas situaciones en que no necesitamos
una lista completa y por tanto, podemos ahorrarnos una gran cantidad de trabajo.
Presión sanguínea
Tipo sanguíneo BAJA
DIAGRAMA DE ÁRBOL
NORMAL
Solución: Si tenemos 2 letras (a, b) y formamos la palabra con tres letras tendremos 23 = 2 x 2
x 2 = 8 esto quiere decir que formaremos ocho palabras con tres letras.
73
Para comprender mejor hagamos otro “DIAGRAMA DE ÁRBOL”
a ………………….. a a a
a
b …………………… a a b
a
a …………………… aba
b
b ………………….. a b b
a ………………….. b a a
a
b …………………. b a b
b
a …………………. b b a
b
b …………………. b b b
PLACA DE NAYARIT
PROCESO DE CONTAR
74
Si el suceso o evento incluye más de dos sucesos diferentes podemos ampliar el principio
multiplicativo, de manera que si después de haber ocurrido los dos primeros sucesos, puede
ocurrir un tercero de p3 maneras diferentes, un cuarto de p4 maneras diferentes, y por último
un n-ésimo de pn maneras diferentes, entonces los sucesos pueden ocurrir en el orden
siguiente: p1 p2 p3 p4 …, pn maneras diferente.
Reflexiona y piensa: Una cafetería ofrece una comida especial que consiste en un
emparedado (usando una de ocho carnes distintas y uno de cuatro tipos diferentes de pan),
una de cuatro clases distintas de sopa y una de tres bebidas diferentes.
¿De cuántas maneras distintas una persona puede seleccionar una de estas comidas
especiales?
Solución: Dado que p1 = 8, p2 = 4, p3 = 4, p4 = 3, hay (8)(4)(4)(3) = 384
maneras diferentes en que se puede seleccionar una comida especial.
¿De cuántas maneras distintas un estudiante puede marcar una respuesta para cada
pregunta?
Uno de los principales conocimientos que nos servirán como base para el cálculo de las
técnicas de conteo (permutaciones y combinaciones), es el factorial de un número. Su
definición y algunos ejemplos se comentan enseguida.
75
El producto de cualquier número entero positivo n por todos los enteros menores que n se
llama FACTORIAL de n y se expresa con el símbolo n!, por lo tanto:
0! = 1 por definición
1! = 1 (1) = 1
2! = 2 (1) = 2
3! = 3 (2) (1) = 6
4! = 4 (3)(2)(1) = 24
5! = 5 (4)(3)(2)(1) = 120
.
.
.
n! = (n) (n-1) (n-2) ,…(1)
8! = ______________________
9! =_______________________
10! = _______________________________
76
ACTIVIDADES DE APRENDIZAJE: Resuelve los siguientes problemas de probabilidades de
frecuencia relativa en fracciones ( 0 a 1) y en porcentajes (%). REALIZA AQUÍ TUS
CÁLCULOS.
3) En una caja hay 75 canicas azules y 225 rojas. ¿Cuál es la probabilidad de sacar al azar
una canica azul? Además calcula ¿cual es la probabilidad de sacar una roja?
77
MAS ACTIVIDADES DE APRENDIZAJE: UTILIZA LA HOJA DE AUN LADO O DE ATRAZ,
PARA RESOLVER LOS SIGUIENTES PROBLEMAS DE CONTEO (Diagrama de árbol y
principio multiplicativo,)
1) ¿De cuántas maneras diferentes se puede arreglar uno de los viajes especiales de fin de
semana a 12 ciudades distintas, por avión, tren o autobús, que ofrece una agencia de viajes?:
ELABORA UN DIAGRAMA DE ÁRBOL PARA ESTE EJERCICIO EN LA PÁGINA DE AÚN
LADO.
4) Una persona piensa comprar cierto automóvil. El fabricante ofrece cualquier combinación
de las siguientes alternativas: SEIS colores diferentes; DOS tipos de motor; TRES tipos de
rines; Transmisión manual o automática; sin radio, con radio AM-FM, con radio AM-FM-
Tocacintas o con radio AM-FM-CD; y sin aire acondicionado o con aire acondicionado. Cada
comprador debe hacer UNA elección con respecto al color, motor, rines, transmisión, radio y
aire acondicionado.
5) De una ciudad A a otra B hay 4 caminos; a su vez de, la ciudad B a la C hay 6 caminos, si
todos los caminos son diferentes, de cuantas formas es posible:
a) Viajar de A hasta C pasando por B
b) Hacer el viaje “redondo” saliendo de A hasta C pasando por B y de C hasta A pasando por
B
c) Hacer el viaje “redondo” desde A hasta C pasando por B pero sin utilizar el mismo camino
más de una vez.
Ciudad Ciudad
Ciudad
B C
A
78
P E R M U T A C I O N E S.
En cada arreglo pueden participar parte o la totalidad de los elementos del conjunto.
n=3 3! 3! 6 n = 1 2 3
r=2 3 p2 6
(3 2)! 1! 1
Serían: 12; 13; 21; 23; 31; 32.
Lo que hace que un arreglo sea diferente a otro es el orden en que aparecen los elementos
del conjunto en cada arreglo. Para una PERMUTACIÓN, el arreglo {1,2} es diferente al
arreglo {2,1}. Entonces, esta técnica de conteo es idónea para problemas en los que es
importante la jerarquía que tienen algunos elementos sobre otros. Algunos ejemplos de ello,
es cuando se requiere conocer el orden de llegada de personas, formas posibles de arranque
y llegada en una justa atlética, colocación de objetos, la jerarquía en algunos puestos
administrativos, la jerarquía en equipos médicos, el orden en que deben tomarse o medirse
algunos objetos en experimentos, etcétera.
Ahora: ¿Cuantas diferentes permutaciones o acomodos se pueden realizar con los números
1,2,3,4 tomando DOS a la vez?
n=4 4! 4! 24 n = 1 2 3 4
r=2 p2 12
(4 2)! 2! 2
4
De nuevo te recordamos que es muy importante que te fijes que aquí si interesa el orden en
que se seleccionaron los dos números (la pareja) de entre los cuatro números (1,2,3,4) y
resulta que hay 12 permutaciones.
79
Se pueden formar 2520 quintas diferentes con 7 jugadores disponibles.
Observa como utilizando la ley de la multiplicación utilizando un ORDEN nos arroja el mismo
resultado: 7(6)(5)(4)(3)= o sea 7 opciones serían para la primer quinta, 6 la segunda quinta, 5
la tercer quinta, 4 la cuarta quinta y por último 3 la quinta, quinta. Si lo multiplicas nos dará
igual = 2520.
Otro tipo de permutaciones es cuando en cada arreglo participan TODOS LOS ELEMENTOS
DEL CONJUNTO(n), o sea cuando el número de permutaciones de n objetos se toman
TODOS los elementos n a la vez.
Iniciemos, Permutar los elementos de un conjunto de TRES tomando todos a la vez, es igual
a 3! = 6 los arreglos resultantes son los siguientes 123,- 132, - 213, - 231, - 312, - 321.
n Pn
La fórmula que se utiliza para estos casos es n!
Otro para comprender mejor: ¿De cuantas maneras distintas se pueden asignar a diez
profesores las diez secciones de un curso de economía? n = 10, obtenemos:
P 10! 3,628,800
10 10
Un último para confirmar: Obtener cuántos números pueden formarse con los dígitos 1,2,3,4,5
sin repetir ningún dígito, n = 5 P 5! 120
5 5
80
Pero… ¿Cómo se elabora un espacio muestral para permutaciones tomando todos los
elementos?
Ejemplo para pensar, sea S= { a,b,c,d, } un conjunto con cuatro elementos genéricos, calcular
n n!
las posibles formas en que se pueden permutar tomando todos los objetos a lan P
vez.
Para ello la forma de cálculo está referida simplemente a sustituir el número de elementos en
n!.
Como ya se explicó, el factorial de un número es el producto de todos los enteros desde n
hasta 1. Entonces, para éste ejemplo el número de elementos es 4, así, 4! = (4)(3)(2)(1) = 24
que será el número de formas posibles, pero queremos saber todos los posibles arreglos o
los espacios maestrales para dicho problema.
Como primer paso se elabora una tabla que contenga todos los posibles arreglos para lo
cual utilizamos la regla del cociente.
El número 6 nos indica que cada elemento del conjunto deberá repetirse seis veces en la
primera columna.
COMPLETA EL EJERCICIO PARA LAS PRIMERAS COLUMNAS (1)
N.A Arreglo N.A Arreglo N.A Arreglo N.A Arreglo
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1 a b c d 7 b 13 19
2 a b d c 8 b 14 20
3 a c b d 9 b 15 21
4 a c 10 b 16 22
5 a 11 b 17 23
6 a 12 b 18 24 d c b a
Como te darás cuenta se han creado cuatro subgrupos de seis elementos.
El segundo paso consiste en hacer la misma operación que el paso anterior, solamente que
esta vez, el total de arreglos serán 6 y el número de elementos serán tres, (6/3 = 2) ya que
uno de los cuatro elementos ya han sido permutados en la primera columna.
En el subgrupo de arreglos que comienzan con “a” ese elemento quedará fuera en esta
operación, o sea que los elementos a permutar serán el resto del conjunto; b,c,d.
Similarmente, en el subgrupo de arreglos que comienzan con “b” ese elemento quedará fuera
de esta operación, o sea que los elementos a permutar serán el resto del conjunto: a,c,d; y
así sucesivamente. A continuación podrás observar dicho procedimiento. COMPLETA EL
EJERCICIO EN LA SEGUNDA COLUMNA
81
Finalmente algunas características de las permutaciones tomando “todos los
elementos”.
a) En cada arreglo están presentes todos los elementos del conjunto: { a,b,c,d }.
b) Todos los arreglos son mutuamente excluyentes. Es decir, cada uno de ellos es
diferente al resto, por lo tanto no existen dos arreglos iguales.
c) Se forman bloques de arreglos que inician con el mismo elemento. Para este caso,
existen cuatro bloques de seis arreglos que inician con el mismo elemento. Este tipo de
agrupamiento es el mayor para 4!
d) El menor agrupamiento en bloques es por pares. De hecho, las dos últimas columnas
de cada par forman un modelo 2!
e) En el primer arreglo, todos los elementos están arreglados en un orden ascendente
f) En el último arreglo sucede lo contrario, están arreglados en forma descendente.
g) El arreglo de los elementos se realiza en estricto orden.
h) En referencia a los 24 arreglos, aparecen todos los elementos en la primera columna.
i) En referencia a cualquier bloque de seis, en la segunda columna aparecen n -1(4-1=3)
elementos del conjunto.
j) En referencia al bloque más pequeño, cualquier par de arreglos, en la tercera aparecen
n - 2 (4-2= 2) elementos del conjunto.
k) En referencia a cualquier arreglo, en la k-ésima columna aparece el elemento faltante
del conjunto.
l) Ninguno de los 24 arreglos presenta un elemento repetido.
Si tenemos un conjunto de 5 elementos, de los cuales sólo nos interesa permutar 3 de ellos
(primero, segundo y tercer lugar) en cada arreglo. Así, n = 5 y r = 3 entonces…
5! (5)(4)(3)(2)(1) 120
p3 60
(5 3)!
5
(2)(1) 2
Para dar respuesta a la pregunta a) podemos concluir que si participan 5 atletas y sólo
deseamos conocer las posibles formas en las cuales llegan los tres primeros lugares,
entonces tenemos 60 posibles formas.
82
El número 12 nos indica que esas serán las veces que podría aparecer cada atleta en primer
lugar. COMPLETA LOS PRIMEROS LUGARES DE LLEGADAS DE LA TABLA
N. Llegada N. Llegada N. Llegada N. Llegada N. Llegada
A. 1° 2° 3° A. 1° 2° 3° A. 1° 2° 3° A. 1° 2° 3° A. 1° 2° 3°
1 1 2 3 13 2 25 37 49
2 1 2 4 14 2 26 38 50
3 1 2 5 15 2 27 39 51
4 1 3 2 16 2 28 40 52
5 1 3 4 17 2 29 41 53
6 1 3 5 18 2 30 42 54
7 1 4 19 2 31 43 55
8 1 4 20 2 32 44 56
9 1 4 21 2 33 45 57
10 1 22 2 34 46 58
11 1 23 2 35 47 59
12 1 24 2 36 48 60 5 4 3
El segundo paso consiste en calcular los segundos lugares para las otras cuatro corredoras.
El tercer paso puede tener dos lecturas; la primera determinar mediante la regla del cociente
el número de veces que aparecerá cada elemento en la tercer columna ( 3 / 3 = 1); La
segunda, colocar el resto de los elementos para el menor subgrupo. Recomendaremos la
segunda opción, por tanto, en este caso el subgrupo más pequeño es de tres elementos
idénticos. Por ejemplo, los arreglos uno, dos y tres tienen los elementos 1 y 2 hasta la
segunda columna. Al contrario de la anterior técnica de permutaciones (tomando todos los
elementos), en esta ocasión colocaremos el resto de los elementos en una forma vertical
hacia abajo. Esta acción nos servirá para distinguir esa tercia de arreglos idénticos.
¿De cuantas formas puede llegar Ana Gabriela Guevara en primero, segundo y tercer lugar?.
83
ACTIVIDADES DE APRENDIZAJE:
CALCULA LAS POSIBLES FORMAS DE PERMUTACION Y ELABORA LOS ESPACIOS
MUESTRALES UTILIZANDO LA PAGINA DE LADO O ATRAZ DE ELLA.
1) Sea S = { a,b,c,}, o sea un conjunto con tres elementos genéricos, calcular las posibles
formas en que se pueden permutar tomando todos los objetos a la vez y elaborar el espacio
muestral correspondiente.
2) Sea W = { A,B,C,D} un conjunto con cuatro elementos, calcular las posibles formas en que
se pueden permutar tomando tres a la vez y elaborar el espacio muestral correspondiente.
3) Sea X = { a,b,c,d,e,f} un conjunto con seis elementos, calcular las posibles formas en que
se pueden permutar tomando dos a la vez y elaborar el espacio muestral correspondiente.
84
C O M B I N A C I O N E S:
Por ejemplo, los arreglos posibles del conjunto de letras {a,b} son ab y ba. Puesto que el
orden del arreglo NO es considerado, el arreglo ab es el mismo que ba. Por tanto, hay
solamente una combinación posible para el conjunto.
Para iniciar: Cuantas diferentes combinaciones o grupos se pueden realizar con los números
1,2,3 tomando DOS a la vez?
3! 3! 6
n=3 C2 3 n = 1 2 3
2!(3 2)! 2!1! 2
3
r=2
Serían: 12; 13; 23
21; 31; 32; Estos se eliminan, porque no nos interesa el orden en que se seleccionan
los dos números ( r ) de entre los tres números ( n ). Aquí es mas chico el resultado que
en la permutación, porque el orden no tiene importancia.
n=4 4! 4! 24 n = 1 2 3 4
r=2 C2 6
2!(4 2)! 2!2! 4
4
21; 31; 32; 41; 42; 43; Estos se eliminan por la misma razón anterior.
Es muy importante que te fijes que aquí NO interesa el orden en que seleccionan los dos
números (la pareja) de entre los cuatro números (1,2,3,4) y resulta que hay 6 combinaciones.
85
PRIMER PROBLEMA: Con una parte de su primer salario, un alumno de quinto semestre
decide comprar TRES de los SIETE discos compactos que ha sacado a la venta el grupo
MANA. ¿Cuántas posibilidades tiene? Ya que hay que elegir 3 discos (sin importar el orden)
de un conjunto de siete.
7! 7! 5040 5040
n=7 C3 35
3!(7 3)! 3!4! (6)(24) 144
7
r=3
OTRO PARA PENSAR; ¿De cuantas maneras una persona puede seleccionar TRES libros
de una lista de OCHO best-sellers? Aquí tampoco es importante el orden en que se
seleccionen los tres libros.
n=8
r=3 8! 8! 40320 40320
8 C3 56
3!(8 3)! 3!5! (6)(120) 720
PARA REFLEXIONAR Y CONFIRMAR: Un alumno del CBTa No. 107 Ext. Xalisco del turno
vespertino, tiene 7 libros de física y 5 de matemáticas. Calcular de cuántas maneras se
pueden ordenar 3 libros de física y 2 de matemáticas en un librero.
Primeramente hacemos las combinaciones posibles de libros de física.
n=7 7! 7! 5040 5040
r=3 7 C3 35 combinaciones de libros de física
3!(7 3)! 3!4! (6)(24) 144
Ahora hacemos las combinaciones posibles de libros de matemáticas
5! 5! 120 120
n=5 5 C2 10 combinaciones de libros de
2!(5 2)! 2!3! (2)(6) 12
matemáticas
r=2
Multiplicamos 35 por 10 nos resulta 350 combinaciones posibles.
De una manera general, la propuesta para elaborar espacios muestrales para este tipo de
técnica de conteo está basada en un sistema numérico a la n, el cual denominamos “Método
de la cifra”. (Tomado de: Técnicas de muestreo y espacios maestrales sin maestro. Héctor
Francisco Reynoso Titrado)
5! 5! 120 120
C4 5...combinacio nes
4!(5 4)! 4!1! (24)(1)
5
24
86
En el caso de la segunda pregunta, empezaremos por preparar el espacio para arreglar esas
cinco combinaciones
Primer paso Colocamos los primeros cuatro elementos del conjunto en el primer arreglo.
N.A. Combinaciones
a b c d
1 1 2 3 4
2
3
4
5
N.A. Combinaciones
a b c d
1 1 2 3 4
2 1 2 3 5
3 1 2 4 5
4
5
Observa cómo nuestra atención está siendo demandada en las últimas columnas, arreglando,
de los elementos menores a los mayores, similar a un sistema numérico. Finalmente…
Tercer paso, será cambiar el elemento 2 de la columna k-2, por el siguiente elemento, el 3
(arreglo número cuatro). Lo demás ya es sabido, no habrá elementos mayores a la izquierda.
a) Las combinaciones son arreglos de elementos en los que no nos interesa el orden de
los mismos.
b) El primer arreglo tiene combinados los primeros elementos del conjunto.
d) Los elementos del conjunto aparecen arreglados del menor al mayor de los elementos,
al menos en las escalas nominales y de razón. Justamente, en esta característica está
87
basado el método de la cifra que usamos para elaborar espacios maestrales para
combinaciones.
e) El número que aparece cada elemento del conjunto es el espacio muestral está
dado por la siguiente fórmula:
N.A. Combinaciones
a b c d
1 1 2 3 4 Observamos que cada elemento (1,2,3,4,5) en el
2 1 2 3 5 espacio muestral se repite cuatro veces; esto es, hay
3 1 2 4 5 cuatro 1, cuatro 2, cuatro 3, cuatro 4 y cuatro 5.
4 1 3 4 5
5 2 3 4 5
En resumen:
Es muy importante que recuerdes que en una permutación SI importa el orden y se relaciona
a sucesiones ordenadas; parejas ordenadas, tríadas ordenadas, etc. En las combinaciones
NO importa el orden y se relacionan con la selección de un subconjunto de un conjunto dado.
88
CALCULA LAS POSIBLES FORMAS DE COMBINACIÓN POSIBLES Y ELABORA LOS
ESPACIOS MUESTRALES UTILIZANDO LA PAGINA DE LADO O ATRAZ DE ELLA, PARA
REALIZAR LOS EJERCICIOS
89
MÁS ACTIVIDADES DE APRENDIZAJE:
En cada uno de los siguientes problemas, decide si se trata de una permutación o de una
combinación y obtén su resultado correcto.
UTILIZA LA HOJA DE AUN LADO Y/O LA DE ATRAZ PARA TUS OPERACIONES.
1) Calcular el número de palabras de 5 letras, que se pueden formar con 12 letras diferentes,
aunque no necesariamente tengan algún significado.
Permutación _____ o combinación________
Resolver:
5) Una bolsa contiene 6 bolas rojas numeradas del 1 al 6 y 8 bolas azules numeradas del 1 al
8. ¿De cuántos modos se pueden seleccionar 6 bolas de manera que 2 sean rojas y 4
azules?
Permutación _____ o combinación________
Resolver:
6) La carta de una fonda indica que hay 4 sopas, 7 carnes, 8 ensaladas y 5 postres. ¿De
cuántos modos se puede ordenar una comida consistente en una sopa, una carne, 3
ensaladas y un postre?
Permutación _____ o combinación________
Resolver:
90
TEOREMA DEL BINOMIO Y TRIÁNGULO DE PASCAL
( x + y )1 = x + y
( x + y )2 = x2 + 2xy + y2
( x + y )3 = x3 + 3x2y + 3xy2 + y3
( x + y )5 = __________________________________
( x + y )6 = _______________________________________________
TRIANGULO DE PASCAL
( x + y )0 = primera fila 1
( x + y )1 = 1 1
( x + y )2 = 1 2 1
( x + y )3 = 1 3 3 1
( x + y )4 = 1 4 6 4 1
( x + y )5=
(x + y )6 =
Observa que si sumas dos coeficientes adyacentes, su suma es el coeficiente entre ellos una
fila abajo; por ejemplo, para obtener el 2 de la tercer fila sumamos los dos UNOS(1+1=2) de
la segunda fila; para obtener el 4 de la quinta fila sumamos el UNO y TRES (1 +3 = 4)
Preparados ahora si con todo este conocimiento, podemos escribir fácilmente TODO EL
DESARROLLO de los binomios (x+y)5 ; (x+y)6 y (x + y )7
(x + y )5 = _______________________________________________
Por supuesto que si deseamos desarrollar la sexta potencia del binomio, podemos hacerlo
utilizando los coeficientes de la quinta potencia y así sucesivamente. Fácil o no?
( x + y )6 = ____________________________________________________________
(x + y)7 = _________________________________________________________________
92
PROBABILIDAD AXIOMÁTICA
A) UNIÓN ( su símbolo es U )
Si se reúnen los elementos de dos o más conjuntos para formar uno solo, a este
conjunto que resulta se la llama UNIÓN DE CONJUNTOS; si existen elementos comunes
entre los conjuntos originales éstos no se repiten en el conjunto unión.
P M
P ( P U M) = { 1, 2, 3, 4, 5, 6 }
1,2 3, 4 5, 6
P (P o M) = { 1, 2, 3, 4, 5, 6 }
93
En Diagrama de Venn - Euler
P (A ∩ B) = { 1, 2 }
P (A y B) = { 1, 2 } A 1,2 B
C. COMPLEMENTO DE UN CONJUNTO
Cuando se ha establecido un conjunto universal u, a la diferencia de u y un conjunto sea
por ejemplo A, se le llama COMPLEMENTO de A, se expresa A’ . El apóstrofe señala que
hemos formado el complemento de A. Algunos autores expresan el complemento, así; A c con
una pequeña c de donde A’ = Ac , otros mas, lo expresan con una barra arriba de la letra
mayúscula.
Observa detenidamente: u = { 1, 2, 3, 4, 5, 6 } A = { 1, 2, 3 }
En diagrama de Venn - Euler
P ( A’ ) = { 4, 5, 6 } u
A
A’= 4, 5, 6
Ejemplo: A = { 1, 2, 3, 4, 5 } B = { 1, 2 }
A -B B
A – B = { 3, 4, 5 } 3, 4, 5
94
En muchos problemas de probabilidad debemos considerar eventos que se forman por medio
de UNIONES, INTERSECCIONES Y COMPLEMENTOS. Para ilustrar estos conceptos
reflexionemos y analicemos el siguiente problema:
A = { 0, 1, 2, 3, 4, 5, 6 }
B = { 20,21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31}
C = { 0, 15, 31 }
D = { 18, 19, 20, 21, 22, 23, 24 }
E = { 22 }
a) A U D; c) D ∩ B; e) B’ g) D’ U B’
b) B U D; d) A ∩ B; f) D’ h) B’ ∩ A’
b) B U D = { 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31}
f) Como D’ = { 0, 1, 2, …, 16, 17, 25, 26, …, 30, 31} entonces D’ es el evento de que
llueva a lo más (o menos que) 17 días, o bien, que llueva mas de 25 días.
g) Como D’ = { 0, 1, 2, …, 16, 17, 25, 26, …, 30, 31} y B’ = { 0, 1, 2, …, 18, 19} entonces
D’ U B’ = { 0, 1, 2, …, 16, 17, 18, 19, 25, 26, …, 30, 31} ¿como se interpreta?
95
h) B’ ∩ A’ como B’ = { 0, 1, 2, …, 19} y A’ = { 7, 8, 9, …, 31} , entonces la intersección
B’ ∩ A’ es el evento { 7, 8, 9, …, 18, 19 } que llueva de 7 a 19 días.
TIPOS DE EVENTOS
En función de la relación de probabilidad que se puede establecer entre los eventos o
sucesos éstos se clasifican en:
96
Los sucesos B y C SON MUTUAMENTE EXCLUYENTES O DISJUNTOS, puesto que un
analfabeta no puede ser ingeniero y un ingeniero no es un analfabeta.
Los sucesos A y D SON MUTUAMENTE EXCLUYENTES O DISJUNTOS, porque una
persona no puede tener menos de 40 años o mas de 40 años en un mismo momento.
Finalmente, antes de analizar problemas de probabilidad con uniones, complementos e
intersecciones de eventos; analicemos cuando intervienen tres o más eventos y sus
relaciones, dibujando la siguiente figura en donde el espacio muestral queda dividido en ocho
regiones diferentes.
Z Y
Digamos que X es el evento que los autos nuevos que
6 2 5
lleguen a la agencia sean automáticos, Y es el
evento que los autos nuevos que lleguen a la 1
4 3
agencia sean de cuatro puertas, Z que los autos
nuevos que lleguen a la agencia tengan rines 7
deportivos 8
X
¿Que representan las siguientes regiones o números?
La región 3 está formada por los resultados que están en X y en Y, ( X ∩ Y ), pero no están
en Z, de modo que representa el evento de que los autos nuevos que lleguen a la agencia
sean automáticos, de cuatro puertas y no tengan rines deportivos.
La región 6 está formada por los resultados que tiene el evento Z, esto es que los autos
nuevos que lleguen a la agencia tengan nomás rines deportivos.
La región 7 está formada por los resultados que NO están ni en Y ni en Z, por lo que
representa el evento que los autos que lleguen a la agencia NO tengan cuatro puertas ni
tampoco rines deportivos, pero que si sean automáticos.
___________________________________________________________________________
_
y la región 2 y 4
?,_____________________________________________________________
___________________________________________________________________________
_
Una vez que ya nos hemos familiarizado con los eventos y sus relaciones vamos a describir
algunas reglas sencillas que nos permitan determinar la probabilidad de que ocurra algún
evento. Para expresar simbólicamente estas reglas denotaremos por P ( A ) a la probabilidad
de que ocurra el evento A. Ya hemos comentado que la probabilidad de que suceda un
evento es un número real entre cero y uno y que entre más pequeño sea este número, el
evento es menos probable y entre más cercano a uno el número el evento es más probable.
97
REGLAS BÁSICAS DE PROBABILIDAD
Esta ley se utiliza cuando se quiere obtener la probabilidad de que ocurra el suceso A o el
suceso B, para lo cual es necesario revisar si los sucesos SON O NO MUTUAMENTE
EXCLUYENTES.
Hagamos un diagrama… U
P (A ) +
P (B)
Eventos mutuamente
excluyentes
Hagamos un diagrama…
P (A’) =
P (A )
U
1 –
Eventos mutuamente
excluyentes
98
Hagamos un diagrama…
U
P (A) P (B) =
No son mutuamente
excluyentes
P (A U B) P (A) + P (B) – P (A ∩ B)
Ahora con otro problema para que utilices mas reglas… ECHALE GANAS
Para que tu aprendizaje sea significativo contesta por favor las siguientes preguntas
99
Son eventos mutuamente excluyentes SI____ NO___ Porque?
_______________________
___________________________________________________________________________
_
___________________________________________________________________________
_
-
___________________________________________________________________________
_
Como se interpreta P ( A ∩ B ) en el contexto del problema?
___________________________________________________________________________
Si P (A) es la probabilidad de que el martes esté lloviendo; P (A’) será la probabilidad de que
NO LLUEVA el martes a las 16:00 hrs. Por lo tanto utilizamos P ( A’ ) = 1 – P (A) y
sustituyendo los valores P (A’) = 1 – 0.45 = 0.55
En resumen...
P (A’) = La probabilidad de que NO LLUEVA el martes a las 16:00 hrs = 0.55
P (A∩ B) = La probabilidad de estar lloviendo y despejado simultáneamente = P ( Ø ) = 0
P (A U B) = La probabilidad de que esté lloviendo o esté despejado = 0.75
100
Como estos eventos son mutuamente excluyentes, usando la regla P (A1 U… Ak ) = P (A1 ) +
P(A2)... + P (A k ) para saber si la agencia venderá de 2 a 5 automóviles, por lo tanto será:
0.15 + 0.18 + 0.12 + 0.05 = 0.5
Ahora para calcular la probabilidad de que vendan 5 o más automóviles, o sea P (vender 5 o
más automóviles), COMO ES UN EVENTO COMPLEMENTARIO DE (A’) debemos primero
calcular la probabilidad de vender a lo más cuatro automóviles…(AK )
ACTIVIDADES DE APRENDIZAJE:
Realiza tus esquemas, reflexiones y cálculos con orden hasta obtener lo que se te señala.
1) Determina si los siguientes eventos son mutuamente excluyentes. Explica tus respuestas.
_____________________________________________________________________
_
b) Lucía llega tarde a su empleo y Lucía quema accidentalmente una compresora del
taller donde trabaja.
_____________________________________________________________________
_
c) Lucía llega tarde a su empleo y Lucía emplea todo el día arreglando el pago del
impuesto predial de su casa.
_____________________________________________________________________
_
d) En una mano de póker la primera carta es as y en la misma mano de póker la
quinta carta es as.
e) En una mano de póker las primeras cuatro cartas son ases y en la misma mano de
póker la quinta carta es as.
_____________________________________________________________________
__
2) Al lanzar un dado una vez, ¿Cuál es la probabilidad de obtener un 1 o un número par?
3) Para participar en la rifa de un reloj, los alumnos del primer año compraron 18 boletos; los
de segundo año 12 boletos. Si son 50 boletos. ¿Cuál es la probabilidad de que un alumno de
primero o segundo gane la rifa?
101
4) En un experimento tiramos un par de dados y contamos los puntos obtenidos.
P ( A’ ) = _______________________________ P ( B’ ) =
__________________________
P ( A U B ) : ________________________ P ( A ∩ B’ ) = _________________________
P ( A ∩ B ) = ____________________________________
Ahora analicemos dos problemas para aplicar la ley aditiva cuando dos sucesos NO son
mutuamente excluyentes, donde ya se indicó que P ( A ∩ B ) ≠ Ø y se utiliza entonces…
P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) o sea la probabilidad de que A o B ocurran
indistintamente.
Problema para pensar: Un estudio de mercado estima que las probabilidades de que una
familia en cierta zona vea el noticiero de TV Azteca es de 0.3, que vea el noticiero de Televisa
es de 0.2 y de que vea a ambos es de 0.02.
¿Cuál es la probabilidad de que una familia vea al menos uno de los dos noticieros?
Observemos primero que como la probabilidad de que vean ambos noticieros es positiva, los
eventos A y B NO son mutuamente excluyentes, por lo tanto se deben transmitir a diferente
horario.
102
Sea A el evento sacar UN AS y como en la baraja hay 4 ases en 52 cartas P ( A ) = 4/52
Sea B el evento sacar UN TREBOL y en la baraja hay 13 tréboles en 52 cartas P (B) = 13/52
La probabilidad de obtener UN AS y UN TREBOL al mismo tiempo es de 1/ 52 Por lo
tanto…
2) Si extraes de una baraja de póker ordinaria, una sola carta ¿Cuál es la probabilidad de de
que sea:
Una reina o un corazón?
Un 3 o una carta negra?
103
PROBABILIDAD PARA EVENTOS SUCESIVOS
Observa que la regla del producto analiza con frecuencia lo que ocurre en más de un
lanzamiento o extracción, mientras que la regla de la suma estudia sólo un lanzamiento o
extracción.
El muestreo con reemplazo ilustra bien esta situación. Por ejemplo, suponga que vamos a
extraer dos cartas, una a la vez, con reemplazo, de una baraja ordinaria. Denotamos por A a
la carta extraída primero y B a la carta obtenida en segundo lugar. Cuando A se reemplaza
antes de extraer a B, la aparición de A en la primera extracción no tiene efecto alguno sobre
la probabilidad de ocurrencia de B. Por lo tanto son eventos A y B son independientes. Bajo
esta condición, la regla del producto se convierte en…
Vamos a analizar dos problemas para emplear esta ecuación. Suponga que vamos a obtener
al azar dos cartas, una a la vez, con reemplazo, de una baraja ordinaria. ¿Cuál es la
probabilidad de que ambas cartas seas Ases?
Como el problema nos pide DOS cartas; la primera que sea As “y ” en la segunda extracción
sea también otro As y además con reemplazo, podemos utilizar la regla del producto P (A ∩
B) = P ( A ) P ( B )
104
P ( A ) = (un as en la primera extracción) P ( B ) = (un as en la segunda extracción)
4 ases o eventos favorables de 52 barajas también 4 ases o eventos favorables de 52
barajas
Otro para reflexionar y pensar. Se lanza un dado y se saca una canica de una bolsa; en la
bolsa hay 3 canicas, una roja, una azul y una verde. ¿Cuál es la probabilidad de que salga un
número primo y una canica azul?
Lee detenidamente el problema y contesta ¿los eventos (lanzar un dado y sacar una canica)
son independientes? _____ porque?
__________________________________________________
Si el lanzar el dado es el evento A, ¿Cuales son los eventos muestrales para A ?
A = { _____________} P ( A ) = ( 4/ 6 )
Esto lo podemos comprobar contando de los resultados posibles, los que son favorables al
suceso A y B, así:
(A, 1) (A, 2) ( A, 3) (A, 4) (A, 5) ( A, 6)
(R, 1) (R, 2) ( R, 3) (R, 4) (R, 5) ( R, 6)
(V, 1) (V, 2) ( V, 3) (V, 4) (V, 5) ( V, 6)
La anterior regla del producto para eventos independientes, también se aplica en situaciones
con más de dos eventos. En tales casos, la probabilidad de la ocurrencia conjunta de los
eventos es igual al producto de las probabilidades individuales de cada evento. En forma de
ecuación es…
P ( A y B y C …Z ) = P ( A ) P ( B ) P ( C ) … P ( Z )
Queremos obtener al azar 4 individuos de una población de 110 habitantes, los cuales 50 son
varones y 60 mujeres. El muestreo es un individuo a la vez, con reemplazo. ¿Cuáles la
probabilidad de obtener 3 mujeres y 1 hombre, en ese mismo orden?
Como el problema pide una mujer en la primera, segunda y tercera extracción y un hombre en
la cuarta y como el muestreo es con reemplazo, aplicamos la ley del producto para más de
dos eventos independientes.
105
Regla del producto: Eventos dependientes
El muestreo sin reemplazo ilustra bien esta situación de los eventos dependientes.
Otro problema para aprender… Queremos obtener DOS frutas, una a la vez, de una bolsa de
frutas que contienen 4 manzanas, 6 naranjas y 5 duraznos, sin reemplazo ¿Cuál es la
probabilidad de obtener una naranja y una manzana, en ese mismo orden?
Por lo tanto…
106
Un último problema para reafirmar y después realices tus actividades de aprendizaje:
De un grupo del CBTa – Xalisco turno vespertino, se van a elegir por sorteo a 3 alumnos que
se hagan cargo de una ceremonia escolar del “día del maestro”; en el grupo hay 24 hombres
y 12 mujeres. ¿Cuál es la probabilidad de que el grupo de representantes esté conformado de
las maneras siguientes; sean Tres hombres y sean dos hombres y una mujer
Observa que la ocurrencia de A, AFECTA la probabilidad de que ocurra A 2 puesto que tanto
el número de hombres como el número de alumnos cambia ( han disminuido) para el evento
A2.
A3 ; el tercer alumno seleccionado sea hombre - - - - - P ( A3 ) = 22/34
Entonces P ( B ) = P (B1 ) P (B2 ) P (B3 ) = (24/ 36) (23/ 35) (12/34 ) = 6624/ 42840 = 0.1546
= 15.46 %
Observa que el orden en que salgan los dos hombres y la mujer no cambia el valor de la
probabilidad.
107
ACTIVIDADES DE APRENDIZAJE
1) Determina si los siguientes eventos son Independientes o dependientes. Explica tus
respuestas
a) Se toma una carta de una baraja de póker bien revuelta y sin regresar esta carta se toma
una segunda carta:
___________________________________________________________________________
_
b) Si A es el evento que el automovilista maneja en estado de ebriedad y B es el evento el
automovilista tuvo un accidente.
___________________________________________________________________________
_
c) Si A es el evento que una moneda caiga águila en un primer volado y B es el evento que la
moneda caiga águila en el segundo volado.
___________________________________________________________________________
d) Se toma una carta de una baraja bien revuelta. Se regresa la carta y después de revolver
la baraja se toma una segunda carta.
___________________________________________________________________________
e) El evento A es una luna llena y el evento B es comer una hamburguesa.
___________________________________________________________________________
4) Si se lanzan dos monedas una sola vez. ¿Cuál es la probabilidad de que ambas caigan
con cara hacia arriba?
108
5) Dada una población de 30 bats, 5 guantes de béisbol y 60 pelotas, si el muestreo es
aleatorio, uno a la vez, sin reemplazo. ¿Cuál es la probabilidad de obtener:
a) Un guante si se extrae un objeto de la población
b) Un bat y una pelota si se extraen dos objetos de la población
c) Un bat, un guante y un bat, en ese orden, si se extraen tres objetos de la población?
6) Usted quiere llamar a una amiga por teléfono. Sólo recuerda los tres primeros dígitos de su
número telefónico y ha olvidado los últimos cuatro. ¿Cuál es la probabilidad de que marque al
azar el número correcto?
7) Durante una comida de fin de año se rifan dos televisores entre un grupo de empleados.
Los participantes en la rifa son cuatro hombres y ocho mujeres. Encuentra la probabilidad de
que los televisores los ganen…
a) Dos hombres
b) Dos mujeres
c) Un hombre y una mujer.
8) Determina la probabilidad de obtener de una baraja de póker bien revuelta dos tréboles
si..
109
TEOREMA DE BAYES
Sea A1, A2, ...,An un conjunto de sucesos incompatibles cuya unión es el total y tales que la
probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se
conocen las probabilidades condicionales P(B/Ai). entonces la probabilidad P(Ai/B) viene
dada por la expresión:
donde:
Esto se cumple
N
Como observación, se tiene P( A / B) 1 y su demostración
i 1
i resulta evidente
110
GLOSARIO
CLASE. Intervalo en el cual se agrupan los datos en una tabla de distribución de frecuencias.
COMPLEMENTO DEL EVENTO A. El evento que contiene todos los puntos maestrales que
no están en A
CUARTILES. Los percentiles 25%, 50% y 75% se llaman primer cuartil, segundo cuartil
(mediana) y tercer cuartil respectivamente. Se pueden usar los cuartiles para dividir al
conjunto de datos en cuatro partes, cada una de las cuales contiene aproximadamente el
25% de los datos.
DATOS CUANTITATIVOS. Datos que indican cuánto o cuántos de algo. Los datos
cuantitativos siempre son numéricos.
111
DIAGRAMA DE DISPERSIÓN. Método gráfico para mostrar la relación entre dos variables
cuantitativas. Una variable se representa sobre el eje horizontal y la otra sobre el eje vertical.
EVENTO. Uno o más de los posibles resultados al hacer algo, o bien uno de los posibles
resultados que se producen al efectuar un experimento.
EXPERIMENTO. Cualquier proceso que genere resultados bien definidos, que se representan
por Ei.
MEDIA ARITMÉTICA. Suma de los valores dividida entre el número total de ellos.
MEDIA GEOMÉTRICA. Medida de tendencia central que se usa para medir la tasa promedio
de cambio o crecimiento de alguna cantidad; se calcula tomando la enésima raíz del producto
de n valores que representan el cambio.
112
MEDIDA DE DISPERSIÓN. Aquella que describe cómo las observaciones están esparcidas
en un conjunto de datos.
MUESTRA ALEATORIA SIMPLE. Muestra tomada de tal manera que cada muestra de
tamaño n tiene la misma probabilidad de ser seleccionada.
POBLACIÓN. Conjunto de todos los elementos que estamos estudiando y acerca de los
cuales tratamos de sacar conclusiones.
POLIGONO DE FRECUENCIAS. Gráfica lineal que une los puntos medios de cada clase en
un conjunto de datos; se grafica en la altura correspondiente a la frecuencia de cada clase.
113
PROBABILIDAD. Es el número de posibilidades que hay de que un fenómeno suceda o no
suceda.
PROMEDIO. Número que describe la centralización o tendencia central de los datos. Existe
un cierto número de promedios especializados, entre los que se incluye la media aritmética, la
media ponderada, la mediana, la moda, y la media geométrica.
RANGO. Medida de dispersión definida como el valor máximo menos el valor mínimo.
114
BIBLIOGRAFÍA CONSULTADA.
11. VILENKIN. N. ¿De cuantas formas? Combinatoria. Libro de la editorial MIR, Moscú,
1972. Impreso en el taller de publicaciones de Matemáticas de la Facultad de Ciencias
UNAM. Vínculos matemáticos No. 219. 1996.
115
BIBLIOGRAFÍA RECOMENDADA.
1. CÓNCAVOS, George, Probabilidad y estadística, Ed. Mc. Graw Hill, México 1998.
4. MORENO, G. José y Ortiz, G. Mariano, Matemáticas primer curso, Ed. Mc Graw Hill,
México 1994.
10. GOVINDEN y LINCOYAN, Curso práctico de estadística Ed. Mc. Graw Hill, México
1990.
ENCICLOPEDIAS DIGITALES
http://es.wikipedia.org/wiki/Portada
116