Académique Documents
Professionnel Documents
Culture Documents
PROGRAMA DESARROLLADO
COORDINACIÓN GENERAL
Y MUY ESPECIALMENTE A:
ÍNDICE
III. TEMARIO
V. EVALUACIÓN
Presentación
a. Ficha de identificación
Nombre de la Licenciatura o Ingeniería Primer cuatrimestre de asignaturas comunes
Nombre del curso o asignatura Estadística básica
Clave de asignatura -
Seriación Sin seriación
Cuatrimestre 1
Horas contempladas 90
b. Descripción
En un mundo cada vez más competitivo, tanto en las áreas comerciales, financieras, tecnológicas
y científicas, y donde invariablemente el flujo de información es mayor a cada momento, se hace
indispensable no sólo la correcta descripción de los datos sino también su análisis e interpretación.
Es aquí donde la estadística juega un papel preponderante, al ser una de las herramientas más
poderosas para comprender la variabilidad inherente a los datos observados y se constituye
como la mejor herramienta para la toma de decisiones.
El tronco básico se conforma de varias asignaturas comunes que promueven, por un lado, la
formación integral de los estudiantes, integrando asignaturas de distintas áreas del conocimiento,
y por otro lado, desarrollan en el estudiante competencias transversales necesarias para la
investigación, el análisis crítico, el manejo y la sistematización de información y datos, así como
una serie de valores que le permitan conducirse con ética y responsabilidad durante su trayectoria
académica y su desempeño profesional.
Las materias que forman el tronco básico son: Contexto socioeconómico de México, Desarrollo
humano, Estadística básica y Fundamentos de investigación; estas materias a simple vista parecen
desarticuladas, pero se interrelacionan para contribuir a la formación integral de los estudiantes.
En relación al tronco básico la asignatura Estadística básica tiene varios propósitos, pues pretende
despertar en el estudiante el interés por la investigación para la toma de decisiones, la solución de
problemas y el análisis de situaciones y eventos relacionados con el entorno académico, profesional,
personal y social, rigiéndose en todo momento por un código de ética profesional y personal.
Los propósitos de la asignatura en relación al tronco básico son que los estudiantes:
1. Adquieran la capacidad de lectura e interpretación de tablas y gráficos estadísticos que con
frecuencia aparecen en diferentes medios.
2. Lleguen a comprender y apreciar el papel de la estadística en la sociedad, incluyendo sus
diferentes campos de aplicación y el modo en que la estadística ha contribuido a su desarrollo.
3. Identifiquen, dentro del contexto socioeconómico mexicano, la importancia y utilidad de los
análisis estadísticos para la toma de decisiones.
4. Se conduzcan de manera ética y responsable en el manejo y análisis de la información.
De manera particular, la materia pone especial énfasis en el enfoque práctico del material y los
contenidos que se presentan, tratando siempre de relacionar los conceptos, técnicas y casos
de estudio con el quehacer cotidiano de las diferentes disciplinas, esperando despertar en los
estudiantes el deseo de adentrarse cada vez más a la teoría de la probabilidad y estadística, al ver
lo importante que resulta su utilización en las diferentes áreas de trabajo.
El curso tiene como propósito introducir al estudiante con los conceptos y técnicas básicas de la
estadística aplicada a la licenciatura e ingeniería. El curso tiene un nivel matemático elemental,
con la intención de que el estudiante comprenda la metodología y su aplicación, y no tanto la
teoría matemática detrás de ella.
II. COMPETENCIAS A DESARROLLAR
Competencia general:
• Aplica procedimientos estadísticos y probabilísticos para analizar eventos en diferentes
contextos, a través de la recolección, representación e interpretación de datos.
Competencias específicas:
• Aplica la metodología estadística para obtener una muestra aleatoria simple, identificando
los elementos que intervienen en un problema estadístico.
• Aplica los parámetros de la estadística descriptiva para la representación gráfica y numérica
de un conjunto de datos a través de muestras aleatorias simples.
• Identifica los conceptos básicos de probabilidad para la solución de problemas mediante
experimentos aleatorios.
• Utiliza los modelos de probabilidad para el análisis de eventos y situaciones en diferentes
contextos a través de experimentos aleatorios.
III. TEMARIO
1. Fundamentos de la estadística
1.1 Introducción a la estadística
1.1.1 División de la estadística
1.2 Conceptos básicos de estadística
1.2.1 Población
1.2.2 Individuo
1.2.3 Muestra
1.2.4 Muestreo
1.2.5 Dato
1.2.6 Variable
1.2.7 Solución de un problema estadístico
1.3 Muestreo aleatorio
1.3.1 Conceptos básicos de muestreo aleatorio
1.3.2 Metodología del muestreo aleatorio simple
2. Estadística descriptiva
2.1 Organización de datos y distribución de frecuencias
2.1.1 Frecuencias
2.1.2 Intervalos
2.1.3 Construcción de intervalos de clase
2.1.4 Tablas de datos
2.1.5 Tablas de frecuencias
2.1.6 Tablas por intervalos de clase
2.1.7 Tablas de doble entrada
2.2 Representación gráfica de datos
2.2.1 Histograma
2.2.2 Gráfica de barras
2.2.3 Gráfica de líneas
2.2.4 Gráficas de área o de pastel
2.3 Medidas de tendencia central
2.3.1 Media aritmética
2.3.2 Mediana
2.3.3 Moda
2.4 Medidas de dispersión
2.4.1 Recorrido
2.4.2 Varianza
2.4.3 Desviación típica
4. Modelos de probabilidad
4.1 Variable aleatoria
4.1.1 Variables aleatorias continuas y discretas
4.1.2 Valor esperado
4.2 Distribuciones de probabilidad
4.3 Modelos de probabilidad
4.3.1 Modelo Binomial
4.3.2 Modelo Poisson
4.3.3 Modelo Normal
IV. METODOLOGÍA DE TRABAJO
Como estrategia de evaluación se utiliza un proyecto integrador, donde el estudiante haga uso
de todo lo que se trabajó en el curso. Para esto, se les presentará a los estudiantes una serie de
lineamientos generales que tendrán que seguir para realizar el trabajo, pero cada estudiante debe
desarrollar el proyecto contextualizándolo en su campo de estudio y/o trabajo específico.
A lo largo del curso, se les presentarán a los estudiantes varia autoevaluaciones de carácter
lúdico, esto con el fin de que puedan observar e identificar cuáles son sus avances y las
dificultades que presentan en el aprendizaje de los temas. Estas autoevaluaciones contarán con
una retroalimentación que sirva para reforzar los temas que se evalúan.
El facilitador juega un papel muy importante dentro del curso, pues se espera que sea quien dirija
y oriente todo el proceso de aprendizaje. Deberá diseñar estrategias que propicien un aprendizaje
verdaderamente significativo, facilitando la comprensión del contenido y relacionando éste con
los conocimientos previos del estudiante así como con sus áreas específicas de estudio, a través
del estudio casos y problemas relacionados con el hacer cotidiano donde los estudiantes puedan
aplicar y ejercitar lo aprendido. Además de ser quien oriente las discusiones y sesiones de trabajo
que se plantean en los espacios de aprendizaje colaborativo.
Para aprobar la asignatura de Estadística Básica, se espera una participación responsable del alumno.
Consciente de que el proceso de aprendizaje es su responsabilidad y de que puede contar con su
facilitador para llevar este proceso.
Es requisito indispensable el cumplimiento de los entregables en todas y cada una de las unidades,
dentro del tiempo especificado y conforme a las indicaciones dadas. La calificación obtenida será
de acuerdo a la rúbrica, que el estudiante conocerá previamente.
Es también necesaria una actitud proactiva y de mucha interacción entre el alumno y su facilitador, a
través de correos y foros de tal manera que el facilitador tenga una regencia clara de su desempeño.
Para aprobar la asignatura, se debe de obtener la calificación mínima indicada por la ESAD.
Unidad 1:
• Muestra aleatoria simple
Unidad 2:
• Representación numérica y gráfica, bajo los parámetros de la estadística descriptiva, de la
muestra aleatoria simple que entregó en la primera unidad. Esto incluye, tablas de frecuencias,
medidas de tendencia central, medidas de dispersión y gráficas de diferentes tipos.
Unidad 3:
• Ejercicios de probabilidad en experimentos aleatorios
Unidad 4:
• Aplicación de los modelos de probabilidad en un problema.
Proyecto integrador:
• Solución de un problema general que requiere la aplicación de los procedimientos trabajos
durante el curso.
Ponderaciones:
El trabajo en el aula virtual tiene un valor del 80% de la calificación final, el 20% restante, lo aporta
el examen presencial. Las actividades que suman para la evaluación final del curso son:
ACTIVIDAD PORCENTAJE
Evidencia de la unidad 1 8%
Total 100%
VI. MATERIALES DE APOYO
Bibliografía básica:
• Douglas C. Montgomery, George C. Runger. Probabilidad y Estadística aplicadas a la
ingeniería. Cuarta Edición, McGraw-Hill, México, 2006.
• Walpole Ronald E., Myers Raymond H. Probabilidad y Estadística para Ingenieros. Octava
Edición, Editorial Pearson, México, 2007.
Bibliografía complementaria:
• Wackerly Dennis D., Mendenhall William III, Scheaffer, Richard L. Estadística Matemática
con Aplicaciones. Séptima Edición, Cengage Learning, México, 2010.
• Ferris Ritchey. Estadística aplicada a las ciencias sociales. Segunda Edición. Mc Graw Hill, 2008.
• Douglas L., William M., Samuel W. Decimotercera Edición, Estadística aplicada a los negocios
y la economía, Mc Graw Hill, 2008.
• Isabel Castillo Manrique, Estadística descriptiva y cálculo de probabilidades, Primera Edición,
Pearson Education de México, 2006.
Propósitos de la unidad
En esta unidad:
• Identificarás los conceptos básicos relacionados con la Estadística.
• Reconocerás la utilidad e importancia de la Estadística.
• Aplicarás el procedimiento para obtener una muestra aleatoria simple.
Competencia específica
Aplica la metodología estadística para obtener una muestra aleatoria simple, identificando los
elementos que intervienen en un problema estadístico.
Introducción
La palabra estadística a menudo te remite a gráficas y tablas; cifras relativas a nacimientos, muertes,
impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar las herramientas
de análisis estadístico, es necesario comprender qué representa cada concepto y la metodología
mediante la cual se obtiene un dato estadístico.
En esta unidad se hablará sobre la importancia de la estadística, conocerás sus conceptos básicos,
así como la metodología del muestreo para que al final, obtengas una muestra aleatoria simple.
Utilidad e Importancia
La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para interpretar
la información obtenida, que puede ser aprovechada para demostrar la evolución de un fenómeno
a través de cierto tiempo.
La estadística inferencial infiere con esos datos, entendiendo inferir como la predicción de un resultado.
1.2 Conceptos básicos e importancia de la estadística
1.2.1 Población
Conjunto de todos los elementos que presentan una característica común determinada, observable
y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las características edad,
peso, nacionalidad, sexo, etc. Los elementos que integran una población pueden corresponder a
personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de
una empresa, etc).
1.2.2 Individuo
Un individuo o unidad estadística es cada uno de los elementos que componen la población. Nota
que un individuo en estadística puede ser distinto a un individuo como persona. Por ejemplo, en
los censos económicos se obtienen datos de los negocios. En este caso cada negocio, que está
formado por varias personas, es un individuo de la población.
1.2.3 Muestra
1.2.4 Muestreo
Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporción reducida
y representativa de la población.
1.2.5 Variable
Se llama variable a una característica que se observa en una población o muestra, y a la cual se
desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Las
variables se pueden clasificar en cuantitativas y cualitativas:
a) Variable cuantitativa: se expresa en valores numéricos. Dentro de ella, se subdividen en:
• Discreta: Se tratan de variables expresadas con valores enteros. Ej. N° de hijos de una
familia, n° de alumnos de un curso.
• Continua: son valores que pueden tomar cualquier valor dentro de un intervalo. Ej.
Peso, estatura, sueldos.
b) Variable cualitativa: es aquella que describe cualidades. No son numéricas y se subdividen en:
• Nominal: son variables presentadas sin orden ni jerarquía. Ej. Estado civil, preferencia
por una marca, sexo, lugar de residencia.
• Ordinal: son variables organizadas de acuerdo con una clasificación. Ej. grado de
estudios, días de la semana, calidad de la atención, nivel socioeconómico.
1.2.6 Solución de un problema estadístico
Los posibles modelos son Normal, Binomial, Poisson, Uniforme, etc. (estos modelos se estudiarán
en la unidad 4).
C) Extracción de la muestra.
Se usa alguna técnica de muestreo o un diseño experimental para obtener información de una
pequeña parte de la población.
D) Tratamiento de los datos
En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan
los valores que serán necesarios en pasos posteriores, como la media y la varianza de la muestra.
Los métodos de esta etapa corresponden a los métodos de la estadística descriptiva.
Algunas de las etapas de esta fase son: recopilación, clasificación y presentación de la información.
E) Estimación de los parámetros
La estadística inferencial nos proporciona herramientas para la predicción o estimación de los
parámetros de la población que nos ayudarán a resolver el problema. Un ejemplo de estas
herramientas son las pruebas de hipótesis que se obtienen del análisis de los datos y los intervalos
de confianza.
Introducción
Los estudios estadísticos normalmente se hacen con una parte de la población, ya que realizarlos
sobre la totalidad resultaría demasiado complicado. Para que la información obtenida tenga
validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones específicas,
relacionadas con el método para determinar el tamaño y características de la muestra y los
individuos que la componen.
Para que la información obtenida tenga validez y confiabilidad es necesario que cumpla con
algunas condiciones específicas. Los métodos de muestreo se pueden clasificar en:
• Muestreo probabilístico: en él, todos los elementos de una población y, por lo tanto,
todas las muestras posibles tienen la misma posibilidad de ser elegidas. Las muestras
obtenidas a través de este tipo de muestreo son confiables porque aseguran la condición de
representatividad que es muy importante para hacer generalizaciones.
• Muestreo no probabilístico: en este tipo de muestreo los elementos de la población no
comparten las mismas posibilidades de ser seleccionados. Las muestras obtenidas no cumplen
con la condición de representatividad, por lo que no es confiable hacer generalizaciones a
toda la población.
1.3.2 Metodología del muestreo aleatorio simple
1. Definir la población de estudio y el parámetro a estudiar.
Recordemos que la población es el grupo formado por el conjunto total de individuos, objetos o
medidas que poseen algunas características comunes observables en un lugar y en un momento
determinado. Por lo tanto, el paso 1 es determinar el que se va a estudiar.
Por ejemplo:
Un investigador realiza un estudio sobre las relaciones de género en el noviazgo, su objeto
de estudio es las manifestaciones de violencia física y psicológica entre los estudiantes del
último año de la carrera de química. Su población es el total de estudiantes del último año
de ingeniería química que tengan novio o novia; el total de individuos con esta característica
es de 386. Por lo que, la población es de 386 individuos y las variables son: violencia física y
violencia psicológica.
Por ejemplo, si tenemos 10 pelotas y 3 son rojas y 7 son negras la probabilidad de que
saques una roja de una urna es de 3/7 y no 3/10. Y la probabilidad de que no saques una
roja es de 7/10. Por eso dice que la negativa es el complemento de la positiva.
4. Determinar el tamaño óptimo de muestra para el estudio.
Una vez que la población, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad
han sido determinados, se debe determinar el tamaño de la muestra.
En este paso, se utiliza cualquiera de las siguientes fórmulas. El uso de una u otra depende de si
se conoce o no el tamaño de la población.
En un lote grande de medicinas, se desea verificar que la proporción de los ingredientes activos
sea el adecuado. Se debe determinar el tamaño de la muestra para un nivel de confianza del 95%
con un error del 5%. Supongamos que la variabilidad p=q=0.5.
Solución:
Para el nivel de confianza sea igual al 95%, tenemos que P(Z)=0.95 si Z=1.96.
Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en el caso
necesario, hay que convertir esos valores a proporciones.
Sustituyendo:
Ejemplo:
En un lote de 25,000 cajas de medicina, se desea verificar que la proporción de los ingredientes
activos sea el adecuado. Se debe determinar el tamaño de la muestra para un nivel de confianza
del 95% con un error del 5%. Supongamos que la variabilidad p=q=0.5.
Solución:
Para el nivel de confianza sea igual al 95%, tenemos que p(Z)=0.95 si Z=1.96. Sustituyendo:
EJEMPLO:
Suponga que tenemos la siguiente tabla de 100 datos, numerados del 00-99.
En la figura anterior tenemos una tabla de números aleatorios tomados de este documento
(http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/NumerosAleatorios.pdf ),
seleccionemos una fila al azar, suponga la fila 5, y separamos los números de 2 en 2, tendríamos
entonces la siguiente serie de 7 números: 65 03 83 69 67 67 43 54 49 27 82 50 15 06 etc. Esto
significa que nuestra muestra aleatoria deberá contener esos individuos, en el caso de 67 que se
repite, solo lo consideramos una vez y pasamos al siguiente número. (En algunas calculadoras
existe la función RAN# que nos proporciona también números aleatorios, en esta basta con poner
en la calculadora el número de muestras + (Tecla SHIFT) + RAN# y cada vez que presionemos la
tecla (=) nos dará un numero aleatorio, si solo queremos la parte entera, ignoramos al decimal).
Por lo que nuestra muestra quedaría con los valores 93, 68, 56, 69, 61, 34, 23, 17 ,45 , 52.
Consideraciones específicas de la unidad
En esta unidad se trabajará con lecturas de apoyo y se resolverán problemas como ejercicios para
reforzar el aprendizaje.
Tendrás que participar en una encuesta con la cual se generará una base de datos, este material
lo utilizarás a lo largo del curso para que elabores las evidencias de aprendizaje de cada unidad.
Referencias:
• statistics. (2010). En Merriam-Webster Online Dictionary.
• Recuperado el 8 de marzo de 2010 desde: http://www.merriam-webster.com/dictionary/statistics
• Borrego, Silvia (2008). “Estadística descriptiva e inferencial”. Revista digital innovación y
experiencias educativas 13. Recuperado el 10 de marzo de 2010 desde: http://www.csi-csif.
es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.pdf
• Castillo Manrique, Isabel (2006). Estadística descriptiva y cálculo de probabilidades. México:
Pearson Educación.
• Galbiati Riesco, Jorge M. Conceptos Básicos de Estadística (Versión electrónica). Pontificia
Universidad Católica de Valparaíso, Instituto de Estadística. Recuperado el 1 de marzo de
2010 desde: http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf
• Jordi Casal, Enric Mateu. (2003). Tipos de muestreo (versión electrónica). Rev. Epidem.
Med. Prev. (2003), 1: 3-7. Recuperado el 1 de marzo de 2010 en http://minnie.uab.
es/~veteri/21216/TiposMuestreo1.pdf
Propósitos
En esta unidad:
• Identificarás algunos conceptos que se utilizan en estadística descriptiva.
• Organizarás datos en diferentes tipos de tablas y elaborarás varios tipos de gráficas.
• Aplicarás las fórmulas para obtener medidas de descripción de datos.
Competencia específica
En la unidad anterior vimos que existen dos grandes divisiones de la estadística: la que se dedica
a la recolección, presentación y categorización de datos, llamada estadística descriptiva, y la que
se dedica a realizar hipótesis en base a dichos datos, llamada inferencial. También aprendimos a
determinar el espacio de estudio, es decir la población, y las variables que se van a estudiar de
acuerdo al problema planteado.
Introducción
La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta área
sólo describe, resume, organiza y representa los datos obtenidos de una población o muestra de
dicha población, sin elaborar inferencias ni obtener conclusiones.
La organización de datos se realiza a través de tablas que se utilizan para simplificar la presentación
y distribución de estos datos.
A continuación veremos que existen diferentes tipos de presentación de datos y con base en
ellos distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y
frecuencia absoluta.
2.1.1 Frecuencias
Dentro de los conceptos básicos para la organización de datos están los que conciernen a la frecuencia:
Frecuencia: es el número de veces que se repite un dato, también se le conoce como frecuencia absoluta.
Frecuencia acumulada: es la suma de las frecuencias absolutas de las variables hasta el renglón i. También
es conocida como frecuencia absoluta acumulada.
Frecuencia relativa: es el resultado de dividir la frecuencia entre el número total de datos (N). Este
dato también puede verse como un porcentaje.
Podemos encontrar las frecuencias organizadas en tablas que estudiaremos más adelante. Por
ahora veamos cómo se representan los tipos de frecuencia que vimos anteriormente, supongamos
que tenemos la siguiente distribución de datos:
18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23,
52, 7, 18, 52, 23.
f1+f2+f3+f4=
4 41 f4= 4 h4=f4/N=0.1250 h1+h2+h3+h4=H4=0.6250
F4=20
f1+f2+f3+f4+f5=
5 47 f5= 7 h5=f5/N=0.2187 h1+h2+h3+h4+h5=H5=0.8430
F5=27
f1+f2+f3+f4+f5+f6=
6 52 f6= 5 h6=f6/N=0.1563 h1+h2+h3+h4+h5+h6=H6=1.0000
F6=32
2.1.2 Intervalos
Intervalo o rango: Conjunto de números comprendidos entre otros dos números dados, conocidos
estos últimos como límites del intervalo.
Intervalo de clase: En estadística, se llama intervalo de clase a la expresión que nombra un intervalo.
Amplitud del intervalo: Es la diferencia del límite superior menos el límite inferior (Ls -Li).
Fronteras de clase: Son los puntos medios entre los límites de intervalos consecutivos.
Las fronteras de clase se utilizan para recuperar los datos entre el límite superior de un intervalo
y el límite inferior del siguiente.
Marca de clase: Es el punto medio del intervalo y es el resultado de la suma de los límites inferior y
superior del intervalo dividido entre 2. A la marca de clase también se le denomina punto medio de clase.
Ejemplo de intervalos
Límite inferior = 15
Límite superior = 25
La amplitud del intervalo 15-25 sería: 25 menos 15, es decir 10. Es recomendable que todos los
intervalos tengan la misma amplitud. Para ello podemos restar el dato menor del dato mayor y
dividir este resultado entre el número de intervalos que se deseen.
La frontera de clase: si tomamos los intervalos 4-14, 15-25 y 26-36, las fronteras de clase serían:
3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por último, 25.5 y 36.5
para el tercer intervalo.
La frontera de clase no debe coincidir con los datos límites del intervalo, porque sería complicado
identificar el intervalo al que pertenece dicho dato.
Ejemplo: Con en base las fronteras dadas se construyen los nuevos intervalos 3.5-14.5, 14.5-25.5
y 25.5-36.5. Si se tiene el dato 25.5 no se sabría si ponerlo en el segundo o en el tercer intervalo.
Si esta coincidencia sucede deberá moverse el intervalo. Siguiendo con el ejemplo, moviéndolo un
punto a la izquierda tendríamos los intervalos 2.5-13.5, 13.5-24.5 y 24.5-35.5.
Es recomendable que la marca del intervalo coincida con alguno de los datos. Esto no es necesario
y no siempre se logra, sobre todo cuando los intervalos tienen la misma amplitud.
2.1.3 Construcción de intervalos de clase
La formación de clases o intervalos de clase, que se representa con (k), dependen, generalmente,
del tamaño del rango de la población o muestra. Lo que se debe hacer para determinar los
intervalos de clase es lo siguiente:
1. Calcular el rango:
Para esto, se identifica el número mayor (Xn) y el número menor (X1) en los datos. El rango es el
resultado de la resta, esto es:
R= Xn – X1
Por ejemplo:
Si en una serie de datos que van desde el 18 hasta el 56, tendríamos lo siguiente:
Xn= 56 y X1= 18, por lo tanto:
R= Xn – X1= 56 – 18= 38
2. Determinar el número de intervalos que se desea tener:
No existe una regla para determinar el número de intervalos, pero generalmente se suelen crear
entre 5 y 20 intervalos. La decisión la toma el investigador.
Dividimos entre uno menos de los intervalos deseados porque con el número de datos se acumula un
intervalo más.
38 / 7 = 5.428
Esta será la amplitud de los intervalos. Cuando no es un número entero, se escoge el entero más
cercano, como en este caso, tomamos el rango igual a 5.
Cuando la cantidad de datos es tal que no alcanza para acumular un intervalo más, entonces se
divide entre el número de intervalos que se quieren.
4. Se forman los intervalos:
Los intervalos se forman comenzando un número antes del primer dato:
INTERVALOS:
17 a 22 (se cuenta 5 desde 18 hasta 22)
23 a 28
29 a 34
35 a 40
41 a 46
47 a 52
53 a 58 Nota: No importa que el último intervalo exceda el último dato.
35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27,
29, 22, 28, 27, 48, 40, 48, 31, 39, 28 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60,
55, 48, 37, 31, 30, 22, 20.
Existen diferentes tipos de tablas para presentar los datos, las más utilizadas son: Tabla de datos,
Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Veamos en qué
consiste cada una:
Una tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza cuando
la información que necesitamos son los datos mismos. Se organizan en columnas o renglones y se
registran las mediciones o datos obtenidos.
Ejemplo: Supongamos que la medición de temperatura a lo largo del día da como resultado los
siguientes valores en grados Celsius: 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7. Entonces construimos
una tabla como la siguiente:
Temperatura (Celsius) 20.4 21.2 22.1 23.9 25.3 26.9 27.7
Esta nos aporta mayor información pues está formada por categorías de la variable que se esté
midiendo y su frecuencia (es decir, el número de ocurrencias de un valor dado).
1,2,2,2,1,1,5,4,3,2,2,1,3,4,5,6,2,3,4,5,5,4,3,3,2
Procedemos entonces a agrupar por categorías, según la frecuencia o número de veces que aparece
cada medición:
Valor de la Variable medida Frecuencia
1 4
2 7
3 5
4 4
5 5
6 1
En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores
correspondientes a cada variable.
Grupo de edad Frecuencia
De 12 a 19 9600
De 20 a 21 7100
De 25 a 34 3900
De 35 a 44 1500
De 45 a 99 1600
Estas tablas proporcionan información referente a dos variables o eventos relacionados entre
sí. Se forma poniendo en los renglones de la tabla la información de una de las variables y en las
columnas la información de la otra variable.
Ejemplo: suponga que se miden el número de cirugías realizadas por edades en una muestra de
100 personas, encontrándose lo siguiente:
Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables
relacionadas son los rangos contra el valor de las variables en dicho rango.
Por ejemplo: supongamos que medimos la temperatura de un líquido con respecto al tiempo de
calentamiento. En el renglón colocamos los tiempos y en las columnas la temperatura obtenida.
Podríamos considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada:
Tiempo en minutos Temperatura en grados C
1-5 36
6-10 44
11-15 67
De 35 a 44 1500
De 45 a 99 1600
Hemos visto cómo se organizan los datos, pero ¿de dónde y cómo se obtienen?
Cuándo se realiza un trabajo que requiere de la estadística, las personas que realizan el trabajo
diseñan sus instrumentos para recolectar la información y obtener los datos que necesitan. Existen
muchos métodos para recolectar información, pero los más frecuentes son:
Censo
Es una técnica de recolección de datos que se aplica a la totalidad de los elementos que componen
la población o universo que se estudia. Un censo debe cumplir dos condiciones:
Universalidad: esto es, se debe tomar en cuanta a todos los elementos de la población.
Simultaneidad: debe realizarse dentro de un periodo de tiempo limitado.
Encuesta
Esta técnica se utiliza para recolectar información de una muestra de la población. Consiste en
presentar un conjunto de preguntas abiertas (preguntas que no tienen respuestas predeterminadas)
o cerradas (preguntas que cuentan con una serie de respuestas establecidas).
Experimento
Otra de las técnicas más recurridas en estadística para recolectar información son los experimentos,
veamos en qué consisten.
Un experimento es una prueba que se realiza para determinar las características o comportamientos
de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qué alimentos nos parecen
más salados.
Un experimento, también se define como el proceso que se realiza para verificar una serie de
hipótesis relacionadas con un determinado fenómeno, en el cual se determinan las características
o comportamientos del fenómeno que se analiza. Por ejemplo, un experimento para determinar
la velocidad de la luz en el vacío; donde se está determinando la velocidad de la luz.
La diferencia entre la primera y la segunda definición es que en la segunda se parte de una hipótesis
mientras que en la primera no necesariamente.
En el primer ejemplo, experimento los sabores de los alimentos sin antes predecir cuál pienso que me
sabrá más salado.
Introducción
Las gráficas son representaciones visuales de los datos que se muestran en una tabla. Existen
diferentes tipos de gráficas, cada una de ellas se elabora con base en el tipo de información que
se quiere representar.
2.2.1 Histograma
Este tipo de grafica se utiliza para datos de tipo ordinal, nominal y discreto. En estas se muestran la
frecuencia, la frecuencia relativa y el porcentaje por medio de la altura de la barra y no por el área
de la barra. Esta gráfica muestra las discontinuidades en las mediciones por medio de espacios
vacios entre las barras.
La gráfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:
Barras verticales:
• En el eje horizontal se representan los valores de la variable.
• En el eje vertical se representa la frecuencia de cada clase.
Barras horizontales:
• En el eje horizontal se representan las frecuencias.
• En el eje vertical los valores de la variable.
Un histograma y una gráfica de barras son muy semejantes, la diferencia radica en que el histograma
no presenta separación entre las barras.
2.2.3 Graficas de línea
Para trazar la gráfica, se hace una distribución proporcional de las frecuencias del problema con
respecto a la circunferencia determinando sectores circulares para cada categoría.
EJEMPLO:
Frecuencia
Medición en Cm Frecuencia Porcentaje
acumulada
30 3 3 3%
30.1 7 10 6%
30.2 12 22 10%
30.3 18 40 15%
30.4 23 63 19%
30.5 21 84 18%
30.6 17 101 14%
30.7 11 112 9%
30.8 5 117 4%
30.9 1 118 1%
En esta figura se muestra el histograma de las mediciones en Cm vs. La frecuencia, note como el
ancho de las clases es el mismo.
Introducción
Para cualquier conjunto de datos estudiados es importante tener información resumida de sus
características. Esta información nos indica cómo se comporta la población de datos que tenemos.
Para resumir la información se utilizan dos tipos de valores que en lugar de representar cada dato,
representan conjuntos de datos. Estos dos tipos de indicadores estadísticos son: las medidas de
tendencia central, que nos muestran hacia qué valores se agrupan o acumulan los datos, y las
medidas de dispersión, que, de forma contraria a las anteriores, muestran cómo se dispersan o
separan los datos.
Las medidas de tendencia central son los valores que representan un conjunto de datos de forma
tal que nos ayudan a saber dónde están acumulados los datos pero sin indicar como se distribuyen.
Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos.
Las medidas de tendencia central más comunes son: la media aritmética, comúnmente conocida
como media o promedio, la mediana y la moda.
2.3.1 Media aritmética
La media aritmética o, simplemente, media, se denota por x o por la letra μ según se calcule en
una muestra o en la población, respectivamente. La media es resultado de dividir la suma de
todos los valores de los datos entre el número total de datos.
La fórmula para calcular la media de una distribución de datos, varía de acuerdo a la manera cómo los
tenemos organizados.
Los datos no agrupados son aquellos datos que organizamos en una tabla de datos, es decir, cada
valor se representa de manera individual. Las fórmulas para calcular la media son:
EN UNA POBLACIÓN EN UNA MUESTRA
En estas fórmulas la diferencia radica en que, el total de la población se representa con la letra N
y el total de la muestra se representa con la letra n.
Los datos agrupados en frecuencias son aquellos que organizamos en una tabla de frecuencias,
es decir, las tablas que contienen, en una columna, el valor de la variable y, en otra columna, la
frecuencia o el número de veces que se repite cada valor en una serie de datos. Las fórmulas para
calcular la media con los datos organizados de esta manera son:
Los datos agrupados en intervalos son aquellos que se organizan dentro de un rango establecido
entre un límite inferior y un límite suprior. Recuerda que las tablas de intervalos muestran el
número de datos que abarca cada intervalo (frecuencia por intervalo).
Las fórmulas para calcular la media con los datos organizados de esta manera son:
2.3.2 Mediana
La mediana es el valor que divide a la mitad la serie de datos que se tienen. Es decir, la mediana
queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o decreciente,
entonces, el número de datos que queda a la izquierda de la mediana es igual al número de datos
que queda a la derecha.
Si n es impar hay un dato que queda en medio de todos, éste será igual a la mediana. Si n es par
hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio de esos dos
datos, es decir, su suma dividida entre dos.
2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9
1. Ordenamos:
0, 0, 1, ,1, 2, 4, 4, 6, 6, 7, 8, 8, 9
2. El dato que divide a la mitad es:
4, por lo tanto Me: 4
5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1 ,3, 2
1. Ordenamos
1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9
2. Buscamos los datos del centro:
4, 5
3. Promediamos:
4+5=9/2= 4.5, por lo tanto Me: 4.5
Cuando queremos calcular la mediana en datos agrupados por intervalos, tenemos que buscar el
intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas,
es decir, es necesario localizar el intervalo donde se encuentre N/2 , ocupamos siguiente fórmula:
2.3.3 Moda
La moda es el valor del dato que más veces se repite, esto es, el valor cuya frecuencia absoluta
es mayor, y se denota como Mo. Algunas veces el valor que más se repite puede no ser único, es
decir, puede haber dos o más datos que aparezcan con la misma frecuencia absoluta, siendo ésta
la mayor. En esas ocasiones podemos hablar de poblaciones o muestras bimodales si existen dos
modas o multimodales si existen más de dos.
Cuando nuestra distribución de datos es por intervalos de clase, primero localizamos el intervalo
que tiene mayor frecuencia absoluta y utilizamos la siguiente fórmula para calcular la moda:
A diferencia de las medidas de tendencia central, que miden acumulaciones, las medidas de
dispersión miden el grado de separación o alejamiento que tiene una variable estadística en torno a
una medida de posición o tendencia central. Dicho grado de separación nos indica lo representativa
que es la medida de posición con respecto al conjunto total de datos. A mayor dispersión menor
representatividad de la medida de posición y viceversa.
Las medidas de dispersión más comunes son: el recorrido, la varianza y la desviación estándar.
2.4.1 Recorrido ( Re )
Recorrido
El recorrido representa la diferencia que hay entre el primero y el último valor de la variable,
también se le conoce como rango y se denota por Re.
Donde:
Por ejemplo:
Supongamos que tenemos la siguiente distribución de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74, 74,
69, 52, 76.
Re=78-52=26
2.4.2 Varianza
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media
aritmética. Siempre es mayor o igual que cero y menor que infinito. Se define como la media de
los cuadrados de las diferencias del valor de los datos menos la media aritmética de estos.
La desviación típica muestra qué tan alejado está un dato del valor de la media aritmética, es
decir, la diferencia que hay entre un dato y la media aritmética. Se denota como S o σ, según se
calcule en una muestra o en toda la población, respectivamente.
Se define como la raíz cuadrada positiva de la varianza. Se expresa mediante las siguientes fórmulas:
En datos no agrupados:
EN UNA POBLACIÓN EN UNA MUESTRA
Esta unidad se trabajará con lecturas y ejercicios para ejercitar el uso de las fórmulas.
La evidencia con la que se evalúa la unidad será la representación gráfica numérica de los datos
obtenidos de la muestra que seleccionaste en la evidencia de la unidad 2.
Referencias:
1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadística aplicadas a la
ingeniería. McGraw-Hill, México, cuarta edición.
2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadística para Ingeniería
y ciencias. México: Pearson Educación, octava edición.
3. Intervalos de clase, consultado el 26 de abril de 2010 en:
• http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_
descriptiva_2/estadistica_descriptiva_2.htm
4. Censo y entrevista, consultados el 26 de abril de 2010 en:
• http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.doc.
• http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf
5. Medidas de tendencia central y dispersión, consultado el 27 de abril de 2010, en:
• http://bibl iotecavi rtu al .l asal leurubamba.edu.pe/Estadi stica/res/ p d f /
estadisticadescriptivavariables2.pdf
• http://www.vitutor.com/estadistica.html
Propósitos de la unidad
En esta unidad:
• Identificarás los conceptos básicos de la teoría de probabilidad.
• Utilizarás las reglas y postulados de la probabilidad para resolver problemas en eventos aleatorios.
Competencia específica
En las unidades anteriores vimos los principios de la Estadística y los aspectos más importantes
de la Estadística Descriptiva. En esta unidad se estudiarán los conceptos y reglas básicas de la
probabilidad. Ésta es una de las mejores herramientas que existen para el manejo del riesgo en
las sociedades modernas, pues día a día se presentan múltiples situaciones en las que la toma de
decisiones se debe realizar sin contar con que todas las variables estén bajo un perfecto control.
De hecho esta situación de control total rara vez (o nunca) se da.
En estadística la probabilidad nos ayudará a hacer inferencias con los resultados obtenidos a
través del manejo de los datos.
3.1 Conceptos básicos
Introducción
“Considero que la probabilidad representa el estado de la mente con respecto a una afirmación,
evento u otra cosa para las que no existe conocimiento absoluto”
La probabilidad es una constante en la vida cotidiana, a diario las personas nos preguntamos sobre la
probabilidad de lluvia, la probabilidad que tenemos de obtener un trabajo, acreditar una asignatura,
de salir de vacaciones, etc.
3.1.1 Incertidumbre
¿Cuántas veces no hemos estado con la incertidumbre acerca del resultado nuestras calificaciones,
de nuestros estudios médicos o sobre cualquier otro evento?
La incertidumbre es una duda o inseguridad que tenemos con respecto a que suceda algo. La
incertidumbre aparece cuando algo es incierto.
Para un experimento aleatorio en cambio, no sabemos cuál será el resultado concreto en una
realización del mismo, aunque sabemos todos los posibles resultados, incluso algún tipo de
patrón es observado. Por ejemplo, el lanzamiento de una moneda es un experimento aleatorio,
pues sabemos que sus posibles resultados son cara o cruz, pero no podemos saber a ciencia cierta
cuál será el resultado del enésimo lanzamiento.
3.1.2 Probabilidad e incertidumbre
Por ejemplo, cuando lanzamos un dado sólo podemos saber que hay seis resultados posibles y
podemos medir la frecuencia con la que aparece cada uno de esos resultados en 100 lanzamientos.
La medida de dicha frecuencia con la cual aparece cada resultado en un fenómeno aleatorio es la
probabilidad con la cual se espera que aparezca dicho resultado cuando realicemos el experimento
nuevamente. Por ello, cuando no tenemos control sobre las variables, es decir, cuando hay
incertidumbre acerca del resultado, aparece la probabilidad, y la medida de la incertidumbre es
la probabilidad.
3.1.3 Probabilidad
La probabilidad de un evento se denota como P(E), y los eventos con letras mayúsculas, por ejemplo,
la probabilidad del evento A sería P(A), la probabilidad del evento B sería P(B), y así sucesivamente.
La probabilidad es una medida del grado de creencia de que un evento suceda. Ésta se puede
expresar como la relación que hay entre el número de veces que un resultado aparece en n
repeticiones. Esto es: La probabilidad de que un evento E suceda en un experimento es igual
al número de veces, n, que aparece dicho evento, dividido entre el número total de eventos
posibles, N:
P (E) = n/N
Por ejemplo, la probabilidad de que al tirar un dado caiga 2 es 1/6 pues sólo hay un 2 entre seis
números posibles. También podemos decir que la probabilidad de que caiga 2 al lanzar un dado
es de 16.66 %.
La probabilidad se asigna en porcentajes del 0-100% o bien como fracción de la unidad, es decir
un número entre 0-1, siendo el 1 o 100% un resultado seguro.
Por ejemplo:
La probabilidad siempre está condicionada por la información que se tenga del fenómeno. Esto
quiere decir que no hay probabilidades absolutas.
Por ejemplo, si nos dicen que en una urna hay 10 pelotas y se nos pregunta cuál es la probabilidad
de sacar una roja sería más difícil de responder que si se nos informa cuántas pelotas rojas hay.
Para medir la probabilidad debemos tomar en cuenta cuáles son los resultados posibles del evento.
3.1.4 Espacio muestral
Por ejemplo:
El espacio muestral de los posibles resultado del lanzamiento de un dado será cualquier número
entre el 1 y el 6, por lo que su espacio muestral es:
S={1,2,3,4,5,6}
Existen dos formas de representar espacios muestrales y combinaciones de eventos en espacios muestrales:
Conjuntos: En el caso probabilístico, un conjunto será una agrupación de los posibles resultados de
un experimento.
Por ejemplo, el espacio muestral de los posibles resultados de lanzar un dado será el conjunto:
S={1,2,3,4,5,6}
Por ejemplo, el espacio muestral de los posibles resultados de lanzar un dado sería el árbol:
3.1.4.1 Conjuntos
Como vimos anteriormente, una forma de representar los espacios muestrales es a través de
conjuntos, dado que en probabilidad se utilizan frecuentemente, vamos a recordar las operaciones
de conjuntos:
Un conjunto es una agrupación de elementos. Los diagramas de Venn nos ayudan a visualizar
conjuntos gráficamente. En un diagrama de Venn se representa un conjunto A por medio de un
círculo o un óvalo que contienen los elementos de dicho conjunto.
37
11
B
3 5
16
15 2
35
C 7
13
A B
A B
A B= Ø
A’
Por ejemplo:
Al lanzar un dado tenemos seis eventos posibles, que caiga cualquier número entre 1 y 6. Estos
son: E�= {1}, E�= {2}, E�= {3}, E�= {4}, E�= {5} Y E�= {6}.
S={1,2,3,4,5,6}
• EVENTOS SIMPLES (E):
• Cada uno de los posibles resultados de un experimento y que no se puede descomponer.
En el caso del lanzamiento del dado, cada uno de los posibles números en la cara del
dado es un evento simple.
• A = { evento que salga un número impar }, A = { 1, 3, 5 }
• EVENTOS COMPUESTOS:
• Los eventos A, B, C, etc., son eventos compuestos si se componen de dos o más
eventos simples.
• Lanzamiento de dos monedas:
• A = el evento de observar una cara, A = {HH, HT, TH, TT }
3.1.7 Tipos de espacios muestrales
Los resultados de sacar una carta de una baraja inglesa pueden ser numerados del 1 al 52.
• Continuos
Los eventos que lo forman pueden alcanzar cualquier número en un rango dado. Estos eventos
no pueden ser numerados porque pueden alcanzar cualquier valor de la recta. Por ejemplo:
Por ejemplo, en el lanzamiento de un dado, la probabilidad de que caiga 2 es 1/6, pues sólo hay
un dos entre seis eventos posibles
3.1.8 Eventos dependientes, independientes y mutuamente excluyentes.
En ocasiones un evento o más eventos dependen de otro evento previo, es decir, un evento B
ocurre dado que ocurrió un evento A antes. Si existe este tipo de relación entre eventos se dice
que son eventos dependientes o condicionados (el evento B depende del evento A, o el resultado
del evento B está condicionado al resultado del evento A). Por otro lado, si no existe tal relación
entre eventos se dice que son eventos independientes.
Dos eventos son mutuamente excluyentes cuando no pueden suceder al mismo tiempo.
La diferencia entre los eventos mutuamente excluyentes y los independientes es que dos eventos
independientes pueden suceder al mismo tiempo pero los excluyentes no.
EVENTO MUTUAMENTE
EVENTO DEPENDIENTE EVENTO INDEPENDIENTE
EXCLUYENTE
Las evidencias de Contestar una
Las evidencias de
aprendizaje que pregunta con cuatro
aprendizaje que entregas
entregaste en la unidad 2 opciones de respuesta,
para cada asignatura no
dependían del resultado los eventos son A o B o
dependen de la entrega
de las evidencias C o D, pero no pueden
de las evidencias de
de aprendizaje que ser A y, por ejemplo B
ninguna otra asignatura.
entregaste en la unidad 1. al mismo tiempo.
Existen tres postulados de la probabilidad, los cuales se aplican cuando el espacio muestral S es finito:
• Todo espacio muestral tiene la probabilidad 1; simbólicamente, P(S) = 1 para cualquier
evento S.
Por ejemplo:
Aquí el conjunto de los eventos que buscamos sería igual al espacio muestral, es decir,
S={1,2,3,4,5,6}
Entonces tenemos 6 eventos que posibles dentro de un espacio muestral con 6 eventos.
Por lo tanto, P(S) = 6/6 = 1
• La probabilidad de un evento es un número real mayor o igual a cero y menor o igual a uno,
simbólicamente 0≤P (E) ≤1, para cualquier evento A.
Por ejemplo:
La probabilidad de que al lanzar una moneda caiga águila es de ½ (1 evento entre dos
resultados posibles: águila o sol) y ½ = 0.5. Y sabemos que 0≤0.5≤1.
• Si dos eventos son mutuamente excluyentes, la probabilidad de que uno u otro ocurran
equivale a la suma de sus probabilidades. Simbólicamente, P (A B)=P(A)+P (B))
Para dos eventos mutuamente excluyentes cualesquiera, A y B.
Por ejemplo:
La unión de los eventos sería que caiga 2 o que caiga 3. Así que P(E1 E3) = P(E2) + P(E3) =
1/6 + 1/6 = 2/6 = 1/3.
3.3 Reglas básicas de probabilidad
Con frecuencia es más fácil calcular la probabilidad de algún evento si conocemos la probabilidad
de otro evento. Esto puede suceder si el evento en cuestión se puede representar como la unión
de otros dos eventos o como el complemento de algún evento.
En este caso, se suma la intersección de los tres o más eventos porque al restar las
intersecciones de dos en dos se resta de más la intersección de los tres.
• La probabilidad de la suma de dos eventos mutuamente excluyentes A y B, es la suma de sus
probabilidades, es decir:
Por ejemplo:
Suponga que se tiene un par de conjuntos como se muestra en la figura. Sea el conjunto A los
numero pares, A=[2,4,6,8] y B=[1,3,5,7,9] lo impares respectivamente.
La probabilidad condicional es aquella en la que la probabilidad de que ocurra une evento depende
de lo que ha ocurrido con otro evento, entonces tenemos:
Dados dos eventos A y B, la probabilidad condicional se denota como P (B|A), o como P (B dado
A). Ésta se refiere a la probabilidad de que ocurra el evento B está dada a la ocurrencia anterior
del evento A, y se denota como:
Así, si la ocurrencia o no del evento E1 no afecta la ocurrencia o no del evento E2, entonces decimos
que los eventos E1 y E2 son independientes y P (E2/E1) = P(E2). En caso de que la probabilidad de
que ocurra E2 sí se vea afectada por la ocurrencia de E1, entonces los eventos son dependientes.
3.5 Experimentos aleatorios
Un experimento aleatorio es aquel en el cual se conocen los posibles resultados pero no se sabe
con exactitud cuál de todos esos posibles resultados sucederá bajo ciertas condiciones.
Por ejemplo, al lanzar una moneda al aire, sabemos que la moneda caerá, pero no sabemos con
exactitud si caerá águila o sol.
Las actividades de la unidad consisten en la solución de problemas aplicando las reglas y los
postulados de la probabilidad.
Para evaluarla tendrás que resolver una serie de problemas que se diseñaron la base de datos
obtenida de la encuesta en la que participaste en la unidad 1.
g. Fuentes de consulta
• Bibliografía
1. Douglas C. Montgomery, George C. Runger. Probabilidad y Estadística aplicadas a la
ingeniería. Primera Edición, McGraw-Hill, México, 1999.
2. Walpole Ronald E., Myers Raymond H. Probabilidad y Estadística. Cuarta Edición, Thomson,
México, 1999.
• Ligas o portales electrónicos
• http://www.vitutor.com/estadistica.html
• http://www.uaq.mx/matematicas/estadisticas/xu4.html
• http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
Propósitos de la unidad
En esta unidad:
• Obtendrás las variables aleatorias y las distribuciones de probabilidad de experimentos
aleatorios simples.
• Aplicarás los modelos de probabilidad para solucionar problemas.
Competencia específica
Utiliza los modelos de probabilidad para el análisis de eventos y situaciones en diferentes contextos
a través de experimentos aleatorios.
Introducción
Existen ocasiones en las que en algún experimento desconocemos no solamente el resultado del
mismo, sino también el valor mismo de la variable, en estos casos es útil asociar un “número” al
resultado del experimento.
Las variables aleatorias se denominan con mayúscula, por ejemplo X, Y o Z. Mientras que cada uno
de los posibles valores que puede tener cada variable se denomina con minúsculas, por ejemplo:
x, y o z. el conjunto de valores de la variable aleatoria recibe el nombre Rango de X.
Suponga que se analiza una muestra química determinar si existe moléculas de algún componente
especifico que se esté buscando, por ejemplo algún virus. Sea X la variable aleatoria que
denota el número de moléculas presentes en la muestra. Las muestras pueden tener diferentes
características que las hacen variar entre ellas, tales como volumen, densidad, etc., y la variable X
solo proporciona el número total de moléculas que estamos buscando. Los posibles valores de X
van desde cero hasta algún número infinitamente grande.
Ejemplo: En una caja se tienen 4 bolas rojas y 3 bolas negras. Dos Sucesos x
bolas se sacan consecutivamente de la caja. Denotemos por R a
la bola roja y por N a la negra. Los posibles valores de la variable RR 2
aleatoria se muestran en la siguiente tabla. RN 1
NR 1
Note como el valor de la variable aleatoria puede ser cualquier
NN 0
número entero 0, 1 y 2.
Ejemplo: Se define a la variable aleatoria X como el costo que tiene (en pesos) el arreglar una
refacción automotriz, dependiendo de si presenta defectos en la parte superior o inferior de la
misma. En la siguiente tabla se presentan los datos.
Aquí los posibles valores de la variable son $0, $90 y $180 pesos respectivamente.
4.1.1 Variable aleatoria Discreta vs. Continuas
Los resultados de un experimento estadístico pueden no ser finitos o contables, tal es el caso
de la medición de distancia que un auto recorre con cierta cantidad de combustible. Dado que
la distancia puede ser medida con cualquier grado de exactitud, existen un número infinito de
posibles distancias que pueden resultar medidas.
Una variable aleatoria discreta es aquella cuyos posibles resultados se pueden contabilizar.
Una variable aleatoria continua es aquella que puede tomar valores infinitos.
Una forma útil de diferenciar este tipo de variables es que típicamente las variables continuas
representan datos medidos, tales como alturas, distancias, pesos, temperaturas, tiempo de vida,
etc., mientras que las variables discretas representan conteo de datos, tales como el numero de
productos defectuosos, el número de contagios de una enfermedad, etc.
El valor esperado, también llamado media o esperanza, de una variable aleatoria discreta X se
denota por U(X) o E(X) y es:
E(X)= (21 x 0.25) + (22 x 0.04) + (23 x 0.06) + (24 x 0.13) + (25 x 0.1) + (26 x 0.1) + (28 x .09) + (29
x .02) + (30 x .03)
E(X) = 5.25 + 0.88 + 1.38 + 3.12 +2.5 + 2.6 + 0 +2.52 + 5.8 +0.9 =24.95
El valor esperado de una variable aleatoria no siempre coincide con alguno de los valores que
puede alcanzar dicha variable. Se denomina media de la variable aleatoria debido a que es análoga
a la media aritmética.
La línea roja de la siguiente gráfica, marca el valor esperado del ejemplo que vimos con anterioridad:
Toda variable aleatoria posee una distribución de probabilidad que describe su comportamiento.
El evento formado por todos los resultados para los que X=x se denota como {X=x} y su probabilidad
como P(X=x).
Ejemplo: Suponga que se lanza una moneda 3 veces. Los posibles valores que pueden tener son
A águila o S sello. Supongamos que queremos la probabilidad de que salgan 2 Sellos. Los posibles
resultados serian:
Así que tenemos 8 posibilidades, cada una de estas combinaciones de 3 resultados tiene igual
probabilidad, es decir, tiene una P=1/8. Como nos interesa que X asuma un valor de 2 (es decir,
que salgan 2 sellos), existen 3 combinaciones que resultan en que los lanzamientos produzcan dos
sellos, a saber, ASS, SAS, o SSA. Por lo que la probabilidad de que X=2 sellos es igual a la suma de
las probabilidades individuales de cada combinación, y es igual a P(X=2)= 3/8.
4.3 Modelos de distribución de probabilidad
Introducción
Cuando estamos estudiando un fenómeno, y una vez obtenidos los datos, es útil hacer supuestos o
conjeturas acerca de las poblaciones que estamos estudiando. Tales supuestos, que son hipótesis,
generalmente son planteamientos respecto a las distribuciones de probabilidad de las poblaciones
y el valor esperado de las mismas.
Los modelos de distribución de probabilidad más comunes son: el modelo binomial, el modelo de
Poisson y el modelo normal.
4.3.1 Modelo binomial
En algunos experimentos sólo nos interesa que el resultado de la variable aleatoria sea uno de
todos los posibles resultados.
Por ejemplo, en el caso de un examen de opción múltiple, que contenga 10 preguntas con 4
opciones cada una, sólo importará para fines de calificación aprobatoria, que se elija la respuesta
correcta, mientras que no importaría cuál de todas las respuestas incorrectas se haya elegido. Así
que podemos calificar al resultado como “éxito” para un sólo resultado y “fracaso” para cualquiera
de los otros 3.
Existen muchas aplicaciones en las que nos interesan sólo estos 2 posibles resultados cualitativos,
“éxito” o “fracaso”, por lo que el experimento tiene sólo 2 resultados, a este tipo de experimento
recibe el nombre de binomial.
Propiedades del modelo binomial
La variable aleatoria X seria igual al número n de ensayos donde el resultado es “éxito”, y tiene una
distribución de probabilidad binomial, con parámetros p (probabilidad de éxito) y n=1,2,…
La distribución binomial refleja el número de secuencia de diferentes ensayos con x éxitos y n-x
fracasos. Ésta se obtiene con la fórmula:
La probabilidad de que un paciente se recupere una vez que ha desarrollado cierto tipo de cáncer es
de 0.32. En un pabellón con 27 enfermos de este tipo de cáncer queremos determinar lo siguiente:
A) ¿Cuál es la probabilidad de que sobrevivan exactamente 13 pacientes?
P(10≤x≤13)=P(10)+P(11)+P(12)+P(13)
Es decir, podemos aplicar una sumatoria de probabilidades desde x=10 hasta x=13
Como debe ser obvio en este punto, la probabilidad de que se salven menos personas es más
grande, mientras que la probabilidad de que se salven más y más personas va disminuyendo.
C) ¿Cuál es la probabilidad de que sobrevivan al menos 4 pacientes?
En la figura se muestra la distribución binomial para este ejemplo, calculando las Probabilidades
para x=0,…27 y graficándolas.
Existen otros experimentos en los que lo que se busca es determinar el número de eventos que
suceden en tiempo o espacio finito y no si el resultado es éxito o fracaso.
Por ejemplo, conocer el número de autos que pasan por una cierta ruta en un intervalo de tiempo,
determinar el número de llamadas simultáneas que está procesando una antena de telefonía
celular, saber el número de accesos que tiene un servidor web por segundo, etc.
Para llevar a cabo el análisis de este tipo de experimentos, se utiliza el modelo de Poisson.
Propiedades del modelo de Poisson
Donde:
x= 0, 1,2,…
El promedio de camiones de carga que llegan a un puesto aduanal es de 13 camiones por hora. El
puesto aduanal puede atender máximo 21 camiones por hora.
A) ¿Cuál es la probabilidad de que en determinada hora se atiendan 10 camiones?
Esta es sin lugar a dudas, la más importante de las distribuciones continuas de probabilidad en todo el
campo de la estadística. Se le conoce como distribución normal o gaussiana. A su curva característica
se le llama curva normal o campana, por la forma parecida a una campana que presenta.
Esta distribución aparece con mucha frecuencia en una gran cantidad de fenómenos que ocurren
en la naturaleza, la industria, la investigación tecnológica y social. Además, los errores asociados a
los sistemas de medida utilizados, están bien aproximados por la distribución normal, lo que nos
permite manejar correctamente la incertidumbre debida a los métodos de medición.
Por ejemplo, considérese dos individuos que tratan de estimar la longitud de una barra, y para ello
se les proporciona la misma cinta métrica. Ambos acabarán con la misma medida aproximada de
la barra, con un margen de error pequeño. Pero si las cintas métricas fueran ligeramente distintas,
la longitud y el margen de error se verían afectados, en este caso porque el instrumento de medida
proporciona distinta información a cada individuo.
Propiedades del modelo normal
donde:
μ es la media
σ es la desviación estándar
π=3.14159…
Representación gráfica del modelo normal
Una vez que la media y la desviación estándar se especifican, la curva normal queda completamente
descrita. El valor de μ determina el centro de la distribución, mientras que σ determina la
dispersión. A continuación se muestran algunas curvas con distintos valores de μ y σ.
En la ambas figuras se muestran distribuciones normales con medias iguales (cero en ambos
casos), pero la deviación estándar aumenta la dispersión para la segunda figura.
Campana de Gauss
La siguiente figura muestra la distribución normal con las áreas de probabilidad comprendidas
entre la media y unidades medidas en términos de la deviación estándar.
Esta representación es útil porque para cualquier distribución normal se tiene que:
hace referencia a la cantidad 6σ como una medida del ancho de la distribución normal.
Variable aleatoria normal estándar
Una variable aleatoria normal con µ=0 y σ=1 recibe el nombre de variable aleatoria normal
estándar o normal tipificada y se denota por la letra Z.
La ventaja de las variables normales estándar está en que hay tablas donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribución.
Toda distribución normal se puede transformar en una normal tipificada, para transformarla se
crea una nueva variable (Y) que será igual a la anterior (X) menos su media y dividida por su
desviación típica, se denota como:
Veamos un ejemplo sobre cómo convertir una distribución normal a una normal tipificada.
El salario medio de los empleados de una empresa se distribuye según una distribución normal,
con media 5 millones de pesos y desviación típica 1 millón de pesos. Calcular el porcentaje de
empleados con un sueldo inferior a 7 millones de pesos.
1. Transformamos esa distribución en una normal tipificada, para ello se crea una nueva
variable (Y):
3. Esta nueva variable se distribuye como una normal tipificada. La variable Y que corresponde
a una variable X de valor 7 es:
Ya podemos consultar en la tabla (más adelante veremos cómo) la probabilidad acumulada para el
valor 2 (equivalente a la probabilidad de sueldos inferiores a 7 millones de pesos). Esta probabilidad
es 0,97725. Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 millones de ptas.
es del 97,725%.
Cómo se usa la tabla de valores para la distribución normal estándar
Buscando en la tabla nos da un valor de P (Z≤1.34)=0.9099, es decir, tiene el 90.1% del área total
de la curva de probabilidad hasta Z=1.34, como se muestra a continuación.
Continuando con el ejemplo anterior, si quisiéramos calcular la P (Z>1.34) entonces, sería más
conveniente calcularlo así:
Si quisiéramos la probabilidad entre 2 valores, tendríamos que realizar la resta de aéreas, por
ejemplo:
Al igual que en las unidades anteriores, en ésta tendrás que resolver problemas donde se apliquen
los procedimientos presentados. La evidencia es la solución de problemas aplicando los modelos
de la probabilidad.
Por último, al finalizar la unidad, tendrás que resolver un problema en el que se trabaja todo el
contenido que abarca la asignatura, es la quinta y última evidencia de aprendizaje del curso.
Fuentes de consulta
• Bibliografía
1. Douglas C. Montgomery, George C. Runger. Probabilidad y Estadística aplicadas a la
ingeniería. Primera Edición, McGraw-Hill, México, 1999.
2. Walpole Ronald E., Myers Raymond H. Probabilidad y Estadística. Cuarta Edición, Thomson,
México, 1999.
• Ligas o portales electrónicos
• http://www.vitutor.com/estadistica.html
• http://www.uaq.mx/matematicas/estadisticas/xu4.html
• http://math2.org/math/stat/distributions/es-z-dist.htm
• http://www.est.uc3m.es/esp/nueva_docencia/leganes/ing_tec_teleco_todas/
estadistica/doc_generica/archivos/Tabla%20Normal%20COL.pdf
• http://www.vitutor.com/pro/5/a_3.html
• Tabla de valores para la distribución normal estándar, recuperada el 6 de abril desde:
• http://www.ust.cl/html/cree/asignaturas/material_profesor/material_bioestadis/
Tabla%20Z.pdf