Vous êtes sur la page 1sur 130

UNIDAD I: Fundamentos

Estadísticos

Material Elaborado por:


Lic. Mariela Villalobos Villegas
Msc. Gerardo Arroyo Brenes

1|P ág in a
Historia de la Estadística y la Probabilidad

Estadística: La palabra "estadística" proviene del latín: statisticum collegium


("Consejo de Estado") y de su derivado italiano statista ("Hombre de Estado" o
"Político").

El origen de la estadística se remota a los comienzos de la historia a partir de


40000 años a.c, y esto se sabe tanto a través de crónicas, datos escritos, como
restos arqueológicos que han descubierto grabados en pieles, rocas, madera,
paredes de cuevas que servían para llevar la cuenta del ganado, la caza, los
habitantes u otros elementos. En la Biblia, por ejemplo, observamos en uno de los
libros bajo el nombre de números, el censo que realizó Moisés después de la
salida de Egipto (Números, 1, 1-2).

La presencia del hueso astrágalo de oveja o ciervo en las excavaciones


arqueológicas más antiguas, parece confirmar que los juegos de azar tienen una
antigüedad de más de 10000 años.

Los babilonios hacia el año 3000 a.c usaban ya pequeñas tablillas de arcilla para
recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o
cambiados mediante trueque. En el antigüo Egipto, se analizaban los datos de la
población y la renta del país mucho antes de construir las pirámides.

En Grecia hacían censos periódicos con fines tributarios, sociales y militares, en


Roma hacían censos periódicos de población cada cinco años y censos periódicos
de bienes, formaban enumeración de nacimientos y mortalidad, ambos países,
utilizan la configuración resultante de lanzar cuatro dados para presidir al futuro y
revelar la voluntad favorable o desfavorable de los dioses.

2|P ág in a
Probabilidad: La Edad media termina históricamente en el año 1453, dando paso
al Renacimiento, la cual se destacó por la actividad mercantil, industrial, artística,
arquitectónica, intelectual y científica, entre otras; surgiendo una nueva relación
del hombre con la naturaleza, que va unida a una concepción ideal y realista de la
ciencia convirtiéndose la matemática en la principal ayuda de una sociedad
preocupada por fundamentar racionalmente su ideal de belleza.

A partir de esta etapa con el avance en las matemáticas y la filosofía, se empieza


a dar una explicación coherente a muchos fenómenos que no seguían un patrón
determinístico, sino aleatorio, hoy conocidos como todos los fenómenos relativos a
la probabilidad de los sucesos, concretados en los juegos de azar (cartas y
dados).

Importancia de la Estadística y la Probabilidad

La estadística y la probabilidad como términos definidos, cobraron importancia


durante el siglo XX, tuvo un desarrollo sin precedentes como disciplina científica,
por lo que pasó a considerarse como una de las ciencias metodológicas
fundamentales y como base del método científico experimental, por ejemplo: para
asuntos de salud pública, economía y propósitos sociales como las tasas de
desempleo.

Castells (1997), expresa que existe una relación directa entre el desarrollo de un
país y el grado en que se utiliza la información, por ello es vital contar con un
sistema estadístico que produzca información completa y confiable. Esta
información es necesaria para la toma de decisiones, sin embargo, se requiere de
un sistema educativo que procure la formación adecuada, no sólo a los técnicos
que produzcan estas estadísticas, sino a los profesionales y ciudadanos que
puedan interpretarla y tomas a su vez decisiones basadas en ellas.

3|P ág in a
Conceptos Básicos de Estadística

¿Qué es Estadística?: La estadística, en general, es la ciencia que trata de la


recopilación, organización, presentación, análisis e interpretación de datos
numéricos con el fin de realizar una toma de decisión más efectiva. Es decir, es la
disciplina científica dedicada al desarrollo y aplicación de la teoría y las técnicas
apropiadas para la recolección y análisis e interpretación de información
cuantitativa o cualitativa obtenida por observación o experimentación.

Una clasificación tradicional es la siguiente:

Estadística
Estadística Aplicada:

Teoría de la
Estadística 1. Estadística Descriptiva
2. Estadística Inferencial

Estadística Descriptiva e Estadística Inferencial.

La estadística descriptiva como menciona Chaves (2012): “se dedica a organizar,


representar, resumir y analizar conjuntos de datos, de modo que se puedan
describir en forma precisa sus patrones de variabilidad e identificar las principales
características en función del contexto al que pertenecen”. Mientras que la
estadística inferencial la define como: “la parte de la estadística que identifica la
variabilidad de los datos para favorecer su interpretación y con ello poder apoyar
el análisis de situaciones particulares”. (p.11)

4|P ág in a
En resumen, la estadística descriptica es una rama estadística que se interesa por
recoger, resumir y analizar los datos y su fin es lograr la descripción propia de un
conjunto determinado. Las técnicas comúnmente utilizadas son: confección de
gráficos, cálculo de medidas de posición y variabilidad y cálculo de porcentajes.

Mientras que la estadística inferencial, es un proceso inductivo, en el cual se toma


una parte de la población, es decir, una muestra, se analizan los datos y
resultados y se generalizan para toda la población. Sin embargo, se debe tomar
en cuenta que para hacer inferencia, es indispensable que la muestra sea
aleatoria o probabilística.

Conceptos Básicos de Estadística

 Unidad de Estudio o Unidad Estadística: Se refiere a la característica que me


indica de donde proviene la información, es decir, la unidad que me relaciona
el propósito de estudio. Podría referirse entonces a personas, animales,
objetos, entre otros.

Gómez (2010), menciona: “el análisis estadístico se lleva a cabo con base en
observaciones correspondientes a una cierta característica en lo que se
denomina unidades estadísticas elementales o unidades de estudio”. (p. 5)

Ejemplo #1: Si se realiza un cuestionario sobre el rendimiento académico de


los estudiantes de secundaria del Colegio XYZ, la unidad de estudio o unidad
estadística corresponde a los estudiantes, esto debido a que todas las
características sobre las que se centra el cuestionario está en función del
estudiante.

Ejemplo #2: El ingeniero jefe de producción de una empresa llamada XYZ


desea verificar la calidad de una partida de bombillos producidos el día 6 de
marzo. Para hacerlo toma una muestra de 50 bombillos y determina, para cada

5|P ág in a
uno, si enciende o no.
En este caso, la unidad de estudio es: “El Bombillo”, la característica de
interés: su estado (bueno o malo) y la observación: si enciende o no. Las
observaciones formarían los 50 resultados.

Ejemplo #3: El jefe de la sección de créditos personales de un banco decide


hacer una investigación para saber el estado de los préstamos, en lo que
respecta a la puntualidad en el pago de las amortizaciones mensuales.

En este ejemplo: la unidad estadística es: “El Préstamo” y la característica es:


el cumplimiento en el pago. Las observaciones podrían arrojar tres tipos de
resultados: al día, atrasado y cobro judicial, de manera que para cada
préstamo existiría una observación que se sitúa dentro de una de esas
categorías.

 Población: Se llama población al conjunto del que se estudia una o varias


variables estadísticas. Una población podría ser finita (tiene un número
limitado de elementos) o infinita (tiene un número ilimitado de elementos).

Es importante destacar que la población la componen no las unidades


estadísticas propiamente, sino los valores numéricos asociados a esas
unidades. Sin embargo, en la práctica esto no es fundamental y puede verse
como un conjunto de números o de unidades.

Ejemplo #1: Gómez(2010), menciona el siguiente ejemplo: en una encuesta


dirigida a conocer el ingreso mensual de las familias del Área Metropolitana de
San José, la unidad de estudio será la familia residente en esa área geográfica
y la población la componen el total de familias dentro del área.
Para el estadístico, sin embargo, la población no la forman las familias
propiamente dichas, sino los números que indican los ingresos mensuales de
esas familias. (p. 8)

6|P ág in a
Ejemplo #2: clasifique si las siguientes poblaciones son finitas o infinitas:

Ejemplos de poblaciones ¿Finita o


infinita?
Longitud de los tornillos producidos por una máquina Infinita
Peso de los estudiantes matriculados en el curso de Finito
estadística descriptiva en la UTN
resultados obtenidos al lanzar al aire una moneda un número Infinito
infinito de veces
Resultados obtenidos al lanzar al aire un dado 200 veces Finito
Longitud de los tornillos producidos durante un día. Finita

 Muestra: Se llama muestra a un subconjunto o parte de la población. Se


utilizan en investigaciones, en diversos campos y su fin es proporcionar
conclusiones que sean aplicables a todos los elementos de la población. Las
muestras podrían ser aleatorias o no aleatorias.

Ejemplo #1: Los Estudiantes del curso de Estadística Descriptica para la


carrera de Ingeniería en Procesos y Calidad de la UTN.

¿Cuándo utilizar una muestra?

 Cuando la población es muy grande o infinita, pues resulta imposible cubrir


los elementos que la componen.

 Cuando la población es finita, pero muy grande, por lo que su estudio


resultaría muy costoso y demanda mucho tiempo, al punto de que los datos
resulten obsoletos o inútiles.

 La unidad de estudio se transforma o se destruye al ser examinada

7|P ág in a
¿Cómo se selecciona una muestra?

 Aleatoria o al zar: si se le da a cada uno de los elementos de la población


una probabilidad conocida de ser incluida en la muestra.
 Intencional: utilizando la experiencia y conocimiento de la persona en la
población que se estudia.
 Por conveniencia: utilizando elementos que estén disponibles o sean más
fáciles de conseguir.

Tipos de muestreo
A. Muestreo aleatorio o probabilístico: todos los elementos de la población
tienen una probabilidad conocida y no nula de ser seleccionados en la
muestra. Este tipo de muestreo es el que se requiere para poder hacer
inferencias a la población, pues eliminan los sesgos de selección, producen
errores aleatorios medibles y el error de muestreo puede hacerse pequeño
aumentando el tamaño de la muestra.

Muestra Muestreo Sistemático Muestreo Muestreo por


aleatoria simple estratificado
Conglomerados
o muestra
aleatoria simple
al azar
Es aquel donde Este tipo de muestreo es Cuando se divide Es muy diferente al
todos los recomendable cuando se a la población en
estratificado.
elementos tienen poseen listados de personas, estratos y dentro
la misma empresas o instituciones y de cada uno se Se utiliza cuando no
probabilidad de se desea una muestra. hace un muestreo
es posible obtener la
ser simple al azar.
seleccionados. Se recomienda tener la lista lista de todas las
en forma alfabética, pues se Ejemplo: En la
unidades de la
No es debe cuidar que cierto UTN hay 8000
conveniente número no repita una misma hombres y 7000 población; además,
cuando se trabaja característica. mujeres.
cuando se desea
con personas.
Lo que se hace es tomar 1 Muestra: 150 reducir el costo y el
cada k-ésimo de la lista. personas
tiempo para ubicar
Se toma:
El espaciamiento  80 las unidades
hombres
individuales.
 70

8|P ág in a
El arranque es un número mujeres
aleatorio entre 1 y k.
Ejemplo:
Estratos: genero,
grupos de edad, investigación de
Si entonces
estudiantes (de
el arranque será un número colegio, primaria, estudiantes de
entre 1 y 7, sea a = 4. universidad, etc), secundaria en el
entre otros. Los
Entonces los números serán: estratos de uno a área metropolitana,
4, 11, 18, 25, ... otro son muy tomo como muestra
heterogéneos.
Cuando el k no es número a los estudiantes de
entero se sigue este 1 colegio, entonces,
procedimiento:
son heterogéneos
en su interior y
homogéneos por
El arranque “a” se tomará fuera.
entre 100 y 875.

Supongamos a = 216 → 2
 216 + 875 = 1091 → 10
 1091 + 875 = 1966→ 19
y así sucesivamente

Por ejemplo en trabajos de


campo: entrevisto una casa y
me brinco 4 y así
sucesivamente.

B. Muestreo no aleatorio o no probabilístico: NO todos los elementos de la


población tienen probabilidad de ser seleccionados en la muestra. Se
toman los elementos que son más fáciles de conseguir o que están más
cerca del interesado. Es imposible hacer inferencias sobre la población
utilizando un muestreo no probabilístico.

Muestreo por cuotas Muestreo intencional o Muestreo por Muestreo


por juicio conveniencia bola de nieve
La población se divide en Las muestras las El investigador Se basa en la
distintas subpoblaciones, selecciona una persona emplea su propio hipótesis de
pero la selección de cada con experiencia y juicio para elegir que los

9|P ág in a
unidad se hace basada conocimiento amplio de las unidades miembros de
completamente en el criterio la población en estudio específicas que una población
del entrevistador, de modo (juicio de experto). debe incluir en la rara se
que se elige una muestra muestra. conocen entre
por conveniencia dentro de El propósito de lograr sí
cada subpoblación. una muestra lo más Se escogen los
representativa posible, elementos que
Su principal desventaja es pero sigue siendo no están más
que no se conoce si las aleatoria cercanos
unidades elegidas para la
muestra presentan sesgo de
selección. Con este tipo de
muestreo no se puede
estimar el sesgo ni se puede
medir el error de muestreo.

Ejemplo: en un grupo de 20
personas:
 5 mujeres dentro de
Heredia
 5 hombres dentro de
Heredia.
 5 mujeres fuera de
Heredia
 5 hombres fuera de
Heredia.

 Unidad de muestreo: la unidad de muestreo es la unidad que podría ser


seleccionada para pertenecer en la muestra (personas, viviendas, barrios,
parcelas, establecimientos, etc). Para seleccionar una muestra aleatoria de
unidades de elementos muestrales, es necesaria una lista de todas las
unidades muestrales contenidas en la población. Esta lista se le denomina
marco muestral.

10 | P á g i n a
Por ejemplo, suponga que en una empresa de alimentos se selecciona una
muestra de uno de sus productos: “tortas de carne” en la ciudad de Alajuela,
luego una muestra de supermercados en esas tortas de carne y por último una
muestra de pulperías en los supermercados seleccionados. En cada etapa del
muestreo las unidades de muestreo son las tortas de carne, los supermercados
y las pulperías, pero solo estos últimos son elementos.

 Marco muestral o marco de muestreo: es la lista específica de las unidades de


muestreo de la que se elige la muestra o una de sus etapas. En los diseños de
muestreo de una sola etapa el marco muestral es la lista de la población de
estudio.

 Variables Estadísticas: Es la característica o propiedad que varía en el estudio


de ciertos fenómenos, como por ejemplo: la profesión, la edad, el grupo
sanguíneo, la estatura, el género, el peso, el salario mensual, el estado civil,
entre otras, son variables estadistas. Las variables estadísticas se clasifican en
cualitativas y cuantitativas:

A) Cualitativas: se refieren a una cualidad o modalidad. Ejemplo:


Profesión, grupo sanguíneo, género, estado civil.

B) Cuantitativas: Se refieren a una cantidad, es decir las que pueden


tomar valores numéricos. Ejemplo: Edad, estatura, peso, salario
mensual, número de hijos de una pareja, entre otros.
A su vez, las variables cuantitativas, se clasifican en discretas y continuas:

I. Variable Discreta: Una variable discreta es una variable cuantitativa que


toma valores aislados, es decir no admite valores intermedios entre dos
valores específicos. Ejemplos: El número de hermanos de una persona,
el número de alumnos por sección, número de hijos de una pareja,
número de goles de un equipo de fútbol, número de libros de la

11 | P á g i n a
biblioteca de la universidad, entre otros.
II. Variable Continua: puede admitir, todos los valores de un intervalo real.
Ejemplo: El peso de cada estudiante, estatura, nota obtenida en un
examen, entre otros.

 Observación o Dato: es el valor numérico, cualidad o categoría que se obtienen


de una unidad de estudio o unidad estadística, para una variable en particular.
Por tanto, para cada variable estadística, los datos estadísticos son un
conjunto de números o categorías correspondientes a las observaciones. Por
ejemplo: Un Cuestionario sobre gustos de comidas y cantidad de horas que
duerme al día, aplicado a cada uno de los estudiantes de sétimo año del
colegio XYZ, genera una cantidad de datos o valores a cada variable (gustos
de comidas y cantidad de horas que duerme al día, lo cual se denomina Dato u
Observación).

 Variabilidad de los Datos: según Chaves (2012), se debe a que los datos que
corresponden a las características de las unidades de estudio, varían de una
unidad a otra. Por tanto, es uno de los fines más importantes, pues pretende
modelar e interpretar la variabilidad de un grupo de datos, para determinar
patrones. (p.10)

 Atributos nominales: los valores de la variable indican nombres o cualidades.


Con éstos se puede contar, obtener la moda, calcular porcentajes, hacer
gráficos circulares o de barras horizontales. Ejemplos
 Color de la casa de los estudiantes de este grupo (verde, azul, amarilla,
blanca, entre otros).
 Estado civil de una persona (soltero, casado, viudo, unión libre).

12 | P á g i n a
 Atributos ordinales: también los valores de la variable indican nombres o
cualidades pero tienen un orden establecido. Con éstos se puede contar,
calcular porcentajes, obtener la moda, hacer relaciones del tipo mayor que o
menor que, hacer gráficos de barras horizontales. Se debe tener claro que las
distancias entre una categoría y otra no son constantes. Ejemplos:
 Nivel de escolaridad (ninguno, primaria, secundaria, universitaria).
 Clase social (alta, media, baja)
 Opinión sobre el desempeño de la empresa “xyz” (muy bueno, bueno,
regular, malo, muy malo).

Nota: Una variable cuantitativa puede transformarse en variable cualitativa si se


agrupan sus posibles valores numéricos dentro de ciertas categorías o clases.
Ejemplo: La variable estatura o la altura se puede categorizar en tres clases:
pequeña, mediana, alta.

PRÁCTICA
1) Complete la siguiente tabla de variables:

Unidad característica Unidad de Ejemplos de


elemental medida observación
Un estudiante peso kilogramo 64,5
Una casa Tamaño Metro cuadrado
Valor Colón 3900000
Un bombillo Duración Hora 500
Gasto de kW/h De 100 watios: 0,10
electricidad De 60 watios: 0,06
Una venta monto colón 30000
Una máquina Producción diaria Unidad 200
producida

13 | P á g i n a
2) Complete la siguiente tabla de atributos:
Unidad elemental característica Posibles Observaciones
Un estudiante Clase de alumno Regular, malo, oyente, especial…
Una casa Condición de alquiler Amueblada- sin amueblar
Un bombillo condición Defectuoso- no defectuoso
Una venta Tipo de artículo Jugos-jabón…

3) Dados los ejemplos de poblaciones que a continuación se le muestran,


especifique si se tratan de poblaciones finitas o infinitas, situando dentro del
cuadro correspondiente la letra que las precede

Finitas Infinitas
Población

A. Salarios de los trabajadores de una fábrica “x”, durante el año anterior


B. Personas a las que se les puede aplicar una vacuna contra la gripe
C. Estudiantes que se matriculan en Estadística Descriptiva en los próximos años
D. Resultados obtenidos al lanzar sin límite, un dado
E. Salarios de los obreros
F. Producción de energía eléctrica en los últimos diez años
G. Población costarricense por sectores de producción en el año 2010

4) Para cada uno de los enunciados a continuación, escriba en los espacios en


blanco, una “V” si es verdadera la proposición, o bien una “F” si es falsa.

A. _________ cuando se selecciona una muestra utilizando el juicio de un


experto, hay que tener muy en cuenta los errores aleatorios cometidos.
B. _________ la representatividad de la muestra está en razón directa a su
tamaño y a la homogeneidad que presenten los elementos de la población.}
C. _________ en un análisis estadístico, cuanto mayor es la muestra, menor es el
error aleatorio.

14 | P á g i n a
D. ________ Los sesgos de selección son errores aleatorios o de muestreo

5) En la lista de características que a continuación se le presentan, indique, para


cada una, si se trata de un atributo o variable, y en caso de ser variable, si es
continua o discreta.

A. Peso de los estudiantes


B. Estado civil de los profesores

C. Ingresos familiares

D. Número de hijos
E. Edad de los estudiantes
F. Edad en años cumplidos de un estudiante
G. Clases de insectos
H. Duración de las carreras
I. Categorías profesionales
J. Producción de la editorial
K. Tipos de papel
L. Consumo familiar de electricidad
M. Humedad relativa
N. Especies botánicas
O. Calidad de un producto

6) El departamento de personal de la empresa Zemo S.A, para una nueva


ubicación de sus empleados, decide llevar a cabo un estudio sobre la situación
socioeconómica de aquellos.

A. ¿Cuál es la población de interés? ________________________________

B. ¿Cuáles son las características que interesa estudiar?


____________________________________________________________

15 | P á g i n a
C. ¿cuál es la unidad estadística? ___________________________________
D. Escriba tres ejemplos distintos de población a los que se refieran este
ejercicio:
____________________________________________________________
____________________________________________________________
____________________________________________________________.

7) Defina en sus propias palabras, los términos: estadística descriptiva y


estadística inferencial.

8) Determine si las afirmaciones que a continuación se exponen, son verdaderas


“v” o falsas “f”, según corresponda.

A. ______ la selección aleatoria garantiza que la muestra refleja exactamente


lo que sucede en la población.
B. ______ la estadística inferencial trata de generalizar los datos obtenidos en
la muestra a la población.
C. ______ el cálculo de promedios, porcentajes y medidas de variabilidad es el
objeto exclusivo de la estadística inferencial.
D. ______ La tabla de números al azar se utiliza para garantizar que los
elementos escogidos no podrán repetirse al seleccionar otras muestras.
E. ______ la estadística descriptiva trata de describir el conjunto de datos, sin
pretender generalización alguna.

16 | P á g i n a
Fuentes de Información

En toda investigación, la estadística tiene dos fines:


1. El fin científico, es decir, explicar, controlar y posteriormente hacer
pronósticos en situaciones determinadas.
2. Un fin utilitario, es decir, tomar decisiones, a partir de resultados
determinados, para ponerlas en práctica y posteriormente ser evaluadas,
como sucede en el ámbito empresarial.
Sin embargo, es importante no olvidar que cuando se realiza una investigación
con herramientas estadísticas podemos tener el caso que los datos requeridos
sean existentes, pues alguien ya los recogió para estudiar el mismo tema, o bien,
que los datos requeridos sean no existentes y deba implementarse otro proceso
para obtenerlos.
Así tenemos:
A) Datos Existentes: si la información que requerimos ya existe y es apropiada
al tema de interés. Debe evaluarse bien si es pertinente a los fines que se
persiguen, si es posible, el investigador se economizará esfuerzo y
recursos. Además, dichos datos se pueden dividir en primarios y
secundarios, el primero para el caso en las fuentes que recogen y
suministran dichos datos, como: Dirección General de Estadísticas y
Censos, Dirección de Empleo del Ministerio de Trabajo, Banco Central, etc.
Mientras que la segunda, es para el caso en que los datos recogidos
originalmente se dieron por otros y estas solo se publican, un ejemplo lo
menciona Gómez (2010): “planidatos, publicado por el Ministerio de
Planificación y Política Económica, resume y presenta numerosas series
estadísticas recogidas y elaboradas por otras instituciones nacionales
productoras de datos: Dirección General de Estadísticas y Censos, Banco
Central,…”. (p.31). Sin embargo, para manipular este tipo de datos, deben
evaluarse antes de ser utilizados, mediante las siguientes preguntas:

17 | P á g i n a
 ¿La investigación fue con la población o muestra?, si fue con
muestra: ¿aleatoria o intencional?
 ¿El lugar donde se realizó el estudio fue parcial o había un
interés?
 ¿Se pudo haber introducido algún sesgo en los datos?
 ¿Se definieron claramente las unidades estadísticas y las
variables en estudio?
 ¿Las técnicas de estudio, definiciones y población estudiada
aplica para el problema que interesa estudiar?

B) Datos No existentes: cuando los datos no existen y el investigador debe


entonces, enfrentarse a utilizar ciertas técnicas específicas de recolección
de información para obtener los datos que la investigación requiera. Dichas
técnicas son: la observación, la entrevista, correo y registro, cada una de
ellas elaboradas mediante cuestionarios específicos, según la finalidad de
cada técnica. Para que cualquiera que sea el modelo de investigación
elegido, logremos obtener los datos necesarios para cumplir con nuestros
objetivos de investigación y es utilizada para generar estudios que al ser
socializados, apoyarán el proceso de mejoramiento de problema.
Analizaremos, cada técnica para datos no existentes y posteriormente el
cuestionario, el cual es una herramienta útil para cada una de estas técnicas:
1. La Observación

Propósito

Desarrollar una comprensión completa de los fenómenos en


estudio, que sea tan clara y precisa como sea posible. Por medio
de la observación se pueden responder preguntas, construir teoría
y generar o probar algunas hipótesis. Se utiliza en el control de
calidad de muchos procesos industriales.

18 | P á g i n a
A) Desarrollo del Método: El resultado se materializa en el registro, diario o
cuaderno de campo.

B) Contenido del Diario de Campo: El diario de campo debe contener al menos


 Registro detallado, preciso y completo de acciones y eventos.
 Descripción detallada de personas y contextos.
 Las propias acciones de la investigadora o investigador.
 Impresiones y vivencia del observador (a).
 Supuestos e interpretaciones que se hacen en el transcurso de la
observación.
 Reflexiones, conjeturas y prejuicios.
 Comentarios, consideraciones y reflexiones de quien hace la observación.

C) ROL DEL OBSERVADOR(A)


Como participante completo Participante como observador
Es un miembro de la empresa y Es un miembro del grupo estudiado y el grupo
oculta al grupo su rol de es consciente de la investigación. No es un
investigador para evitar agente externo.
interrumpir la actividad normal.
Observador como participante Observador completo
Su rol principal es la recogida de El investigador está completamente oculto
datos y el grupo estudiado es mientras observa o cuando éste se halla a
consciente de las actividades de plena vista en un escenario público, pero el
observación del grupo. público estudiado no está advertido de lo que
observan.

De las cuatro posturas anteriores, la más ética es la de “observador como


participante”, pues las actividades son conocidas para el grupo estudiado.
D) LIMITACIONES

19 | P á g i n a
 La mayoría de observadores(as) no son del todo participantes en la vida de
la empresa determinada en el estudio, o bien, del grupo estudiado dentro de
la misma.
 Las costumbres y normas existentes en la empresa pueden impedir el
desarrollo pleno de la investigación.
 Desconfianza del grupo estudiado por la aparición de un(a) extranjero(a) en
el territorio.
 La calidad de la observación, depende de la habilidad del (de la)
investigador (a) en observar, documentar e interpretar la información.

2. LA ENTREVISTA

Definición y Propósito
La entrevista es una conversación entre 2 o más
personas, una persona es entrevistador y otra u otras
entrevistados.
Su propósito es reconstruir la realidad tal y como la
observan los actores de un sistema o área empresarial
previamente definido.
Se dialoga, según ciertas normas o esquemas, teniendo
siempre un objetivo profesional, de manera, que ambos
pueden participar, la comunicación verbal es recíproca.

A) Características Generales
 Reiterados encuentros cara a cara entre el investigador y los
informantes dirigidos hacia la comprensión de las perspectivas.
 El investigador es el instrumento de la investigación y no lo es un
protocolo.
 Es necesario prestar atención a los detalles de las experiencias y los
significados que los entrevistados le atribuyen.

20 | P á g i n a
B) Aspectos a considerar
 Selección de informante
 Anonimato
 Emplear seudónimos a personas y lugares de estudio.
 Ganar la confianza al informante.
 Logística.

CARACTERÍSTICAS DEL…
ENTREVISTADOR ENTREVISTADO
 Explica el objetivo y la motivación del  Cada entrevistado recibe su propio
estudio. conjunto de preguntas.
 Formula preguntas con categorías de  Orden y formato puede diferir de
respuesta. uno a otro.
 Explica el sentido de las preguntas.  Dispuesto a cooperar.
 Establece relación equilibrada entre  Comprende los propósitos del
familiaridad y profesionalidad. investigador.

C) VENTAJAS Y DESVENTAJAS
Ventajas
 Es una técnica eficaz para obtener datos relevantes y significativos.
 Se pueden captar los gestos, los tonos de voz, los énfasis, entre otros;
éstos aportan información relevante sobre el tema y las personas
entrevistadas.
 La ventaja esencial de la Entrevista reside en que son los mismos actores
sociales quienes proporcionan los datos.

21 | P á g i n a
Desventajas
 Lo cara que puede resultar preparar a los entrevistadores, ya que se debe
pagar: sueldos, viáticos, transporte, entre otros.
 Es susceptible a producir engaños, exageraciones o distorsiones. Las
personas hacen y dicen cosas diferentes en distintas situaciones.
 Existencia de temas tabúes entre las personas, algunos de los cuales
producen rechazo cuando se trata de responder preguntas concretas,
como por ejemplo temas políticos, sexuales, económicos, sociales, etc.

D) Tipos de entrevista:

 Personal: permite obtener información muy confidencial, y posee un


mayor porcentaje de respuesta. Se necesita que los miembros de la
población sean potencialmente accesibles. Sin embargo, se vuelven
generalmente largas.

 Telefónica: tienen costos más bajos, permite obtener información muy


confidencial y un alto porcentaje de respuestas, además, es sencillo
contactar luego a la persona entrevistada, se cubre una gran área
geográfica y no es peligroso para el entrevistador. Sin embargo, requiere
la supervisión a los entrevistadores.

 Correo: presentan un bajo costo, existe un alto porcentaje de que los


entrevistados no respondan y se debe presentar mediante un
cuestionario claro, ordenado, fácil de responder y bien redactado.

3. Registro
Se utiliza casi exclusivamente por las oficinas públicas. Se obtiene información
teniendo el registro de hechos como: nacimientos, matrimonios, defunciones,
accidentes, entre otros, ya que al tener dicha información no sería necesario salir

22 | P á g i n a
a buscarla. Es una técnica muy barata, sin embargo, se corre el riesgo de que la
información recopilada sea limitada.
Fases de la Investigación Estadística
En toda investigación estadística, se debe tomar en cuenta el plan y la
preparación, la ejecución del mismo y el análisis de resultados. De manera, que lo
dividiremos de la siguiente forma:
A) Definición del problema: determinar qué es lo que se quiere investigar y
delimitarlo claramente.
B) Establecer los propósitos específicos del estudio: Fijando los objetivos
específicos, la teoría que sustenta la investigación e hipótesis que puedan
someterse a prueba.
C) Preparación de un plan general de trabajo: se debe formular un plan de acción
con las metas a las que se desea llegar.
D) Formulación de un cuestionario: el cuestionario para la investigación
estadística es la herramienta en la cual giran las técnicas de recolección de
información anteriormente vistas.
E) Diseño y selección de la muestra: se debe especificar la población en estudio,
para luego mediante algún método probabilístico determinar la muestra que se
requiere.
F) Preparación y ejecución del trabajo de campo: una vez seleccionada la
muestra y teniendo listo el cuestionario, el investigador debe proceder a
realizar la técnica de recolección seleccionada.
G) El procesamiento de la información: una vez obtenida la información, se debe
proceder a ser analizada estadísticamente.
H) Análisis e interpretación de datos: se debe dominar el campo específico y tener
cautela al procesar la información.
I) Preparación del informe: en el mismo, se debe especificar: objetivos,
metodología, principales resultados, análisis e interpretaciones.

23 | P á g i n a
El Cuestionario
Es un instrumento que consta de una serie de preguntas, para ser resueltas sin
intervención del investigador. Su función es obtener las respuestas que
suministren los datos necesarios para cumplir con los datos de la investigación.
Características que debe cumplir el cuestionario:
 Confiabilidad.
 Validez.
 Motivación.
 Evitar el cansancio del informante.
El uso de la técnica de la interrogación contempla dos pasos básicos:
 La preparación de un cuestionario donde aparezcan las preguntas de
interés.
 La aplicación de ese cuestionario a los sujetos o informantes.
La construcción de un buen cuestionario y su correcta aplicación se
convierten en la base de una encuesta.
Funciones:
 Obtener respuesta que suministren los datos necesarios para cumplir con
los objetivos de la investigación.
 Ayudar al entrevistador en la tarea de motivar al informante para que
comunique la información requerida, siendo de suma importancia para la
obtención de la información en forma válida y confiable.
Tipos de preguntas:
1. Cerradas: son aquellas en las que las respuestas posibles se hallan fijadas a
alternativas fijadas de antemano (“SI O NO”), también pueden consistir en una
serie de opciones de las que el entrevistado debe tomar una como la mas
acorde con su postura.

 Ventajas: Pueden ser formuladas rápidamente, son fáciles de anotar y las


respuestas quedan clasificadas en el mismo momento en que se aplica la
entrevista, haciendo que su procesamiento y análisis sean relativamente
sencillos.

24 | P á g i n a
 Desventajas: Pueden llegar a forzar al entrevistado a dar una respuesta o
juicio sobre un tema del que todavía no tenga opinión. Las respuestas
pueden ser interpretadas erróneamente o no captarse su real significado.

2. Abiertas: Están elaboradas para permitir una respuesta libre y no una limitada
a alternativas preestablecías.

 Ventajas: Dan la oportunidad al interrogado de contestar espontáneamente


y en sus propios términos. Desventajas: Plantean problemas de
procesamiento y de análisis que pueden ser muy complejos.

Clases de preguntas:
 Preguntas de hechos: se le pregunta al individuo algo tangible, que pueda
responder fácilmente: edad, profesión, domicilio,……
 Preguntas de acción o comportamientos: Se requiere del individuo
información sobre si ha realizado tal o cual acto y en que sentido, las
respuestas pueden ser bastantes preciso ya que se refieren a algo
concreto.
 Preguntas de intención: Se requiere que el individuo no daga como actuó, si
no como actuaría si se le presentara la ocasión. La respuesta de este tipo
de preguntas es difícil.
Detalles acerca de la Construcción del Cuestionario:
Las preguntas:
 Deben ir Claras y Comprensibles: Evitar repeticiones y el estilo complicado.
 No deben incorporar al que responde: Utilizando temas que lo lleven a la
respuesta deseada.
 No deben incluir a la respuesta (ejemplo: ¿Es el actual presidente una
persona culta?), Ni llevar una carga emocional.
 No deben ser formuladas en negativo: ¿No asiste a reuniones.....
 No deben tener dos preguntas a la vez
 Deben tener un lenguaje adaptado a las características del que responde.

25 | P á g i n a
 No se debe iniciar el cuestionario con preguntas muy difícil.
Además, no se debe olvidar explicar los propósitos del cuestionario ni las
instrucciones. Y no se tiene un número ideal de preguntas.
Nota: Para una investigación estadística, el tipo de preguntas deben ser cerradas,
para que posteriormente puedan ser analizadas mediantes gráficos.

26 | P á g i n a
Unidad

UNIDAD II: PROCESAMIENTO Y


PRESENTACIÓN DE LA INFORMACIÓN

27 | P á g i n a
Las clasificaciones o series estadísticas
Se acostumbra a utilizar cuatro tipos de clasificaciones o series estadísticas para
los datos recolectados, los cuales son los siguientes:
1. Series cuantitativas: son aquellos datos clasificados según una variable
cuantitativa (discreta o contínua) Por ejemplo:
Cuadro Nº 1
Prevalencia de sobrepeso en Costa Rica según edad y género
Grupo Prevalencia (%)
Niños (as) 5-12 años 21.4
Adolescentes 13-19 años 20.8
Mujeres 20-44 años 59.7
Mujeres 45-64 años 77.3
Hombres 20-64 años 62.4
Hombres y mujeres >65 años 59%
Fuente: Ministerio de Salud, Costa Rica; 2009

28 | P á g i n a
Cuadro No. 2

Cantidad de Víctimas Mortales

Según Rango de Edad y Sexo

Año 2010

Rango de Edad Sexo


Masculino Femenino
1-10 10 4
11-20 9 4
21-30 87 8
31-40 46 10
41-50 40 6
51-60 21 2
61-70 13 0
71-80 4 1
81-90 3 0
Más de 91 0 0
No informa 14 5
Total 247 40

Fuente: Dirección General de la Policía de Transito

2. Series Cualitativas: son aquellos datos clasificados según una variable


cualitativa. Por ejemplo:

29 | P á g i n a
3. Series geográficas: son series cualitativas, se mencionan separadas de las
mismas por las frecuencias con la que se utilizan. Por ejemplo:

4. Series Cronológicas o de tiempo: se clasifican como la palabra lo indica, según


un orden cronológico. Son de gran importancia para explicar fenómenos
sociales, económicos, demográficos y meteorológicos. Por ejemplo:

30 | P á g i n a
Fuente: INEC, Costa Rica; 2008

Formas de Presentación de la Información


Una vez obtenidos los datos, se clasifican y se tabulan, para luego resolver de qué
forma se presentarán o expondrán los resultados. Es importante no olvidar esta
fase, pues nos permite un mejor análisis de los datos y los resultados y dejarlos a
su vez, al alcance de muchas otras personas.
Para esta fase, no existe una regla fija para definir el proceso, por lo que lo vuelve
un poco complejo, ya que depende del criterio de la persona que maneja los
datos. Sin embargo, como guía, podemos utilizar una de las siguientes cuatro
formas básicas de presentar la información:
1. Textual: tiene un uso restringido y específico. Las cifras (o datos) se incluyen
dentro del texto. Por ejemplo, Gómez (2010) cita: “El problema nutricional de
Costa Rica es, en la mayoría de los casos, un resultado directo de la pobreza.

31 | P á g i n a
En el área Metropolitana de San José, el costo de la dieta recomendada por el
INCAP (Instituto de Nutrición de Centroamérica y Panamá) es de ₡500,00 al
mes para una familia de 5 miembros. Sin embargo, un elevado porcentaje de
las familias urbanas no alcanzan ni siquiera ese nivel de ingreso. En las zonas
rurales, el problema de la mala nutrición no es extraño, si se considera que los
salarios mínimos del gran número de jornaleros de estas zonas no llegan ni
siquiera a ₡300,00 mensuales”. (p.146)

Como ventajas se tiene que: se permite resaltar cifras importantes, permite


explicar ciertos puntos donde se considere necesario y permite simplificar la
información de forma simple e interesante al público.

Como desventajas tenemos que: no permite incluir información extensa y se


requiere leer todo el análisis para poder comprender la información transmitida.

2. Semitabular: tiene un uso restringido y específico. Se utiliza cuando se tienen


pocos datos clasificados de forma simple, pero que a su vez estos muestran
una independencia del texto. Es decir, se utilizan en series sencillas o sencillas
con 3 o más categorías, las cuales resultaría confusas en un texto, pues
requieren ordenarse en columnas.

Muestra las ventajas de forma similar a la textual, agregando que esta permite
darle mayor énfasis a los datos. Como desventaja, al igual que la textual, aún
no se puede dejar de leer el párrafo para comprender los datos.

Como ejemplo Melgar (2012) cita lo siguiente: “Analizando el comportamiento


poblacional del municipio de San Juan Sacatepéquez, se determina que está
integrada mayoritariamente por población joven”.

32 | P á g i n a
Categoría Rango de Edad Porcentaje

Joven 0 – 30 61.25

Adulto 31 – 64 31.38

Tercera Edad 65 y más 7.37

3. Tabular: es la más utilizada. Goméz (2010) la define como: “una ordenación


sistemática de datos en filas y columnas, de acuerdo al criterio o criterios de
clasificación que interesen y, en forma tal, que puedan ser interpretados
rápidamente, extraer conclusiones de ellos y hacer comparaciones”. (p.147)

Los componentes del cuadro son los siguientes:

Fuente: http://www.estadistica.ucr.ac.cr/cdmmora/pages/inicio.htm

33 | P á g i n a
Ejemplo de cuadro:

A) EL NÚMERO DEL CUADRO: puede formar parte del título o colocarse


encima de él. Se agrega cuando en una publicación hay más de un
cuadro, para identificarlos. Se recomienda usar la numeración arábiga.

B) TITULO: se coloca en la parte superior, presenta en forma corta un idea


de la información que contiene el cuadro. El título debe decir: que son
los datos (a que se refieren), donde se recogieron (lugar), cuando se
recogieron (año) y clasificaciones utilizadas para organizar los datos
(provincia, sexo, entre otros).

C) LA NOTA INTRODUCTORIA O PRELIMINAR: aclara una parte o todo el


contenido del cuadro; se coloca centrada debajo del título y en

34 | P á g i n a
minúscula, se encierra entre paréntesis o guiones. Puede indicar la
unidad de medida de los datos o hacer alguna aclaración esencial para
su comprensión. Es un complemento del título. Marjorie, menciona las
siguientes ventajas:

Ventajas
 Informa las unidades de los datos
(En dólares)
(En miles de colones)
(Tasas por mil habitantes)
 Aclara el título
(Muestra de estudiantes)
(Datos censales)
 Previene al usuario de las limitaciones de los datos
(Cifras preliminares)
(Proyecciones)
 Establece la base sobre la que se realizan las comparaciones, como
en los índices
(Enero 1995=100)

D) LA COLUMNA MATRIZ: Marjorie la define como: “es la columna del lado


izquierdo del cuadro. En ella se coloca la característica principal de
clasificación del cuadro; pero puede colocarse, también, la característica
que tiene el mayor número de categorías o los nombres más largos, por
la facilidad de extenderse para abajo”.

E) ENCABEZADO: El encabezado se ubica en la parte superior derecha


del cuadro y contiene los títulos de las columnas; se coloca en ellos una
o varias clasificaciones de los datos.

35 | P á g i n a
Nota:
 Ordenamiento de las categorías en la columna matriz y en los encabezados:

 Se coloca la clasificación más importante en la columna matriz y las


clasificaciones secundarias en el encabezado. No es recomendable
colocar más de tres niveles de clasificación en los encabezados.

 Se prefiere una columna matriz larga y un encabezado corto. Por tanto,


los nombres de las características más extensas se colocan en la
columna matriz.

 El título o etiqueta se escribe con letras mayúsculas y las


subclasificaciones en minúscula (sólo la primera letra lleva mayúscula).
Los nombres se escriben en singular y debe evitarse la repetición de
palabras.

 Si los datos del cuadro se refieren al sexo de las personas, se opta por
usar el término “Ambos sexos” en lugar de “total”.

Marjorie menciona: “El Instituto Nacional de Estadística y Censos de Costa Rica


(INEC) y la norma del Centro Interamericano de Enseñanza de Estadística
(CIENES), dice que las clasificaciones deben estar antecedidas por las palabras
según para la columna matriz y por para el encabezado”.

Las siguientes son formas de ordenamiento de la columna matriz y de los


encabezados, más comunes:

 Alfabético: Ordena las categorías en forma alfabética. Facilita la localización


de los datos. Por ejemplo: ordenar según la primer letra de los apellidos de los
estudiantes.

36 | P á g i n a
 Magnitud: se ordena las categorías de acuerdo con su tamaño o magnitud, es
decir de menor a mayor (o viceversa). Por ejemplo: ordenar los trabajadores
de la empresa XYZ de acuerdo con su peso o bien su edad.

 Cronológico: se ordena las categorías de acuerdo con una serie cronológica o


de tiempo, es recomendado y más utilizado que se inicie con la fecha más
antigua, aunque algunos acostumbran poner primero el año o período más
cercano. Por ejemplo:
 Clasificar la población de Costa Rica, por año calendario del 1990 al
2005.
 Mostrar los datos del Índice de Precios al Consumidor de Costa
Rica, para cada uno de los doce meses del año 2012.

 Geográfico: se ordena las categorías de acuerdo con un orden de cercanía o


continuidad geográfica. Por ejemplo: en Costa Rica: Zona Atlántica, Zona
Norte, Zona Sur y Valle Central.

 Usual: se ordenan las categorías de acuerdo con la tradición o la costumbre.


Por ejemplo: En el caso de Costa Rica, se acostumbra a ordenas sexo por
hombre y mujeres y no al revés.

 Progresivo: se ordena las categorías de acuerdo con un orden determinado,


ya sea como se presentan en la realidad o por las diferentes etapas de un
proceso. Por ejemplo: matricula ordinaria, matricula extraordinaria, retiros
justificados, exclusiones por razones especiales y matrícula final.

 Numérico: se ordena las categorías por números. Se utiliza para ciertos


fenómenos, entidades, entre otros. Por ejemplo: Distrito I, Distrito II, Distrito
III, etc.

37 | P á g i n a
F) CUERPO O CONTENIDO: la conforman las cifras que van incluidas en
el cuadro, dentro de las casillas definidas por la columna matriz y los
encabezados.
G) NOTA AL PIE: se coloca al pie del cuadro, antes de la fuente. Su fin es
hacer aclaraciones, observaciones o advertencias a cierta cifra (o dato)
o clasificación. Esta es la notación para escribirlas: _/: signo que denota
la llamada de atención. Ejemplo:

Fuente:http://www.estadistica.ucr.ac.cr/cdmmora/pages/cuadrosygraficos/c4-noaalpie.jpg
H) FUENTE: los datos incluidos en el cuadro no fueron obtenidos
directamente por la persona o entidad que lo confecciona por lo que
debe llevar: Institución u organismo. (año de la edición). Título del
documento. Lugar: publicador. Si los datos fueron citados por otros se
menciona como: FUENTE: xxx, según cita “y”.

38 | P á g i n a
Clasificación de los cuadros
Se clasifican por su contenido o por su estructura o formato, de la siguiente
forma:
Por su contenido
1. Cuadros generales o de referencia: presentan gran cantidad de datos a
un nivel muy desagregado. La función es presentar los resultados de
censos, encuestas, sistemas de registro, etc con todo el detalle posible.
Se llaman generales porque presentan mucha información, pero
también sirven de referencia para diversas investigaciones.

2. Cuadros específicos, derivados o de resumen: son más pequeños que


los de referencia, presentan un punto particular, contestando a
preguntas específicas de interés. Son más elaborados, pues pueden
contener datos adicionales como: porcentajes, tasas, promedios o
razones.
Por su estructura o formato
 Dividido  Paralelo o doble página
 Vertical  Formas compuestas
 Horizontal
Detalles sobre la
construcción de Cuadros
 Es recomendable no incluir demasiada información porque se puede confundir
al lector.
 Destacar cifras: estas deben ser colocadas adecuadamente. La forma de
resaltarla es subrayándola, sin que el cuadro se vuelva extravagante.
 Se citan las fechas exactas, primero la más antigua y luego la más reciente.
Por ejemplo: 1989-2013.
 Rayado: Deben dejarse abiertos los lados del cuadro, no se deben trazar
líneas horizontales dentro del cuerpo ni deben penetrar la columna matriz y las
líneas verticales es para dividir encabezados. Es necesario colocar una línea
vertical que separe la columna matriz del cuerpo del cuadro y una línea

39 | P á g i n a
horizontal al final que es la que cierra el cuadro, que va antes de la fuente o de
la nota al pie.
 Tamaño y forma del cuadro: que no sea ni muy largo ni muy angosto, ni muy
ancho ni muy corto. Ejemplo:

Fuente. http://www.estadistica.ucr.ac.cr/cdmmora/pages/inicio.htm

4. Gráfica: Es la más utilizada después de la tabular. Un gráfico estadístico es


una representación pictórica, cuyo objetivo es expresar el comportamiento de
una variable en estudio. Además, son representaciones de información real
que existe en nuestro mundo, es una expresión artística de datos reales y
observados.

Un gráfico sirve también para comparar visualmente el comportamiento de dos


o más variables similares o relacionadas. Es un medio clásico para presentar
resultados de investigaciones científicas, son simples y fáciles de comprender
y permiten un mejor análisis y una mejor precisión de las conclusiones o
resultados.

40 | P á g i n a
Partes de un gráfico estadístico:

1. Título: Aquí se señala la población en Estudio y la variable. Similar al título


en los cuadros.
2. Diagrama: Dado por el propio dibujo el cual representa el comportamiento
de los datos o series estadísticas. Es la parte más importante del gráfico.
3. Escalas: Depende de la magnitud de los datos, la frecuencia mayor, es el
valor máximo de la escala y se recomienda que exista una relación entre el
eje “x” y “y” de 1 cm cada eje.
4. Leyenda: Son indicadores donde se precisa la correspondencia entre los
elementos del gráfico y la naturaleza de las medidas representadas.
Marjorie menciona:
 Si son cifras absolutas o relativas: Número de persona, Porcentaje
de estudiantes, Número de escuelas.
 Si son unidades, miles o millones: Número de personas (en miles) y
Producto interno bruto (en millones de colones)
 Si los datos han sido multiplicados por una constante, entonces,
anotar el valor de esta constante: Tasa de mortalidad infantil (por 1
000 nacimientos) o Tasa bruta de natalidad (por 1 000 habitantes).

41 | P á g i n a
5. Fuente: Aquí se señala de donde se obtuvo la información que permitió
obtener el respectivo gráfico. Se escribe de forma similar al cuadro.

Tipos de gráficos:
Existe una variedad gráficos, sin embargo, en cada gráfico existe una
clasificación de interés y una frecuencia o valor que pertenece a cada
categoría. Se hará referencia a los gráficos de mayor uso e importancia:

A) Gráfico de barras: La comparación está en la longitud de las barras.

 Las barras deberían ser horizontales si la serie que se presenta es


cualitativa o geográfica (leyenda de categorías corresponde a texto)

Fuente:http://www.estadistica.ucr.ac.cr/cdmmora/pages/cuadrosygraficos/grafico1.png

42 | P á g i n a
 Las barras deberían ser verticales si los datos constituyen una serie
cronológica o cuantitativa (leyendas corresponden a valores numéricos).

Fuente:http://www.estadistica.ucr.ac.cr/cdmmora/pages/cuadrosygraficos/grafico13
.png

Nota: En las series cualitativas y geográficas las barras deben ordenarse


de acuerdo con su longitud, ya sea de forma ascendente o descendente.
No obstante, si se representan variables cuantitativas o cualitativas
ordinales, las barras se colocan siguiendo un orden lógico.

 Las barras comparativas: permiten hacer comparaciones entre variables


de modo que es posible visualizar relaciones entre ellas. Son adecuadas
cuando se desea comparar el comportamiento de una variable entre
distintos grupos.

43 | P á g i n a
Fuente:http://www.estadistica.ucr.ac.cr/cdmmora/pages/cuadrosygraficos/gr
afico16.png

B) Gráfico Circular, de pastel o de sectores: Es utilizado para representar una


variable cualitativa. Es un círculo cuya área se divide en sectores
proporcionales. Se necesita el porcentaje de los elementos en estudio y el área
de cada uno de los sectores refleja la importancia de la categoría que
representa. Estas gráficas son utilizadas para comunicar la misma información
que se representa con gráficas de barras simples, con el inconveniente que su
construcción es más compleja. Se utiliza para representar porcentajes en
variables que tienen pocas categorías de respuesta.

44 | P á g i n a
FUENTE: Colegio de Médico y Cirujanos de Costa Rica.
www.medicos.sa.cr

C) Gráfica lineal: siempre hay dos escalas y el lector debe considerarlas


simultáneamente para interpretar los datos. Son usadas generalmente para
representar series de tiempo, pues permiten analizar de una mejor manera el
patrón de comportamiento. Las escalas se marcan sobre dos rectas, una
vertical y otra horizontal que se unen en un ángulo recto formando un sistema
de coordenadas.

Los Gráficos lineales pueden ser de cuadrícula aritmética, semilogarítmica o


logarítmica.

 Gráficos lineales aritméticos: son aquellos cuya escala vertical y


horizontal es aritmética, es decir, las distancias iguales representan
iguales magnitudes o montos. Se utiliza casi exclusivamente para series
de tiempo y la técnica es prácticamente igual a la del gráfico de barras,
con la diferencia que en lugar de representar el caso o fenómeno con
barras, se utiliza una línea formada por la unión de los puntos. La

45 | P á g i n a
ventaja respecto al de barras es que permite representar varias series
en un mismo gráfico. SIEMPRE debe aparecer el cero al pie de la
escala vertical. Ejemplo:

Fuente: http://www.estadistica.ucr.ac.cr/cdmmora/pages/cuadrosygraficos/grafico9.png

 Gráficos lineales semilogarítmicos: se usa cuando se desea representar


y analizar las variaciones relativas de una serie, tiene en el eje “x” una
escala aritmética y en el eje “y” una escala geométrica o de razón, en la
cual distancias iguales representan magnitudes proporcionales y no
iguales como en la aritmética. Según Gómez (2010), se tiene las
siguientes formas de interpretar el gráfico semilogarítmico:
 “Una línea recta indica una tasa constante de cambio, de
aumento si la pendiente es positiva y de disminución si la
pendiente es negativa.
 Las líneas paralelas indican que las series están aumentando o
disminuyendo a la misma tasa

46 | P á g i n a
 Si dos segmentos de una misma curva tienen diferente
pendiente, el que tiene la pendiente más marcada varía a una
tasa mayor (de aumento o de disminución)”. (p.213)

Fuente: http://www.estadistica.ucr.ac.cr/cdmmora/pages/cuadrosygraficos/grafico12.png

D) Pictogramas: es un gráfico construido a base de figuras o dibujos con el fin de


llamar la atención del lector.

47 | P á g i n a
E) Mapas Estadísticos: son aquellos que muestran la información sobre una base
geográfica. Ejemplos:

PRÁCTICA
1) Mencione dos ventajas y dos inconvenientes del uso de los gráficos

Ventajas:
 Son entendidos de forma rápida y cómoda (presentan la idea general).
 Llaman la atención del lector
Desventajas:
 No muestran las cifras exactas, sino valores aproximados
 En los gráficos, se presenta una cantidad limitada de datos.

48 | P á g i n a
2) De acuerdo con los resultados del censo del 2000, la población nacida
en el extranjero y residente en el territorio nacional es de 296 461 personas.
Estos inmigrantes representan el 7,8% de la población total del país. En el
siguiente gráfico circular, se detalla esta población de inmigrantes según país
de de origen para el año 2000:
Población de Costa Rica nacida en el extranjero según país de
origen. Año 2000.

Otros 12,05%

Colombia 2%

El Salvador 2,93%

Estados Unidos 3,2%

Panamá 3,46%

Nicaragua 76,35%

Fuente: Censo 2000. Instituto Nacional de Estadísticas y Censos

a) Acorde con el gráfico anterior, ¿cuántos inmigrantes de cada país forma parte
de la población nacida en el extranjero y residente en el territorio nacional?

b) En el Censo del 2000 se excluyeron a los turistas y a las personas que


estuvieron en el país por un período corto (menos de seis meses) y sin
intenciones de radicar en el país. ¿Por qué cree usted que se hizo esto?
Formule conjeturas.

49 | P á g i n a
3) El virus del SIDA cobra cada vez mayor cantidad de vidas. En el siguiente
cuadro, se presenta el porcentaje de la mortalidad de niños menores de 5 años
a causa de esta enfermedad en aquellos países que más sufren por este virus.
País Porcentaje
Botswana 64
Zimbabwe 50
Sudáfrica 50
Namibia 48
Kenya 35
Mozambique 26
Zambia 25
Liberia 22
Tanzania 20

Fuente: Estado Mundial de la Infancia 2002, UNICEF.

a) Elabore un gráfico de barras que muestre el comportamiento en los


diferentes países.

b) ¿Por qué cree usted que el SIDA tiene resultados más devastadores en el
continente africano?

c) ¿Cuáles acciones pueden contribuir a la lucha contra el SIDA?

4) Escriba una “V” si el enunciado es verdadero y una “F” si el enunciado es falso


para cada una de las siguientes proposiciones.

 Las proposiciones del gráfico dependen de la serie estadística que pretende


presentar.

50 | P á g i n a
 Debe señalarse claramente si en el gráfico la escala ha sido cortada.

 El gráfico necesita título, leyendas, símbolos, escala, fuente para quedar


claramente explicado.

 El gráfico tiene con respecto al cuadro, la ventaja de poder introducir un


gran número de datos sin perder claridad.

 Todo gráfico puede representar cualquier tipo de serie de datos.

 En el gráfico sólo deben aparecer los nombres que corresponden a las


magnitudes de las escalas horizontal y vertical, todo lo demás lo haría más
confuso.

5) Dadas las siguientes proposiciones:

A) Peso de los alumnos ingresados en un centro


B) Nivel académico de los componentes de un club social.
C) Salarios percibidos por los trabajadores de una empresa.
D) Valores de las importaciones de un cierto año por países de origen
E) Población total por sexo
F) Población total por edades
G) Cantidad de café recogido por provincias
Para cada tipo de series estadísticas, coloque la letra que precede a cada
distribución en el espacio en blanco:
Series cuantitativas: _____________________________
Series cualitativas: ________________________________
Series geográficas: ________________________________
Series cronológicas: __________________________

51 | P á g i n a
6) Dados los enunciados que se presentan a continuación, señale a qué formas
básicas de presentación de la información pertenecen y escriba: 1 si es textual,
2 si es semitabular, 3 si es tabular y 4 si es gráfica.

 Información numérica muy escasa

 Se separa del texto con pocos datos

 Las cifras vienen a apoyar las argumentaciones

 No precisa aclaraciones textuales

 Se usan en publicaciones censales

 La información viene expuesta por medio de dibujos y figuras

7) Los siguientes datos corresponden al PARTIDO POLÍTICO PREFERIDO de 30


estudiantes de octavo año del Colegio XYZ en la provincia de Alajuela. La
investigación realizada fue por el Comité de Actividades Curriculares del
colegio en junio del 2012.
PLN PLN PLN PLN PLN PLN PLN PLN PLN PLN
PLN PAC PAC PAC PAC PAC PAC PAC PAC PUSC
PL PL PL PL PAC PAC PAC PAC PAC PUSC

PLN: Partido Liberación Nacional


PAC: Partido Acción Ciudadana
PUSC: Partido Unión Social Cristiana
PL: Partido Libertario
Conteste lo que se le solicita:

52 | P á g i n a
A) Haga un cuadro de presentación para resumir la información. Incluya
cantidad.
B) Hacer un gráfico adecuado para presentar la información. Tome en cuenta
el tipo de variable, para la selección correcta del tipo de gráfico

NOTA: “¿Qué es razón y qué Proporción?

 Razón: es un cociente, donde el numerador NO está incluido en


el denominador.
 Proporción: es una razón, donde el numerador SI está incluido
en el denominador.
Ejemplo:
Total de No leen Leen 260 libros Leen 3 o
encuestados 1 libro al año 2 libros al año más libros al
año
500 240 100 90 70

 Proporción: . Interpretación: el 20% de los


encuestados leen 1 libro al año.

 Razón: . Interpretación: por cada persona


que lee un libro al año, hay dos personas que NO leen (“interpreta de
abajo hacia arriba”).

53 | P á g i n a
Distribuciones de Frecuencias

De acuerdo con lo visto anteriormente, podríamos afirmar que la estadística


trabaja con números, que representan ciertas características de objetos, personas
o cosas. Los datos pueden presentarse de dos formas:
 Serie de datos sin agrupar: cuando el conjunto de datos es reducido,
tanto, que se pueden presentar en detalle (uno a uno). Se ordenan de
menor a mayor, para apreciar rápidamente las características de dichos
datos (si varían mucho o si son homogéneos).
 Serie de datos agrupados: cuando los datos son muy numerosos y la
presentación y análisis no es simple, para este tipo de datos se debe
agrupar en clases o categorías que sean exhaustivas y mutuamente
excluyentes, es decir, que no exista alguna posibilidad que algún dato
no corresponda a ninguna clase o de que pueda quedar incluido en más
de una clase. Estos arreglos son los que se denominan Distribuciones
de Frecuencias.

Las distribuciones de frecuencias representan entonces una de las técnicas para


lograr resumir la información (de datos agrupados) recolectada y obtener mejores
resultados para la interpretación de los datos. Son clasificaciones u ordenaciones
que se refieren a las variables, ya sean cuantitativas o cualitativas, y que
constituyen un instrumento muy útil en el trabajo estadístico; ya que en el análisis
e interpretación de los datos correspondientes a variables continuas o discretas
resulta muy valioso tener información acerca de tres aspectos:
 La forma o patrón de la distribución de los datos (simétrica, sesgada).
 La posición de la distribución, es decir, alrededor de qué valor se tienden a
concentrar los datos (valores centrales).
 La dispersión o variabilidad de los datos alrededor de los valores centrales
o promedios.

54 | P á g i n a
Existen diferentes tipos de escalas para realizar una distribución de frecuencias
y dependen del tipo de datos con que se trabaje. Si se trabaja con atributos, se
utiliza la escala nominal, algunas características con escala ordinal, pero en
ambas escalas, las categorías no corresponden a ninguna escala de medición,
sino a razones propias de presentación, por ejemplo:

ESCALA NOMINAL ESCALA ORDINAL


Cuadro No.1 Cuadro No. 2
DISTRIBUCIÓN DE EMPLEADOS DE LA DISTRIBUCIÓN DE EMPLEADOS DE LA
EMPRESA XXX SEGÚN EL EMPRESA XXX SEGÚN EL NIVEL
DEPARTAMENTO AL QUE PERTENECE. OCUPACIONAL

Departamento Número de Empleados Nivel Ocupacional Número de Empleados


Producción 600 1 100
Finanzas 125 2 200
Mercadeo 425 3 525

Y por último, la escala de intervalos para variables discretas y continuas, para las
primeras, su estudio por lo general resulta de muy fácil construcción, para las
segundas podrían presentarse algunos otros problemas o dificultades.

Distribuciones de Frecuencias de Variables Discretas: la construcción para las


variables discretas es más sencilla, se podrían incluso obtener los diferentes tipos
de frecuencias, pues con los datos y el recuento de las mismas se completa dicha
información de forma cómoda y eficiente, para finalmente representarse por medio
de gráficos de barras verticales. Algunos conceptos básicos para la construcción
de distribuciones de frecuencias para variables discretas son:

A) Frecuencias Absolutas: Es el número de veces que aparece un dato.


Esta columna debe sumar el número total de observaciones.

55 | P á g i n a
B) Frecuencias Relativas: es el cociente entre la frecuencia absoluta de
cada categoría entre el total de observaciones. Se indica en porcentajes
y representa la importancia relativa de cada dato estadístico.

C) Frecuencias Acumuladas: puede hacerse sumándose hacia abajo para


obtener una distribución acumulada “menos de” o hacia arriba para
obtener una distribución acumulada “más de”.

En la frecuencia “menos de” (de arriba hacia abajo): se toma el primer


dato igual al 1o de las frecuencias absolutas, en la segunda fila se toma
el valor anterior y se suma el 2o de las frecuencias absolutas, en la tercer
fila se toma el valor anterior y se suma el 3o de las frecuencias absolutas
y así sucesivamente hasta llegar al total de las frecuencias absolutas.
Mientras que la “más de” (de abajo hacia arriba): se toma el total las
frecuencias absolutas, en la segunda fila se toma el valor anterior y se le
resta el 1o valor de las frecuencias absolutas, para la tercer fila se toma
el anterior y se le resta el 2o de las frecuencias absolutas y así
sucesivamente hasta llegar a un valor igual al último de las frecuencias
absolutas. Ejemplo:

Número Frecuencia Frecuencia Frecuencia Acumulada Frecuencia Acumulada


de Absoluta Relativa “menos de” “más de”
Hermanos Absoluta Relativa Absolut Relativa
a
1 2 2 25
2 3
3 4
4 8
5 3
6 1
7 2
8 2 25 2
TOTAL 25 1.00

56 | P á g i n a
Interpretación:

 De acuerdo con los datos recolectados, el número de hermanos que presenta


mayor frecuencia es el ______, con un porcentaje del______de la población
total estudiada.

 El número de empleados que tienen de 1 a 5 hermanos son______, quienes


representan el ________ por ciento de la población estudiada.

 _________ empleados tienen 6 o más hermanos, que representan el _______,


de los 25 empleados estudiados.

Distribuciones de Frecuencias de Variables Continuas: para las variables


continuas se deben tomar en cuenta diferentes aspectos como: número de clase,
amplitud, entre otros, pues su construcción no es tan sencilla como en las
variables discretas.

Existen algunas reglas generales para construir distribuciones de frecuencias:


1. Recopilar los datos
2. Ordenar los datos de menor a mayor
3. Especificar el número de clases
4. Calcular el tamaño exacto del ancho de la clase
5. Determinar el tamaño ajustado del ancho de clase.
6. Identificar los límites de clase
7. Conteo de los datos

A continuación, se presentará algunos conceptos básicos que son necesarios e


indispensables para la construcción de distribuciones de frecuencias de variables
continuas:

57 | P á g i n a
A) Regla de redondeo: se utilizará la regla de redondeo usual, es decir, “a la
unidad más próxima”, que indica lo siguiente:

 Si el primer dígito de la parte del número que va a ser eliminada en el


redondeo es menor que cinco, el dígito precedente permanece sin cambio.

Ejemplo: → →

 Si el primer dígito de la parte del número que va a ser eliminada en el


redondeo es exactamente cinco, el dígito precedente se aumenta en una
unidad si es impar y se deja sin cambio si es par. Recuerde que el cero es

un número par. Ejemplo: → → →

 Si el primer dígito de la parte del número que va a ser eliminada en el


redondeo es mayor que cinco, el dígito precedente se incrementa en una

unidad. Ejemplo: →

B) Clases Son las categorías utilizadas cuando se trabaja con variables


cualitativas. Cuando se trata de variables cuantitativas las clases son intervalos
o valores discretos.

Al agrupar los datos los dividimos en clases o categorías, si es posible todas


del mismo tamaño. Se debe utilizar más de cinco y menos de 15 clases, y
éstas dependen del número total de observaciones. Debe evitarse las clases
de diferente amplitud y también las clases abiertas (pues estas no permiten el
cálculo del punto medio, ni de intervalos de clase y obligan a optar
procedimientos parciales). Además, se prefiere por comodidad y sencillez que
el intervalo de clase sea cinco, diez o un múltiplo de ellos.

58 | P á g i n a
C) Límites de clase: Son los valores que definen una clase (cuando éstas son
intervalos) separándola de la anterior y de la posterior. Deben ser tales que
permitan definir clases exhaustivas (clasificar a todas las observaciones en
alguna de ellas) y mutuamente excluyentes (no permitan que una observación
quede incluida en más de una clase).

Para definir el límite inferior de la primera clase se considera el dato menor del
conjunto de observaciones y se escoge un valor más pequeño a éste.

D) Amplitud general, rango o recorrido: Es la diferencia entre el dato mayor y el


dato menor del conjunto de observaciones.

E) Intervalo de clase, tamaño de la clase o ancho de la clase: este representa


el tamaño de la clase. Se obtiene como el cociente entre la amplitud general y
el número de clases. Como se mencionó antes, se prefiere, por comodidad,
que el intervalo de clase sea cinco, diez, o un múltiplo de ellos.

F) Punto medio: Es el promedio entre el límite inferior y superior de la clase. Si


se trabaja con valores discretos en las clases (no hay intervalos) entonces no
se coloca el punto medio.

G) Frecuencia absoluta: Es el número de veces que aparece un dato. Esta


columna debe sumar el número total de observaciones.

H) Frecuencia relativa: Son los cocientes entre las frecuencias absolutas de


cada clase y el número total de datos. Son proporciones y por lo tanto esta
columna debe sumar uno.

59 | P á g i n a
I) Porcentajes: Las frecuencias relativas multiplicadas por cien. Esta columna
debe sumar 100%.

J) Frecuencias acumuladas: Hay de dos tipos: “más de” y “menos de”. Se


obtienen realizando la suma de cada una de las frecuencias (absolutas o
relativas) con las precedentes o con las sucesivas utilizando los límites
inferiores ó superiores de cada clase, (esto depende del tipo de frecuencias
acumuladas que se desee). Para la frecuencia acumulada “menos de” se
suman las frecuencias absolutas (o relativas) con las precedentes usando los
límites superiores de cada clase. En la frecuencia acumulada “más de” se
suman las frecuencias absolutas (o relativas) con las sucesivas usando los
límites inferiores.

NOTA: En la primera parte de este curso, utilizaremos el redondeo a un decimal


(excepto cuando se indique lo contrario). Esto es recomendable principalmente en
la construcción de tablas y gráficas, con el fin de que éstos no se observen muy
recargados de valores que distorsionen la atención del lector.

Ejemplo: Los siguientes datos corresponden a los montos de los créditos


otorgados por un Banco Comercial a 45 ganaderos de la provincia de Guanacaste
en el año 1970, los montos están dados en miles de colones:

63 73 60 47 62 55 79 37 70
88 56 84 71 91 77 97 83 68
35 47 68 25 65 91 75 43 71
82 57 62 51 58 67 51 56 66
30 93 53 64 48 62 44 64 50

60 | P á g i n a
A) El primer paso es ordenar los datos:

25 44 51 56 62 65 70 77 84
30 47 51 57 62 66 71 79 88
35 47 53 58 63 67 71 81 91
37 48 55 60 64 68 73 82 93
43 50 56 62 64 68 75 83 97

B) Amplitud General:

C) Intervalo de la clase o Tamaño de cada clase: .


Observando los resultados, ¿Cuál es el tamaño más apropiado?

D) Límites: Cuenta de las Límite inferior y Límites Reales:


clases superior ó


61 | P á g i n a
E) Finalmente, tenemos que:

Cuadro No. 4
CLASIFICACIÓN DE LOS CRÉDITOS OTORGADOS POR UN BANCO COMERCIAL A 45 GANADEROS DE LA PROVINCIA DE
GUANACASTE
AÑO 1990
(En miles de colones)

CLASES Frecuencia Frecuencia Acumulada Puntos Medios Frecuencia Relativa


absoluta “menos de” “más de”
2 2 45 29,5
4
7
12
9
7
3
1
TOTAL 45 100.0

62 | P á g i n a
Algunas Interpretaciones:

 12 ganaderos recibieron créditos entre__54 500_______ y __64 500______

 El número 2 en la frecuencia “menos de” indica que: 2 ganaderos recibieron


“menos de”__34 500____ en créditos.

 El número 32 en la frecuencia “más de” indica que: 32 ganaderos recibieron


“más de”__54 500____ en créditos.

 El número 26,6 de la frecuencia relativa, indica que el 26,6% de los ganaderos


recibieron créditos entre __54 500______y______64 500________

NOTA: cuando los límites se dan con un decimal como en este caso, no hay
ningún problema en trabajar con los límites, pues no se comete ningún error en
considerar los límites indicados como reales.
Representación gráfica de las distribuciones de frecuencias

1. Para variables discretas: Se utilizan las gráficas de bastones o de barras


verticales.

2. Para variables continuas: Se utilizan básicamente tres tipos de gráficos para


representar las distribuciones de frecuencias para este tipo de variables:
histogramas, polígonos de frecuencia y ojivas.

Todas las gráficas deben contener los elementos básicos (numeración, título
completo, dimensiones adecuadas (se recomienda la relación 1,5:1 entre el
largo y el ancho del rectángulo), fuente, colores adecuados, etc).

 Histograma: es un gráfico de barras verticales en el cual las barras no


guardan separación entre sí. Se utiliza para representar frecuencias no
acumuladas ya sean absolutas o relativas. Se define una escala
horizontal apropiada y en ella se marcan los límites reales de todas las
clases de la distribución que se quiere representar. La escala no
necesita empezar en cero, pero sí en un intervalo de clase antes del
límite inferior de la primera clase y terminar en uno después de la última
clase. Las frecuencias de los datos se representan en la escala vertical,
la cual debe empezar en cero y No debe tener cortes.

63 | P á g i n a
Fuente: http://www.estadistica.ucr.ac.cr/cdmmora/pages/cuadrosygraficos/grafico22.png

 Polígono de frecuencias: es una forma comparativa de representar las


distribuciones de frecuencias. Se utiliza para representar frecuencias no
acumuladas ya sean absolutas o relativas. Se construye tomando como
abscisa (eje “x”) el punto medio de cada clase y como ordenada (eje “y”)
la frecuencia de dicha clase, se marcan los pares ordenados y se unen
con segmentos de línea recta. El área bajo el polígono debe ser igual al
área comprendida bajo el histograma, para ello, se prolonga el polígono,
una clase más y una menos de las definidas originalmente.

64 | P á g i n a
Fuente:
http://www.estadistica.ucr.ac.cr/cdmmora/pages/cuadrosygraficos/grafico25.pn

 Ojivas: Representan un caso particular de los polígonos de frecuencias


con la diferencia que estas se utilizan para representar frecuencias
acumuladas ya sean del tipo “más de” o “menos de”. Su construcción es
similar a la de los polígonos de frecuencia con la diferencia que no se
usan los puntos medios de las clases sino los límites superiores de cada
clase (si se quiere la ojiva “menos de”) o los límites inferiores de cada
clase (si se quiere la ojiva “más de”).

Una observación importante es que la ordenada (eje “y”)


correspondiente al límite inferior de la primera clase es cero para el caso
de la ojiva “menos de” y la ordenada correspondiente al límite superior
de la última clase es uno, para la ojiva del tipo “más de” la ordenada
correspondiente al límite inferior de la primera clase es uno y la
ordenada correspondiente al límite superior de la última clase es cero.

65 | P á g i n a
Fuente:
http://www.estadistica.ucr.ac.cr/cdmmora/pages/cuadrosygraficos/grafico27.png

Ejercicios

1. Se han recolectado los siguientes datos:

 Determine las distribuciones de frecuencias

2. Se estudia un total de 3541 trabajadores de una cadena de tiendas XY, a


quienes se les preguntó, entre otras cosas, su salario mensual en colones.

Los resultados de menor a mayor salario, son los siguientes:

66 | P á g i n a
Tabla de frecuencias:
Salario Mensual Número Frecuencia Frecuencia
(colones) Entrevistados Relativa acumulada
Clase
“menos de”

TOTAL

 ¿Cuántos Trabajadores tienen un salario inferior a ?

 ¿Dónde se concentran la mayor cantidad de los salarios? ¿Qué


porcentaje representan?

3. Los siguientes datos se refieren a esos en kilogramos de 40 estudiantes de


un colegio, y que se presentan en el orden en que fueron pesados los
alumnos:
49 60 46 37 54
43 59 40 62 47
46 52 55 41 66
45 36 50 51 48
42 53 53 68 56
35 74 43 47 60
51 67 40 70 49
41 46 32 57 43

67 | P á g i n a
 Determine las distribuciones de frecuencias.

4. Considere el cuadro:
UNIVERSIDAD NACIONAL. ESTUDIANTES DE LA CARRERA DE INGENIERÍA INFORMÁTICA
SEGÚN NÚMERO DE MATERIAS MATRICULADAS.
I TRIMESTRE AÑO 2004
Materias Frecuencia Frecuencia Acumulada menos de Acumulada más de
Matriculadas absoluta relativa Absoluta Relativa Absoluta Relativa
2 4 20 4 20 20 100
3 9 45 13 65 16 80
4 5 25 18 90 7 35
5 2 10 20 100 2 10
Total 20 100,0

Responda:
 ¿Cuántos estudiantes matricularon menos de 3 materias durante el I
trimestre del año 2004?
R/ _______________________
 ¿Qué porcentaje de estudiantes matricularon más de 3 materias durante el I
trimestre del año 2004?
R/ _______________________

5. Diga qué tipo de frecuencias (absoluta, relativa, absoluta acumulada “más


de”, etc) se ha utilizado para hacer cada una de las siguientes afirmaciones:

 Un 26% de los estudiantes tiene notas entre 65 y 70.


_____________________

 Un 40% de los estudiantes tienen notas inferiores a 80.


______________________

68 | P á g i n a
 29 obtuvieron una nota mayor o igual a 70.
______________________

 3 alumnos obtuvieron notas entre 85 y 90.


______________________

 un 40% de los alumnos obtuvieron notas menores a 70.


_____________________

6. Una marca de perfume para mujer para evaluar la aceptación de una de


fragancias aplica una cuesta a 40 damas, donde estas lo califican en escala
a uno a cien. Los datos obtenidos son los siguientes:

68 73 61 66 96 79 65 86 84 79
65 78 78 62 80 67 75 88 75 82
89 67 73 74 82 73 87 75 61 97
57 81 68 60 74 94 75 78 88 72

 Agrupe los datos en clases de amplitud 5 y construya una tabla de


distribución de frecuencias acumuladas.

 Acorde con la información que suministró la distribución de frecuencias


construida, conteste las siguientes preguntas:

 ¿Cuántas damas otorgaron una calificación mayor a 75?


R/ _____________________
 ¿Cuántas damas otorgaron una calificación menor a 85?
R/ _____________________
 ¿Cuántas damas otorgaron una calificación mayor o igual a 80?
R/ _____________________

69 | P á g i n a
 ¿Qué porcentaje de mujeres otorgaron una calificación mayor o igual a
75 pero menor a 90?
R/ _______________________
 ¿Qué porcentaje de mujeres otorgaron una calificación menor a 80?
R/ ______________________
 ¿Qué porcentaje de mujeres otorgaron una calificación mayor o igual a
90? R/ _______________________

7. Complete con la información numérica que corresponda.


Dato Frecuencia Frecuencia Acumulada menos de Acumulada más de
Absoluta Relativa Absoluta Relativa Absoluta Relativa
5
6 4
7 0,20
8 17
9 9
10 4
Total 30 1

70 | P á g i n a
Unidad

UNIDAD III: MEDIDAS DE


POSICIÓN Y VARIABILIDAD

71 | P á g i n a
El Símbolo de la Sumatoria

En nuestro caso, la sumatoria es el símbolo matemático que simplifica las


fórmulas estadísticas. Nos permite representar sumas muy grandes,
de sumandos o incluso sumas infinitas y se expresa con la letra griega sigma: .
Se define como:

El símbolo ∑ se lee: “La sumatoria de equis sub-i, desde i igual a 1 hasta n”.
Dónde:

El índice “i” toma valores enteros consecutivos desde 1 hasta n. los números o
letras que aparecen debajo y encima de indican la extensión de la sumatoria.

Si ∑ aparece delante de una variable o expresión con subíndice “i”, esto


indica que deben sumarse todos los valores particulares de la variable que se
originan al darle al subíndice “i” los valores enteros . Por ejemplo:

A) ∑
B) ∑

Medidas de Tendencia Central

En el capítulo anterior, estudiamos las distribuciones de frecuencias, notando en


estas, la importancia que tiene contar con elementos descriptivos, sin embargo, si
observamos las distribuciones de frecuencias poseen valores que tienden a
concentrarse alrededor de un sector, para estudiar esto y determinar criterios para
representar con un valor o categoría de la distribución esa tendencia de las
observaciones se utiliza la Tendencia Central.

72 | P á g i n a
Son también llamadas "medidas de posición'. Las medidas de tendencia central
son valores numéricos que quieren mostrar el centro de un conjunto de datos. Si
los datos son una muestra, la media(o promedio) y la mediana se llamarán
estadígrafos o estimadores. Si los datos son una población entonces estas
medidas de tendencia central se llamarán parámetros.

Medidas de tendencia Central para datos no agrupados o


agrupados discretos

1. Moda: La moda es el valor que más se repite en el conjunto de datos, es decir


el que tiene mayor frecuencia absoluta, se utiliza tanto para datos cualitativos
como cuantitativos. En un grupo de observaciones puede ser que no exista
moda o que haya más de una moda. Se debe tener cuidado con su
interpretación, debido a que el concepto de valor que más se repite o de mayor
frecuencia, no significa que la mayoría de las observaciones tome ese valor,
pues la mayoría representa más de la mitad, pero el valor modal no siempre
incluye más de la mitad de los datos. La moda la representaremos con .

Ejemplo 1: Calcule e interprete la moda del siguiente conjunto de datos que


corresponden a la nota de 20 estudiantes del curso de Estadística Descriptiva
de la UTN:

 Respuesta:

 Interpretación: La nota más frecuente del curso de Estadística Descriptiva


de los 20 estudiantes de la UTN es 70.

73 | P á g i n a
Ejemplo 2: Indique cuál es la moda de los siguientes conjuntos de datos.

 { }: No tiene
 { }: la moda es 4 y 7
 { }: la moda es 9

2. Mediana: La mediana de un conjunto de n observaciones ordenadas de menor


a mayor, es un valor tal que la mitad de las observaciones son menores o
iguales que tal valor y la otra mitad de las observaciones son mayores o
iguales que ese valor. La mediana puede estar o no estar en el conjunto de
datos.

Dónde:

Nota: En la mediana no interesa tanto el valor numérico de las observaciones sino


la posición de las mismas en el eje de las abscisas (eje “x”). Es un valor para el
cual no más de la mitad de los datos son menores que ella y no más de la mitad
son mayores que ella, por esto se dice que esta medida estadística se ubica en el
centro de la distribución de los datos.

Ejemplo 1: Encuentre la mediana del número de niños por hogar en la muestra de


10 hogares.

 Paso 1: “ordenar”:

74 | P á g i n a
 Interpretación: La no está en el grupo de datos, sin embargo, es el

número central que representa a la mediana

Ejemplo 2: Calcule e interprete la mediana del siguiente conjunto de datos


correspondiente a la cantidad de libros que tienen 5 estudiantes de un curso de
Estadística Descriptiva.

 Paso 1: ordenar:

 Interpretación: el 50% de los estudiantes tienen menos de 9 libros.

3. Media Aritmética o Promedio Simple: El promedio se define como el punto de


equilibrio. Es el resultado de dividir la suma de los valores de una serie de
datos, entre el número total de ellos.
Muestra Población

∑ ∑
̅

Dónde:


Propiedades de la Media Aritmética:

A. ̅ ∑
B. ∑ ̅

75 | P á g i n a
Ejemplo: Calcule e interprete el promedio del siguiente conjunto de datos que
corresponde a la edad de 25 estudiantes de un curso de Estadística Descriptiva:

19 19 19 19 19
19 21 18 18 19
23 18 19 22 20
18 20 27 24 18
20 22 18 21 21


̅

Interpretación: La edad promedio del grupo de 25 estudiantes del curso de


Estadística Descriptiva es 20,04 años.

4. Media aritmética ponderada: Este promedio se utiliza cuando los datos se


presentan con cierta frecuencia o ponderación. Simbólicamente:


̅

Dónde:


Nota: El promedio ponderado se interpreta de la misma manera que una media


simple. Por otro lado, Cuando se pide determinar un promedio, en distribuciones
de frecuencias, se debe prestar atención a que cada uno de los datos, dentro de
una misma categoría o clase, tenga el mismo valor (o peso relativo), pues suele
ocurrir que las observaciones tienen diferentes pesos o ponderaciones. Por
ejemplo, al obtener la nota promedio de un curso, las diferentes evaluaciones

76 | P á g i n a
tienen diferentes ponderaciones, por lo que el promedio debe ser ponderado y no
un promedio simple.

Ejemplo 1: La evaluación de un curso de Estadística Descriptiva, está distribuida


como sigue: 10% pruebas cortas, 20% tareas y 70% pruebas parciales. Al final del
curso un estudiante obtuvo las siguientes notas: 85 en tareas, 81 en pruebas
cortas y 91 en exámenes. Calcule e interprete la nota promedio de este
estudiante.

Pruebas Cortas: 10%


Tareas: 20%
Pruebas Parciales: 70%
Total 100%

Ejemplo 2: Si el examen final de un curso de Estadística Descriptiva vale tres


veces una evaluación parcial y un estudiante del curso obtiene las siguientes
calificaciones: 85 en el examen final, 70 y 90 en las pruebas parciales. Calcule e
interprete la nota promedio del estudiante.

Por tanto cada examen parcial tiene un valor de 20% y el examen final un 60%

I Prueba: 20%
II Prueba: 20%
Prueba Final: 60%
Total 100%

77 | P á g i n a
Ejercicios

1. Calcule la moda, mediana y media aritmética de los siguientes grupos de datos e


interprete la información obtenida.

A. Calificaciones en el área de español de los estudiantes de la Escuela “María


José”.

82 74 88 66 58 74 78

87 96 76 62 68 72 92

86 76 52 76 82

B. Número de faltas cometidas por equipo durante la sexta fecha del


campeonato nacional de fútbol.

10 13 8 7 14 13 8 6 5 11 8 9

C. Edades de un grupo de personas

78 | P á g i n a
2. Cantidad de ausencias injustificadas en un mes de los estudiantes de un grupo de
octavo año y un grupo de noveno año.

Ausencias Cantidad de Ausencias Cantidad de


alumnos de alumnos de
8vo 9no

0 10 0 9

1 15 3 12

2 8 4 11

3 4 5 3

4 1 7 4

5 2 9 1

 ¿Qué puede concluirse al comparar los promedios de ausencias de los dos


grupos?

3. La medida de posición que se toma en cuenta, en mejor forma, el valor típico o


que más se repite en un conjunto se denomina: _______________________.

4. Los datos que se presentan a continuación, corresponden a notas de


aprovechamiento de un grupo de 30 estudiantes de un curso de verano de
Administración, en la Universidad de Costa Rica:

79 | P á g i n a
A. Calcule la media aritmética utilizando la definición de promedio simple

5. Para los siguientes conjuntos de datos sin agrupar, calcule: la moda, mediana
y la media aritmética simple:

6. El gerente de una planta hidroeléctrica cuenta con 10 generadores en su


sistema. Necesita algunas medidas del tiempo que éstos están fuera de
servicio a un mantenimiento insatisfactorio o fallas. Esta información le
permitirá planear las necesidades de personal, programar el mantenimiento y
organizar el servicio de respaldo. La siguiente tabla contiene datos de cada
generador en el último año.

Generador A B C D E F G H I J

Días Fuera de Servicio 7 23 4 8 2 12 6 13 9 4

Obtenga un promedio de días que, durante ese año, los generadores de la planta
estuvieron fuera de servicio.

Solución:

El problema dice que la planta hidroeléctrica cuenta con 10 generadores, por lo


que, este número 10 es la _____________________ (población/muestra). La
fórmula a utilizar será:

80 | P á g i n a
Los datos del problema son:

Su solución es:

81 | P á g i n a
Medidas de tendencia central para datos agrupados continuos

A) Moda : En el caso de datos agrupados hay que ubicar la clase modal, es


decir, la clase donde aparece la mayor frecuencia. Luego se usa la
siguiente fórmula:
 d1 
Mo  Li  c  
 d1  d2 
con y





Nota: la clase modal es la que presenta mayor frecuencia en la distribución.

B) Mediana : Es el valor tal que su frecuencia acumulada “menos de”

absoluta es . Es decir, el valor que divide a la distribución en dos partes

iguales. Para calcularla primero hay que hallar el valor . Luego se ubica,

utilizando la frecuencia acumulada “menos de” absoluta, el número de la clase


en la cual se ha acumulado dicho valor. Finalmente, se aplica la fórmula:

( )



 :

82 | P á g i n a
NOTA: Para determinar la clase donde está la mediana, primero se utiliza la

fórmula , donde “n” es el número total de observaciones o la suma de las

frecuencias absolutas y se busca, de acuerdo a las frecuencias acumuladas


“menos de”, la clase en la cual se encuentra el dato (posición) que se encontró
con la fórmula anterior.

C) Media aritmética ponderada: En los datos agrupados resulta de mucha utilidad


el concepto de promedio ponderado. En una distribución de frecuencias se
conoce el número de observaciones que hay dentro de una clase pero no se
sabe cuál es el valor exacto de ellas. Por eso se dificulta el cálculo de la media
aritmética simple. Es por ello que para calcular esta medida se supone que el
valor de las observaciones se distribuye uniformemente dentro de la clase, esto
equivale a decir que el punto medio de la clase es el valor exacto de cada
observación. Para calcular el promedio se utiliza la fórmula:

Para la Población Para la Muestra

∑ ∑
̅

Dónde:

 i



 i

83 | P á g i n a
Ejemplo: Calcule las tres medidas de tendencia central para la siguiente
distribución de las comisiones en ventas obtenidas por 32 empleados de un
almacén.

Clase xi fi xi fi xi 2 xi 2fi

(dólares)

12

14

27

58

72

63

36

18

TOTAL 300

xi fi
Simbología: = punto medio = frecuencia absoluta

xi fi = producto de multiplicar el punto medio por la frecuencia absoluta

xi 2 = punto medio al cuadrado

xi 2fi =producto de multiplicar el punto medio al cuadrado por la frecuencia absoluta

Práctica: De la unidad anterior, determine las tres medidas de tendencia central


del ejercicio 1, 2, 3 y 6 (de las páginas: 68, 69 y 70).

84 | P á g i n a
Resumen de las Fórmulas:

MODA:
Datos agrupados continuos
 d1 
Mo  Li  c  
 d1  d2 
con y




Mediana:
Datos no agrupados o agrupados Datos agrupados continuos
discretos

( )

Dónde:

85 | P á g i n a
Media Aritmética Simple:

Datos No Agrupados Datos Agrupados

Para la Población: Para la Población:

∑ ∑

Para la Muestra Para la Muestra

∑ ∑
̅ ̅

Dónde:

 i



 i

Media aritmética ponderada:



̅

Dónde:


86 | P á g i n a
Clases xi fi xi fi

TOTAL

Simbología:

xi = punto medio fi = frecuencia absoluta

xi fi = producto de multiplicar el punto medio por la frecuencia absoluta

87 | P á g i n a
Otras medidas:
La media geométrica y la media armónica que se presentarán a continuación, son
dos medidas de posición que se usan con frecuencia en ciertos campos de la
estadística aplicada. Por ejemplo, en la media geométrica podemos determinar el
incremento en el porcentaje promedio en ventas, producción u otras actividades
económicas de un periodo dado, mientras que en la media armónica, se
promedian variaciones respecto al tiempo.

Media Geométrica
Si se tienen valores de una variable: la media geométrica es la
raíz del producto de esos valores. Simbólicamente:

̅ √

Ejemplo 1: obtenga la media geométrica de los números

Ejemplo 2: hallar la media geométrica de los números

88 | P á g i n a
Ejemplo 3: supóngase que las utilidades obtenidas por una compañía constructora
en cuatro proyectos fueron 3, 2, 4, y 6 respectivamente. ¿Cuál es la media
geométrica de las ganancias?

Media Armónica
Si se tiene un conjunto de valores: la media armónica, se
define como el recíproco de la media aritmética de los recíprocos de los valores.
Simbólicamente:

Ejemplo 1: Hallar la media armónica de los siguientes números:

Ejemplo 2: calcular la media armónica de los siguientes valores:

89 | P á g i n a
Ejemplo 3: Consideremos un caso en que sea promediar la velocidad: un hombre
viajó kilómetros a ⁄ , otros kilómetros a ⁄ y finalmente

kilómetros más a ⁄ . ¿Cuál es la velocidad promedio para los 600


kilómetros recorridos?

Nota: las tres medidas estudiadas: media aritmética, media geométrica y media
armónica, tienen una relación de orden:
̅ ̅ ̅
Las tres medias tendrán el mismo valor únicamente cuando todos los números de
las serie sean idénticos.

Medidas de Posición

Son medidas de posición tales que superan a no más de cierta proporción de las
observaciones y simultáneamente quedan superadas por no más de la proporción
complementaria cuando las observaciones han sido ordenadas de acuerdo con su
magnitud, de menor a mayor. Entre estas medidas están: los cuartiles, deciles y
percentiles.

90 | P á g i n a
Los Percentiles:

Dividen al conjunto de datos en 100 partes iguales que representan cada una el
1% de los valores. Por ejemplo, el Percentil 90 es un valor tal que el 90% de todos
los valores son menores y el 10% son mayores que él.

A) Para datos No agrupados o agrupados discretos: El percentil toma el valor


intermedio entre dos observaciones o el de una de ellas según sea divisible o
no por cien. Para denotar a cualquier percentil se usa el símbolo con

Para hallar un percentil en datos no agrupados, ordenados de acuerdo con su


magnitud, de menor a mayor, se utiliza lo siguiente:

Interpretación: quiere decir que de las observaciones son menores o


iguales que el valor que resulte de y que de las observaciones
son mayores o iguales que ese valor.

Ejemplo 1: Calcule e interprete el percentil 77 del conjunto de datos


correspondiente al peso, en kilogramos, de 40 estudiantes de un curso de
Estadística Descriptiva de la UTN.

32 35 36 37 40 40 41 41 42 43

43 44 45 45 46 46 47 47 48 49

49 50 51 51 52 53 53 54 55 56

91 | P á g i n a
57 59 60 60 62 66 67 68 70 74

Ejemplo 2: Calcule e interprete el percentil 77 del conjunto de datos


correspondiente al peso, en kilogramos, de 38 estudiantes de un curso X.

36 37 40 40 41 41 42 43 43 44

45 45 46 46 47 47 48 49 49 50

51 51 52 53 53 54 55 56 57 59

60 60 62 66 67 68 70 74

92 | P á g i n a
Ejemplo 3: Calcule e interprete el percentil 77 del conjunto de datos siguiente
correspondiente al número de cursos matriculados, por 10 estudiantes de la UTN.

B) Para datos agrupados continuos: La clase es la que cumple que

Dónde:

93 | P á g i n a
Ejemplo 1: calcular el percentil 72 del peso de los 40 estudiantes:

Clases Frecuencia Absoluta: Frecuencia Acumulada

1 1

3 4

8 12

9 21

7 28

4 32

3 35

3 38

2 40

∑ 40

94 | P á g i n a
Los Cuartiles:

Son casos particulares de los percentiles y se define en forma análoga a la de los


percentiles. Los cuartiles dividen al conjunto de datos en cuatro partes iguales, y
solo existen tres de ellos:

 El cuartil 1:
 El cuartil 2:
 El cuartil 3:

El primer cuartil es el valor tal que por debajo de él queda no más de la cuarta
parte de todas las observaciones del conjunto, el segundo cuartil es la
mediana, y el tercer cuartil es el valor tal que por debajo de él queda no más de
las tres cuartas partes de las observaciones.

Para un conjunto de datos sin agrupar, un cuartil toma el valor de una observación
o bien un valor intermedio entre dos observaciones. Para determinar la mediana y
los otros cuartiles, los datos deben estar ordenados de menor a mayor.

La forma de calcular los cuartiles es por medio de los percentiles con las
siguientes igualdades:
 =
 =
 =

Los Deciles:

Son casos particulares de los percentiles y se define en en forma análoga a la de


los percentiles. Los deciles dividen al conjunto de datos en diez partes iguales, y
solo existen nueve de ellos.

95 | P á g i n a
La forma de calcular los deciles al igual es los cuartiles es por medio de los
percentiles con las siguientes igualdades:


Medidas de Variabilidad o Dispersión

Las medidas de posición en un conjunto de datos permiten describir mediante uno


o pocos valores el comportamiento de la distribución, sin embargo, resulta
importante preguntarse: ¿cuándo es que una medida de posición representa
adecuadamente al conjunto de observaciones? Y esto sucederá cuando las
observaciones estén cerca de la medida de posición buscada, pues así todos los
datos se parecerán mucho a la misma. Por tal motivo, es vital estudiar la
variabilidad o la dispersión de los datos pues esto nos permitirá, entre otras cosas,
juzgar la confiabilidad de nuestra medida de tendencia central.

Es la diferencia o grado de semejanza que existe entre los valores que toma la
variable de estudio. Así, un conjunto que tenga mucha variabilidad es un conjunto
que sus datos son muy distintos, mientras que si es baja variabilidad, sus datos
son muy similares

Existen varias medidas de variabilidad entre ellas: el recorrido o rango, La


desviación media, la varianza, la desviación estándar y el coeficiente de variación.
A continuación se describen las características de cada una de estas medidas:

96 | P á g i n a
Rango o Recorrido: el rango lo representamos con: .

 Datos no agrupados en tablas

Dónde:


 Datos agrupados en tablas

Dónde:


La desviación media:

∑ | ̅|

Ejemplo 1: Calcule la desviación media para los siguientes datos: .

97 | P á g i n a
Varianza y desviación estándar: Para determinar la varianza y la desviación
estándar se utilizan las siguientes fórmulas:

 Para datos sin agrupar:

Población Muestra

∑ ̅ ∑ ̅


√ Dónde:

Dónde:

98 | P á g i n a
 Para datos agrupados:

Población Muestra

∑ ∑ ̅

√ Dónde:

Dónde:

Nota: de lo anterior, tenemos que la desviación estándar de es


√ y representa “que tanto” se desvían los datos respecto al promedio

99 | P á g i n a
Ejemplo para datos NO AGRUPADOS: la siguiente tabla presenta el ingreso
mensual de la muestra de familias de cierta región (las cantidades están en
dólares). Calcule la desviación estándar e interprete el resultado.

Observaciones Media ̅ ̅ ̅

863

903

957

1041

1138

1204

1354

1624

1698

1745

1802

1883
Ejemplo para datos agrupados: a continuación se le presenta una distribución de
frecuencia sobre los salarios mensuales de los trabajadores de cierta compañía de
Alajuela (cantidades dadas en dólares). Calcule la desviación estándar de los
salarios.

Clases Punto Frecuencia


Medio

750 4

850 7

950 8

1050 10

1150 12

1250 17

1350 13

1450 10

1550 9

1650 7

1750 2

1850 1

TOTALES 100

101 | P á g i n a
Coeficiente de Variación:

Puesto que las medidas vistas hasta ahora son medidas absolutas, por lo tanto
están afectadas por la unidad de medida en que está expresada la característica.
Por ejemplo, si las observaciones están expresadas en metros, el promedio y la
desviación estándar quedan también expresadas en metros. Esto causa
problemas para comparar la dispersión de dos o más conjuntos de datos porque:
 No podemos comparar unidades distintas.
 Hay casos donde no tiene sentido comparar cifras de magnitud distinta (aun
cuando estén expresadas en la misma unidad de medida).

Para solucionar estos problemas se utiliza el coeficiente de variación (CV), este es


un número relativo y por lo tanto, comparable aun cuando se presenten las dos
dificultades mencionadas antes. Es una medida relativa de dispersión que
proporciona una estimación de la magnitud de la desviación estándar con respecto
a la magnitud de la media. Esta representa la desviación estándar como
porcentaje de la media. La unidad de medida es el “por ciento”.


Ejemplo: cada día el técnico A del laboratorio realiza un promedio de 40 análisis


diarios con una desviación estándar de 5. El técnico B efectúa un promedio de 160
análisis diarios con una desviación estándar de 15. ¿Cuál de los dos técnicos
muestra menos variabilidad?

102 | P á g i n a
Coeficiente de variación para A Coeficiente de variación para B

Interpretación: El técnico________ tiene un coeficiente de variación más alto lo


cual indica que hay mayor variabilidad en el conjunto de observaciones.

103 | P á g i n a
PRÁCTICA

1. Calcule e interprete el Coeficiente de variación para un conjunto de datos que


tiene ̅ y
R/
2. Un hombre viaja en su auto de la ciudad de Alajuela a la ciudad de Heredia a
una velocidad media de ⁄ y vuelve de la ciudad de Heredia a la ciudad
de Alajuela por la misma ruta, con una velocidad media de ⁄ . Hallar la
velocidad media para el viaje completo.
R/ ⁄ .

3. Tome la distribución de frecuencias que se presentan a continuación y que


corresponde al ingreso mensual en dólares de 124 profesionales que trabajan
en el exterior y proceda a encontrar el percentil 80:

Clases

Más de 12

Más de 52

Más de 31

Más de 20

Más de 9

TOTAL 124

R/

4. Un zoólogo tiene como propósito recabar información para determinar el


estado en que se encuentran los animales de un refugio de vida silvestre. Para
ello espera que no exista mucha variabilidad entre los pesos de los animales
adultos. Selecciona una muestra aleatoria de 10 jaguares machos adultos y
una muestra de 10 tepezcuintles machos adultos. Los pesos en kilogramos
son:

104 | P á g i n a
Jaguar 80 66 72 76 76 70 65 68 69 77

Tepezcuintle 5,5 6,4 7,0 7,7 6,6 7,5 8,11 6,3 7,7 6,9

A) Calcule para cada conjunto de datos el promedio, la mediana, varianza y


desviación estándar. Compare los resultados en un cuadro e interprete en
términos de variabilidad absoluta.
B) ¿Para qué animal, los pesos mostrados son relativamente más variables?
¿Llega a las mismas conclusiones que en la parte A?
5. Asocie cada concepto de la izquierda con la característica que le corresponda
a la columna de la derecha.

a) Desviación Estándar ____b____Toma en cuenta solo el valor


mayor y menor del conjunto.

b) Recorrido ____d____para su cálculo se utilizan


valores absolutos.

c) Coeficiente de Variación ___a____su cuadro recibe el nombre de


variancia.

d) Desviación Media ___d____se utilizan muy poco en la


práctica.

___c____es una medida de dispersión


relativa.

___a____utiliza los cuadrados de las


desviaciones con respecto al promedio.

___c____se utiliza cuando se quiere


comparar la variabilidad de dos o más
conjuntos dados.

105 | P á g i n a
Tablas: Observaciones Media ̅ ̅ ̅

Clases Punto Frecuencia


Medio

TOTALES

106 | P á g i n a
FÓRMULAS

Media Armónica: Media Geométrica:

̅ √

Percentil:

Para datos No agrupados o Para datos agrupados continuos


agrupados discretos

Dónde:

107 | P á g i n a
∑ | ̅|
La desviación media:

Varianza y desviación estándar:

Para datos sin agrupar

Población Muestra

∑ ∑ ∑ ̅ ∑ ̅

√ √

Dónde:

Dónde:

108 | P á g i n a
Para datos agrupados

Población Muestra

∑ ∑ ̅
∑ ∑


Dónde:
Dónde:

109 | P á g i n a
Unidad

UNIDAD IV: INTRODUCCIÓN A LAS


PROBABILIDADES

110 | P á g i n a
Introducción a las Probabilidades

¿Qué es Probabilidad?
La probabilidad es una disciplina, una rama de la matemática que tiene tres
principios básicos como teoría: su contenido lógico formal, el antecedente intuitivo
y sus aplicaciones.

Gómez (2003) lo define como: “Un valor numérico que debe cumplir con ciertas
condiciones o propiedades matemáticas, y que se asocia a un evento o suceso
determinado para expresar el grado de confianza que se tiene en la verificación
futura de dicho evento. (p. 356)

La teoría de las probabilidades se aplica actualmente en


muchos y diversos campos. Por ejemplo, desde
experiencias simples como: arrojar una moneda y tirar
un dado, hasta fenómenos físicos de masa y energía.
Así, como dice Feller (1983): “históricamente, el
propósito original de la teoría de la probabilidades
consistía en describir el dominio excesivamente estrecho de la experiencia
relativa a los juegos de azar, y el esfuerzo principal se dirigía al cálculo de algunas
probabilidades”.

En síntesis, las probabilidades son una forma intuitiva de responder ante un hecho
y comienza con experiencias simples.

El Azar

Torstein Frode cuenta que en Hising había una ciudad que estaba ligada en su
suerte tanto a Noruega como a Suecia. Los dos reyes convinieron entonces echar
suertes por ver quién de ellos les correspondería; arrojarían los dados y el
ganador sería aquel que obtuviera el total de puntos mayor.

111 | P á g i n a
El rey de Suecia sacó dos seis y dijo que no valía la pena que el rey Olav probara
suerte, pero éste, mientras sacudía en la manos los dados, le respondió: “Hay
todavía dos seis en estos dados y no es difícil que Dios, mi Señor, los haga salir”.
Tiró los dados y obtuvo dos seis. El rey de Suecia volvió a echar los dados y
obtuvo de nuevo dos seis. Luego, el rey Olav tornó a jugar y uno de los dados
mostró todavía un seis pero el otro se quebró en dos pedazos, con tanta fortuna
que indicó un siete. Entonces la ciudad le tocó a él.

¿Se podría tener “suerte” de una manera perfectamente honesta, es el azar


independiente de toda manipulación humana?

El Azar se define como: La “casualidad” de que ocurra un determinado suceso, es


decir, son eventos inesperados, los cuales no tienen causa alguna de ser
provocados. Para algunos la incertidumbre que les genera la probabilidad hacen
que estudien al azar y la probabilidad como una teoría idéntica, sin embargo, para
la mayoría de científicos y matemáticos, el azar es la base de la probabilidad y se
le culpa de todo aquello que en la probabilidad carece de certeza o no se puede
predecir, es decir, de todo que se salió de alguna manera de las reglas ya
establecidas en la teoría de la probabilidad.

Experimento: Es cualquier proceso en el que se observó algo. Es decir, cualquier


acción cuyo resultado se registra como un dato. Ejemplo:

Se divide en dos tipos: Experimento determinista y experimento aleatorio.

1. Experimento Determinista: es aquél donde los posibles resultados se


conocen antes del experimento, es decir, el resultado se determina sin
necesidad de llevarlo a la práctica.

112 | P á g i n a
2. Experimento Aleatorio: es imposible predecir sus resultados. Se dice que en
este experimento, los resultados dependen del azar. Los siguientes
aspectos caracterizan a un experimento aleatorio:
 Cada experimento puede ser repetido bajo las mismas condiciones.
 Aunque no se puede establecer un resultado particular del
experimento, podemos describir el conjunto de todos los resultados
posibles de este.
 Si un experimento puede repetirse un gran número de veces
aparece un patrón de regularidad. Por ejemplo si se lanza una
moneda al aire un gran número de veces observaremos que la mitad
o aproximadamente la mitad de las veces aparece cara (siempre y
cuando la moneda no esté cargada). Y esto ocurre a pesar de cada
resultado individual aparecería de manera casi arbitraria e imposible
de predecir. Es precisamente esta regularidad la que hace posible
construir un modelo probabilístico para analizar u experimento
aleatorio.

Evento: Es una uno de los resultados posibles en un experimento. Ejemplo:


Lanzar una moneda.

Se clasifica en:

1. Evento Simple: cada uno de los elementos un espacio de un


evento determinado. Por ejemplo: al lanzar un dado, sus eventos
simples son seis: 1, 2, 3, 4, 5 y 6.
2. Evento Compuesto: Es la unión de varios eventos simples.
Ejemplos: al lanzar un dado, “que salga un número par”, es la
unión de los eventos simples: 2, 4 y 6.

113 | P á g i n a
3. Evento Imposible: es un evento donde al realizarse un
experimento, se sabe que dicha situación o suceso no se puede
presentar. Se le denota como: . Por ejemplo: que al lanzar un
dado, salga el número 7.
4. Evento Seguro: es un evento donde al realizarse un experimento,
se sabe que dicha situación o suceso siempre se puede
presentar. Se le denota como el conjunto universal: .
5. Eventos Mutuamente Excluyentes: son los eventos que no
pueden ocurrir a la vez, por ejemplo: el evento seguro es
mutuamente excluyente con el evento imposible.

Punto Muestral: Son disjuntos, pues no ocurren dos al mismo tiempo y siempre
se relaciona con un evento simple.

Espacio Muestral: Es el conjunto de puntos muestrales posibles en un


experimento. Es una lista de todos los resultados posibles. Un tipo de espacio
muestral es el Discreto, en la cual se cumple que: hay una cantidad finita o
contable de puntos muestrales y lleva un orden.

TECNICAS DE CONTEO

1. Principio de la Suma: Si las formas o maneras de realizar un producto se


clasifica en “k” casos, y es el conjunto de todas las maneras de realizar el
proceso en el caso Se sigue que, | | | |+| |
| |. Es decir, que el número total de formas de realizar el proceso es la
suma de las cardinalidades de

Ejemplo 1: Supóngase que se desea viajar de Concepción a Santiago y debemos


decidir entre viajar en Tren, Bus, Auto o Avión. Si hay 1 ruta de tren, 2 rutas de
bus, 3 rutas de auto, y 1 ruta de avión, entonces el número total de rutas distintas
disponibles para el viaje es

114 | P á g i n a
Ejemplo 2: En un colegio se tienen 5 grupos de undécimo, 9 grupos de décimo y
18 grupos de noveno. Una empresa regalará una fiesta a un grupo de tercer ciclo
o ciclo diversificado. Si el grupo se elige al azar. De cuantas maneras se puede
seleccionar.

2. Principio de la Multiplicación: la realización de un proceso se divide en k”


etapas. Sea el conjunto de las maneras de realizar la etapa
Entonces, | | | |+| | | |. Es decir, que el número total de
formas de realizar el proceso es el producto de las cardinalidades de .

Ejemplo 1: Un contrato de construcción ofrece casas con cinco tipos distintos de


distribución de las habitaciones, tres tipos de techo y dos tipos de alfombrado ¿De
cuantas maneras diferentes puede un comprador elegir una casa?

Ejemplo 2: ¿Cómo se puede formar un número de cuatro dígitos con números del
1 al 7?

Ejemplo 3: ¿Cómo se puede formar un número de cuatro dígitos con números del
1 al 7, pero sin repetir los números?

115 | P á g i n a
3. Permutaciones y Combinaciones

Permutaciones de Objetos Distintos: una permutación de “n” objetos distintos es


un ordenamiento de ellos. El número total de permutaciones se denota por

Teorema:

Ejemplo 1: ¿Cuántas permutaciones se pueden formar con las letras de la palabra


“maestro”?

Ejemplo 2: ¿Cuántas permutaciones se pueden formar con los números


0,1,3,5,6,9?

a) Los números 1,3,5 están juntos.

b) El número 3 está después de la segunda posición y el número 6 debe ir en


cualquier lugar que esté posterior al 3.

116 | P á g i n a
Arreglos tomados de objetos distintos: un arreglo o permutación de “r” objetos
tomados de “n” objetos distintos es una ESCOGENCIA ORDENADA de estos r
objetos. La notación utilizada es

Teorema:

Ejemplo 1: en una clase de 32 estudiantes desean formar una directiva


(presidente, vicepresidente, secretario, tesorero y fiscal), ¿De cuántas maneras se
pueden efectuar esta selección?

Combinaciones tomadas de objetos distintos: una combinación de “r” objetos


tomados de “n” objetos distintos es una selección de estos “r” objetos. La notación

es ( ).

Teorema: ( )

Ejemplo 1: Para visitar un laboratorio de biotecnología deben seleccionarse 20


estudiantes de entre tres secciones en un colegio. Una de las secciones tiene 25
estudiantes, otra tiene 22 y la tercera tiene 28. ¿De cuántas maneras puede
hacerse la selección si se deben escoger 7 estudiantes de la primera sección, 5 de
la segunda y 8 de la tercera?

117 | P á g i n a
Práctica #1

1) Se tienen 15 libros de matemáticas distintos, de los cuales tres son de


probabilidad. ¿De cuántas maneras se pueden ordenar estos libros en un
estante, si el primer libro de probabilidad debe estar en la quinta o novena
posición?

R/

2) ¿Cuántas permutaciones se pueden formar con las letras de la palabra


“matemática”?

R/ 151200

3) Un proceso de ensamblaje en una fábrica incluye 4 etapas que puede


ejecutarse en cualquier orden. Si el fabricante desea estudiar, ¿cuánto tiempo
dura el proceso en cada orden posible?, ¿cuántas pruebas distintas deberá
estudiar?

R/ 24

4) Escriba el espacio muestral correspondiente si se tiene una caja con 6 bolas


(4 rojas y 2 blancas), se seleccionan consecutivamente 3 bolas con reemplazo
(cada bola es devuelta a la caja antes de una nueva selección).

5) De una urna que contiene los nombres de 30 empleados de una pequeña


empresa, se van a elegir aleatoriamente, sin reemplazo los nombres de 3. El
individuo cuyo nombre sale primero recibe 100 dólares, el siguiente en salir su
nombre recibe 50 dólares y el tercero recibe 25 dólares. ¿Cuántos puntos
muestrales se asocian con este experimento?
R/ 24 360

118 | P á g i n a
6) Una operación de ensamblaje en una fábrica requiere tres etapas, que pueden
ejecutarse en cualquier orden. ¿En cuántas formas distintas se puede realizar
el ensamblaje?
R/ 6

7) Una línea aérea tiene programado seis vuelos diarios de New York a California
y siete de California a Hawai. Si los vuelos se programan para diferentes días,
¿Cuántas diferentes opciones de vuelo puede ofrecer la aerolínea de New York
a Hawai?

R/ 42

8) Un modelo de automóvil viene en cinco presentaciones, con cuatro clases de


motor, dos tipos de transmisión y ocho colores.
a) ¿Cuántos automóviles tiene que almacenar un distribuidor si incluye una
combinación de tipo de motor y transmisión?
R/ 8

b) ¿Cuántos automóviles tendrían que transportar un centro de


distribución, si se almacenan automóviles de todos los colores, de
acuerdo con la combinación del inciso a?
R/64

9) La directora de personal de una corporación contrató a diez nuevos ingenieros.


Si hay tres vacantes (distintas) en la plata de Cleveland, ¿de cuántas maneras
puede cubrir los puestos?
R/ 720

10) Los alumnos que asisten a la universidad de Florida pueden elegir 130
asignaturas, las cuales se identifican en los registros de admisión del
estudiante con un código de dos o tres letras (por ejemplo, la estadística se
identifica mediante STA y las matemáticas con MS). Algunos estudiantes

119 | P á g i n a
eligen dos asignaturas y cumplen con los requisitos de las dos áreas
principales antes de la graduación. Se pidió al coordinador de admisiones que
asignara a estas materias dobles un código diferente a los establecidos y que
puedan identificarse en el sistema de registro de los estudiantes.
a) ¿Cuál es la cantidad máxima de asignaturas dobles de la que pueden
disponer los estudiantes de la universidad de Florida?
R/ 8325

b) Si está disponible algún código de 2 o 3 letras para identificar las


asignaturas sencillas o dobles, ¿entre cuántos códigos de asignatura se
puede elegir?
R/ 18252

c) ¿Cuántos códigos se requieren para identificar a los estudiantes que


tienen asignaturas sencillas o dobles?
R/ 8515

d) ¿Hay suficientes códigos disponibles para identificar a todas las


asignaturas sencillas o dobles en la universidad de Florida?

R/ Sí

11) Las proporciones de fenotipos sanguíneos A, B, AB y O en la población de


caucásicos en Estados Unidos son alrededor de ,
respectivamente. Se elige un caucásico en forma aleatoria de la población.
Elabore una lista del espacio muestral de este experimento.

12) Un vehículo que llega a un crucero puede dar la vuelta a la derecha, a la


izquierda o continuar al frente. El experimento consiste en observar la dirección
que toma un vehículo que pasa por el crucero. Elabore una lista del espacio
muestral de este experimento.

120 | P á g i n a
13) Patricia le ofrece a su hijo Julio dos regalos para su cumpleaños, los cuales
pueden ser seleccionados del siguiente conjunto:

{ }

a) El ejemplo anterior, ¿corresponde a una permutación o una


combinación?
b) ¿Cuántas opciones puede armar Julio?

R/ 15

14) El banco “x” le pide a Noé crear una clave para su pin de tres dígitos (sin
repetir el número), los cuales debe seleccionar del conjunto:

a) El ejemplo anterior, ¿corresponde a una permutación o una


combinación?
b) ¿Cuántas claves puede ser creadas por Noé?

15) ¿Cuántas maneras hay de asignar los primeros cuatro lugares de un concurso
de creatividad que se realiza en una institución educativa de nuestro país, si
hay 14 participantes?
R/ 24024
16) ¿Cuántas maneras hay de que se asignen a 120 personas, tres premios de un
sorteo en donde el primero premio es un departamento, el segundo un auto y
el tercero un centro de cómputo? (sin reemplazo).
R/ 1685040
17) ¿Cuántas formas hay de asignar las primeras cinco posiciones de una carrera
de autos, si participan 26 autos en esta carrera?. Considere que la asignación
es totalmente al azar y sin reemplazo.
R/ 7893600

121 | P á g i n a
Definición Clásica de Probabilidad: Es un evento donde todos los puntos
muestrales son igualmente probables, según Chaves (2012): “si un experimento
genera el espacio muestral S, el cual contiene n puntos muestrales, de los cuales
k puntos muestrales favorecen la ocurrencia de un evento A, entonces la
k
probabilidad de A, denotada por P( A) viene dada por: P( A)  ”.(p.18).
n

Ejemplo #1: Obtener la probabilidad de sacar el número 1 en un dado:

1
P(1)  .
6

Ejemplo #2: En un curso de Bioestadística hay 30 alumnos, 10 de la carrera de


Bioquímica, 15 de Farmacia y 5 de Enfermería. El 70% del total son mujeres y el
resto varones. Se escoge uno al azar; hallar la probabilidad de que sea de la
carrera de:

 Bioquímica:

 Farmacia:

 Enfermería:

¿Cuál será la cantidad de mujeres M?

Enfoque Frecuencial de la Probabilidad: Complementa la definición clásica


pues atiende casos que no pueden resolver con dicha definición.

Según Chaves (2012): “si se hace n número de observaciones de una


misma clase, donde n es grande y se encuentra que el evento A ocurre en k

122 | P á g i n a
ocasiones, entonces la probabilidad del evento A es aproximadamente:
. Por tanto, con base en esta definición, se entiende como

Probabilidad de Ocurrencia de un evento a un cierto valor, generalmente


desconocido, al cual tienden las frecuencias relativas al aumentar el
número de observaciones en que están basadas”. (p.21)

Reglas básicas de Probabilidad: Supongamos que S es un espacio muestral


relacionado con un experimento. Para cada evento A en S (A es un subconjunto
de S), asignamos un número denominado Probabilidad de A, de tal manera
que se cumplan los siguientes axiomas:

I.
II. , “no hay espacios incompletos”
III. Si forman una sucesión de eventos mutuamente
excluyentes por parejas de S, es decir, si
entonces ∑

Nota: Como consecuencia de la definición, tenemos que la probabilidad de un


evento “Imposible” es cero. Por otro lado, dichas reglas corresponden en forma
parcial a los axiomas de Kolmogorov sobre el “Cálculo de Probabilidades”.

Ejemplo #1: Suponga que se lanza una moneda tres veces para observar si se
tiene escudo o corona, en cada lanzamiento. Vamos a suponer que la moneda
está equilibrada y los tres lanzamientos tienen las mismas condiciones:
Espacio Muestral:
E1  AAA E5  BAA
E2  BBB E6  BBA
 Escudo: A
 Corona: B
E3  AAB E7  BAB
E4  ABA E8  ABB
Donde, Ei , con 1  i  8 son los eventos
probables

123 | P á g i n a
 B: Obtuve una Corona

B  E3 , E4 , E5 
Eventos Simples

𝐸 𝐸 𝐸 𝐸
𝐸

𝐸 𝐸 𝐸

Solución: Asigne probabilidades a los eventos simples

, suponiendo que todos tienen igual probabilidad de

ocurrencia.

la suma, o los tres eventos simples de A.

La Ley de la Suma

A) Teorema:

 Si A y B son mutuamente excluyentes entonces , así:
.

B) Teorema: ̅

124 | P á g i n a
Donde,  
P A significa la probabilidad del complemento de A.

Definición de Probabilidad Condicional de un Evento

Definición de Eventos Independientes:




, si A y B son independientes

Teorema: Ley Multiplicativa: Si A y B son dependientes:


⁄ ⁄

En resumen:

Dos Eventos A y B

Eventos NO Mutuamente Eventos Mutuamente


Excluyentes Excluyentes

INDEPENDIENTES DEPENDIENTES

125 | P á g i n a
Nota: “Algunas Leyes Importantes”

A) Leyes Distributivas:
a.
b.

B) Leyes de De Morgan:
a. ̅̅̅̅̅̅̅ ̅ ̅
b. ̅̅̅̅̅̅̅ ̅ ̅

Ejemplo 1: se tiene una canasta con 15 bolas numeradas del 1 al 15. Las bolas
con números entre 1 y 7 son rojas y las demás son verdes. Se elige una bola al
azar, considere los eventos:

 A: la bola extraída es verde


 B: la bola extraída es roja
 C: la bola extraída tiene un número par

Determine: ̅ ⁄ ¿Son independientes los


eventos A y C?

126 | P á g i n a
Ejemplo 2: Considere el ejemplo de lanzar dos dados:

 Escriba el espacio muestral


 Escriba el espacio muestral para cuando la suma sea par. Determine su
probabilidad.

Ejercicios

1. ¿Cuál es la probabilidad de que al lanzar dos dados la suma sea un


número par o un número menor que cinco?

R/

2. Si se lanza un dado, ¿Cuál es la probabilidad de obtener 3 ó 5?

R/

3. Considere el caso de una urna que contiene 7 bolas blancas y 5 negras, siendo
ellas en todo iguales, excepto su color. Se saca una bola al azar y luego otra
sin reemplazo de la primera. ¿Cuál es la probabilidad de que la primera sea
blanca y la segunda sea negra?

R/

127 | P á g i n a
4. Si de ocho grupos de sétimo cada uno de treinta estudiantes, desertaron en
total ochenta y cuatro estudiantes en el primer trimestre, ¿cuál es la
probabilidad que un estudiante cualquiera haya desertado en ese trimestre?

R/0,35

5. Supongamos que de 240 estudiantes, cien son hombres y de los 95 que


aprobaron el curso 55 eran hombres.
1. ¿cuál es la probabilidad que uno cualquiera de esos estudiantes sea
hombre o haya aprobado el curso?
R/0, 5833

2. ¿cuál es la probabilidad que sea mujer y haya aprobado el curso?


R/0, 1667

3. Si seleccionamos un estudiante cualquiera y sabemos que es mujer,


cual es la probabilidad de que haya aprobado el curso?
R/0, 2857

6. Suponga que en una familia hay dos visitantes de diferente edad y que nos
interesa conocer el sexo y la edad de estos visitantes. Se utiliza la letra H para
representar a un hombre, M para una mujer y HM para denotar que la persona
con más edad es mujer y el menor es hombre.
 ¿Cuál es el espacio muestral?
 Sea A el subconjunto de todas las posibilidades que no incluyen varones
 Sea B el subconjunto que contiene dos varones.
 Sea C el subconjunto que contiene al menos un varón

128 | P á g i n a
Distribución de Probabilidad: una distribución de probabilidad, p(x) ó una
función de probabilidad de masa, es una fórmula o función, tabla o gráfica, que
proporciona a cada posible valor de la variable aleatoria su probabilidad asociada.

 Teorema: Si p(x) es la distribución de probabilidad de x, entonces,


i.
ii. ∑

 Definición: Sea x una variable aleatoria discreta con función de probabilidad


p(x). Entonces, el valor esperado de x, se define como: ∑
además, (es decir, E(x)= La Media)

Medidas de Variabilidad del Conjunto de Datos:

a) Definición: se define varianza (o variancia) de una variable aleatoria


discreta x como [ ] [ ].
b) De la definición anterior se tiene que la desviación estándar de x es
√ y representa “que tanto” se desvían los datos
respecto al promedio.
c) Teorema: sea x una variable aleatoria discreta con función de
probabilidad p(x).
Entonces, [ ]

Teniendo las distribuciones de Probabilidad se puede utilizar el siguiente cuadro y


determinar la media, la varianza y la desviación estándar:

x P(x)

TOTAL = =

129 | P á g i n a

Vous aimerez peut-être aussi