Vous êtes sur la page 1sur 29

Trabajo de la Unidad II Fernando A. Contreras J.

TRABAJO DE PROBABILIDAD Y ESTADISTICA


VALOR: 50% DE LA NOTA DEL SEGUNDO PARCIAL

INSTRUCCIONES
Lea con detalle la presente guía, la misma comienza en la
página 1 y termina en la página 23. Luego, resuelva las
preguntas que vienen dadas al final, las mismas comienzan en la
página 24 y terminan en la página 28. La resolución de estas
preguntas son el trabajo, las cuales se deben presentar con su puño
y letra (es decir, a mano escrita). Los trabajos que se realicen en
letra de imprenta y/o en letra de computadora no serán recibidos.
El trabajo es individual, el mismo se debe realizar en hojas blancas
u otras, las cuales deben organizarse dentro de una carpeta. Se
tomara en cuenta el orden y la presentación del trabajo.

Fecha: 17 de Enero del 2011 Fernando A. Contreras J.


0
Trabajo de la Unidad II Fernando A. Contreras J.

“Estadística”

Todo aquello que se relaciona con la recolección, procesamiento, análisis e


interpretación de datos numéricos o cuantificables, pertenece al campo de la estadística.
De ahí que la estadística puede definirse como la ciencia o método de reunir, organizar y
analizar datos, para luego generalizar los resultados a toda la población que se está
estudiando a partir de la información contenida en una muestra. La estadística se divide
en dos grandes apartados denominados: Estadística Descriptiva y Estadística
Inferencial.

“Estadística Descriptiva”

Se define como el conjunto de métodos que analizan una muestra conformada por una
colección de datos o determinadas características medibles, obtenidos de un colectivo de
personas u objetos de una naturaleza específica. El objetivo de la estadística descriptiva
es describir los datos en forma conveniente, útil y comprensible de las diversas
características de mencionado conjunto de observaciones.

Universo Muestra Poblaciones


o Aleatoria Estadísticas
Población
Física

Peso
Sexo
Edad

“Estas características medibles de la población física van a generar dato que van a ser
organizados por la estadística descriptiva”

“Ejemplo 1”: ¿De qué manera un entrenador de Básquetbol describiría e ilustraría en


forma resumida, las mediciones de las estaturas de los miembros del equipo de su
selección?

“Desarrollo”

El entrenador obtiene las siguientes mediciones y las representa a través de un


cuadro:

Estaturas
1.93 1.97 1.84 1.90 2.01 1.95 2.05

Luego obtiene algunas medidas que resumen y aportan una mayor información del
conjunto de estaturas del equipo selección:

1
Trabajo de la Unidad II Fernando A. Contreras J.

Resumen Estadístico Descriptivo Elemental

Numero de Observaciones n=7


Estatura Promedio 1.95
Mayor Estatura 2.05
Menor Estatura 1.84
Diferencia (Rango) 2.05 – 1.84 = 0.21

Luego realiza una representación gráfica que ilustra aún mejor el conjunto de datos
obtenidos:

Representación Gráfica
2,1

2,0

1,9

1,8
1 2 3 4 5 6 7

Jugad ores d el Eq ui po

“Ejemplo 2”: Considérese una sección de 50 alumnos de estadística de la


Universidad Nacional Experimental del Táchira. Tome una muestra aleatoria de
tamaño 11 y obtenga los datos de las variables Edad, sexo, # de hermanos, Peso,
Estatura y Deporte.
“Desarrollo”

A través del mecanismo de la bolsa con los papelitos, supóngase que se obtuvo la
muestra de tamaño 11 a partir de la cual se han obtenidos los datos ilustrados en la
tabla adjunta:
X1 X2 X3 X4 X5 X6
Clases Selección al azar Edad Sexo # de Hermanos Peso Estatura Deporte
Clase 1 07 (María) 17.8 F 3 60.5 1.65 Voleibol
Clase 2 19 (Amelia) 19.3 F 4 64.8 1.70 Natación
Clase 3 23 (Luís) 20.2 M 1 73.3 1.73 Básquet
Clase 4 11 (Angélica) 19.1 F 4 58.9 1.66 Voleibol
Clase 5 16 (José) 20.4 M 2 68.4 1.70 Fútbol
Clase 6 34 (Jorge) 18.9 M 3 83.5 1.81 Fútbol
Clase 7 03 (Alejandra) 19.4 F 0 68.6 1.73 Maratón
Clase 8 45 (Andreina) 21.9 F 2 61.4 1.55 Básquet
Clase 9 33 (Roberto) 23.5 M 1 75.7 1.67 Natación
Clase 10 49 (Marta) 18.9 F 5 50.3 1.63 Voleibol
Clase 11 17 (Paulina) 20.4 F 2 65.1 1.67 Básquet

2
Trabajo de la Unidad II Fernando A. Contreras J.

Universo: Curso de estadística de la Universidad Nacional Experimental del Táchira


(N = 50).
Poblaciones Estadísticas: Edad, Sexo, # de Hermanos, Peso, Estatura y Deporte.

Muestra: Parte del Universo, selección de 11 alumnos al azar (n = 11).

Datos: Información obtenida de la muestra sobre algunas características medibles de la


población física.

Datos Cualitativos: Sexo y Deporte.

Datos Cuantitativos: Edad, # de Hermanos, Peso y Estatura.

Variables: X1, X2, X3, X4, X5 y X6.

Variables Continuas: X1, X4 y X5.

Variables Discretas: X3.

Variables Cuantitativas: X1, X3, X4 y X5.

Variables Cualitativas: X2 y X6.

“Las mediciones dan pie a variables continuas y los conteos a variables discretas”

“Forma de Organizar los Datos”

Orden Creciente y Decreciente: Las observaciones de una variable se ordenan tomando


en cuenta la magnitud en forma creciente o decreciente.

“Ejemplo 3”: Considérese la variable peso en kilogramos de la muestra de 11 estudiantes


de estadística (n = 11), de la tabla de datos obtenida en el “Ejemplo 2.

Peso 60.5 64.8 73.3 58.9 68.4 83.5 68.6 61.4 75.7 50.3 65.1
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11

Realice un orden creciente y decreciente de la muestra. Luego realice una


representación gráfica.
“Desarrollo”

Orden Creciente 50.3 58.9 60.5 61.4 64.8 65.1 68.4 68.6 73.3 75.7 83.5
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)

Orden Decreciente 83.5 75.7 73.3 68.6 68.4 65.1 64.8 61.4 60.5 58.9 50.3
X(11) X(12) X(9) X(8) X(7) X(6) X(5) X(4) X(3) X(2) X(1)

“Representación Gráfica” (Gráfico de Puntos)

3
Trabajo de la Unidad II Fernando A. Contreras J.

Clases o Categorías: Las observaciones de una variable se ordenan en clases o


categorías en las que se lleva a cabo un recuento de la frecuencia del número de
observaciones que pertenece a cada clase.

“Ejemplo 4”: Considérese las variables sexo y deporte de la muestra de 11 estudiantes de


estadística (n = 11), de la tabla de datos obtenida en el “Ejemplo 2”.

Sexo F F M F M M F F M F F
Deporte Voleibol Natación Básquet Voleibol Fútbol Fútbol Maratón Básquet Natación Voleibol Básquet

Organice estas observaciones en clases o categorías. Luego realice una representación


gráfica de cada variable en cada caso.

“Desarrollo”

Para la variable “Sexo”, se tiene la tabla:

Clases Sexo Conteo Frecuencia (fi)


Clase 1 Femenino /////// 7
Clase 2 Masculino //// 4
Total ///////// 11

“Representación Gráfica” (Gráfico Circular)

El círculo se divide en sectores cuyas áreas son proporcionales a los datos que se
quieren representar. Normalmente se utiliza cuando hay pocas clases o categorías.

Área Porcentaje
“Para Dividir el Área del Circulo” “Para Determinar el Porcentaje del Área”

Frecuencia de la Celda  X Frecuencia de la Celda  X


Tamaño de la Muestra  360º Tamaño de la Muestra  100%

Frecuencia de la Celda Área del Circulo en Grados Porcentaje Correspondiente al Área


Femenino 7 229º 63.6%
Masculino 4 131º 36.4%
Total 11 360º 100%

4
Trabajo de la Unidad II Fernando A. Contreras J.

Para la variable “Deporte”, se tiene:

Clases Deporte Conteo Frecuencia (fi)


Clase 1 Voleibol /// 3
Clase 2 Natación // 2
Clase 3 Básquet /// 3
Clase 4 Maratón / 1
Clase 5 Fútbol // 2
Total /////////// 11

“Representación Gráfica” (Gráfico Circular y Gráfico de Barras)

El gráfico de barras está formado por rectángulos en los que la base del rectángulo representa
una clase y la altura del rectángulo es la frecuencia de la clase.

3,5

3,0

2,5

2,0
Número de Alumnos

1,5

1,0

,5
Básquet Fútbol Maratón Natación Voleibol

Deporte que Practican

Rol de Frecuencias: Las observaciones de una variable se agrupan en orden de


magnitud de manera creciente o decreciente, pero teniendo en cuenta la frecuencia (fi)
con que se repite cada observación. Además, se calcula la frecuencia acumulada (Fi), la
 fi  F 
frecuencia relativa   , la frecuencia relativa acumulada  i  , el porcentaje de la
n n
f 
frecuencia relativa  i .100 y el porcentaje de la frecuencia relativa acumulada
n
 Fi 
 .100 .
n

“Ejemplo 5”: Considérese la variable “# de hermanos” de la muestra de 11 estudiantes de


estadística (n = 11), de la tabla de datos obtenida en el “Ejemplo 2”.

# de Hermanos 3 4 1 4 2 3 0 2 1 5 2
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)

Realice un rol de frecuencias en donde la variable a analizar sea “# de hermanos”.

5
Trabajo de la Unidad II Fernando A. Contreras J.

“Desarrollo”

Clases # de hermanos Conteo fi Fi fi/n Fi/n (fi/n).100 (Fi/n).100


Clase1 0 / 1 1 0.09 0.09 9 9

Clase 2 1 // 2 3 0.18 0.27 18 27

Clase 3 2 /// 3 6 0.27 0.55 27 55

Clase 4 3 // 2 8 0.18 0.73 18 73

Clase 5 4 // 2 10 0.18 0.91 18 91

Clase 6 5 / 1 11 0.09 1.00 9 100

Total /////////// 11 1.00 100

La nomenclatura de la tabla es: frecuencia (fi) con que se repite cada observación,
frecuencia acumulada (Fi), la frecuencia relativa (fi/n), la frecuencia relativa acumulada
(Fi/n), el porcentaje de la frecuencia relativa ((fi/n).100) y el porcentaje de la frecuencia
relativa acumulada ((Fi/n).100).

“Representación Gráfica”

Se realizaran distintas representaciones de barras y gráficos acumulativos.

6
Trabajo de la Unidad II Fernando A. Contreras J.

Distribución de Frecuencias: Las observaciones de una variable se agrupan clases o


categorías las cuales poseen límites o valores extremos (Li: Límite Inferior y Ls: Límite
Superior). Además se calcula la frecuencia (fi), la frecuencia acumulada (Fi), la marca de
 Li  Ls
 f  F 
clase  X i   , la frecuencia relativa  i  , la frecuencia relativa acumulada  i 
 2  n n
f 
, el porcentaje de la frecuencia relativa  i .100 y el porcentaje de la frecuencia relativa
n
F 
acumulada  i .100 .
n

“Ejemplo 6”: Supóngase que un investigador desea describir las estaturas en pulgadas
de 50 estudiantes de un curso de “Estadística” de la Universidad Nacional Experimental
del Táchira dadas en el cuadro adjunto:
“n = 50”

61 63 65 63 69 67 53 58 60 65
Estaturas de los 64 65 64 72 68 66 55 57 66 62
“50” estudiantes 62 65 64 71 68 66 56 59 61 64
de estadística de 63 65 63 62 67 60 57 59 61 62
la UNET. 64 64 63 69 67 66 58 60 61 70

Antes de construir la tabla de distribución de frecuencias se plantea la pregunta:


¿Cómo obtener el número de clases y intervalo de clase?

1.) Para obtener el # de clases, se puede usar la formula de Sturges:

7
Trabajo de la Unidad II Fernando A. Contreras J.

K : # de clases
K = 1 + 3.322Log10(n)
Log10(n) : Logaritmo en base 10 de “n” (el número de
datos considerados)

En otro caso, usted mismo puede asignar el número de clases, el cual se recomienda este
comprendido entre 5 y 15 clases, cuando se tenga un número de datos mayor o igual a 30.

2.) Para obtener la longitud del intervalo de clases, se puede usar la formula:

A K : # de clases
lI.C. = A : Amplitud
K lI.C. : Longitud del Intervalo de Clase para la Fórmula de
Sturges.

Donde: A = VM – Vm VM : Valor Mayor


Vm : Valor Menor

 “f1, f2, f3, . . . , fk es la “frecuencia de las k clases”; es decir, los fi para i =


1, 2, 3, . . . , k”

 “F1, F2, F3, . . . , Fk es la “frecuencia acumulada de las k clases”; es decir, los


Fi para i = 1, 2, 3, . . . , k”

 “X1, X2, X3, . . . , Xk son las “marcas de clase de las k clases”; es decir, los Xi
para i = 1, 2, 3, . . . , k”

 Para los demás elementos de la tabla, el análisis es análogo.

Continuando con el Ejemplo 6, para obtener el intervalo de clase usando la fórmula


de Sturges), se tiene:

K = 1 + 3.322Log10(50) = 6.64  7

19
Luego, la longitud del intervalo de clase queda: lI.C. = = 2.7  3  lI.C.  3
7

Se construye la tabla de “Distribución de Frecuencias”, la construcción del primer


intervalo se realiza comenzando desde el menor valor en la lista de datos (en este caso
53). A partir de este valor e incluyéndolo se cuenta tres valores (53, 54 y 55), de acuerdo
a la longitud del intervalo (en este caso 3) hasta llegar al extremo (en este caso 55). A
través de éste mecanismo, se obtiene el primer intervalo 53 – 55. Los demás intervalos se
obtienen siguiendo un proceso análogo.

8
Trabajo de la Unidad II Fernando A. Contreras J.

“Tabla A”

Clases Intervalos Recuento fi Fi Xi fi/n Fi/n (fi/n).100 (Fi/n).100


Clase 1 53 – 55 // 2 2 54 0.04 0.04 4 4
Clase 2 56 – 58 ///// 5 7 57 0.10 0.14 10 14
Clase 3 59 – 61 ///////// 9 16 60 0.18 0.32 18 32
Clase 4 62 – 64 /////////////// 15 31 63 0.30 0.62 30 62
Clase 5 65 – 67 //////////// 12 43 66 0.24 0.86 24 86
Clase 6 68 – 70 ///// 5 48 69 0.10 0.96 10 96
Clase 7 71 – 73 // 2 50 72 0.04 1.00 4 100

A modo de observación se puede notar que:

f3 = 9 es la frecuencia de la Clase 3
F4 = 31 es la Frecuencia Acumulada de la Clase 4
X5 = 66 es la Marca de Clase de la Clase 5

Además, el número de datos obtenido (“n”), se puede expresar como se muestra a


continuación:
7

n = Fk = f
i 1
i = F7 = 50

“Representación Gráfica de una Distribución de Frecuencias”

Histograma y Polígono de Frecuencias: El histograma es un gráfico de barras


continuas en donde la base de cada barra es un intervalo de clase y la altura es la
frecuencia de la clase. El Polígono de Frecuencias es un diagrama de líneas que se obtiene
uniendo los puntos medios de cada rectángulo mediante semi-rectas.

“Ejemplo 7”: Realice el histograma y el polígono de frecuencia correspondiente a la


“Tabla A” de datos del “Ejemplo 2”.
“Desarrollo”

Nota: Para que exista continuidad en las barras del histograma, se utilizarán los límites
reales (L.r.) de cada clase. Obsérvese:

LI : Límite Inferior
LI – LS LS : Límite Superior
Clase i: Lri : Límite Real Inferior
Lri – Lrs Lrs : Límite Real Superior.

Lri = LI – 0.5
(En el caso de estar trabajado con cantidades enteras)
Lrs = LS + 0.5

9
Trabajo de la Unidad II Fernando A. Contreras J.

Para construir el histograma y el polígono de frecuencia es necesario construir una


tabla que contenga las clases, los intervalos de clase, los límites reales de cada intervalo,
la frecuencia de cada clase y la marca de clase.

Clases Intervalos Límites Reales fi Xi


Clase 1 53 – 55 52.5 – 55.5 2 54
Clase 2 56 – 58 55.5 – 58.5 5 57
Clase 3 59 – 61 58.5 – 61.5 9 60
Clase 4 62 – 64 61.5 – 64.5 15 63
Clase 5 65 – 67 64.5 – 67.5 12 66
Clase 6 68 – 70 67.5 – 70.5 5 69
Clase 7 71 – 73 70.5 – 73.5 2 72

La Ojiva: Es un diagrama de semi-rectas que se utiliza para representar la frecuencia


acumulada de cada clase.

“Ejemplo 8”: Realice la ojiva correspondiente a la “Tabla A” de datos del “Ejemplo 2”.

“Desarrollo”

Para construir la ojiva y la curva percentilar es necesario construir una tabla que
contenga las clases, los intervalos de clase, los límites reales de cada intervalo, la
frecuencia acumulada y el porcentaje de frecuencia acumulada de cada clase.

10
Trabajo de la Unidad II Fernando A. Contreras J.

Clases Intervalos Límites Reales Fi


Clase 1 53 – 55 52.5 – 55.5 2
Clase 2 56 – 58 55.5 – 58.5 7
Clase 3 59 – 61 58.5 – 61.5 16
Clase 4 62 – 64 61.5 – 64.5 31
Clase 5 65 – 67 64.5 – 67.5 43
Clase 6 68 – 70 67.5 – 70.5 48
Clase 7 71 – 73 70.5 – 73.5 50

“Estimadores Poblacionales”

Son medidas que se calculan a las muestras con la finalidad de aproximarse de alguna
manera a los parámetros poblacionales. Algunos de los estimadores más importantes son:
La Media, La Mediana, la Moda, la Varianza y la Desviación Estándar.

La Media: Es aquella medida que representa un promedio o centro físico de los datos.
Esta se puede calcular cuando la variable en estudio es cuantificable numéricamente.

x i

Cálculo de la Media en datos no agrupados: X  i 1

n
k

 f .X i i
Cálculo de la Media en datos agrupados en clases o categorías: X  i 1
n

11
Trabajo de la Unidad II Fernando A. Contreras J.

xi : representa la “i-ésima” variable de la colección de datos


n : representa el numero de datos
f1, f2, f3, ..., fk : son las frecuencias de las “k” clases
X1, X2, X3, …, Xk : son las marcas de las “k” clases

La Media se llama estadística o estimador poblacional (se denota X ), si se calcula a


partir de los datos de una muestra y se llama parámetro poblacional (se denota por ), si
se calcula a partir de los datos de toda la población en cuestión.

La Mediana: Es el valor de posición central, de un conjunto de observaciones que están


ordenadas en forma creciente o decreciente. X(1), X(2), X(3), . . ., X(n) (Sucesión de
observaciones ordenadas en orden creciente de magnitud). La mediana divide desde el
centro, el conjunto de observaciones en dos partes iguales, dos partes de 50% cada una.

x n 1 ; si n es impar
( )
2
~
Cálculo de la Mediana en X =

datos no agrupados: x n +
x n
( ) (( ) 1)
2 2
 ; si n es par
2

n
 F( m1)
~ 2
Cálculo de la Mediana en datos X = Lri  .lI.C.
fm
agrupados en clases o categorías:

Lri: Límite real inferior de la clase medianal.


F(m – 1): Frecuencia acumulada que antecede a la frecuencia acumulada
de la clase medianal.
fm : Frecuencia de la clase medianal.
lI.C.: Longitud del intervalo de clase de la clase medianal.

¿Cómo encontrar la clase que contiene la mediana (Clase Medianal)? Se efectúa el


n
cociente , el resultado se busca en la celda de la frecuencia acumulada que tenga la
2
n
menor valor que contenga a .
2
La Moda: Esta medida está muy relacionada con su nombre “Moda” (la tendencia más
usada), ya que la misma está definida como la observación que más se repite o que se da
con mayor frecuencia. La moda es un valor descriptivo fácil de ver y entender.

Cálculo de la Moda en datos no agrupados: Se ordenan los datos en forma creciente


X(1), X(2), X(3), . . ., X(n), luego se ubica la moda por simple observación.

12
Trabajo de la Unidad II Fernando A. Contreras J.

d1
Cálculo de la Moda en datos X̂ = Lri  . lI.C.
d1  d 2
agrupados en clases o categorías:

Lri : Límite real inferior de la clase modal.


d1 : Diferencia entre la frecuencia de la clase modal y la frecuencia que antecede a la
de la clase modal.
d2 : Diferencia entre la frecuencia de la clase modal y la frecuencia que precede a la de
la clase modal.
lI.C.: Longitud del intervalo de clase de la clase modal.

¿Cómo encontrar la clase que contiene la moda (Clase Modal)? La clase modal es aquella
que tiene la clase con mayor frecuencia (fi).

Entre la Media, la Moda y la Mediana existe una relación aritmética que es válida para
datos que provienen de poblaciones estadísticas que son moderadamente sesgadas; esta
 ~
relación es: X  Xˆ  3 X  X 

La Varianza: Es aquella medida que nos proporciona un indicativo de la forma como se


distribuyen los datos en torno a la media.

Cálculo en datos no agrupados: Se utiliza la ecuación,


  n 
2

   xi  
1  n  i 1  
  xi 
2
S2 = 
n  1  i 1 n 
 
 
Cálculo en datos agrupados en clases o categorías: Se utiliza la ecuación,

  k  
2
  i i 
f . X
= 1  k  i 1  
S2  i i 
2
f . X 
n  1  i 1 n 
 
 

La varianza se llama estadística o estimador poblacional (se denota S2), si se


calcula a partir de los datos de una muestra y se llama parámetro poblacional (se
denota 2), si se calcula a partir de los datos de toda la población en cuestión.

La Desviación Estándar: Es la raíz cuadrada de la varianza. S =  S2

13
Trabajo de la Unidad II Fernando A. Contreras J.

“Ejemplo 9”: Realice los dos apartados siguientes;

A) Considérese la colección de observaciones adjuntas que corresponde a las


calificaciones obtenidas por un grupo de 11 (n = 11) estudiantes en Estadística I.

Calificaciones 44 59 36 55 47 61 53 36 65 32 51
(n = 11) x1 x2 x3 X4 x5 x6 x7 x8 x9 x10 x11

~
Calcule la media ( X ), la mediana ( X ), moda ( X̂ ) y la varianza (S2) de las
observaciones dadas.

“Desarrollo”

Nótese que los datos dados corresponden a datos no agrupados; es decir, son pocos
(n < 15) y no están organizados en una tabla de de frecuencias.

Cálculo de la Media

Calificaciones 44 59 36 55 47 61 53 36 65 32 51
(n = 11) x1 x2 x3 X4 x5 x6 x7 x8 x9 x10 x11

11

x i
44  59  36  55  47  61  53  36  65  32  51
X  i 1
= = 49
11 11

Cálculo de la Mediana

Calificaciones 32 36 36 44 47 51 53 55 59 61 65
(Orden Creciente) x(1) x(2) x(3) X(4) x(5) x(6) x(7) x(8) x(9) x(10) x(11)

Como n = 11 es impar se procede como sigue:

~
X = x 111  = x(6) = 51
 
 2 

Cálculo de la Moda

Calificaciones 32 36 36 44 47 51 53 55 59 61 65
(Orden Creciente) x(1) x(2) x(3) X(4) x(5) X(6) x(7) x(8) x(9) x(10) x(11)

Nótese que al ordenar los datos en forma creciente se puede observar que la moda es
Xˆ  36 , ya que es el dato que más se repite.

14
Trabajo de la Unidad II Fernando A. Contreras J.

“En una colección de observaciones puede haber dos o tres modas; en este caso se está en
presencia de distribuciones bi-modales o tri-modales respectivamente”

Cálculo de la Varianza y la desviación Estándar

Calificaciones 32 36 36 44 47 51 53 55 59 61 65
(Orden Creciente) x(1) x(2) x(3) X(4) x(5) X(6) x(7) x(8) x(9) x(10) x(11)

  11 
2

   xi  
1  11 2  i 1  
Se tiene que: S2 =   xi  
11  1  i 1 11 
 
 
 11 2 
  xi  = x12  x22  x32  x42  x52  x62  x72  x82  x92  x102  x112 =
 i 1 
= 322  362  362  442  472  512  532  552  592  612  652 = 27623

2
 11 
  xi  = (32  36  36  44  47  51  53  55  59  61  65)2 = 539
 i 1 
  11

2

   xi  
1  11 2  i 1   1  (539) 2 
Luego: S2 =   xi  =  (27623)  
11  1  i 1 11  11  1  11 
 
 
 S2 = 121.2 En consecuencia: S = 11.01

La Media Ponderada: Es aquella en la que cada elemento está afectado por un factor
de importancia o peso. Considérese la sucesión de datos x1, x2, x3, ..., xn y la sucesión
de factores de peso w1, w2, w3, . . ., wn. Entonces la media aritmética ponderada está
dada por:
w1 x1  w2 x2  w3 x3  ...  wn xn
Xp 
w1  w2  w3  ...  wn

“Ejemplo 10”: Considérese el cuadro adjunto que contiene las calificaciones de un


estudiante de la Universidad Nacional Experimental del Táchira de un semestre
culminado. Calcule el promedio ponderado de éstas calificaciones.

“Desarrollo”

Se tiene que: x1 = 5 ; x2 = 6 ; x3 = 8 ; x 4 = 9 ; x5 = 7
w1 = 5 ; w2 = 4 ; w3 = 3 ; w4 = 3 ; w5 = 2

15
Trabajo de la Unidad II Fernando A. Contreras J.

(5)(5) + (6)(4) +(8)(3) + (9)(3) + (7)(2)


Luego: Xp =  = 6.7
5+4+3+3+2

Se concluye que el promedio ponderado de las calificaciones del estudiante es de 6.7


puntos.

La Media Geométrica: Es aquella cuya utilidad es prestada en el promediar


proporciones de variación. Considérese la sucesión de datos x1, x2, x3, ..., xn. La media
geométrica se define como la raíz n-ésima del producto de los datos que conforman la
muestra:
G  n x1.x2 .x3.,...,.xn

“Ejemplo 11”: Supóngase que las ventas de una empresa de telecomunicaciones se


ilustran en el cuadro adjunto,

Año Ventas
2000 El doble (2) de las ventas de 1999
2001 Tres medios (3/2) de las ventas del 2000
2002 Cinco cuartos (5/4) de las ventas del 2001

Calcule la media geométrica de estos datos.

“Desarrollo”

x1 = 2 ; x2 = 3/2 ; x3 = 5/4

Luego:  3  5  = 1.55
G 3 ( 2)  
 2  4 

Se concluye que la proporción promedio de crecimiento de la empresa en sus ventas es


de un 155% por año en el período de los años citados.

La Media Armónica: Es aquella que se utiliza si las observaciones se expresan


inversamente a como se expresa el promedio buscado. Considérese la sucesión de datos
x1, x2, x3, ..., xn. La media armónica es:

n
H 
1 1 1 1
   ... 
x1 x2 x3 xn

“Ejemplo 12”: Supóngase que un mayorista ha gastado Bs. 100.000 en carteras para
damas en cada una de tres tiendas diferentes, tal y como se ilustra en la tabla adjunta,

Tienda Precio por unidad


Tienda 1 Bs. 20.000
Tienda 2 Bs. 25.000
Tienda 3 Bs. 50.000

16
Trabajo de la Unidad II Fernando A. Contreras J.

¿Cuál es el precio promedio que el mayorista ha pagado por estas carteras para dama?

“Desarrollo”

Nótese que los datos se expresan como “tantos artículos por peso” y lo que se
quiere saber es “la cuantía pagada por artículo”. En este caso se aplica la media
armónica y el precio promedio pagado por artículo es:

3
H =  = 300.000/11 = 27.272,73
1 1 1
 +  + 
20000 25000 50000

Se concluye que el precio promedio que el mayorista ha pagado por cartera para damas
es de aproximadamente Bs. 27.273.

“Diagrama de Pareto”

Es una forma sencilla de graficar, que permite encontrar de manera rápida y practica
la incidencia de algunos factores que afectan o influyen de forma determinante en un
proceso. En esta representación, se ilustran los datos a través de un gráfico de barras las
cuales van ordenas de mayor frecuencia a menor frecuencia, determinándose así, de
acuerdo a la frecuencia de las barras, las causas más importantes que afectan el proceso.

“Ejemplo 13”: Supóngase que la mayoría de los estudiantes de una sección de


estadística salen reprobados en un examen parcial. Determine un orden de causas que
afectaron a esta evaluación.

“Desarrollo”

Se realiza una encuesta entre los estudiantes reprobados en el examen y se obtienen


algunos datos en los que se analizan algunos factores relacionados que incidieron
negativamente en esta evaluación.

Factores Relacionados Frecuencia


Grado de dificultad en la evaluación (A) 29
Falta de material de apoyo (E) 5
Falta de mas tiempo para responderla (B) 15
No haber estudiado lo suficiente (C) 9
Deficiencia en las explicaciones del profesor (D) 7
Otros (F) 3

Los mismos se ordenan de acuerdo a su frecuencia y se grafican en un diagrama de


pareto. Es decir, colocando de primero el que tenga mayor frecuencia y por tanto la barra
es más alta, se segundo el que tenga segunda mayor frecuencia y por tanto la segunda
barra más alta y así sucesivamente.

17
Trabajo de la Unidad II Fernando A. Contreras J.

80

100

Porcentaje
60

40

50

29
Frecuencia

20

15

9
7
0 5 0
A B C D E F

Factores que inciden en el proceso

Se pude observar que los factores determinantes de incidencia en el proceso (examen


de estadística) fueron el grado de dificultad de la evaluación y el tiempo que se dio para
responderla.

“Coeficiente de Variación”

Es una medida que permite comparar las variaciones proporcionales o dispersiones


entre dos o más conjuntos de datos. Esta medida no es afectada por los diferentes
sistemas de unidades de medida de donde fueron extraídos los datos de las muestras a
comparar. Este coeficiente se define por la ecuación:

C.V. =  S .100%
X

“Ejemplo 14”: Se tienen dos muestras de pesos; una de pesos de elefantes y otra de peso
de ratones. Se calculó el promedio del peso de los elefantes en donde se obtuvo un peso
de 24.000 libras con una desviación estándar de 1285 libras. Por otro lado se calculó el
promedio del peso de los ratones en donde se obtuvo un peso de 1,05 libras con una
desviación estándar de 0,16 libras. ¿Quién presenta una mayor variación en los pesos,
los elefantes o los ratones?

Se calcula el coeficiente de variación de cada uno de ellos:

1285
C.V. Elefantes =  x 100% = 5,4%
24000

0,16
C.V. Ratones =  x 100% = 15,2%
1,05

Se concluye que se presenta mayor variación en los pesos de los ratones.

18
Trabajo de la Unidad II Fernando A. Contreras J.

“Estandarización de una Variable”

Supóngase que se consideran los datos de dos variables diferentes X1 y X2, las cuales
están expresadas en diferentes unidades, o simplemente sus centros físicos y sus
varianzas no son los mismos. Se plantea la interrogante: ¿Cómo comparar dos elementos
x1 y x2, tomados respectivamente, de cada una de estas variables mencionadas? La
respuesta es, estandarizando las variables para llevarlas a un mismo sistema, con una
escala de medida común. Esto es, la variable “X” se puede estandarizar convirtiéndose en
una variable estandarizada “Z”. La variable “Z” no tiene unidades y se utiliza para
realizar comparaciones relativas entre los elementos particulares de una distribución. El
valor de “Z” esta dado por la ecuación:

x X
Z =
S
“Ejemplo 15”: Se sabe que Alejandra obtuvo 84 puntos en un examen de estadística
donde el promedio del curso fue 76 puntos con una desviación estándar de 10 puntos.
En matemática Alejandra obtuvo una calificación de 90 puntos donde el promedio del
curso fue de 82 puntos con una desviación estándar de 16 puntos. ¿En qué asignatura,
Alejandra obtuvo una puntuación relativamente más alta?

Se tiene que las calificaciones de Alejandra son:

x Estadística = 84 puntos
x Matemática = 90 puntos

Se calculan los valores estandarizados “Z” que corresponden a las calificaciones


relativas obtenidas en cada asignatura.

x–X 84 – 76
ZEstadística =  =  = 0.80
S 10

x–X 90 – 82
ZMatemática =  =  = 0.50
S 16

Gráficamente, éstos resultados se pueden ilustrar a través de una curva normal:

Curva Normal Estandarizada

Se concluye que la calificación en


Z = 1 Estadística estuvo relativamente
mejor que la calificación en
Matemática.
Z
Z = 0 ZM = 0.5 ZE = 0.8

19
Trabajo de la Unidad II Fernando A. Contreras J.

“Ejemplo 16”: Realice los dos apartados siguientes;

A) Utilice los datos tabulados de la distribución de frecuencias de la “Tabla A” del


~
“Ejemplo 6” para calcular la media ( X ), la mediana ( X ), moda ( X̂ ) y la Varianza (S2).

“Desarrollo”

Nótese que los datos de la “Tabla A” del “Ejemplo 6” corresponden a datos


agrupados (n  30) y están organizados en una tabla de distribución de frecuencias.

Cálculo de la Media

Clases Intervalos Limites Reales fi Xi fi Xi


Clase 1 53 – 55 52.5 – 55.5 2 54 108
Clase 2 56 – 58 55.5 – 58.5 5 57 285
Clase 3 59 – 61 58.5 – 61.5 9 60 540
Clase 4 62 – 64 61.5 – 64.5 15 63 945
Clase 5 65 – 67 64.5 – 67.5 12 66 792
Clase 6 68 – 70 67.5 – 70.5 5 69 345
Clase 7 71 – 73 70.5 – 73.5 2 72 144

 f .X i i
108  285  540  945  792  345  144
X i 1
= = 63.18
50 50
Se concluye que el promedio de las estaturas de los 50 alumnos del curso de
Estadística de la UNET es de 63.18 pulgadas aproximadamente.

Cálculo de la Mediana

Clases Intervalos Limites Reales fi Fi


Clase 1 53 – 55 52.5 – 55.5 2 2 F(m – 1)
Clase Medianal Clase 2 56 – 58 55.5 – 58.5 5 7
Clase 3 59 – 61 58.5 – 61.5 9 16
Clase 4 62 – 64 61.5 – 64.5 15 31
Clase 5 65 – 67 64.5 – 67.5 12 43
fm
Clase 6 68 – 70 67.5 – 70.5 5 48
Clase 7 71 – 73 70.5 – 73.5 2 50

Se calcula la clase medianal:

n 50
= = 25; se busca en la casilla de Fi de menor valor que la contenga. En éste
2 2
n
caso F4 = 31 la contiene = 25  F4 = 31; por lo tanto la “Clase 4” es la clase
2
20
Trabajo de la Unidad II Fernando A. Contreras J.

medianal. Luego se sustituye los valores de la formula usando los datos de la clase
medianal.
50
~  16
X = 61.5  2 .3 = 63.3
15

Se concluye que el 50% de los estudiantes el curso de Estadística de la UNET tiene su


estatura por debajo o por encima de 63.3 pulgadas aproximadamente.

Cálculo de la Moda
Frecuencia que antecede a
Clases Intervalos Limites Reales fi la clase modal
Clase 1 53 – 55 52.5 – 55.5 2
Clase Modal Clase 2 56 – 58 55.5 – 58.5 5
Clase 3 59 – 61 58.5 – 61.5 9
Clase 4 62 – 64 61.5 – 64.5 15
Clase 5 65 – 67 64.5 – 67.5 12
Clase 6 68 – 70 67.5 – 70.5 5
Frecuencia que precede a
Clase 7 71 – 73 70.5 – 73.5 2
la clase modal

Se ubica la clase modal:

La casilla que posee la mayor frecuencia es f4 = 15. Por lo tanto la clase modal es la
“Clase 4”.

d1 = 15 – 9 = 5 6
Xˆ  61.5  .3  63.5
 63
d2 = 15 – 12 = 3

Se concluye que la mayoría de los estudiantes del curso de Estadística de la UNET,


tienen una estatura aproximada a 63.5 pulgadas.

“Representación Gráfica de la Mediana (Ejemplo 6)”

La mediana se representa gráficamente a través de la ojiva. Para ello se ubica la


posición de la mediana en el eje vertical (Fi); luego desde la posición de la mediana y
perpendicular a ésta y al eje vertical, se traza una línea que corte la gráfica, luego desde
ese punto de corte se traza una línea que corte en forma perpendicular el eje horizontal
~
que es donde se encuentra la mediana ( X ).

21
Trabajo de la Unidad II Fernando A. Contreras J.

“Representación Gráfica de la Moda (Ejemplo 6)”

La moda se representa gráficamente a través del histograma. Para ello se hacen dos
líneas rectas transversales que unen los vértices opuestos de las barras que están a cada
lado de la barra más alta con los vértices de la misma. Desde éste punto de corte se traza
una línea recta que corte el eje horizontal que es donde está la moda.

22
Trabajo de la Unidad II Fernando A. Contreras J.

Cálculo de la Varianza y la Desviación Estándar

Clases Intervalos fi Xi fi.Xi Xi2 fi.Xi2


Clase 1 53 – 55 2 54 108 2916 5832
Clase 2 56 – 58 5 57 285 3249 16245
Clase 3 59 – 61 9 60 540 3600 32400
Clase 4 62 – 64 15 63 945 3969 59535
Clase 5 65 – 67 12 66 792 4356 52272
Clase 6 68 – 70 5 69 345 4761 23805
Clase 7 71 – 73 2 72 144 5184 10368

  7 
2

S2 = 1  7
   i i
 i 1
f . X  

 i i 
2
f . X 
50  1  i 1 50 
 
 

Se calculan las partes de la fórmula por separado:

7
*  f i .X i
2
= 5832 + 16245 + 32400 + 59535 + 52272 + 23805 + 10368 = 200457
11

7
*  fi .X i = 108 + 285 + 540 + 945 + 792 + 345 + 144 = 3159
11

Luego :

1 
 200457  
3159 
2
 = 17.80
S2 =
50  1  50 

Se concluye que la varianza es de 17.80 pulgadas cuadradas.

“La Desviación Estándar”

S =  17.80 = 4.22

Se concluye que la desviación estándar es de 4.22 pulgadas.

23
Trabajo de la Unidad II Fernando A. Contreras J.

UNIVERSIDAD NACIONAL EXPERIMENTAL DEL TÁCHIRA


DEPARTAMENTO DE MATEMÁTICA Y FÍSICA

“Trabajo del Segundo Parcial”

(Valor de 50 puntos)

“Instrucciones”

El Presente Trabajo Consta de 15 preguntas de desarrollo. Las preguntas se


deben realizar a mano (con su puño y letra) y en hojas blancas tamaño carta,
entregadas en una carpeta con sus datos. El Trabajo es individual y tiene fecha
tope el día que se realice el segundo parcial de la asignatura.

1.) Las medidas realizadas a dos muestras de plantas de dos especies similares
(en cm.) fueron las siguientes:

Especie A 8.2 7.9 10.0 9.4 7.8 9.1 6.5 9.5 10.0 10.0 10.0 9.9
Especie B 7.3 8.1 9.4 8.3 7.1 8.0 8.3 8.0 8.9 7.9 8.3 6.1

Ordene en forma creciente y decreciente; luego represente las medidas de éstas


muestras en un mismo gráfico de puntos. Utilice “” para la Especie A y “”
para la Especie B.

2.) Se está estudiando la altura de los pinos de cierta edad en Mesa de Aura,
una localidad turística del Estado Táchira. Para ello se elige una muestra de 24
árboles cuyas alturas (en pies) fueron:

64 73 68 68 76 62
Población física: Árboles de Pino.
67 71 69 70 68 60
Población estadística: Altura.
65 68 66 68 67 71 Muestra: 24 Pinos de Mesa de Aura.
66 72 66 72 67 65

Organice éstos datos en un Rol de Frecuencias. Luego represente gráficamente


estos datos a través de:

a) Gráfico de Barras.
b) Gráfico Acumulativo.
c) Calcule: La Media, La Moda y La mediana.

3.) El número de empleados de una empresa de telecomunicaciones clasificados


según su deporte favorito esta dado por la tabla adjunta:

Deporte Fútbol Básquetbol Béisbol Natación Maratón Voleibol Ninguno


Frecuencia (fi) 15 11 9 5 7 6 6

24
Trabajo de la Unidad II Fernando A. Contreras J.

Represente estos datos en una tabla de frecuencia que contenga: frecuencia


acumulada, frecuencia relativa, % de frecuencia relativa, % de frecuencia relativa
acumulada. Luego represéntelos gráficamente a través de:

a) Un gráfico de torta (gráfico circular)


b) Un gráfico de barras

4.) Realice un proceso análogo al anterior con los datos correspondientes al


número de estudiantes de cierta universidad, clasificados de acuerdo a su lugar
de origen:

Lugar de Origen Frecuencia (fi)


Norteamericano 11000
Centroamericano 3000
Suramericano 8000
Europeo 5000
Asiático 5000
Australiano 1000

5.) Se juegan dos dados regularmente 70 veces y se registra la suma de puntos


obtenidos en cada jugada. Se dio la siguiente distribución de frecuencias:

Suma de Puntos de las


Caras Superiores 2 3 4 5 6 7 8 9 10 11 12 Total
Frecuencia (fi) 2 2 5 9 8 9 11 7 7 6 4 70

Organice éstos datos en un Rol de Frecuencias. Luego represente gráficamente


estos datos a través de:

a) Gráfico de Barras.
b) Gráfico Acumulativo.
c) Calcule: La Media, La Moda y La Mediana.

6.) Suponga que se les realiza un test de Geometría a 50 aspirantes a estudiar


Arquitectura en la Universidad Nacional Experimental del Táchira. Los resultados
fueron los siguientes:

74 44 49 33 34 33 76 58 68 39
29 41 45 32 83 58 73 47 40 26
37 47 69 53 55 58 49 45 65 47
54 50 51 66 80 73 57 61 56 50
38 45 51 44 41 68 45 93 43 17

Realice lo siguiente:

a) Construya una tabla de distribución de frecuencias.


b) Construya un histograma y el polígono de frecuencias
c) Construya el histograma de frecuencia acumulada y la ojiva
d) Calcule la media, la mediana, la moda, la varianza y desviación estándar.

25
Trabajo de la Unidad II Fernando A. Contreras J.

Luego, realice una representación gráfica de la mediana y la moda.

7.) Los siguientes datos corresponden a los pesos en Kg. de un grupo de 45


alumnos de Estadística de la Universidad Nacional Experimental del Táchira:

59.7 57.5 62.3 73.1 52.9 66.3 51.4 60.7 45.9


55.6 58.0 52.3 63.5 52.6 60.1 55.3 55.2 55.5
52.6 54.5 51.8 66.9 54.9 63.9 59.4 59.3 58.6
53.6 65.7 54.8 51.2 55.5 48.2 58.3 52.4 58.8
59.4 54.5 50.7 52.8 50.3 46.8 62.9 49.3 52.5

Realice un proceso análogo al anterior.

8.) Construya un diagrama de Pareto para representar los factores que influyeron
en la venta de un producto de diferente marca, cuando se les preguntó a los
consumidores del mismo, las causas de su falta de preferencia por el mismo:

Factores Relacionados Frecuencia


Presentación en su empaque (D) 15
Falta de mejora en su sabor (A) 35
Alto costo (B) 19
Poca cantidad del mismo (E) 11
Alto costo (C) 17
Otros (F) 5

9.) Considérese la tabla adjunta:

Estudiantes Color Preferido Índice Académico # de Asignaturas Inscritas Procedencia


María Azul 7.8 7 Táriba
Amelia Verde 5.3 6 Palmira
Luis Blanco 6.2 5 San Cristóbal
Angélica Azul 7.1 6 Rubio
José Rojo 6.4 4 Rubio
Jorge Amarillo 7.9 5 Palmira
Alejandra Verde 8.4 6 San Cristóbal
Andreina Rojo 6.9 4 Mérida
Roberto Azul 5.5 3 San Cristóbal
Marta Amarillo 6.9 5 Capacho
Paulina Blanco 6.4 6 San Cristóbal

Realice una representación gráfica adecuada de cada una de estas variables (un
gráfico aparte por cada variable, elija el grafico de su preferencia).

10.) Considérese la tabla adjunta:

26
Trabajo de la Unidad II Fernando A. Contreras J.

Supermercado A Supermercado B Supermercado C Supermercado D


87 80 79 82
76 71 77 68
54 57 60 62
76 75 72 39
34 39 44 33

Realice una representación gráfica adecuada a los datos (puede ser un gráfico de
cuatro barras por cada supermercado dentro de un contexto grafico total que tendría 20
barras por todos).

11.) Supóngase que las ventas de una empresa de telecomunicaciones se ilustran


en el cuadro adjunto,

Año Ventas
2001 El doble (2) de las ventas del 2000
2002 Tres medios (3/2) de las ventas del 2001
2003 Cuatro quintos (4/5) de las ventas del 2002
2004 Cinco cuartos (5/4) de las ventas del 2003
2005 Tres medios (3/2) de las ventas del 2004
2006 Siete tercios (7/3) de las ventas del 2005
2007 Tres medios (3/2) de las ventas del 2006
2008 Siete quintos (7/5) de las ventas del 2007
2009 El doble (2) de las ventas del 2008
2010 Cinco cuartos (5/4) de las ventas del 2009

Calcule la media geométrica (el promedio proporcional) de las ventas en estos


años.

12.) Considérese el cuadro adjunto que contiene las calificaciones de un


estudiante de la Universidad Nacional Experimental del Táchira de un semestre
culminado.

Asignatura Calificación
Matemática I 5
Estudios Generales 8
Idiomas I 6
Lenguaje Y Comunicaciones 9
Lógica 7
Informática 6
Algebra 5

Calcule el promedio ponderado de estas calificaciones.

13.) Supóngase que un mayorista ha gastado Bs. 300.000 en productos en cada


una de tres sucursales diferentes, tal y como se ilustra en la tabla adjunta,

27
Trabajo de la Unidad II Fernando A. Contreras J.

Tienda Precio por producto


Sucursal 1 Bs. 27.000
Sucursal 2 Bs. 25.000
Sucursal 3 Bs. 20.000
Sucursal 4 Bs. 75.000
Sucursal 5 Bs. 40.000
Sucursal 6 Bs. 35.000
Sucursal 7 Bs. 15.000

¿Cuál es el precio promedio que el mayorista ha pagado por estos productos?

14.) Supóngase que se tienen dos muestras de estaturas (medidas a lo largo) de 2


especies de hormigas (en mm):

Especie A 1.2 0.9 1.0 1.4 0.8 1.1 0.5 1.5 1.0 1.0 1.2 0.9
Especie B 3.3 2.1 3.4 2.3 3.1 4.0 2.3 3.0 3.9 2.9 2.3 3.1

¿Qué especie presenta una mayor variación en las medidas, la hormiga de


Especie A o la hormiga de Especie B?

15.) Supóngase que Luis obtuvo 63 puntos en un examen de Mecánica donde el


promedio del curso fue 58 puntos con una desviación estándar de 7 puntos. En
Termofluidos Luis obtuvo una calificación de 80 puntos donde el promedio del
curso fue de 78 puntos con una desviación estándar de 11 puntos. ¿En qué
asignatura, Luis obtuvo una puntuación relativamente más alta?

28