Académique Documents
Professionnel Documents
Culture Documents
INSTRUCCIONES
Lea con detalle la presente guía, la misma comienza en la
página 1 y termina en la página 23. Luego, resuelva las
preguntas que vienen dadas al final, las mismas comienzan en la
página 24 y terminan en la página 28. La resolución de estas
preguntas son el trabajo, las cuales se deben presentar con su puño
y letra (es decir, a mano escrita). Los trabajos que se realicen en
letra de imprenta y/o en letra de computadora no serán recibidos.
El trabajo es individual, el mismo se debe realizar en hojas blancas
u otras, las cuales deben organizarse dentro de una carpeta. Se
tomara en cuenta el orden y la presentación del trabajo.
“Estadística”
“Estadística Descriptiva”
Se define como el conjunto de métodos que analizan una muestra conformada por una
colección de datos o determinadas características medibles, obtenidos de un colectivo de
personas u objetos de una naturaleza específica. El objetivo de la estadística descriptiva
es describir los datos en forma conveniente, útil y comprensible de las diversas
características de mencionado conjunto de observaciones.
Peso
Sexo
Edad
“Estas características medibles de la población física van a generar dato que van a ser
organizados por la estadística descriptiva”
“Desarrollo”
Estaturas
1.93 1.97 1.84 1.90 2.01 1.95 2.05
Luego obtiene algunas medidas que resumen y aportan una mayor información del
conjunto de estaturas del equipo selección:
1
Trabajo de la Unidad II Fernando A. Contreras J.
Luego realiza una representación gráfica que ilustra aún mejor el conjunto de datos
obtenidos:
Representación Gráfica
2,1
2,0
1,9
1,8
1 2 3 4 5 6 7
Jugad ores d el Eq ui po
A través del mecanismo de la bolsa con los papelitos, supóngase que se obtuvo la
muestra de tamaño 11 a partir de la cual se han obtenidos los datos ilustrados en la
tabla adjunta:
X1 X2 X3 X4 X5 X6
Clases Selección al azar Edad Sexo # de Hermanos Peso Estatura Deporte
Clase 1 07 (María) 17.8 F 3 60.5 1.65 Voleibol
Clase 2 19 (Amelia) 19.3 F 4 64.8 1.70 Natación
Clase 3 23 (Luís) 20.2 M 1 73.3 1.73 Básquet
Clase 4 11 (Angélica) 19.1 F 4 58.9 1.66 Voleibol
Clase 5 16 (José) 20.4 M 2 68.4 1.70 Fútbol
Clase 6 34 (Jorge) 18.9 M 3 83.5 1.81 Fútbol
Clase 7 03 (Alejandra) 19.4 F 0 68.6 1.73 Maratón
Clase 8 45 (Andreina) 21.9 F 2 61.4 1.55 Básquet
Clase 9 33 (Roberto) 23.5 M 1 75.7 1.67 Natación
Clase 10 49 (Marta) 18.9 F 5 50.3 1.63 Voleibol
Clase 11 17 (Paulina) 20.4 F 2 65.1 1.67 Básquet
2
Trabajo de la Unidad II Fernando A. Contreras J.
“Las mediciones dan pie a variables continuas y los conteos a variables discretas”
Peso 60.5 64.8 73.3 58.9 68.4 83.5 68.6 61.4 75.7 50.3 65.1
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11
Orden Creciente 50.3 58.9 60.5 61.4 64.8 65.1 68.4 68.6 73.3 75.7 83.5
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)
Orden Decreciente 83.5 75.7 73.3 68.6 68.4 65.1 64.8 61.4 60.5 58.9 50.3
X(11) X(12) X(9) X(8) X(7) X(6) X(5) X(4) X(3) X(2) X(1)
3
Trabajo de la Unidad II Fernando A. Contreras J.
Sexo F F M F M M F F M F F
Deporte Voleibol Natación Básquet Voleibol Fútbol Fútbol Maratón Básquet Natación Voleibol Básquet
“Desarrollo”
El círculo se divide en sectores cuyas áreas son proporcionales a los datos que se
quieren representar. Normalmente se utiliza cuando hay pocas clases o categorías.
Área Porcentaje
“Para Dividir el Área del Circulo” “Para Determinar el Porcentaje del Área”
4
Trabajo de la Unidad II Fernando A. Contreras J.
El gráfico de barras está formado por rectángulos en los que la base del rectángulo representa
una clase y la altura del rectángulo es la frecuencia de la clase.
3,5
3,0
2,5
2,0
Número de Alumnos
1,5
1,0
,5
Básquet Fútbol Maratón Natación Voleibol
# de Hermanos 3 4 1 4 2 3 0 2 1 5 2
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)
5
Trabajo de la Unidad II Fernando A. Contreras J.
“Desarrollo”
La nomenclatura de la tabla es: frecuencia (fi) con que se repite cada observación,
frecuencia acumulada (Fi), la frecuencia relativa (fi/n), la frecuencia relativa acumulada
(Fi/n), el porcentaje de la frecuencia relativa ((fi/n).100) y el porcentaje de la frecuencia
relativa acumulada ((Fi/n).100).
“Representación Gráfica”
6
Trabajo de la Unidad II Fernando A. Contreras J.
“Ejemplo 6”: Supóngase que un investigador desea describir las estaturas en pulgadas
de 50 estudiantes de un curso de “Estadística” de la Universidad Nacional Experimental
del Táchira dadas en el cuadro adjunto:
“n = 50”
61 63 65 63 69 67 53 58 60 65
Estaturas de los 64 65 64 72 68 66 55 57 66 62
“50” estudiantes 62 65 64 71 68 66 56 59 61 64
de estadística de 63 65 63 62 67 60 57 59 61 62
la UNET. 64 64 63 69 67 66 58 60 61 70
7
Trabajo de la Unidad II Fernando A. Contreras J.
K : # de clases
K = 1 + 3.322Log10(n)
Log10(n) : Logaritmo en base 10 de “n” (el número de
datos considerados)
En otro caso, usted mismo puede asignar el número de clases, el cual se recomienda este
comprendido entre 5 y 15 clases, cuando se tenga un número de datos mayor o igual a 30.
2.) Para obtener la longitud del intervalo de clases, se puede usar la formula:
A K : # de clases
lI.C. = A : Amplitud
K lI.C. : Longitud del Intervalo de Clase para la Fórmula de
Sturges.
“X1, X2, X3, . . . , Xk son las “marcas de clase de las k clases”; es decir, los Xi
para i = 1, 2, 3, . . . , k”
K = 1 + 3.322Log10(50) = 6.64 7
19
Luego, la longitud del intervalo de clase queda: lI.C. = = 2.7 3 lI.C. 3
7
8
Trabajo de la Unidad II Fernando A. Contreras J.
“Tabla A”
f3 = 9 es la frecuencia de la Clase 3
F4 = 31 es la Frecuencia Acumulada de la Clase 4
X5 = 66 es la Marca de Clase de la Clase 5
n = Fk = f
i 1
i = F7 = 50
Nota: Para que exista continuidad en las barras del histograma, se utilizarán los límites
reales (L.r.) de cada clase. Obsérvese:
LI : Límite Inferior
LI – LS LS : Límite Superior
Clase i: Lri : Límite Real Inferior
Lri – Lrs Lrs : Límite Real Superior.
Lri = LI – 0.5
(En el caso de estar trabajado con cantidades enteras)
Lrs = LS + 0.5
9
Trabajo de la Unidad II Fernando A. Contreras J.
“Ejemplo 8”: Realice la ojiva correspondiente a la “Tabla A” de datos del “Ejemplo 2”.
“Desarrollo”
Para construir la ojiva y la curva percentilar es necesario construir una tabla que
contenga las clases, los intervalos de clase, los límites reales de cada intervalo, la
frecuencia acumulada y el porcentaje de frecuencia acumulada de cada clase.
10
Trabajo de la Unidad II Fernando A. Contreras J.
“Estimadores Poblacionales”
Son medidas que se calculan a las muestras con la finalidad de aproximarse de alguna
manera a los parámetros poblacionales. Algunos de los estimadores más importantes son:
La Media, La Mediana, la Moda, la Varianza y la Desviación Estándar.
La Media: Es aquella medida que representa un promedio o centro físico de los datos.
Esta se puede calcular cuando la variable en estudio es cuantificable numéricamente.
x i
n
k
f .X i i
Cálculo de la Media en datos agrupados en clases o categorías: X i 1
n
11
Trabajo de la Unidad II Fernando A. Contreras J.
x n 1 ; si n es impar
( )
2
~
Cálculo de la Mediana en X =
datos no agrupados: x n +
x n
( ) (( ) 1)
2 2
; si n es par
2
n
F( m1)
~ 2
Cálculo de la Mediana en datos X = Lri .lI.C.
fm
agrupados en clases o categorías:
12
Trabajo de la Unidad II Fernando A. Contreras J.
d1
Cálculo de la Moda en datos X̂ = Lri . lI.C.
d1 d 2
agrupados en clases o categorías:
¿Cómo encontrar la clase que contiene la moda (Clase Modal)? La clase modal es aquella
que tiene la clase con mayor frecuencia (fi).
Entre la Media, la Moda y la Mediana existe una relación aritmética que es válida para
datos que provienen de poblaciones estadísticas que son moderadamente sesgadas; esta
~
relación es: X Xˆ 3 X X
k
2
i i
f . X
= 1 k i 1
S2 i i
2
f . X
n 1 i 1 n
13
Trabajo de la Unidad II Fernando A. Contreras J.
Calificaciones 44 59 36 55 47 61 53 36 65 32 51
(n = 11) x1 x2 x3 X4 x5 x6 x7 x8 x9 x10 x11
~
Calcule la media ( X ), la mediana ( X ), moda ( X̂ ) y la varianza (S2) de las
observaciones dadas.
“Desarrollo”
Nótese que los datos dados corresponden a datos no agrupados; es decir, son pocos
(n < 15) y no están organizados en una tabla de de frecuencias.
Cálculo de la Media
Calificaciones 44 59 36 55 47 61 53 36 65 32 51
(n = 11) x1 x2 x3 X4 x5 x6 x7 x8 x9 x10 x11
11
x i
44 59 36 55 47 61 53 36 65 32 51
X i 1
= = 49
11 11
Cálculo de la Mediana
Calificaciones 32 36 36 44 47 51 53 55 59 61 65
(Orden Creciente) x(1) x(2) x(3) X(4) x(5) x(6) x(7) x(8) x(9) x(10) x(11)
~
X = x 111 = x(6) = 51
2
Cálculo de la Moda
Calificaciones 32 36 36 44 47 51 53 55 59 61 65
(Orden Creciente) x(1) x(2) x(3) X(4) x(5) X(6) x(7) x(8) x(9) x(10) x(11)
Nótese que al ordenar los datos en forma creciente se puede observar que la moda es
Xˆ 36 , ya que es el dato que más se repite.
14
Trabajo de la Unidad II Fernando A. Contreras J.
“En una colección de observaciones puede haber dos o tres modas; en este caso se está en
presencia de distribuciones bi-modales o tri-modales respectivamente”
Calificaciones 32 36 36 44 47 51 53 55 59 61 65
(Orden Creciente) x(1) x(2) x(3) X(4) x(5) X(6) x(7) x(8) x(9) x(10) x(11)
11
2
xi
1 11 2 i 1
Se tiene que: S2 = xi
11 1 i 1 11
11 2
xi = x12 x22 x32 x42 x52 x62 x72 x82 x92 x102 x112 =
i 1
= 322 362 362 442 472 512 532 552 592 612 652 = 27623
2
11
xi = (32 36 36 44 47 51 53 55 59 61 65)2 = 539
i 1
11
2
xi
1 11 2 i 1 1 (539) 2
Luego: S2 = xi = (27623)
11 1 i 1 11 11 1 11
S2 = 121.2 En consecuencia: S = 11.01
La Media Ponderada: Es aquella en la que cada elemento está afectado por un factor
de importancia o peso. Considérese la sucesión de datos x1, x2, x3, ..., xn y la sucesión
de factores de peso w1, w2, w3, . . ., wn. Entonces la media aritmética ponderada está
dada por:
w1 x1 w2 x2 w3 x3 ... wn xn
Xp
w1 w2 w3 ... wn
“Desarrollo”
Se tiene que: x1 = 5 ; x2 = 6 ; x3 = 8 ; x 4 = 9 ; x5 = 7
w1 = 5 ; w2 = 4 ; w3 = 3 ; w4 = 3 ; w5 = 2
15
Trabajo de la Unidad II Fernando A. Contreras J.
Año Ventas
2000 El doble (2) de las ventas de 1999
2001 Tres medios (3/2) de las ventas del 2000
2002 Cinco cuartos (5/4) de las ventas del 2001
“Desarrollo”
x1 = 2 ; x2 = 3/2 ; x3 = 5/4
Luego: 3 5 = 1.55
G 3 ( 2)
2 4
n
H
1 1 1 1
...
x1 x2 x3 xn
“Ejemplo 12”: Supóngase que un mayorista ha gastado Bs. 100.000 en carteras para
damas en cada una de tres tiendas diferentes, tal y como se ilustra en la tabla adjunta,
16
Trabajo de la Unidad II Fernando A. Contreras J.
¿Cuál es el precio promedio que el mayorista ha pagado por estas carteras para dama?
“Desarrollo”
Nótese que los datos se expresan como “tantos artículos por peso” y lo que se
quiere saber es “la cuantía pagada por artículo”. En este caso se aplica la media
armónica y el precio promedio pagado por artículo es:
3
H = = 300.000/11 = 27.272,73
1 1 1
+ +
20000 25000 50000
Se concluye que el precio promedio que el mayorista ha pagado por cartera para damas
es de aproximadamente Bs. 27.273.
“Diagrama de Pareto”
Es una forma sencilla de graficar, que permite encontrar de manera rápida y practica
la incidencia de algunos factores que afectan o influyen de forma determinante en un
proceso. En esta representación, se ilustran los datos a través de un gráfico de barras las
cuales van ordenas de mayor frecuencia a menor frecuencia, determinándose así, de
acuerdo a la frecuencia de las barras, las causas más importantes que afectan el proceso.
“Desarrollo”
17
Trabajo de la Unidad II Fernando A. Contreras J.
80
100
Porcentaje
60
40
50
29
Frecuencia
20
15
9
7
0 5 0
A B C D E F
“Coeficiente de Variación”
C.V. = S .100%
X
“Ejemplo 14”: Se tienen dos muestras de pesos; una de pesos de elefantes y otra de peso
de ratones. Se calculó el promedio del peso de los elefantes en donde se obtuvo un peso
de 24.000 libras con una desviación estándar de 1285 libras. Por otro lado se calculó el
promedio del peso de los ratones en donde se obtuvo un peso de 1,05 libras con una
desviación estándar de 0,16 libras. ¿Quién presenta una mayor variación en los pesos,
los elefantes o los ratones?
1285
C.V. Elefantes = x 100% = 5,4%
24000
0,16
C.V. Ratones = x 100% = 15,2%
1,05
18
Trabajo de la Unidad II Fernando A. Contreras J.
Supóngase que se consideran los datos de dos variables diferentes X1 y X2, las cuales
están expresadas en diferentes unidades, o simplemente sus centros físicos y sus
varianzas no son los mismos. Se plantea la interrogante: ¿Cómo comparar dos elementos
x1 y x2, tomados respectivamente, de cada una de estas variables mencionadas? La
respuesta es, estandarizando las variables para llevarlas a un mismo sistema, con una
escala de medida común. Esto es, la variable “X” se puede estandarizar convirtiéndose en
una variable estandarizada “Z”. La variable “Z” no tiene unidades y se utiliza para
realizar comparaciones relativas entre los elementos particulares de una distribución. El
valor de “Z” esta dado por la ecuación:
x X
Z =
S
“Ejemplo 15”: Se sabe que Alejandra obtuvo 84 puntos en un examen de estadística
donde el promedio del curso fue 76 puntos con una desviación estándar de 10 puntos.
En matemática Alejandra obtuvo una calificación de 90 puntos donde el promedio del
curso fue de 82 puntos con una desviación estándar de 16 puntos. ¿En qué asignatura,
Alejandra obtuvo una puntuación relativamente más alta?
x Estadística = 84 puntos
x Matemática = 90 puntos
x–X 84 – 76
ZEstadística = = = 0.80
S 10
x–X 90 – 82
ZMatemática = = = 0.50
S 16
19
Trabajo de la Unidad II Fernando A. Contreras J.
“Desarrollo”
Cálculo de la Media
f .X i i
108 285 540 945 792 345 144
X i 1
= = 63.18
50 50
Se concluye que el promedio de las estaturas de los 50 alumnos del curso de
Estadística de la UNET es de 63.18 pulgadas aproximadamente.
Cálculo de la Mediana
n 50
= = 25; se busca en la casilla de Fi de menor valor que la contenga. En éste
2 2
n
caso F4 = 31 la contiene = 25 F4 = 31; por lo tanto la “Clase 4” es la clase
2
20
Trabajo de la Unidad II Fernando A. Contreras J.
medianal. Luego se sustituye los valores de la formula usando los datos de la clase
medianal.
50
~ 16
X = 61.5 2 .3 = 63.3
15
Cálculo de la Moda
Frecuencia que antecede a
Clases Intervalos Limites Reales fi la clase modal
Clase 1 53 – 55 52.5 – 55.5 2
Clase Modal Clase 2 56 – 58 55.5 – 58.5 5
Clase 3 59 – 61 58.5 – 61.5 9
Clase 4 62 – 64 61.5 – 64.5 15
Clase 5 65 – 67 64.5 – 67.5 12
Clase 6 68 – 70 67.5 – 70.5 5
Frecuencia que precede a
Clase 7 71 – 73 70.5 – 73.5 2
la clase modal
La casilla que posee la mayor frecuencia es f4 = 15. Por lo tanto la clase modal es la
“Clase 4”.
d1 = 15 – 9 = 5 6
Xˆ 61.5 .3 63.5
63
d2 = 15 – 12 = 3
21
Trabajo de la Unidad II Fernando A. Contreras J.
La moda se representa gráficamente a través del histograma. Para ello se hacen dos
líneas rectas transversales que unen los vértices opuestos de las barras que están a cada
lado de la barra más alta con los vértices de la misma. Desde éste punto de corte se traza
una línea recta que corte el eje horizontal que es donde está la moda.
22
Trabajo de la Unidad II Fernando A. Contreras J.
7
2
S2 = 1 7
i i
i 1
f . X
i i
2
f . X
50 1 i 1 50
7
* f i .X i
2
= 5832 + 16245 + 32400 + 59535 + 52272 + 23805 + 10368 = 200457
11
7
* fi .X i = 108 + 285 + 540 + 945 + 792 + 345 + 144 = 3159
11
Luego :
1
200457
3159
2
= 17.80
S2 =
50 1 50
S = 17.80 = 4.22
23
Trabajo de la Unidad II Fernando A. Contreras J.
(Valor de 50 puntos)
“Instrucciones”
1.) Las medidas realizadas a dos muestras de plantas de dos especies similares
(en cm.) fueron las siguientes:
Especie A 8.2 7.9 10.0 9.4 7.8 9.1 6.5 9.5 10.0 10.0 10.0 9.9
Especie B 7.3 8.1 9.4 8.3 7.1 8.0 8.3 8.0 8.9 7.9 8.3 6.1
2.) Se está estudiando la altura de los pinos de cierta edad en Mesa de Aura,
una localidad turística del Estado Táchira. Para ello se elige una muestra de 24
árboles cuyas alturas (en pies) fueron:
64 73 68 68 76 62
Población física: Árboles de Pino.
67 71 69 70 68 60
Población estadística: Altura.
65 68 66 68 67 71 Muestra: 24 Pinos de Mesa de Aura.
66 72 66 72 67 65
a) Gráfico de Barras.
b) Gráfico Acumulativo.
c) Calcule: La Media, La Moda y La mediana.
24
Trabajo de la Unidad II Fernando A. Contreras J.
a) Gráfico de Barras.
b) Gráfico Acumulativo.
c) Calcule: La Media, La Moda y La Mediana.
74 44 49 33 34 33 76 58 68 39
29 41 45 32 83 58 73 47 40 26
37 47 69 53 55 58 49 45 65 47
54 50 51 66 80 73 57 61 56 50
38 45 51 44 41 68 45 93 43 17
Realice lo siguiente:
25
Trabajo de la Unidad II Fernando A. Contreras J.
8.) Construya un diagrama de Pareto para representar los factores que influyeron
en la venta de un producto de diferente marca, cuando se les preguntó a los
consumidores del mismo, las causas de su falta de preferencia por el mismo:
Realice una representación gráfica adecuada de cada una de estas variables (un
gráfico aparte por cada variable, elija el grafico de su preferencia).
26
Trabajo de la Unidad II Fernando A. Contreras J.
Realice una representación gráfica adecuada a los datos (puede ser un gráfico de
cuatro barras por cada supermercado dentro de un contexto grafico total que tendría 20
barras por todos).
Año Ventas
2001 El doble (2) de las ventas del 2000
2002 Tres medios (3/2) de las ventas del 2001
2003 Cuatro quintos (4/5) de las ventas del 2002
2004 Cinco cuartos (5/4) de las ventas del 2003
2005 Tres medios (3/2) de las ventas del 2004
2006 Siete tercios (7/3) de las ventas del 2005
2007 Tres medios (3/2) de las ventas del 2006
2008 Siete quintos (7/5) de las ventas del 2007
2009 El doble (2) de las ventas del 2008
2010 Cinco cuartos (5/4) de las ventas del 2009
Asignatura Calificación
Matemática I 5
Estudios Generales 8
Idiomas I 6
Lenguaje Y Comunicaciones 9
Lógica 7
Informática 6
Algebra 5
27
Trabajo de la Unidad II Fernando A. Contreras J.
Especie A 1.2 0.9 1.0 1.4 0.8 1.1 0.5 1.5 1.0 1.0 1.2 0.9
Especie B 3.3 2.1 3.4 2.3 3.1 4.0 2.3 3.0 3.9 2.9 2.3 3.1
28