Vous êtes sur la page 1sur 10

TERCER SEMESTRE DE LICENCIATURA EN INFORMTICA. CENTRO UNIVERSITARIO DE LOS ALTOS. CAPITULO I. DESCRIPCION DE UN CONJUNTO DE DATOS. CONCEPTOS.

ESTADSTICA: Es una disciplina de las matemticas cuyo objetivo es analizar la informacin obtenida a fin de poder obtener un resultado mediante el mtodo de anlisis para la toma de decisiones. ESTADSTICAS: Son los resultados de los eventos que debern ser sujetos a un anlisis estadstico. POBLACIN: Es un conjunto entero de datos. Las poblaciones pueden ser de tipo finitoo infinito. Ejemplo: Finito: Nmero de alumnos de un grupo. Infinito: Los nmeros. TOMA DE DATOS: Es un conjunto o una coleccin de datos que no han sido ordenados numricamente. Ejemplo: Un edificio tiene 15 apartamentos con el siguiente nmero de inquilinos: 2,1,3,5,2,2,2,1,4,2,6,2,4,3,1 DISTRIBUCIONES DE FRECUENCIAS. Estas pueden utilizarse cuando el nmero de datos es mayor que 30. Para ellos se recomienda utilizar el siguiente procedimiento: igual al dato mayor menos el dato menor. Rango = Dato mayor - Dato menor. aproximada el nmero de clases, el cual se divide el rango entre un valor arbitrario. Nmero de clases = ___Rango_____ X = valor arbitrario. clases y se calculan las frecuencias absolutas y frecuencias relativas. MARCAS DE CLASE. Estas se obtienen sumando el limite real inferior mas el limite real superior y el resultado se divide entre 2. LIMITES REALES SUPERIORES E INFERIORES. Estos se obtienen sumando 0.5 a los limites superiores y restando 0.5 a los limites inferiores. LONGITUD TAMAO O ANCHURA DE CLASE (c). Este se obtiene restando el limite real superior menos el limite real inferior para cada clase. Ejemplo 1. Supongamos que las temperaturas en grados Fahrenheit medidas a las 6 de la tarde durante un periodo de 35 das son las siguientes: DATOS AGRUPADOS.

72 82 92 92 81

78 81 83 93 77

86 77 76 84 73

93 87 78 107 76

106 82 73 99 80

107 91 81 94 88

98 95 86 86 91

Hacer una distribucin de frecuencias. Rango= 107 - 72 = 35 Nmero de clases = Rango = 35 = 7 clases aproximadamente. X=5 5 DISTRIBUCIN DE FRECUENCIAS. M ar ca de Cl as e Li mi te Re al Inf eri or Lim ite Re al Su per ior Frec uenc ia Rela tiva Acu mul ada

Cl as es 72 76

Frec uen cia Abs olut a

Frec uen cia Rela tiva

Frec uenc ia Acu mul ada

14.2 8% 3 7. 1 3 5 7. 1 3 6 8. 5

77 81

22. 85 %

7 9

7 6. 5

8 1. 5

1 3

82 86 87 91

20 % 11. 42 %

8 4

8 1. 5 8 6. 5

8 6. 5 9 1. 5

2 0

74

71. 5

76. 5

14.2 8

8 9

2 4

5 8 5. 6 9

92 96 97 10 1 10 210 6 10 711 1

17. 14 %

9 4

9 1. 5

9 6. 5 1 0 1. 5 1 0 6. 5 1 1 1. 5

3 0

5.7 1%

9 9

9 6. 5 1 0 1. 5 1 0 6. 5

3 2

9 1. 4 9 4. 2 5 9 9. 9 6

2.8 5%

1 0 4

3 3

5.7 1%

1 0 9

3 5

35 99.6% HISTOGRAMA Y POLGONO DE FRECUENCIAS. Es una representacin grfica mediante rectngulos cuyas bases corresponden a la longitud de la clase y las alturas a las frecuencias absolutas. HISTOGRAMAS: Se grafican en el eje horizontal las marcas de clase y en el eje vertical las frecuencias absolutas. POLGONO DE FRECUENCIAS: Es una representacin grfica que se obtiene en los puntos medios de los techos de los rectngulos, se unen con lneas rectas. POLGONO DE FRECUENCIAS RELATIVAS. Es una representacin grfica que se obtiene mediante las marcas de clase y las frecuencias relativas. DIAGRAMA DE PARETO. Es una representacin grfica en base a rectngulos, con la caracterstica de la mayor frecuencia absoluta hasta la menor. FRECUENCIAS ACUMULADAS. Estas se obtienen para cada una de las clases sumando la frecuencia absoluta de la clase actual mas la frecuencia o frecuencias absolutas anteriores. La grfica se llama OJIVA y esta se obtiene con los lmites reales superiores y las frecuencias acumuladas. MEDIDAS DE TENDENCIA CENTRAL. Entre las medidas de tendencia central ms comunes son: x ).

Las medidas de tendencia central son las que representan a un conjunto de datos. MEDIA ARITMTICA: Es aquella que se define como el promedio de un conjunto de datos. La media Aritmtica se obtiene tanto para datos agrupados como los no agrupados. DATOS NO AGRUPADOS:

Donde: X = Datos. N = Nmero total de datos. Ejemplo: 66, 100, 98, 96, 58, 94, 90 = 66, 100, 98, 96, 58, 94, 90 = 602 = 86. 77 DATOS AGRUPADOS:

Donde: X = Nmero de datos N = Nmero total de datos. f = Frecuencias absolutas. Ejemplo:

MODA: Es la medida de tendencia central que se define como el valor que se presenta con mayor frecuencia, es decir el ms comn. La moda para datos no agrupados presenta los siguientes casos: Caso 1: 2, 3, 3, 4, 4, 4, 5, 7, 8, 9. Moda = 4. Caso 2: 2, 5, 5, 6, 6, 7, 9, 16. Moda = 6, 5. Caso 3: 2, 4, 5, 6, 7, 8, 11. No existe Moda. La moda para datos agrupados presenta la siguiente formula:

Donde: L1 = Es el limite inferior de la clase que contiene la moda. 1 = Es la diferencia de la frecuencia modal menos la frecuencia de la clase contigua inferior. 2 = Es la diferencia de la frecuencia de la clase menos la frecuencia de la clase contigua superior. C = Es el tamao, longitud o anchura de clase. Ejemplo: 1=8-5=31=8-7=1 3 Moda = 76.5 + 5 = 76.5 + 3 (5) = 76.5 + 3.75 = 80.25 3+1 Moda = 80.25. MEDIANA: Es la medida que se define como el valor que divide a un conjunto de datos en dos partes iguales. La moda presenta los siguientes casos: Caso 1: (Conjunto impar). 2, 3, 4, 5, 7 , 7, 8, 9, 13 Mediana Mediana = 7 Caso 2: (Conjunto par ). 1, 3, 3, 6, 7, 8, 9, 15 6 + 7 = 13 = 6.5 2 Mediana = 6.5 Para calcular la mediana para datos agrupados se aplica la siguiente frmula: Mediana = L + N _ f C 2 fm Donde: L = Es el lmite real inferior de la clase que contiene la mediana. N = Es el nmero total de datos en el conjunto. f =Es la suma de las frecuencias acumuladas inferiores sin contar la frecuencia de la clase que contiene la mediana. C = Es el tamao, longitud o anchura de la clase. *NOTA: La clase que contiene la mediana se obtiene contando las frecuencias absolutas, de arriba hacia abajo y viceversa localizndola donde nos de la mitad de N. Ejemplo: 35 - 13

Mediana = 81.5 + 2 5 = 81.5 + (17.5 - 13 ) = 77 Mediana = 81.5 + 3.21 = 84.71 RELACION EMPRICA ENTRE MEDIA ARITMTICA, MODA Y MEDIANA.

86.57 - 80.25 " 3 (86.57 - 84.71) 6.32 " 5.58 MEDIDAS DE DISPERSIN. DISPERSIN: Es el grado en que los datos numricos tienden a extenderse alrededor de un valor medio. 3 X 85 AMPLITUD DE VARIACIN (RANGO). DESVIACIN MEDIA ABSOLUTA (D.M): Es la media aritmtica de los valores absolutos de las desviaciones con respecto a la media aritmtica. Para calcular las desviacin media para los datos no agrupados se utiliza la siguiente frmula:

N Donde: X = Datos = Media Aritmtica. | | = Valor absoluto. N = Nmero Total de Datos. Ejemplo: D.M = |66-86| + |100-86| + |98-86| + 96-86| + |58-86| + |94-86| + |90-86| 7 D.M = |20| + |14| + |12| + |10| + |28| + |8| + |14| =13.71 7 Para calcular la desviacin media para datos agrupados se utiliza la siguiente frmula:

Donde: X = Marcas de clase. f = Frecuencias Absolutas. = Media Aritmtica. N = Nmero total de datos en el conjunto. Ejemplo: D.M = 5|74-86.57|+8|79-86.57|+7|84-86.57|+4|89-86.57|+ 6|94-86.57|+2|99-86.57|+1|104-86.57|+2|109-86.57| = 35

D.M =|62.85|+|60.56|+|17.99|+|9.72|+|44.58|+|24.86|+|17.43|+|44.86|= 35 D.M = 282.85 = 8.08 35 DESVIACIN TIPICA O ESTNDAR: Se define como la raz cuadrada de la varianza. Para calcular las desviacin tpica para los datos no agrupados mayores de 30 se utiliza la siguiente frmula:

Para menores de 30:

Ejemplo:

Para calcular la desviacin tpica o estndar para datos agrupados se utiliza la siguiente frmula:

Donde: f1 = Frecuencia Absoluta. Ejemplo:

= 9.66 VARIANZA: Se define como la desviacin tpica o estndar elevada al cuadrado; su smbolo es 2. Ejemplo: 2 = (9.66)2 = 93.31 REGLA EMPRICA PARA UNA, DOS Y TRES DESVIACIONES TIPICAS: Para una desviacin tpica el porcentaje es del 68.27%

El porcentaje para 2 desviaciones tpicas es igual al 95.45%.

El porcentaje para 3 desviaciones tpicas es igual a 99.73%.

MODELO. El presidente de Ocean Airlines intenta hacer una estimacin de cuanto se tardar el Departamento de Aeronutica Civil en decidir acerca de la solicitud de la compaa sobre una nueva ruta entre la ciudad de Charlotte y Los Angeles. Los asesores del presidente han conseguido los siguientes tiempos de espera de las solicitudes hechas durante el ao anterior. Los datos estn en das desde la fecha de solicitud hasta la respuesta del D.A.C. 34 49 29 24 29 40 34 40 44 22 23 38 31 37 28 28 31 30 39 44 31 33 34 32 51 40 42 31 36 31 25 26 38 34 44 35 35 35 36 28 47 27 37 41 47 32 31 33 39 31

a) Construya ana distribucin de frecuencias utilizando 10 intervalos cerrados igualmente espaciados. Rango = 51 - 22 = 29 = 9.66 " 10 3 Limite Real Inferi or Limite Real Superi or Frecuenc ia Acumula da Frecuenc ia Relativa Acumula da

Clas es 21 24

Frecuenc ia Absoluta

Frecuenc ia Relativa

Marc a de Clase

6%

23

21.5

24.5

25 27 28 30 31 33 34 36 37 39 40 42 43 45 49 48 49 51

6%

26

24.5

27.5

12

12%

29

27.5

30.5

12

24

12

24%

32

30.5

33.5

24

48

16%

35

33.5

36.5

32

64

12%

38

36.5

39.5

38

76

10%

41

39.5

42.5

43

86

8%

44

42.5

45.5

47

94

9 1 0

4%

47

45.5

48.5

49

98

2%

50

48.5

51.5

50

100

50 100% Longitud = 3.

Vous aimerez peut-être aussi