Vous êtes sur la page 1sur 86

DESCRIPCIN DE LOS

CONJUNTOS DE DATOS
Dr. Rafael Maradiaga

TOMA DE DATOS
La toma de datos es la obtencin de una coleccin
de los mismos que no han sido ordenados
numricamente.
Ejemplo

www.themegallery.com

El conjunto de alturas de 100 estudiantes, sacados de una lista


alfabtica de una universidad.

TOMA DE DATOS
Entre la herramientas estadsticas que resultan
de particular utilidad para organizar los datos se
incluyen:
Tablas de frecuencias que colocan los todos los datos en clases
especificas.

www.themegallery.com

Diversos grficos que pueden proporcionar una representacin


visual de los datos.
Tablas de contingencia y diagramas de tallo y hoja, los cuales
tambin permiten la presentacin de un conjunto de datos de
manera concisa y discernible.

ORDENAMIENTO

ORDENAMIENTO
Es colocar los datos numricos tomados, en
orden creciente o decreciente de acuerdo a su
magnitud.

www.themegallery.com

La diferencia entre el mayor y el menor de los


nmeros se llama recorrido o rango de los datos.

ORDENAMIENTO
Ejemplo:
Si la altura mayor de los 100 estudiantes es 74
pulgadas y la menor es de 60 pulgadas, el rango
es de:

www.themegallery.com

74 60 = 14 PULGADAS

DISTRIBUCION DE
FRECUENCIA

DISTRIBUCION DE FRECUENCIA

www.themegallery.com

La informacin estadstica puede constar de un


gran nmero de observaciones y, mientras
mayor sea el nmero, mayor puede ser la
conveniencia y necesidad de presentarla en
forma resumida, la cual puede omitir algunos
detalles, pero en cambio puede revelar la
naturaleza general de la informacin.

DISTRIBUCION DE FRECUENCIA

www.themegallery.com

Cuando se dispone de gran nmero de datos, es


til distribuirlos en clases o categorias y
determinar
el
nmero
de
individuos
pertenecientes a cada clase, que es la
frecuencia de clase.

DISTRIBUCION DE FRECUENCIA

www.themegallery.com

Un ordenamiento tabular de los datos en clases,


reunidas las clases y con frecuencias
correspondientes a cada una, se conoce como
una distribucin de frecuencias o tabla de
frecuencias.
Una distribucin de frecuencias (o tabla de
frecuencias) ordenar los datos si estos se
dividen en clases y se registrar el nmero de
observaciones en cada clase.

www.themegallery.com

Alturas de 100 estudiantes en la Universidad


ALTURA (Pulg.)

Nmero de Estudiantes

60 62

63 65

18

66 68

42

69 71

27

72 - 74

TOTAL

100

La primera clase o categora, por ejemplo, comprende las alturas de


60 a 62 pulgadas y vienen indicadas por el smbolo 60 62.

DISTRIBUCION DE FRECUENCIA
Puesto que 5 estudiantes tienen una altura
perteneciente a esta clase, correspondiente
frecuencia de clase es 5.

www.themegallery.com

Los datos ordenados y resumidos como en la


distribucin de frecuencia anterior, se suelen
llamar datos agrupados.

DISTRIBUCION DE FRECUENCIA

www.themegallery.com

Aunque con el proceso de agrupamiento


generalmente se pierden parte del detalle
original de los datos, tiene la importante ventaja
de presentarlos todos en un sencillo cuadro que
facilita el hallazgo de las relaciones que pueda
haber entre ellos, puestas as de manifiesto.

NMERO DE CLASES

NMERO DE CLASES
En una tabla de frecuencias el nmero de clases
es algo arbitrario.

www.themegallery.com

En general una tabla debera estar entre 5 a 20


clases.
Muy pocas no revelaran ningn detalle sobre los
datos y demasiadas clases seria confuso como la
lista de datos originales.

NMERO DE CLASES
Se puede seguir una regla simple para aproximar
el nmero de clases a utilizar, C, es:

2 n
www.themegallery.com

INTERVALOS DE CLASE

INTERVALO DE CLASES
TABLA DE FRECUENCIA

Para la construccin original de una tabla de


frecuencias, el intervalo de clase puede
determinarse como:

www.themegallery.com

IC =

Valor ms grande Valor ms pequeo


nmero deseado de clases

INTERVALOS DE CLASE
Un smbolo que define una clase, tal como 60
62 de la tabla anterior, se conoce con intervalo
de clase

www.themegallery.com

Los nmeros extremos, 60 y 62, son los limites


de clase
El nmero menor 60 es el limite inferior de la
clase y el mayor 62 es el limite superior.

INTERVALOS DE CLASE
Los trminos clase e intervalo de clase se
utilizan a menudo indistintamente, aunque el
intervalo de clase es realmente un smbolo para
la clase.

www.themegallery.com

Un intervalo de clase que, al menos


tericamente, no tiene limite superior o inferior,
se conoce como intervalo de clase abierto.

INTERVALOS DE CLASE

www.themegallery.com

Por ejemplo, el referirse a la edad de grupos de


individuos el intervalo de clase, mayores de 65
aos es un intervalo de clase abierto.

LIMITES REALES DE CLASES

LIMITES REALES DE CLASE

www.themegallery.com

Si las alturas se registran con aproximacin de


pulgadas, el intervalos de clase 60 62
tericamente incluye todas la medidas desde
59.5000a 62.5000pulgadas.

LIMITES REALES DE CLASE

www.themegallery.com

Estos nmeros, representados brevemente por


los nmeros exactos 59.5 y 62.5 se conocen
como limites reales de clase o limites verdaderos
de clase El menor de ellos, 59.5 es el limite real
inferior y el mayor de ellos, 62.5 es limite real
superior.

LIMITES REALES DE CLASE

www.themegallery.com

Prcticamente, los limites reales de clase se


obtienen sumando al limite superior de un
intervalo de clase el limite inferior del intervalo de
clase contiguo superior y dividiendo por 2.

LIMITES REALES DE CLASE


A veces, los limites reales de clase se utilizan
para simbolizar las clases

www.themegallery.com

Por ejemplo: tomemos la tabla anterior

Limites de clase

www.themegallery.com

Alturas de 100 estudiantes en la Universidad

ALTURA
(Pulgadas)
60 62

Nmero
de Estudiantes
5

63 65

18

66 68

42

69 71

27

72 - 74

TOTAL

100

LIMITES REALES DE CLASE


Las diferentes clases de la primera columna
podrn iniciarse por:

www.themegallery.com

59.5 62.5
62.5 65.5
.
.

LIMITES REALES DE CLASE

www.themegallery.com

Sin embargo, con tal notacin aparece una


ambigedad, pues los lmites reales de clase no
coincidiran con las observaciones reales.

LIMITES REALES DE CLASE

www.themegallery.com

As si una observacin fuese 62.5 no seria posible


discernir si pertenece al intervalo de clase (59.5 62.5) o al (62.5 - 65.5)

TAMAO O ANCHURA DE UN
INTERVALO DE CLASE

TAMAO O ANCHURA DE UN INTERVALO DE CLASE

www.themegallery.com

El tamao o anchura de un intervalo de clase es


la diferencia entre los limites reales de clase que
lo forman y se conoce como anchura de clase,
tamao de clase o longitud de clase.

TAMAO O ANCHURA DE UN INTERVALO DE CLASE

www.themegallery.com

Si todos los intervalos de clase de una


distribucin de frecuencias tienen igual anchura,
esta anchura comn representa por C

TAMAO O ANCHURA DE UN INTERVALO DE CLASE

www.themegallery.com

En tal caso, C es igual a la diferencia entre dos


sucesivos limites de clase inferiores o superiores

TAMAO O ANCHURA DE UN INTERVALO DE CLASE

POR EJEMPLO:

www.themegallery.com

EL INTERVALO DE CLASE ES
C = 62.5 59.5 = 65.5 62.5 = 3

MARCA DE CLASE

MARCA DE CLASE

www.themegallery.com

La marca de clase es el punto medio del intervalo


de clase y se obtiene sumando los limites inferior
y superior de la clase y dividiendo por 2.

MARCA DE CLASE
As la marca de clase se llama tambin punto
medio de la clase

www.themegallery.com

As todas las alturas en el intervalo de clase 60 62


pulgadas se consideran como de 61 pulgadas.

REGLAS GENERALES PARA


FORMAR LAS DISTRIBUCIONES
DE FRECUENCIA

REGLAS
1. Determinar el mayor y el menor entre los
datos registrados y as encontrar el rango.

www.themegallery.com

(Diferencia entre el mayor y el menor de los datos)

REGLAS
2. Dividir el rango en un nmero conveniente de
intervalos de clase del mismo tamao.
El nmero de intervalos de clase se toma generalmente entre
5 y 20 dependiendo de los datos.

www.themegallery.com

Los intervalos de clase se eligen tambin en forma que las


marcas de clase o puntos medios coincidan con datos
realmente observados.
Eso tiende a reducir el llamado error de agrupamiento, en los
anlisis matemticos posteriores.
Sin embargo, los limites reales de clase muchas veces no
coincidirn con los datos observados.

REGLAS
3. Determinar el nmero de observaciones que
cae dentro de cada intervalo de clase, es
decir, encontrar las frecuencias
de clase.

www.themegallery.com

Lo mejor para esto es utilizar una hoja de conteo

HISTOGRAMS
Y
POLIGONOS DE FRECUENCIAS

HISTOGRAMS Y POLIGONOS DE FRECUENCIA


1.Un histograma de frecuencias consiste en una
serie de rectngulos que tienen
(a) sus bases sobre el eje horizontal (el eje x) con
centros en las marcas de clase y longitud igual al
tamao de los intervalos de clase.

www.themegallery.com

(b) superficie proporcionales a las frecuencias de clase.

HISTOGRAMS Y POLIGONOS DE FRECUENCIA

www.themegallery.com

2. Polgono de frecuencias es un grafico de lnea


trazado sobre las marcas de clase, pueden
obtenerse uniendo los puntos medios de los
techos de los rectngulos en el histograma.

HISTOGRAMS Y POLIGONOS DE FRECUENCIA

nmero DE ESTUDIANTES

www.themegallery.com

FRECUENCIA

40
30
20
10

58

61

64

67

70

ALTURAS

73

76

DISTRIBUCION DE
FRECUENCIAS RELATIVA

DISTRIBUCION DE FRECUENCIA

www.themegallery.com

La frecuencia relativa de una clase es la


frecuencia de la clase dividida por el total de
frecuencias de todas las clases y se expresa
generalmente como porcentaje.
Si las frecuencias en la anterior tabla de
frecuencias
se
sustituyen
por
las
correspondientes frecuencias relativas, la tabla
resultante se llama:

DISTRIBUCION DE FRECUENCIA

www.themegallery.com

distribucin de frecuencias relativas,


distribucin porcentual o
tabla de frecuencias relativas

DISTRIBUCION DE FRECUENCIAS
ACUMULADAS. OJIVAS

DISTRIBUCION DE FRECUENCIA
ACUMULADAS

www.themegallery.com

La frecuencia total de todos los valores menores


que el limite real superior de clase de un intervalo
de clase dado se conoce como frecuencia
acumulada hasta ese intervalo de clase inclusive.

DISTRIBUCION DE FRECUENCIA ACUMULADAS

www.themegallery.com

Una tabla que represente las frecuencias


acumuladas se llama distribucin de:

DISTRIBUCION DE FRECUENCIA ACUMULADAS

www.themegallery.com

Frecuencias acumuladas,
Tabla de frecuencias acumuladas o;
Brevemente distribucin acumulada.

www.themegallery.com

Alturas de 100 estudiantes en la Universidad


ALTURA
(Pulgadas)

nmero
de Estudiantes

Menor que 59.5

Menor que 62.5

Menor que 65.5

23

Menor que 68.5

65

Menor que 71.5

92

Menor que 74.5

100

TOTAL

100

Histogramas y polgonos de frecuencia

NMERO DE ESTUDIANTES

www.themegallery.com

FRECUENCIA

100
80
60
40
20

59.5

62.5 65.5 68.5 71.5


ALTURAS

74.5

DISTRIBUCION DE FRECUENCIA ACUMULADAS

www.themegallery.com

Un grafico que muestre las frecuencias


acumuladas menores que cualquier limite real
superior de clase trazado sobre los limites reales
superiores de clase se llama polgono de
frecuencias acumuladas u ojiva

DISTRIBUCION DE FRECUENCIA ACUMULADAS

www.themegallery.com

En algunos casos es preferible considerar una


distribucin de frecuencias acumuladas de todos
los valores mayores o iguales al limite real
inferior de clase de cada intervalo de clase.

DISTRIBUCION DE FRECUENCIA ACUMULADAS

www.themegallery.com

En este caso consideremos las alturas de 59.5


pulgadas o ms, 62.5 pulgadas o ms, esta a
veces se llama distribucin acumulada o ms
mientras que la considerada anteriormente es la
distribucin acumulada menor que.

DISTRIBUCION DE FRECUENCIA ACUMULADAS

www.themegallery.com

Las correspondientes ojivas se llaman o ms y


menor que.

DISTRIBUCION DE FRECUENCIA ACUMULADAS

www.themegallery.com

Siempre que nos refiramos a distribuciones


acumuladas u ojivas sin especificar, se entender
que son del tipo menor que

DISTRIBUCION DE FRECUENCIAS
RELATIVAS ACUMULADAS. Ojivas
porcentulaes

DISTRIBUCION DE FRECUENCIA RELATIVAS ACUMULADAS.


OJIVAS PORCENTUALES

www.themegallery.com

La frecuencia relativa acumulada o frecuencia


porcentual acumulada es la frecuencia
acumulada dividida por la frecuencia total.

CURVAS DE FRECUENCIA.
OJIVAS SUAVIZADAS

CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

www.themegallery.com

El conjunto de datos puede considerarse


normalmente como perteneciente a una muestra
extrada de una poblacin grande

CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

www.themegallery.com

A causa de las muchas observaciones que


podemos realizar en la poblacin es posible
tericamente (para datos continuos) elegir los
intervalos de clase muy pequeos y todava tener
un nmero adecuado de observaciones dentro
de la clase.

CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

www.themegallery.com

As se tiene que el polgono de frecuencias o el


de frecuencias relativas para una poblacin
grande puede estar formado por muchos
pequeos segmentos rectos que aproximan el
conjunto a una curva, las curvas de este tipo
pueden llamarse curvas de frecuencia o curvas
de frecuencia relativa, respectivamente.

CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

www.themegallery.com

Es razonable esperar que tales curvas tericas


provengan de la aproximacin a suavizar los
polgonos de frecuencias o de los polgonos de
frecuencias relativas de la muestra, la
aproximacin es tanto ms exacta conforme
aumenta el tamao de la muestra.

Por esta razn una curva se conoce como un


polgono de frecuencias suavizado.

CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

www.themegallery.com

normalmente es ms sencillo suavizar una ojiva


que un polgono de frecuencias.

TIPOS DE CURVAS DE
FRECUENCIA SUAVIZADAS

TIPOS DE CURVAS DE FRECUENCIAS

www.themegallery.com

Las curvas de frecuencias presentan


determinadas formas caractersticas que les
distinguen:

TIPOS DE CURVAS DE FRECUENCIAS.


a) las curvas de frecuencias simtricas o bien formadas se
caractersticas por el hecho de que las observaciones
que equidistan del mximo central tienen la misma
frecuencia.

www.themegallery.com

b) en las curvas de frecuencias moderadamente


asimetricas o sesgadas la cola de la curva a un lado
del mximo central es mayor que al otro lado.
c)

si la cola mayor se presenta a la derecha de la curva


se dice que esta sesgada a la derecha o que tiene
sesgo positivo, mientras que si ocurre lo contrario se
dice que la curva esta sesgada a la izquierda o que
tiene un sesgo negativo.

www.themegallery.com

TIPOS DE CURVAS DE FRECUENCIAS.


d)

en las curvas en forma de j o de j invertida, el


mximo se presenta en un extremo.

e)

las curvas de frecuencias en forma de u tienen un


mximo en ambos extremos.

f)

una curva de frecuencias bimodal tiene dos


mximos.

g)

una curva de frecuencias multimodal tiene ms de


dos mximos

PROBLEMS

PROBLEMA 1.
Sean los nmeros 17, 45, 38, 27, 6, 48, 11, 57,
34, 22:

www.themegallery.com

a) colocarlos en orden creciente y decreciente.


b) determinar el rango.

PROBLEMA 2.

www.themegallery.com

La puntuacin final en la clase de matemtica de


80 estudiantes en la universidad se registran en
la siguiente tabla:

www.themegallery.com

PROBLEMA 2.
68

84

75

82

68

90

62

88

76

93

73

79

88

73

60

93

71

59

85

75

61

65

75

87

74

62

95

78

63

72

66

78

82

75

94

77

69

74

68

60

96

78

89

61

75

95

60

79

83

71

79

62

67

97

78

85

76

65

71

75

65

80

73

57

88

78

62

76

53

74

86

67

73

81

72

63

76

75

85

77

PROBLEMA 2.
con relacin a esta tabla, encontrar:

www.themegallery.com

(a) la puntuacin ms alta,


(b) la puntuacin ms baja,
(c) el rango.
(d) las puntuaciones de los cinco estudiantes de mayor puntuacin.
(e) las puntuaciones de los cinco estudiantes de menor puntuacin.
(f) la puntuacin del decimo estudiante de mayor puntuacin.
(g) cuantos estudiantes obtuvieron puntuacin de 75 o mayor.
(h) cuantos estudiantes obtuvieron puntuacin menor de 85.
(i) que porcentaje de estudiantes obtuvo una puntuacin mayor
que 65 pero no mayor que 85.
(h) que puntuaciones no tienen ningn estudiante.

PROBLEMA 3.

www.themegallery.com

En la siguiente tabla se muestra una distribucin


de frecuencias de salarios semanales en dlares
de 65 empleados de la compaa M&M:

www.themegallery.com

PROBLEMA 3.
SALARIOS
(dlares)

nmero
de Empleados

50.00 59.00

60.00 69.00

10

70.00 79.00

16

80.00 89.00

14

90.00 99.00

10

100.00 109.00

110.00 119.00

PROBLEMA 3.
determinar:

www.themegallery.com

(a)
el limite inferior de la sexta clase,
(b)
el limite superior de la cuarta clase
(c) la marca de clase (o punto medio) de la tercera
clase.
(d) los limites reales de la quinta clase.

PROBLEMA 3.
determinar:

www.themegallery.com

(e)
tamao del quinto intervalo de clase,
(f) frecuencia de la tercera clase
(g) frecuencia relativa de la tercera clase.
(h) intervalo de clase que tiene mayor frecuencia.

PROBLEMA 3.
Determinar:

www.themegallery.com

porcentaje de empleados con salarios


menores a $80.00 por semana.
porcentaje de empleados con menos de
$100.00 pero con $60.00 semanales al
menos.

www.themegallery.com

PROBLEMA 3.

PROBLEMA 4.

www.themegallery.com

Si las marcas de clase en una distribucin de


frecuencias de pesos de estudiantes son:
128, 137, 146, 155, 164, 173 y 182 libras, hallar:

PROBLEMA 4

www.themegallery.com

(a) el tamao de intervalo de clase.


(b) los limites reales de clase,
(c) los limites de clase, suponiendo los pesos
medidos con aproximacin de unidad de
libra.
(d) representar grficamente los resultados.

Thank You !
www.themegallery.com

Vous aimerez peut-être aussi