Académique Documents
Professionnel Documents
Culture Documents
UNIDAD I
ESTADSTICA DESCRIPTIVA
1. INTRODUCCIN A LA ESTADSTICA
La palabra Estadstica proviene del latn status, que significa estado, posicin o
situacin; para responder a las necesidades que el Estado Romano tena con respecto a
la obtencin de informacin. Por Estadstica entendemos la coleccin de los datos que
caracterizan las condiciones predominantes en un estado o nacin: por ejemplo, el
nmero de nacimientos y muertes, las cosechas, el comercio exterior, etc.
Conclusin Verificacin
de la
consecuencia
Mtodo Estadstico
En un sentido estadstico, un elemento puede ser algo con existencia real, como un
automvil o una casa, o algo ms abstracto como la temperatura, un voto, o un intervalo
de tiempo. A su vez, cada elemento de la poblacin tiene una serie de caractersticas que
pueden ser objeto del estudio estadstico. As, por ejemplo si consideramos como
elemento a una persona, podemos distinguir en ella las siguientes cualidades o
caracteres: Sexo, Edad, Nivel de estudios, Profesin, Peso, Altura, Color de pelo, etc.
a) Poblacin finita: cuando el nmero de elementos que la forman es finito, por ejemplo, el
nmero de alumnos de un colegio, o un curso o clase.
Por lo tanto, el mtodo estadstico nos proporciona las tcnicas necesarias para
recolectar y analizar la informacin requerida, en la que se puede distinguir dos etapas:
a) Planificacin
Los pasos que conforman esta etapa pueden ser representados a travs del
esquema que se presenta a continuacin (representado en la Figura N 2).
Definir los
Objetivos
Definicin
del Universo
Diseo de la
Muestra
Def. unidad
observacin
Plan de
Tabulacin
Anlisis de
Datos
b) Ejecucin
Las funciones de la Estadstica son dos, y stas dan origen a dos categoras de
estadsticas: la Estadstica Descriptiva y a la Estadstica Inferencia o Inductiva.
La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo,
edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los
meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas
variables.
Cabe sealar, que el anlisis se limita a los datos recolectados y en ningn caso se
pretende hacer generalizaciones a poblaciones o a conjunto de datos distintos a los
tratados.
Por ejemplo, si se toma una muestra de 30 alumnos (al azar) de un colegio, del
anlisis de los datos recogidos se obtienen conclusiones para el colegio en su conjunto.
Para poder realizar adecuadamente estas tres tareas, se debe tener en cuenta el
tipo de datos con el que se trabaja, es decir, el tipo de tabla, grfico y medida de resumen
que se utilizarn; lo cual depende del tipo de variable que se est analizando
estadsticamente.
Dado lo anterior, lo principal ser definir los tipos de variables que existen y sus
principales caractersticas.
Las variables pueden ser clasificadas segn el tamao del recorrido y la escala de
medicin, de la variable en cuestin. Lo que nos permite encontrar el mtodo correcto
para tratar los datos recolectados.
1
Las Medidas de Resumen es un valor representativo o tpico ce los datos observados, que es fijo para cada poblacin,
y que recibe el nombre de estadstico.
2. Variable Discreta: son las variables que pueden tomar un nmero finito o
infinito numerable de valores, es decir, puede tomar cualquier valor entero,
por ejemplo: nmero de hijos en una familia, nmero de alumnos en un
curso, nmero de asignaturas en la carrera, etc.
3. Variable Continua: son aquellas variables que pueden tomar cualquier valor,
de hecho su recorrido es infinito. Es decir, entre dos valores cualquiera
podemos, potencialmente, observar un tercero, por ejemplo: entre el 0 y 1,
existe un nmero infinito de nmeros. Como ejemplos de estas variables
encontramos el ingreso, el valor de los aranceles universitarios, consumo de
electricidad, edad, estatura, peso, etc.
Muchas veces, una variable continua se trabaja como variable discreta, para
propsitos del anlisis. Por ejemplo, es posible trabajar la variable continua edad
como variable discreta al hablar de aos cumplidos, es as como, el ingreso
tambin puede ser trabajado como variable discreta al subdividirlo en categoras que
suelen ser referidas como estratos socio-econmicos.
1. Escala nominal: en donde las observaciones para una variable slo pueden
ser clasificadas en una de varias clases mutuamente excluyente y
exhaustivas.
Clasificacin de variables
Cuantitativas (intervalares)
Continuas Discretas
2. ESTADSTICA DESCRIPTIVA
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
Intervalos Frecuencia
(Cantidad de dinero) (Nmero de alumnos con
esa cantidad de dinero)
0 - 500 16
500 - 1000 6
1000 - 1500 3
1500 - 2000 2
2000 - 2500 1
2500 - 3000 1
3000 - 3500 0
3500 - 4000 0
4000 - 4500 0
4500 - 5000 0
5000 - 5500 1
Una vez presentados los tipos de tablas, es posible ahondar en el tpico de Tablas
de Frecuencias, comenzando desde su construccin hasta su anlisis.
Ttulo de la Tabla
a) Ttulo de la Tabla
b) Nombre de la variable
c) Categora de la variable
Para una variable cuyo nivel de medicin es nominal, entonces las categoras de la
variable se colocan en forma arbitraria (no importa el orden que se le de). Ejemplo: la
categora de la variable estado civil de las personas de una muestra pueden ser
soltero(a), casado(a), viudo(a) o separado(a). Luego, se asignan nmeros a estas
categoras -no importando el orden-, donde soltero puede ser el nmero 1 2 3 4.
Para los otros tipos de variables, de escala de medicin ordinales, los valores de
estas se deben anotar respetando el orden implcito (mayor o menor). Por ejemplo, al
estudiar el estatus socio-econmico de una muestra de familias la variable puede tomar
las categoras de bajo, medio o alto. Luego, se asignan nmeros a las categoras
respetando su orden, bajo es 1, medio es 2 y alto es 3.
d) Tipo de Frecuencias
ni
pi =
n
Donde algebraicamente:
i i i i
ni 1 nj
Ni = nj =1
j Pi = pj =1
j = j =1
n
=
n j =1 n
= Ni
Ejemplo N 1
Como una forma de integrar estos conceptos, se presenta el siguiente ejemplo para
una variable nominal discreta, como el nmero de alumnos por carrera de un Centro de
Formacin Tcnica para el primer semestre del 2005.
Ejemplo N 2
Recordemos:
Frecuencia Acumulada Absoluta
Frecuencia Relativa 48 que representa la cantidad
0.107 que representa la proporcin acumulada de profesores con
con que ocurre la jerarqua de jerarqua de titular, asociado y
instructor. Clculo ni / n (6/56) asistente (8+16+24).
Ejemplo N 3
(*) El primer intervalo tiene una amplitud mayor, a necesidad del anlisis, a razn de la
cantidad de alumnos con nota inferior a 3,0.
k = 1 + 3.3 Log n
R = X mx X mn
R
Amplitud de k (a ) =
k
Donde:
k : es el nmero de intervalos
El lmite inferior del primer intervalo se escoge de una forma muy sencilla, ya que
ste representa, habitualmente, al Xmn, aunque puede ser tambin un valor inferior a
ste. Los lmites inferiores de las restantes clases, se obtienen sumando la amplitud del
intervalo al lmite inferior de la clase o intervalo anterior.
165 163 165 163 169 167 153 158 160 161
164 165 164 172 168 166 155 157 160 162
164 165 164 171 168 166 156 159 161 162
163 165 163 170 167 166 157 159 161 162
164 164 163 169 167 166 158 160 161 162
Se pide:
K = 1 + 3.3 log 50
K = 1 + 3.3 (1.698970004)
K = 6.6066 aprox.
R = Xmx - Xmn
= 172 - 153 = 19 pesos
Amplitud (a) = R / K
a = 19 / 7 = 2.714 aprox.
Lmite Real
170.5 = (170 + 171)
2
Lmites aparentes
B Frecuencia
B1 , B2 , B3, Bc Marginal
A Fila
A1
A2 FRECUENCIAS CONJUNTAS
A3 n ij ni
. p ij pi
. 100 * p i j 100 * p i
.
Bk
Frecuencia
Marginal nj , p j , 100 * p j Total (n)
Columna
Donde:
i = 1, k
j = 1, c
Ejemplo N 5
B = bj es fi(j) = nij/n.j
A = ai es f(i)j = nij/ni.
Ejemplo N 6
Sexo
Hombres ni pi
Carrera
Administracin - - -
Contabilidad 120 120 0.26
Publicidad 100 220 0.47
Finanzas 90 310 0.67
Dibujo Tcnico 150 460 1
Nota: Si la tabla resulta muy grande deberemos agrupar una o las dos variables en
intervalos de clase, del mismo modo que se ha sealado anteriormente (construccin de
intervalos).
Una forma de resumir los datos es por medio de las Tablas, sin embargo, la
estadstica descriptiva tambin nos permite resumir los datos a travs de la
Representacin Grfica. Este instrumento, es un complemento a las Tablas Estadsticas,
que buscan dar una impresin global, en forma visual y de rpida comprensin, de la
informacin obtenida.
Ejemplo N 7
ni
18
20
15 11
8
10
5 3
0.4
0.275
0.3
0.2
0.2
0.1 0.075
0
0-2 3-5 6-8 9-oms
Este tipo de grfico se utiliza para mostrar la posible asociacin entre dos o ms
variables discretas, en especial las variables de escala nominal u ordinal. Este grfico
presenta barras que se agrupan de acuerdo a una cierta clasificacin general,
determinada por el usuario.
Ejemplo N 8
30 Reprueban
20
10
0
Hombres Mujeres
Ejemplo N 9
Para ilustrar este tipo de grfico, se utiliza el mismo ejemplo que muestra la
distribucin de los estudiantes segn la aprobacin y sexo, del curso de Estadstica I, para
el primer semestre de 2005. Veamos cmo se construye un diagrama de barras divididas
utilizando estos datos.
pi
Aprueban
50
Reprueban
40
30
20
10
0
Hombres Mujeres
3.2 Grficos Sectoriales
Estos grficos nos permiten ver la distribucin interna de los datos que representan
una variable, en forma de porcentajes sobre un total. Se suele separar el sector
correspondiente al mayor o menor valor, segn lo que se desee destacar. Se pueden
presentar en dos o tres dimensiones.
Ejemplo N 10
40 %
Aprueban
60 % Reprueban
33,3 %
Aprueban
66,6 % Reprueban
3.3 Histogramas
En este tipo de grfico son muy importantes las reas de los rectngulos, porque
no representamos una barra correspondiente a un punto, sino que el ancho de la barra
representa a nuestro intervalo. As, si los intervalos son de la misma amplitud, la altura
suele corresponder a la frecuencia, pero si no es as, hay que modificar la altura para
mantener la proporcin entre la frecuencia y el rea.
Superficie ai * hi = K ni i = 1,2,3, .K
Altura hi = Kni
ai
Donde k es una constante cualquiera, pero la misma para todos los intervalos. Es
posible, que sta se elija arbitrariamente por conveniencia de clculo.
Ejemplo N 11
(*) El primer intervalo tiene una amplitud mayor, a necesidad del anlisis, debido a la baja
cantidad de alumnos con nota inferior a 3,0.
3.4 Pictogramas
Los pictogramas son grficos similares a los grficos de barras, pero con la
diferencia que en estos diagramas se emplea un dibujo en una determinada escala para
expresar la unidad de medida de los datos. Generalmente, este dibujo debe cortarse para
representar los datos.
Es comn ver grficos de barras, donde las barras se reemplazan por dibujos a
diferentes escalas, con el nico fin de hacer ms ilustrativo el grfico, estos tipos de
grficos no constituyen un pictograma.
Enero 2005
Cantidad Hermanos ni pi Ni Pi 100* pi
0 - 2 18 0.45 18 0.45 45 %
3 - 5 11 0.275 29 0.725 27,5%
6 - 8 8 0.2 37 0.925 20 %
9 - o ms 3 0.075 40 1 7,5%
Total 40 1 100 %
0 - 2 3 - 5 6 - 8 9 - ms Hermanos