Vous êtes sur la page 1sur 7

Por qu estudiar Estadstica?

El estudio de la Estadstica permite, entre otras cosas


Aprender las reglas y mtodos usados en el tratamiento de informacin
Evaluar y cuantificar la importancia de los resultados estadsticos obtenidos
Entender mejor algunos fenmenos de inters !ociales, Econmicos, "iolgicos, Educacionales, etc#$
%ar una visin m&s clara acerca de la informacin proveniente de diversas fuentes#
Algunos aspectos estadsticos manejados en la informacin obtenida de la radio, la televisin u otro medio, influencian fuertemente a gran cantidad de
personas pero a veces no proporcionan una descripcin cabal de los que pretenden mostrar#

'omo una de las tareas de la Estadstica es el estudio de fenmenos aleatorios, esto (ace muy pertinente el tratar de e)plicar la manera como se
comportan *ariabilidad$#
Entre otras cosas la Estadstica se ocupa del manejo de la informacin que pueda ser cuantificada# +mplica esto la descripcin de conjuntos de datos y la
inferencia a partir de la informacin recolectada de un fenmeno de inters# ,a funcin principal de la estadstica abarca-
.esumir, !implificar, 'omparar, .elacionar, Proyectar#
Entre las tareas que debe enfrentar un estudio estadstico est&n-
/# %elimitar con precisin la poblacin de referencia o el conjunto de datos en estudio, las unidades que deben ser observadas, las caractersticas o
variables que ser&n medidas u observadas#
0# Estrategias de 1bservacin- 'enso, 2uestreo, %ise3o de E)perimental#
4# .ecoleccin y .egistro de la informacin#
5# %epuracin de la informacin#
6# 'onstruccin de 7ablas#
8# An&lisis Estadstico-
9 Produccin de res:menes gr&ficos y numricos#
9 +nterpretacin de resultados#
'uando los datos comprenden toda la poblacin de referencia, (ablamos de un 'enso y cuando solo comprometen una parte de ella, (ablamos de una
muestra# En ambos casos es pertinente un an&lisis Descriptivo# En el segundo caso un an&lisis Inferencial#
A grandes rasgos podemos decir que una Poblacin es el conjunto de toda posible informacin, o de los objetos, que permite estudiar un fenmeno de
inters#
Ejemplo# En el caso de medir la calificacin promedio obtenida por los estudiantes de Estadstica + de la ;niversidad <acional de 'olombia !ede 2edelln,
en el semestre =0>0==4# ,a poblacin puede ser el conjunto de todas las notas posibles obtenidas por los estudiantes o el conjunto de todos los
estudiantes registrados en el curso en dic(o semestre# ,a caracterstica de inters que debe ser estimada es la <ota Promedio del curso en dic(o semestre#
;na muestra es un subconjunto de informacin representativa de una poblacin#
Ejemplo# En el caso de determinar la nota promedio, podramos optar por seleccionar de manera aleatoria un grupo de estudiantes de la poblacin y
observar de ellos la nota promedio obtenida al final del semestre# 'on estos datos podemos estimar la nota promedio global de todos los estudiantes en
dic(a poblacin 7odos los estudiantes de estadstica +$# El grupo de estudiantes seleccionados constituye una Muestra#
,as Variables resultan ser aquellas caractersticas de inters que desean ser medidas sobre los objetos o individuos seleccionados#
En la mayora de los casos lo que se pretende es estimar, a partir de la informacin recolectada de una muestra, caractersticas desconocidas de los
objetos en dic(a poblacin de inters#
Por ejemplo, estimar el costo de vida promedio en cierta comunidad, requiere de un despliegue muy grande de recursos, personal capacitado, dise3o de
encuestas o cuestionarios, ejecucin de la misma, tiempo empleado, etc# !in embargo una muestra representativa de los objetos de inters en dic(a
comunidad posiblemente (ogares$, permite registrar las caractersticas de los objetos seleccionados que permitir&n dar una apro)imacin del costo de vida
real en la comunidad# El costo promedio de vida en esta comunidad costo real$ constituye un Parmetro fijo que ata3e a la poblacin y el costo de vida
obtenido a partir de la muestra constituye una Estadstica o apro)imacin al valor real del par&metro#
,os par&metros son fijos, pues no dependen de ninguna muestra? los estadsticos dependen siempre de la muestra seleccionada#
,as caractersticas desconocidas de una poblacin ser&n llamadas par&metros# ,as caractersticas calculadas a partir de una muestra son llamadas
estadsticas# ;na Inferencia es una generali@acin obtenida a partir de una muestra aleatoria#
,a Estadstica puede dividirse en dos grandes ramas- Estadstica %escriptiva y Estadstica +nferencial#
Estadstica Descriptiva
Es el conjunto de mtodos usados para la organi@acin y presentacin descripcin$ de la informacin recolectada# ,a informacin recolectada puede ser
catalogada de dos maneras- %atos Cualitativos y Cuantitativos# ,os primeros se refieren a categoras o atributos que pueden clasificarse seg:n un criterio
o cualidad# Ejemplo- !e)o, 'olor de Auto, 7ipo de !angre, Estado civil, categora de un profesor, etc# ,os segundos se refieren a informacin numrica,
como cuanto o cuantos# Ejemplo- 2asa, estatura, Presin !angunea, duracin de un espcimen, etc#
Algunos datos numricos pueden ser clasificados como cuantitativos o cualitativos seg:n su uso# Por ejemplo, la estatura de una persona se mide en
centmetros, pies, metros y es entonces una medida cuantitativa# Pero si se mide como "ajo, 2edio y Alto, se convierte en una medida cualitativa#
,os datos cuantitativos pueden ser clasificados como %iscretos y 'ontinuos#
,os datos %iscretos est&n relacionados principalmente con conteos, ,os datos 'ontinuos se obtienen principalmente de mediciones# En el primer caso los
resultados conforman un conjunto discreto finito o numerable$, en el segundo caso el conjunto de posibles resultados est& conformado por un intervalo
real#
Ejemplo- El n:mero de ni3os en una familia, n:mero de accidentes por (ora en un cruce, n:mero de (oras dedicadas a estudiar semanalmente,
pulsaciones por minuto, n:mero de tiendas por man@ana, son datos de tipo discreto# ,a velocidad de un automvil en AmB(, la masa de una persona en Agr,
la estatura de cierto tipo de &rboles en pulgadas, tiempo de duracin de una batera en das, distancia de frenado en metros, edad de un individuo, son
datos de tipo continuo#
,os datos cualitativos a su ve@ pueden ser clasificados como <ominales y 1rdinales#
,os primeros son obtenidos por medio de agrupamientos no ordenados de datos en categoras discretas, usados principalmente en clasificacin o
identificacin# ,os segundos son obtenidos o medidos en una escala nominal ordenados de alguna manera# ;na escala ordinal coloca las medidas en
categoras, cada una de las cuales indica un nivel distinto respecto a un atributo que se est& midiendo#
Ejemplo- ,a ra@a, Estado civil, !e)o 2 o C$, .eligin, 7ipo de sangre, constituyen datos nominales# ,as categoras A, ", ', %, E como calificacin o niveles
de perfeccionamiento, categora de un profesor +nstructor asistente, +nstructor asociado, Profesor asistente, Profesor asociado y Profesor titular$, son datos
ordinales#
Organizacin de datos por medio de tablas de recuencia!
,a idea primordial de este proceso es simplificar la forma como se representa la informacin# ,a informacin puede mostrarse de dos maneras- "o9
agrupada y #grupada#
En aquellos casos donde la cantidad de valores de una o varias variables es muy grande, se (ace necesario resumirlos para una presentacin m&s
adecuada y en algunos casos agruparlos en clases, rangos o intervalos para facilitar su interpretacin#
,a frecuencia de una medida o de una categora es el n:mero de veces que esta aparece en una coleccin de datos# ;sualmente denotada f# ,a
informacin que contiene los valores de dic(as medidas y sus respectivas frecuencias se llamar& $abla de recuencias#
Ejemplo- !e tienen los datos respecto al n:mero de faltas a clase durante cierto perodo para los estudiantes de un curso de Estadstica- D E F E 5 4 0 / = 6
4 0 / / F 4 0 E F 8 8 5 4 0 0 = D 5 8 D 8 D 54 6 F 4 0 / 5 5 0# 'onstruya una tabla de frecuencias adecuada para estos datos#
G Caltas = / 0 4 5 6 8 F E D
Crecuencia 0 5 F 8 8 0 5 5 4 5
;na agrupacin de estos datos puede reducir m&s la presentacin-
G Caltas = / 9 0 4 9 5 6 9 8 F 9 E H D
Crecuencia 0 // /0 8 F 5
Ejemplo- En cierto (ospital se tiene informacin acerca del n:mero de personas que ocupan la sala de emergencias cada da en un perodo de /0 das# ,os
resultados observados son-
%a / 0 4 5 6 8 F E D /= // /0
G Pacientes F 54 E 00 /4 0E 48 /E 04 0/ /6 60
;na agrupacin de esta informacin puede ser-
'lase / I /= // I 0= 0/ I 4= 4/ 9 5= 5/ 9 6= H 6=
Crecuencia 0 4 5 / / /
,a manera como se agrupa la informacin debe corresponder a alg:n propsito particular de quien anali@a la informacin o requerimiento del investigador
conocedor de la informacin#
Medidas de %ocalizacin o de $endencia Central!
!uponga que se tiene un conjunto de datos numricos de la forma
1 2 n
X , X , , X L , donde cada
i
X corresponde al i9simo valor de la variable de
inters# ,as medidas de locali@acin permiten tener un panorama general de aquella o aquellas caractersticas de inters en una poblacin y al mismo
tiempo sirven como representacin del conjunto de datos#
Media Muestral# ,a media de un conjunto de observaciones
1 2 n
X , X , , X L , se denotar&
X
y est& dada por-
n
1 2 n
i
i 1
X X X
1
X X
n n
=
+ + +
= =

L
#
En trminos fsicos la media representa el 'entro de gravedad de un conjunto de datos#
Ejemplo- !e registra el n:mero de ta@as de caf consumidas por un empleado de oficina en un perodo de 0= das# ,os datos son- 5 6 4 8 F / 0 4 = 6 8 6 E
5 = 0 4 F 6 8# %e aqu tenemos que-
20
i
i 1
1 82
X X 4.1
20 20
=
= = =

# En promedio este empleado consume 5#/ ta@as de caf diarias# El siguiente gr&fico de puntos ilustra esta afirmacin#
Ejemplo- !e registran las edades en a3os$ de /6 personas en un grupo# ,os datos son- /E 0= /D /D 0/ 00 0= 04 0/ 05 /D 0= 00 0/ 05# ,a edad promedio
de este grupo es-
9 20 86 20
15
313
X # # J J
#
!i resumimos esta informacin en una tabla de frecuencias de la forma-
Edad /E /D 0= 0/ 00 04 05
Crecuencia / 4 4 4 0 / 0
Podemos calcular la media muestral como- 9 20
f
f X
15
f X
X
i
i i i i


# J J #
,a media muestral es sensible a datos e)tremos# Para los datos de edades, suponga que otrta persona ingresa al grupo y su edad es 46 a3os# As,
8 21 75 21
16
35 313
X # # J
K
J
# !i la edad fuera 56 a3os, entonces,
4 22 375 22
16
45 313
X # # J
K
J
# !i la edad es 8= a3os,
3 23 31 23
16
60 313
X # # J
K
J
#
Mediana# !i las observaciones se ordenan de menor a mayor,
n 2 1
X X X L #la mediana representa aquel valor que divide los datos en
dos partes porcentual mente iguales# %e esta manera al menos el 6=L de los datos son inferiores o iguales a la mediana# !i denotamos por
M
X
o por 2e,
la mediana, tenemos que-
Ejemplo# 'onsiderando las edades del ejemplo anterior, ordenamos la informacin en forma
ascendente- /E /D /D /D 0= 0= 0= 0/ 0/ 0/ 00 00 04 05 05# En este caso, como nJ/6,
entonces
21 X X Me
8
2
1 15
J J J
K
# Al menos el 6=L de las
personas en el grupo en cuestin tienen 0/ a3os o menos# ,a mediana a diferencia de la media muestral no es tan sensible a datos e)tremos# Por ejemplo
si otra persona de /= a3os (ace parte del grupo, tenemos nJ/8# As-
5 20
2
21 20
2
X X
Me
9 8
# J
K
J
K
J
# ,a interpretacin es igual# !i ,a persona
tiene 46 a3os, entonces
21
2
21 21
2
X X
Me
9 8
J
K
J
K
J
# !i la edad es 66 a3os, 21 Me J # 'omo se podr& observar, la mediana divide la
informacin en dos partes porcentualmente iguales# !i queremos dividir la informacin en cuatro partes porcentualmente iguales, cada parte representar& el
06L de la informacin# ,os valores reales que dividen la informacin en cuartos son llamadas Cuartiles y se denotan &', &( y &)#
%e esta manera N/ deja al menos el 06L de la informacin inferior o igual e el, N0 deja al menos el 6=L de la informacin menor o igual a el esta es la
2ediana$ y finalmente N4 deja al menos el F6L de la informacin inferior o igual a el#
!i la divisin se (ace en /== partes porcentualmente iguales, los valores reales que permiten esta divisin son llamados Percentiles# ;sualmente
denotados con la letra P y el respectivo percentil# Por ejemplo P/=, P06, PF=, etc#
Ejemplo# .etomando las edades de las /6 personas, calcule N/, P8= y PD=#
N/ corresponde al percentil 06, es decir, P06# El 06L de /6 datos es- 75 3 15 25 0 # J O # # En este caso escogemos 19 X 1 Q
4
J J # Para el
percentil 8=, tenemos que 9 15 60 0 J O # # As (ay dos valores que cumple la condicin de dejar al menos D valores iguales o inferiores a ellos-
10 9
X y X # As,
21
2
X X
60 P
10 9
J
K
J
# Para PD=, tenemos- 5 13 15 90 0 # J O # # As, 24 X 90 P
14
J J # Al menos el D=L de las
personas tienen edades inferiores o iguales a 05 a3os#
1tras medidas de ,ocali@acin son la 2oda, la 2edia .ecortada, la 2edia Peomtrica, entre otras#
Medidas de Variabilidad o de Dispersin#
,as medidas de variabilidad permiten establecer que tan dispersos est&n entre si un conjunto de datos observados# Algunas de estas medidas se refieren a
la %ispersin respecto a una medida particular de tendencia central#
El *ango es la diferencia entre el m&)imo valor observado y el mnimo- .J2a)92in#
El *ango Intercuartil, el cual denotaremos +N., es la diferencia entre N4 y N/- 9 1 Q 3 Q IQR 9 J # El .ango +ntercuartil permite determinar que tan
disperso est& el 6=L de la informacin mas central#
Varianza Muestral# !i
1 2 n
X , X , , X L es un conjunto de observaciones, la *arian@a 2uestral, denotada +, est& dada por-
$
1 n
X X
S
2
i
2
9
9
J
Q
# ,a %esviacin Est&ndar ser& la ra@ cuadrada de la *arian@a#
Ejemplo- ;sando los datos de las edades, tenemos que-
$
41 3
1 15
X X
S
2
1
2
# J
9
9
J
Q
y 85 1 S # J # Para estos la desviacin es casi 0 a3os, lo
que indica una dispersin alta# 1tras medidas de variabilidad son- %esviacin 2ediana, %esviacin absoluta, etc#
Diagramas de ,arras e -istogramas!
,a informacin es presentada de manera gr&fica dependiendo del tipo de datos que esta contenga# !i la variable representa categoras o clasificaciones es
usual usar una tabla de frecuencias para resumir la informacin y luego un diagrama de barras para visuali@arla? en este caso el eje R estar& compuesto por
las categoras o niveles discretos de la variable y en el eje S la frecuencia o porcentajes que le corresponden a cata categora o nivel discreto#
Ejemplo- se tiene informacin resumida acerca del monto anual obtenido por donaciones en diferentes &reas#
Area 2onto Porcentaje
.eligin 4/#= 5F#E
Artes y Tumanidades 5#/ 8#4
!ervicios !ociales 8#D /#=8
Educacin D#= /4#D
!alud D#0 /5#0
1tros 5#F F#0
1 si lo que se quiere una representacin usando los porcentajes
obtenemos un diagrama de este estilo-
El programa en !A! usado es-
data monto;
input area$ 1-19 total porc;
cards;
Religion 31.0 47.8
Artes y Humanidades 4.1 6.3
er!icios ociales 6." 10.6
#ducacion ".0 13."
alud ".$ 14.$
%tros 4.7 7.$
;
run;
Proc gchart data&monto;
!'ar area()re*&total space&10;
!'ar area()re*&porc space&10;
run;
Ejemplo# .etomando los datos acerca del n:mero de faltas de un grupo de estudiantes en un curso de Estadstica, la tabla de frecuencias elaborada al
respecto muestra /= categoras diferentes# !i el rango del n:mero de faltas fuera muc(o mayor, el diagrama de barras resultante no sera operativo, en el
sentido en que muc(as barras quedaran sin frecuencia# !e recomienda agrupar para lograr captar mejor la informacin# ,a tabla de frecuencias y el
respectivo diagrama de barras se muestra a continuacin-
.ango o 'lase Crecuencia
= I / 8
0 I 4 /4
5 I 6 E
8 I F E
E I D F
'uando los datos son de tipo continuo se (ace necesario
agruparlos en intervalos disjuntos para tener una mejor
comprensin gr&fica de su comportamiento#
Ejemplo# ,as estaturas en centmetros de 6= estudiantes mujeres
un grupo se registraron# ,os datos son-
/6F /66 /F/ /6= /84 /6= /F0 /8/ /65 /F5 /84 /5E /60 /84 /5D /6E /F8 /85 /6F /64 /8D /8/ /8= /85 /66 /80 /6/ /8F /8F /8F /F= /6E /84 /F6 /8D
/8D /6E /6= /68 /6F /F5 /80 /6= /6/ /86 /F= /68 /F= /64 /65#
Agrupe adecuadamente los datos y elabore la respectiva tabla de frecuencias y el (istograma de frecuencias relativas#
El problema m&s importante a resolver aqu es En cu&ntas clases o intervalos debo agrupar la informacin? Es decir, cu&l es el n:mero m&s adecuado
de intervalos de agrupacin?# E)isten diversas reglas empricas acerca de cual debe ser un n:mero de intervalos o grupos adecuados# !ea n- n:mero de
observaciones, U- n:mero de intervalos o grupos, .- .ango, A- Amplitud del intervalo# Entre las reglas m&s conocidas se tienen-
9
K n =
9
5 K 25
9
10
K 1 3.33 log n = + .egla de !turges$
!i usamos la primera regla, corremos el riesgo de incrementar dr&sticamente el n:mero de intervalos a medida que aumenta el n:mero de datos# Por
ejemplo con nJ/==,
K 100 10 = =
# !i nJ/===,
K 1000 10 10 31.62 = =
# !e recomienda usar la :ltima regla pues esta permite
corregir el valor de U aunque se incremente dram&ticamente el n:mero de datos# ;sando la regla de !turges, un n:mero de clases inicial es
10
K 1 3.33 log 50 6.66 = + = # As apro)imamos
K 7
# ,a estatura mnima es /5E cms y la m&)ima estatura es /F8# As el rango ser&
R 176 148 28 = =
# ,a amplitud de estos ser&-
R 28
4
K 7
= = = #
,os intervalos que se generen deben ser disjuntos, de esta manera se proponen intervalos semi9abiertos a derec(a# As los intervalos de clases ser&n-
[ ) 148, 152 ,
[ ) 152, 156 ,
[ ) 156, 160 ,
[ ) 160, 164 ,#
[ ) 164, 168 ,
[ ) 168, 172 ,
[ ) 172, 176 # Es implicara que el m&)imo valor no
est incluido en el :ltimo intervalo# Es usual incrementar levemente la amplitud de los intervalos para garanti@ar que ning:n valor quede por fuera de la
clasificacin# En otros casos Taciendo 4. 2 = , entonces el nuevo rango es- R 4. 2 7 29. 4 = = # As, el rango se ampla en /#5 unidades que
pueden ser repartidas =#F a i@quierda y a derec(a# En el siguiente gr&fico ilustra lo antes dic(o#
,os intervalos de clase respectivos son-
[ ) 147.3, 151.5 ,
[ ) 151.5, 155.7 ,
[ ) 155.7, 159.9 ,
[ ) 159.9, 164.1 ,
[ ) 164.1, 168.3 ,
[ ) 168.3, 172.5
[ ) 172.5, 176.7 #
,a tabla de frecuencias para estos intervalos y el respectivo (istograma son-
Este gr&fico es llamado -istograma de recuencias# !e puede observar que las estaturas no est&n muy agrupadas alrededor de un rango de valores
especficos, de (ec(o, las personas con estaturas entre /5E y /8= cms# presentan frecuencias muy similares# Es muy frecuente encontrar personas con
estaturas que oscilan entre los /8= y /85 cms# Apro)imadamente#
Es usual graficar las clases contra las frecuencias de manera que el &rea de cada rect&ngulo sea igual a la frecuencia# El (istograma resultante se llama
-istograma de Densidad#
Diagrama de Ca.as / ,igotes0 ,o12P%ot
,os diagramas de caja y bigotes son (erramientas gr&ficas muy :tiles para describir caractersticas importantes en un conjunto de datos, como son centro,
simetra o asimetra, valores atpicos raros$, etc# ,a construccin de este diagrama emplea medidas descriptivas que son poco sensibles a datos e)tremos
y por lo tanto presentan una descripcin m&s clara de la informacin# "&sicamente empleamos para su construccin los tres cuarteles, los valores mnimos
y m&)imos y la media muestral solo como medida de locali@acin en el gr&fico#
;na observacin se dice #tpica o Inusual si est& a m&s de /#6 veces el rango intercualtil de alguno de los cuarteles N/ o N4# ;na observacin se dice
Atpica E)trema si est& a m&s de 4 veces el rango +ntercuartil de alguno de los cuarteles N/ o N4#
El diagrama est& conformado por una caja la cual se construye con ayuda del primer y tercer cuartil# ,a mediana es dibujada en el interior de la caja al igual
que la media muestral# ,os bigotes se e)tienden desde los cuartiles a la derec(a y a la i@quierda# !u longitud depende de si (ay o no datos atpicos#
!in valores Atpicos ni E)tremos-
'on valores Atpicos yBo E)tremos-
En algunos paquetes computacionales, los bigotes van siempre (asta los valores mnimo y m&)imo, sin (acer distincin en los valores atpicos#
Ejemplo# Para los datos de las estaturas tenemos- 148 Min J , 176 M!" J , 86 160 X # J 154 Q
1
J , 161 Q
2
J , 167 Q
3
J #
Ejemplo# En un estudio epidemiolgico, el 1rganoc(lorine y P'"Vs totales fueron registrados en 5= voluntarios en 'olorado# ,os datos son- 0F 54 60 64 64
64 8/ 84 84 86 8E F= F0 F6 E4 D6 D8 DF /=/ /=6 //= //6 //6 //6 //6 /08 /0F /45 /56 /60 /64 /E0 /D= /DF /DF 0E0 400 400 450 60/#
Algunas medidas descriptivas b&sicas son- 27 Min J , 521 M!" J , 925 133 X # J , 5 66 Q
1
# J , 5 107 Q
2
# J , 5 152 Q
3
# J # El
respectivo %iagrama de cajas y bigotes se muestra a continuacin-

En este caso e)isten datos inusuales de los dos tipos- atpicos y atpicos e)tremos# ,o que nos muestra una gran dispersin de los datos debido a
observaciones muy inusuales 0E0, 400,450 y 60/# El Tistograma de frecuencias evidencia dic(o sesgo a la derec(a# Esto indica que es muy inusual
encontrar niveles totales superiores a 0E=#

Vous aimerez peut-être aussi