Vous êtes sur la page 1sur 31

William W. Lzaro Apolaya: Introduccin al SPSS 14.

0
1
Anexo
Estadstica Bsica
DEFINICION DE ESTADSTICA
Es la ciencia y el arte de desarrollar y aplicar los
mtodos ms efectivos en la recopilacin, tabulacin e
interpretacin de datos, de tal manera que las
conclusiones y los estimados puedan ser evaluados
mediante el razonamiento inductivo, basado en las
matemticas de la probabilidad (Anderson & Bancroft)
P d l i
Estadstica Bsica
Puede concluirse que
Es un campo de estudio referente a:
OLa organizacin y el resumen de datos
OLa extraccin de inferencias acerca de un grupo de
datos cuando solo se observa una parte de ellos
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
2
DEFINICION DE ESTADSTICA
La estadstica es la disciplina que provee de mtodos y
procedimientos para obtener describir analizar e procedimientos para obtener, describir, analizar e
interpretar un conjunto de datos, que permiten luego,
tomar decisiones y predecir fenmenos que puedan
expresarse en forma cuantitativa, de acuerdo a ciertos
objetivos preestablecidos.
Ciencia que trata de la recoleccin clasificacin y
Estadstica Bsica
Ciencia que trata de la recoleccin, clasificacin y
presentacin de los hechos sujetos a una apreciacin
numrica, como base a la explicacin, descripcin y
comparacin de un fenmeno (G. U. Yule)
ESTADSTICA DESCRIPTIVA E
INFERENCIAL
La estadstica puede ser descriptiva e inferencial o
i d ti inductiva
OEstadstica descriptiva: Se. encarga de presentar de
una manera resumida la informacin contenida en un
conjunto de datos. Implica pues la necesidad del clculo
de una o ms medidas para describir la poblacin
mediante una serie de nmeros
OEstadstica inferencial: Es esencialmente la aplicacin
Estadstica Bsica
OEstadstica inferencial: Es esencialmente la aplicacin
de cierta metodologa para tomar decisiones utilizando
datos muestrales como fundamento. Es decir, llegar a
conclusiones sobre una poblacin a partir del anlisis de
una muestra representativa de sta.
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
3
ESTADSTICA DESCRIPTIVA
Conceptos preliminares
Poblacin: Es un conjunto de individuos u objetos en Poblacin: Es un conjunto de individuos u objetos en
los cuales el investigador est interesado. Por ejemplo,
si el inters es caracterizar el nivel de empleo en la
poblacin infantil (5 a 17 aos de edad), la poblacin
sera todos los menores entre 5 a 17 aos de edad.
Muestra: Es un subconjunto o parte de la poblacin
Estadstica Bsica
Muestra: Es un subconjunto o parte de la poblacin
seleccionada. Es importante sealar que este
subconjunto debe ser representativo de la poblacin, de
manera tal que las conclusiones obtenidas a partir de
ella, puedan extrapolarse a toda la poblacin.
1. ESTADISTICA DESCRIPTIVA
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
4
1.1 Conceptos preliminares
Variables: Son las caractersticas o propiedades de
l j t d bl i t t d los sujetos de una poblacin o muestra. stas pueden
adoptar diferentes valores o expresarse en varias
categoras. Por ejemplo, en el caso del estudio sobre los
niveles de empleo en la poblacin infantil, stas seran:
edad, gnero, nivel de escolaridad, nivel de asistencia,
nivel educativo alcanzado, actividad econmica que
realiza ingreso percibido horas que trabaja nivel de
Estadstica Bsica
realiza, ingreso percibido, horas que trabaja, nivel de
satisfaccin con el trabajo que realiza, ocupacin que
tiene, etc.
Datos: Son los valores observados o medidos de una
variable. Constituyen la informacin disponible.
1.2 Tipos de Variables
Son caractersticas, atributos, cualidades o propiedades que
p eden ariar c a ariacin es s sceptible a medirse pueden variar y cuya variacin es susceptible a medirse.
Cualitativas
Tipos de variables
Cuantitativas
Estadstica Bsica
Discretas Continuas
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
5
1.2.1 Variables cualitativas
Son aquellas que expresan una cualidad del
objeto o individuo observado, no es susceptible
de medicin numrica. Por ejemplo, en el caso
del estudio sobre los niveles de empleo en la
poblacin infantil, stas seran: gnero, nivel de
asistencia, nivel educativo alcanzado, actividad
econmica que realiza nivel de satisfaccin con
Estadstica Bsica
econmica que realiza, nivel de satisfaccin con
el trabajo que realiza, ocupacin que tiene, lugar
de nacimiento, nivel socioeconmico, etc.
1.2.1 Variables cualitativas
Un caso especial de variable cualitativa es la llamada
variable dicotmica y es aquella que representa xito variable dicotmica, y es aquella que representa xito
o presencia de una caracterstica y la otra representa
fracaso o ausencia de la caracterstica.
Por ejemplo, si el objetivo de una investigacin es
analizar el nivel de pobreza en el pas, esta variable
sera dicotmica. Aqu es comn asignar el valor 1 a los
pobres (presencia de la caracterstica) y el valor 0 a los
Estadstica Bsica
pobres (presencia de la caracterstica) y el valor 0 a los
no pobres (ausencia de la caracterstica)
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
6
1.2.2 Variables cuantitativas
Son aquellas que se caracterizan porque los valores
posibles son la expresin numrica o la medicin posibles son la expresin numrica o la medicin
cuantitativa del hecho que se est observando. Estas se
dividen en dos tipos: continuas y discontinuas o
discretas.
Discretas: Son aquellas que no admiten valores
intermedios entre los distintos valores de la variable.
Slo puede asumir o adoptar valores enteros es decir
Estadstica Bsica
Slo puede asumir o adoptar valores enteros, es decir,
no puede adoptar valores intermedios o fraccionarios
entre dos puntos. Ejemplo: Nmero de dientes, nmero
de camas de un hospital, nmero de hijos de una familia,
cantidad de nios curileros que asisten a la escuela, etc.
1.2.2 Variables cuantitativas
Continuas: Son aquellas que puede asumir o adoptar
cualquier valor numrico dentro de una amplitud o
intervalo especfico, ya sea entero o partes de un entero.
Ejemplo: El peso, la estatura, ingreso percibido, gasto
diario, precio de un producto en el mercado.
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
7
1.3 Escalas de medicin
Las escalas de medicin se dividen en cuatro:
Nominal: Consiste en asignar nmeros a objetos,
sujetos u observaciones para su clasificacin Los datos sujetos u observaciones para su clasificacin. Los datos
slo son frecuencias de ocurrencia en cada clase o
categora de la variable. En esta escala se clasifican
aquellas variables cuyas categoras de respuesta no
tienen orden ni jerarqua. No se pueden manipular
aritmticamente. Ejemplos: gnero, lugar de nacimiento,
nivel de asistencia, actividad econmica en la que labora
Estadstica Bsica
q
Ordinal: Conlleva la asignacin de valores numricos
para establecer que una categora de respuesta es
mayor que la prxima; o sea, establece un orden o
jerarqua. Ejemplo: Nivel socioeconmico, nivel de
estudios, ocupacin, etc.
1.3 Escalas de medicin
Intervalo: Adems del orden o jerarqua entre
categoras se establecen intervalos iguales en la categoras, se establecen intervalos iguales en la
medicin. Las distancias entre las categoras son las
mismas a lo largo de toda la escala.Sin embargo, el cero
es un cero arbitrario, no es real. Ejemplo: estaturas,
peso, ingreso, gasto, etc.
Razn: En este nivel, adems de tenerse todas las
caractersticas del nivel de intervalo el valor cero (0) es
Estadstica Bsica
caractersticas del nivel de intervalo, el valor cero (0) es
real, es absoluto. Cero (0) significa que no existe la
propiedad. Ejemplo: exposicin a la televisin, ventas de
un producto, nmero de hijos, productividad,
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
8
1.4 Distribucin de frecuencias
Una distribucin de frecuencias es un conjunto de
t i d d ti puntuaciones ordenadas en sus respectivas
categoras.
Contiene otros elementos como el porcentaje o
frecuencia relativa y el porcentaje acumulado o
frecuencia relativa acumulada. La primera representa
el porcentaje de casos en cada categora, mientras el porcentaje de casos en cada categora, mientras
que la segunda, representa lo que se va acumulando
en cada categora
Estadstica Bsica
Ejemplo de distribucin de
frecuencias
TAMAO DEL HOGAR
285 9 8 9 8
TAMAO DEL HOGAR
1 A 2
Frecuencia Porcentaje
Porcentaje
acumulado
MATERIAL EN LOS PISOS
285 9.8 9.8
655 22.5 32.4
946 32.6 64.9
660 22.7 87.7
357 12.3 100.0
2903 100.0
1 A 2
3 A 4
5 A 6
7 A 8
9 Y MAS
Total
373 12.9
880 30.3
1616 55.7
34 1.2
2903 100.0
MATERIAL EN LOS PISOS
MADERA
CEMENTO
TIERRA
OTRO MATERIAL
Total
Frecuencia Porcentaje
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
9
2. MEDIDAS DESCRIPTIVAS
2. Medidas descriptivas
El objetivo de la estadstica descriptiva es
presentar de una manera resumida la informacin
contenida en un conjunto de datos. Esta finalidad
se logra presentando los datos en una distribucin
de frecuencias. Sin embargo, de tratarse de
variables cuantitativas la informacin se puede
resumir an ms dando algunos valores que
describen ciertos aspectos de la distribucin de
frecuencias como por ejemplo el centro, la forma,
la variabilidad o dispersin de las observaciones.
Estos valores se denominan medidas descriptivas.
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
10
2. Medidas descriptivas
Son medidas para resumir la informacin
contenida en los datos y cuya interpretacin contenida en los datos y cuya interpretacin
permite explicar ciertas regularidades en el
comportamiento de la poblacin.
Son las siguientes:
Medidas de tendencia central
Medidas de posicin
Medidas de dispersin o variabilidad
Medidas de asimetra y apuntamiento
Estadstica Bsica
2.1 Medidas de tendencia central
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
11
2.1 Medidas de tendencia central
Las medidas de tendencia central son puntos en
una distribucin, los valores medios o centrales
de sta y nos ayudan a ubicarla dentro de la
escala de medicin
Las medidas de tendencia central ms usuales
son:
Media
Mediana Mediana
Moda
Estadstica Bsica
2.1.1 Media Aritmtica
La media aritmtica es la medida de tendencia
central ms utilizada, se define como la suma de
todos los valores dividida por el nmero de casos todos los valores dividida por el nmero de casos.
La edad promedio de un grupo de nios
pepenadores en Santa Ana es:
7 . 8
7
11 10 10 9 8 7 6
=
+ + + + + +
=

x
El promedio de hijos de un grupo de madres es:
7 . 4
6
8 7 5 4 2 2
=
+ + + + +
=

x
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
12
2.1.1 Media Aritmtica
A partir de las tablas con los datos agrupados, la
media se calcula utilizando como valores de la
variable los puntos medios de los intervalos variable los puntos medios de los intervalos.
OEl peso medio de un grupo de alumnos es:
kg. 54.8
_
X =
La media es una medida solamente aplicable
a mediciones por intervalos o de razn
Estadstica Bsica
2.1.2 Mediana
La mediana es el valor que divide a la
distribucin por la mitad, es decir, la mitad de los p , ,
casos caen por debajo de la mediana y la otra
mitad se ubica por encima de la mediana.
Para determinar el nmero de caso en el que
se ubica la mediana se aplica la frmula:
2
1 N
ed
M
+
=
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
13
2.1.2 Mediana

N
n
Para datos agrupados se aplica la frmula:

=
i
n
i
N
i
a
i
l
1
2
1 ed
M
l
i-1
= Lmite inferior del intervalo mediano
a
i
= Amplitud del intervalo mediano
n= Nmero de observaciones
N
i-1
= Frecuencia absoluta acumulada del intervalo
anterior al intervalo mediano
n
i
= Frecuencia absoluta del intervalo mediano
Estadstica Bsica
En primer lugar se procede a ordenar las
edades de los nios pepenadores:
6 8 9 10 10 11
2.1.2 Mediana
6, 7, 8, 9, 10, 10, 11
La mediana es 9 aos, esto significa que el 50%
de los nios tiene una edad menor a 9 aos y la
otra mitad mayor.
Se ordenan el nmero de hijos de cada madre:
2 2 4 5 7 8 2, 2, 4, 5, 7, 8
La mediana es de 4.5 hijos, es decir, el 50% de las
madres tiene menos de 4.5 hijos, y la otra mitad
ms.
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
14
2.1.2 Mediana
El peso mediano de los estudiantes es 53.9 kg., p g ,
es decir, el 50% de los estudiantes pesan menos
de 53.9 kg. y el resto ms.
La mediana es una medida propia de los niveles
de medicin ordinal, por intervalos y de razn.
Estadstica Bsica
2.1.3 Moda
La moda es la categora o puntuacin que ocurre
con mayor frecuencia.
En el caso de las variables agrupadas es ms
correcto hablar de intervalos modales (mximo
valor relativo de la distribucin, es decir aquel
que posee una frecuencia mayor que su anterior
y posterior). Se aplica la frmula:
i
a *
)
1 i
n
i
n ( )
1 i
n
i
n (
1 i
n
i
n
1 i
l
+
+

=
oda
M
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
15
OLa edad ms frecuente es 10 aos.
OEl nmero de hijos ms frecuente es 2
2.1.3 Moda
OEl nmero de hijos ms frecuente es 2
OEl peso modal est entre los 45 y 55 kilos. A
este intervalo se le denomina intervalo modal, la
moda sera 52.3 kg..
La moda se utiliza con cualquier nivel de
medicin.
Estadstica Bsica
Relacin entre la media, mediana
y moda
Peso agrupado
600
500
400
300
200
Int. modal 45 y 55 kg
Peso agrupado
110 100 90 80 70 60 50 40 30
F
r
e
c
u
e
n
c
i
a
100
0
Medi a = 54.8 kg
Medi ana = 53.9 kg
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
16
La media es sensible a valores extremos.
Algunas propiedades de la media y
la mediana
La edad promedio de los nios pepenadores es 8.7. Si
agregamos las edades de 3 nios de 17 aos ubicados
posteriormente la nueva edad promedio sera:
(6 + 7 + 8 + 9 + 10+ 10 + 11 + 17 + 17 + 17)/10 =11.2
La mediana no lo es.
La mediana vara ligeramente de 9 a 10
Estadstica Bsica
Algunas propiedades de la media y
la mediana
Tanto la media como la mediana pueden no
representar bien el comportamiento de la variable.
Si la distribucin anterior se agrega un nio ms
de 17 aos, la media aritmtica sera 11.7 aos y
la mediana 10.
Es de observar que la existencia de los valores
extremos pueden incidir en que tanto la media como la
mediana no representen efectivamente el
comportamiento de la variable.
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
17
2.2 Medidas de posicin
2.2 Medidas de Posicin
Las medidas de posicin, al igual que las de
tendencia central indican donde se ubica un
grupo de puntuaciones o casos. Un cuantil de
orden es el valor de la variable por debajo del
cual se encuentra el por ciento de la poblacin.
Casos especiales de cuantiles son los
percentiles que dividen a la poblacin en 100 percentiles, que dividen a la poblacin en 100
partes iguales, los cuartiles, que dividen a la
poblacin en 4 partes iguales y los deciles, que
dividen a la poblacin en 10 partes.
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
18
2.2 Medidas de Posicin
As el percentil de orden 1 deja por debajo al 1% As, el percentil de orden 1 deja por debajo al 1%
de la poblacin; el de orden 15, al 15% y el 80 al
80%.
El primer cuartil deja por debajo al 25% de la
poblacin; el segundo al 50% (Mediana) y el poblacin; el segundo al 50% (Mediana) y el
tercero, al 75%.
Estadstica Bsica
Ejemplo de medidas de posicin
En un determinado pas se Estadsticos En un determinado pas, se
tiene que el 10% de los
hogares percibe ingresos
menores a $120, el 20%
menores a $200, el 50%
menores a $390, el 90%
menores a $840 y el 10%
Estadsticos
Ingreso del hogar en dlar es
2684
0
120.00
200.00
250.00
300.00
390 00
Vlidos
Valores perdidos
N
10
20
30
40
50
Percenti les
y
restante ingresos superiores
a $840.
390.00
480.00
600.00
710.00
840.00
50
60
70
80
90
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
19
2.3 Medidas de dispersin
2.3 Medidas de Dispersin
Como su nombre lo indica estas medidas indican la
dispersin de los datos en la escala de medicin y
responden a la pregunta dnde estn diseminadas responden a la pregunta dnde estn diseminadas
las puntuaciones o valores obtenidos? Es decir si
estn prximas entre s o si por el contrario estn
dispersas.
Las ms usadas son:
Rango
Rango intercuartlico
Varianza
Desviacin estndar
Coeficiente de variacin
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
20
Se denomina tambin recorrido o amplitud, se obtiene
restando el valor ms bajo de un conjunto de
2.3.1 Rango
observaciones del valor ms alto.
Un valor pequeo del rango indica poca dispersin, puesto
que la variable toma valores en un intervalo pequeo. Por
el contrario, un valor grande puede indicar mucha
dispersin o la existencia de valores extremos.
L d d i b d d 11 l i La edad mxima observada es de 11 aos y la mnima
de 6, siendo la media de 8.7. El recorrido es de 5 indicando
poca dispersin en los datos.
Estadstica Bsica
2.3.1 Rango
En otra muestra las edades de los nios
pepenadores fue de: pepenadores fue de:
6, 7, 8, 9, 10, 10, 11, 17, 17, 17
En este caso la media aumenta a 11.2 aos, afectada
por el valor mximo observado. Mientras que la
mediana es 10, puesto que est menos afectada por
l l t los valores extremos.
El valor del recorrido es 17 - 6 = 11 aos, indicando
mucha dispersin o existencia de valores extremos.
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
21
2.3.2 Recorrido intercuartlico
El recorrido intercuartlico es la diferencia entre el tercer
y primer cuartil. y p
Un valor pequeo del recorrido intercuartlico indica poca
dispersin. Sin embargo, un valor grande puede indicar
mucha dispersin o la existencia de valores extremos.
Como los cuartiles estn poco afectados por la existencia p p
de valores extremos, un recorrido intercuartlico pequeo
frente a un recorrido grande indicar la existencia de
valores extremos. Si ambos son grandes, podemos
asegurar que existe dispersin.
Estadstica Bsica
En el primer grupo de nios el recorrido
intercuartlico es 10 - 7 = 3 aos que indica poca
2.3.2 Recorrido intercuartlico
intercuartlico es 10 - 7 = 3 aos, que indica poca
dispersin.
En el segundo grupo, el recorrido intercuartlico es
17 - 7.75 = 9.25 aos, que indica alta dispersin,
asociada a la existencia de valores extremos asociada a la existencia de valores extremos.
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
22
La varianza es el promedio de las distancias de los valores
a la media elevadas al cuadrado.
2.3.3 Varianza
( )
n
x x
i

=
2
2

La varianza para el primer grupo de nios es, por tanto,


19.43/7=2.8 (edad)
2
Para el segundo grupo es de 16.36
El inconveniente de la varianza es que no se mide en las
mismas unidades de medida que la variable y, por tanto, es
difcil de interpretar.
Estadstica Bsica
Ser define como la raz cuadrada de la varianza.
Es expresada en las unidades originales de
C
2.3.4 Desviacin Estndar
medicin de la distribucin. Cuanto mayor es la
dispersin de datos respecto a la media mayor es
la desviacin estndar.
En la primera muestra de nios, el valor de la
desviacin tpica es 1.67 aos, un valor pequeo
que indica poca dispersin que indica poca dispersin.
En la segunda muestra el valor de la varianza
es 4.04 aos, un valor alto que indica dispersin o
existencia de valores extremos.
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
23
2.3.5 Coeficiente de variacin
El coeficiente de variacin se define como el cociente
entre la desviacin estndar y la media. Es til para
comparar la variabilidad de dos conjuntos de valores
(muestras o poblaciones)
El ingreso promedio de la regin A es de $848.80. con una
desviacin estndar de $701.91 y el de la regin B es de
$502.31 con una desviacin estndar de $255.36. Para
comparar la dispersin entre las dos poblaciones p p p
calculamos el coeficiente de variacin:
0.51
502.31
255.36
CV
RB
= =
Estadstica Bsica
2.3.5 Coeficiente de variacin
INGRESO PROMEDIO DEL HOGAR
Regin A
INGRESO PROMEDIO DEL HOGAR
Regin B g
u
e
n
c
i
a
200
100
g
u
e
n
c
i
a
50
40
30
20
10
4
7
5
0
.0
4
5
0
0
.0
4
2
5
0
.0
4
0
0
0
.0
3
7
5
0
.0
3
5
0
0
.0
3
2
5
0
.0
3
0
0
0
.0
2
7
5
0
.0
2
5
0
0
.0
2
2
5
0
.0
2
0
0
0
.0
1
7
5
0
.0
1
5
0
0
.0
1
2
5
0
.0
1
0
0
0
.0
7
5
0
.0
5
0
0
.0
2
5
0
.0
0
.0
F
r
e
c
u
0
1200.0
1100.0
1000.0
900.0
800.0
700.0
600.0
500.0
400.0
300.0
200.0
100.0
F
r
e
c
u
0
Mayor dispersin en la regin A que en la B
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
24
Interpretacin de las medidas de
tendencia central y variabilidad
Supongamos que se aplic una escala de tipo Likert
para medir la actitud hacia determinado gobernante de para medir la actitud hacia determinado gobernante de
una nacin. El rango potencial es de 1 a 5
Actitud totalmente
1 2 3 5 4
Actitud totalmente
Moda: 4.0
Mediana: 3.9
Media: 4.2
Desviacin estndar: 0.7
Actitud totalmente
desfavorable
favorable
Puntuacin ms alta observ.: 5.0
Puntuacin ms baja observ.: 2.0
Rango: 3.0
Estadstica Bsica
Interpretacin de las medidas de
tendencia central y variabilidad
Se puede hacer la siguiente interpretacin descriptiva:
La actitud hacia el gobernante es favorable. La
categora que ms se repiti fue 4 (favorable). El 50%
de encuestados est por encima del valor 3.9 y el
restante 50% se sita por debajo de dicho valor. En
promedio los encuestados se ubican en 4.2 (favorable).
Asimismo se desvan 4.2, en promedio, 0.7 unidades , p ,
de la escala. Ninguna persona calific a gobernante de
manera totalmente desfavorable (no hay 1). Las
puntuaciones tienden a ubicarse en valores medios o
elevados
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
25
2.4 Medidas de asimetra y
apuntamiento
La asimetra es una estadstica necesaria para
conocer cuanto se parece nuestra distribucin a una
distribucin terica denominada curva normal de esta
2.4.1 Asimetra
distribucin terica denominada curva normal, de esta
forma se constituye en un indicador del lado de la
curva donde se agrupan las frecuencias.
Puede ser:
Simtrica: Si asimetra es igual a cero
Positiva: Cuando hay ms valores agrupados hacia Positiva: Cuando hay ms valores agrupados hacia
la izquierda de la curva (por debajo de la media)
Negativa: Cuando hay ms valores agrupados
hacia la derecha de la curva (por encima de la media)
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
26
Tipos de asimetra
Distribucin
simtrica.
Distribucin
asimtrica positiva
Distribucin
asimtrica negativa
Estadstica Bsica
Salario actual
140
Distribucin asimtrica
Ejemplo de tipos de asimetra
e
n
c
i
a
140
120
100
80
60
40
20 Std. Dev = 17075.66
Talla
200
positiva
1
3
5
0
0
0
.0
1
2
5
0
0
0
.0
1
1
5
0
0
0
.0
1
0
5
0
0
0
.0
9
5
0
0
0
.0
8
5
0
0
0
.0
7
5
0
0
0
.0
6
5
0
0
0
.0
5
5
0
0
0
.0
4
5
0
0
0
.0
3
5
0
0
0
.0
2
5
0
0
0
.0
1
5
0
0
0
.0
F
r
e
c
u
0
Mean = 34419.6
N = 474.00
Talla
1
9
0
,0
1
8
5
,0
1
8
0
,0
1
7
5
,0
1
7
0
,0
1
6
5
,0
1
6
0
,0
1
5
5
,0
1
5
0
,0
1
4
5
,0
1
4
0
,0
1
3
5
,0
F
r
e
c
u
e
n
c
i
a
100
0
Distribucin simtrica
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
27
El apuntamiento o curtosis es un indicador de lo
l i d
2.4.2 Apuntamiento o curtosis
plana o picuda que es una curva.
Puede ser:
Curva normal: Si curtosis es igual a cero
Picuda o levantada: Cuando la curtosis es
positiva.
Plana: Cuando la curtosis es negativa.
Estadstica Bsica
2.4.2 Tipos de curtosis
Talla
200
INGRESO PROMEDIO DEL HOGAR
REGION A
INGRESO PROMEDIO DEL HOGAR
REGION C
Talla
190 185 180 175 170 165 160 155 150 145 140 135
F
r
e
c
u
e
n
c
i
a
100
0
4
5
4
4
.0
4
2
3
2
.0
3
9
2
0
.0
3
6
0
8
.0
3
2
9
6
.0
2
9
8
4
.0
2
6
7
2
.0
2
3
6
0
.0
2
0
4
8
.0
1
7
3
6
.0
1
4
2
4
.0
1
1
1
2
.0
8
0
0
.0
4
8
8
.0
1
7
6
.0
F
r
e
c
u
e
n
c
i
a
30
20
10
0
Std. Dev = 705.46
Mean = 848.8
N = 88.00
2000.0
1800.0
1600.0
1 400.0
1200.0
1 000.0
800.0
600.0
400.0
200.0
F
r
e
c
u
e
n
c
ia
10
8
6
4
2
0
Std. Dev = 498.38
Mean = 773.2
N = 40. 00
Talla
Aproximadamente, igual de
apuntada que la normal.
Curtosis positiva: Ms
levantada que la normal
Curtosis negativa: Ms
plana que la normal
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
28
3. Pasos para la realizacin de un estudio
estadstico
Estadstica Bsica
Recogida de los datos
Pasos previos a la realizacin de un estudio
estadstico
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
29
Estudio unidimensional:ordenacin de los datos
Tablas de frecuencias
DISTRIBUCION DE FRECUENCIA DE LOS HOGARES, SEGUN
MATERIAL PREDOMINANTE EN LOS PISOS DE LAS VIVIENDAS
373 12.9
880 30.3
1616 55.7
34 1.2
2903 100.0
MATERIAL EN LOS PISOS
MADERA
CEMENTO
TIERRA
OTRO MATERIAL
Total
Frecuencia Porcentaje
NNA que trabajan en pesca, segn razn de
no asistencia a la escuela
49 4.2
28 2.4
41 3.5
650 56.2
196 16.9
59 5.1
62 5.4
65 5.6
7 .6
1157 100.0
Razones de no asistencia
Muy caro
No existe escuela cercana
Enfermedad o discapacidad
Trabaja
No quiere o no le interesa
Padres no quieren
Por la edad
Otro
No precis
Total
Frecuencia Porcentaje
NNA que trabajan en la pesca, segn edad
144 4.1 4.1 4.1
164 4.7 4.7 8.9
219 6.3 6.3 15.1
Edad en aos
cumplidos
5
6
7
Frecuencia Porcentaje
Porcentaje
vlido
Porcentaje
acumulado
Estadstica Bsica
219 6.3 6.3 15.1
294 8.4 8.4 23.6
299 8.6 8.6 32.2
322 9.3 9.3 41.4
326 9.4 9.4 50.8
364 10.5 10.5 61.3
335 9.6 9.6 70.9
281 8.1 8.1 79.0
278 8.0 8.0 87.0
251 7.2 7.2 94.2
199 5.7 5.7 99.9
4 .1 .1 100.0
3480 100.0 100.0
8
9
10
11
12
13
14
15
16
17
18
Total
Estudio unidimensional: ordenacin de los datos
Representaciones grficas
Salario actual
140
120
100
80
60
40
Grfico 5
NNA que trabajan en la pesca, por gnero
38.1%
Femenino
Salario actual
5
4
0
0
0
5
0
0
0
0
4
6
0
0
0
4
2
0
0
0
3
8
0
0
0
3
4
0
0
0
3
0
0
0
0
2
6
0
0
0
2
2
0
0
0
1
8
0
0
0
1
4
0
0
0
1
0
0
0
0
6
0
0
0
F
r
e
c
u
e
n
c
i
a
20
0
Estadstica Bsica
Fuente: OIT IPEC. Lnea de Base de Pesca. 2003
61.9%
Masculino
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
30
Estudio unidimensional: clculo de estadsticos
Resumen de los datos a travs de medidas estadsticas
Estadsticos
Edad en aos cumplidos
3480
0
11.32
.057
11.00
12
3.345
11.186
-.071
042
Vlidos
Perdidos
N
Media
Error tp. de la media
Mediana
Moda
Desv. tp.
Varianza
Asimetra
Error tp de asimetra
Estadstica Bsica
.042
-.963
.083
13
5
18
39384
Error tp. de asimetra
Curtosis
Error tp. de curtosis
Rango
Mnimo
Mximo
Suma
Estudio bidimensional
Seleccin de las parejas de variables que responden a los
objetivos de la investigacin
Condicin de actividad y gnero
Condicin de actividad y nivel de asistencia escolar
Condicin de actividad y nivel de escolaridad
Condicin de actividad y nivel de pobreza
Etc.
Estudio de la independencia y correlacin
Estadstica Bsica
William W. Lzaro Apolaya: Introduccin al SPSS 14.0
31
Estudio bidimensional
Presentacin de los datos mediante tablas o reportes
Cuadro 17 Cuadro 17
NNA que trabajan y estudian, por gnero, segn nivel
educativo y escolaridad
100.0 100.0 100.0
2320 1373 947
10.7 9.9 11.8
88.3 88.8 87.5
.9 1.1 .6
.1 .2 .0
Nivel educativo al que asiste
Total
Parvularia
Bsica
Media
No precis
Total Masculino Femenino
Sexo
Estadstica Bsica
3.2 3.2 3.1
11.0 11.1 10.7
Nivel de escolaridad
Edad promedio
Fuente: OIT IPEC. Lnea de Base de Pesca. 2003
Anlisis de la regresin
Bsqueda de las relaciones funcionales entre las variables
60000
50000
Salario inicial
40000 30000 20000 10000 0
S
a
l
a
r
i
o

a
c
t
u
a
l
40000
30000
20000
10000
0 R = 0,7746
Obtencin de la ecuacin de la funcin elegida.
Bondad del ajuste.
Salario final=1,909 Salario inicial + 771,282
Estadstica Bsica