Vous êtes sur la page 1sur 58

Rafael Cantorin Curty

procesamiento de datos e informacin

Tcnicas de

UNIDAD 1. TCNICAS DESCRIPTIVAS


1.1 VISIN SISTMICA DE LA ESTADSTICA
POBLACIN

PARMETRO

MUESTRA

ESTADSTICO

INFERENCIA
ESTADSTIC

ESTADSTICA
DESCRIPTIVA

ERROR
PROBABILIDADES

Figura 01
1.2 VARIABLE ESTADSTICA
Es la atribucin de un valor (numrico o alfanumrico) a cada caracterstica de una unidad de
observacin, es decir, es una funcin de las observaciones (mediciones) realizadas.

Cuando una caracterstica o variables no es numrica, se denomina variable cualitativa o


atributo.

Cuando puede ser expresada numricamente, la variable estudiada se denomina variable


cuantitativa. Las variables cuantitativas pueden ser discretas o continuas.
Tenemos:
VARIABLES
ESTADISTICAS
Es la atribucin de un valor (numrico o alfanumrico) a cada
caracterstica de una unidad de observacin

CUALITATIVAS

CUANTITATIVAS

Son atributos o categoras


Ejemplos:
- Sexo
- Religin
- Grupos de edad
- Origen

Son numricos
DISCRETAS

CONTINUAS

Pueden tomar determinados valores y son el


resultado de un conteo
Valores de la moneda
Peso
Figura 02

1.2.1 ESCALAS DE MEDICIN DE LA VARIABLE ESTADISTICA

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Las escalas se clasifican en nominales, ordinales, intervalares y de razn o proporcionales.


A.- Escala nominal.- Son aqullas en las cuales los nmeros que se asignan a sus diversas categoras
slo sirven como smbolos o cdigos para efectos de clasificacin.
Ejemplo:
Protestante
(1)
Masculino (1)
Catlico
(2)
Sexo
Religin
Judo
(3)
Femenino
(0)
Otros
(4)
Este sera el caso de usar la etiqueta (1) para el sexo masculino y la etiqueta (0) para el sexo
femenino o viceversa, cuando estudiamos la variable estadstica SEXO. De igual manera sucedera
con la variable RELIGIN.
B.- Escala ordinal.- Es cuando las modalidades que toma la variable estadstica no solo se distinguen
una de otra, sino que tambin pueden ser ordenadas jerrquicamente de menos a ms. Los nmeros
que se asignan a las personas en base a la posesin de una propiedad indican slo rdenes de
magnitud o rango entre ellas; as, podemos colocarle un 6 a un alumno que observa un cierto
comportamiento o actitud y un 3 a otro en esa dimensin, pero el comportamiento reconocido con un
6 no quiere decir que sea el doble del indicado por el nmero 3, slo significa un rango mayor, un
orden. Para estos efectos podran haberse utilizado los nmeros 7 y 4, sin mayores problemas de
interpretacin de esas conductas en su relacin de mayor y menor.
Ejemplos de este tipo de variable: actitudes, inteligencia, rendimiento escolar (orden de mrito), etc.
Si nuestra variable estadstica es APRECIO QUE SE TIENE AL PROFESOR DE CURSO, las
modalidades seran: Ningn aprecio, poco aprecio, regular aprecio y mucho aprecio.
C.- Escala intervalar.- Son aqullas en las cuales existen distancias iguales en los objetos en relacin
con una cierta propiedad. As, si se tiene cuatro objetos a los cuales se le asignaron los nmeros 9,
5, 7, y 3, la distancia real entre 9 y 7 es igual a la que se da entre 5 y 3 (vale decir, 2). En estas
variables no existe un cero real, pero puede elegirse uno arbitrario. Ejemplos de este tipo de variable:
test de inteligencia, temperatura en las escalas Celsius y Fahrenheit, rendimiento acadmico, etc.
D.- Escala de razn o proporcional.- Tienen las mismas propiedades que las variables intervalares y,
adems, posee un cero que refleja la ausencia del atributo a medir. Ejemplos: las variables: edad,
ingreso, aos de escolaridad, analfabetismo, etc.
La clasificacin anterior es especialmente importante en relacin con las tcnicas estadsticas que se
pueden usar con los nmeros que se le asignan a los objetos o las personas en funcin del modo o
magnitud con las cuales se dan las diferentes variables en ellas:
1)
Las nicas tcnicas estadsticas que se pueden emplear con la escala nominal son: la
distribucin de frecuencias, la moda, el prueba chi cuadrado(X), el coeficiente de contingencia
como medida de asociacin.
2)
Con la escala ordinal: moda, mediana y los coeficientes de rango: Spearman y Gamma.
Conviene tomar nota que, en sentido estricto, con los puntajes o valores de este tipo de variables,
no se pueden calcular la media aritmtica, varianza ni desviacin estndar. De hecho se calculan,
pero sus valores son slo aproximaciones que deben tomarse con precaucin.
3)
La escala intervalar admiten todas las tcnicas estadsticas. Por lo tanto, admiten el clculo de
la media aritmtica, mediana, desviacin estndar, coeficiente de correlacin de Pearson,
coeficiente de correlacin mltiple, etc.
4)
La escala de razn o proporcional, admite sin excepcin todas las tcnicas estadsticas.
Distribucin de frecuencias
Moda
Coeficiente de
contingencia
Chi cuadrado X
NOMINALES

Moda
Mediana
Coeficientes de rango:
Spearman y Ganma.
ORDINALES

ESCALAS

Rafael Cantorin Curty


procesamiento de datos e informacin

PROPORCIONALES
Admiten todas las
tcnicas estadsticas.

Tcnicas de

INTERVALARES
Moda
Mediana
Media Aritmtica
Varianza
Desviacin estndar
Correlacin mltiple
UNA VARIABLE r
ESTADSTICA
de PearsonES EL ATRIBUTO QUE SE ESTUDIA
SOBRE UNA POBLACIN ESTADSTICA DETERMINADA

Recuerde:

Una variable estadstica se clasifica en:


Variable cualitativa nominal
Variable cualitativa, que puede ser
Variable cualitativa ordinal
Variable cuantitativa discreta
Variable cuantitativa, que puede ser
Variable cuantitativa continua
De acuerdo con el tipo de variable estadstica, la escala de medicin que se usar ser:
VARIABLE

ESCALA DE MEDICION

CUALITATIVA
CUANTITATIVA

Nominal

Ordinal

De intervalo

De razn

ACTIVIDAD 01:
Identifica la variable: cualitativa (C) o cuantitativa (Q) y clasifica las variables segn el carcter de las
escalas: nominal (N), ordinal (O), de intervalo (I) y de razn (R):

Edad

Sexo

Grado de instruccin

Estado civil

Religin

Rango de agresividad

Nmero de hijos

Aos de escolaridad

Tipos de desviacin
social: alcoholismo,
prostitucin, drogadiccin

Puntuacin obtenida
en una escala de
Thurstone

Tiempo de servicios

Grado de
generosidad

Temperatura

Peso

Extensin de fincas
cultivadas

Escalas de prestigios
de profesiones

Permetro torxico
Rasgo caracterial
preferido: amabilidad,
simpata
Nivel de ingresos
Coeficiente de
inteligencia
Rango de prestigio

Rafael Cantorin Curty


procesamiento de datos e informacin

Grados de aficin al cine

Clases sociales

Frecuencia de visitas a
amigos

Nombre de las
Instituciones Educativas

Tcnicas de

Filiacin poltica

Deportes practicados

Rango en la amplitud
musical
ndice ceflico
Rendimiento
acadmico (notas)

ACTIVIDAD 01:
Identifica la variable: cualitativa (C) o cuantitativa (Q) y clasifica las variables segn el carcter de las
escalas: nominal (N), ordinal (O), de intervalo (I) y de razn (R):

Edad

Estado civil

Nmero de hijos

Tipos de desviacin social:


alcoholismo, prostitucin, drogadiccin

Tiempo de servicios

Temperatura

Extensin de fincas cultivadas

Grados de aficin al cine

Clases sociales

Frecuencia de visitas a amigos

Sexo

Religin

Aos de escolaridad

Puntuacin obtenida en una escala


de Thurstone

Grado de generosidad

Peso

Escalas de prestigios de
profesiones

Nombre de las Instituciones


Educativas

Filiacin poltica

Deportes practicados

Grado de instruccin

Rango de agresividad

Permetro torxico

Rasgo caracterial preferido:


amabilidad, simpata

Nivel de ingresos

Coeficiente de inteligencia

Rango de prestigio

Rafael Cantorin Curty


procesamiento de datos e informacin

Rango en la amplitud musical

ndice ceflico

Rendimiento acadmico (notas)

Tcnicas de

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

1.3 REDONDEO DE NMEROS


Tericamente el redondeo de los nmeros se puede hacer:
1.3.1 Por defecto.- Es cuando no se altera la ltima cifra a redondear.
Ejemplo: Redondear al milsimo por defecto los nmeros siguientes:
NMERO

RESPUESTA

4,151 6

4,151

5,394 5

5,394

122,003 8

122,003

2,369 7

2,369

1.3.2 Por exceso.- Es cuando se incrementa en una unidad la cifra a redondear.


Ejemplo: Redondear al milsimo por exceso los nmeros siguientes:
NMERO

RESPUESTA

4,151 6

4,152

5,394 5

5,395

122,003 5

122,004

2,369 7

2,370

1.3.3 Por aproximacin.- La regla general es que, si el dgito que precede a la cifra a redondear es
menor que 5, se mantiene igual; si el dgito que precede es mayor que 5, la cifra a redondear
se aumenta en una unidad. El caso dudoso aparece cuando los nmeros terminan en 5. El
criterio que seguiremos en estas circunstancias es que si el dgito anterior al 5 es impar, se
aumenta en una unidad, y si es un nmero par, se conserva. Los ejemplos siguientes explican
este criterio:
REDONDEAR A:

NMERO

RESPUESTA

Los centsimos

8,375

8,38

Es redondeado a una cifra inmediata


mayor porque, el nmero que antecede
al 5 es impar.

Los dcimos

8,05

8,0

No es redondeado porque, el nmero


que antecede al 5 es par.

Los dcimos

5,24

5,2

No es redondeado porque, el nmero


que esta despus de 2 es menor que 5.

66,936

66,94

Los centsimos

COMENTARIO

Es redondeado a una cifra inmediata


mayor porque, el nmero que esta
despus de 3 es mayor que 5.

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

1.4 GRFICAS, TABLAS Y CUADROS ESTADSTICOS


Representacin grfica.- Es una representacin objetiva que muestra visualmente el resumen de la
informacin que interesa destacar y recordar. Las representaciones grficas deben conseguir que un
simple anlisis visual ofrezca la mayor informacin posible.
La representacin grfica puede percibirse como un recurso visual que permite al investigador tener
una idea clara, precisa y rpida de las observaciones que se obtuvieron para la variable objeto de
estudio, ya sea de una muestra, poblacin o grupo de elementos.

En toda tabla o cuadro estadstico se debe tener en cuenta lo siguiente:


Cuadro 01. REGIN JUNN: PERSONAL DOCENTE, SEGN NIVEL Y
MODALIDAD, 2005 - 2009

TITULO
VARIABLES
(Cabezas)

CONTENIDO

FUENTE

Ao
2005
2006
2007
2008
2009

Educacin
Inicial

Educacin Primaria
Menores

Adultos

Educacin Secundaria
Menores

Adultos

1 620
8 897
75
8 234
1 692
8 990
78
8 351
1 925
9 247
14
8 774
1 813
9 253
14
9 056
2 030
9 607
10
9 127
Fuente: Junn Compendio Estadstico 2010 - INEI

275
229
216
122
37

CUERPO
(Unidades
Absolutas)

1.4.1 GRFICOS LINEALES


Son grficos que consisten en lneas o segmentos de recta. Para construir una grfica de lnea,
primero se marcan los datos mediante puntos, de acuerdo a las escalas de las dos lneas de
referencia. Luego se unen los puntos por medio de segmentos. Las escalas usadas en las dos
lneas de referencia son usualmente cuantitativas y pueden ser o no iguales. Los grficos
lineales son usados principalmente para mostrar datos clasificados por cantidad y tiempo.
Ejemplo:
GRFICO 01. NMERO DE INSTITUCIONES EDUCATIVAS EN EDUCACIN
SECUNDARIA - REGIN JUNN, 2005 - 2009

660
640
620
600
580
N INST. EDUCATIVAS 560
540
520
500
480
2005

2006

2007

2008

2009

AOS

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

1.4.2 GRFICO DE BARRAS


Son usados frecuentemente para presentar datos clasificados mediante cualquier base
(cronolgica, geogrfica, cuantitativa o cualitativa), mientras que los grficos lineales son usados
principalmente para presentar datos clasificados por tiempo y cantidad. Existen diferentes tipos de
barras:
a) Barras simples o barras
MONTO RECAUDADO (S/.)

700
600
500
400
300
200
100

SET.

OCT.
NOV.
MES

DIC.

GRFICO 02. MONTO RECAUDADO DE CUOTAS DE LOS ALUMNOS DE LA PROMOCIN (SETIEMBRE DICIEMBRE)

b) Barras componentes o de partes componentes:


NMERO DE DESAPROBADOS

35
30
25
20
15
10
5

2007

2008

2009

2010

AO
MUJERES

HOMBRES

c) Barras mltiples o agrupadas:

20
15
10
5

NMERO DE DESAPROBADOS

25

2007

2008

HOMBRES

2009

2010

AO
MUJERES

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

1.4.3 HISTOGRAMA
Es una representacin grfica que hace uso de barras, consiste en marcar en el eje de las
abscisas (eje x) de un sistema de coordenadas rectangulares, los intervalos de clase y sobre
cada uno de estos intervalos levantar un rectngulo de rea proporcional a la frecuencia
correspondiente.
INTERVALOS DE CLASE

xi

fi

Fi

hi

Hi

(% hi)

(% Hi)

04; 07

5,5

0,04

0,04

07; 10

8,5

0,12

0,16

12

16

10; 13

11,5

24

32

0,48

0,64

48

64

13; 16

14,5

10

42

0,20

0,84

20

84

16; 19

17,5

50

0,16

1,00

16

100

TOTAL

50

1,00

HISTOGRAMA DE FRECUENCIAS
30
25
20

N DE ALUMNOS

15
10
5
0
0

5,5

8,5

11,5

14,5

17,5

NOTAS

1.4.4 POLGONO DE FRECUENCIAS


Se denomina as a la lnea quebrada que resulta de unir los puntos medios de las bases superiores
de los rectngulos sucesivos de un histograma. El rea bajo esa lnea poligonal ser en general,
una aproximacin al rea cubierta por el histograma.

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

POLGONO DE FRECUENCIAS
30
25
20

FRECUENCIAS

15
10
5
0
0

5,5

8,5

11,5

14,5

17,5

NOTAS

1.4.5 OJIVA
Es una representacin grfica lineal de la distribucin de frecuencias acumuladas, ya sean
absolutas o relativas. Empieza en el lmite inferior del primer intervalo de clase, y muestra las
frecuencias acumuladas menores a cualquier lmite real superior trazado sobre los lmites reales
superiores de clase.

OJIVA
60
50
40

FRECUENCIA ACUMULADA

30
20
10
0
0

10

13

16

19

NOTAS

1.4.6 GRFICO CIRCULAR O DE SECTORES


Equivale a una circunferencia cuya rea se divide en partes proporcionales a las partes integrantes
de un total; se utiliza en el caso de atributos. Para su construccin es necesario determinar el
ngulo que representa a cada sector, para lo cual se utiliza una regla de tres simple.
Ejemplo:
Cuadro 02. OCUPACIN OBRERA EN LA MINERA
DETALLE

OBREROS NGULO

PORCENTAJ
E

COBRE

20 784

181

50 %

HIERRO2,5

3 173

27

8%

CARBON

11 278

98

27 %

SALITRE

5 353

46

13 %

20

10

Rafael Cantorin Curty


procesamiento de datos e informacin

PETRLEO
TOTAL

Tcnicas de

958

2%

41 446

360

Para obtener el ngulo que representa a los obreros que trabajan con Cobre se procede de la
siguiente manera:

41 446 obreros son representados por

360

20 784 obreros sern representados por x

Y se resuelve as:

Salitre

Petrleo

Carbon
Cobre

Hierro

PRACTICA N 01

ACTIVIDAD 02:
Dadas los siguientes cuadros estadsticos y distribucin de frecuencias. Representa con la grfica
correspondiente o apropiada.
CUADRO N 01
ALUMNOS MATRICULADOS EN UNIVERSIDADES POR SECTOR
1992

1993

1994

1995

1996

1997

1998

1999

Pblicas

242

235

242

79

175

109

136

216

Privadas

145

132

123

102

118

17

68

105

FUENTE: INEI-2000

CUADRO N 02
PREGUNTA N 01. EN EL COLEGIO EL DIRECTOR TIENE CAPACIDAD DE LIDERAZGO Y
CONVOCATORIA PARA GESTIONAR LA INSTITUCIN EDUCATIVA
RESPUESTAS

fi

Fi

Mala

17

17

Tolerable

29

46

Regular

97

143

hi

Hi

% hi

%Hi

11

Rafael Cantorin Curty


procesamiento de datos e informacin

Buena

38

181

ptima

41

222

TOTAL

Tcnicas de

222
FUENTE: CUESTIONARIO DE GESTIN INSTITUCIONAL

CUADRO N 03
DISTRIBUCIN DE LA LECTORA

NIVEL SOCIO
ECONMICO

DE INFORMACIN

ENTRETENIMIENTO

DEPORTES

OTROS

NIVEL A

19

NIVEL B

15

NIVEL C

14

NIVEL D

11

TOTAL

57

23

24

16

FUENTE: APOYO Y OPININ-2000

CUADRO N 04
ESTRS LABORAL EN DOCENTES DE EDUCACIN PRIMARIA DEL DISTRITO DE CHILCA
Sexo

Nivel

Edad

Bajo

Medi
o

20

13

Alto

6
33

TOTAL

Cond. Laboral

20-40 41-60

Proced.

ISPP

19

16

14

21

28

17

26

24

20

30

40

10

FUENTE: TESIS DE SILVIO CHAVEZ (2010; 101)

TABLA N 05*
TABLA DE FRECUENCIAS DE UNA PRUEBA DE PROCESO EN MATEMTICA
LIR - LSR

xi

fi

[03; 05[

[05; 07[

[07; 09[

11

[09; 11[

15

[11; 13[

[13; 15[

[15; 17[

[17; 19]

TOTAL

60

Fi

hi

Hi

%hi

%Hi

(*) Representa grficamente: Histograma, polgono y ojiva

TABLA N 06*
ESTRUCTURA DEL PRESUPUESTO

12

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

(*) Representa grficamente con sector circular

13

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

UNIDAD II.- ESTADIGRAFOS DE LA ESTADISTICA DESCRIPTIVA


En cualquier anlisis o interpretacin de datos numricos se puede utilizar una gran
variedad de medidas descriptivas que representan las propiedades de posicin, dispersin y
forma, para extraer y resumir las caractersticas salientes del conjunto de datos:

Propiedades
de los datos

Posicin

Medidas de tendencia
Central

Media aritmtica
Mediana
Moda
Cuantiles

Dispersin

Medidas de dispersin
o variabilidad

Rango
Varianza
Desviacin Estndar
Coeficiente de Variacin

Simetra
Forma
Curtosis

Asimtrica + Simtrica
Leptocrtica
Mesocrtica
Platicrtica

2.1 Media aritmtica.- Es el estadgrafo de posicin ms importante, se obtiene dividiendo la suma de


todos los valores de la variable entre el nmero total de observaciones. Se presenta dos casos:
Para datos no agrupados

Para datos Agrupados

2.2 Mediana.- Es aquel dato que tiene la propiedad de dividir al conjunto en dos partes iguales. Si el
nmero de datos fuese impar se tomar como mediana el valor central, pero si el nmero de datos
fuese par, se tomar como mediana la semisuma de los datos centrales siempre y cuando los datos
estn ordenados ascendentemente o descendentemente.
Para datos agrupados

Su ecuacin es:
Donde:
LMe
c
n
Fm-1
fm

: Lmite inferior de la clase mediana.


: Amplitud de la clase mediana.
: nmero total de datos.
: Frecuencia absoluta acumulada de la clase anterior a la clase mediana.
: Frecuencia absoluta de la clase mediana.

2.3 Moda.- La moda es el valor que se da con mayor frecuencia. Si se tiene una moda se llama
UNIMODAL; si tiene dos modas se llama BIMODAL y si tiene dos o ms modas se llama
MULTIMODAL o POLIMODAL. Hay dos tipos de moda:
Moda Absoluta: Es el valor de la variable que se da con mayor frecuencia.

14

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Moda relativa: Es un valor de la variable que representa un intervalo de clase.

Moda para una variable continua o datos agrupados


Se utiliza la siguiente frmula:

Donde:
LMo: Lmite inferior de la clase modal.
c : Amplitud de la clase modal.
n : nmero total de datos.
1 : Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta anterior.
2 : Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta posterior.
2.4 Rango o recorrido.- El rango o recorrido de un conjunto de observaciones es la diferencia entre el
dato mayor y el dato menor de la variable.

2.5 Varianza.- La varianza es el promedio del cuadrado de las desviaciones de cada valor de la variable
respecto de la media aritmtica.

Mtodo de clculo para datos sin agrupar

Mtodo de clculo para datos agrupados


2.6 Desviacin estndar.- La desviacin estndar de una distribucin se define como la raz cuadrada
de la varianza. Por consiguiente para su clculo solo debemos agregarle una raz cuadrada a las
ecuaciones de la varianza. Se denomina tambin desviacin tpica.

Datos sin agrupar

Datos agrupados

2.7 Coeficiente de variacin.- El ms comn de los parmetros de dispersin relativa que se utiliza en
estudios estadsticos es el coeficiente de variacin. Este coeficiente se define como el cociente entre
la desviacin estndar y la media aritmtica, se expresa como porcentaje y no en trminos de las
unidades de los datos particulares. Es decir:

15

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Como es una medida relativa su utilidad es muy particular. Sirve para comparar la variabilidad de
dos o ms conjuntos de datos que se expresan en diferentes unidades de medida:
Si CV > 33 % el conjunto de datos es heterogneo
Si CV < 33 % el conjunto de datos es homogneo
2.8 ndices de asimetra.- Se dice que una distribucin de frecuencias es simtrica, si los intervalos
equidistantes del intervalo central tienen iguales frecuencias.

Existen varias medidas de asimetra, una de ellas es el coeficiente o ndice de asimetra de


Pearson:

Otra forma de expresar el ndice de asimetra es:


Interpretacin:

= Me = Mo
Me Mo
Simtrica: As = 0
Dificultad de una prueba:

Mo Me

Asimetra positiva: As >0


Asimetra igual a cero:
Asimetra positiva:
Asimetra negativa:

Asimetra negativa: As < 0


prueba moderada.
prueba difcil.
prueba fcil.

Tambin tenemos el coeficiente de asimetra de Fisher:

As=

1
3
( Xi X ) fi

1
2
( Xi X ) fi

3/2

Tenemos el ndice basado en tres cuartillas (Yule Bowley):


o Simtrico
: Q3 Q2 = Q2 Q1
o Simetra positiva
: Q3 Q2 > Q2 Q1
o Simetra negativa
: Q3 Q2 < Q2 Q1
Su ecuacin es:

( Q3 Q2 )( Q2 Q1)
1
( Q3Q2 ) + ( Q2Q1 )

2.9 Curtosis.- Es la propiedad de una distribucin de frecuencias por la cual se compara la dispersin de
los datos observados cercanos al valor central con la dispersin de los datos cercanos a ambos
extremos de la distribucin.

16

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

La curtosis utilizando percentiles se define por el cociente:


Interpretacin: Sensibilidad de una prueba:
Mesocrtica: K = 0,263
Leptocrtica: K > 0,263 (Prueba no muy sensible)
Platicrtica: K< 0,263 (Prueba muy sensible)
Tambin tenemos el coeficiente de Fisher:

K=

1
4
( Xi X ) fi

1
2
( Xi X ) fi

EJERCICOS DE APLICACIN:
1.

Con los datos de la tabla N 05, determina los estadgrafos de tendencia central, de dispersin y de
posicin.
Tenemos:
TABLA N 05.- PRUEBA DE PROCESO EN MATEMTICA
xi

fi

xifi

Fi

[03; 05[

99,405

[05; 07[

24

102,010

[07; 09[

48

12

55,815

[09; 11[

10

90

21

9,923

[11; 13[

12

84

28

6,317

[13; 15[

14

70

33

43,513

[15; 17[

16

64

37

98,010

[17; 19]

18

54

40

144,908

40

442

TOTAL

Media aritmtica:

Mediana:

(xi -

LIR - LSR

)fi

559,900

Reemplazando:

Reemplazado:

2012

Me=9+2 ( 9 ) =10,78

17

Rafael Cantorin Curty


procesamiento de datos e informacin

Moda:

Tcnicas de

Mo=9+2

Reemplazando:

( 3+23 )=10,20

Rango: Xmax Xmin = 19 03 = 16


Reemplazando:
Varianza:

S =

=14,36
( 559,9
351 )

Desviacin estndar:
Reemplazando:

Coeficiente de Variacin:

Reemplazando:
Interpretacin: El conjunto de datos de la prueba de proceso de matemtica es heterogneo
porque 34,29 % > 33%.

Coeficiente de Asimetra:
Reemplazando:

As=

3(11,0510,78)
=0,22
3,79

Interpretacin: El coeficiente de asimetra es positivo o tiene un sesgo hacia la derecha; tambin


nos indica que la prueba escrita de proceso de matemtica estuvo difcil.

Kurtosis:

Calculando los respectivos percentiles se tiene:


Interpretacin: El conjunto de datos tiene como coeficiente de kurtosis igual a 0,02; es decir le
corresponde una grfica mesocrtica.

18

Rafael Cantorin Curty


procesamiento de datos e informacin
2.

Tcnicas de

Con los datos del Cuadro N 01, determina los estadgrafos de tendencia central, de dispersin y de
posicin.
Cuadro 01. Matriz de tem por sujeto de los resultados de una Prueba de Rendimiento Acadmico
1

10

11

12

13

14

15

tem 1

tem 2

tem 3

tem 4

tem 5

tem 6

tem 7

tem 8

tem 9

tem
10

2
0

18

20

18

16

14

16

12

16

18

UNIDAD III.- VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS


3.1 VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS
Estos procesos se aplican en el desarrollo de una investigacin, con la finalidad de evaluar la
consistencia del diseo de la estructura de los instrumentos de recoleccin que se usaran para el
acopio y recoleccin de la informacin necesaria para la ejecucin de una investigacin.

3.1.1 Validez
El objetivo de la validez es definir si el test cumple la funcin para el cual fue diseado, se dice que
un instrumento es vlido cuando demuestra efectividad en cuanto a lo que mide; es decir mide lo
que se ha propuesto medir. Para este fin, la validez se agrupa en tres grandes grupos:
A. Validez de Contenido.- Grado en el cual los tems son una muestra representativa de la
variable que se desea medir. Se refiere al grado en que un instrumento refleja un dominio
especfico del contenido de lo que se mide. Para lograr una buena evidencia del contenido
debe tenerse en cuenta:
1. Definicin conceptual
2. Definicin operacional
3. Pertinencia
4. Exhaustividad
5. Plan de Prueba
6. Evaluacin o juicio de un experto

19

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

B. Validez de Criterio.- Establece la validez de un instrumento de medicin comparndola con


algn criterio externo. Este criterio es un estndar con el que se juzga la validez del
instrumento. Entre ms se relacionen los resultados del instrumento de medicin con el criterio,
la validez del criterio ser mayor.
Si el criterio se fija en el presente, se habla de validez concurrente; si el criterio se ubica en el
futuro, se habla de validez predictiva; si el criterio se fija en el pasado, equivale a la validez
posdictiva.
C. Validez de Constructo.- Se refiere al grado en que una medicin se relaciona
consistentemente con otras mediciones de acuerdo con hiptesis derivadas tericamente y que
conciernen a los conceptos (constructos) que estn siendo medidos. La validez del constructo
incluye tres etapas:
- Se establece y especifica la relacin terica entre los conceptos.
- Se correlacionan ambos conceptos y se analiza cuidadosamente la correlacin.
- Se interpreta la evidencia emprica de acuerdo con el nivel en que clarifica la validez del
constructo de una medicin en particular.

El Informe de la Validez de Contenido a travs del Juicio de Expertos


Para la determinacin de la validez de contenido a travs del Juicio de Expertos, se utiliza el
Coeficiente V. De Aiken, puesto que los valores son contrastados estadsticamente segn el
tamao de la muestra de los jueces consultados. De acuerdo con Navarro (2009), requiere de un
grupo mnimo de cinco jueces y que por lo menos cuatro estn en concordancia para que el tem
sea vlido, alcanzando Coeficiente V iguales o superiores a 0,80, a un nivel de significacin
estadstica de p < 0,05.
Este coeficiente puede obtener valores entre 0 y 1, y a medida que sea ms elevado el valor
computado, el tem tendr una mayor validez de contenido. Tal como lo seala Escurra (1988), el
resultado puede evaluarse estadsticamente haciendo uso de la tabla de probabilidades asociadas
a la cola derecha. La frmula utilizada para determinar la validez de contenido ese la siguiente:

Donde:
S, es igual a la sumatoria de los valores de SI.
N, es el nmero de jueces.
C, constituye el nmero de valores de la Escala,(Es 2, cuando se tiene: SI y NO).
3.2 CONFIABLIDAD DE LOS INSTRUMENTOS
La confiabilidad de un instrumento de medicin, se refiere al grado en que su aplicacin repetida al
mismo sujeto u objeto produce resultados iguales.
La confiabilidad de un instrumento se refiere a la constitucin interna de las personas, a la mayor o
menor acescencia de errores de medida. Un instrumento confiable significa que si lo aplicamos por
ms de una vez a un mismo elemento entonces obtendramos iguales resultados.
Mtodos para calcular la confiabilidad de un instrumento de medicin:
Hay diversos mtodos para determinar la confiabilidad de un instrumento de medicin. Todos utilizan
frmulas que producen coeficientes de confiabilidad estos coeficientes pueden oscilar entre 0 y 1,
donde un coeficiente de o significa nulo confiabilidad y 1 representa un mximo de confiabilidad
(confiabilidad total).

20

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

CONFIABILIDAD
Muy baja

Baja

Regular

0
0%
Confiabilidad del instrumento debe ser: Mayor al 60 %

Aceptada

Elevada
1
100 %

3.2.1 Mtodo de la medida de estabilidad: Test Retest


Consiste en la aplicacin de dos veces o ms veces un mismo instrumento de medicin a un
mismo grupo de personas, despus de cierto perodo. Si la correlacin entre los resultados de
las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable. Se
determinar mediante el clculo del Coeficiente de correlacin de Pearson (r).

Donde:
N: nmero de parejas
X: valores obtenidos en el momento 1
Y: valores obtenidos en el momento 2
3.2.2 Mitades partidas (Split-Halves)
Consiste en calcular el Coeficiente de correlacin de Pearson entre las dos mitades de cada
factor (pares e impares) de los elementos. Este mtodo requiere solo una aplicacin de la
medicin.
Especficamente el conjunto total de tems (o componentes) se divide en dos mitades y se
comparan las puntuaciones o los resultados de ambas. Si el instrumento es confiable, las
puntuaciones de ambas mitades deben estas muy correlacionadas.

21

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

3.2.3 Coeficiente Alfa de Cronbach


Requiere de una sola administracin del instrumento de medicin y se basa en la medicin de la
respuesta del sujeto con respecto a los tems del instrumento.
Su ventaja reside en que no es necesario dividir en dos mitades a los tems del instrumento de
medicin; simplemente se aplica la medicin y se calcula el coeficiente. Alfa refleja el grado en el
que covaran los tems que constituyen el test, es, un indicador de la consistencia interna del test.
Su ecuacin del coeficiente es:

Donde:
k: Es el nmero de tems.
Si: Sumatoria de varianzas de los tems.
ST: Varianza de la suma de los tems.
: Coeficiente de Alfa de Cronbach.
3.2.4 Kuder - Richardson
Kuder y Richardson (1937) desarrollaron varios modelos para estimar la confiabilidad de
consistencia interna de una prueba, siendo uno de los ms conocidos la denominada frmula 20
(KR20), el cual se representa de la siguiente manera:

Donde:

22

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

k: Es el nmero de tems.
St: Varianza total de la prueba.
pq: Sumatoria de la varianza individual de los tems.
rKR: Coeficiente de confiabilidad Kuder-Richardson.

Tambin tenemos:

Donde:
k: Es el nmero de tems.
St: Varianza total de la prueba.
p: Promedio (X / k)
rKR: Coeficiente de confiabilidad Kuder-Richardson.

Dentro de los factores que pueden afectar la confiabilidad y la validez se encuentran:


- Improvisacin
- Uso de instrumentos desarrollados en el extranjero que no han sido validados.
- Instrumento inadecuado para las personas a las que se le aplica.
- Condiciones en que se aplica el instrumento.

EJERCICOS DE APLICACIN:
1. Sean los datos de una prueba administrado dos veces en diferentes tiempos en una muestra de
veinte estudiantes, cuyos resultados se presentan en el Cuadro 01. Estima la estabilidad mediante el
mtodo test retest.
Cuadro 01. Notas de 20 estudiantes de una misma prueba en diferentes tiempos
SUJETOS PRUEBA (t1)

PRUEBA (t2)

11

10

08

11

10

10

12

12

10

10

09

05

10

07

09

06

10

13

10

12

08

23

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

11

11

13

12

08

07

13

09

06

14

12

11

15

12

13

16

12

12

17

06

07

18

14

12

19

11

10

20

15

14

Reemplazando en la frmula de la correlacin de Pearson:


rxy = 0,6646
De acuerdo con el resultado anterior, se concluye que el instrumento en estudio tiene una
confiabilidad de consistencia moderada, aunque no lo suficientemente alta como para ser
considerada aceptable en el caso de pruebas escritas, cuyo coeficiente de homogeneidad siempre se
espera que caiga en la categora de muy alto (entre 0,80 y 1,0).
2. Sean los datos de una prueba de 10 tems aplicado en una muestra de quince estudiantes, cuyos
resultados se presentan en el Cuadro 02. Estima la confiabilidad mediante el mtodo de Split-Halves.
Cuadro 02. Matriz de tem por sujeto de los resultados de una Prueba de Rendimiento Acadmico
1

10

11

12

13

14

15

Item 1

Item 2

Item 3

Item 4

Item 5

Item 6

Item 7

Item 8

Item 9

Item 10

20 18

20

18

16

14

04

16

08

08

12

06

08

16

18

10

10

10

10

10 10

10

10

10

Impar
Par

Reemplazando en la frmula de la correlacin de Pearson:

rxy = 0,6547

De acuerdo con el resultado anterior, se concluye que el instrumento en estudio tiene una confiabilidad
de consistencia moderada, aunque no lo suficientemente alta como para ser considerada aceptable en el
caso de pruebas escritas, cuyo coeficiente de homogeneidad siempre se espera que caiga en la
categora de muy alto (entre 0,80 y 1,0).
3. Sean los datos de una prueba de diez tems en una muestra de quince estudiantes, cuyos resultados
se presentan en el Cuadro 03. Estima la confiabilidad interna mediante el Alfa de Cronbach
Cuadro 03. Matriz de tem por sujeto de los resultados de una Prueba de Rendimiento Acadmico

tem 1

10

11

12

13

14

15 SItem

0,952
4

24

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

tem 2

0,838
1

tem 3

1,028
6

tem 4

0,838
1

tem 5

1,028
6

tem 6

0,838
1

tem 7

0,495
2

tem 8

1,028
6

tem 9

0,685
7

tem
10

1,028
6

8,7619

2
0

18

20 18

16

14

16

12

16

18

ST

28,8381

Reemplazando en la frmula:

De acuerdo con el resultado anterior, se concluye que el instrumento en estudio tiene una confiabilidad
de consistencia interna significativa, aunque no lo suficientemente alta como para ser considerada
aceptable en el caso de pruebas escritas, cuyo coeficiente de homogeneidad siempre se espera que
caiga en la categora de muy alto (entre 0,80 y 1,0).
4. Supongamos que hemos administrado una prueba de diez tems en una muestra de quince
estudiantes, cuyos resultados se presentan en el Cuadro 04. Estima la confiabilidad interna mediante
KR20 (Kuder-Richardson)
Cuadro 04. Matriz de tem por sujeto de los resultados de una Prueba de Rendimiento Acadmico
1

10

11

12

13

14

15

pq

tem 1

0,666
7

0,3333

0,2222

tem 2

0,800
0

0,2000

0,1600

tem 3

0,666
7

0,3333

0,2222

tem 4

0,666
7

0,3333

0,2222

tem 5

0,666
7

0,3333

0,2222

tem 6

0,666
7

0,3333

0,2222

tem 7

0,933
3

0,0667

0,0622

tem 8

0,466

0,5333

0,2489

25

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

7
tem 9

0,800
0

0,2000

0,1600

tem 10

0,466
7

0,5333

0,2489

16 16

14

16

14

12

12

14

12

12

14

10

16

18

6,971
4

1,9911

Reemplazando en la frmula:

rKR = 0,7938
De acuerdo con el resultado anterior, se concluye que el instrumento en estudio tiene una
confiabilidad de consistencia interna significativa, aunque no lo suficientemente alta como para ser
considerada aceptable en el caso de pruebas escritas, cuyo coeficiente de homogeneidad siempre
se espera que caiga en la categora de muy alto (entre 0,80 y 1,0).

3.2.5 ndice de dificultad


Indica la proporcin de personas que respondieron correctamente la pregunta o reactivo.
Se halla dividiendo el nmero de participantes que respondieron bien el tem sobre el nmero de
participantes evaluados. Su ecuacin es:

Donde:
A: N de aciertos
N=Nmero total de participantes
Clasificacin del nivel de dificultad:
Muy fcil
Fcil
Intermedio
Difcil
Muy difcil

de 0,75
de 0,55
de 0,45
de 0,25
de 0,05

a
a
a
a
a

0,99
0,74
0,54
0,44
0,24

Del Cuadro N 04:


ITEM

N DE
ACIERTOS

ID

tem 1

10

0,67

Fcil

tem 2

12

0,80

Muy fcil

tem 3

10

0,67

Fcil

tem 4

10

0,67

Fcil

tem 5

10

0,67

Fcil

tem 6

10

0,67

Fcil

tem 7

14

0,93

Muy fcil

tem 8

0,47

Intermedio

tem 9

12

0,80

Muy fcil

COMENTARIO

26

Rafael Cantorin Curty


procesamiento de datos e informacin

tem 10

Tcnicas de

0,47

Intermedio

3.2.6 Coeficiente de validez de los tems


El coeficiente de validez de cada tem es una correlacin tem-test o tambin llamada tem-total.
Para que sea vlido el coeficiente de validez debe ser mayor que 0,20.
No vlido
0

Vlido
0,20

1,0

Se calcula mediante la frmula, que es una correccin al coeficiente de correlacin de Pearson.

Donde:
Con
rcrudo
St
Si
S2t
S2i

=
=
=
=
=
=

Coeficiente de validez del tem.


Coeficiente de correlacin de Pearson.
Desviacin estndar del puntaje total.
Desviacin estndar del tem.
Varianza del puntaje total.
Varianza del tem.

Del Cuadro N 03:


Desviaci
Varianza n estndar

St = 5,3701

Correlaci
n de
Pearson

Coeficient
e de
validez

Comentario

tem 1

0,9524

0,9759

0,2544

0,0750

NO VLIDO

tem 2

0,8381

0,9155

0,5192

0,3778

VLIDO

tem 3

1,0286

1,0142

0,4407

0,2701

VLIDO

tem 4

0,8381

0,9155

0,5773

0,4459

VLIDO

tem 5

1,0286

1,0142

0,5456

0,3917

VLIDO

tem 6

0,8381

0,9155

0,6354

0,5158

VLIDO

tem 7

0,4952

0,7037

0,5645

0,4649

VLIDO

tem 8

1,0286

1,0142

0,6610

0,5326

VLIDO

tem 9

0,6857

0,8281

0,6554

0,5529

VLIDO

tem 10

1,0286

1,0142

0,9128

0,8710

VLIDO

St = 28,8381

3.2.7 Poder discriminativo de la prueba pedaggica


La magnitud de esta capacidad diferenciadora de los tems se expresa por ndices de
discriminacin, cuyo clculo se realiza mediante el mtodo correlacional, coeficiente de correlacin
punto serial (rp.bis).
Se calcula mediante la frmula, que es una correccin punto serial (r p bis).

27

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Donde:
= Promedio de las puntuaciones totales del postulante que respondi bien el tem
analizado.
= Promedio de las puntuaciones totales de todos los postulantes considerados en el anlisis.
st = Desviacin estndar de las puntuaciones totales de todos los postulantes considerados en el
anlisis.
p y q = Proporciones de los postulantes que, respondieron bien, mal u omitieron el tem analizado.
Clasificacin de la discriminacin del tem
Clasificacin

Puntaje

Muy buena discriminacin

0,40 0,99

Buena Discriminacin

0,30 0,39

Baja Discriminacin

0,20 0,29

Muy baja Discriminacin

0,05 0,19

Del Cuadro N 04:


tem

Pt

Xt

St

PD

Comentario

tem 1

13,800

13,60

2,64

0,6667

0,3333

0,11

Muy baja discriminacin

tem 2

13,667

13,60

2,64

0,8000

0,2000

0,05

Muy baja discriminacin

tem 3

14,600

13,60

2,64

0,6667

0,3333

0,54

Muy buena discriminacin

tem 4

14,200

13,60

2,64

0,6667

0,3333

0,32

Buena discriminacin

tem 5

13,60

2,64

0,6667

0,3333

tem 6

13,60

2,64

0,6667

0,3333

tem 7

13,60

2,64

0,9333

0,0667

tem 8

13,60

2,64

0,4667

0,5333

tem 9

13,60

2,64

0,8000

0,2000

tem 10

13,60

2,64

0,4667

0,5333

UNIDAD IV
INFERENCIA ESTADSTICA
4.1 TCNICAS DE MUESTREO
En este captulo aprenderemos mtodos sencillos para determinar la probabilidad de seleccionar
muestras de una poblacin. Una parte fundamental para realizar un estudio estadstico de cualquier
tipo es obtener unos resultados confiables y que puedan ser aplicables; pues, resulta casi imposible

28

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

o imprctico llevar a cabo algunos estudios sobre toda una poblacin, , por lo que la solucin es
llevar a cabo el estudio basndose en un subconjunto de sta denominada muestra.
La muestra siempre ser un subconjunto de la poblacin en estudio;
sin embargo, para que los estudios tengan la validez y confiabilidad
buscada es necesario que tal subconjunto de datos, posea algunas
caractersticas especficas que permitan generalizar los resultados
hacia la poblacin en total. Esas caractersticas tienen que ver
principalmente con el tamao de la muestra y con la manera de
obtenerla.

4.1.1 IMPORTANCIA DEL MUESTREO


A lo largo de la asignatura se hacen uso de dos tipos de razonamiento: el deductivo y el
inductivo. El primero est relacionado directamente con la teora de la probabilidad, el
segundo tipo de razonamiento se relaciona con la denominada inferencia estadstica; luego,
la importancia que desempea el muestreo consiste en proporcionar el nmero de elementos
necesarios y suficientes para realizar la inferencia respectiva. Dicho nmero se estima por
medio de distribuciones de probabilidad y tipos de muestreo.
Es posible obtener una informacin apropiada de la poblacin a partir de la muestra, siempre
que se eviten errores como la mala elaboracin de la encuesta o del cuestionario o las
equivocaciones de los entrevistadores. Sobre el particular, conviene impartir a stos
capacitacin previa para cada proyecto que se va a realizar; este tipo de errores por lo general
se llaman sesgos.
Toda muestra tiene un error muestral, debe tomarse un nmero de elementos suficientes para
poder inferir acerca de la poblacin; cuanto menor sea el error muestral, mayor ser la
muestra, es decir, se tiende a encuestar al universo, y estaremos realizando un censo; lo que
se busca es efectuar una muestra considerando el error y evitando sesgos en toda nuestra
investigacin.

29

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

4.2 CLASIFICACIONES DE MUESTREO


Tenemos los siguientes diseos muestrales:

Muestreo
Caso 1:

Fijo

Secuencial

Figura 4.1

En el muestreo fijo, se establece un nmero fijo de tamao de muestra y se recaban los datos antes
de realizar el anlisis de los resultados. En el muestreo secuencial, el tamao de la muestra no se
determina por una regla de decisin, ni de manera arbitraria; se comienza con la recoleccin de
datos y, en forma peridica, se examina si es necesario continuar con el muestreo o se llega a la
conclusin de que la informacin recabada basta para analizar los datos y realizar las inferencias
necesarias.

Caso 2:

Muestreo

Atributos

Variables

Figura 4.2

La diferencia entre el muestreo de atributos y el de variables consiste en el tipo de parmetro


que se busca acerca de la poblacin. Un atributo es una caracterstica cualitativa o
descriptiva que un integrante de la poblacin posee o no posee; por eso siempre se har
referencia a proporciones de la poblacin en estudio. El muestreo de variables trata de
estimar una medida de la poblacin y no una proporcin de ella.
Ejemplo, supngase que se necesita conocer la opinin de los docentes acerca de las
clases que se imparten en la especialidad de educacin primaria; nuestro atributo lo
constituiran todas las personas que son pedagogos y se titularon en ello. Debido a que no
todos los individuos cumplen este requisito, es una proporcin de la poblacin total.

30

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Muestreo
Caso 3:

Probabilstico

Determinstico

Figura 4.3

Esta clasificacin es la ms usual. El muestreo probabilstico, indica que la eleccin de


cada integrante de la poblacin debe ser completamente aleatoria, y que todos tendran la
misma probabilidad de ser seleccionados. En el muestreo determinstico, el investigador
escoge los elementos de acuerdo con sus necesidades, el nmero de muestra y los
elementos de la poblacin en estudio.
Ejemplo, para establecer el nmero apropiado de instituciones educativas primarias y
secundarias que deben contar con el Plan Huascarn, en el Distrito de Huancayo; se
desconoce el nmero de estudiantes y computadoras por centro educativo y sera muy
costoso realizar un censo, por lo que se usar el muestreo. La pregunta inmediata es:
probabilstico o determinstico? En este caso conviene ms el muestreo probabilstico; de lo
contrario, slo se extraer informacin referente a cierto sector, la cual no sera confiable.
Para ejemplificar el muestreo determinstico, se tiene lo siguiente; un docente desea conocer
la opinin de sus alumnos respecto a la calidad de las sesiones de aprendizaje. El imparte la
materia a cuatro grupos, pero decide encuestar slo a dos. Es importante sealar que el
maestro solamente ser capaz de realizar un estudio estadstico descriptivo. No podr hacer
ningn tipo de inferencia al respecto.
Luego, uno de los primeros problemas que enfrentamos es la eleccin del tipo de muestreo mas
adecuado. Pasamos a detallar un listado de ventajas y desventajas en la eleccin entre determinstico o
probabilstico.
Determinstico

V
e
nt
aj
as

Econmico

Cuenta con modelos para calcular el


tamao de la muestra, con una
confiabilidad y un grado de error
determinado.

Es viable inferir respecto de los


estadsticos y parmetros insesgados.

Alto costo en el establecimiento del


marco muestral adecuado.

Puesta en marcha sencilla


Conocimientos bsicos de la
estadstica.
No es posible obtener
patrones insesgados

No cuenta con un modelo


para la determinacin del
tamao de muestra

Menor tiempo de elaboracin

Desventajas

Probabilstico

Sesgo de recoleccin
intrnseco imperceptible al
anlisis.

Mayor tiempo de elaboracin


Se necesita manejo de la estadstica
inferencial.

31

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Por ltimo, se considerar la calidad del diseo de muestreo requerido. En la prctica el


probabilstico es irrealizable en su totalidad debido a su alto costo; por eso, en ocasiones
experimenta cambios (llamados adaptaciones del muestreo probabilstico). Estos provocan que la
calidad del diseo disminuya considerablemente; es responsabilidad del investigador decidir hasta
dnde est dispuesto a sacrificar dicha calidad.

CALIDAD DEL DISEO DE MUESTREO REQUERIDO

BAJA

ALTA

MUESTREO

MUESTREO

DETERMINSTICO

PROBABILSTICO

Considerando un universo

Considerando el universo

al que se tiene acceso

ms conveniente

MENOR

MAYOR
Figura 4.4

4.3 MUESTREO DETERMINISTICO


Muestreo Determinstico

De Juicio

Diseo de la
bola de nieve

Por
Conveniencia

Por Cuotas

32

Rafael Cantorin Curty


procesamiento de datos e informacin

De entrevista
de grupo

Tcnicas de

De intercepcin de
centros comerciales

De paneles
controlados

Figura 4.5

4.3.1 MUESTREO DE JUICIO O CRITERIO


El tamao de la muestra y los elementos muestrales estn sujetos al juicio del investigador,
contando con la experiencia que el mismo tenga, por consiguiente su xito o fracaso depende
de la capacidad de la eleccin de los elementos. Hay situaciones en las que este procedimiento
es el ms adecuado y an aconsejable cuando el muestreo probabilstico no es factible o
resulta costoso.
Existe sin embargo, imposibilidad de asegurar la representatividad de la muestra, tampoco
tenemos un mtodo estadstico para determinar el tamao de la muestra, ni capacidad de
inferir sobre los parmetros del universo. Ejemplo: Una muestra aleatoria de homosexuales,
puede llegar a ser inviable obtenerla, para ello se recomienda utilizar una muestra de juicio
sobre los lugares que frecuentan (bares, plazas pblicas, etc.), sus lugares de reunin.
Tambin resultara difcil obtener una lista de vendedores ambulantes, as que una muestra de
juicio es la ms apropiada.
4.3.2 EL DISEO DE LA BOLA DE NIEVE
Este diseo resulta conveniente cuando se requiere alcanzar poblaciones especficas
(pequeas) de las cuales es difcil encontrar marcos muestrales adecuados. La regla es simple,
a cada encuestado se le pide que identifique a uno o ms sujetos con las mismas
caractersticas, hasta recolectar la cantidad de encuestas que considere adecuadas el
investigador para satisfacer los objetivos de estudio.
Ejemplo: Para la evaluacin de los profesores se requiere especialistas en evaluacin. El
primer paso ser encontrar al primer especialista en evaluacin, despus ste recomendar a
otro u otros; quienes alcanzaran los informes respectivos.
4.3.3 MUESTREO POR CONVENIENCIA
Sencillamente consiste en ponerse en contacto con los elementos muestrales apropiados. El
tamao de la muestra y el lugar de contacto quedan deliberados a la conveniencia del
investigador.
Ejemplo: Se desea hacer la prueba piloto de un producto, se contacta directamente a las
personas en los supermercados, se hace una demostracin y luego se recolecta una serie de
datos mediante una encuesta.
Un muestreo por conveniencia a menudo se utiliza para pruebas piloto o para probar un
cuestionario.
4.3.4 MUESTREO POR CUOTAS

33

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

El investigador trabaja nuevamente con su juicio, pero, esta vez utiliza una variable de control
que forman subgrupos dentro de la poblacin. Nuevamente el tamao de la muestra ser a
juicio del investigador, como as tambin el porcentaje que se tomar de cada subgrupo.
Tengamos en cuenta que no necesariamente estos porcentajes deben ser iguales, pueden
estar relacionados al tamao de la poblacin en relacin al tamao del departamento, o usar la
densidad poblacional como elemento de ponderacin.
Ejemplo: La variable aleatoria es el nivel de ingresos en la Provincia de Huancayo. Esta
provincia tiene distintas reas poblacionales (distritos) que marcan una distincin en cuanto a
poder adquisitivo, por consiguiente es interesante poder discriminar esos subgrupos dentro de
la provincia y determinar el porcentaje de poblacin que se tomara de cada subgrupo.
Distritos (muestra)

Huancayo

Tambo

Chilca

Sapallanga

San Agustn de Cajas

Porcentaje

Casa habitacin

20
20
20
20
20

57
63
25
15
31

100

191

4.4 MUESTREO PROBABILISTICO


Muestreo Probabilstico

Aleatorio
simple

Aleatorio
estratificado

Sistemtico

Por
Conglomerados

Figura 4.6

4.4.1 MUESTREO ALEATORIO SIMPLE


El muestreo aleatorio simple (MAS) o muestreo irrestricto aleatorio es el ms usado por los
investigadores, porque los que conforman la muestra son aquellas que se basan en el principio
de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos de una poblacin de tamao N para formar parte de una muestra
de tamao n. A continuacin se estudiar cmo seleccionar una muestra aleatoria simple o

34

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

muestrea irrestricta aleatoria, entre varias tcnicas, para lo cual algunos investigadores
acostumbran utilizar una tabla de nmeros aleatorios. (Ver la tabla de nmeros al azar)
Ejemplo: Se tiene 300 estudiantes y se desea seleccionar una muestra aleatoria simple de 30
estudiantes. Determine los seleccionados.
Solucin:

Se hace uso de la tabla: Nmeros al azar o aleatorios.

Los estudiantes ordenados alfabticamente deben ser numerados de 001 al 300.

Luego se empieza a seleccionar, para ello elegimos arbitrariamente el primer, segundo,


tercer o cuarto millar respectivamente y empezamos de la primera fila (1) y primera columna (1 4). En nuestro caso elegimos el segundo millar, tenemos:

Nmero
muestral

Sel
ecci
ona
do

23 15

231

Si

05 54

055

Si

14 87

148

Si

97 31

973

No

11 74

117

Si

43 36

433

No

93 80

938

No

49 54

495

No

...

...

Nmeros
de la tabla

...

Son seleccionados aquellos nmeros (n i 300). Por qu el nmero 973 no es


seleccionado? Pues, el 973 no existe, puesto que hay solamente 300 miembros. Qu sucede
si el nmero 231 o cualquier otro nmero se repite? Tambin se descarta, y se contina el
muestreo como si nada hubiese ocurrido.

Es as que se continuara, hasta completar el total de la muestra y podemos estar seguros


de que nuestra muestra es aleatoria. Este procedimiento, atractivo por su simpleza, tiene poca o
nula utilidad prctica cuando la poblacin que estamos manejando es muy grande.

Solucin 2:

35

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Teniendo en cuenta el cumplimiento de los procedimientos iniciales, escogemos ahora en


lnea (fila).

De la tabla, el segundo millar y primera fila, tenemos: 64 75 58 38 85 84 12 22 59 20


17 69 61 56 55 95 04 59 59 47 ...

Tenemos, 647; 558; 388; 584; 122; 259; 201; 769; 615; 655; 950; 459; 594; ... Son
seleccionados los nmeros (ni 300: 122; 259; 201; ...)

4.4.2 DETERMINACIN DEL TAMAO DE LA MUESTRA


Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacin total.
2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin.
3. El nivel de variabilidad que se calcula para comprobar la hiptesis.
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para
generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir
que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la
totalidad de los casos de la poblacin.
Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de
confianza menor. Comnmente en las investigaciones sociales se busca un 95%.
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que sea
falsa como si fuera verdadera, o la inversa: rechazar a hiptesis verdadera por considerarla falsa.
Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como
0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un
cierto riesgo de equivocarse.
Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son
complementarios la confianza y el error.
La variabilidad es la probabilidad (o porcentaje) con el que se acept y se rechaz la
hiptesis que se quiere investigar en alguna investigacin anterior o en un ensayo previo a la
investigacin actual. El porcentaje con que se acept tal hiptesis se denomina variabilidad
positiva y se denota por p, y el porcentaje con el que se rechaz se la hiptesis es la
variabilidad negativa, denotada por q.
Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la
unidad: p + q = 1. Adems, cuando se habla de la mxima variabilidad, en el caso de no
existir antecedentes sobre la investigacin (no hay otras o no se pudo aplicar una prueba
previa), entonces los valores de variabilidad es p = q = 0,5.
Una vez que se han determinado estos tres factores, entonces se puede calcular el tamao
de la muestra como a continuacin se expone.
Los conceptos que ayudarn a determinar el tamao de la muestra son los siguientes:
Error muestral (E): Es la diferencia entre la media muestral y la media de la poblacin
aceptable.

36

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Ejemplo: La puntuacin media de una poblacin de 1 000 estudiantes en un test de fsica es


11,5 y de una muestra aleatoria de 200 estudiantes es 10. Determine su error de muestreo.
Solucin:

Sabemos que,
Reemplazando,

E = 10 - 11,5
E = - 1,5

Distribucin Z: Es el nmero de unidades de desviaciones estndar en la distribucin


normal que producir el nivel deseado de confianza.

Para determinar los elementos de la muestra se aplicar la siguiente frmula, citado por Sierra Bravo.

n =
Donde:
N
n
E
pyq

: Tamao de la poblacin
: Tamao de la muestra
: Error (E = 0,05 E = 0,10)
: La mxima probabilidad, p = 0,5;

q = 0,5 (p + q = 1)

Ejemplo. En una Institucin Educativa ABC del nivel secundario, los alumnos del cuarto grado son 500
de sexo masculino. Se desea determinar la muestra respectiva, con un margen de error de 0,05
Datos:
N = 500 alumnos
E = 0,05
p = 0,5
q = 0,5
Reemplazando los datos en la frmula respectiva se tiene:
n=
n=

222

En la siguiente figura se muestran los casos para la determinacin del tamao de una muestra con
una serie de recomendaciones para el uso de las formulas:
PROCEDIMIENTOS PARA DETERMINAR EL TAMAO DE MUESTRA EN UN MAS

37

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

38

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

No

No

Si

Si

No

No

Si

Si

39

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

N = Tamao de la poblacin

N = Tamao de la poblacin

FACTOR DE CORRECCION PARA LA POBLACION FINITA

40

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

n = tamao de la muestra

N = tamao de la poblacin

Ejemplos:
1.
Determina el tamao de la muestra necesaria para estimar el peso promedio de una
poblacin conformada por 2 000 alumnos, con un margen de confianza del 95 % y un error admisible
de 50 g. Si, en un estudio similar se obtuvo que la desviacin de los pesos de los alumnos con
respecto a su media fue de 300 gramos.
SOLUCION:
Datos:
n = ?
N = 2 000
2,5 %
95 %
2,5 %
Margen de confianza: 95 % Z/2 = 1,96

E = 50 g

-1,96

+1,96

= 300 g

Reemplazando en la formula:

n = 129,35 129

Utilizando la formula (factor de correccin):

Observamos que utilizando la formula (3), el tamao de la muestra es 129 y si utilizamos el factor de
correccin, formula (5), el tamao de la muestra sera 121. Luego, dejamos al criterio del investigador
decidir el tamao de la muestra a utilizarse.
2.

De una poblacin de 1 500 estudiantes, determina el tamao de la muestra para


mantener una probabilidad de 0,9544 con un error admisible de 1,5. Considere, = 10 puntos.
SOLUCION:
Datos:
n = ?
N = 1 500
P(z) = 0,9544 Z/2 = 2

0,0228

0,9544

0,0228
z

41

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

E = 1,5 puntos

-2

+2

= 10 puntos

Reemplazando en la formula :

n = 158,94 159

Utilizando la formula (factor de correccin):

Observamos que utilizando la formula (3), el tamao de la muestra es 159 y si utilizamos el factor de
correccin, el tamao de la muestra sera 144. Luego, dejamos al criterio del investigador decidir el
tamao de la muestra a utilizarse.
3.
Luego de aplicar una evaluacin a los estudiantes de un centro educativo x. Determina
el tamao de la muestra necesaria para mantener la probabilidad de 0,6826 con los alumnos de
escasos recursos, con un error admisible de -1,5 y una desviacin poblacional de 8 puntos.
SOLUCION:
Datos:
n = ?
P(z) = 0,6826 Z/2 = 1

0,1587

0,6826

0,1587

E = -1,5

= 8
+1
Reemplazando en la formula:

-1

n = 28,4 28
Observamos que utilizando la formula (1), el tamao de la muestra es 28.
4.

En una Institucin educativa ABC del nivel secundario, los alumnos del cuarto grado
son 500 del sexo masculino. Determina la muestra respectiva para un proceso de investigacin, con
un margen de error de 0,05 y un nivel de confianza del 95 %.
SOLUCION:
Datos:
N = 500
n =?
2,5 %
95 %
2,5 %
E = 0,05
z

42

Rafael Cantorin Curty


procesamiento de datos e informacin
Margen de confianza: 95 % Z/2 = 1,96

Tcnicas de

-1,96

+1,96

p = 0,5 y (1 p) = 0,5
Reemplazando en la formula :

n = 217
5.
Se desea realizar una encuesta sobre el nivel de aceptacin de la autoridad respectiva
entre los pobladores de un distrito x del nivel socioeconmico C. Con este fin determina el tamao
de la muestra para una poblacin total de 12 000 habitantes; la proporcin del nivel socioeconmico
C con respecto a la poblacin total es de 32,76 %. Se acepta un error muestral de 0,10 y una
confiabilidad del 95 %.
SOLUCION:
Datos:
n = ?
N = 12 000
2,5 %
95 %
2,5 %
p = 0,3276 y (1 p) = 0,6724
E = 0,10
-1,96
0
+1,96
Margen de confianza: 95 % Z/2 = 1,96

Reemplazando en la formula :

n = 84
Observamos que utilizando la formula (4), el tamao de la muestra es 84.
Utiliza la formula (5) y determina el tamao de la muestra final.
Ahora resuelve t el siguiente problema:
6.
Se desea realizar un estudio de las actitudes hacia la experiencia prematrimonial a los
estudiantes de la UNCP, que cuenta con una poblacin estudiantil de 10 000 estudiantes.
Determina el tamao de la muestra con un margen de error permitido del 2 por 100 y un nivel
de confianza del 90 %.
4.4.2 MUESTREO ALEATORIO ESTRATIFICADO (MAE)
Cuando la caracterstica que nos interesa estudiar no se distribuye homogneamente en la
poblacin, por la existencia de grupos o estratos entre s heterogneos, se efecta un muestreo
estratificado. El resultado es una muestra compuesta por tantas muestras, elegidas al zar, como
estratos existan en la poblacin. Es as que los alumnos de una Institucin Educativa los podemos
agrupar por edades, clase social, lugar de procedencia, etc. (estratos). Cada uno de estos grupos
se pueden subdividir en subgrupos y elegir la muestra en funcin de ellos. El nmero de elementos
del estrato podr ser diferente desde el momento que es diferente el nmero total de sujetos que
forman cada uno de ellos.
Ejemplo. En una Institucin Educativa (x) tiene cinco secciones del 4to grado, se desea determinar
la muestra por estratificacin, dado el siguiente cuadro.

43

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

GRADO

CANTIDAD
DE ALUMNOS

CANTIDAD DE
ALUMNOS POR ( W)

4to A

45

0,6512

29

4to B

40

0,6512

26

4to C

48

0,6512

31

4to D

42

0,6512

28

4to E

40

0,6512

26

215

n = 140

W=

= 0,6512

4.4.3 MUESTREO ALEATORIO SISTEMTICO (MAS)


Es realmente, una variante del muestreo aleatorio simple, en lo nico que difiere es en la manera
como se selecciona la muestra, el procedimiento del muestreo sistemtico es exacto, por otro lado
es ms sencillo escoger los elementos de la muestra y se disminuye el grado de error. Los
nmeros que forman la muestra sern los resultantes de sumar el coeficiente de variacin
progresivamente, a partir del elegido aleatoriamente.

Coeficiente de elevacin (k) =


Donde:
N
: Nmero de unidades de la poblacin.
n
: Nmero de elementos de la muestra.
Ejemplo. Se desea seleccionar 2000 alumnos de Educacin Secundaria de una poblacin de
24000.

k=
k = 12
Al nmero aleatoriamente elegido se le suma sucesivamente 12.
Si el nmero elegido al azar fue el 9, la serie que constituye la muestra sera 9; 9 + 12; 21 + 12;
33 + 12 y as sucesivamente.
4.4.4 MUESTREO ALEATORIO POR CONGLOMERADOS (MAC)
Una muestra por conglomerados es una muestra aleatoria, en la cual cada unidad de muestreo
es una coleccin o conglomerado de elementos.
Es fcil confundir el muestreo por conglomerados con el aleatorio estratificado, ya que en
ambos se forman subconjuntos de la poblacin para realizar el muestreo; una diferencia radica
en la recoleccin de la muestra.
Es importante reconocer tres elementos para la aplicacin correcta de este diseo:
Variable de inters. Es lo que se desea conocer acerca de la poblacin.
Unidades primarias. A la primera divisin de la poblacin en estudio se le denomina unidad
primaria.
Unidades secundarias. Una vez bien definidas las unidades primarias, es necesario
subdividirlas para establecer cuntas unidades se sometern a la observacin.

44

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Ejemplo:
VARIABLE
DE
INTERS

UNIDADES
PRIMARIA
S

UNIDADES
SECUNDARIA
S

TENENCIA
DE
TELEVISO
R

MANZANA
S

CASA
HABITACIN

PROFESO
RES DE LA
UNCP

FACULTAD
ES

DEPARTAMEN
TOS

Este muestreo tiene el inconveniente de una importante prdida de informacin al no ser los
individuos las unidades muestrales sino el conglomerado. Sin embargo, cuando los elementos
de los conglomerados son muy numerosos, hay grandes inconvenientes para aplicar el
muestreo de conglomerados de una sola etapa, dado que el nmero de entrevistas sera muy
numeroso y las estimaciones, por otra parte, seran poco precisas.
4.5 PRUEBA DE HIPTESIS Y TEORA DE LA DECISIN ESTADSTICA
4.5.1 FORMULACIN DE LA HIPTESIS
No todas las investigaciones cuantitativas plantean hiptesis. Las investigaciones cuantitativas
que formulan hiptesis son aquellas cuyo planteamiento define que su alcance ser
correlacional o explicativo, o las que tienen un alcance descriptivo, pero que intentan pronosticar
una cifra o un hecho. Mientras que los estudios cualitativos, por lo regular, no formulan hiptesis
antes de recolectar datos.
Alcance del estudio

Formulacin de hiptesis

Exploratorio

No se formulan hiptesis

Descriptivo

Slo se formulan hiptesis cuando se pronostica un hecho o dato

Correlacional

Se formulan hiptesis correlacionales

Explicativo

Se formulan hiptesis causales

4.5.2 HIPTESIS NULA


La hiptesis nula es, en un sentido, la negacin de la hiptesis de investigacin. Tambin
constituyen proposiciones acerca de la relacin entre variables, solamente que sirven para
refutar o negar lo que afirma la hiptesis de investigacin.
Se representa por H0; dicha hiptesis es aceptada provisionalmente como verdadera y cuya
validez ser sometida a comprobacin experimental. Los resultados experimentales nos
permitirn seguir aceptndola como verdadera o si, por el contrario, debemos rechazarla como
tal.
4.5.3 HIPTESIS ALTERNA
La hiptesis alterna, como su nombre lo indica, son posibilidades, alternativas, ante las hiptesis
de investigacin y nula. Ofrecen otra descripcin y explicacin distintas a las que proporcionan
estos tipos de hiptesis.
Se representa por H1 o por HA; dicha hiptesis es la suposicin contraria a la hiptesis nula. La
hiptesis alternativa se acepta en caso de que la hiptesis nula sea rechazada.
4.5.4 HIPTESIS ESTADSTICAS
Las hiptesis estadsticas, son la transformacin de las hiptesis de investigacin, nula y
alternativa en smbolos estadsticos. Se pueden formular solamente cuando los datos del

45

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

estudio que se van a recolectar y a analizar, para probar o desaprobar las hiptesis, son
cuantitativas (nmeros, porcentajes, promedios). Hay tres tipos fundamentales de hiptesis
estadsticas, que corresponden a clasificaciones de las hiptesis de investigacin y nula: de
estimacin, de correlacin y de diferencias de medias.
Ejemplo de hiptesis estadstica de estimacin:
H0: = 200 (El promedio mensual de casos es igual a 200)
H1: > 200 (El promedio mensual de casos es mayor a 200)
Ejemplo de hiptesis estadstica de correlacin:
H0: r = 0 (No existe correlacin o correlacin nula)
H1: r > 0 (Existe correlacin positiva)
Ejemplo de hiptesis estadstica de diferencias:
H0: 1 = 2 (No hay diferencia entre los promedios de los dos grupos)
H1: 1 2 (Hay diferencia entre los promedios de los dos grupos)
4.5.5 TIPOS DE PRUEBAS DE HIPTESIS.El tipo de prueba depende bsicamente de la hiptesis alterna H 1. Se denomina prueba de una
cola a toda prueba de hiptesis donde la alternativa H 1 es unilateral. Si la alternativa es bilateral,
la prueba se denomina prueba de dos colas. Por ejemplo, si se asume que 0 es un valor de
parmetro desconocido :
1) Si H0: = 0 y H1: 0, se denomina prueba bilateral o de dos colas.
2) Si H0: = 0 y H1: > 0, se denomina prueba unilateral de cola a la derecha o positiva.
3) Si H0: = 0 y H1: < 0, se denomina prueba unilateral de cola a la izquierda negativa.

GRFICA 4.1. Grfica de la Curva Normal unilateral positiva

ZONA DE
ACEPTACIN

ZONA DE
RECHAZO

x
Ejemplos de docimasia de hiptesis
1. Si el diseo de investigacin es correlacional descriptivo simple:

OX
r
OY

Donde:
M: Muestra (profesores de educacin primaria)
Ox : Inteligencia emocional
OY: Estrs
rXY : Correlacin de Pearson
Sean los datos de 20 profesores del Nivel Primario, cuyos resultados fue a travs del inventario de
BarON, de la inteligencia emocional en el componente interpersonal:
126
148
152
137
99
165
147
146
150
135
142
162
124
119
154
153
138
140
135
137

46

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

El estudio del estrs (sndrome de BOURNOUT), fue a travs de la escala de Maslach Bournout
Inventory (MBI), aplicado a 20 profesores del Nivel Primario, cuyos resultados fueron:
11
11 12
14
14
10
14
17
12
10
8
10 18
19
12
11
10
12
12
10

Docimasia de la hiptesis de trabajo


H0: No existe relacin entre el componente interpersonal de la inteligencia emocional y el estrs
en los profesores del Nivel Primario.
Ho: r = 0
H1: Existe relacin inversa entre el componente interpersonal de la inteligencia emocional y el
estrs en los profesores del Nivel Primario.
H1: r < 0
Prueba estadstica
: r de Pearson.

Nivel de significacin, = 0,05 y grados de libertad, = N 2 = 20 - 2 = 18

Punto crtico o rc (18; 0,05) = 0,4438

Decisin

: Si rc rt ; se acepta la Ho y se rechaza H1.


Si rc > rt ; se rechaza la Ho y se acepta H1.
X

XY

1
2
3

19
20
=
Fuente: Archivo del tesista 2013.

Donde:
X = Componente interpersonal
Y = Estrs

Calculando r con la siguiente frmula:

Reemplazando:
Comparando, rc = y
Conclusin:

rc = -0,4482
rt = .; tenemos:

47

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

GRFICA 4.2. Grfica de dispersin del Componente interpersonal de la inteligencia


emocional y el estrs.

20
18
16
14
12
10
ESTRES
8
6
4
2
0
90

100

110

120

130

140

150

160

170

INTELIGENCIA EMOCIONAL

Tambin para aceptar o rechazar la hiptesis nula se emplea la razn t (t de student), definida como
sigue:

t
Donde:
n = Nmero de pares de valores de las variables X y Y
r = Coeficiente de correlacin lineal obtenido.

Docimasia de la hiptesis de trabajo


H0: No existe relacin significativa entre el componente interpersonal de la inteligencia emocional y
el estrs en los profesores del Nivel Primario.
Ho: r = 0 y t no es significativa
H1: Existe relacin inversa significativa entre el componente interpersonal de la inteligencia
emocional y el estrs en los profesores del Nivel Primario.
H1: r < 0 y t es significativa
Prueba estadstica
: t de student.

Nivel de significacin, = 0,05 y grados de libertad, = N 2 = 20 - 2 = 18

Punto crtico, tt (18; 0,05) = 1,734

Decisin

: Si tc tt ; se acepta la Ho y se rechaza H1.

48

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Si tc > tt ; se rechaza la Ho y se acepta H1.

Calculando t con la siguiente frmula:

Reemplazando:
Comparando, tc = y
Conclusin:

tc =
tt = .; tenemos:

GRFICA 4.3. Grfica de la Curva Normal unilateral hacia la derecha.

Zona de
Aceptacin

Zona de rechazo

t
2. Ejemplo de aplicacin:
Sean los puntajes de autoestima y de agresividad de los estudiantes del cuarto ao de la Institucin
Educativa Jhon Dewey Huancayo:
AUTOESTIMA:
62 80
56
72
86
46
74
76
88
48
62
68
70
80 62
AGRESIVIDAD:
8
9
12
29
15
36
25
16
11
18
21
16
14
14 19

Desarrolla la docimasia de la siguiente hiptesis de trabajo:


H0: No existe relacin entre autoestima y agresividad que tienen los estudiantes del 4to ao de
educacin secundaria de la Institucin Educativa Privada Jhon Dewey de Huancayo.
Ho: r > 0
H1: Existe relacin inversa entre autoestima y agresividad que tienen los estudiantes del 4to ao de
educacin secundaria de la Institucin Educativa Privada Jhon Dewey de Huancayo.
H1: r < 0

49

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

3. Si el diseo de investigacin es cuasi experimental:


GE:

O1

GC:

O2

O3
O4

Donde:
GE: Grupo experimental.
GC: Grupo control.
O1 y O2: Prueba de entrada o Pre test
O3 y O4: Prueba de salida o Post test

Docimasia de la hiptesis de trabajo del Post test (GE y GC)


Sean las notas de 15 alumnos del grupo experimental, cuyas notas del Post test son:
20
18 20
18
16
14
04
16
08
08
12
06 08
16
18
Sean las notas de 20 alumnos del grupo control, cuyas notas del Post test son:
11
11 12
14
14
10
14
17
12
10
8
10 18
19
12
11
10
12
12
10

H0: No existe diferencia significativa entre los puntajes obtenidos en el post test de los grupos
experimental y control de los alumnos del tercer grado de educacin secundaria de la Institucin
Educativa...
Ho: XGE =
XGC
H1: Existe diferencia significativa entre los puntajes obtenidos en el post test de los grupos experimental y
control de los alumnos del tercer grado de educacin secundaria de la Institucin Educativa...
H1: XGE
Prueba estadstica

XGC

: t de student.

Nivel de significacin, = 0,10 y grados de libertad, = N 2 = 35 - 2 = 33


Pinto crtico, tt (33; 0,005) = 1,697
Decisin

: Si tc tt ; se acepta la Ho y se rechaza H1.


Si tc > tt ; se rechaza la Ho y se acepta H1.

Calculando t con la siguiente frmula:

Reemplazando:
tc =
Comparando, tc = y tt = .; tenemos: .
Conclusin: Observamos que tc < t t, porque 0,732 < 1,697; entonces aceptamos la hiptesis nula y
rechazamos la hiptesis alterna, es decir no existe diferencia significativa entre los puntajes obtenidos
en el post test de los grupos experimental y control de los alumnos del tercer grado de educacin
secundaria de la Institucin Educativa...

50

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

GRFICA 4.4. Grfica de la Curva Normal Bilateral del Post test.

= 0,05

= 0,05

Zona de rechazo

Zona de
Aceptacin

Zona de rechazo

t
-1,697

+1,697

Docimasia de la hiptesis de trabajo del Post test y Pre test del Grupo experimental
Sean las notas de 15 alumnos del grupo experimental, cuyas notas del Post test son:
20
18 20
18
16
14
04
16
08
08
12
06 08
16
18
Sean las notas de 15 alumnos del grupo experimental, cuyas notas del Pre test son:
10
10
08
08
12
14
06
10
06
08
12
10
08
14
08
H0: No existe diferencia significativa entre los puntajes obtenidos en el post y pre test del grupo
experimental de los alumnos del tercer grado de educacin secundaria de la Institucin
Educativa...
Ho: XPS =
XPE
H1: Existe diferencia significativa entre los puntajes obtenidos en el post y pre test del grupo experimental
de los alumnos del tercer grado de educacin secundaria de la Institucin Educativa...
H1: XPS XPE
Prueba estadstica

: t de student.

Nivel de significacin, = 0,05 y grados de libertad, = N 2 = 15 - 2 = 13


Punt6o crtico, tt (13; 0,025) = 0,694
Decisin

: Si tc tt ; se acepta la Ho y se rechaza H1.


Si tc > tt ; se rechaza la Ho y se acepta H1.

Calculando t con la siguiente frmula:

Reemplazando:
tc =
Comparando, tc = y tt = .; tenemos:
Conclusin:

51

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

GRFICA 4.5. Grfica de la Curva Normal del Grupo Experimental del Post y Pre test.

Zona de rechazo

Zona de
Aceptacin

Zona de rechazo

t
3.PRUEBA F O COMPROBACION DE IGUALDAD DE VARIANZAS
Nos preguntamos, es vlida nuestra hiptesis 1 = 2?; es decir, si validamos que las varianzas
son iguales estaramos determinando la homogeneidad de los grupos respecto a su varianza
poblacional.

Su

ecuacin

es:

tambin:

Ejercicios:
1. Se toman muestras aleatorias de n 1 = n2 = 31 nios y nias respectivamente; las desviaciones
normales muestrales de las calificaciones son s1 = 10 puntos y s2 = 7 puntos. Existe alguna razn
para dudar que las varianzas poblacionales sean iguales? ( = 5%)
SOLUCION:
n1 = 31
n 2 = 31
s1 = 10 puntos
s2 = 7 puntos
DATOS
s1 = 100 puntos
s2 = 49 puntos
Tener en cuenta lo siguiente:
i) Planteamiento de las hiptesis estadsticas:
Ho : s1 = s2 ; es decir las varianzas son iguales o son homogneos los grupos.
H1 : s1 > s2 ; es decir la varianza de la muestra 1 es mayor que la muestra 2 o son heterogneos
los grupos.
ii) Determinando los grados de libertad: 1 = 31 - 1 = 30 y 2 = 31 - 1 = 30
iii) Sabiendo que el nivel de significacin es, = 5%
iv) Conocer la regla de decisin:
Si Fc < Ft, entonces se acepta la Ho y se rechaza la H1.
Si Fc > Ft, entonces se rechaza la Ho y se acepta la H1.

v) Calculando Fc, reemplazando en la formula:


Observamos en la tabla Ft =

52

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

Comparando Fc > Ft, porque 2,04 > 1,84; entonces se rechaza la Ho y se acepta la H 1 es decir
los grupos son heterogneos respecto a su varianza o sus varianzas no son iguales.
GRFICAMENTE:
g(F)
5%
ZONA DE ACEPTACION

ZONA DE RECHAZO

1,84

2,04
3.1 Puntos crticos de ambos extremos o prueba de dos colas
Sea F una distribucin de F con n1 = 15, n2 = 20 y 1 = 14 y 2 = 19 grados de libertad. Determina el
valor crtico de ambos extremos, con = 5 %.
SOLUCION:
i) Determinamos el punto crtico de la
g(F)
derecha:
P F > 2,62 / 1 = 14, 2 = 19 = 0,025

2,5 %

ii) Luego, determinamos el punto crtico


invirtiendo los grados de libertad:
P F > 2,84 / 1 = 19, 2 = 14 = 0,025

2,5%

iii) Determinamos el punto crtico de la


izquierda calculando la inversa de 2,84
0,35

2,62

El procedimiento para hallar el punto crtico del extremo de la izquierda es, si F tiene una distribucin
F con 1 y 2 grados de libertad, se halla el valor de F para el punto crtico del extremo derecho
correspondiente a 2 y 1, luego se toma el inverso de dicho dato.
En smbolos podemos expresarlo de la manera siguiente:

El valor de F, tambin puede escribirse como:


EJERCICIO DE APLICACIN
Sean las notas de pre y post test de los grupos experimental y de control de los estudiantes del quinto
grado de educacin secundaria de la Institucin Educativa.
PRE TEST DEL GRUPO EXPERIMENTAL
06
08
02
07
13
13
02
02
03
04
01
05

11
14

53

Rafael Cantorin Curty


procesamiento de datos e informacin
10

09

06

08

11

10

06

POST TEST DEL GRUPO EXPERIMENTAL


15
08
03
16
13
17
14
17
15
13
18
17
16
15
12
10
11
14

17
16
16

POST TEST DEL GRUPO CONTROL


13
10
08
11
14
11
07
12
10
12
06
13
06
08
08
15
11
10
10
09

09
07
13
11

12
15
08
06

Tcnicas de

Desarrolla la docimasia de las siguientes hiptesis


H0: No existe diferencia significativa entre los puntajes obtenidos en el post test de los grupos
experimental y control de los alumnos del quinto grado de educacin secundaria de la Institucin
Educativa...
Ho: XGE =
XGC
H1: Existe diferencia significativa entre los puntajes obtenidos en el post test de los grupos experimental y
control de los alumnos del quinto grado de educacin secundaria de la Institucin Educativa...
H1: XGE

XGC

H0: No existe diferencia significativa entre los puntajes obtenidos en el post y pre test del grupo
experimental de los alumnos del quinto grado de educacin secundaria de la Institucin
Educativa...
Ho: XPS =
XPE
H1: Existe diferencia significativa entre los puntajes obtenidos en el post y pre test del grupo experimental
de los alumnos del quinto grado de educacin secundaria de la Institucin Educativa...
H1: XPS XPE
Ho : sGE = sGC ; es decir las varianzas son iguales o son homogneos los grupos.
H1 : sGE sGC ; es decir la varianza del grupo experimental es diferente que la varianza del grupo
control o son heterogneos los grupos.
4. ANOVA.El anlisis de varianza fue elaborado por R. A. Fisher y se utiliz principalmente en investigaciones
agrcolas, pero posteriormente ha encontrado aplicacin en casi todas las disciplinas cientficas y ha
llegado a ser un tema muy amplio y tcnico. Adems nos interesa el anlisis de varianza (ANOVA)
como un ejemplo de las aplicaciones de la distribucin F.
Ejemplo: Tenemos los puntajes luego de la aplicacin de un material autoinstructivo y queremos
averiguar si los promedios son iguales significativamente. Sea su diseo de investigacin:
GE1:
GE2:

O1
O2

GC:

O3

X
X

O4
O5
O6

Donde:
GE: Grupo experimental.
GC: Grupo control.

54

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

O1, O2, y O3: Prueba de entrada o Pre test


O4, O5 y O6: Prueba de salida o Post test
Sean los datos:
G. E1:
14
14
16

15
16
16

14
17
15

16
14
14

17
16
13

15
15
13

G. E2:

17
13
16
15

14
15
15
16

15
14
14

16
16
17

14
17
13

14
15
15

G. C:

11
12
12
12

10
11
10

11
12
11

12
11
10

11
10
11

13
10
10

i) Planteamiento de las hiptesis estadsticas:


Ho: 1 = 2 = c; No existe diferencia significativa de los promedios en la aplicacin de los materiales
auto instructivos.
H1: 1 2 c; Existe diferencia significativa de los promedios en la aplicacin de los materiales auto
instructivos.
RESUMEN
FUENTE DE
VARIANZA

gdl

SC

CM

Entre grupos
(Tratamiento)
Dentro de grupos
(Error)
TOTAL
Conclusin:

PROCESO:
i) Determinando los puntajes de la prueba de salida:
G E1

G E2

GC

TOTAL

55

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

X
X
(X)

N
ii) Suma total de cuadrados:

SCtotal = ..
iii) Suma de cuadrados entre los grupos:

SCeg = ..
iv) Suma de cuadrados dentro de los grupos:
SCd.g = SCtotal SCe.g
SCd.g =
v) Grados de libertad (gdl):
gdle.g = k 1 = ..

k = nmero de muestras

gdld.g = n k = .

n = nmero total de la muestra

gdltotal = n -1 = ..
vi) Cuadrados medios:

CMe.g = .

CMd.g = .

56

Rafael Cantorin Curty


procesamiento de datos e informacin

Tcnicas de

vii) Clculo del F terico:


F(2; 54; 0,05) = ..
PRUEBA TUKEY SNEDECOR
Tratamient
o

i) CMd.g =

GE1 =

GE2 =

GC =

SX = .
ii) Si k = y gdldg = ; entonces, Q(3; 54) = .
iii) Diferencia significativa, D = Q * SX =
Conclusin:

Ejercicio: Valida con las siguientes notas, si existe diferencia significativa, luego de la aplicacin de
materiales instructivos para mejorar el aprendizaje de ecuaciones en los alumnos del sexto grado de
primaria del distrito de Paucarbamba. Sean las notas:
IE. N 30263:

IE. N 31182:

IE. N 30270:

03
08
07
05
08
10
10

04
09
08
03
07
05
10

03
10
09
04
08
06

05
10
09
06
09
06

06
09
10
06
08
08

06
06
09
07
09
09

04
11

08
10

06
12

07
10

10
09

08
08

57

Rafael Cantorin Curty


procesamiento de datos e informacin
07
12

09

10

Tcnicas de

10

11

10

58

Vous aimerez peut-être aussi