Vous êtes sur la page 1sur 61

Las únicas anotaciones permitidas en el formulario son las correcciones de las erratas encontradas 

Los cálculos deberán redondearse a dos decimales 
 
1.‐  En  el  método  de  las  comparaciones  binarias,  la  suma  de  los  elementos  simétricos  de  una  matriz  de 
puntuaciones típicas es igual a: a) 0;  b) 1;  c) al valor escalar del estímulo. 

2.‐ En la Teoría de respuesta al ítem (TRI): a) la puntuación de los sujetos depende de la dificultad de los ítems a los 
que responde; b) la dificultad de los ítems depende del nivel de habilidad de la muestra de sujetos a los que se les 
aplica;  c)  el  nivel  de  habilidad  de  los  sujetos  es  independiente  de  los  parámetros  de  los  ítems  a  los  que 
responden. 

3.‐ La puntuación de un sujeto en una escala tipo Likert se obtiene: a) sumando las puntuaciones asignadas a las 
categorías elegidas por los sujetos en cada uno de los ítems; b) calculando la media de los valores escalares de los 
ítems; c) restando a los aciertos los errores cometidos. 

4.‐ Si la fiabilidad del test fuera perfecta, la varianza de las puntuaciones verdaderas sería: a) igual a la unidad; b) 
mayor que la de las puntuaciones empíricas; c) igual a la varianza de las puntuaciones empíricas. 

5.‐ En la Teoría Clásica de los Tests (TCT): a) los estadísticos de los ítems dependen de la muestra utilizada; b) el 
nivel  de  habilidad  de  los  sujetos  es  independiente  del  número  de  ítems  a  los  que  han  respondido;  c)  el  error  de 
medida es único para cada muestra. 

6.‐  El  error  típico  de  medida  es  igual  a:  a)  la  desviación  típica  de  las  puntuaciones  empíricas  menos  la  de  las 
verdaderas; b) la desviación típica de los errores de medida; c) el error de estimación de la puntuación verdadera. 

7.‐  Los  percentiles:  a)  son  puntuaciones  que  dejan  por  debajo  un  determinado  porcentaje  de  sujetos;  b)  son 
transformaciones  lineales  de  las  puntuaciones  directas  obtenidas  por  un  grupo  de  sujetos  en  un  test;  c)  los 
percentiles constituyen una escala sumativa. 

8.‐  El  coeficiente  de  validez  indica:  a)  el  grado  de  seguridad  en  las  medidas  obtenidas;  b)  la  eficacia  del  test  para 
estimar un criterio; c) el error de medida del test para pronosticar un criterio. 

9.‐  El coeficiente Kappa de Cohen: a) se utiliza para evaluar la consistencia de las clasificaciones; b) oscila entre ‐1 y 
+1;  c) indica las clasificaciones correctas esperadas por azar. 

10.‐  El  índice  de  fiabilidad  de  un  ítem  es  función  de:  a)  su  índice  de  discriminación;  b)  la  fiabilidad  del  test;  c)  la 
varianza del test. 

11.‐  Al  coeficiente  de  fiabilidad  obtenido  mediante  el  método  test‐retest  se  le  denomina  coeficiente  de:  a) 
equivalencia; b) estabilidad; c) consistencia interna.  

12.‐  Supongamos que al aplicar un test de 20 elementos a una muestra de sujetos, la varianza de las puntuaciones 
verdaderas fue el 60 % de la de las empíricas.  Si quisiéramos obtener un coeficiente de fiabilidad de 0.80, ¿Cuántos 
elementos deberíamos añadir al test inicial?: a) 53; b) 43; c) 33. 

R(1 − r) 0.80(1 − 0.60)


n= = = 2.67 
r(1 − R) 0.60(1 − 0.80)

    2.67* 20 = 53          53‐20 = 33 elementos que hay que añadir a los 20 iniciales 

13.‐ Hemos aplicado un test de 6 ítems dicotómicos a una muestra de sujetos. Las medias obtenidas para cada uno 
de los ítems han sido: 0.4, 0.5, 0.7, 0.8, 0.6 y 0.7 respectivamente y la varianza del test  igual a 6. El coeficiente de 
fiabilidad del test será igual a: a) 0.91; b) 0.94; c) 0.97. 
∙ = 0.24 + 0.25 + 0.21 + 0.16 + 0.24 + 0.21 = 1.31 

6 1.31
= 1− = 0.938 
5 6
14.‐ Al aplicar un test a una muestra de sujetos, la correlación entre las puntuaciones obtenidas en los elementos 
pares e impares fue 0.60. Sabiendo que las dos mitades del test son paralelas y que la varianza total del mismo fue 
180, la varianza de las puntuaciones en los elementos pares del test sería: a) 82.35;  b) 67.82;  c) 56.25. 

= + +2  

Por ser las dos mitades paralelas, la varianza de los ítems pares es igual a la varianza de los ítems impares 
180
180 = 2 1+ ; 180 = 2 ∙ 1.60; = = 56.25 
3.2
15.‐ Una muestra se sujetos ha obtenido una media de 20 puntos y una desviación típica de 2 puntos en un test. La 
varianza de los errores es 3 veces menor que la varianza de las puntuaciones verdaderas. El intervalo confidencial 
en  el  que  se  encontrará  la  puntuación  diferencial  verdadera  que  le  pronosticaríamos  a  un  sujeto  que  en  el  test 
hubiera obtenido una puntuación directa de 30 puntos (NC 95%), utilizando el modelo de regresión, sería igual a: a) 
5.33  y 9.72; b) 5.81 y 9.21; c) 5.55  y 9.47. 

= = 0.75; = 0.75 ∙ (30 − 20) = 7.51 


1.33
4
=3 + ; = = 1; = 1 ∙ √0.75 = 0.866 ≈ 0.87; 
4
= 0.87 ∙ 1.96 = 1.70; = ± ; 5.81 ≤ ≤ 9.21 

En la tabla siguiente se muestran las puntuaciones obtenidas por 5 sujetos en un test (X) y en un criterio (Y). Con 
esos datos responder a las preguntas 16‐ 18 ambas inclusive. 

Sujetos  A  B  C  D  E 
Test  5  3  6  1  4 
Criterio  7  4  5  2  3 
 

 Sabiendo que la varianza de los errores de medida del test es igual a 0.59, la varianza del criterio es igual a 2.96 y el 
coeficiente de validez es 0.76. 

16.‐  El coeficiente de fiabilidad del test es: a) 0.70; b) 0.68; c) 0.80 

0.59 = 2.96(1 − )
. .                                         = − = 2.96       = = 3.80 = = 4.2 
= = 0.80
.

17.‐  El error de estimación cometido con el sujeto C será: a) 1;  b) ‐0.87; c) 5.87 
2.96
´ = 0.76 ( − )+
2.96  
´ = 1.31 + 0.76
´ = 1.31 + 0.76 ∗ 6 = 5.87
El error de estimación de ese sujeto será Y – Y´= 5 – 5.87= ‐0.87 

18.‐  La proporción de varianza del criterio que no puede explicarse mediante el test es: a) 0.42;  b) 0.58; c) 0.24 

1− =1− = 1 − 0.58 = 0.42 

19.‐  Al aplicar un test de 15 ítems a una muestra de 61 sujetos  se ha obtenido un coeficiente alfa de Cronbach de 
0.79. ¿Entre qué valores se encontrará el coeficiente alfa en la población a N.C. del 99%?: a) 0.21 y 0.67; b) 0.68 y 
0.88; c) 0.35 y 0.69 

 

  ≤ 1.53 
.

1−∝
≥ 0.59 
1 − 0.79
F 0.995, 60,840 gl = 1.53    1‐ α ≤   0.3213           α ≥ 1‐ 0.3213 ≥ 0.68 

F 0.005 = 0.59                             1 – α  ≥  0.1239          α ≤ 1‐ 0.1239 ≤ 0.876 

20.‐ La desviación típica de los errores de estimación de un test de comprensión verbal es de 0.80 puntos, siendo la 
media y  varianza obtenida por una muestra de sujetos de 8 y 12 respectivamente. La varianza de las puntuaciones 
de los mismos sujetos en un examen final de Lengua es de 10 puntos y la media 7. Si se quisiera utilizar el test para 
pronosticar las puntuaciones de los sujetos en el examen de lengua, el porcentaje de seguridad en los pronósticos 
sería igual al: a) 64%;  b) 75%;  c) 97%.  

0.64
=1− =1− = 0.94 
10

. . =1− 1− = 1 − √1 − 0.94 = 0.75 

21.‐ A cada una de dos muestras de aspirantes a una escuela de danza se les ha aplicado un test distinto de Expresión 
Corporal. La media del test A aplicado a una de las muestras es igual a 15 y la desviación típica 3. La media del test B 
aplicado a la otra muestra es igual a 25 y la desviación típica 4. Utilizando el método lineal y asumiendo que las dos 
muestras son equivalentes, la puntuación en el test B de un sujeto que en el test A ha obtenido una puntuación de 
18  hubiera sido: a) 25; b) 15; c) 29 
4
∗ = (18 − 15) + 25 = 28.99 = 29 
3
22.‐ La razón entre el error típico de estimación y  la desviación típica del  criterio es 0.60, ¿cuál de los siguientes 
intervalos incluye el valor del coeficiente de validez de un test cuyo coeficiente de fiabilidad  es 0.80 si se eliminaran 
de éste todos los errores de  medida?: a) 0.88‐ 0.90; b) 0.92‐0.94; c) 0.96‐0.98. 

 
S y. x
 0.60
Sy
S y. x
 1  rxy2 ;
Sy
0.602  1  rxy2  
rxy2  1  0.36  0.64
rxy 0.64
Rvxy    0.89
rxx 0.80
23.‐ La proporción de aciertos para ser considerado apto en un test de memoria es 0.80. Si se está dispuesto a 
asumir un error máximo del 0.08, la longitud del test se encontrará en el siguiente intervalo: a) 10 – 15;  b) 17 – 21;  
c) 23 – 27.  

(1 − ) 0.80(1 − 0.80)
= = = 25
0.08

24.‐ La puntuación directa corregida de un sujeto cuyo patrón de respuesta a 8 ítems de 3 opciones es 1, 1, 1, 0, 0, 
1, 0, 1 (1 acierta el ítem, 0 falla) es: a) 3;  b) 3.5;  c) 4 

3
= − =5− = 3.5 
−1 2

25. La varianza verdadera de un test es el 68% de la varianza empírica. La correlación del test con un criterio externo 
es 0.65. Si mejoramos la fiabilidad hasta alcanzar un coeficiente igual a 0.80, ¿en cuánto se incrementa su 
correlación respecto al criterio anterior?: a) 0.10;  b) 0.06;  c) 0,02 

0.65
= = = 0.706 ≈ 0.71; 0.71 − 0.65 = 0.06 
0.68
0.80

   
 

 
Sólo se permitirá anotar en el formulario las erratas detectadas. 
 Los cálculos deberán redondearse a dos decimales 
 
1.‐ La Ley del Juicio Categórico puede utilizar como procedimiento experimental para la obtención de los datos el 
método de: a) ordenación por  rangos; b) las comparaciones binarias; c) error promedio.  

2.‐ Si medimos el grado en que los tests están libres de errores de medida estamos evaluando: a) la fiabilidad; b) la 
validez; c) la discriminación.  

3.‐ El coeficiente alpha de Cronbach: a) es un índice de la estabilidad de las medidas; b) está basado en la 
equivalencia entre las puntuaciones del test; c) es un estimador del límite inferior del coeficiente de fiabilidad de 
un test. 

4.‐ En los tests referidos a la norma la puntuación obtenida por un sujeto: a) se considera un indicador de su 
puntuación verdadera en un rasgo latente; b) representa un estimador de su conocimiento del dominio; c) tiene 
significado en términos absolutos. 

5.‐ El modelo lineal de Spearman asume que los errores de medida: a)  aumentan a medida que lo hacen las 
puntuaciones verdaderas; b) disminuyen a medida que aumentan las puntuaciones verdaderas; c) son 
independientes de las puntuaciones verdaderas. 

6.‐ Si la varianza verdadera de un test es el 90% de su varianza empírica, el coeficiente de fiabilidad del test es igual 
a: a) 0.90; b) 0.81; c) 0.10. 

7.‐ Dos test serán paralelos si se cumplen las dos condiciones de igualdad de las: a) medias y de las puntuaciones 
verdaderas; b) puntuaciones verdaderas y de la varianza de los errores de medida; c) puntuaciones empíricas y 
puntuaciones verdaderas. 

8.‐ Los cambios en la longitud del criterio pueden afectar a la: a) fiabilidad del test y del criterio; b) fiabilidad del 
test; c) validez del test. 

9.- La razón de selección expresa la proporción de aspirantes que: a) rindieron satisfactoriamente en el criterio;  b)  
fueron seleccionados mediante el test; c) fueron correctamente rechazados. 

10.‐ El diseño de anclaje es un diseño de equiparación: a) de un solo grupo; b) de grupos equivalentes;  c) de grupos 
no equivalentes con ítems comunes. 

11.‐  Si  un  test  y  un  criterio  no  presentaran  errores  de  medida,  el  coeficiente  de  validez  sería:  a)  la  unidad;  b)  la 
correlación entre las puntuaciones verdaderas del test y las del criterio; c) igual al índice de fiabilidad del test. 

En  relación  con  la  pregunta  número  11  del  examen  de  la  segunda  semana  hemos  de  aclarar  lo  siguiente:  Si  no 
existen  errores  de  medida,  al  calcular  la  correlación  entre  las  puntuaciones  del  test  y  del  criterio  se  estarían 
correlacionando las puntuaciones verdaderas obtenidas por los sujetos en el test con las puntuaciones verdaderas 
obtenidas por los sujetos en el criterio. Eso no tiene nada que ver con que el valor del coeficiente de validez sea la 
unidad.  Apliquen  la  fórmula  7.20.  del  libro  de  texto  que  es  la  que  les  va  a  dar  el  valor  del  coeficiente  de  validez 
cuando tanto las puntuaciones del test como las del criterio estuvieran libres de errores de medida. La respuesta 
correcta es la b.‐  Rvxvy es el coeficiente de validez teórico (se dice teórico porque en realidad nunca se puede llegar 
a alcanzar) que se obtendría si las puntuaciones del test y del criterio estuvieran libres de errores de medida y, en 
este caso equivale a la correlación entre las puntuaciones verdaderas del test y del criterio. El que no haya errores 
de  medida  no  implica  que  la  correlación  entre  dos  variables  sea  la  unidad,  puede  incluso  ser  cero,  puesto  que 
puede que no haya correlación entre ellas. 
Para que el valor llegara a la unidad se les tendría que haber dicho que la fiabilidad del criterio era igual a la unidad 
y que el coeficiente de validez empírico, es decir, el obtenido antes de haber eliminado los errores de medida del 
test y del criterio era igual al índice de fiabilidad del test, algo que no se ha incluido en el enunciado. 
12.‐ El coeficiente de ambigüedad: a) puede ser negativo; b) aumenta cuando el acuerdo entre los jueces es mayor; 
c) disminuye cuando el acuerdo entre los jueces es mayor. 

13.‐ Se ha aplicado un test a una muestra de 200 sujetos obteniendo una media y una desviación típica de 9 y 4 
puntos respectivamente. Si el coeficiente de fiabilidad del test es igual a 0.85, la varianza de las puntuaciones 
verdaderas de los sujetos sería igual a: a) 13.60; b) 15.40;  c) 16.00. 

= 0.85 ∗ 16 = 13.60 

14.‐  A continuación se presenta una escala de entrelazamiento obtenida al aplicar un cuestionario de 6 elementos a 
una muestra de 3 sujetos: 1__3__4__A__5__C__6__B__2.  El valor escalar de los sujetos C y B son respectivamente: 
a) 4 y 5; b) 5 y 6; c) 6 y 2. 

15.‐ La varianza de las puntuaciones empíricas de un grupo de sujetos a los que hemos aplicado un test es igual a 
36  y el coeficiente de fiabilidad 0.70. Si aplicamos dicho test a una muestra más heterogénea de sujetos cuya 
varianza es 64, el coeficiente de fiabilidad será igual a: a) 0.77; b) 0.83; c) 0.89. 

36
=1− 1− )=1− 1 − 0.70) = 0.83 
64

16.‐ Sabiendo que la media de las puntuaciones obtenidas por un grupo de sujetos en un test es 52 y la varianza 16,  
que la proporción de varianza verdadera que hay en la varianza empírica es igual a 0.64 y utilizando el modelo de 
regresión y un nivel de confianza del 95%, el intervalo confidencial dentro del cual se encontrará la puntuación 
diferencial verdadera de un sujeto que obtuvo en un test una puntuación típica empírica de 0.60 puntos será:         
a) ‐2.22 ; 5.30; b) ‐1.64 ; 4.70 c) ‐1.80 ; 4.75 
95% → = 1.96 

          0,60 = ; = 4. 0,60 = 2,40 

= ∙ = 0.64 ∙ 2.4 = 1.54 

= ∙ 1− = 4 ∙ 1 − 0,64 = 2,4 

= ∙ = 2.4√0.64 = 1.92 

= 1.92 ∗ 1.96 = 3.76 


= 1.54 ± 3.76; −2.22 ≤ ≤  5.30 
17.‐ Una empresa quiere construir una prueba que garantice que el personal contratado tendrá éxito como 
comercial. Para ello construimos y aplicamos un test a un grupo de aspirantes en el que obtienen una media y una 
varianza de 23 y 9 puntos respectivamente. La correlación entre las puntuaciones del test y una prueba de 
evaluación de estrategias comerciales es igual a 0.80. Sabiendo que la media y la desviación típica obtenida en esta 
prueba de evaluación son 18 y 3 puntos respectivamente, ¿de los sujetos que obtuvieron en el test una puntuación 
mínima de 25 puntos, ¿qué porcentaje obtendría en la prueba de evaluación de estrategias una puntuación igual o 
mayor de 22?: a) 9.18%;  b) 15.24%;  c) 18%. 
3
= − )+ = 0.80 25 − 23) + 18 = 19.6 
3

∙ = 1− = 3 1 − 0.80 = 1.8 

− 22 − 19.6
= = = 1.33; ≥ 22| = 25) = 1 − 0.9082 = 0.0918 = 9.18% 
∙ 1.8

18.‐  Cuál será el coeficiente de validez de un test, sabiendo que al N.C. del 95% se ha pronosticado que la 
puntuación típica de un sujeto en el criterio estará comprendida entre 0.60 y 1.40:   a) 0.90;  b) 0.94;  c) 0.98 
.
0.60 =  Z’y – 1.96Sy.x                                              . = = 0.20                                                                                                                                                               
.
1.40 =  Z’y + 1.96Sy.x                                                                                                                                                                                                                         

__________________________                                 0.20 = 1− ; = 1 − 0.20 = 0.96; = √0.96 = 0.98                                 


0.80 = 3.92Sy.x  

En  la  tabla  adjunta  aparecen  recogidos  los  valores  asignados,  por  un  grupo  de  jueces,  a  cuatro  ítems  con  el 
objeto de escalar el grado de satisfacción de un determinado producto. Con los siguientes datos conteste a las 
preguntas: 19, 20 y 21 

  Categorías 
Ítems 1  2  3  4  5  6 
1  5  20 35 45 15 10
2  10 15 45 25 20 15
3  5  5  10 60 50 0 
4  15 15 20 40 20 20
    

19.‐ Calcular el valor escalar del ítem 1: a) Md1=3.61; b) Md1=3.68; c) Md1=3.72.    

65 − 60
= 3.5 + = 3.5 + 0.11 = 3.61  
45

20.‐ El coeficiente de ambigüedad del cuarto ítem es igual: a) 3.15;  b) 2.69;  c) 2.25. 

= − = 4.875 − 2.625 = 2.25 

97.5 − 90 32.5 − 30
= 4.5 + = 4.875 = 2.5 + = 2.625 
20 20

21.‐ Asumiendo que los valores escalares de los ítems 2 y 3 son 3.39 y 4.25 respectivamente, si se aplicara la escala 
resultante a una muestra de sujetos y un sujeto hubiera respondido favorablemente a los 4 ítems obtendría una 
puntuación igual a: a) 4.01; b) 3.59; c) 3.78. 

65 − 50
= 3.5 + = 3.5 + 0.0.375 = 3.87 
40
3.61 + 3.39 + 4.25 + 3.87 15.12
= = = 3.78 
4 4

   
22.‐ Se ha aplicado un test a una muestra de sujetos, obteniendo una media y una desviación típica de 12 y 3 puntos 
respectivamente. El coeficiente de fiabilidad del test es igual a 0.85. Utilizando la desigualdad de Chebychev,  la 
puntuación verdadera de un sujeto que obtuvo en el test una puntuación empírica de 8 puntos se encontrará en el 
intervalo (NC 90%): a) 4.3 – 11.7;  b) 6.5 – 11.9;  c) 7.1 – 12.3 (Dado que puede haber problemas de redondeo escoger 
el intervalo más aproximado). 

1 1
| − |) ≥ 1 − ; 1 − = 0.90; = 3.16 

= 1− = 3√1 − 0.85 = 1.17 

|8 − | ≤ 3.16 ∙ 1.17) ≥ 0.90; −3.70 ≤ |8 − | ≤ 3.70) ≥ 0.90  

4.3 ≤ | | ≤ 11.7) ≥ 0.90 

23‐ Un test está formado por 40 ítems. Los 10 primeros son de dos alternativos, los 10 siguientes de tres alternativas y 
los 20 restantes son de cuatro alternativas. La puntuación que le corresponde en el test a un sujeto que contestó 
correctamente a los 10 primeros ítems, a 8 de los 10 siguientes y a 14 de los veinte restantes, sabiendo que no dejó 
ningún ítem sin contestar, es: a) 30;  b) 33;  c) 29. 

10 ítems 2 alternativas: 10 aciertos→  Punt: 10                                                              
10 ítems 3 alternativas: 8 aciertos→ Punt: 8 ‐   = 7                                                           
20 ítems 4 alternativas: 15 aciertos→ Punt: 14 ‐   = 12                                                        
Puntuación total: 10+7+12 = 29                                                                            

24.‐ Suponiendo que  la distribución de las puntuaciones en un test se ajusta a una distribución normal y que la media  
y la desviación típica de las puntuaciones empíricas es igual a 10 y 4 respectivamente, ¿qué puntuación directa, típica y 
percentil lo correspondería a un sujeto de la muestra que obtuvo en el test una puntuación  inferior al 60% de sus 
compañeros?: a) X=11; Z= 0.25; P= 60 ;  b) X=10; Z= ‐0.26; P= 40 ; c) X=9; Z= ‐0.25; P= 40 

= 40; = −0.25; = ∙ + = −0.25 ∙ 4 + 10 = 9 

25.‐A continuación se presentan las puntuaciones obtenidas en un ítem que corresponde a una escala tipo Likert, por 
el 25% de los sujetos que obtuvieron una puntuación más alta en la escala total y por el 25 % que obtuvieron una 
puntuación más baja. 

25% superior  4 3 5 4 1 2 4 5 4 3 4 3 
25% inferior  1 2 3 2 3 4 1 2 3 3 1 2 
 

Utilizando el estadístico de contraste “T”, calcular si el ítem discrimina adecuadamente entre ambos grupos. (NC 
95%): a) el ítem no discrimina; b) el ítem discrimina; c) el ítem no discrimina  porque el valor de T=2.12<t0.95,24 .   

s = 3.50 = 1.12 = 1.25 i = 2.25 = 0.92 = 0.85  


3.50 − 2.25
= = 2.99 ; . , = 1.71 
11 ∙ 1.25) + 11 ∙ 0.85) 1 1
+
22 12 12

 
EXAMEN JUNIO 2014

1.- En la fase de definición de la finalidad del test se toman decisiones acerca de: a) a quién se va a medir;
b) cuál va a ser el contenido del test; c) qué ítems van a seleccionarse.

2.- Para la obtención empírica de los datos en la Ley del Juicio categórico se utiliza el método de: a)
comparaciones binarias; b) estimación de magnitudes; c) intervalos aparentemente iguales.

3.- El coeficiente de reproductividad varía entre: a)-1 y 1; b) 0 y 1; c) 0.5 y 1.

4.- La fórmula de Rulon para el cálculo de la fiabilidad implica qué: a) las dos mitades del test sean tau-
equivalentes; b) las varianzas de error de las dos mitades sean iguales; c) los ítems sean paralelos.

5.- A medida que aumenta la variabilidad de una muestra puede: a) disminuir el coeficiente de fiabilidad
del test; b) aumentar el coeficiente de fiabilidad del test; c) disminuir el error típico de medida del test.

6.- El coeficiente de fiabilidad tiende a: a) aumentar a medida que aumenta la longitud del test; b)
disminuir a medida que disminuye la homogeneidad de la muestra; c) permanecer constante puesto que es
intrínseco al test.

7.- El coeficiente alfa de Cronbach: a) es función de la covarianza entre los ítems; b) requiere que los ítems
sean dicotómicos; c) disminuye a medida que todos los ítems son homogéneos.

8.- El método de Nedelsky se utiliza con tests compuestos con: a) ítems de elección múltiple; b) ítems de
tipo verdadero-falso; c) todo tipo de ítems.

9.- El coeficiente de valor predictivo: a) expresa el porcentaje de inseguridad en los pronósticos; b) es el


complementario del coeficiente de determinación; c) no puede ser negativo.

10.- El coeficiente de alienación: a) se define como la varianza asociada entre el test y el criterio; b)
representa la seguridad que afecta a los pronósticos; c) será máximo cuando el coeficiente de validez sea
cero.

11.- En el método test–retest para el cálculo del coeficiente de fiabilidad: a) se aplica el mismo test en dos
ocasiones distintas a los mismos sujetos; b) se aplican dos tests paralelos a dos muestras de sujetos; c) se
obtiene la consistencia interna del test.

12.- Un ítem alcanza su máximo poder discriminativo: a) cuando la muestra es homogénea; b) cuando su
dificultad es media; c) cuando la probabilidad de acierto es alta.

13.- Se ha aplicado una prueba de lectura a un grupo de estudiantes. La tabla que se presenta recoge las
respuestas dadas por cinco de ellos a cuatro preguntas de la prueba. El valor del coeficiente de
reproductividad y el valor escalar del sujeto 2 son respectivamente: a) 0.80 y 1; b) 0.90 y 2; c) 0.80 y 2.
Preguntas
S 1 2 3 4
u 1 1 1 0 1
j
2 1 0 1 1
e
t 3 1 1 0 0
o 4 1 0 0 0
s 5 1 0 0 0

Preguntas Preguntas
S 1 2 3 4 X S 1 2 4 3 Errores
u 1 1 1 0 1 3 u 1 1 1 1 0 0
j j
2 1 0 1 1 3 2 1 0 1 1 2
e e
t 3 1 1 0 0 2 t 3 1 1 0 0 0
4 1 0 0 0 1 4 1 0 0 0 0 El valor escalar del sujeto 2 es
o o
s 5 1 0 0 0 1 s 5 1 0 0 0 0 igual al número de preguntas a las
∑ 5 2 1 2 que ha respondido
correctamente: 2

14.- Si la varianza de las puntuaciones empíricas obtenidas por una muestra de sujetos en un test es igual a
25 y el coeficiente de fiabilidad es 0.84, la varianza de las puntuaciones verdaderas y el error típico de
medida en puntuaciones directas son respectivamente: a) 18 y 2; b) 21 y 4; c) 21 y 2

15.- Un test compuesto de 120 ítems tiene un coeficiente de fiabilidad de 0.85. ¿Cuántos ítems tendríamos
que eliminar para obtener un coeficiente de fiabilidad de 0.70?: a) 98; b) 80; c) 71.
16.- Calcular el coeficiente de fiabilidad de un test sabiendo que al aplicarlo a una muestra de sujetos se
obtuvo una covarianza media entre sus 10 ítems igual a 0.16 y una varianza igual a 25 puntos: a) 0.80: b)
0.79;c) 0.64

) = 0.64

La tabla siguiente muestra las respuestas de 5 sujetos a 4 ítems de 3 alternativas de las cuales
sólo una es correcta. Con estos datos responder a las preguntas 15 y 16

Sujetos Ítem 1 Ítem 2 Ítem 3 Ítem 4


A 1 0 0 1
B 1 1 1 1
C 1 1 0 0
D 0 1 1 1
E 1 0 0 0

17.- El índice de dificultad corregido del ítem 2 sería: a) 0.60; b) 0.40; c) 0.20

18.- La puntuación corregida del sujeto D sería: a) 2.5; b) 2; c) 2.25

19.- Una muestra de 10 sujetos ha obtenido en un test (A) una media de 20 puntos y una varianza de 16
puntos, y una segunda muestra ha obtenido en otro test (B) una media de 40 puntos y una varianza de 25
puntos. Utilizando el método lineal, ¿qué puntuación en el test A sería equivalente a una puntuación de 35
en el test B? (utilizar el método lineal): a) 12; b) 16; c) 19.

A A B  B
 ;
Sa Sb
(35  40)  4
A  20  16
5

20.-Un test tiene un coeficiente de fiabilidad de 0.90 y su correlación con un criterio es 0.72. Si
cuadruplicamos la longitud del test con elementos paralelos, el coeficiente de valor predictivo del nuevo
test es igual a: a) 0.56; b) 0.60; c) 0,66
21.- En una distribución normal, sabiendo que un sujeto es superado por el 2.28 % de los sujetos de su
población, ocuparía el estanino: a) 1; b) 5; c) 9

22.- Un ítem de un test es contestado por 300 sujetos de los cuales 150 lo contestan correctamente, 70
pertenecientes al 27% de los que mayor puntuación obtienen en el test y 35 al 27% con puntuaciones más
bajas. El índice discriminativo de dicho ítem es igual a: a) 0.32; b) 0.43; c) 0.56

23.- La desviación típica de los errores de estimación de un test de comprensión verbal es de 0.80 puntos,
siendo la media y la varianza obtenida por una muestra de sujetos de 8 y 12 respectivamente. La varianza
de las puntuaciones en las calificaciones finales de Lengua es de 10 puntos y la media 7. El porcentaje de
seguridad en los pronósticos es igual a: a) 64%; b) 83%; c) 97%.

24.- La correlación entre un test y un criterio es 0.64 y la fiabilidad del criterio del criterio 0.81. El
coeficiente de validez del test si se hubieran eliminado los errores de medida del criterio sería igual a: a)
0.91; b) 0.82; c) 0.71.

25.- Al aplicar un test a una muestra de sujetos la varianza de las puntuaciones empíricas fue de 8 puntos y
la razón entre la varianza de las puntuaciones verdaderas y la de las empíricas fue de 0.60. ¿Cuál sería el
coeficiente de fiabilidad del test si al aplicarle a otra muestra de sujetos se obtuviera una varianza de las
puntuaciones empíricas igual a 16?: a) 0.80; b) 0.64; c) 0.40
  PLANTILLA EXAMEN JUNIO 2015, 1ª SEMANA  

1.‐ El escalamiento de estímulos mediante el método de estimación de magnitudes se deriva de 
los trabajos de: a) Weber; b) Fechner; c) Stevens. 

2.‐ Si el índice de dificultad del ítem A es 0.80 y el del ítem B es 0.50 para la misma muestra de 
sujetos:  a)  el  ítem  A  es  más  difícil  y  discriminativo  que  el  ítem  B;  b)  el  ítem  B  es  más  fácil  y 
discriminativo que el ítem A; c) el ítem B es más difícil y discriminativo que el ítem A. 

3.‐  En  los  ítems  dicotómicos:  a)  la  media  del  ítem  es  igual  a  la  proporción  de  aciertos;  b)  la 
varianza es más pequeña cuando la proporción de aciertos es igual a la de fallos; c) no es necesario 
corregir los efectos del azar. 

4.‐ El concepto de validez de constructo: a) es una propiedad intrínseca al test; b) se refiere a la 
precisión  de  las  medidas  realizadas  con  el  test;  c)  hace  referencia  al  grado  de  relación  entre  el 
test y el concepto que se quiere medir.  

5.‐ El modelo de Millman está basado en: a) modelos bayesianos; b) el modelo de regresión;  c) el 
modelo binomial. 

6.‐  El  valor  del  coeficiente  de  fiabilidad  de  un  test:  a)  depende  del  coeficiente  de  validez;  b) 
depende de la  homogeneidad del grupo de  sujetos a  los que  se aplica el test;   c) es constante 
porque siempre evalúa el mismo constructo. 

7.‐ En el modelo de Spearman las puntuaciones verdaderas de los sujetos: a) se pueden estimar 
conociendo el coeficiente de validez del test;  b) correlacionan positivamente con los errores de 
medida;  c) son iguales en dos formas paralelas de un test. 

8.‐ El coeficiente de determinación indica la proporción: a) de varianza del criterio que no se puede 
predecir a partir del test; b) entre el error típico de estimación y la desviación típica del criterio; c) 
de varianza asociada entre el test y el criterio. 

9.‐  El  coeficiente  de  reproductividad:  a)  es  independiente  del  número  total  de  respuestas;  b) 
proporciona una medida de la bondad de ajuste de los datos al modelo; c) varía entre ‐1 y 1. 

10.‐  Para  poder  utilizar  correctamente  la  fórmula  KR21  los  ítems  del  test  tienen  que:  a)  ser 
dicotómicos  y  tener  el  mismo  índice  de  dificultad;  b)  estar  divididos  en  dos  mitades;  c)  tener 
distinta varianza. 

11.‐ En la construcción de una escala según el modelo escalar de Thurstone: a) se asignan valores 
escalares  a  los  sujetos; b)  se  asume  que  un  mismo  estímulo  suscita  la  misma  ambigüedad  en  los 
sujetos; c) los sujetos actúan como instrumentos de medida. 

12.‐  La  matriz  multimétodo‐multirrasgo  se  utiliza  para  analizar  la  validez:  a)  convergente  y 
discriminante; b) factorial; c) de contenido. 
13.‐  En  el  método  de  los  estímulos  constantes  el  umbral  absoluto  es:  a)  la  media  de  los  valores 
asignados a los estímulos en las diferentes presentaciones; b) el valor del estímulo  que ha sido 
detectado  el  50%  de  las  veces;  c)  la  media  de  las  diferencias  entre  el  valor  del  estímulo 
correspondiente al percentil 75 y el correspondiente al percentil 25. 

14.‐  Calcular  el  coeficiente  de  fiabilidad  de un  test  sabiendo  que la  varianza  de  los errores  es  el 
40% de la varianza verdadera: a) 0.84; b) 0.77;  c) 0.71. 

0.71  
0.40

15.‐  Para  elaborar  una  escala  de  Thurstone,  se  sometieron  a  la  calificación  de  10  jueces  una 
muestra de 50 ítems, utilizando una escala de 4 categorías. La asignación dada por los jueces a un 
determinado ítem figura en la tabla adjunta. ¿Cuál es el valor escalar de dicho ítem?: a) 1.55;  b) 
1.98; c) 2.17 

Jueces 
  1  2 3 4 5 6 7 8 9 10
Item A  3  2 4 3 1 1 3 2 2 1 
 

X  F  fa 
4  1 10
3  3  9 
2  3  6 
1  3  3 
1
1.5 5 3 1.5 0.67 2.17 
3
            

Con el siguiente enunciado responder a las preguntas 16, 17, 18, y 19 
Hemos aplicado un test compuesto por 100 ítems a una muestra de sujetos obteniendo una media 
de 12, una desviación típica igual a 6 y un coeficiente de fiabilidad igual a 0.80. El coeficiente de 
validez obtenido es igual a 0.70 y la varianza del criterio es igual a 16. 
 
16.‐ Utilizando el modelo de regresión, ¿entre qué valores se encontrará la puntuación verdadera 
en  el  test,  de  un  sujeto  que  obtuvo  una  puntuación  empírica  igual  a  14  puntos?  (NC.  95%). 
Seleccionar el intervalo más aproximado a) 6,02 y 14,95; b) 8.94 y 18.26; c) 9,68 y 19,15. 
1 6 ∙ √1 0.80 2.68 
 
2.68 ∙ 0.89 2.38 
 
1.96 ∙ 2.38 4.66 
 
0.80 14 12 12 13.60 
 
13.60 4.66 8.94 18.26 
 

17.‐ Si se eliminan 40 ítems del test, el nuevo coeficiente de fiabilidad será: a) 0,60; b) 0,67; c) 0,71 
60 0.60 ∙ 0.80 0.48
0.60; 0.705 
100 1 0.60 1 ∙ 0.80 0.68

18.‐ ¿Cuál sería el coeficiente de validez del test si se eliminasen del mismo todos los errores de 
medida? a) 0.79;  b) 0.76;  c) 0.72. 

0.70
0.79 
√0.80

19.‐  Si  la  distribución  de  las  puntuaciones  en  el  test  se  ajusta  a  la  curva  normal,  calcular  la 
probabilidad de que un sujeto alcance una puntuación directa igual o mayor que 6. a) 0.16  b) 0.50  
c) 0. 84 
6  12
Z  1; P(X  6)  1 - P(X  6)  1 - 0.1587  0.8413  
6

20.‐  Para  un  determinado  test  la  varianza  de  los  errores  es  el  33%  de  la  varianza  verdadera,  el 
coeficiente  de  fiabilidad  del  criterio  es  0.80  y  el  coeficiente  de  validez  corregidos  los  errores  de 
atenuación es 0.90. Calcular el coeficiente de validez del test sin corregir dichos errores. a) 0.75;  
b) 0.77; c) 0.69. 

; 0.90 ; 0.90 ∙ 0.77 0.69 


∙ √0.75 ∙ 0.80

0.75 
0.33

21.‐  Si  la  distribución  de  las  puntuaciones  de  los  sujetos  en  un  determinado  test  se  ajusta  a  la 
curva  normal,  el  estanino,  el  percentil  y  la  puntuación  típica  derivada  de  media  8  y  desviación 
típica  2  que  le  corresponde  a  un  sujeto  que  en  el  test  se  situó  a  dos  desviaciones  típicas  por 
encima de la media son: a)9, 98 y 12  b) 7, 98 y 10  c) 6, 96 y 4.  

2; 5 2∙2 9; 98; 8 2∙2 12 

Con el siguiente enunciado responder a las preguntas 22 y 23 
Hemos aplicado un test visual a una muestra de 100 sujetos. A dicha muestra se le aplica una tarea 
visual que actúa como criterio externo, obteniendo la muestra una desviación típica en el criterio 
igual a 4 y un valor del coeficiente de alienación de 0.30.  
 
22.‐ ¿Cuál es el error típico de estimación del criterio? a) 0.20; b) 0.70; c) 1.20. 
1 ; 0.30 1 ; 0.09 1 ; 0.91 
1 4√1 0.91 1.20 

23.‐ ¿Cuál es el error máximo de estimación que se podrá cometer al realizar un pronóstico? (NC 
95%): a) 1.96;  b) 2.35;  c) 2.79. 

∙ 1.96 ∙ 1.20 2.352 

24.‐  Se  ha  aplicado  un  test  a  una  muestra  de  150  escolares.  La  media  y  varianza  de  las 
puntuaciones  empíricas  son  20  y  6  respectivamente.  Si  un  sujeto  ha  obtenido  en  el  test  una 
puntuación  empírica  igual  a  22  puntos,  ¿utilizando  el  método  lineal,  cuál  sería  la  puntuación 
equivalente que le correspondería a dicho sujeto en un segundo test  cuya media fuera igual a 15 y 
la desviación típica igual a 4? a) 18.26; b) 16.87; c) 14.45. 
 

4
22 20 15 1.63 ∙ 2 15 18.26 
2.45
 
25.‐ Se desea aplicar el modelo de Guttman a las respuestas dadas por una muestra de 20 sujetos 
a  un  test  de  8  ítems  dicotómicos.  Analizados  los  resultados  se  han  detectado  8  errores  con 
respecto al patrón ideal, ¿Se ajusta el modelo a los datos?: 
a) si, porque su C.R.=0.95  y  es mayor  que  0.90; b) no,  porque para que  se ajuste el modelo  no 
debe haber errores; c) si, porque su C.R.=0.98 y es mayor que 0.90. 
ES 8
CR  1   1  1  0.05  0.95  
TR 20  8
 

Plantilla Examen Junio 2015 Segunda Semana 
 
Las opciones de respuesta de la pregunta número 8 están mal redactadas por lo que se dará por 
correcta a todos los alumnos. 
 
1.  La  Ley  de  Fechner:  a)  relaciona  la  magnitud  de  los  estímulos  con  las  sensaciones  subjetivas  que 
producen en los sujetos; b) pone en relación la magnitud de los estímulos con las respuestas directas 
de los sujetos; c) tiene como unidad de medida de la escala de sensación el umbral absoluto. 
2.  La  importancia  de  Alfred  Binet  (1857‐1911)  se  debe  a  que:  a)  introdujo  por  primera  vez  el  término 
“test  mental”;  b)  utiliza  como  medida  de  la  inteligencia  el  concepto  de  “cociente  intelectual”;  c) 
desarrolló el concepto de “edad mental”. 
3. La curva característica del ítem: a) representa la relación entre la dificultad del ítem y la probabilidad 
de acertarlo; b) puede modificarse de un sujeto a otro; c) relaciona el nivel de habilidad de los sujetos 
con la probabilidad de acertar el ítem. 
4. Si  la  varianza  de  los  errores  de  medida  es  igual  que  la  varianza  de  las  puntuaciones  verdaderas  el 
coeficiente de fiabilidad es: a) 0; b) 1; c) 0.50. 
5. El valor del error típico de medida: a) no puede ser negativo; b) oscila entre ‐1 y +1; c) no puede ser 
mayor que el coeficiente de fiabilidad. 
6. En el modelo de Millman se parte del supuesto de que: a) los errores se ajustan a la curva normal; b) 
los  ítems  del  test  son  dicotómicos;  c)  cada  ítem  del  test  tiene  una  probabilidad  distinta  de  ser 
respondido correctamente.   
7. El coeficiente de validez: a) puede variar de muestra a muestra; b) es una característica intrínseca al 
test; c) no puede ser negativo.  
8. El  coeficiente de valor  predictivo representa la  proporción de: a) varianza del criterio independiente 
del test; b) varianza del test independiente del criterio; c) varianza común entre en test y el criterio. 
9. Cuando  se  lleva  a  cabo  un  estudio  de  equiparación  utilizando  un  diseño  de  un  solo  grupo:  a)  es 
aconsejable aplicar las dos formas del test contrabalanceadas; b) se puede utilizar una única forma 
del test; c) se deben utilizar unos cuantos ítems de anclaje.  
10. El  error  de  medida  es  la  diferencia  entre  la  puntuación:  a)  empírica  obtenida  por  un  sujeto  y  su 
puntuación  verdadera;  b)  empírica  obtenida  por  un  grupo  de  sujetos  y  su  puntuación  verdadera;  c) 
verdadera obtenida por un sujeto y su puntuación verdadera pronosticada. 
11. El  índice  de  fiabilidad  es:  a)  el  cuadrado  del  coeficiente  de  fiabilidad;  b)  mayor  o  igual  que  el 
coeficiente de fiabilidad; c) menor o igual que el coeficiente de fiabilidad. 
12. Si aumenta la variabilidad de la muestra puede: a) aumentar el coeficiente de fiabilidad y disminuir el 
coeficiente de validez; b) disminuir ambos coeficientes; c) aumentar ambos coeficientes. 
13. Un grupo de 200 jueces evalúan el grado en que un ítem contiene una determinada actitud, para ello 
utilizan el método de los intervalos aparentemente iguales y una escala de 5 categorías. Los resultados 
se muestran en la tabla adjunta. El valor escalar del ítem evaluado y su coeficiente de ambigüedad son 
respectivamente: a) 4.5 y 1,08; b) 3.5 y 4.22; c) 4.18 y 1.08 

 
Categ.  1  2  3  4  5 
Jueces  10  15  7  100  68 
 

Fa =         10        25        32     132      200 

Mediana = VE=  . .             C.  A. = 4.765 – 3.68 = 1.085 

. .  

  . .  

14. Suponiendo que la varianza de las puntuaciones verdaderas de una muestra de sujetos fuera el doble 
que la de las erróneas y que la varianza empírica obtenida al aplicarles un test fuera de 30 puntos. El 
coeficiente y el índice de fiabilidad del mismo serían respectivamente: a) 0.67 y 0.82; b) 0.60 y 0.45; c) 
0,33 y  0.58 

30 2 3  →  10→  20 

Rxx = 20/30 = 0.67             Rvx = 0.82 

15. El error típico de medida (en puntuaciones típicas) de un test cuyo índice de fiabilidad es 0.80  será: a) 
0.45; b) 0.64; c) 0.60. 

√ . .  

16. En  la  tabla  siguiente  se  recogen  las  respuestas  de  un  grupo  de  sujetos  ante  la  presentación  de  4 
estímulos  en  un  experimento  de  detección  de  señales  (1=  acierto;  0=  error).  El  coeficiente  de 
reproductividad es: a) 0.80; b) 0.90; c) 0.85. 

    Ite.     
Suj.  X1  X2  X3  X4 
1  1  0  0  1 
2  1  1  1  0 
3  1  1  0  1 
4  1  0  0  0 
5  1  0  0  0 
 

Matriz ordenada 

    Ite.       
Suj.  X1  X4  X2  X3 
  2  1  0  1  1 
 3  1  1  1  0 
1  1  1  0  0 
4  1  0  0  0 
5  1  0  0  0 
Hay 2 errores    CR = 1‐ 2/20 = 0.90 
 

17. El índice de fiabilidad de un test aplicado a una muestra de sujetos es 0.90. ¿Cuál sería el coeficiente 
de fiabilidad que se obtendría si se aplicara a otra muestra cuya varianza fuera la mitad?: a) 0.62; b) 
0.19; c) 0.80. 

0.81 2 1 1
2 1 0.81 1 1 0.38 0.62  

18. El coeficiente de fiabilidad de un test formado por 50 ítems paralelos es 0.92. ¿Cuál sería el coeficiente 
de fiabilidad de cada uno de sus elementos?: a) 0.10; b) 0.19; c) 0.15 
. ∗ . .
0.02 0.186 0.19   
. . .

19. En  la  tabla  que  se  muestra  a  continuación  se  muestran  las  respuestas    que  dieron  una  muestra  de 
sujetos a un ítem de un test de aptitudes. La respuesta correcta es la A. A un NC del 95%, ¿ podemos 
decir que las alternativas incorrectas son equiprobables?: a) sí porque el valor teórico del estadístico 
es  menor  que  el  valor  obtenido;  b)  sí  porque  el  valor  teórico  del  estadístico  es  mayor  que  el  valor 
obtenido; c) no porque el valor teórico del estadístico es mayor que el obtenido. 

A  B  C 
389  52  36 
 

Se  calculan  las  frecuencias  teóricas  de  las  alternativas  incorrectas  como  la  media  de  las 
respuestas: 36 + 52/ 2= 44 

Se aplica la fórmula de:  


Χ2 =  2.91 

Buscando en tablas  y a nivel de confianza del 95% se obtiene un valor teórico del estadístico 
de 3.84. Dado que el valor obtenido es menor que el teórico se acepta la hipótesis nula de que 
las alternativas son equiprobables. 

20. Se  ha  aplicado  un  test  de  razonamiento  espacial    a  una  muestra  de  8  sujetos,  obteniéndose  un 
coeficiente de fiabilidad de 0.70 y un coeficiente de validez de 0.81. La proporción de varianza de las 
puntuaciones del criterio no asociada al test será: a) 0.90; b) 0.66; c) 0.34 
 
Si el coeficiente de determinación representa la proporción de varianza de las puntuaciones 
del criterio asociadas al test, 1 ‐CD será la proporción de varianza del criterio no asociada al 
test. 
 
21. La  varianza  de  la  diferencia  entre  las  puntuaciones  obtenidas  por  una  muestra  de  sujetos  en  los 
elementos pares e impares de un test es 2.25. Si la varianza de los elementos pares es de 16 puntos y 
las  dos  mitades  son  paralelas,  el  coeficiente  de  fiabilidad  del  test  completo  será:  a)  0.94;  b)  0.86;  c) 
0.96 

 
. ∗ .
2.25 2 ∗ 16 2 ∗ 16 ∗ 0.923 0.96  
.

22. Se ha aplicado un test de percepción visual a una muestra de sujetos obteniéndose una media y una 
desviación  típica  de  las  puntuaciones  de  15  y  2  respectivamente.  Sabiendo  que  el  error  típico  de 
medida del test es igual a 1 y utilizando el modelo de regresión, el intervalo confidencial en el que se 
encontrará la puntuación verdadera de un sujeto que obtuvo en el test una puntuación empírica de 19 
puntos  será a NC del 95%:  a) 16.85 y 21.15;  b) 16.30 y 19.71; c) 15.20 y 20.80 
 
1 ; 1 2 1 ;       0.75 
95% 1.96 1√0.75 0.87 á . 1.96 ∗ 0.87 1.705
  
´ 0.75 19 15 15 18 18 1.705 16.30 18 1.705 19.71
 
Con estos datos contestar a las preguntas 23, 24 y 25.  
En la tabla adjunta se muestran las puntuaciones obtenidas por 5 estudiantes en un test de 5 ítems 
dicotómicos (se trata de un ejemplo).  

                ítems 
sujetos  1  2  3  4  5 
A  0  1  1  1  1 
B  1  1  0  1  0 
C  1  1  0  0  0 
D  1  1  1  1  0 
E  1  0  0  0  0 
 
23. La media del ítem 1 es : a)  0.80; b) 0.60; c) 0.50 
La media equivale a la proporción de aciertos 
 
24. La varianza del ítem 5 es:  a) 0.21; b) 0.16; c) 0.25 
La varianza se obtiene multiplicando p.q = 0.2 * 0.8 = 0.16   
 
25. El coeficiente α de Cronbach es: a) 0.49; b) 0.36; c) 0.69 

sujetos  1  2  3  4  5  X  X2 
A  0  1  1  1  1  4  16
B  1  1  0  1  0  3  9 
C  1  1  0  0  0  2  4 
D  1  1  1  1  0  4  16
E  1  0  0  0  0  1  1 
p  0.8  0.80  0.40  0.6  0.2     
0.96/1.36P*q  0.16 0.16  0.24  0.24 0.16 14 46
 
∑ ∗ 5 0.96
20 1 20 1 0.36
1 4 1.36
 
46
S 2.8 1.36
5
 
 

Preguntas examen psicometría Septiembre 2015 
 
1. En las baterías de aptitud múltiple: a) se utiliza el cociente intelectual como medida para cada rasgo; 
b) cada sujeto obtiene una puntuación en cada rasgo; c) se obtiene una puntuación global que indica 
la posición del sujeto. 
 
2. Los tests referidos al criterio (TRC) permiten interpretar las puntuaciones de los sujetos en función de 
su conocimiento de una materia: a) sin hacer referencia a un grupo normativo; b) en relación  a un 
grupo normativo; c) sin analizar si se han obtenido o no los objetivos establecidos. 
 
3. En los tests adaptativos informatizados (TAI´s): a) se seleccionan los ítems aleatoriamente de un banco 
de  ítems;  b)  los  ítems  se  van  seleccionando  a  lo  largo  del  proceso  de  administración  del  test;  c)  a 
todos los sujetos se les administra el mismo número de ítems. 
 
4. Cuando el objetivo que se persigue es analizar hasta qué punto los ítems de un  test son una muestra 
adecuada  del  constructo  que  se  quiere  medir  estamos  hablando  de  validación  de:  a)  constructo;  b) 
referida al criterio; c) contenido. 
 
5. Cuando los ítems de un test son dicotómicos, el índice de dificultad de cada uno de ellos: a) es igual a 
su media; b) depende del número de sujetos; c) es independiente del nivel de habilidad de los sujetos. 
 
6. Las escalas típicas derivadas: a) presentan valores negativos; b) se encuentran entre 0 y 100;  c) son 
transformaciones lineales de las puntuaciones típicas. 
 
7. Cuando se utiliza un diseño de anclaje para llevar a cabo la equiparación: a) las muestras  no tienen 
por qué ser equivalentes; b) las muestras tienen que ser equivalentes; c) se pasan las dos pruebas a 
las distintas muestras. 
 
8. En el método lineal de equiparación: a) la diferencia entre las puntuaciones obtenidas por los sujetos 
en  ambos  tests  es  constante;  b)  se  equiparan  las  puntuaciones  directas  que  tienen  la  misma 
puntuación típica; c) se equiparan las puntuaciones que tienen el mismo percentil. 
 
9. El índice de dificultad de un ítem en la teoría clásica de los tests: a) no influye en la media del test; b) 
es independiente de la muestra de sujetos; c) depende de la muestra de sujetos a los que se aplique 
el test 
 
10. A la hora de llevar a cabo un proceso de selección, los FALSOS NEGATIVOS  hacen alusión a aquellos 
sujetos que: a) habiendo superado la prueba de admisión (Test) tienen luego un mal rendimiento en el 
criterio;  b)  no  habiendo  superado  la  prueba  de  admisión  (Test)  rindieron  adecuadamente  en  el 
criterio; c) no superaron  la prueba de admisión (Test) ni rindieron adecuadamente en el criterio. 
 
11. El coeficiente alfa de Cronbach: a) es un indicador de la consistencia interna del test; b) oscila entre ‐1 
y +1; c) es mayor que el índice de fiabilidad. 
 
12. El coeficiente de validez: a) aumenta con la homogeneidad de la muestra; b) es intrínseco al test y es 
independiente del criterio utilizado; c) es un índice de capacidad del test para predecir un criterio. 
 
13. A una muestra de 500 sujetos se les pide que evalúen a 4 políticos (A, B, C y D) en función de la calidad 
de su gestión en los 4 últimos años. En la tabla siguiente se recoge la matriz de puntuaciones típicas 
correspondiente a los resultados obtenidos al aplicar el método de las comparaciones binarias. El valor 
escalar y el valor escalar transformado asignado al político A  son: a) ‐0.41 y 0; b) 0.28 y 0.685; c) 0 y 
0.125. 
 

  A  B  C  D 
A  0       
B  ‐0.25  0     
C  0.52  0  0   
D  0.85  0.25  0.52 0 
  1.12/4=  0.50/4=  0  ‐1.62/4= 
∑Z/N  0.28  0.125  ‐0.405 
   
 

El valor del estímulo A es igual a la media de las puntuaciones típicas = 1.12/4= 0.28 

Para calcular el valor transformado se pone el origen en el valor más bajo y se va sumado ese 
valor  a  todos  los  demás.  El  valor  más  bajo  es  el  correspondiente  al  estímulo  D  (‐.405).  El 
valor escalar transformado del estímulo A será igual a 0.28 + 0.405 = 0.685 

14. Si  la  correlación  entre  las  puntuaciones  empíricas  de  un  test  y  los  errores  de  medida  del  mismo  es 
0.40. El índice de fiabilidad del test es: a) 0.92; b) 0.84; c) 0.67 

0.40 1 0.16 0.84 √0.84 0.92 

15. Tres jueces han valorado la probabilidad de que un sujeto mínimamente competente supere los tres 
ítems  de  un  test  (se  trata  de  un  ejemplo).  Los  resultados  aparecen  en  la  tabla  adjunta.  El  punto  de 
corte será:  a) 3.54; b) 2.28;c) 1.18 

Ítems  Juez1  Juez2  Juez3 


1  0.25  0.48  0.40 
2  0.53  0.44  0.46 
3  0.30  0.28  0.40 
 

El punto de corte será la media de las probabilidades asignadas por cada juez 

1.08 1.2 1.26


1.18 
3

16.  En  una  prueba  de  conocimientos  se  considera  que  para  que  los  sujetos  sean  considerados  como 
APTOS  deberán    acertar  el  75%  de  sus  ítems.  Cual  deberá  ser  la  longitud  de  la  prueba  si  el  error 
máximo que estamos dispuestos a admitir es de  e2 =  0.0025?:  a) 65; b) 75; c) 85 
 
1 0,75 1 0,75
75 í  
0,0025
 
 
 
Con los datos que se presentan a continuación responder a las preguntas 17 a 25 
Se  quiere  llevar  a  cabo  un  estudio  de  las  propiedades  psicométricas  de  un  nuevo  test  de  inglés  (X). 
Para ello se ha aplicado a una muestra de 6 sujetos (es un ejemplo) junto con una prueba ya validada 
(Y). Los resultados obtenidos se encuentran en la tabla adjunta: 

Sujetos  X1  X2  X3  X4  Y 


1  1  1  0  1  5 
2  1  1  1  1  6 
3  1  0  0  0  4 
4  1  1  0  1  6 
5  0  1  1  1  7 
6  1  1  0  0  8 
 

Datos:Σ 16, Σ 48; Σ 256; Σ 36; Σ 226; Σ 1296 

16 36
ΣXY 98; Σpq 0,72; 2,67; 7,13; 6;  
6 6
48 226
7,13 0,87; 36 1,67 
6 6

17. El coeficiente y el índice de fiabilidad utilizando la fórmula KR20 serán respectivamente: a) 0,23 y 0,40; 
b) 0,40 y 0,48; c) 0,23 y 0,48 
 
 
Σ 4 0,72
20 1 1 0,23 
1 3 0,87
0,23 0,48 
 
18. Utilizando el modelo de regresión, el intervalo confidencial en el que estará la puntuación verdadera 
del sujeto 5 (NC 95%) será:  a) 1,99 y 3,51; b)  1,50 y 3,25; c) 1,93 y 3,57 
El sujeto 5 ha obtenido un 3 en el test. 
´ 0,23 3 2,67 2,67 2,75 
0,93 1 0,23 0,23 0,39 
Emáx= 1.96 * 0,39 = 0,76 
´ 0,76 → 2,75 0,76 3,51 2,75 0,76 1,99 
 
 
19. Si se duplicara la longitud del test, el nuevo coeficiente de fiabilidad sería: a) 0,56; b)0,45; C) 0,37 
2 ∗ 0,23
0,37 
1,23
20. Sabiendo que la correlación entre las puntuaciones obtenidas por los sujetos en el test original y en el 
duplicado  es  0,60.  Serían  significativas  las  diferencias  encontradas  entre  ambos  coeficientes?  (NC 
95%):  a)  Si  porque  el  valor  de  chi  cuadrado  obtenido  es  mayor  que  el  de  tablas;  b)  no  porque  la 
puntuación  típica  obtenida  es  mayor  que  la  de  las  tablas;  c)  no  porque  el  valor  de  t  obtenido  es  
menor que el de las tablas. 
 
0,37 0,23 √6 2
0,25 
4 1 0,37 1 0,23 1 0,36
 
 Para 4 grados de libertad el valor de t= 2,78 
Por lo tanto no hay diferencias estadísticamente significativas 
 
21. El coeficiente de determinación del test respecto al criterio será:  a) 0,07;  b) 0,27; c)0,20 
 
∗ ∗  
, → . . , ,
∗ ∗
 
22. El intervalo confidencial en el que se encontrará la puntuación en el criterio de un sujeto que en el test 
original obtuvo una puntuación directa de 3 puntos será: a) 2,49 y 7,55; b) 3,69 y 8,55; c) 4,49 y 7,36 

1,29
´ 0,27 3 2,67 6 6,12 
0,93

1,29 1 0,07 1,24


á 1,96 ∗ 1,24 2,43  
6,12 2,43 3,69 6,12 2,43 8,55

 
23. El ítem más difícil para esta muestra ha sido el: a)  1 y 2; b)  4; c) 3  
El ítem más difícil es el que ha sido acertado por el menor número de sujetos 
 
24. Suponiendo  que  la  distribución  de  las  puntuaciones  se  ajustara  a  una  distribución  normal  ¿qué 
eneatipo le corresponde en el criterio al sujeto número 5?: a) 6; b) 8; c) 7 
7 6
0,78
1,29  
5 2 ∗ 0,78 6, 56 7
 
25. Si la puntuación de 2 es el punto de corte en el test para clasificar a los sujetos en aptos y no aptos, el 
coeficiente de Livingston será: a) 0,49; b) 0,39; c) 0,59 

0,23 ∗ 0,87 2,67 2


0,49 
0,87 2,67 2

 
PLANTILLA

NOTA: Se autoriza a los alumnos a llevar al examen fotocopia de la Fe de Erratas del formulario. También podrán
llevar las erratas corregidas en el mismo.
Es posible que por problemas de redondeo no aparezca ninguna opción como correcta, en esos casos deberán
elegir la más aproximada.
1. Los constructos psicológicos: a) son variables psicológicas observables; b) se miden a través de
indicadores; c) son variables unidimensionales.

Al realizar un experimento se sabe que el umbral absoluto de una persona para el sonido es de 20 Hz, que
la constante de Weber es 0,3 y que se cumplen los supuestos de la ley de Fechner. Con estos datos
responder a las preguntas 2 y 3.
2. El umbral diferencial cuando se produce una diferencia apenas perceptible es: a) 0; b) 6.7; c) 6.0

∆𝐸
0.3 = → ∆𝐸 = 20 ∗ 0.3 = 6
20
3. El valor del estímulo en la escala física que corresponde al valor de 2 en la escala de sensación es: a)
33.8; b) 26; c) 7.8

𝐸2 = 𝐸1 (𝐾 + 1) = 26 ( 0.3 + 1) = 33.8

4. Cuando se quiere elaborar una escala para la medición de actitudes mediante alguna de las técnicas de
Thurstone, hay que asignar valores escalares a: a) los sujetos; b) las respuestas; c) los estímulos.
5. El método de Nedelsky se utiliza con ítems: a) de todo tipo; b) de elección múltiple; c) dicotómicos.
6. La variabilidad de las puntuaciones obtenidas por una muestra de sujetos en el criterio: a) afecta al valor
del coeficiente de alienación; b) no incide en la validez del test; c) afecta a la validez de contenido.
7. La especificidad del test expresa la proporción de sujetos que: a) fueron correctamente seleccionados
por el test respecto al total de sujetos que superaron el criterio; b) fueron correctamente rechazados por el
test respecto al total de sujetos que no superaron el criterio; c) superaron el criterio.
8. El coeficiente de validez: a) está afectado por los errores de medida del test y del criterio; b) disminuye
a medida que aumenta la longitud del test; c) es la correlación entre las puntuaciones verdaderas y las
empíricas obtenidas por los sujetos.
9. Se ha aplicado un test de inteligencia general formado por 26 ítems a una muestra de 61 adolescentes
y se ha obtenido un coeficiente alfa de Cronbach de 0.78. Utilizando el NC del 95% comprobar si el coeficiente
obtenido es estadísticamente significativo y establecer el intervalo confidencial en el que se encontrará el
coeficiente alfa en la población: a) No es significativo y el intervalo es 0.60 y 0.85; b) Si es significativo y el
intervalo es 0.60 y 0.79; c) Si es significativo y el intervalo es 0.69 y 0.85.

1−0
𝐹= = 4,55
1 − 0.78
Gl= 60 y 1500
1−𝛼
≤ 1.39; 𝛼 ≥ 1 − 0.22 ∗ 1,39 ≥ 0.69
1−0.78
F0.975 = 1,39 1−𝛼
≥ 0.67; 𝛼 ≤ 1 − 0.22 ∗ 0.67 ≤ 0.85
1−0.78
0.69 ≤ 𝛼 ≤ 0.85
F0.025 = 0,67
10. Para establecer el punto de corte en un test de 6 ítems se ha requerido la opinión de 2 jueces. Éstos,
después de analizar cada uno de los ítems deberán decir cuál es la probabilidad de que un sujeto
mínimamente competente acierte cada uno de ellos. En la tabla que se muestra a continuación aparecen las
valoraciones de los jueces. El punto de corte será: a) 3.2; b) 2.5; c)2.23

Ítems/Jueces 1 2 3 4 5 6
Juez 1 0.22 0.40 0.50 0.40 0.25 0.44
Juez 2 0.30 0.50 0.35 0.25 0.35 0.50

Ítems/Jueces 1 2 3 4 5 6 Total
Juez 1 0.22 0.40 0.50 0.40 0.25 0,44 2.21
Juez 2 0.30 0.50 0.35 0.25 0.35 0.50 2.25

Punto de corte = 2.21 + 2.25/2= 2.23

Con los datos que se presentan a continuación responder a las preguntas 11 a la 13


Se quiere comprobar la influencia que dos variables (X1 y X2) tienen sobre la Empatía de las personas (Y).
Para ello se han aplicado las pruebas correspondientes y se han obtenido los siguientes resultados:
𝑟𝑌.𝑋1 = 0.69; 𝑟𝑌.𝑋2 = 0.45; 𝑟𝑋1.𝑋2 = 0.52;

11. Si se eliminara el efecto de la variable X2, la correlación entre el criterio (Y) y la variable X1 sería: a)
0.59; b) 0.65; c) 0.60
0.69 − 0.45 ∗ 0. 52
𝑟𝑌𝑋1.𝑋2 = = 0.60
√(1 − 0.452 ) ∗ (1 − 0.522 )

12. La proporción de la varianza de las puntuaciones en el criterio (Y) que se puede pronosticar a partir de
las puntuaciones obtenidas en las variables X1 y X2 es: a) 0.49; b) 0.55; c) 0.34

2 0.692 +0.452 −2∗0.69∗0.45∗0.52


𝑅𝑌.𝑋1𝑋2 = = 0.49
1− 0.522

13. El error típico de estimación múltiple en puntuaciones típicas será: a) 0.51; b) 0.61; c) 0.71

𝑆𝑌.𝑋1𝑋2 = √1 − 0.49 = 0.71

14. La proporción de la varianza verdadera que hay en la varianza empírica es igual a 0.70 y el coeficiente
de determinación es igual a 0.60. Si aumentamos la longitud del test cuatro veces, el coeficiente de valor
predictivo del nuevo test es: a) 0.51; b) 0.68; c) 0.75
2
𝑟𝑥𝑥 = 0.70; 𝑟𝑥𝑦 = 0.60; 𝑟𝑥𝑦 = √0.60 = 0.77

0.77 ∙ √4 1.54
𝑅𝑥𝑦 = = = 0.875; 𝐸 = 1 − √1 − 0.872 = 1 − 0.49 = 0.51
√1 + (4 − 1)0.70 1.76

15. Hemos aplicado un test a una muestra de sujetos. La varianza de las puntuaciones empíricas en una
mitad del test es 14 y la varianza en la otra mitad es 22, siendo la desviación típica del test total igual a 6. El
valor del índice de fiabilidad es igual a: a) 0; b) 0.25; c) 0.53

2 2
𝑆𝐴 +𝑆𝐵 14+22
𝑟𝑥𝑥 = 2 (1 − 2 ) = 2 (1 − ) = 0; 𝑟𝑥𝑣 = 0
𝑆𝑋 36

16. La correlación entre las puntuaciones obtenidas por una muestra de sujetos en un test compuesto por
40 ítems y un criterio externo es igual a 0.75. ¿Cuántos ítems tendríamos que añadir para que la validez fuera
igual a 0.90, sabiendo que cuando el test tiene una fiabilidad perfecta el coeficiente de validez final es 0.95?:
a)102; b)167; c)246
2
𝑟𝑥𝑦 𝑟𝑥𝑦 0.752 0.902 ∙ (1 − 0.62) 0.31
𝑅𝑉𝑥 𝑦 = ; 𝑟𝑥𝑥 = 2 = = 0.62; 𝑛 = =
√𝑟𝑥𝑥 𝑅𝑉𝑥 𝑦 0.95 2 0.75 − (0.90 ∙ 0.62) 0.06
2 2

= 5.17
𝐹 = 𝑛 ∙ 𝐸𝐼 = 5.17 ∙ 40 = 206,8 ≈ 207; 207 − 40 = 167

17. Hemos aplicado un test compuesto por 25 ítems a una muestra de 150 sujetos, obteniéndose que el
80% de la varianza empírica se debe a la varianza verdadera y que el coeficiente de valor predictivo es igual
a 0.60. Si añadimos 15 ítems paralelos al test original, la validez del test es igual a: a) 0.86; b) 0.88; c) 0.95

𝑆𝑣2 = 0.57 ∙ 𝑆𝑥2 ; 𝑟𝑥𝑥 = 0.80; 0.60 = 1 − √1 − 𝑟𝑥𝑦


2
; 1 − 𝑟 2 𝑥𝑦 = 0.16; 𝑟𝑥𝑦 = 0.92

40 𝑟𝑥𝑦 √𝑛 0.92 ∙ 1.26 1.06


𝑛= = 1.6; 𝑅𝑥𝑦 = = = = 0.95
25 √1 + (𝑛 − 1)𝑟𝑥𝑥 √1 + (1.6 − 1) ∙ 0.80 1.16

18. Si un test está formado por 20 ítems paralelos y su índice de fiabilidad es igual a 0.90, el coeficiente de
fiabilidad del ítem 17 será igual a: a) 0.17; b) 0.30; c) 0.98.

𝐸𝐹 1 0.05 ∙ 0.81 0.04


𝑛= = = 0.05; 𝑟𝑥𝑣 = 0.90 → 𝑟𝑥𝑥 = 0.81; 𝑟𝑗𝑗 = = = 0.17
𝐸𝐼 20 1 + (0.05 − 1) ∙ 0.81 0.23

19. En la tabla que se presenta a continuación aparecen recogidas las puntuaciones obtenidas en los
elementos pares (P) e impares (I) de un test de razonamiento matemático por 4 sujetos de una muestra (se
trata de un ejemplo). Utilizando el método que consideren más adecuado, el coeficiente de fiabilidad del
test será: a) 0.86; b)0.76; c) 0.84
Sujetos P I
A 4 3
B 8 9
C 3 6
D 6 7

Sujetos P I (P-I) =d X
A 4 3 1 7
B 8 9 -1 17
C 3 6 -3 9
D 6 7 -1 13

7 + 17 + 9 + 13
𝑀𝑒𝑑𝑖𝑎 = = 11.5
4
49 + 289 + 81 + 169
𝑆𝑥2 = − 132.25 = 14.75
4
1−1−3−1
𝑀𝑒𝑑𝑖𝑎 𝑑 = = −1
4
1+1+9+1
𝑆𝑑2 = −1=2
4
2
𝑟𝑥𝑥 = 1 − = 0.86
14.75

Esto utilizando Rulon.

Si aplicamos Guttman-Flanagan el resultado es el mismo

Media (p) = 5.25; Media (I)= 6.25


Varianza (P) = 3.69; Varianza (I)= 4.69
3.69 + 4.69
𝑟𝑥𝑥 = 2 ( 1 − ) = 0.86
14.75

Para utilizar Spearman-Brown habría que comprobar que las dos formas son paralelas, por
ello, tenemos que utilizar Rulon, o Guttman-Flanagan.

Con los siguientes datos responder a las preguntas 20 y 21


Se ha elaborado, mediante el procedimiento de intervalos aparentemente iguales, una escala de Thurstone
para evaluar la calidad de los tejidos empleados por una empresa textil. A continuación se presenta la
clasificación llevada a cabo por 180 expertos, en cinco categorías, respecto al ítem “resistencia de los
tejidos”.

Categorías: 1 2 3 4 5
Jueces: 15 22 33 45 65
20. Calcular el valor escalar de dicho ítem: a) 3.16; b) 3.87; c) 3.94
1 2 3 4 5
f 15 22 33 45 65
f a 15 37 70 115 180
1
V.E.  M d  3.5  (90  70)  3.5  (0.44)  3.94
45

21. Calcular el coeficiente de ambigüedad del ítem: a) 1.05; b) 2.07; c) 3.02

1 1
Q 3  4.5  (135  115)  4.5  0.31  4.81 Q1  2.5  ( 45  37)  2.5  0.24  2.74
65 33
C.A.  Q 3  Q1  4.81  2.74  2.07.

22. Hemos aplicado un test formado por 60 ítems a una muestra de sujetos. Los 15 primeros son de dos
alternativas, los 20 siguientes de tres alternativas y los 25 restantes son de cuatro alternativas. La puntuación
que le corresponde en el test a un sujeto que contestó correctamente a 10 de los 15 primeros ítems, a 16 de
los 20 siguientes y a 16 de los veinticinco restantes, sabiendo que no dejó ningún ítem sin contestar, es igual
a: a) 30; b) 32; c) 42.

5
15 ítems 2 alternativas: 10 aciertos→ Punt: 10 - =5
1
4
20 ítems 3 alternativas: 16 aciertos→ Punt: 16 - = 14 Puntuación total= 5 + 14 + 13 = 32
2
9
25 ítems 4 alternativas: 16 aciertos→ Punt: 16 - = 13
3

23. Supongamos que en un examen de Psicometría se establece que para que un alumno sea considerado
apto la proporción de aciertos debe ser 0.80 como mínimo. ¿Cuál debería ser la longitud del examen si
estamos dispuestos a admitir un error máximo de 0.05?: a) 54; b) 64; c) 74.

0.80(1 − 0.80)
𝑛= = 64
0.052

24. Un distractor de un ítem se considera que funciona correctamente cuando: a) es seleccionado por los
sujetos menos competentes en el test. b) discrimina en el mismo sentido que la alternativa correcta. c) es
fácilmente identificado como una alternativa incorrecta por todos los sujetos.
25. Cuando un mismo constructo se mide mediante distintos tests, la correlación entre las puntuaciones
obtenidas por los sujetos en los distintos tests hace referencia a la validez: a) discriminante; b) referida al
criterio; c) convergente
1. En las escalas de clasificación: a) se evalúan variables cognitivas; b) el significado de las opciones de
respuesta es el mismo para todos los sujetos; c) es frecuente que aparezcan sesgos en las respuestas.

2. La técnica de Likert: a) da lugar a una escala sumativa; b) da lugar a una escala multidimensional; c)
utiliza la prueba de jueces.

3. Según el modelo de la TCT, el cálculo de las variaciones del coeficiente de fiabilidad como consecuencia
de la variabilidad de la muestra, asume la constancia de las varianzas: a) verdaderas; b) empíricas; c) de
error.

4. El coeficiente de fiabilidad de un test de actitudes es igual a 0.80 y la varianza de las puntuaciones


empíricas de la muestra de sujetos a los que se ha aplicado dicho test es igual 12. El valor del error típico
de estimación de las puntuaciones verdaderas es igual a: a) 7.68; b) 1.24; c) 1.38.

𝑆𝑣2 = 𝑟𝑥𝑥 ∙ 𝑆𝑥2 = 0.80 ∙ 12 = 9.60; 𝑆𝑒2 = 12 − 9.60 = 2.40; 𝑆𝑒 = √2.40 = 1.549 ≈ 1.55;

𝑆𝑣𝑥 = 𝑆𝑒 ∙ √𝑟𝑥𝑥 = 1.55 ∙ 0.89 = 1.379 ≈ 1.38

5. En los Tests referidos al criterio: a) las puntuaciones obtenidas por los sujetos se interpretan en relación
a las obtenidas por una muestra representativa de su misma población; b) las puntuaciones se
interpretan en relación a un dominio bien definido; c) los ítems se seleccionan de manera que
discriminen mejor entre los sujetos.

Con los datos que se presentan a continuación responder a las preguntas 6 y 7.


Se quiere elaborar una escala de 7 categorías para evaluar la actitud de los españoles ante la llegada de
refugiados. Un grupo de 200 jueces han evaluado los ítems para ver el grado de actitud que implica cada
uno de ellos. La categoría 1 indicaría la actitud más negativa y la 7 la más positiva. Los resultados al evaluar
el ítem 4 fueron los siguientes:

CATEGORÍAS

Ítem 4 1 2 3 4 5 6 7
Jueces 0 0 10 50 100 30 10

6. El valor escalar del ítem 4 será: a) 4,5; b) 5,6; c) 4,9

CATEGORÍAS

Ítem 4 1 2 3 4 5 6 7
Jueces 0 0 10 50 100 30 10
fa 0 0 10 60 160 190 200

100 − 60
𝑀𝑑𝑛𝑎. = 4,5 + = 4.9
100
7. El coeficiente de ambigüedad del ítem 4 será: a) 1.1; b) 1.4; c) 1.7

150 − 60
𝑃75 = 4,5 + = 5.4
100
50 − 10
𝑃25 = 3,5 + = 4.3
50
C.A = 1.1
Con los datos que se presentan a continuación responder a las preguntas 8 y 9.
Al aplicar un test a una muestra de 200 sujetos hemos obtenido un coeficiente de fiabilidad de 0.80 y una
desviación típica igual a 6. Dicho test nos permite pronosticar el 64% de la varianza de las puntuaciones de
la muestra en un criterio externo. La desviación típica del criterio es igual a 5.

8. Calcular el intervalo confidencial en puntuaciones diferenciales que se le pronosticará en el criterio a un


sujeto que ha obtenido en el test una puntuación típica igual a 0.20. (NC 90%): a) - 4.15 – 5.75; b) -4.92 –
5.38; c)- 5.15 – 5.64.

𝑥 2 𝑆𝑦 5
𝑍𝑥 = ; 𝑥 = 0.2∙ 6 = 1.2; 𝐶𝐷 = 𝑟𝑥𝑦 = 0.64 → 𝑟𝑥𝑦 = 0.80; 𝑦 ′ = 𝑟𝑥𝑦 ∙ ∙ 𝑥 = 0.8 ∙ ∙ 1.2 = 0.8
𝑆𝑥 𝑆𝑥 6

2
𝑆𝑦𝑥 = 𝑆𝑦 √1 − 𝑟𝑥𝑦 = 5√1 − 0.64 = 3; 𝐸𝑚𝑎𝑥 = 𝑆𝑦𝑥 ∙ 𝑍 = 3 ∙ 1.65 = 4.95; 𝑦 ′ ± 𝐸𝑚𝑎𝑥 = −4.15 − 5.75

9. ¿Cuántos sujetos obtendrían en el criterio puntuaciones diferenciales iguales o superiores a 2, sabiendo


que la distribución de las puntuaciones en el criterio se ajusta a la curva normal: a) 131; b) 100; c) 69.
𝑦 2
𝑍𝑦′ = = = 0.40; 𝑃(𝑍 ≤ 0.4) = 0.6554; 0.6554 ∙ 200 = 131,08 ≈ 131; 200 − 131 = 69 sujetos
𝑆𝑦 5
que obtienen puntuaciones superiores.

10. Una de las condiciones de paralelismo en los tests es que: a) las puntuaciones empíricas de los sujetos
en ambos tests sean iguales; b) la correlación entre las puntuaciones obtenidas por los sujetos en ambos
tests es igual a la unidad; c) la varianza de los errores de medida es la misma en ambos tests.

11. El coeficiente de fiabilidad se define como la correlación entre las puntuaciones empíricas obtenidas
por: a) una muestra de sujetos en dos formas paralelas de un test; b) dos muestras de sujetos en un test;
c) una muestra de sujetos en dos tests distintos.

12. Sabiendo que en una muestra de sujetos la varianza de los errores de medida es la mitad de la varianza
de sus puntuaciones verdaderas, el coeficiente de fiabilidad del test es: a) 0.50; b) 0.70; c) 0.67
𝑆𝑥2 = 𝑆𝑣2 + 0.5 𝑆𝑣2 = 1.5 𝑆𝑣2
1
𝑟𝑥𝑥 = = 0.666~ 0.67
1.5
13. La desviación típica de los errores de medida de un tests es igual a 4, lo que implica el 20% de la
varianza de las puntuaciones verdaderas. El coeficiente de fiabilidad del test es igual a: a) 0.56; b) 0.62; c)
0.74

𝑆𝑒 2
4 20
2 = 0.20; 𝑆𝑣 = 0.20 = 20; 𝑆𝑥2 = 𝑆𝑣2 + 𝑆𝑒2 = 20 + 16 = 36; 𝑟𝑥𝑥 = = 0.56
𝑆𝑣 36
14. Las correlaciones parciales indican la correlación entre: a) la variable criterio y una de las variables
predictoras eliminando de esa correlación la influencia del resto de las variables; b) la variable criterio
y una variable predictora habiendo eliminado de esa variable predictora el influjo que ejercen las
demás; c) la variable criterio y el conjunto de las variables predictoras eliminando de la correlación
obtenida el influjo de una de ellas.
15. El coeficiente de valor predictivo representa: a) la proporción de varianza del criterio que se debe a
error; b) la proporción de seguridad que hay al hacer los pronósticos; c) la proporción de varianza del
criterio que se puede predecir a partir del test.

Con los datos que se presentan a continuación responder a las preguntas 16 a 18

Se quiere averiguar si un test (X) es un buen predictor de la capacidad matemática de los niños de 10 años.
Para ello se aplica a una muestra representativa a la que posteriormente se le va a evaluar mediante un
examen (Y) en una escala de 0-10. Los resultados obtenidos se muestran a continuación: 𝑋̅ = 10; 𝑌̅ =
5; 𝑆𝑥 = 3; 𝑆𝑦 = 2 y a partir del test se puede predecir el 49% de la varianza del criterio.

16. La puntuación pronosticada en el examen ( criterio) a un sujeto que en el test obtuvo una puntuación
directa de 15 puntos fue: a) 5.33; b) 6.33; c) 7.33
2
𝑌´ = 0.70 (15 – 10)+5= 7.33
3
17. El error de estimación de un sujeto que obtuvo en el test una puntuación de 10 puntos y en el examen
obtuvo un 6 fue: a) 1; b) 0; c) -1.

𝑌´ = 5; 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 = 𝑌 − 𝑌´ = 1

Cuando en el test el sujeto obtiene la puntuación media su puntuación pronosticada en el criterio


es la media también.
18. La proporción de varianza del criterio que no se puede predecir a partir del test es: a) 0,51; b) 0.71; c)
0.29
19. En la tabla adjunta se presentan las puntuaciones obtenidas por 10 sujetos en un ítem de un test
dicotómico, donde 1 representa un acierto y 0 un fallo, así como las puntuaciones obtenidas en un criterio
externo. El índice de validez de dicho ítem es igual a: a) 0.17; b) 0.26; c) 0.28.

Puntuación ítem 1 1 1 0 1 1 0 1 0 1
Puntuación criterio 5 7 9 5 6 4 5 8 2 7

5+7+9+6+4+8+7
𝑌̅𝑝 = = 6.57
7
𝑌̅𝑝 − 𝑌̅ 𝑝 6.57 − 5.8 0.7
𝑟𝑏𝑝 = √ = √ = 0.40 ∙ 1.53 = 0,61
𝑆𝑦 𝑞 1,94 0.3
IV = 0,46 ∙ 0,61 = 0,28

20. Hemos administrado un test compuesto por 50 ítems de tres alternativas cada uno, a una muestra de
300 sujetos. ¿Cuál sería la puntuación, corrigiendo el azar, en una escala de 0 a 30, de un sujeto que acierta
30 ítems y falla el resto: a) 10; b) 12; c) 20.
E 20
P=A- = 30 − = 20
K-1 2
30/50 = 0,6 el acierto; 20 ∙ 0.6=12
21. A la hora de calcular la discriminación de los ítems en tests multidimensionales se estima en: a) el
conjunto de ítems asociados a cada dimensión; b) el conjunto del test; c) un criterio externo.
22. A medida que aumenta la discriminación media del test: a) disminuye el coeficiente de fiabilidad; b)
aumenta el coeficiente de fiabilidad; c) no varía el coeficiente de fiabilidad.
23. Los percentiles: a) constituyen una escala de intervalos; b) se utilizan fundamentalmente en los tests
referidos al criterio; c) proporcionan información respecto a un grupo normativo.

24. Dos expertos en comunicación han codificado los registros visuales de un sujeto en relación a su
actitud ante la presentación de una serie de imágenes de expresión facial. Cada experto ha clasificado cada
una de las 100 conductas definidas en dos categorías (A y B). En la siguiente tabla se muestran los
resultados de las clasificaciones realizadas por ambos: a) El índice de Hambleton y Novick es igual a 0.43. b)
El índice Kappa de Cohen es igual a 0.49. c) El coeficiente de Croker y Algina es igual a 0.55

Experto 1
A B
Experto 2 A 45 15
B 10 30

45 30
pc    0.75
100 100
(60  55)  (40  45)
pa   0.51
10000
p  p a 0.75  0.51
K c   0.49
1  pa 1  0.51

25. La recta de regresión en puntuaciones típicas entre las notas de los alumnos en un examen (A), cuya
media es 10 y desviación típica 3, y un test (B), tiene una pendiente igual a 0.80. Un sujeto ha obtenido en
el examen A, una puntuación de 14 ¿Qué puntuación directa se le pronosticaría en el test B, siendo su
media 8 y su desviación típica 2? a) 7.15 b) 10.12 c) 13.75

A  10; S A  3
B  8; S B  2
14  10
ZA   1.33
3
Z B'  b  Z A  0.80  1.33  1.06
BB
Z B'  ; B  (Z B'  S B )  B  (1.06  2)  8  10.12
SB

Vous aimerez peut-être aussi