Vous êtes sur la page 1sur 29

La selección de empleados públicos en la administración vasca: investigación sobre

pruebas selectivas y propuestas de mejora


Documento para su presentación en el VIII Congreso Internacional en Gobierno,
Administración y Políticas Públicas GIGAPP. (Madrid, España) del 25 al 28 de
septiembre de 2017.

Autor: Rodríguez López, Alexander, Instituto Vasco de Administración Pública


(IVAP)
Email: alexander-rodriguez@ivap.eus

Resumen/abstract:
El objetivo de la ponencia es presentar los principales datos obtenidos en las
investigaciones realizadas en el Gobierno Vasco acerca de la selección de empleados
públicos y las conclusiones a considerar en la selección de personal directivo. Así, en
primer lugar, se dan a conocer los resultados de estudios de validación de las pruebas
selectivas más empleadas en las distintas administraciones públicas vascas: pruebas de
conocimientos, pruebas prácticas, entrevistas, tests de personalidad y pruebas de
aptitudes. En segundo lugar, se analiza el papel de variables relevantes en los diseños
selectivos, como la sensibilidad de los principales predictores selectivos (su capacidad
de discriminación), el papel de las percepciones de los participantes en las pruebas, la
similitud entre el contenido de las pruebas y las tareas a desempeñar y la metodología
de evaluación del desempeño. En tercer lugar se describen las iniciativas del IVAP en
materia de adaptaciones idiomáticas de pruebas de personalidad, competencias o
desempeño adaptativo que pueden contribuir a mejorar los procesos selectivos.
Finalmente se ofrecen una serie de conclusiones sobre la selección en el sector público
teniendo en cuenta los modelos selectivos empleados en administraciones públicas
internacionales y se presentan las principales pruebas propuestas para la selección de
personal directivo en las administraciones públicas vascas: Entrevistas conductuales
estructuradas, Assessment center y Pruebas de evaluación de proyectos.

Palabras clave: Validez predictiva, evaluación del desempeño, predictores


selectivos, reacciones de los candidatos, diseño selectivo

1
1. Introducción

El objetivo de esta ponencia es presentar una serie de reflexiones basadas en las


actividades de investigación realizadas en el Instituto Vasco de Administración Pública
(IVAP) acerca de la selección en el sector público que pueden contribuir a introducir
modificaciones en el diseño de las oposiciones y en la manera de seleccionar directivos
públicos. No en vano, son muchas las voces que llevan tiempo demandando cambios en
los procedimientos selectivos en el sector público español, tradicionalmente basado en
las pruebas de conocimiento y la valoración de la experiencia, y defienden combinar
estas pruebas con procedimientos que evalúen las competencias de los aspirantes
(Areses et al., 2017; Ramió, 2011; Peiró, Ramos y Cortés, 2012; Salgado, 2010). De
hecho, varias administraciones públicas vascas se han dirigido a este Instituto, que
anualmente colabora diseñando y corrigiendo exámenes, psicotécnicos o entrevistas en
unos 100 procesos selectivos de diferentes entidades públicas vascas, para introducir
pruebas que se han usado con escasa frecuencia en los procedimientos de selección de
personal que ejerce jefaturas, como Assessment Centers o Entrevistas Conductuales
Estructuradas.

En las siguientes páginas se expondrán los principales datos de validez de las


pruebas más empleadas en el sector público, con los datos obtenidos en investigaciones
del IVAP, algunas de ellas no publicadas, diferentes aspectos a considerar en los
diseños selectivos a emplear (capacidad de las pruebas a emplear para distinguir entre
candidatos, valoraciones de los participantes, similitud entre las pruebas y el contenido
del puesto a desempeñar y el papel de la evaluación del desempeño para contrastar la
validez de las pruebas selectivas), distintas iniciativas del IVAP para mejorar la
selección en el ámbito público y una propuesta de pruebas a emplear en la selección de
directivos públicos en base a la investigación, la jurisprudencia y a los modelos
empleados a nivel internacional. Todo ello desde la conciencia de la dificultad que está
teniendo la implantación de la figura del directivo público profesional en el sector
público español, lo que dificulta la puesta en práctica de propuestas concretas (Jiménez
Asensio, 2009).

2
2. Validez de las pruebas selectivas

El Real Decreto Ley 5/2015 se refiere a los procesos de selección en el acceso al


empleo público en su artículo 61, que insta a que dichos procedimientos cuiden
“especialmente la conexión entre el tipo de pruebas a superar y la adecuación al
desempeño de las tareas de los puestos de trabajo convocados”. No obstante, tal y como
indican Gorriti y López (2014), son pocas las Administraciones Públicas españolas que
hayan comprobado las predicciones hechas en sus procedimientos selectivos empleando
el desempeño como criterio y por tanto hayan podido demostrar el cumplimiento de este
precepto. En consecuencia, es necesario poder comprobar con mayor frecuencia la
eficacia de las pruebas de una oposición midiendo su conexión con el desempeño de los
trabajadores, es decir, la relación entre el contenido de las pruebas y el comportamiento
laboral concreto que predicen. Esto está relacionado con el concepto validez de criterio,
definido por Hernández et al. (2010), como “la validez de un instrumento de medición
al comparar sus resultados con los de algún criterio externo que pretende medir lo
mismo”. Si el criterio se fija en el futuro, se habla de validez predictiva. En definitiva,
se trata de estudiar la relación entre dos medidas relativas a los mismos sujetos tomadas
en dos momentos distintos: por un lado, los resultados en el proceso selectivo de las
personas contratadas –los predictores-, y por otro, las evaluaciones del desempeño de
esas mismas personas en los puestos para los que han sido contratadas –los criterios-. Se
trata, por tanto, de estudiar en qué medida las notas de una prueba selectiva predicen el
desempeño futuro de los candidatos a un puesto.

Esta relación entre predictores y criterios se mide mediante la correlación, que se


expresa en coeficientes que van de -1 a +1 y que sirve para “intentar predecir el valor
aproximado que tendrá un grupo de individuos o casos en una variable, a partir del valor
que poseen en la o las variables relacionadas” (Hernández et al., 2010). Como señalan
Gorriti y López Basterra (2014) “cuanto más alto sea un índice de correlación quiere
decir que la relación es más fuerte, lo cual no debe interpretarse como causa; la
correlación no indica necesariamente causa, sólo eso, relación. La correlación puede ser
negativa. Cuando lo es, indica que la relación es inversa: a más de la variable
independiente x (predictor), menos de la dependiente y (criterio). Y viceversa”.

3
La magnitud de las correlaciones, en base a las convenciones establecidas por
Cohen (1988) se puede calificar de grande si es de en torno a .50, mediana, si es de en
torno a .30, y pequeña si está en torno a .10. En términos de validez predictiva es
deseable contar con instrumentos de al menos .30.

Para saber cuán valida es una prueba en concreto contamos con la aportación del
meta-análisis, es decir, una revisión sistemática en la cual se combinan
matemáticamente los resultados de varios estudios para contestar una misma pregunta
de investigación. El meta-análisis más reciente y completo en materia de validez de
instrumentos de selección es el realizado por Schmidt, Oh y Shaffer (2016), en el que se
resumen los datos de miles de investigaciones realizadas en todo el mundo en los
últimos 100 años relativas a la validez predictiva de 31 instrumentos de selección. La
evaluación del desempeño se obtuvo mediante valoraciones de los superiores directos
de las personas contratadas, que es el procedimiento de evaluación más habitual.

En la Tabla 1 presentamos los datos meta-analíticos de las pruebas más


empleadas en el sector público español, en el que tienen cabida, según el RDL 5/2015:
pruebas de comprobación de conocimientos y capacidad analítica de los aspirantes,
ejercicios para demostrar la posesión de habilidades y destrezas, valoración de méritos,
superación de cursos o de periodos de prácticas, exposición curricular por los
candidatos, pruebas psicotécnicas o entrevistas. Se ofrecen datos de validez operativa,
es decir, la correlación entre pruebas y desempeño corregida por restricción del rango1 y
falta de fiabilidad de la medida de criterio2. Los coeficientes más altos son los de las
pruebas de Aptitud Mental General o Inteligencia General (.65) y las Entrevistas
estructuradas (.58), mientras que el más bajo es el de la experiencia laboral o
antigüedad, .16, que es uno de los ejes del modelo selectivo español. La validez de un
factor de personalidad, Conciencia o Responsabilidad, es de .22, mientras que para el
conjunto de los 5 grandes factores de personalidad (Extraversión, Responsabilidad,
Estabilidad Emocional, Amabilidad y Apertura a la Experiencia), es de .31 (Tett y
Christiansen, 2007). Los tests de conocimientos presentan un coeficiente de .45,

1
Corrección de la correlación observada teniendo en cuenta los datos del total de candidatos y no solo
los de las personas contratadas cuyo desempeño se ha evaluado
2
Corrección de la correlación observada en función del error que se comete al evaluar el desempeño

4
mientras que las pruebas prácticas o de simulación (Test de juicio situacional o Test de
muestras de trabajo) oscilan entre .26 y .33.

Tabla 1
Validez operativa de los principales instrumentos selectivos
Procedimiento selectivo/predictor Validez operativa
Inteligencia general .65
Entrevistas estructuradas .58
Conciencia (personalidad) .22
Experiencia laboral (antigüedad: años de experiencia) .16
Test de juicio situacional (práctico) .26
Test de muestras de trabajo (práctico) .33
Assessment center .36
Conocimientos .45
Periodo de prácticas .44

En cuanto a los datos de validez de las pruebas de oposición obtenidas en


investigaciones realizadas en nuestro país, en la tabla 2 ofrecemos los datos de Berges
(2011) y Sáez (2007) en la selección de policías, los de Salgado, Gorriti y Moscoso en
la selección de puestos de jefatura en el Gobierno Vasco (2007) y los datos de la
validación interna del IVAP en todo tipo de puestos del sector público, que han sido
publicados en lo relativo a la Entrevista (Rodríguez, 2016), así como datos obtenidos en
la selección de auxiliares administrativos en la OPE 2010 del Gobierno Vasco (Prueba
tipo test de conocimientos, Test de juicio situacional –TJS-, Experiencia).

La principal conclusión es que la Entrevista Conductual Estructurada es el mejor


predictor del desempeño laboral, con magnitudes muy superiores (entre .44 y .63) a las
de la piedra angular del sistema selectivo español, las pruebas de conocimientos tipo
test, que en los dos casos estudiados presentan el mismo coeficiente, .24, muy inferior al
apuntado por el meta-análisis de Dye et al. (1993), .45. No obstante, se aproxima al
valor hallado por dicho meta-análisis para puestos de baja complejidad y pruebas de
moderada similitud al contenido del puesto, aspecto este último que coincide con las
reacciones indicadas por los auxiliares de la OPE 2010 del Gobierno Vasco, que le
otorgaron una puntuación de 3 en una escala Likert de 5 puntos en la que tenían que
evaluar el grado de adecuación de la prueba al contenido del puesto.

En ese sentido, otra argumentación que pretende explicar la diferencia entre el


valor hallado y la del conjunto de pruebas de conocimientos es que, como señala Táuriz
(2014), los exámenes de oposición muchas veces incluyen contenido que no está
directamente relacionado con el puesto en sí, como puede ser el derecho constitucional
o el administrativo, por lo que cabe esperar que su validez predictiva sea inferior a .45.
Ello apunta a otra posible línea de investigación: realizar trabajos análogos a este
estudio con muestras que estudien puestos en los que el contenido jurídico esté más
relacionado con el día a día en el trabajo, como Asesores Jurídicos, Letrados, Técnicos
de Administración General, etc., y comprobar si la validez de estas pruebas es distinta
en estos casos.

5
La experiencia, por su parte, presenta valores extremadamente bajos, en torno a
0, tanto en los datos de Berges (2011) como en los del IVAP, lo que implica que este
aspecto no tiene relación con el desempeño, pese a la considerable importancia que se le
da en la selección de empleados públicos.
Las pruebas de personalidad presentan coeficientes similares a los que cabe
esperar según meta-análisis, mientras que las de inteligencia general presentan
coeficientes mucho menores de lo esperado. No obstante, dado el tamaño de las
muestras, es necesario profundizar en este tipo de estudios y hacerlos extensibles a todo
tipo de puestos.

Tabla 2
Validez operativa de pruebas empleadas en el sector público español
Prueba Validez Operativa N
IVAP (Rodríguez, 2016)

MO1 (Método y orden) .26 33


MO2 (Método y orden) .01 98
BO (Batería de operarios) .02 33
IC (Método y orden) .36 69
BFQ (Personalidad) .22 171
CPS (Personalidad) .24 86
Entrevista conductual estructurada .44 125
Conocimientos (Teórico) .24 101
Test de juicio situacional (Práctico) .12 101
Experiencia -.01 101

Gobierno Vasco (Salgado, Gorriti y Moscoso, 2007)

Entrevista conductual estructurada .60 93

Ayuntamiento de Vitoria (Sáez, 2007)

Entrevista conductual estructurada .61 63

Ayuntamiento de Zaragoza (Berges, 2011)

Inteligencia general .10 240


Conocimientos (Teórico) .24 240
Conciencia (Personalidad) -.03 240
Entrevista conductual estructurada .51 226
Inteligencia general .24 226
Destrezas profesionales (Aprovechamiento formativo) .39 226
Antigüedad (experiencia) .00 226
Conciencia (Personalidad) .18 226

6
3. Aspectos a tener en cuenta en la selección del ámbito público

Además de los datos de validez de las pruebas hay una serie de cuestiones que es
necesario tener en cuenta a la hora de elegir los instrumentos selectivos. Son las
siguientes:

3.1. Sensibilidad de las pruebas selectivas

Las correlaciones dependen de la variabilidad de las medidas empleadas, de su


desviación típica. Cuanto mayor sea la desviación típica y más relacionada esté la
variabilidad en las medidas empleadas (a mayor puntuación en una le corresponde una
mayor puntuación en la otra, y viceversa) mayor será la correlación y será más fácil
detectar relaciones significativas.

La desviación típica es la expresión de la sensibilidad de un instrumento, del


grado de dispersión de las puntuaciones de un instrumento. Si un instrumento es
insensible la mayor parte de los candidatos tendrá puntuaciones similares y la
organización encargada de la selección tendrá poca información en la que basar su
decisión. Si, por el contrario, es sensible, será más sencillo identificar al mejor. Los
instrumentos menos sensibles presentan desviaciones típicas de en torno a .4 si se
emplean escalas Likert de 5 puntos o de 1 en una escala de 0 a 10, pudiendo clasificar a
los candidatos en dos grupos, por encima de la media y por debajo de la media. Los más
sensibles, por su parte, presentan desviaciones típicas superiores a 1.8 si se emplean
escalas Likert de 5 puntos o a 5 en una escala de 0 a 10, pudiendo clasificar a los
aspirantes en 9 grupos (Smith y Smith, 2005).

La investigación indica que los instrumentos que no son tests (como las
entrevistas o las dinámicas de grupo) son menos sensibles, y en el mejor de los casos
clasifican a los candidatos en cuatro niveles (muy por encima de la media, por encima
de la media, por debajo de la media y muy por debajo de la media). Por el contrario, la
sensibilidad de las pruebas de aptitudes es muy alta, y la de las pruebas de personalidad
es alta o muy alta (Smith y Smith, 2005).

Para comparar las desviaciones típicas de las principales pruebas de las


oposiciones, en la Tabla 3 se ofrecen las desviaciones de dichos instrumentos tanto en
bolsas de trabajo y oposiciones convocadas por el IVAP como en procesos selectivos de
administraciones públicas vascas en las que ha colaborado este Instituto. Teniendo en
cuenta de la libertad que tienen las entidades convocantes para establecer las
puntuaciones de cada prueba, en el registro del IVAP se tradujeron las puntuaciones de
todas las pruebas estudiadas a una escala de 0 a 10, siendo 10 el equivalente a la
puntuación máxima que se podía conseguir en cada prueba según las bases de la
convocatoria de cada oposición. Se observa que la Experiencia laboral es el aspecto que
más discrimina entre candidatos pudiendo clasificar a los candidatos en 6 grupos según
el criterio de Smith y Smith (2005), seguida muy de cerca por las pruebas de
7
inteligencia y de método y orden. Las que menos discriminan son las pruebas de
conocimientos, pruebas prácticas y la entrevista, que clasifican a los candidatos en tres
grupos (por encima de la media, en la media, por debajo de la media).

Tabla 3.
Desviaciones típicas de las principales pruebas selectivas
Tipo de prueba Estadísticos descriptivos
N Media Desv. típ.
Conocimientos (Teórico) 17185 3.97 1.70
Práctico 3776 6.54 1.33
Experiencia 3721 1.93 2.94
Entrevista 910 6.76 1.35
BFQ (Personalidad) 1265 7.35 2.04
CPS (Personalidad) 567 6.68 1.50
TPT (Personalidad) 287 5.15 1.56
TIG1 (Inteligencia) 1277 6.43 1.77
TIG2 (Inteligencia) 3492 4.30 1.77
D70 (Inteligencia) 936 7.59 2.22
RP30 (Inteligencia) 803 5.89 2.73
MO1 (Método y orden) 184 7.59 2.12
MO2 (Método y orden) 356 6.55 2.93

Esta sensibilidad de los instrumentos empleados tiene efectos en el resultado


final de la oposición y en las posibilidades de obtener plaza. Por ello, el IVAP ha
estudiado empíricamente con los datos de 91 oposiciones realizadas por diferentes
administraciones vascas entre 2006 y 2017 la importancia relativa de los procedimientos
selectivos más empleados a la hora de predecir el resultado selectivo en el acceso al
empleo público, es decir, en qué medida obtener un buen resultado en las diferentes
pruebas selectivas es determinante cara al resultado final, y por tanto, para poder
convertirse en empleado público, algo que es esencial para poder maximizar la utilidad
del sistema selectivo.

La importancia relativa de una variable se refiere a su contribución relativa al


poder de predicción de un modelo de regresión. Para poder analizar la importancia
relativa de los predictores de un determinado criterio la estrategia más empleada es
examinar coeficientes de regresión (coeficientes beta) o las correlaciones de orden cero
en la regresión múltiple ya que cuando los predictores no están correlacionados los
coeficientes beta y las correlaciones son equivalentes. En ese caso la importancia

8
relativa de cada variable se puede expresar como la proporción de la varianza del
criterio que explican (Johnson y LeBreton, 2004; Nathans, Oswald y Nimon, 2012). No
obstante, este procedimiento no aporta información acerca de la contribución que un
nuevo predictor realiza a un modelo de regresión en relación al resto de predictores
(Van Iddekinge y Ployhart, 2008).

Este problema, unido al hecho que a menudo se dan correlaciones entre las
variables independientes debido al solape de los constructos medidos por pruebas con
contenidos similares (multicolinealidad), hace preciso optar por procedimientos como
General Dominance Weights (GDW; Azen y Budescu, 2003), que calcula el peso
relativo que cada variable independiente aporta a través de todos los modelos de
regresión que se puedan formar con el conjunto de predictores. En la selección de
empleados públicos cabe esperar que haya correlaciones entre los predictores, ya que se
suele emplear más de una prueba de conocimientos, circunstancia ante la cual es
recomendable emplear la mencionada medida (Johnson y LeBreton, 2004; Nathans,
Oswald y Nimon, 2012).

En la investigación del IVAP, realizada con los datos de opositores que llegaron
al final de 91 oposiciones de todo tipo de plazas (N= 3418), se tuvieron en cuenta
únicamente los resultados en los tres predictores que tradicionalmente tienen más peso
en los procedimientos selectivos: prueba de conocimientos tipo test, prueba práctica y
valoración de la experiencia. Para poder comparar los resultados se convirtieron las
puntuaciones de las pruebas estudiadas a una escala de 0 a 10, siendo 10 el equivalente
a la puntuación máxima que se podía conseguir en cada prueba según las bases de la
convocatoria de cada oposición. La puntuación total máxima en el proceso selectivo fue
la variable dependiente empleada para estudiar el peso de los mencionados
procedimientos selectivos en la decisión selectiva, es decir, en la nota final del proceso
selectivo.

Empleando el procedimiento GDW se obtuvieron pesos relativos de 22.82%


para la prueba de conocimientos específicos, 27.50% para la prueba práctica y 49.67%
para la experiencia. Todo lo cual nos lleva a concluir que estamos seleccionando en

9
base a la experiencia, que tiene un coeficiente de validez pequeño, y mucho menor que
el de pruebas como las de conocimientos o las entrevistas.

Pese a que la puntuación máxima marcada por las bases de convocatoria para la
experiencia estuviese en todos los casos dentro del margen marcado por la
jurisprudencia (por debajo del límite del 45% del total de puntos de la oposición, con
pesos que oscilaron entre el 22% y el 31%), empíricamente, la puntuación total en el
proceso selectivo (nuestra variable dependiente) está determinada fundamentalmente
por la puntuación en experiencia, cuyo peso equivale al de la suma de las dos pruebas
más habituales en la fase de oposición (conocimientos y práctico).

Los resultados obtenidos en esta investigación muestran el considerable peso


específico de la experiencia laboral para el acceso al empleo público, lo que se
corresponde con lo apuntado por Antón (2014), Parada y Fuentetaja (2014), Aldomà et
al. (2011) y con las sentencias del Tribunal Constitucional que establecen un peso
máximo para este procedimiento selectivo en relación a las pruebas de la fase de
oposición. La elevada desviación típica de la experiencia (Media = 1.87; SD = 2.84) en
relación a la que presentan la prueba de conocimientos (Media = 6.90; SD = 1.15) y el
práctico (Media = 6.44; SD = 1.13) hace que las personas con muchos años de servicios
prestados puedan compensar resultados no demasiado altos en las pruebas de oposición,
ya que en estas las diferencias entre los candidatos son menores. Por tanto, cabe afirmar
que tener experiencia es fundamental para convertirse en empleado público. De hecho,
teniendo en cuenta los resultados de este trabajo, en torno al 50% de la varianza de la
puntuación total en el proceso selectivo está explicada por la puntuación en experiencia
laboral según la medida obtenida mediante GDW.

3.2. El papel de las reacciones de los candidatos

Un segundo aspecto a tener en cuenta son las reacciones de los candidatos, ya


que estas pueden influir en la imagen pública de la organización convocante, así como
en el resultado en las pruebas selectivas e incluso en el resultado de la evaluación del

10
desempeño (Anderson, Salgado y Hülsheger, 2010; Ryan y Ployhart, 2000; Salgado,
Gorriti y Moscoso, 2007; McCarthy et al., 2013).

En general, los resultados de diferentes estudios sugieren que existe una relación
positiva entre la percepción de justicia procedimental y el desempeño en los exámenes,
es decir que las personas que tienen reacciones positivas hacia los procedimientos
selectivos obtienen puntuaciones superiores en dichos procedimientos y viceversa
(Smither et al., 1993; Truxillo, Steiner, y Gilliland, 2004). Así, se han realizado
diferentes estudios sobre la percepción de pruebas como los tests de personalidad,
pruebas de inteligencia o test de muestras de trabajo (Anderson, Salgado y Hülsheger,
2010; Anderson y Witvliet, 2008; Hausknecht, Day y Thomas, 2004). En cuanto a las
pruebas de conocimiento o los TJS, debido a su relación con los contenidos del puesto y
a la objetividad en su corrección, los candidatos tienen una visión favorable acerca de
ellas (Rogelberg, 2007). Lo mismo sucede con la evaluación de méritos, que es
percibida como objetiva y justa por parte de empleados públicos (Alonso, Táuriz y
Choragwicka, 2009).

Por otro lado, en cuanto a la relación entre reacciones y evaluación del


desempeño, Gilliland (1994) encontró que los empleados que percibieron que habían
sido seleccionados mediante procedimientos injustos tuvieron un desempeño peor que
los que tuvieron una percepción positiva. Colquitt et al. (2001) hallaron que las
percepciones de justicia estaban relacionadas con el desempeño y McCarthy et al.
(2013), encontraron evidencias de que las reacciones, cuando son disposicionales, es
decir, relacionadas con diferencias individuales estables en constructos como la
personalidad (reacciones como motivación, auto-eficacia, ansiedad ante los tests)
afectan directamente al desempeño laboral. Estos autores también hallaron que cuando
las reacciones son situacionales, es decir, cuando reflejan estados afectivos específicos
de una situación relativos a las percepciones de los candidatos sobre los procedimientos
selectivos y que no presentan un solape con la personalidad (percepción de justicia
procedimental) afectan al desempeño indirectamente a través de su influencia en las
calificaciones obtenidas.

A la misma conclusión se ha llegado en una investigación del IVAP con una


muestra pequeña (N=34) a partir de los datos de la mencionada OPE 2010 de auxiliares,
en la que se encontró un efecto indirecto de la percepción acerca de la adecuación a las

11
tareas del puesto del TJS (reacción situacional) sobre el desempeño laboral por medio
de su efecto en las calificaciones en esta prueba que se ha hallado en esta investigación
y además, una correlación significativa que presentan adecuación de la dificultad y
adecuación al temario con el desempeño general (en ambos casos, r = .41), lo que indica
una posible relación directa entre reacciones y desempeño. No obstante, dado el tamaño
de la muestra, es necesario profundizar en investigaciones similares.

En cualquier caso, la preocupación de las organizaciones acerca de la validez


predictiva de las pruebas, que según el meta-análisis de Anderson et al. (2010) está
ligada a la percepción favorable de las mismas por parte de los candidatos ya que hay
una correlación elevada entre dichas percepciones y los coeficientes de validez de las
pruebas (r = .65), y los resultados obtenidos invitan a reflexionar sobre la importancia
de la “validez política” de las mismas, es decir el grado de aceptación que tienen en las
partes implicadas: entidades convocantes, ocupantes de los puestos, candidatos,
sindicatos, etc., lo que implica que dichas personas deben participar en el diseño de los
procesos selectivos, deben ser informadas debidamente acerca del proceso selectivo y
las pruebas a emplear y se deben considerar sus impresiones (Patterson y Zibarras,
2011; Patterson et al., 2012; Truxillo et al., 2002).

3.3. Similitud entre pruebas selectivas y contenido del puesto

Un tercer aspecto a considerar es la similitud conceptual entre el dominio del


constructo de los predictores y el dominio del constructo de los criterios, es decir, entre
el contenido de las pruebas selectivas y el contenido de las tareas a realizar en el
desempeño del puesto al que se opta (Binning y Barrett, 1989; Lievens, Buyse y Sackett,
2005). Esta similitud entre pruebas y la realidad del puesto afecta de manera positiva a
las reacciones de los candidatos, y también a la magnitud de los coeficientes de validez,
tal y como hemos comprobado en nuestra investigación sobre la OPE 2010, donde la
prueba de conocimientos, percibida por los candidatos como más relacionada con el
puesto frente al Test de Juicio Situacional (TJS), fue la que obtuvo coeficientes de
validez más altos.

Asimismo, al medir las correlaciones corregidas entre las pruebas eliminatorias


(conocimientos y TJS) y las subdimensiones de las medidas de criterio para la OPE
2010 identificadas para el puesto de auxiliar mediante la herramienta de análisis de

12
puestos del Gobierno Vasco (Gorriti y López Basterra, 2010), la prueba de
conocimientos y TJS, presentaron las magnitudes más elevadas con Tramitar
expedientes y Autodesarrollo (Tabla 4).

Tabla 4. Validez operativa de las pruebas de conocimientos con las subdimensiones de


criterio

Criterio

Alimentar
Atender Comprobar Elaborar Tramitar Ayuda Persistencia
Bases de
Predictor Consultas Datos datos Certificaciones Expedientes Cooperación Iniciativa Tenacidad Autodesarrollo

Conocimientos .03 -.02 .28 .07 .39 .02 -.08 .00 .36

TJS -.08 -.11 .13 .10 .35 .03 -.08 -.09 .28

Cabe destacar que tanto la prueba de conocimientos como el TJS presentan las
correlaciones más elevadas a la hora de predecir Tramitación de expedientes, la medida
de criterio más relacionada con el importante peso concedido en el temario al
conocimiento de la normativa de procedimiento administrativo.

Por otro lado, tanto la prueba de conocimientos como el TJS presentan


correlaciones de tamaño medio con Autodesarrollo. Este criterio medía el interés por la
formación y la adquisición de conocimientos por lo que cabría considerar el efecto de la
proximidad conceptual entre predictores y constructos. El autodesarrollo podría
vincularse con el aprovechamiento formativo, hipótesis tentativa que podría ser objeto
de estudios posteriores dada la magnitud de la correlación corregida encontrada con la
prueba de conocimientos como predictor, que se aproxima a la encontrada por el meta-
análisis de Dye et al. en 1993 para predecir el aprovechamiento formativo, .47.

Dados los criterios de desempeño de tarea3 empleados además de Tramitación de


expedientes (Atender consultas; Alimentar bases de datos; Comprobar datos; Elaborar
certificaciones), que se corresponden con actividades que requieren un nivel elevado de

3
Subdimensión del desempeño laboral definida por Borman y Motowidlo (1993) como “la pericia con la
que los ocupantes de un puesto realizan actividades formalmente reconocidas como parte de sus
trabajos, actividades que contribuyen al núcleo técnico de la organización bien directamente como
parte de su proceso tecnológico, o indirectamente proveyéndolo con materiales necesarios o servicios”

13
aptitud mental general y razonamiento, cabría apuntar la necesidad de plantear la
presencia de pruebas de aptitudes (Aptitud Mental General; Aptitud verbal; Aptitud
numérica; Rapidez perceptiva, etc.) en procesos selectivos para personal administrativo.
Este tipo de pruebas, que conceptualmente son cercanas a las dimensiones de
desempeño de tarea empleadas, presentan además una validez operativa con tamaño del
efecto alto en términos de Cohen (1988), según el meta-análisis de Whetzel et al. (2011)
con datos de administrativos. La misma lógica se podría aplicar para los criterios de
desempeño contextual 4 (Ayuda y cooperación, iniciativa, Persistencia-Tenacidad,
Autodesarrollo). Dado que la personalidad es el principal determinante de esta
dimensión del desempeño (Borman et al., 2001; Penney y Borman, 2005), cabría
considerar la presencia de este tipo de pruebas en la selección de empleados públicos.

En consecuencia, es recomendable emplear pruebas que supongan realizar tareas


relacionadas con el perfil del puesto, con las tareas y competencias implicadas en el
desempeño del mismo.

En el caso de los directivos públicos, existen diferentes enfoques sobre el perfil a


tener en cuenta, es decir, sobre las conductas o competencias directivas. En los
siguientes párrafos señalamos algunos de los modelos más significativos.

Cabe mencionar la propuesta de Cunningham-Snell y Wigfield (2005), que


partiendo de datos de 62 países identificaron una serie de conductas críticas para el
ejercicio del liderazgo: a) Comunicación; b) Motivar y conformar equipos; c)
Confianza e integridad; d) Planificación y supervisión; e) Resolución de problemas; f)
Autoconciencia y eficacia situacional; g) Conseguir metas.

En nuestro país, Villoria (2008), distingue entre competencias básicas


gerenciales y competencias transversales. En el primer bloque incluye: a) Pensar en
términos estratégicos.; b) Extraer lo mejor de las personas.; c) Aprender a
perfeccionarse.; d) Concentrarse de resultados.; e) Dar dirección y sentido (visión).; f)
Producir impacto personal (dar ejemplo); g) Capacidad de crear y generar redes y
coaliciones para la prestación de los servicios públicos. Entre las competencias
transversales incluye a las siguientes: a) Habilidades interpersonales; b) Comunicación
4
Subdimensión del desempeño laboral definida por Borman y Motowidlo (1993) como “conductas que
mantienen el ambiente organizacional, social y psicológico en el que el núcleo técnico tiene que
funcionar”

14
oral; c) Integridad/Honestidad; d) Comunicación escrita; e) Aprendizaje continuo; f)
Motivación por el servicio público.

Longo (2002), identificó siete competencias: a) Compromiso con la


organización; b) Iniciativa; c) Orientación al servicio; d) Liderazgo; e) Persuasión e
influencia; f) Trabajo en equipo y colaboración; g) Comprensión del entorno político.

Gorriti (2012), indicó una serie de criterios generales a medir en el perfil del
directivo en la selección que, no obstante, debería diseñarse para cada caso. Son los
siguientes: a) Comunicación; b) Organización y Planificación; c) Resolución de
Problemas; d) Iniciativa, impulso; e) Consideración/conciencia de otros; f) Influir a
otros; g) Tolerancia al estrés y la incertidumbre.

3.4. Tipos de herramientas de evaluación del desempeño

Una última cuestión a considerar es el tipo de herramienta de evaluación del


desempeño que se emplee para medir la validez de las pruebas selectivas o, como señala
Gorriti (2012), como posible elemento selectivo para el acceso a puestos directivos.
Habida cuenta de la tendencia de los evaluadores a asignar puntuaciones elevadas, lo
que se conoce como sesgo de benevolencia (Aguinis et al., 2013; Díaz Cabrera et al.,
2014) o a igualar las puntuaciones de los evaluados (Peiró et al., 2012), es decir, sesgo
de tendencia central, puede ser de utilidad emplear cuestionarios de distribuciones
forzadas o comparaciones forzadas que obliguen a los evaluadores a “mojarse” e indicar
claramente quiénes desempeñan mejor o peor el trabajo. En los cuestionarios
convencionales, los evaluadores tienen libertad para poner la misma nota a los
evaluados, lo que hace que frecuentemente el evaluador ponga notas altas para todos sus
evaluados, y ello reduce la variabilidad de la medida de criterio y por tanto el tamaño
del coeficiente de validez.

Esto es algo que hemos comprobado en la investigación realizada en el IVAP


sobre la OPE 2010, en la que el uso de evaluaciones de desempeño con comparaciones
forzadas ha ayudado a elevar el tamaño de la validez operativa de la prueba de
conocimientos desde .24 hasta .45 y la del TJS desde .12 hasta .24, algo que cabía
esperar en base a lo apuntado por Berger, Harbring y Sliwka (2013), que encontraron
que este tipo de evaluación del desempeño contribuía a evitar el sesgo de benevolencia

15
y a discriminar mejor entre los evaluados, algo que aumenta el tamaño de la correlación
(Smith y Smith, 2005). Estos resultados indican que este tipo de instrumentos de
evaluación podría contribuir a combatir algunos de los obstáculos presentes en la
Administración Pública a la hora de introducir una política de evaluación del
desempeño: una cultura que prima la igualdad, la tendencia a evitar el conflicto por
parte de los supervisores o la cercanía entre evaluador y evaluado (Peiró et al., 2012).
Todo lo cual invita a utilizar con más frecuencia este tipo de evaluaciones del
desempeño, ya que los mencionados sesgos pueden estar afectando negativamente a los
valores de validez operativa hallados con instrumentos de evaluación del desempeño
convencionales que hemos reflejado en la Tabla 2.

Tanto con la herramienta de desempeño convencional como con la de


comparaciones forzosas se emplearon escalas de valoración con anclajes conductuales -
en inglés Behaviourally Anchored Rating Scales o BARS- (Smith y Kendall, 1963) que
identifican conductas observables que indican diferentes niveles de ajuste a una
dimensión determinada y permiten estandarizar qué es hacer bien o mal las tareas de un
puesto, y ejemplificar cómo se puede observar dicha estandarización.

4. Iniciativas de mejora en la selección en el sector público

Un problema recurrente en la selección en el ámbito público es la escasez de


pruebas de carácter psicométrico, ya que, por un lado, facilita la labor de academias que
preparan a candidatos a las oposiciones, y por otro, reduce las posibilidades que los
expertos en recursos humanos pueden tener a la hora de aplicar pruebas adecuadas para
perfiles como el del personal directivo.

Además, en el caso concreto de los cuestionarios de personalidad, una crítica


frecuente es que no están libres de sesgos en las respuestas. La personas tienden
presentarse a sí mismas de una manera favorable (deseabilidad social) y algunas
personas tienden más a la aquiescencia, responder de forma afirmativa a las preguntas
del test psicológico sin un previo razonamiento (Barrick y Mount, 2014). Esto hace
necesario perfeccionar la manera en que se controla estos aspectos a la hora de
responder.

16
Por ello, desde el IVAP se ha lanzado una iniciativa, en colaboración con la
Universidad del País Vasco para adaptar al euskara y al castellano pruebas que permitan
la evaluación rigurosa de la personalidad y de competencias dados los perfiles
necesarios en el sector público y que tiene como objetivo poder disponer de más
herramientas psicométricas para la selección y mejorar la eficacia de dichas pruebas en
la selección de empleados públicos estudiando detenidamente su relación con el
desempeño laboral.

Como indica Ramírez Vielma (2013), el desempeño es un constructo


multidimensional, y cabe distinguir cinco grandes dimensiones independientes y
generalizables a distintos puestos y roles presentes en el ámbito laboral: desempeño de
tarea, desempeño contextual, desempeño adaptativo, desempeño proactivo y desempeño
contraproductivo. Sin embargo, el desempeño adaptativo, que se refiere a “conductas de
adaptación o ajuste eficaz ante situaciones cambiantes y/o adquisición de habilidades
para ser competente ante nuevas demandas en el trabajo” ha recibido poca atención en
la literatura científica.

El desempeño adaptativo es un factor determinante en puestos que impliquen el


ejercicio del liderazgo, aunque esta cuestión ha sido poco investigada hasta la fecha por
lo que es necesario profundizar al respecto (Holtkamp, 2014; Tucker y Gunther, 2009).
Por ello, la investigación realizada en el IVAP puede contribuir a mejorar los
conocimientos acerca del rol que juegan estas conductas en el ámbito público, lo que
puede ser relevante para evaluar el desempeño de los directivos públicos.

La relación entre la personalidad y variables relevantes en el ámbito


organizacional, tales como el desempeño laboral constituye un tema de gran interés
tanto a nivel teórico como a nivel práctico. La literatura muestra que los factores de
personalidad son predictores de aspectos importantes para las organizaciones, como el
trabajo en equipo, las conductas contraproductivas, la orientación al cliente, las
conductas cívicas organizacionales (Organizational Citizenship Behaviour, OCB en
inglés), la satisfacción laboral y el compromiso con la organización y la seguridad
laboral (Barrick, Feild y Gatewood, 2011; Barrick y Mount, 2014). No obstante, como
indican Ryan y Ployhart (2014), dada la importancia del desempeño adaptativo en el
entorno laboral actual, resulta sorprendente la escasez de trabajos que estudien su
relación con variables utilizadas en la selección de personal.

17
La relación entre los cinco factores de personalidad y el desempeño adaptativo
ha recibido poca atención en la literatura, siendo el estudio llevado a cabo por
Charbonnier-Voirin (2013), uno de los escasos trabajos que han explorado esta cuestión.
Sus resultados sugieren un efecto diferente de cada factor de personalidad en las
dimensiones de desempeño adaptativo y muestran la importancia de los factores
apertura mental y responsabilidad, aunque, como señalan Pulakos, Mueller-Hanson y
Nelson (2012), se necesita profundizar en mayor medida en la relación entre los factores
de personalidad y las diferentes dimensiones del desempeño adaptativo.

Por otro lado, la relación entre variables sociodemográficas y laborales como la


edad, el género, el tipo de puesto (con o sin mando) o la experiencia laboral y variables
como la personalidad o el desempeño laboral es un aspecto de especial relevancia por
sus implicaciones a nivel de selección, gestión de recursos humanos y evaluación del
desempeño.

En cuanto a las pruebas de personalidad, existe un consenso generalizado sobre


la ausencia de sesgo en función de género o edad (Barrick y Mount, 2014), cuestión
vital para garantizar el cumplimiento del principio de igualdad en el acceso al empleo
público exigido por la legislación.

En lo que se refiere al desempeño adaptativo, tal y como han señalado Jundt,


Shoss y Huang (2015), se han realizado pocos estudios. Un ejemplo sería el de
O’Connell, McNeely y Hall (2008), en el que se encontraron niveles diferentes de
adaptabilidad según el género o el nivel educativo, pero no así en función de la edad. En
la presente investigación se estudiará si hay diferencias significativas entre personas que
ejercen funciones de jefatura y personas que no ejercen dichas funciones en cuanto a
desempeño adaptativo.

Por lo tanto, teniendo en cuenta las investigaciones previas y la necesidad de


contar con más pruebas adaptadas a nuestro contexto, se plantea como objetivo general
de la iniciativa del IVAP proporcionar instrumentos que permitan la evaluación rigurosa
de los factores de personalidad y el desempeño laboral en el ámbito del sector público.
Para responder a este objetivo general, se han establecido cuatro objetivos específicos
inicialmente:

18
 se adaptará a la lengua y cultura castellana el cuestionario de desempeño
adaptativo de Charbonnier-Voirin y Roussel (2012);

 se adaptará a la lengua y cultura vasca la prueba OPERAS (Vigil-Colet y otros,


2013), basada en el modelo Big Five de personalidad y que tiene la
particularidad de haber diseñado un método para controlar los efectos de la
deseabilidad social y la aquiescencia identificando ambos factores para aislar sus
efectos sobre el patrón de respuestas, lo que logra eliminar los efectos de dichos
factores, aumentando el nivel de precisión de la medida de los factores de interés,
los 5 grandes factores de personalidad;

 se analizará la relación de los cinco grandes factores de personalidad con


constructos vinculados con el desempeño laboral (OCBs y desempeño
adaptativo) y el ajuste persona-organización;

 se estudiará la posible relación existente entre tales constructos y un conjunto de


variables sociodemográficas y laborales, diferenciando entre puestos que
implican jefatura de los que no.

La adaptación de los ítems de OPERAS y del cuestionario de Charbonnier y


Roussel se ha llevado a cabo utilizando un diseño de traducción inversa en el que han
participado traductores/as, psicólogos/as expertos/as en pruebas de personalidad y
metodólogos/as. Tras llegar a una versión consensuada traducida y, a partir de ésta, a
una versión retro-traducida consensuada, los integrantes del equipo de traductores
compararon cada uno de los ítems de las versiones original e inversamente adaptadas de
los instrumentos, examinando las posibles no-equivalencias en cuanto al significado.

Posteriormente, se ha verificado la adecuación de los ítems de los cuestionarios a


la población objetivo mediante la aplicación de entrevistas cognitivas (N=10) y
versiones piloto de las pruebas (N = 80). Tras recoger los cuestionarios de la prueba
piloto, se procedió al análisis cuantitativo y cualitativo de los ítems y a la reformulación
de tres ítems en el caso de OPERAS.

Actualmente, tras haber contactado con diversas entidades públicas vascas, más
de 30 han aceptado participar y estamos en la fase de recogida de respuestas por parte
de las personas voluntarias para poder llevar a cabo la validación experimental de los

19
instrumentos mencionados, el estudio de la relación entre las diferentes variables y el
análisis de las diferencias en las puntuaciones medias de las distintas variables en base a
variables sociodemográficas y laborales. Por el momento hemos contado con la
colaboración de más de 400 personas.

Nuestra intención es contar con una muestra de más de 1000 voluntarios que nos
permita, en sucesivas fases y aplicando la misma metodología, adaptar al euskera y al
castellano 6 pruebas más que no estén a disposición de las academias o incluso crear
pruebas diseñadas para medir las competencias más requeridas en el sector público. Por
ello, estamos trabajando en la adaptación al euskara de pruebas como FFPI (Hendriks,
Hofstee y DeRaad, 1999) o la adaptación al castellano de una versión paralela de 6FPQ
(Jackson, Paunonen, & Tremblay, 2000) gracias a la iniciativa International Personality
Item Pool (IPIP).

5. Propuesta de modelo selectivo para directivos públicos

En Europa se observa una tendencia generalizada hacia la selección basada en


competencias (Bélgica, Reino Unido, European Personnel Selection Office en las
instituciones de la Unión Europea), e incluso un país como Francia, cuyo modelo ha
servido de referencia para nuestro sistema selectivo público basado en las pruebas de
conocimientos y la experiencia, empieza a incorporar las competencias (INAP, 2012).
Esta cuestión ha sido planteada desde hace tiempo en España (Peiró et al., 2012; Ramió,
2011; Salgado, 2010; Salgado y Moscoso, 2008) e implicaría emplear pruebas con
coeficientes de validez similares o superiores a los de las pruebas de conocimientos,
como las pruebas de aptitudes o pruebas de personalidad. Ambas pruebas serían
aplicables a muestras amplias de candidatos, si bien tendrían coste económico superior
al de las pruebas de conocimientos. Las entrevistas conductuales estructuradas,
simulaciones y Assessment Centers, procedimientos selectivos que presentan
coeficientes de validez elevados, también se emplean con frecuencia en la selección de
instituciones públicas que operan bajo el modelo de selección por competencias,
especialmente en fases selectivas con volúmenes más reducidos de candidatos ya que se
trata de pruebas costosas en cuanto a su diseño o que requieren un tiempo de aplicación
elevado, por lo que se aplican tras una preselección en base a pruebas de aptitudes

20
(Gorriti, 2010; INAP, 2012; Peiró et al, 2012; Salgado, 2010). Todas estas pruebas
alternativas son evaluadas de manera positiva por los candidatos (Anderson, Salgado y
Hühlsheger, 2010; Moscoso y Salgado, 2004) y comienzan a abrirse paso en nuestro
país desde un enfoque de selección por competencias, como puede comprobarse en el
procedimiento selectivo de entrevistadores internos para la Generalitat de Cataluña (Pla
y Martínez, 2016).

La selección por competencias se basa en la evaluación y valoración de las


personas por cómo hacen las cosas, lo que implica medir patrones conductuales que
permitan la predicción del desempeño laboral por medio de instrumentos rigurosos,
como los Assessment Centers (Generalitat de Catalunya, 2010; Toro, 2016). Una
definición de competencia aceptada universalmente es “repertorio de comportamientos
observables que están causalmente relacionados con una buena o excelente ejecución de
un trabajo concreto en una organización determinada” (Pla y Martínez, 2016).

Los Assessment Centers (AC) son una metodología de evaluación de


competencias identificadas mediante un análisis previo del puesto de trabajo, que
incluyen una serie de ejercicios evaluados por expertos debidamente capacitados y que
implican la simulación de situaciones y circunstancias reales del trabajo que realizarán
los candidatos. Las actividades a realizar en los ejercicios están pensadas para evaluar
dimensiones conductuales específicas que permiten que los candidatos demuestren el
nivel de competencias que poseen en un amplio abanico de situaciones y pruebas donde
se examinan los mismos aspectos del perfil (Cascio y Aguinis, 2011; Lievens y
Thornton, 2005).

Los ACs incluyen ejercicios como las entrevistas, las pruebas situacionales o de
simulación (algunas de tipo grupal, como las dinámicas de grupo, y otras de tipo
individual, como role-playing, estudios de caso, fact find o presentaciones orales) que
contienen información que enfrenta al candidato con situaciones complejas ante las que
debe tomar decisiones, y, en menor medida, cuestionarios o evaluación de referencias
(Generalitat de Catalunya, 2010; Toro, 2016). Las entrevistas y las pruebas
situacionales son válidas para medir las competencias mencionadas en el punto 3.3 y
cumplirían con la mayoría los aspectos considerados en los puntos 2 y 3 de este escrito,
ya que presentan coeficientes de validez medios o altos, son valoradas positivamente
por los candidatos y además ofrecen un elevado grado de similitud entre el contenido de

21
los ejercicios a realizar y el contenido de los puestos a los que se opta. El principal
hándicap de las entrevistas y las pruebas situacionales es que no tienen una gran
sensibilidad, clasificando a los candidatos en tres grupos, por lo que podría ser
recomendable emplear de manera complementaria cuestionarios de personalidad o
aptitudes.

El empleo de ACs sería plenamente compatible con la visión de autores como


Jiménez Asensio (2009), Gorriti (2012), Moreu et al. (2012) o Areses et al. (2017), que
proponen un sistema de selección en dos fases que garantice los principios de mérito,
capacidad e idoneidad exigidos por el RDL 5/2015. En la primera fase de este sistema
un órgano de selección independiente realiza una propuesta motivada de tres candidatos
que hayan acreditado las competencias requeridas mediante la aplicación de
procedimientos selectivos como los mencionados en los párrafos anteriores, y en la
segunda, la autoridad encargada del nombramiento elige al candidato a cubrir el puesto
mediante la libre designación entre los tres candidatos propuestos.

Dicho sistema sería muy similar al implantado en Portugal para la selección de


directivos públicos y gestionado por un órgano independiente, la CReSAP o Comissão
de Recrutamento e Selecção para a Administração Pública (Baz Vicente, 2015). En el
proceso selectivo de la CReSAP los candidatos remiten inicialmente su currículum y
cumplimentan un cuestionario de autoevaluación de las competencias requeridas.
Posteriormente, tras analizar el currículum y el cuestionario, únicamente los seis
candidatos con mejor puntuación pasan a la fase de entrevista, pruebas de competencias
y, en casos especiales, pruebas tipo test. De estos seis candidatos, el jurado de la
CReSAP elabora un informe final con los tres candidatos propuestos que remite al
miembro del Gobierno para que tome la decisión final sobre cuál es el elegido. El hecho
de que se apliquen los procedimientos de selección por competencias a únicamente seis
candidatos agiliza notablemente la selección, y provoca que el plazo de tiempo medio
desde la petición de cobertura de una vacante hasta la entrega de la terna al Gobierno
sea de apenas 35 días.

El planteamiento de la CReSAP se podría aplicar en nuestro entorno siguiendo


las directrices propuestas por Gorriti (2012) con una fase previa que incluyese la
superación de una formación teórico-práctica que garantizase la posesión de los
conocimientos y la pericia en las destrezas necesarias para el desempeño de puestos de

22
dirección pública, así como la evaluación del desempeño laboral previo en el caso de
empleados públicos, lo que requeriría la implantación de dicha evaluación. La
formación podría ser diseñada por los Institutos de Administración Pública y debería
otorgar una puntuación a los formandos.

A esta fase previa le seguiría una fase en la que se emplearían algunas de las
técnicas descritas anteriormente con un número de candidatos que garantice la agilidad
del proceso. La Generalitat (2010) propone el uso de entrevistas, análisis de caso y
presentaciones en la selección de subdirectores, mientras que Gorriti (2012) opta por la
Entrevista Conductual Estructurada y las Pruebas de Simulación o de Diseño de
Proyectos. La primera es una entrevista en la que, tras una identificación de los
comportamientos relevantes del directivo, y mediante el diseño de preguntas de
naturaleza conductual (sólo referidas a hechos contrastables) y anclajes conductuales
(ejemplos de qué significa hacerlo bien, regular y mal), un panel de al menos tres
personas evalúa la experiencia y desempeños de los candidatos. Dicha entrevista se
graba y se calcula el coeficiente por acuerdo entre los miembros del panel para asegurar
la fiabilidad de las medidas. Las segundas se refieren a escenarios donde se simulan
situaciones problemáticas que el candidato a directivo debe resolver. Esto se puede
hacer mediante una resolución real ante el panel o mediante la elaboración escrita de un
proyecto en donde se valora el diagnóstico, el diseño, la implantación y las formas de
evaluación del proyecto propuesto. Ambas pruebas se han aplicado desde hace años en
el Gobierno Vasco con resultados óptimos en cuanto a la validez de la entrevista
(Salgado, Gorriti y Moscoso, 2007). Actualmente se está validando la prueba de diseño
de proyectos.

Un número de candidatos similar al de Portugal –seis aspirantes por puesto-


permitiría ejecutar y corregir en una semana entrevistas, pruebas de simulación,
presentaciones orales de la prueba de simulación realizada e incluso dinámicas de grupo,
que están indicadas para medir interacciones sociales y que se deben realizar idealmente
con entre 4 o 6 candidatos a la vez (Eck, 2007). No obstante, para poder diseñar las
pruebas selectivas de manera ágil sería imprescindible implementar un análisis de
puestos de la organización que permita conocer los pormenores de los puestos concretos
(funciones, tareas, criterios de desempeño...) y poder determinar las conductas asociadas
al cumplimiento excelente de cada competencia a partir de las competencias descritas a

23
evaluar. Con esta información se diseñarían las entrevistas y las pruebas de simulación
así como los criterios de evaluación. Las entrevistas y simulaciones deben ser
específicas para el puesto que se pretende cubrir, por lo que debe construirse de acuerdo
con las tareas, criterios de ejecución, conocimientos y destrezas contenidos en el
Informe de Análisis de Trabajo del puesto. Las dinámicas de grupo pueden diseñarse
para su aplicación a todo tipo de puestos directivos en función de competencias
transversales a este tipo de puestos. En cualquier caso, este planteamiento permitiría
realizar el proceso completo de selección, desde la convocatoria hasta la designación de
la persona seleccionada en el plazo propuesto por Areses et al. (2017), entre 3 y 6 meses.

En cuanto al diseño y la evaluación de estas pruebas, es necesario que los


evaluadores miembros del órgano de selección reciban formación previa sobre dichas
pruebas y sean muy conscientes de las dificultades comunes que se encontrarán en el
proceso para evitar cometer errores (Generalitat de Cataluña, 2010). Las personas
evaluadoras deberán conocer con precisión las cuestiones siguientes:

 Las competencias a evaluar, el nivel de dominio


exigido por el perfil y las evidencias comportamentales que lo identifican.

 Las pruebas a aplicar, el orden en que se llevarán a cabo y las respuestas


esperadas para cada uno de los supuestos.

 Los instrumentos de registro.

 Los criterios de evaluación.

 Los elementos básicos sobre metodología observacional, que compran


entenderá el conocimiento sobre cuáles son los sesgos que pueden interferir
en este proceso con el objetivo de detectarlos, minimizarlos y
evitarlos.

El órgano de selección debería estar compuesto por profesionales de la medida y


la evaluación selectiva que aseguren la fiabilidad y validez de las pruebas, y por
expertos en los criterios de éxito del puesto de directivo convocado que garanticen la
relevancia de las medidas y su contexto para el puesto a seleccionar (Gorriti, 2012).

24
Referencias
Aguinis, Herman, Christine A. Henle y Cheri Ostroff. 2001. “Measurement in work and
organizational psychology”, en Neil Anderson, Deniz. S. Ones, Handan K. Sinangil, y
Chockalingam Viswesvaran (Eds.), Handbook of Industrial, Work and Organizational
Psychology (Vol. 1) (pp. 27-50). London, UK: SAGE
http://dx.doi.org/10.4135/9781848608320.n3
Aldomà, Josep, Xavier Boltaina, Eva Comellas, Manuel Férez, Carolina Gala, Lola Miró,
Adriana Payola y Joaquim Valls. 2011. Disseny d’un model de selecció comú per al
personal de l’Administració de la Generalitat i de les entitats locals de Catalunya.
Barcelona: Escola d'Administració Pública de Catalunya.
Alonso, Pamela, Gabriel Táuriz y Beata Choragwicka. 2009. “Valoraciones de Méritos en la
Administración Pública y la Empresa: Fiabilidad, Validez y Discriminación de Género
Merit Ratings”, Revista de Psicología del Trabajo y de las Organizaciones, 25(3): 245-
258.
Anderson, Neil, Jesús F. Salgado, y Ute R. Hülsheger. 2010. “Applicant Reactions in Selection:
Comprehensive meta-analysis into reaction generalization versus situational specificity”,
International Journal of Selection and Assessment, 18(3): 291-304.
Anderson, Neil, y Carlijn Witvliet. 2008. “Fairness reactions to personnel selection methods:
An international comparison between the Netherlands, the United States, France, Spain,
Portugal, and Singapore”, International Journal of Selection and Assessment, 16(1): 1-
13.
Antón, Pilar. 2014. “¿Quiénes optan a plazas de personal funcionario en los cuerpos subalterno,
auxiliar y administrativo de la Administración General del País Vasco (AGPV) y
quiénes las obtienen?”. Revista Vasca de Gestión de Personas y Organizaciones
Públicas, 6: 8-31.
Areses, Xosé, Carmen Blanco, Pedro Colmenares, Eduardo Fernández, Ana Gallego, Gonzalo
Gómez de Villalobos, Sancho Íñiguez, Mª Luz Labrada, Clara Mapelli, Israel Pastor,
Jorge Souto. 2017. Nuevos tiempos para la función pública: Propuestas para atraer y
desarrollar el talento en la Administración General del Estado. Madrid: INAP.
Azen, Razia y David V. Budescu. 2003. “The dominance analysis approach for comparing
predictors in multiple regression”, Psychological Methods, 8: 129–148.
Barrick, Murray R., Hubert S. Feild y Robert Gatewood. 2011. “The process of personality
assessment”, en Murray. R. Barrick, Hubert. S. Feild, y Robert Gatewood, (Eds.)
Selection in Human Resource Management, 7ª Ed. (pp. 451-475). Mason, OH, US:
South-Western Cengage Learning.
Barrick, Murray. R., y Michael K. Mount. 2014. “Nature and use of personality in selection”,
en Neal Schmitt (Ed.), The Oxford handbook of personnel assessment and selection. (pp.
225-251). New York, NY, US: Oxford University Press.
Baz Vicente, Ruben. 2015. “La selección de los directivos públicos en atención al mérito
profesional. Algunas enseñanzas de Portugal”, Gestión y Análisis de Políticas Públicas,
14: 72-83.
Berger, Johannes, Christine Harbring y Dirk Sliwka. 2013. “Performance appraisals and the
impact of forced distribution-An axperimental Iinvestigation”, Management Science,
59(1), 54-68.
Berges, Alfredo. 2011. “Validación de procedimientos de selección de policías locales”,
Anuario de Psicología Jurídica, 21: 83-96.
Binning, John. F. y Gerald V. Barrett. 1989. “Validity of personnel decisions: A conceptual
analysis of the inferential and evidential bases”, Journal of Applied Psychology, 74:
478–494.

25
Borman, Walter C. y Stephan J. Motowidlo. 1993. “Expanding the criterion domain to include
elements of contextual performance”, en Neal Schmitt, y Walter C. Borman (Eds.),
Personnel selection in organizations (pp. 71-98). San Francisco, CA: Jossey-Bass.
Borman, Walter C., Louis A. Penner, Tammy D. Allen y Stephan J. Motowidlo. 2001.
“Personality predictors of citizenship performance”, International Journal of Selection
and Assessment, 9(1-2), 52-69.
Cascio, Wayne F y Herman Aguinis. 2011. Applied Psychology in Human Resource
Management. 7th Ed. Prentice Hall.
Charbonnier-Voirin, Audrey. 2013. « L'influence des traits de personnalité sur les composantes
de la performance adaptative des salariés », Revue de gestion des ressources humaines,
88 (2) : 17-32.
Charbonnier-Voirin, Audrey y Patrice Roussel. 2012. « Adaptive performance: a new scale to
measure individual performance in organizations », Canadian Journal of Administrative
Sciences, 29 (3): 280-293.
Cohen, Jacob. 1988. Statistical Power Analysis for the Behavioral Sciences. N.J.: LEA.
Colquitt, Jason. A., Donald E. Conlon, Michael J. Wesson, Christopher O. Porter, y K. Yee Ng.
2001. “Justice at the millennium: a meta-analytic review of 25 years of organizational
justice research”, Journal of applied psychology, 86(3): 425-445.
Cunningham-Snell, Nicole y David Wigfield. 2005. “Selection of Leaders in Global
Organizations”. En Arne Evers, Neil Anderson y Olga Smit-Voskuijl (Eds.), The
Blackwell handbook of personnel selection (Vol. 1). John Wiley & Sons.
Díaz Cabrera, Dolores, Estefanía Hernández, Rosa Isla, Naira Delgado, Luis Díaz y Christian
Rosales. (2014). “Factores relevantes para aumentar la precisión, la viabilidad y el éxito
de los sistemas de evaluación del desempeño laboral”, Papeles del psicólogo, 35(2),
115-121:
Dye, David A., Martin Reck, y Michael A. McDaniel. 1993. ”The validity of job knowledge
measures”, International Journal of Selection and Assessment, 1(3), 153-157.
Eck, Claus D., Hans Jöri y Marlène Vogt. 2007. Assessment-Center. Heidelberg: Springer.
Generalitat de Catalunya (2010). Guia per a l’avaluació de competències dels càrrecs de
comandament de la Generalitat de Catalunya. Barcelona: Escola d’Administració
Pública de Catalunya.
Gilliland, Stephen W. 1994. “Effects of procedural and distributive justice reactions to a
selection system”, Journal of Applied Psychology, 79: 691–701.
Gorriti, Mikel. 2010. Modelo de proceso selectivo por grupos de clasificación en la
Administración pública. Barcelona: CEMICAL.
Gorriti, Mikel. 2012. "Los directivos públicos profesionales (DPP) en la AGE (origen,
ubicación, funciones, perfil, profesionalización y cambio)", en Luis Ortega Álvarez y
Luis F. Maeso Seco (Coords.), La alta dirección pública: análisis y propuestas (pp. 47-
71). Madrid: INAP.
Gorriti, Mikel y Joseba López Basterra. 2010. Análisis de puestos en la Administración
Pública. Oñati: IVAP.
Gorriti, Mikel y Joseba López Basterra. 2014. Guía para la validación de sistemas de acceso a
la Función Pública. Oñati: IVAP.
Hausknecht, John P., David V. Day y Scott C. Thomas. 2004. “Applicant reactions to selection
procedures: An updated model and meta-analysis”, Personnel Psychology, 57(3): 639-
683.
Hendriks, A.A. Jolijn, Willem K. B. Hofstee y BoeleDe Raad. 1999. “The Five-Factor
[nventory (FFPÍ)”, Personality and Individual Differences, 27: 301 -325.
Hernández, Roberto, Carlos Fernández y Pilar Baptista. 2010. Metodología de Investigación. 5ª
ed. México D.F.: McGraw Hill.

26
Holtkamp, Mark. 2014. Leadership skills and the role of adaptability and creativity in effective
leadership: A literature review geared toward an integrative model. BS thesis.
University of Twente.
INAP 2012. Modelos comparados de selección de empleados públicos. Recuperado de
http://bci.inap.es/alfresco_file/30309fad-762b-43f4-8c87-9c0877de629b .
Jackson, Douglas N., Sampo V. Paunonen y Paul F. Tremblay. 2000. Six Factor Personality
Questionnaire manual. Port Huron, MI: Sigma Assessment Systems.
Jiménez Asensio, Rafael. 2009. El personal directivo de la Administración Local. Estudios de
Relaciones Laborales. Barcelona: Diputación de Barcelona.
Johnson, Jeff W., y James M. LeBreton. 2004. “History and use of relative importance indices
in organizational research”, Organizational Research Methods, 7(3): 238-257.
Jundt, Dustin K., Mindy K. Shoss y Jason L. Huang. 2015. “Individual adaptive performance in
organizations: A review”, Journal of Organizational Behavior, 36 (S1): S53-S71.

Lievens, Filip, Tine Buyse y Paul R. Sackett. 2005. “The operational validity of a video-based
situational judgment test for medical college admissions: illustrating the importance of
matching predictor and criterion construct domains”. Journal of Applied Psychology,
90(3), 442-452.
Lievens, Filip y George C. Thornton III. 2005. “Assessment centers: recent developments in
practice and research”, en Arne Evers, Olga Smit-Voskuijl, y Neil Anderson (Eds.)
Handbook of Selection (pp. 243-264). Blackwell Publishing.
Longo, Francisco. 2002. “El desarrollo de competencias directivas en los sistemas públicos:
una prioridad del fortalecimiento institucional”, Ponencia presentada en el VII Congreso
del CLAD, Lisboa, 2002.
McCarthy, Julie. M., Chad H. Van Iddekinge, Filip Lievens, Mei-Chuan Kung, Evan F. Sinar y
Michael A. Campion, M. 2013. “Do Candidate Reactions Relate to Job Performance or
Affect Criterion-Related Validity? A Multistudy Investigation of Relations Among
Reactions, Selection Test Scores, and Job Performance”, Journal of Applied
Psychology, 98 (5): 701-719. doi: 10.1037/a0034089
Moreu, Elisa, José Luis Bermejo, Víctor Escartín, Miguel Ángel Bernal y Carmen De Guerrero.
2012. "La funció directiva", Revista catalana de dret públic 45: 76-93.
Moscoso, Silvia y Salgado, Jesús F. 2004. “Fairness reactions to personnel selection techniques
in Spain and Portugal”, International Journal of Selection and Assessment, 12(1-2):
187-196.
Nathans, Laura L., Frederick L. Oswald y Kim Nimon 2012. “Interpreting multiple linear
regression: A guidebook of variable importance”, Practical Assessment, Research &
Evaluation, 17(9): 1-19.
O'Connell, David J., Eileen McNeely, y Douglas T. Hall. 2008. “Unpacking personality
adaptability at work”, Journal of Leadership &Organizational Studies, 14: 248–259.
Parada, Ramón y Jesús Fuentetaja. 2014. Derecho de la Función Pública. Madrid: OPEN
Ediciones Universitarias.
Patterson, Fiona, Filip Lievens, Máire Kerrin, Lara Zibarras y Bernd Carette. 2012. “Designing
Selection Systems for Medicine: The importance of balancing predictive and political
validity in high-stakes selection contexts”, International Journal of Selection and
Assessment, 20(4): 486-496.
Patterson, Fiona y Lara Zibarras. 2011. “Exploring the construct of perceived job
discrimination in selection”, International Journal of Selection and Assessment, 19(3):
251-257.
Peiró, José María, José Ramos y José Vicente Cortés. 2012. Productividad y gestión de
recursos humanos en las Administraciones Públicas. Madrid: Funcas.

27
Penney, Lisa M. y Walter C. Borman. 2005. “The prediction of contextual performance”. En
Arne Evers, Neil Anderson y Olga Voskuijl (Eds). The Blackwell Handbook of
Personnel Selection (pp. 376-396). London: Blackwell.
Pla Rius, Eulalia y Silvia Martínez Simón. 2016. “Un paso más hacia la evaluación de
competencias profesionales en los procesos de selección de la Administración pública
catalana: entrevistadores internos”. Ponencia presentada en el VII Congreso
Internacional en Gobierno, Administración y Políticas Públicas GIGAPP 2016.
Ramió, Carles. 2011. “Estrategias para la modernización del acceso a la función pública”,
Nuevas Políticas Públicas: Anuario multidisciplinar para la modernización de las
Administraciones Públicas, 7: 129-144.
Pulakos, Elaine D., Rose A. Mueller-Hanson y Johnathan K. Nelson. 2012. “Adaptive
performance and trainability as criteria in selection research”, en Neal Schmitt (Ed.),
Oxford Handbook of Personnel Assessment and Selection (pp. 595-613). Oxford:
Oxford University Press.
Ramírez Vielma, Raúl Gonzalo. 2013. Diseño Del Trabajo Y Desempeño Laboral Individual.
Tesis Doctoral. Madrid: Universidad Autónoma de Madrid.
Rodríguez, Alexander. 2016. “Validez predictiva e impacto adverso de la entrevista conductual
estructurada en el sector público”, Revista de Psicología del Trabajo y de las
Organizaciones, 32, 2: 75-85.
Rogelberg, Steven G. (Ed.). 2007. Encyclopedia of industrial and organizational psychology.
London: Sage Publications.
Ryan, Ann M. y Robert E. Ployhart. 2000. “Applicants’ perceptions of selection procedures and
decisions: A critical review and agenda for the future”, Journal of Management, 26(3):
565-606.
Ryan, Ann M. y Robert E. Ployhart. 2014. “A century of selection”, Annual review of
psychology, 65: 693-717.
Sáez, Javier. 2007. “Diseño y validación de una entrevista conductual estructurada para la
selección de agentes de policía local”, Revista de Psicología del Trabajo y de las
Organizaciones, 23: 151-178.
Salgado, Jesús F. 2010. Selección de recursos humanos por competencias en las
Administraciones públicas: evidencias basadas en la investigación. Barcelona:
CEMICAL.
Salgado, Jesús F., Mikel Gorriti y Silvia Moscoso. 2007. “La entrevista estructurada y el
desempeño laboral en la administración pública española: propiedades psicométricas y
reacciones de justicia”, Revista de Psicología del Trabajo y de las Organizaciones, 23:
151-178.
Salgado, Jesús F. y Silvia Moscoso. 2008. “Selección de personal en la empresa y las AAPP: de
la visión tradicional a la visión estratégica”, Papeles del Psicólogo, 29(1): 16-24.
Schmidt, Frank L., In‐Sue Oh, y Jonathan A. Shaffer, 2016. "The Validity and Utility of
Selection Methods in Personnel Psychology: Practical and Theoretical Implications of
100 Years of Research Findings”, Fox School of Business Research Paper. Available at
SSRN: https://ssrn.com/abstract=2853669
Smith, Patricia Cain y Lorne M. Kendall, 1963. "Retranslation of expectations: An approach to
the construction of unambiguous anchors for rating scales", Journal of applied
psychology 47.2 (1963): 149-155.
Smith, Mike y Pam Smith. 2005. Testing people at work: Competencies in Psychometric
Testing. Malden, MA.: Wiley-Blackwell.
Smither, James W., Richard R. Reilly, Roger E. Millsap, Kenneth Pearlman y Ronald W.
Stoffey. 1993. “Applicant reactions to selection procedures”, Personnel psychology,
46(1): 49-76.

28
Tauriz, Gabriel. 2014. “Selección de empleados públicos y oposiciones: ¿qué nos dice la
evidencia?”. Recuperado de http://politikon.es/2014/11/19/seleccion-de-empleados-
publicos-y-oposiciones-que-nos-dice-la-evidencia/
Tett, Robert P. y Neil D. Christiansen. 2007. "Personality tests at the crossroads: A response to
Morgeson, Campion, Dipboye, Hollenbeck, Murphy, and Schmitt (2007)." Personnel
Psychology 60, 4: 967-993.
Toro Álvarez, Fernando. 2016. "Criterios para la Conformación de un Servicio de Assessment
Center para el Desarrollo Gerencial”, Revista Interamericana de Psicología
Ocupacional 33.2: 145-159.
Truxillo, Donald M., Talya N. Bauer, Michael A. Campion y Matthew E. Paronto. 2002.
“Selection fairness information and applicant reactions: A longitudinal field study”,
Journal of Applied Psychology, 87: 1020–1031. doi:10.1037/0021-9010.87.6.1020
Truxillo, Donald M., Dirk D. Steiner y Stephen W. Gilliland. 2004. “The importance of
organizational justice in personnel selection: Defining when selection fairness really
matters”, International Journal of Selection and Assessment, 12: 39–53.
Tucker, Jennifer S., y Katie M. Gunther. 2009. "The application of a model of adaptive
performance to Army leader behaviors", Military Psychology, 21.3: 315-333.
Van Iddekinge, Chad H., y Robert E. Ployhart. 2008. “Developments in the criterion‐related
validation of selection procedures: a critical review and recommendations for practice”,
Personnel Psychology, 61(4): 871-925.
Vigil-Colet, Andreu, Fabia Morales-Vives, Elisa Camps, Jordi Tous-Pallarès y Urbano
Lorenzo-Seva. 2013. “Development and validation of the Overall Personality
Assessment Scale (OPERAS)”, Psicothema, 25 (1): 100-106.
Villoria Mendieta, Manuel. 2008. “La función directiva profesional”, Documento de trabajo de
la Comisión de la Junta de Castilla-La Mancha.
Whetzel, Deborah. L., Rodney A. McCloy, Amy Hooper, Teresa L. Russell, Shonna D. Waters,
Wanda J. Campbell y Robert A. Ramos. 2011. “Meta-Analysis of Clerical Performance
Predictors: Still stable after all these years”, International Journal of Selection and
Assessment, 19(1): 41-50.

29

Vous aimerez peut-être aussi