Vous êtes sur la page 1sur 11

Taller 2.

1. Definir el concepto de validez


R/.
Es cuando se aplica a una prueba se refiere a un juicio concerniente a lo bien que
mide de hecho una prueba lo que pretende medir. De manera ms especfica, es
un juicio basado en evidencia sobre lo aprobado de las inferencias extradas de
las puntuaciones de prueba.
2. Diferenciar los conceptos de validez y validacin en la medicin
R/.
La validez es dada o ms conocida como un trmino aceptable o dbil
reflejando un juicio en lo adecuado que est emitiendo en realidad el atributo para
cuya medicin estaba diseada la prueba.
Validacin es el proceso de recopilacin de la evidencia de validez. Tanto quien
elabora la prueba como el administrador de la misma pueden desempear una
funcin en la validacin de una prueba para un propsito especfico. Es
responsabilidad del elaborador de la prueba suministrar evidencia de la validez en
el manual de la misma.

3. Explicar el concepto de validez aparente y ejemplificar


R/.
Juicio concerniente a los relevantes que parecen ser los reactivos de la prueba.
Permite establecer la validez de una prueba a partir de la opinin intuitiva de
individuos, incluso no expertos, alumnos, administradores de la prueba, etc.-,
sobre ella.

Su objetivo es medir cun representativo es un proyecto de

investigacin "en apariencia" y si parece ser un buen proyecto o no.

Ejemplo: imagina un artculo de investigacin sobre el Calentamiento Global. Una


persona comn puede leerlo y pensar que se trata de un experimento fuerte que
destaca

los

procesos

detrs

del

Calentamiento

Global.

Por el contrario, un profesor de climatologa distinguido podra leerlo y considerar


que el artculo y el razonamiento detrs de las tcnicas son muy precarios.

4. Explicar el concepto de validez de contenido y ejemplifique y explicar


la cuantificacin de validez de contenido.
R/.
La validez de contenido describe un juicio concerniente a lo adecuado del
muestreo que hace una prueba del comportamiento representativo del universo
del comportamiento del que la prueba estaba diseada para tomar una muestra.
La validez de contenido se utiliza principalmente con test de rendimiento, y
especialmente con los test educativos y test referidos al criterio. En este tipo de
test se trata de comprobar los conocimientos respecto a una materia o un curso.
La validez de contenido descansa generalmente en el juicio de expertos (mtodos
de juicio). Se define como el grado en que los tems que componen el test
representan el contenido que el test trata de evaluar. Por tanto, la validez de
contenido se basa en (a) la definicin precisa del dominio y (b) en el juicio sobre el
grado de suficiencia con que ese dominio se evala.
Por ejemplo, una prueba de educacin con una fuerte validez de contenido incluir
los temas realmente enseados a los estudiantes, en lugar de hacer preguntas sin
relacin. Una escuela quiere contratar a un nuevo profesor de ciencias y un panel
de directores comienza a analizar a los distintos candidatos. Elaboran una lista
acotada y luego disean una prueba, donde escogen al candidato con la mejor
puntuacin. Lamentablemente, ste demuestra ser un maestro de ciencias
extremadamente mediocre.

La cuantificacin de la validez de contenido tiene relevancia ya que uno de estos


mtodos de contenido fue hecho por Lawshe (1975), quien propuso una frmula
simple para cuantificar el grado de consenso pidiendo a un grupo de expertos que
puedan determinar la validez de contenido de una prueba.

5. Cmo influye la cultura en la validacin de una prueba?


R/.
La influencia de la cultura en lo que ensea a los estudiantes, al igual que aspecto
de construccin, calificacin, interpretacin y validacin de pruebas. La influencia
de la cultura se extiende por tanto a juicios concernientes a la validez de las
pruebas y reactivos de pruebas.
Lo que se considera una prueba de historia vlida en un saln de clases no ser
considerada as en otro. Es ms, las interpretaciones hechas con base en las
respuestas de quin responde las pruebas variarn como funcin de la cultura en
la que se encuentre el individuo.

6.

Qu se entiende por criterio de medicin, cules son sus


caractersticas? y ejemplifique.

R/.
La validez de criterio evala si una prueba refleja un cierto conjunto de habilidades
o no. Para medir el criterio de validez de una prueba, los investigadores deben
compararlo con un estndar conocido o con l mismo. Una de las formas ms
sencillas de evaluar la validez relacionada con el criterio es compararla con un
estndar conocido.
Comparar la prueba con una medida establecida recibe el nombre de validez
concurrente; probarla durante un perodo de tiempo se denomina validez

predictiva. No es necesario utilizar ambos mtodos. Uno es suficiente si el diseo


experimental es fuerte.
Para los investigadores de mercado, la validez de criterio es crucial y puede crear
o destruir un producto.
EJEMPLO DE LA VIDA REAL: Cuando Coca-Cola decidi cambiar el sabor de
su bebida distintiva. Con diligencia, investigaron si a la gente le gustaba el nuevo
sabor por medio de pruebas de sabor y cuestionarios. A la gente le encant el
nuevo sabor, entonces Coca-Cola se apur a comenzar con la produccin de la
Nueva Coca, lo que fue un fracaso enorme. El error que Coca cometi fue que se
olvid de la validez de criterio y omiti una pregunta importante en la encuesta. No
se les pregunt a las personas si preferan el nuevo sabor al antiguo, un fracaso
en establecer la validez concurrente. La Vieja Coca, conocida por su popularidad,
era el punto de referencia perfecto, pero nunca fue utilizado. Con una simple
prueba de sabor, vendndoles los ojos a las personas y preguntndoles cul sabor
de los dos preferan, Coca-Cola se habra ahorrado millones de dlares. En ltima
instancia, la validez predictiva tambin fue mediocre, porque sus resultados
buenos no se correlacionaron con las ventas bajas. Para entonces, ya era
demasiado tarde!

7. En qu consiste la validez concurrente?


R/.
La validez concurrente mide qu tan bien una prueba determinada se correlaciona
con una medida reconocida previamente. Las pruebas son para los mismos
constructos o algunos estrechamente relacionados y permiten que un investigador
valide mtodos nuevos contra un incondicional ya examinado y probado. Por
ejemplo, una nueva prueba de inteligencia podra ser comparada estadsticamente
con una prueba de CI estndar.

8. Qu se entiende por validez predictiva y como se explica el


coeficiente de validez incremental?
R/.
La validez predictiva implica probar a un grupo de sujetos para un determinado
constructo y luego compararlos con los resultados obtenidos en algn momento
posterior. El uso ms comn de la validez predictiva es inherente al proceso de
seleccin de estudiantes para la universidad. La mayora de las universidades
utiliza un promedio de calificaciones de la escuela secundaria para decidir qu
estudiantes aceptar, para encontrar a los estudiantes ms brillantes y estudiosos.
En este proceso, la hiptesis bsica es que un alumno secundario con un
promedio de calificaciones alto tendr calificaciones altas en la universidad.
El coeficiente de validez es un coeficiente de correlacin que proporciona una
media de la relacin entre las puntuaciones de prueba y las puntuaciones en la
medida criterio. Para este caso la correlacin seria que un investigador toma las
calificaciones obtenidas despus del primer ao de estudios y las compara con los
promedios de calificaciones de la escuela secundaria. Una correlacin alta indica
que el proceso de seleccin funcion a la perfeccin, mientras que una correlacin
baja significa que hay algo mal en el enfoque. La mayora de los estudios muestra
que existe una correlacin fuerte entre las dos y la validez predictiva del mtodo
es elevada, aunque no perfecta. Intuitivamente, esto parece lgico: estudiantes
que antes eran excelentes pueden extraar su casa o pasar el primer ao
bebiendo cerveza. Por otro lado, estudiantes a los que antes no les iba bien, ahora
pueden ser estudiosos y esforzarse mucho porque se sienten cmodos con la
libertad del ambiente universitario.

9. En qu consiste la teora de las decisiones y utilidad de las pruebas?


R/.
El concepto de utilidad en la teora de la decisin. Una caracterstica de la teora
de la decisin es que las pruebas se evalan en trminos de su eficacia en una
situacin particular. La evaluacin no solo toma en consideracin la validez de la
prueba para predecir un criterio particular, sino tambin otros parmetros, como la
tasa base y razn de seleccin. Otro parmetro importante es la relativa utilidad de
los resultados esperados, lo favorable o desfavorable de los esperados resultados.
La falta de sistemas adecuados para asignar valores de los resultados en trminos
de una escala uniforme de utilidad ha sido uno de los principales obstculos a la
teora de la decisin.

10. Explicar el concepto de validez de constructo y cules son las


evidencias de la validez de constructo y como se evidencia la validez
de constructo y que se entiende por homogeneidad, evidencia de
cambios con la edad.
R/.
La validez de constructo define si una prueba o experimento est a la altura de sus
pretensiones o no. Se refiere a si la definicin operacional de una variable refleja
realmente el significado terico verdadero de un concepto. Se refiere a si una
escala o prueba mide el constructo correctamente. La forma ms sencilla de
pensar en ella es como una prueba de generalizacin, como la validez externa,
pero evala si el experimento se ocupa de la variable que ests probando. Por
ejemplo, tal vez quieras analizar si un programa educativo aumenta la capacidad
artstica de los nios en edad preescolar. La validez de constructo es una medida
sobre si tu investigacin realmente mide la capacidad artstica, una calificacin un
poco abstracta.

Se puede evidenciar la validez de un constructor por medio de un estudio de


intervencin, donde se prueba un grupo con puntuaciones bajas en el constructo,
se le ensea el constructo y se vuelve a medir. Si existe una diferencia significativa
entre la prueba anterior y la posterior, analizadas generalmente con pruebas
estadsticas simples, esto demuestra una buena validez de constructo.
Establecer una buena validez de constructo es cuestin de experiencia y juicio, de
construir la mayor cantidad de pruebas de apoyo como sea posible. Se utiliza toda
una serie de coeficientes y herramientas estadsticas para demostrar una fuerte
validez de constructo y los investigadores continan hasta que sienten que han
encontrado el equilibrio entre probar la validez y la practicidad.

11. En qu consiste la evidencia de pre pruebas, pos pruebas, evidencias


de grupos distintos, evidencia convergente, evidencia discriminante y
anlisis factoriales.
R/.
La evidencia de pre pruebas y pos pruebas que muestra que las puntuaciones de
las pruebas cambian como resultado de alguna experiencia entre una pre prueba y
una pos prueba puede ser evidencia de validez de constructo. Algunas de las
experiencias intermedias ms comunes responsables de los cambios en la
puntuacin de la prueba son la educacin formal, un proceso de psicoterapia o la
administracin de medicamentos y la experiencia en el trabajo. Por supuesto,
dependiendo del constructo que se est midiendo, podra parecerse que casi
cualquier experiencia que intervenga en la vida producir cambios en la
puntuacin del pre prueba al pos prueba.
La evidencia de grupos distintos tambin conocido como el mtodo de grupo
contrastados, una forma de proporcionar evidencia de la validez de una prueba es
demostrar que las puntuaciones en la prueba varan en una forma predecible
como una funcin de la pertenencia de algn grupo. El razonamiento aqu es que

si una prueba es una medida valida de un constructo particular, entonces las


puntuaciones de la prueba de grupos de personas que se supone que difieren con
respecto

ese

constructo

tendran

puntuaciones

de

pruebas

correspondientemente diferentes.
La evidencia de convergencia para la validez de constructo de una prueba
particular puede provenir de diversas fuentes, en otras pruebas o medidas
diseadas para evaluar el mismo constructo (o uno similar). Por tanto, si las
puntuaciones en la prueba sometida a validacin de constructo tienden a
correlacionarse altamente en la direccin predicha con las puntuaciones en
pruebas anteriores, ms establecidas y ya validas diseadas para medir el mismo
constructo (uno similar), este sera un ejemplo de evidencia convergente.
La evidencia discriminante un coeficiente de validez que muestra poca relacin
(estadsticamente significante) entre puntuaciones de pruebas u otras variables
con las que las puntuaciones de las pruebas que est sometido a validez de
constructo no debera correlacionarse desde el punto de vista terico
proporcionar evidencia discriminativa de la validez de un constructo (tambin
conocida como validez discriminativa).
Anlisis factorial. La evidencia convergente discriminativa de la validez de
constructo puede obtenerse por medio del uso del anlisis factorial. Es un trmino
abreviado en singular que es usado para describir una clase de procedimientos
matemticos que estn diseados para identificar factores o variables especficas
que comnmente son atributos, caractersticas o dimensiones en las pueden diferir
las personas, es empleado con frecuencia como un mtodo de reduccin de datos
en que son analizados varios conjuntos de puntuaciones y correlaciones entre
ellos.

12. Qu se entiende por validez y sesgos de las pruebas?

R/.
Puede definirse como el grado de precisin que una medicin ofrece; para ser
fiable, una escala debe tener la capacidad de exhibir resultados consistentes en
mediciones sucesivas del mismo fenmeno. Puede determinarse mediante un
coeficiente de confiabilidad, el cual corresponde a un ndice, que bajo la forma de
proporcin, da cuenta de la razn entre la varianza de la puntuacin verdadera de
la escala y la varianza total. Tiene como objetivo determinar, probabilsticamente,
el grado de variacin atribuible a errores aleatorios o causales no vinculados a la
construccin del instrumento. Garantiza la consistencia expresada en la
determinacin del grado de error contenido en la aplicacin de una escala, y por
tanto, en la medicin del fenmeno. El error puede ser entendido como el
componente de la puntuacin observada en la medicin que no se relaciona con la
capacidad que posee quien la responde.asi pues se determina la fiabilidad de las
puntuaciones obtenidas a travs de una sola administracin del test. Generaliza
las puntuaciones respecto de un dominio o conjunto de tems y observar si los
sujetos responden consistentemente a lo largo del conjunto de tems utilizados.
Estos procedimientos operan considerando las correlaciones entre diversas partes
del test, para lo cual existen dos caminos, la divisin en dos mitades y
la consideracin del universo de tems.

Sesgos en la evaluacin de pruebas diagnsticas


Los ms frecuentes en este tipo de estudio son:

Sesgo de confirmacin diagnstica al limitar el estudio a los pacientes a


quienes se les hizo en su da el "gold standard" que suelen ser los que ms
probablemente tengan la enfermedad, por tanto las pruebas positivas estn
sobre-representadas (sobreestimacin de la sensibilidad) y las negativas
infra-representadas (infraestimacin de la especificidad). Frecuentemente es
imposible evitarlo por razones ticas. Hay tcnicas matemticas complejas
para controlarlo.

Sesgo de interpretacin de las pruebas si no se hacen independientemente.

Sesgo debido a resultados no interpretables de la prueba problema si dicho


problema no tiene la misma frecuencia en ambos grupos.

Ausencia de gold standard definitivo.

Condiciones de generalizacin

Espectro de la enfermedad ("Case mix") Una prueba puede tener distintos


grados de exactitud para diferentes grados de severidad de la enfermedad.
Deben siempre comunicarse las caractersticas clnicas de los pacientes
incluidos en el estudio.

Variabilidad interobservador: Todas las pruebas (unas ms que otras)


TOMADO DE: http://www.hrc.es/bioest/roc_3.htmlrequieren cierto grado de pericia en su realizacin e interpretacin. Dos
observadores pueden ser igualmente exactos pero ser uno ms sensible o
especfico que otro, en otras palabras operar con la misma curva ROC pero
en puntos distintos o pueden tener distinta exactitud (operar en la misma
prueba con distinta curva ROC).

TALLER 2

MARA ALEJANDRA GARZN VALVERDE.


QUINTO SEMESTRE.
GRUPO: A

MNICA DOMNGUEZ
PSICOMETRA
SEPTIEMBRE 22

CORPORACIN UNIVERSITARIA DEL CARIBE. CECAR


FACULTAD DE HUMANIDADES.
PSICOLOGA
SINCELEJO SUCRE.
2014.

Vous aimerez peut-être aussi