Vous êtes sur la page 1sur 331

Pablo Cazau Estadstica y metodologa de la investigacin

Presentacin Captulo 1: Introduccin a la estadstica Captulo 2: Estadstica descriptiva Captulo 3: Probabilidad y curva normal Captulo 4: Correlacin y regresin Captulo 5: Estadstica inferencial Captulo 6: Investigacin e investigacin cientfica Captulo 7: Tipos de investigacin cientfica Captulo 8: Causalidad y experimento Captulo 9: Las etapas de la investigacin tpica Captulo 10: Problema, bibliografa, teora y objetivos Captulo 11: Hiptesis y variables Captulo 12: Tcnicas de muestreo e instrumentos de medicin Captulo 13: El diseo de investigacin Captulo 14: El procesamiento de los datos Captulo 15: Redaccin y publicacin de los resultados Captulo 16: Investigaciones especiales Referencias bibliogrficas de estadstica Otras fuentes consultadas para estadstica Referencias bibliogrficas de metodologa Anexos de estadstica Anexos de metodologa

LA FORMA DE CITAR LA PRESENTE BIBLIOGRAFA ES LA SIGUIENTE: Cazau Pablo (2011), Estadstica y metodologa de la investigacin. Buenos Aires: Biblioteca Redpsicologa.
Buenos Aires, Junio 2011. Ms informes: pcazau@gmail.com
INDICE GENERAL Presentacin CAPTULO 1: INTRODUCCIN A LA ESTADSTICA 1.1 1.2 1.3 1.4 1.5 Definicin y utilidad de la estadstica Clasificaciones de la estadstica Poblacin y muestra Estructura del dato La medicin

CAPTULO 2: ESTADSTICA DESCRIPTIVA 2.1 Generalidades 2.2 Ordenamiento y agrupacin de los datos: matrices y tablas 2.3 Visualizacin de los datos: grficos 2.4 Sntesis de los datos: medidas estadsticas de posicin 2.5 Sntesis de los datos: medidas estadsticas de dispersin 2.6 Sntesis de los datos: asimetra y curtosis Notas CAPTULO 3: PROBABILIDAD Y CURVA NORMAL 3.1 El concepto de probabilidad 3.2 Anlisis combinatorio 3.3 Definicin y caractersticas de la curva normal 3.4 Puntajes brutos y puntajes estandarizados 3.5 Aplicaciones de la curva normal Notas CAPTULO 4: CORRELACIN Y REGRESIN 4.1 4.2 4.3 4.4 4.5 4.6 4.7 Introduccin El anlisis de correlacin Clculo grfico de la correlacin Clculo analtico de la correlacin Un ejemplo: construccin y validacin de tests El anlisis de regresin Clculo analtico de la regresin

4.8 Clculo grfico de la correlacin Notas CAPTULO 5: ESTADSTICA INFERENCIAL 5.1 Introduccin 5.2 Estimacin de parmetros 5.3 Prueba de hiptesis 5.4 Ejemplos de pruebas de hiptesis 5.5 El concepto de significacin estadstica Notas CAPTULO 6: INVESTIGACIN E INVESTIGACIN CIENTFICA 1. 2. 3. 4. 5. 6. QU ES INVESTIGACIN TIPOS DE INVESTIGACIN LA INVESTIGACIN CIENTFICA EL MTODO EN LA INVESTIGACIN CIENTFICA EL ENCUADRE EN LA INVESTIGACIN CIENTFICA LA FORMACIN DEL INVESTIGADOR CIENTFICO

CAPTULO 7: TIPOS DE INVESTIGACIN CIENTFICA 1. INVESTIGACIN PURA, APLICADA Y PROFESIONAL Bases cientficas de la investigacin Investigacin y tica Interrelaciones entre los tres tipos de investigacin Los tres tipos de investigacin y los contextos de la ciencia 2. INVESTIGACIN EXPLORATORIA, DESCRIPTIVA, CORRELACIONAL Y EXPLICATIVA Investigacin exploratoria Investigacin descriptiva Investigacin correlacional Investigacin explicativa Otras consideraciones Un anlisis crtico de la propuesta tipolgica Algunos ejemplos de investigaciones descriptivas y explicativas 3. 4. 5. 6. INVESTIGACIN TERICA Y EMPRICA INVESTIGACIN CUALITATIVA Y CUANTITATIVA INVESTIGACIONES PRIMARIA Y BIBLIOGRFICA CONCLUSIONES

CAPTULO 8: CAUSALIDAD Y EXPERIMENTO 1. CAUSA Y CAUSALIDAD Unicausalidad y policausalidad Hacia una definicin de causa Requisitos de causalidad 2. EL EXPERIMENTO Definicin Medicin de la variable dependiente Manipulacin de la variable independiente Grupo experimental y grupo de control Experimento y no experimento Limitaciones del experimento Experimento y diseo experimental Validez interna y validez externa del experimento Las variables extraas Control de las variables extraas Pruebas de confirmacin y pruebas de refutacin Experimentos bivariados y multivariados Un inventario de relaciones entre variables 3. LOS CNONES DE STUART MILL Una presentacin de los mtodos de Mill Crticas y comentarios a los mtodos de Mill Antecedentes histricos

Los mtodos de Mill y los mtodos experimentales actuales CAPTULO 9: LAS ETAPAS DE LA INVESTIGACIN TPICA CAPTULO 10: PROBLEMA, BIBLIOGRAFA, TEORA Y OBJETIVOS 1. 2. 3. 4. PLANTEO DEL PROBLEMA REVISIN BIBLIOGRFICA PLANTEO DEL MARCO TERICO PLANTEO DE OBJETIVOS

CAPTULO 11: HIPTESIS Y VARIABLES 1. HIPTESIS Definicin Clasificacin de las hiptesis Componentes de la hiptesis: los conceptos 2. VARIABLES Definicin Relacin entre variables y unidades de anlisis La definicin conceptual de las variables Clasificacin de las variables Categorizacin de las variables La definicin operacional de las variables u operacionalizacin Relaciones entre la categorizacin y la operacionalizacin CAPTULO 12: TCNICAS DE MUESTREO E INSTRUMENTOS DE MEDICIN 1. DEFINICIN DE LA POBLACIN 2. SELECCIN DE LA TCNICA DE MUESTREO 3. SELECCIN DEL INSTRUMENTO DE MEDICIN CAPTULO 13: EL DISEO DE INVESTIGACIN 1. VERSIN CAMPBELL Y STANLEY Diseos preexperimentales Diseos experimentales propiamente dichos Diseos cuasiexperimentales 2. VERSIN LEN Y MONTERO Diseos Diseos Diseos Diseos de investigacin con encuestas experimentales con grupos de N = 1 (diseos de sujeto nico) cuasi experimentales

3. VERSIN ARNAU GRAS Diseos Diseos Diseos Diseos Diseos Diseos Diseos Diseos experimentales experimentales simples experimentales factoriales experimentales de bloques homogneos intrasujeto (o de medidas repetidas) experimentales no estadsticos preexperimentales cuasiexperimentales

4. VERSIN SELLTIZ ET AL 5. OTRAS VERSIONES Versin Versin Versin Versin Versin Kohan Hernndez Sampieri et al Lores Arnaiz Greenwood ONeil

6. CONCLUSIONES CAPTULO 14: EL PROCESAMIENTO DE LOS DATOS

1. RECOLECCIN DE LOS DATOS La observacin La entrevista El cuestionario El test 2. ORGANIZACIN DE LOS DATOS Pasos de la organizacin de los datos El anlisis factorial 3. ANLISIS DE LOS DATOS El anlisis de la varianza 4. INTERPRETACIN DE LOS DATOS CAPTULO 15: REDACCIN Y PUBLICACIN DE LOS RESULTADOS 1. REDACCIN DE LOS RESULTADOS La forma del texto El contenido del texto La bibliografa La conexin entre una cita bibliogrfica y una referencia bibliogrfica Algunos errores posibles Precauciones 2. PUBLICACIN DE LOS RESULTADOS 3. COMO HACER UNA MONOGRAFA CAPTULO 16: INVESTIGACIONES ESPECIALES 1. INVESTIGACIN MDICA 2. INVESTIGACIN GRAFOLGICA La cientificidad de la grafologa La investigacin en grafologa Grafologa y psicologa Conclusiones REFERENCIAS BIBLIOGRFICAS DE ESTADSTICA OTRAS FUENTES CONSULTADAS PARA ESTADSTICA REFERENCIAS BIBLIOGRFICAS DE METODOLOGA ANEXOS DE ESTADSTICA ANEXO 1: NOMENCLATURA UTILIZADA EN ESTA GUA ANEXO 2: TABLA DE REAS BAJO LA CURVA NORMAL ESTANDARIZADA Tabla 1 reas desde z hacia la izquierda Tabla 2 reas desde z = 0 hacia la izquierda o hacia la derecha ANEXO 3: TABLA DE LA DISTRIBUCIN t ANEXOS DE METODOLOGA ANEXO 1. PREGUNTAS MULTIPLE CHOICE ANEXO 2. EJERCITACIONES VARIAS ANEXO 3. EJERCITACIN CON INVESTIGACIONES ANEXO 4. NORMAS DE PUBLICACIN DE LA APA Y COMPARACIN CON LAS NORMAS DE VANCOUVER ANEXO 5. NORMAS PARA HACER REFERENCIA A DOCUMENTOS CIENTFICOS DE INTERNET EN EL ESTILO WEAPAS (LAND, 1998) ANEXO 6. GUA PARA MONOGRAFAS.

PRESENTACIN

El presente texto abarca dos grandes partes: estadstica y metodologa de la investigacin. El material de estadstica fue pensado como un manual de consulta para alumnos de diversas carreras universitarias de grado y posgrado que cursan asignaturas donde se ensea la estadstica como herramienta de la metodologa de la investigacin cientfica. Se brinda aqu un panorama general e introductorio de los principales temas de una disciplina que opera en dos grandes etapas: la estadstica descriptiva y la estadstica inferencial. Tambin se desarrollan los conceptos de probabilidad y curva normal, bsicos para la comprensin de la estadstica inferencial, y los conceptos de correlacin y regresin vinculados, respectivamente, con las etapas descriptiva e inferencial. El material de metodologa de la investigacin, fruto de varios aos de enseanza universitaria en los niveles de grado y posgrado, intenta explicar cmo procede el cientfico cuando investiga la realidad en el mbito de las ciencias sociales. Esencialmente, la investigacin tiene dos etapas: proponer una hiptesis como respuesta a un problema, y luego probarla. Para la primera puede necesitarse intuicin y creatividad, y el cientfico no est tan sujeto a normas como en la segunda etapa, en la cual se requiere un mtodo provisto de reglas especficas que cuidarn que la hiptesis planteada quede efectivamente confirmada (o refutada). El presente texto trata acerca de los pasos concretos que habitualmente da el cientfico cuando realiza una investigacin tpica en ciencias sociales, que se presentan en forma panormica en uno de los captulos, el 9. La primera edicin de este libro (Noviembre 1991) form parte de la bibliografa obligatoria de la ctedra de Investigacin Psicopedaggica II (Carrera de Psicopedagoga. Buenos Aires, Universidad de Belgrano. Profesora titular: Lic. Liliana Hernndez). La segunda edicin (Julio 2002) form parte de la bibliografa obligatoria de las ctedras de Metodologa de la Investigacin (Carrera de Trabajo Social. Buenos Aires, Universidad del Museo Social Argentino. Profesora titular: Lic. Norma Ramljak de Bratti), y Metodologa de la Investigacin I, II y III (Carrera de Especialista en Ortodoncia. Buenos Aires, Fundacin Favaloro y Asociacin Argentina de Odontodologa. Profesor titular: Lic. Pablo Cazau). Tambin sirvi de base para el desarrollo de investigaciones en la Asociacin Panamericana de Grafologa. Pablo Cazau. Buenos Aires, Febrero 2008.

PARTE I: ESTADSTICA CAPTULO 1: INTRODUCCIN A LA ESTADSTICA


1.1 DEFINICIN Y UTILIDAD DE LA ESTADSTICA La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Por ejemplo, la estadstica interviene cuando se quiere conocer el estado sanitario de un pas, a travs de ciertos parmetros como la tasa de morbilidad o mortalidad de la poblacin. En este caso la estadstica describe la muestra en trminos de datos organizados y resumidos, y luego infiere conclusiones respecto de la poblacin. Por ejemplo, aplicada a la investigacin cientfica, hace inferencias cuando emplea medios matemticos para establecer si una hiptesis debe o no ser rechazada.
A veces la estadstica ha sido cuestionada por mentir distorsionando los datos de la realidad, pero ello no la hace menos cientfica: en todo caso se trata de un uso tendencioso de la estadstica para lograr algn fin. Una errnea lectura de la informacin estadstica puede dar lugar a algunas de las siguientes conclusiones un tanto risueas: a) La tasa de natalidad es el doble que la tasa de mortalidad; por lo tanto, una de cada dos personas es inmortal. b) El no tener hijos es hereditario; si tus padres no tuvieron ninguno, lo ms probable es que t tampoco los tengas. c) En Nueva York un hombre es atropellado cada diez minutos. El pobre tiene que estar hecho polvo. d) La probabilidad de tener un accidente de trfico aumenta con el tiempo que pasas en la calle. Por tanto, cuanto mas rpido circules, menor es la probabilidad de que tengas un accidente. e) El 33 % de los accidentes mortales involucran a alguien que ha bebido. Por tanto, el 67 % restante ha sido causado por alguien que no haba bebido. A la vista de esto y de lo anterior, esta claro que la forma mas segura de conducir es ir borracho y a gran velocidad.

La estadstica puede aplicarse a cualquier mbito de la realidad, y por ello es utilizada en fsica, qumica, biologa, medicina, astronoma, psicologa, sociologa, lingstica, demografa, etc. Cuando en cualquiera de estas disciplinas se trata de establecer si una hiptesis debe o no ser rechazada, no siempre es indispensable la estadstica inferencial. Por ejemplo, si sobre 60 veces que se mira un dado, sale un dos 10 veces, no se requiere la estadstica para rechazar la hiptesis el dado est cargado. Si sale un dos en 58 ocasiones sobre 60, tampoco se necesita la estadstica para aceptar la hiptesis el dado est cargado. Pero, qu ocurre si el nmero dos sale 20, 25 o 30 veces? En estos casos de duda, la estadstica interviene para determinar hasta qu cantidad de veces se considerar rechazada la hiptesis (o bien desde

qu cantidad de veces se la considerar aceptada). En otras palabras, la estadstica interviene cuando debe determinarse si los datos obtenidos son debidos al azar o son el resultado de un dado cargado. Otro ejemplo. Si una persona adivina el color (rojo o negro) de las cartas en un 50% de los casos, se puede rechazar la hiptesis la persona es adivina. Si, en cambio, acierta en el 99% de los casos el color de las cartas, se puede aceptar la mencionada hiptesis. Los casos de duda corresponden a porcentajes de acierto intermedios, como el 60%, el 70%, etc., en cuyos casos debe intervenir la estadstica para despejarlos. La importancia de la estadstica en la investigacin cientfica radica en que la gran mayora de las investigaciones son casos de duda. 1.2 CLASIFICACIONES DE LA ESTADSTICA Existen varias formas de clasificar los estudios estadsticos. 1) Segn la etapa.- Hay una estadstica descriptiva y una estadstica inferencial. La primera etapa se ocupa de describir la muestra, y la segunda etapa infiere conclusiones a partir de los datos que describen la muestra (por ejemplo, conclusiones con respecto a la poblacin). Tanto la estadstica descriptiva como la estadstica inferencial se ocupan de obtener datos nuevos. La diferencia radica en que la estadstica descriptiva procede a resumir y organizar esos datos para facilitar su anlisis e interpretacin, y la estadstica inferencial procede a formular estimaciones y probar hiptesis acerca de la poblacin a partir de esos datos resumidos y obtenidos de la muestra. Puesto que estas ltimas operaciones llevarn siempre a conclusiones que tienen algn grado de probabilidad, la teora de la probabilidad constituye una de sus herramientas principales. Tngase presente que en s misma la teora de la probabilidad no forma parte de la estadstica porque es otra rama diferente de la matemtica, pero es utilizada por la estadstica como instrumento para lograr sus propios objetivos. La estadstica descriptiva tambin incluye explcita o implcitamente- consideraciones probabilsticas, aunque no resultan ser tan importantes como en la estadstica inferencial. Por ejemplo, la eleccin de un determinado estadstico para caracterizar una muestra (modo, mediana o media aritmtica) se funda sobre ciertas consideraciones implcitas acerca de cul de ellos tiene ms probabilidades de representar significativamente el conjunto de los datos que se intenta resumir. Tanto la estadstica descriptiva como la inferencial implican, entonces, el anlisis de datos. Si se realiza un anlisis con el fin de describir o caracterizar los datos que han sido reunidos, entonces estamos en el rea de la estadstica descriptiva Por otro lado, la estadstica inferencial no se refiere a la simple descripcin de los datos obtenidos, sino que abarca las tcnicas que nos permiten utilizar los datos muestrales para inferir u obtener conclusiones sobre las poblaciones de las cuales fueron extrados dichos datos (Pagano, 1998:19). La estadstica inferencial se ocupa de problemas como los siguientes: 1) Relacin entre muestra y poblacin: estimar parmetros poblacionales a partir de estadsticos muestrales, determinar la probabilidad que una muestra pertenezca a una poblacin, o examinar de si hay diferencia significativa entre muestra y poblacin. 2) Relacin entre dos muestras: determinar si hay diferencias significativas entre dos muestras de una poblacin, o determinar si la diferencia entre dos muestras significa que las poblaciones muestreadas son ellas mismas realmente diferentes. Kohan, por su parte, sintetiza as su visin de las diferencias entre ambos tipos de estadstica: Si estudiamos una caracterstica de un grupo, sea en una poblacin o en una muestra, por ejemplo talla, peso, edad, cociente intelectual, ingreso mensual, etc, y lo describimos sin sacar de ello conclusiones estamos en la etapa de la estadstica descriptiva. Si estudiamos en una muestra una caracterstica cualquiera e inferimos, a partir de los resultados obtenidos en la muestra, conclusiones sobre la poblacin correspondiente, estamos haciendo estadstica inductiva o inferencial, y como estas inferencias no pueden ser exactamente ciertas, aplicamos el lenguaje probabilstico para sacar las conclusiones (Kohan, 1994:25). Kohan emplea la palabra inductiva porque las inferencias realizadas en este tipo de estadstica son razonamientos inductivos, modernamente definidos como razonamientos cuya conclusin es slo probable. En suma: la estadstica descriptiva debe preocuparse de si la muestra est o no bien descripta a partir de los datos de los individuos, mientras que la estadstica inductiva se preocupar de establecer la representatividad de la muestra respecto de la poblacin. Ms generalmente, la primera es eminentemente descriptiva y no ampla mayormente nuestro conocimiento: mas bien lo resume mediante las medidas estadsticas. En cambio la segunda s ampla nuestro conocimiento pues lo extiende (con cierto margen de error) a toda la poblacin, y de all su carcter predictivo. 2) Segn la cantidad de variables estudiadas.- Desde este punto de vista hay una estadstica univariada (estudia una sola variable, como por ejemplo la inteligencia), una estadstica bivariada (estudia la relacin entre dos variables, como por ejemplo inteligencia y alimentacin), y una estadstica multivariada (estudia tres o ms variables, como por ejemplo como estn relacionados el sexo, la edad y la alimentacin con la inteligencia). El siguiente esquema ilustra la relacin entre dos clasificaciones de la estadstica: descriptiva / inferencial y univariada / bivariada.

P Parmetros

P POBLACION

x_ y

E Estadsticos

x_ y
M MUESTRA

U Una variable

x 1 x2 xn n n

x1 y1 1 1
D Dos (o ms) variables

La estadstica descriptiva se ocupa de muestras, y la estadstica inferencial infiere caractersticas de la poblacin a partir de muestras. A su vez, ambas etapas de la estadstica pueden estudiar una variable por vez o la relacin entre dos o ms variables. Por ejemplo, a) en el caso de la estadstica univariada, el clculo de medidas de posicin y dispersin en una muestra corresponde a la estadstica descriptiva, mientras que la prueba de la media corresponde a la estadstica inferencial; b) en el caso de la estadstica bivariada, el anlisis de correlacin de variables en una muestra corresponde estrictamente hablando a la estadstica descriptiva, mientras que el anlisis de regresin o las pruebas de hiptesis para coeficientes de correlacin (Kohan N, 1994:234) corresponden a la estadstica inferencial. 3) Segn el tiempo considerado.- Si se considera a la estadstica descriptiva, se distingue la estadstica esttica o estructural, que describe la poblacin en un momento dado (por ejemplo la tasa de nacimientos en determinado censo), y la estadstica dinmica o evolutiva, que describe como va cambiando la poblacin en el tiempo (por ejemplo el aumento anual en la tasa de nacimientos). La estadstica descriptiva dinmica o evolutiva estudia las llamadas series temporales o cronolgicas. Se trata de series determinadas por dos variables, una de las cuales es el tiempo generalmente medido en aos. La serie se ordena de acuerdo a la variable tiempo (X) y, en funcin de su variacin, variar la otra variable, que puede ser por ejemplo cantidad de habitantes o temperaturas mximas (Y). De acuerdo a como vara la variable Y, las series cronolgicas pueden ser crecientes (cuando Y va aumentando a lo largo del tiempo), decrecientes (cuando Y va disminuyendo a lo largo del tiempo), alternadas (cuando Y aumenta y disminuye cclicamente), y estacionarias (cuando los valores de Y difieren poco respecto de un valor medio). Las series temporales no sirven solamente para describir la evolucin de Y en el tiempo, sino tambin para hacer predicciones, aunque estas generalmente se hacen a corto plazo porque son muchos los factores que pueden incidir en la evolucin de Y, tornndose entonces incierta la prediccin. Existen diversos procedimientos para describir o predecir en las series temporales: el mtodo grfico, el mtodo de los dos promedios, el mtodo de las medias mviles y el mtodo de los cuadrados mnimos. Los diferentes valores que adquiere Y a lo largo del tiempo pueden descomponerse en partes, llamadas componentes de la serie, y que bsicamente son cuatro: tres componentes sistemticos y una componente aleatoria. Los componentes sistemticos estn sujetos a leyes precisas y son la Tendencia (describe como evoluciona Y a corto y largo plazo), el componente Estacional (describe modificaciones repetitivas observables en la evolucin de Y en periodos definidos dentro de un periodo mayor), y el componente Cclico (describe variaciones mayores en la evolucin de Y en lapsos repetitivos no definidos dentro de uno mayor). La diferencia entre Estaconal y Cclico reside especialmente en el tiempo considerado: menor para lo Estacional (por ejemplo cada ao hay variaciones estacionales), y mayor para lo Cclico (por ejemplo cada diez aos hay periodos de prosperidad o depresin econmica). La componente aleatoria describe la evolucin de Y en tanto depende del azar, y es por tanto impredecible. 1.3 POBLACIN Y MUESTRA Puesto que la estadstica se ocupa de una gran cantidad de datos, debe primeramente definir de cules datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadstico se llama poblacin.

No debe confundirse la poblacin en sentido demogrfico y la poblacin en sentido estadstico. La poblacin en sentido demogrfico es un conjunto de individuos (todos los habitantes de un pas, todas las ratas de una ciudad), mientras que una poblacin en sentido estadstico es un conjunto de datos referidos a determinada caracterstica o atributo de los individuos (las edades de todos los individuos de un pas, el color de todas las ratas de una ciudad). Incluso una poblacin en sentido estadstico no tiene porqu referirse a muchos individuos. Una poblacin estadstica puede ser tambin el conjunto de calificaciones obtenidas por un individuo a lo largo de sus estudios universitarios. La poblacin o universo, definible como el conjunto de todas las unidades de anlisis, puede ser finita o infinita, segn tenga o no un nmero determinado de individuos: se puede considerar infinito al conjunto de todos los individuos posibles segn su combinacin gentica. La poblacin tambin puede ser real o potencial: una poblacin real es el conjunto de todos los argentinos mayores de 18 aos y menores de 20, y poblacin potencial es por ejemplo el conjunto de todas las personas que podran utilizar el servicio de psicopatologa de un hospital. En el siguiente esquema pueden apreciarse algunas formas de considerar los datos individuales, segn que correspondan a muchas personas o a una sola, y tambin segn que hayan sido recolectados en un instante de tiempo determinado, o bien a lo largo del tiempo. De muchos individuos Notas de todos los alumnos en el primer parcial de tal mes y tal ao. Notas de todos los alumnos durante los 6 aos de carrera. De un solo individuo Notas de un solo alumno en el primer parcial de las materias que cursa en ese momento. Notas de un alumno a lo largo de los 6 aos de carrera.

En un instante de tiempo A lo largo del tiempo

Los datos de la totalidad de una poblacin pueden obtenerse a travs de un censo. Sin embargo, en la mayora de los casos no es posible hacerlo por razones de esfuerzo, tiempo y dinero, razn por la cual se extrae, de la poblacin, una muestra, mediante un procedimiento llamado muestreo. Se llama muestra a un subconjunto de la poblacin, que puede o no ser representativa de la misma, y que puede estar formada por uno o muchos individuos. Por ejemplo, si la poblacin es el conjunto de todas las edades de los estudiantes de la provincia de Buenos Aires, una muestra podra ser el conjunto de edades de 2000 estudiantes de la provincia de Buenos Aires tomados al azar. Obviamente, hay que asegurarse de que la muestra sea representativa de la poblacin: si se quiere tomar una muestra de los habitantes de una ciudad y slo se seleccionan veinte enfermos mentales de un hospicio, esta muestra no representar adecuadamente a la poblacin. En cambio si se selecciona la misma cantidad de sujetos tomando uno de cada 100 de la gua telefnica aqu ya se puede empezar a pensar ms en la posibilidad de cierta representatividad, pues estn tomados ms al azar. An as no hay un azar total, pues en la gua no figuran por ejemplo individuos de clase baja (no tienen telfono); y si se elige por una lista de empadronamiento para votar, all no figurarn los extranjeros residentes. Un procedimiento bastante aleatorio, en cambio, consiste en elegir un individuo por cada manzana. El tamao elegido para la muestra es tambin importante, y variar de acuerdo a cada investigacin pudiendo ser el 5%, el 20%, etc., de la poblacin total. Suele ser difcil elegir el tamao justo, ya que no se puede pecar por defecto (un solo individuo no representa a una ciudad, an tomndolo al azar) o por exceso (una muestra que sea el 80% de la poblacin es altamente confiable pero no econmica, ya que con menos esfuerzo y dinero puede obtenerse una muestra considerablemente ms pequea sin que vare en forma significativa su grado de representatividad).
Para saber cuando el tamao de una muestra es aceptable, debe considerarse, adems de la varianza poblacional (heterogeneidad de la poblacin), otros dos factores que son el nivel de confianza y el mximo error permitido en las estimaciones (tambin llamado error muestral). En principio, cuanto ms homognea es la poblacin, menor ser el tamao requerido de la muestra. Para determinar el tamao de la muestra, deber primero determinarse un nivel de confianza y un mximo error permitido (valores que determinar el investigador). Una vez conocidos estos valores, se puede determinar el tamao de la muestra por varios caminos. Por ejemplo (Kohan, 1994:181) (Rubio y otro, 1997:290): a) Utilizar la frmula de N (tamao de la muestra), donde el numerador es el producto entre el cuadrado del nivel de confianza y la varianza poblacional, y el denominador el cuadrado del error permitido. Esta frmula es aplicable slo en poblaciones infinitas (ms de 100.000 elementos), y cuando el procedimiento de muestreo fue aleatorio simple. Tambin hay frmulas especiales para poblaciones finitas, donde se introduce un factor de correccin con una especificacin del tamao de la poblacin. b) Si no se quiere utilizar una frmula, puede recurrirse a tablas especiales ya preparadas para estos menesteres, como por ejemplo las tablas de Tagliacarne. Para consultarlas, es preciso conocer antes qu nivel de confianza y qu error muestral ser considerado.

Los muestreos se dividen clsicamente en probabilsticos y no probabilsticos. Lo esencial del muestreo probabilstico es que cada individuo de la poblacin total tiene la misma o aproximadamente la misma probabilidad de estar includo en la muestra. Si se toma una muestra de los habitantes de Londres considerando uno de cada 100 de un listado alfabtico, la probabilidad que tiene de haber sido seleccionado el seor Smith es la misma que tiene el seor Brown o cualquier otro (en este caso, la probabilidad del uno por ciento). Hay varias tcnicas para realizar muestreos probabilsticos, y todas se basan en la seleccin de individuos al azar ya que es ste quien presuntamente garantiza la equiprobabilidad. El muestreo puede ser: a) simple: partiendo de toda la poblacin se toman individuos al azar segn diversos procedimientos; b) estratificado: previamente se seleccionan en la poblacin estratos (por ejemplo clases sociales: alta, media y baja), y dentro de cada estrato se toman individuos al azar segn el muestreo simple; c) por reas o conglomerados: se delimitan previamente reas geogrficas (provincias, ciudades) y dentro de cada una de ellas se toman individuos al azar segn el muestreo simple o estratificado. En el muestreo no probabilstico los individuos de la poblacin no tienen todos la misma probabilidad de aparecer en la muestra, ya que aqu no se hace una estricta seleccin al azar sino que se toman casos tpicos (que se suponen representativos de la media poblacional) o casos en forma accidental (los que tenemos ms a mano), etc. Una vez obtenida la muestra (preferiblemente mediante muestreo probabilstico), se procede a describirla, para lo cual se usan ciertas medidas especiales diferentes a las medidas que usamos para medir individuos. Si se quiere describir sujetos individuales se usa una medida individual: Juancito tiene cociente intelectual 110, o Pedrito tiene poco inters en poltica, etc. Pero, si se quiere describir una muestra se usar lo que se llama una medida estadstica. Por ejemplo, tal muestra se compone de sujetos cuyo promedio de cocientes intelectuales es 120, o tal otra muestra tiene un 70% de sujetos con poco inters en poltica, etc. Como se ve, estas medidas estadsticas son verdaderas sntesis o resmenes de muchas medidas individuales, y un ejemplo tpico es la media aritmtica, o sea, un simple promedio. 1.4 ESTRUCTURA DEL DATO Los datos son la materia prima con que trabaja la estadstica, del mismo modo que la madera es la materia prima con que trabaja el carpintero. As como este procesa o transforma la madera para obtener un producto til, as tambin el estadstico procesa o transforma los datos para obtener informacin til. Tanto los datos como la madera no se inventan: se extraen de la realidad; en todo caso el secreto est en recoger la madera o los datos ms adecuados a los objetivos del trabajo a realizar. El dato es siempre el resultado de un proceso de medicin. De una manera general, puede definirse tcnicamente dato como una categora asignada a una variable de una unidad de anlisis. Por ejemplo, Luis tiene 1.70 metros de estatura es un dato, donde Luis es la unidad de anlisis, estatura es la variable, y 1.70 metros es la categora asignada. Como puede apreciarse, todo dato tienen al menos tres componentes: una unidad de anlisis, una variable y una categora. La unidad de anlisis es el elemento del cual se predica una propiedad y caracterstica. Puede ser una persona, una familia, un animal, una sustancia qumica, o un objeto como una dentadura o una mesa. Por ejemplo: a) las personas son unidades de anlisis si consideramos su edad, su sexo, su inteligencia, su salario o la cantidad de sillas que posee, como variables; b) las sillas son unidades de anlisis si consideramos su precio, su color o su estado como variables; c) los colores son unidades de anlisis si consideramos su tono o su longitud de onda como variables. La variable es la caracterstica, propiedad o atributo que se predica de la unidad de anlisis. Por ejemplo puede ser la edad para una persona, el grado de cohesin para una familia, el nivel de aprendizaje alcanzado para un animal, el peso especfico para una sustancia qumica, el nivel de salud para una dentadura, y el tamao para una mesa. Pueden entonces tambin definirse poblacin estadstica (o simplemente poblacin) como el conjunto de datos acerca de unidades de anlisis (individuos, objetos) en relacin a una misma caracterstica, propiedad o atributo (variable). Sobre una misma poblacin demogrfica pueden definirse varias poblaciones de datos, una para cada variable. Por ejemplo, en el conjunto de habitantes de un pas (poblacin demogrfica), puede definirse una poblacin referida a la variable edad (el conjunto de edades de los habitantes), a la variable ocupacin (el conjunto de ocupaciones de los habitantes), a la variable sexo (el conjunto de condiciones de sexo de los habitantes). La categora es cada una de las posibles variaciones de una variable. Categoras de la variable sexo son masculino y femenino, de la variable ocupacin pueden ser arquitecto, mdico, etc, y de la variable edad pueden ser 10 aos, 11 aos, etc. Cuando la variable se mide cuantitativamente, es decir cuando se expresa numricamente, a la categora suele llamrsela valor. En estos casos, el dato incluye tambin una unidad de medida, como por ejemplo aos, cantidad de hijos, grados de temperatura, cantidad de piezas dentarias, centmetros, etc. El valor es, entonces, cada una de las posibles variaciones de una variable cuantitativa.

Datos individuales y datos estadsticos.- Un dato individual es un dato de un solo individuo, mientras que un dato estadstico es un dato de una muestra o de una poblacin en su conjunto. Por ejemplo, la edad de Juan es un dato individual, mientras que el promedio de edades de una muestra o poblacin de personas es un dato estadstico. Desde ya, puede ocurrir que ambos no coincidan: la edad de Juan puede ser 37 aos, y el promedio de edades de la muestra donde est includo Juan es 23 aos. Por esta razn un dato estadstico nada dice respecto de los individuos, porque solamente describe la muestra o poblacin. Los datos estadsticos que describen una muestra suelen llamarse estadsticos (por ejemplo, el promedio de ingresos mensuales de las personas de una muestra), mientras que los datos estadsticos descriptores de una poblacin suelen llamarse parmetros (por ejemplo, el promedio de ingresos mensuales de las personas de una poblacin) (Kohan N, 1994:143). 1.5 LA MEDICIN Los datos se obtienen a travs un proceso llamado medicin. Desde este punto de vista, puede definirse medicin como el proceso por el cual asignamos una categora (o un valor) a una variable, para determinada unidad de anlisis y para un determinado lugar y tiempo. Ejemplo: cuando decimos que Martn es varn, estamos haciendo una medicin, porque estamos asignando una categora (varn) a una variable (sexo) para una unidad de anlisis (Martn), y aqu y ahora. Como puede verse, la medicin va ms all del clsico empleo de la regla y el nmero.
A veces se ha definido medir como comparar, lo cual puede referirse a diversos tipos de comparacin: 1) comparar una cantidad con otra tomada como unidad Sentido clsico de comparacin); 2) comparar dos categoras de una misma variable en el mismo sujeto y distinto tiempo; 3) comparar dos categoras de una misma variable en distintos sujetos al mismo tiempo; y 4) categoras de variables distintas (debe usarse puntaje estandarizado), en el mismo sujeto o en sujetos distintos.

Las mediciones individuales recaen sobre sujetos, mientras que las mediciones estadsticas recaen sobre muestras o poblaciones. As por ejemplo decimos que medimos una muestra A cuando le asignamos la media aritmtica 120 respecto de la variable inteligencia. Obviamente, las medidas estadsticas se derivan de las individuales pues no se puede obtener un promedio si desconocemos los valores individuales de los sujetos de la muestra. Para llevar a cabo una medicin, necesitamos obligatoriamente tres cosas: a) un instrumento de medicin, b) un sistema de medicin (o escala), ya que hay diferentes grados de precisin en la medicin, y c) un procedimiento para hacer la medicin. Nos ocuparemos brevemente de los dos primeros. Instrumentos de medicin.- Un instrumento de medida es un artificio usado para medir. Una balanza es un instrumento para medir peso, un test mide personalidad, inteligencia, aptitud vocacional, etc., un cuestionario mide conocimientos, etc., pero sea cual fuere el instrumento utilizado, para que sea eficaz debe reunir dos requisitos: confiabilidad y validez. Si la misma balanza hoy me informa que peso 70 kg, maana 80 kg y pasado 63 kg, es un instrumento poco confiable. Un test puede tambin ser poco confiable si, respecto del mismo sujeto, arroja resultados dispares en diferentes momentos de administracin. Confiabilidad significa, entonces, estabilidad o constancia de los resultados.
Esta constancia no es nunca perfecta. El hecho de que puedan existir ligeras variaciones debidas al azar no compromete la confiabilidad del instrumento de medida, siempre que esas variaciones sean poco significativas. Tambin debemos tener en cuenta los cambios propios del sujeto cuya propiedad medimos. Si el sujeto aumenta de peso o mejora su rendimiento intelectual por un efecto madurativo habr una variabilidad en los resultados, lo cual no implica necesariamente que el instrumento no sea confiable. En la confiabilidad, como aqu la entendemos, la constancia o la variabilidad en los resultados depende de la labilidad del instrumento mismo, no del sujeto. Por ejemplo si el instrumento tiene una consigna de aplicacin ambigua, podr ser aplicado de manera distinta antes y despus, y los resultados podrn ser diferentes.

Un test o cualquier otro instrumento puede ser confiable pero no vlido: es vlido cuando mide lo que efectivamente pretende medir, lo cual puede parecer una perogrullada pero que no es tal si nos damos cuenta de los casos de instrumentos que queran medir una propiedad y medan otra. Si con un determinado test pretendemos medir memoria pero slo medimos ansiedad, no es vlido. La validez de un test puede establecerse prospectivamente: nos percatamos que un test de aptitud para la ingeniera es vlido cuando, andando el tiempo, constatamos que quienes obtuvieron altos puntajes hoy son buenos ingenieros, y quienes sacaron bajos puntajes no lo son.
Para determinar la confiabilidad de una prueba, hay muchos procedimientos, siendo uno de ellos el Coeficiente Alfa de Cronbach. a) Cmo se determina la confiabilidad de un test utilizando la escala alfa de Crombach? Para aplicar el coeficiente alfa de Cronbach se requieren conocimientos y experiencia en estadstica. No obstante, con un conocimiento mnimo bsico y algo de audacia se puede calcular la fiabilidad de un test mediante el Cronbach utilizando software de estadstica como por ejemplo el SPSS (preferiblemente la versin 4), uno de los ms conocidos y

utilizados para estas cuestiones. La informacin que debe ingresarse es por lo menos cuantos tems tiene el test y las respuestas obtenidas de una muestra de sujetos. Si no se dispone del software y se cuenta con cierto conocimiento estadstico, la frmula para calcular el alfa de Cronbach tiene como numerador el nmero de tems de la escala, y como denominador, el producto de dicho nmero menos 1, multiplicado por el cociente entre la sumatoria de varianzas de los tems y la varianza de toda la escala. Si se est usando un test ya estandarizado, no hay necesidad de calcular su Coeficiente Cronbach, pues se supone que dicho test es lo suficientemente vlido y confiable. An as, los creadores de la prueba suelen dar informacin sobre estas propiedades, incluyendo un coeficiente Cronbach o algn otro que tambin mida fiabilidad (como el clsico coeficiente Kappa, que mide la equivalencia o concordancia entre observadores, o el coeficiente r de correlacin de Pearson de la prueba de test-retest, que mide la estabilidad de las respuestas. El Cronbach, por su parte, mide la confiabilidad a partir de la consistencia interna de los tems, entendiendo por tal el grado en que los tems de una escala se correlacionan entre s). En estos casos, en el informe de investigacin debe indicarse el coeficiente Cronbach asignado al test utilizado. En cambio, si se ha creado un test o cuestionario ad hoc, ser conveniente determinar su fiabilidad mediante el Cronbach para que los lectores sepan cun confiable o fiable es el test que se est usando. Este coeficiente Cronbach se utilizar, sin embargo, cuando la prueba tenga muchos tems, ya que lo que evala es la confiabilidad a partir de la consistencia interna de los mismos. Si no es as, un tcnico estadstico podr recomendar qu otra prueba de fiabilidad utilizar. b) Qu indica un ndice de confiabilidad de 0.9 utilizando dicha escala? Cronbach desarroll su coeficiente en la dcada del 50 dentro del contexto de investigaciones educativas. En principio, un Cronbach de 0.90 es bastante alto, con lo cual la confiabilidad de test est prcticamente asegurada y puede ser utilizado sin problemas, ya que est indicando una consistencia interna satisfactoria. En general, se admite que por encima de 0.80, la prueba es confiable. El alfa de Cronbach vara entre 0 y 1 (0 es ausencia total de consistencia, y 1 es consistencia perfecta). El valor 0.90 es satisfactorio si, como dijimos antes, el test tiene muchos tems. Si el test llegara a tener pocos tems, se pueden aceptar valores alfa de Cronbach de 0.60 y 0.50 (como sostienen Carmines y Zeller 1979; Pedhazur y Schmelkin 1991). Finalmente, digamos que puede ocurrir que un test tenga varios alfa de Cronbach distintos. Por lo regular esto significa que el test est midiendo una variable compleja, multidimensional, y entonces se ha obtenido un alfa para cada dimensin. No obstante, an en estos casos puede obtenerse un alfa nico para toda la variable.

Puntuacin, validez y confiabilidad en los tests psicomtricos.- La eficacia de cualquier instrumento de medicin, como por ejemplo una balanza o un test, depender de su grado de validez y confiabilidad (o fiabilidad, o consistencia). Cuanto ms vlido y confiable sea el instrumento, mejor medir la variable. Por ello, quienes construyen el instrumento de medicin deben determinar o calcular su grado de validez y confiabilidad. En lo que sigue se describen los conceptos de validez y confiabilidad aplicados a ciertos instrumentos de medicin especiales, llamados habitualmente tests psicomtricos, es decir, pruebas que permiten medir variables psicolgicas en funcin de algn tipo de puntaje numrico. Por lo tanto, antes explicaremos sucintamente la puntuacin, es decir, la asignacin de puntajes a los resultados de los tests. 1) Puntajes brutos y derivados.- Los nmeros que se asignan a las respuestas de un test se llaman puntajes brutos o directos. Tales puntajes no permiten comparar al sujeto con la poblacin o el grupo normativo representado en un baremo (por ejemplo con los dems sujetos de su misma edad o pas), y por ello se requiere transformar los puntajes brutos en puntajes derivados o transformados. Estos ya pueden interpretarse estadsticamente, o sea, permiten comparar al sujeto con los dems de la poblacin, ya que el baremo expresa estadsticamente el desempeo de la poblacin en dicho test. Ejemplos de puntajes transformados son los puntajes estandarizados, que toman como unidad desviaciones estndar o fracciones de la misma. Algunos ejemplos son el puntaje z (que puede valer entre -3 y +3), el puntaje CI (coeficiente intelectual), la edad mental, el eneatipo (que puede valer entre 1 y 9) y el decatipo (entre 1 y 10). Existen tambin los puntajes llamados percentiles (que pueden valer entre 1 y 100, y donde cada valor se llama centil o percentil). Por ejemplo si un sujeto obtuvo un percentil 30, ello significa que supera al 30% de la poblacin y el superado por el 70%. Los puntajes derivados pueden transformarse unos en otros. Por ejemplo, un puntaje percentil puede transformarse en uno z o viceversa. 2) Validez.- Un instrumento de medicin es vlido si realmente mide aquello que pretende medir. Si un test pretende medir inteligencia pero mide simplemente memoria, no es vlido. En casos de variables simples como el peso no hay mayores problemas para establecer su validez: una balanza mide el peso, pero cuando se trata de variables psicolgicas la cuestin de la validez no es tan sencilla. Estadsticamente, la validez suele definrsela como la proporcin de la varianza relevante para los fines del test, o sea, la proporcin de las pruebas del test atribuibles a la variable que pretende medir. Ello significa que la validez es una cuestin de grado: un test ser ms vlido, entre otras cosas, si tiene ms cantidad de pruebas, tems o subtests que realmente expresan la variable a medir. Tngase presente que la validez no es un atributo del test en s mismo sino que las inferencias que se hagan a partir de l. La validez no es algo fijo e invariable para todos los tests, sino que depender tambin de lo que el entrevistador quiera medir. Para determinar la validez de un test deben considerarse diferentes aspectos, que algunas veces fueron denominados tipos de validez, lo cuales se influencian recprocamente formando un todo articulado. Pueden mencionarse los siguientes tipos o categoras de validez:

a) Validez de contenido.- Un test es vlido si el conjunto de sus tems son una muestra representativa de la variable que pretende medir. Esto es esencial cuando deben hacerse generalizaciones a partir de los resultados del test. Se utiliza especialmente en los tests de rendimiento como por ejemplo un test de vocabulario: un conjunto de expertos seleccionar algunas palabras para incluir en el test de manera tal que representen adecuadamente la totalidad del vocabulario, las cuales pueden elegirse al azar (si se seleccionan slo palabras muy fciles, el test disminuye su validez). Un tipo especial de validez de contenido es la validez aparente o de facie: un test tiene validez aparente cuando produce en el sujeto que hace el test la impresin que mide realmente la variable que se quiere medir. Si esto no ocurre no estarn motivados para responder los tems (por ejemplo porque los juzgan dem asiado inapropiados para su edad o instruccin). b) Validez de constructo.- Es especialmente importante cuando se miden variables complejas definidas desde alguna teora en particular. No es lo mismo un test que mida inteligencia segn Weschler que inteligencia segn Piaget: cada uno de ellos da definiciones o constructos diferentes. Un test entonces tendr menor validez si no estn representados en l los diversos aspectos del constructo o variable que propone la teora, o bien si la teora de la cual se parte es errnea. Algunos autores actuales consideran que la validez de constructo es la nica admisible. Para estimar la validez de constructo se pueden utilizar mtodos intraprueba, que ofrecen una llamada validez factorial (por ejemplo examinando el grado de correlacin entre los tems del test, o pidiendo a los sujetos que razonen en voz alta sus respuestas), mtodos de manipulacin experimental (modificar los valores de la variable a medir y viendo qu efectos producen sobre la puntuacin del test), y otros mtodos, como por ejemplo la determinacin de la validez convergente y la validez discriminante. Hay validez convergente cuando las mediciones del mismo rasgo realizadas con distintos mtodos tienen alta correlacin, lo cual aumenta la probabilidad de la existencia real del rasgo. Hay validez discriminante cuando las mediciones de distintos rasgos con un mismo mtodo tienen una baja correlacin en comparacin con la que muestran las medidas del mismo rasgo con diferentes mtodos, lo que indica que los rasgos son independientes entre s, e independientes al sistema de medicin utilizado. c) Validez predictiva.- Es el grado en que un test puede predecir el rendimiento o el comportamiento futuro del sujeto. Por ejemplo, en seleccin de personal un test de liderazgo es vlido si, una vez que el postulante entr y obtuvo alto puntaje, a lo largo del tiempo demuestra que efectivamente es un buen lder. Se llama tambin validez de pronstico, y se puede estimar a partir de un coeficiente de validez, que correlaciona el puntaje del test con la produccin posterior. Esta produccin anterior es llamada por algunos autores criterio o sea cualquier produccin en la vida real, no en un test. Es importante definir la forma en que ser medido ese criterio o comportamiento ulterior: algn psiclogo puede medir el liderazgo en trminos de influencia real del lder sobre los dems, y otro en trminos de si es o no elegido en su trabajo para un puesto de liderazgo. Una variante de la validez predictiva es la validez retrospectiva, donde el test mide algn comportamiento o criterio del pasado del sujeto que por alguna razn no es accesible al conocimiento. d) Validez concurrente.- Un test tiene validez concurrente cuando se da una correlacin alta entre los puntajes del mismo y otro test que mide lo mismo y que ya fue validado previamente. Por ejemplo el Test A de inteligencia es vlido concurrentemente si las puntuaciones de los sujetos sin similares a las puntuaciones de otro Test B de inteligencia ya validado. 3) Confiabilidad.- Un test es confiable cuando al ser administrado al mismo sujeto en diferentes momentos, da aproximadamente los mismos puntajes. Si el test se administra en distintos momentos puede ocurrir que varen las condiciones de cada uno, que pueden atribuirse a que el examinador no aplic siempre la misma consigna (usualmente explicitada en el manual del test) y/o a que el examinado est atravesando distintas experiencias (un da est ms relajado y atento, otro ms angustiado, un mes madur o aprendi ms que el anterior, un da hay ms luz o ms humedad ambiental y otro menos, etc.). Incluso aunque siempre se aplique la misma consigna y el examinado est aproximadamente en las mismas condiciones, los distintos puntajes tienen pequeas variaciones atribuibles al azar. La confiabilidad de un test es un indicador de la estabilidad del mismo, de su consistencia y del grado de precisin con que mide la variable. Para medir este grado de confiabilidad hay varios procedimientos, como por ejemplo la prueba test-retest (tomar dos o ms veces el mismo test y examinar el grado en que se correlacionan los puntajes: el coeficiente de correlacin ser el coeficiente de confiabilidad); la prueba paralela (tomar al mismo sujeto dos tests distintos que midan lo mismo y examinar el grado de correlacin entre ambos puntajes, lo que da un coeficiente de confiabilidad llamado coeficiente de equivalencia); la prueba de las dos mitades (se comparan los puntajes obtenidos en dos mitades del test y se examina su grado de correlacin, lo cual indica la consistencia interna del test y su confiabilidad). En esta ltima prueba ambas mitades deben ser equivalentes (por ejemplo tomar en una los tems pares y en otra los impares, pues a veces los tests presentan los tems en un orden de complejidad creciente). Hay otros mtodos para determinar la consistencia interna de los tests como el coeficiente de Cronbach, Kuder-Richardson, y el coeficiente Beta, til para determinar la confiabilidad de una batera de tests (conjunto de tests), que ofrece una medida de la consistencia interna de los puntajes de cada uno. A la obtencin de estos diferentes tipos de coeficientes de confiabilidad debe tambin agregarse una estimacin del error estndar de medida (que se obtiene mediante una frmula), que permite estimar dentro de qu intervalo de puntajes posibles estar el verdadero puntaje. Recordemos que administrar

varias veces un mismo test arroja puntajes diferentes debido al azar, es decir, a errores aleatorios o no sistemticos. Mientras en la confiabilidad influyen los errores aleatorios, en la validez influyen los errores constantes o sistemticos, pues si un test mide otra variable a la que se pretende medir, arrojar siempre aproximadamente un mismo error. Escalas de medicin.- Se pueden hacer mediciones con mayor o menor grado de precisin. Cuanto ms precisa sea la medicin, ms informacin nos suministra sobre la variable y, por tanto, sobre la unidad de anlisis. No es lo mismo decir que una persona es alta, a decir que mide 1,83 metros.
Los niveles de medicin se definen a partir de escalas de medicin. Desde el punto de vista de la teora de la medicin, una escala es una lnea que representa el campo de variabilidad de una variable. Por ejemplo: la lnea indicadora de kilos en una balanza, la lnea indicadora de kilmetros en un mapa, la lnea indicadora de grados en un termmetro, etc. Los elementos constitutivos de una escala son: a) una longitud, generalmente expresada en centmetros. Por ejemplo, un termmetro de uso clnico puede tener 10 centmetros entre el valor mximo y el valor mnimo de temperatura; b) Un valor mnimo y un valor mximo de la variable, llamados cota inicial y cota final. Por ejemplo: 0 grados y 45 grados centgrados; c) Valores intermedios entre la cota inicial y la final. Por ejemplo: 5-10-15-2025-30-35-40 grados centgrados; d) Una determinada correspondencia entre la variable a representar (por ejemplo temperatura) y la variable longitud. Por ejemplo: un centmetro representa una variacin de 5 grados centgrados. Se llama mdulo de la escala al cociente entre la longitud de la escala (numerador) y la resta entre la cota final y la cota inicial (denominador). Existen escalas uniformes, donde el valor representado es siempre proporcional al valor en longitud elegido para representarlo, y escalas funcionales, donde el valor representado nunca lo es, como sucede en las escalas logartmicas (en este ltimo caso, por ejemplo, 0 cm corresponde a x=10, 4 cm corresponde a x=100, y no a x=40, etc).

Habida cuenta de que hay maneras ms precisas y menos precisas de medir variables, Stevens estableci en 1948 cuatro niveles de medicin en orden de precisin creciente: nominal, ordinal, de intervalos iguales y de cocientes o razones. Posteriormente, Coombs agreg otros niveles intermedios: la escala parcialmente ordenada y la escala mtrica ordenada. En cada uno de los cuatro niveles de medicin, la obtencin del dato o resultado de la medicin ser diferente: Ejemplos de datos en diferentes niveles de medicin Nivel de medicin DATO Unidad de anlisis Variable Categora o valor Unidad de medida Nivel nominal Martn es electricista Martn Oficio Electricista ------------Nivel ordinal Elena termin la secundaria Elena Nivel de instruccin Secundaria completa -----------Nivel cuantitativo discreto Juan tiene 32 dientes Juan Cantidad de piezas dentarias 32 Diente Nivel cuantitativo continuo Mara tiene 70 pulsaciones por minuto Mara Frecuencia cardaca 70 Pulsaciones por minuto

En el nivel nominal, medir significa simplemente asignar un atributo a una unidad de anlisis (Martn es electricista). En el nivel ordinal, medir significa asignar un atributo a una unidad de anlisis cuyas categoras pueden ser ordenadas en una serie creciente o decreciente (la categora secundaria completa puede ordenarse en una serie, pues est entre secundaria incompleta y universitaria incompleta). En el nivel cuantitativo, medir significa adems asignar un atributo a una unidad de anlisis de modo tal que la categora asignada permita saber cunto mayor o menor es respecto de otra categora, es decir, especifica la distancia o intervalo entre categoras (por ejemplo, la categora 70 es el doble de la categora 35). Las variables medibles en el nivel cuantitativo pueden ser discretas o continuas. Una variable discreta es aquella en la cual, dados dos valores consecutivos, no puede adoptar ningn valor intermedio (por ejemplo entre 32 y 33 dientes, no puede hablarse de 32.5 dientes). En cambio, una variable es continua cuando, dados dos valores consecutivos, la variable puede adoptar muchos valores intermedios (por ejemplo entre 1 y 2 metros, puede haber muchas longitudes posibles). Algunas veces una misma variable puede ser considerada como discreta o continua. Por ejemplo, la variable peso es discreta si solamente interesan los pesos sin valores intermedios (50 kg, 51 kg, etc), mientras que ser continua si interesan tambin los valores intermedios (50,3 kg, 50,35 kg, 50,357 kg,

etc). Obviamente, al considerar una variable como continua se obtendr mayor precisin, es decir, mayor informacin.
La precisin es una cualidad importante de la medicin. Se pueden hacer mediciones ms precisas y menos precisas, o tan precisas como lo permita el instrumento de medicin. El primer nivel de medicin es el menos preciso, y el ltimo el ms preciso. Por ejemplo, una mujer puede estar interesada en medir el amor de su pareja, para lo cual podr interrogarla solicitndole diferentes grados de precisin: me quers? (nivel nominal), me quers ms que a la otra? (nivel ordinal), Cunto me quers, del 1 al 10? (nivel cuantitativo). De la misma manera, diferentes grados de precisin para la variable temperatura pueden ser: A es un objeto caliente (nivel nominal), A es ms caliente que B (nivel ordinal), A tiene 25 grados Celsius (nivel cuantitativo). Los ejemplos del amor y de la temperatura ilustran tambin el hecho de que una variable puede en principio medirse en cualquiera de los niveles de medicin.

Los niveles de medicin pueden tambin ser clasificados de acuerdo a un criterio diferente, que afecta especficamente a los dos ltimos. As, los niveles de medicin pueden ser clasificados (Stevens) como nominal, ordinal, de intervalos iguales y de cocientes o razones. Estos cuatro niveles son cada vez ms precisos y exactos, con lo cual aumenta la informacin que recibimos al hacer la medicin. Somos ms precisos y decimos ms si afirmamos que Juan tiene 52 aos (escalas cuantitativas) que si decimos solamente que es adulto (escalas cualitativas). De idntica forma, la medicin es ms precisa si decimos que un objeto cae a 9,8 m/sg2 (escala de cocientes o razones), que si solamente decimos que ese objeto cae ms velozmente que otro (escala ordinal).
Cierto da un emperador, que deba invadir una fortaleza, reunin a cuatro de sus espas para que ingresaran en ella y obtuviesen informacin. Luego de varios das se presentan los cuatro espas con sus respectivos informes. El espa nmero 1 informa que adentro de la fortaleza hay un jefe. El espa nmero 2 informa que adentro de la fortaleza hay un jefe que es ms alto que el hijo. El espa nmero 3 informa que adentro de la fortaleza hay un jefe que es dos veces ms alto que el hijo. El espa nmero 4 informa que adentro de la fortaleza hay un jefe que mide 1,90 metros. Los cuatro espas utilizaron respectivamente los cuatro niveles de medicin: el primero inform realmente muy poco, en comparacin con el ltimo, que proporcion la informacin ms precisa. De idntica manera, no es lo mismo decir que es de noche, es una hora avanzada de la noche y son las once de la noche, siendo sta ltima informacin ms precisa que la primera.

Esta precisin creciente es debida a que las propiedades de cada nivel son acumulativas: el nivel 4 tiene las caractersticas de los tres anteriores, ms alguna nueva. El nivel 3 tiene las caractersticas de los dos anteriores, ms otras nuevas que harn que ese nivel sea ms exacto y por tanto, ms informativo acerca de la propiedad o variable a medir. En un sentido genrico, una escala es el conjunto de categoras (o valores) de una variable, conjunto que, como qued dicho, debe ser exhaustivo y mutuamente excluyente. Estas categoras o valores podemos representarlas grficamente mediante los puntos de una lnea recta para una mejor visualizacin. Ejemplos: FIGURA 1

Escala nominal

Jud o

Catl

Bud i

Prot

Otro

Ejemplo: religin

Escala ordinal

Diam

Hierr o

Cuer

Cart n

Papel

Ejemplo: dureza

Escala de intervalos

-2

-1

+1

+2

+3

Ejemplo: temperatura

Escala de cocientes

0m

1m

2m

3m

Ejemplo: altura

Una escala nominal es simplemente un conjunto de dos o ms categoras de una variable, sin que interese el orden o la jerarqua entre ellas. La escala nominal de la variable religin son sus distintas categoras: judo, catlico, etc. El requisito fundamental que deben reunir es que sean distintas entre si de manera que no puede haber dos categoras con el mismo nombre, ni dos categoras que se superpongan (como

cristianos y catlicos). Obviamente, adems las categoras deben ser homogneas: todas deben referirse a religiones y no a partidos polticos, oficios o lugares de nacimiento. Una escala nominal para la variable profesin puede representarse de cualquiera de las siguientes maneras, entre otras: FIGURA 2

Mdico

Dentista

Psiclog o

Veterin

Ingeniero

Arquitecto

Dentista

Veterin

Psiclog o

Mdico

Arquitecto

Ingeniero

Este ejemplo muestra que en una escala nominal no interesa ni el orden en que colocamos las categoras, ni la distancia que hay entre ellas. Si la variable hubiese sido prestigio de una profesin aqu s hubiera importado el orden, pues hay profesiones ms prestigiosas y menos prestigiosas. Tampoco la escala nominal informa sobre las distancias entre las categoras: subjetivamente podemos pensar que la distancia entre un mdico y un dentista no es la misma que hay entre un ingeniero y un arquitecto, pero esta informacin no nos es suministrada por la escala nominal. Otro ejemplo de variable medible nominalmente es la numeracin del 1 al 11 de los jugadores de un equipo de ftbol. Aqu, puesto que las categoras son numricas podramos pensar que estamos ante una variable cuantitativa y por tanto medible en los niveles 3 o 4, pero si pensamos as estaremos equivocados. Aqu los nmeros no funcionan como tales en el sentido que no podemos manipularlos aritmticamente sumndolos, restndolos, etc., sino slo como simples etiquetas: el 1 representa simplemente la palabra arquero, el 10 delantero, etc. Nadie afirmara que el jugador con el nmero 6 es dos veces ms capaz que el jugador nmero 3. Los nmeros empiezan a funcionar como indicadores de cantidad recin en las escalas cuantitativas. En la escala ordinal, adems de la homogeneidad y la diferenciabilidad entre categoras, importa el orden en que ellas se disponen. Las variables dureza de los materiales y prestigio de una profesin son ordinales, pues los materiales pueden ordenarse segn su dureza y las profesiones de acuerdo a su prestigio. Una escala ordinal para la variable prestigio ocupacional puede graficarse de cualquiera de las siguientes formas, entre otras: FIGURA 3

Basurero

Zapatero

Ejecutivo

Basurero

Zapatero

Ejecutivo

Esto nos muestra que sea cual fuere la forma de representacin, siempre ha de respetarse el orden. Este tipo de escalas tiene una ventaja sobre las nominales, pero tambin tiene una limitacin: la escala ordinal me informa si un individuo tiene mayor o menor prestigio ocupacional que otro, pero no me dice cunto en forma objetiva. Esto ltimo es importante porque subjetivamente uno podra pensar que un ejecutivo tiene tres veces ms prestigio que un zapatero, pero este criterio no sera compartido por otras personas, y una escala ha de ser la misma para todos. Otros ejemplos de variables medibles ordinalmente son el grado de mrito, el grado militar y la gradacin de tonos de colores. Segn la escala nominal, decimos que hemos hecho una medicin simplemente cuando afirmamos que Fulano es mdico, y segn la escala ordinal cuando afirmamos que Fulano tiene una ocupacin ms prestigiosa que Zutano, aunque no sepamos cunto ms prestigiosa es. Mientras una escala nominal permite hacer identificaciones, o poner nombres (de all la expresin nominal), la escala ordinal permite hacer comparaciones cualitativas.

Las comparaciones cuantitativas, o sea la medicin numrica, se hace posible recin con las escalas cuantitativas. Si examinamos las escalas cualitativas (nominales y ordinales) veremos que los intervalos o distancias entre las categoras (o sea las distancias entre los puntos de la recta) son irregulares y no responden a ningn criterio objetivo, aunque s a muchos subjetivos. En la figura 3 vemos que zapatero puede estar ms cerca de basurero segn algunos, o ms cerca de ejecutivo segn otros. La escala ordinal permite comparar profesiones en cuanto a prestigio, pero no permite comparar distancias entre profesiones, o sea no es posible saber cunto mayor es la distancia de basurero a zapatero respecto de la distancia entre zapatero y ejecutivo. En este sentido, las escalas cuantitativas son an ms informativas. A los requisitos de homogeneidad, diferenciabilidad y orden se agrega uno nuevo: los intervalos deben ser regulares, y ms especficamente iguales. Las siguientes tres escalas representan todas ellas intervalos iguales, o sea que los intervalos o distancias entre los puntos estn determinados segn un cierto criterio matemtico: FIGURA 4

1 10 1

16

En la primera vemos que los intervalos son iguales, pues la distancia que hay de 1 a 2 es igual a la distancia que hay entre 2 y 3, etc., todo lo cual, dicho matemticamente, equivale a afirmar que 1-2 = 23, etc. Por la misma razn en la segunda escala las distancias tambin son iguales aunque hayamos tomado intervalos mayores. En la tercera ya parecera que los intervalos no son iguales pues van aumentando cada vez ms hacia la derecha, pero si consideramos que se trata de una escala logartmica (y no lineal como las dos anteriores), veremos que tambin sus intervalos son iguales segn la siguiente serie de igualdades, donde en vez de restar, dividimos: 1 2 4 8 ------ = ------ = ------ = ------ = etc 2 4 8 16 Esta misma serie, expresada logartmicamente, es log1-log2 = log2-log3, etc, o sea que en vez de restar nmeros como en la escala lineal restamos logaritmos, pero igualmente sigue cumplindose la condicin de igualdad de intervalos. Toda escala que tenga intervalos iguales se llama escala mtrica, y a este nivel ya s tiene sentido definir medicin ms familiarmente como la operacin por la cual comparamos una cierta cantidad con otra tomada como nidad. Por ejemplo, decimos que hemos medido el peso de Fulano cuando hemos dicho que pesa 60 kg, o sea, su peso entra 60 veces en la unidad de medida de 1 kg. Estas escalas mtricas, tpicas de los niveles cuantitativos de medicin, siguen conservando las caractersticas de diferenciabilidad (o identidad), y orden de la escala ordinal, pero se agregan otras nuevas: no slo me dice que los pesos 35 kg y 70 kg son distintos (identidad), y no slo me dice que 70 es un peso mayor que 35 (orden), sino que adems me agrega nueva informacin al decirme: (a) que 70 kg es cuantitativamente tan distinto de 35 kg como 35 kg lo es de 0 kg; y (b) que 70 kg es dos veces ms pesado que 35 kg, o sea, me informa acerca de cunto ms pesado es un objeto que otro. Las escalas de intervalos iguales slo nos pueden dar la informacin (a), mientras que la escala de cocientes o razones, adems, nos suministra la informacin (b), con lo cual esta ltima resulta ser ms precisa o con mayor contenido informativo. Establezcamos ms en detalle las diferencias entre ambas escalas cuantitativas, para lo cual comenzaremos por distinguir las escalas absolutas y las relativas. Supongamos que tomamos cinco objetos cualesquiera y medimos sus alturas, graficando del siguiente modo sus valores respectivos: FIGURA 5

A 1m

B 2m

C 3m

D 4m

E 5m

Es indudable que estas alturas son reales: el objeto A mide efectivamente dos metros, el objeto B tres metros, etc. A estas escalas cuyos nmeros representan realmente el atributo fsico las llamamos absolutas y en ellas, obviamente, la cifra 0 corresponder a la ausencia de altura. Pero supongamos ahora que queremos considerar la altura A, que es dos metros, como altura 0 en forma arbitraria. La escala anterior y la nueva quedarn entonces correlacionadas del siguiente modo: FIGURA 6

A 2m

B 3m

C 4m

D 5m

E Escala absoluta 6m Escala relativa

0m

1m

2m

3m

4m

En esta nueva escala el objeto B no tiene realmente un metro de altura: slo nos dice que B es un metro ms alto que A, es decir marca su ubicacin respecto de otro objeto. De la misma forma esta escala no dice que A no tenga altura, sino que arbitrariamente le hemos asignado el valor 0 para que sirva de punto de referencia de los dems valores: es una escala relativa o arbitraria. Obviamente, si disponemos de una escala relativa y conocemos adems la altura absoluta de uno cualquiera de los objetos, podremos calcular la altura absoluta de los dems (tambin necesitamos una regla de transformacin, pero de esto no nos ocuparemos). Tambin podramos haber asignado el valor cero no a 2 sino a la media aritmtica, que en nuestro ejemplo coincide con 4 metros. La nueva escala relativa quedara entonces representada del siguiente modo: FIGURA 7

A 2m

B 3m

C 4m

D 5m

E Escala absoluta 6m Escala relativa

-2m 2m

-1m

0m

1m

Estrictamente hablando no tiene sentido decir que algo mide menos 2 metros (-2), pues no hay alturas negativas, pero no obstante esa cifra aparecida en la nueva escala nos est diciendo algo: que el objeto A es tan alto con respecto al objeto B como ste con respecto al C, que es la media, y el signo negativo nos indica solamente que la altura de A est por debajo de la media aritmtica. Del mismo modo la altura cero no significa aqu ausencia de altura, error que cometi aquel tipo que, cuando le dijeron que haca cero grado de temperatura exclam alborozado: No hace ni fro ni calor!. Galeno haba sugerido como punto cero de temperatura un calor neutro que no era ni fro ni calor, pero Galeno estaba en realidad proponiendo una simple convencin. Vemos as que la escala de temperatura es un tpico ejemplo de escala relativa (con un cero arbitrario). En las escalas de intervalos iguales tenemos escalas relativas (o sea con un cero arbitrario) y en las escalas de cocientes o razones tenemos escalas absolutas (con un cero absoluto o real). El cero arbitrario no corresponde con la ausencia de la magnitud (cero grado no significa ausencia de temperatura), pero el cero absoluto es real (cero metros significa ausencia de altura). Ntese que lo que interesa es la ausencia de la variable, no del individuo. Tanto cero metros como cero cantidad de hijos significa ausencia de altura

y ausencia de hijos, y no interesa que el primer valor corresponda a un individuo inexistente y el segundo a una pareja que s podra existir. Las escalas de cocientes o razones son muy difciles de encontrar en psicologa y en general en las ciencias sociales: en estas disciplinas se manejan variables que, como motivacin, inteligencia o aprendizaje, son muy difciles (o carecera de sentido) identificar su ausencia real, o sea asignarles un cero absoluto, y en general sus valores se consiguen establecer por comparacin con otros valores. Efectivamente, existen ciertas variables a las cuales no puede asignrsele un cero real, por cuanto no se considera que esa variable pueda estar ausente en la realidad. Tal es el caso de la ansiedad o la inteligencia: nadie, por menos ansioso o por menos inteligente que sea, puede tener ansiedad o inteligencia nulas.
Pero, ms exactamente, porqu las variables psicolgicas suelen medirse con escalas relativas y las variables fsicas con escalas absolutas? O, si se prefiere, qu nos obliga a medir ciertas variables mediante escalas relativas, cuando en rigor sera preferible usar escalas absolutas por ser ms precisas y exactas? Esta interesante cuestin tiene su complejidad, no obstante lo cual orientaremos una respuesta en algn sentido que pueda interesarnos como investigadores en ciencias sociales. Para ello comparemos un fsico que debe medir la altura de 10.000 objetos, y un psiclogo que debe medir la inteligencia de 10.000 sujetos de la misma edad. Una vez que hicieron sus respectivas mediciones, cada uno obtiene un promedio: el promedio de alturas es 1,53 metros, y el promedio de inteligencias es 100. Acto seguido, si ahora el psiclogo encuentra una persona y, tras medir su inteligencia encuentra que tiene un valor 60, con justa razn puede decir que tiene una inteligencia inferior a lo normal; pero si el fsico encuentra un objeto que mide apenas 0,42 metros no tendr sentido que diga que su altura es inferior a lo normal o que se trata de un objeto retrasado en cuanto a altura. No es este el tipo de comparacin que le interesa hacer al fsico, pero s al psiclogo. Este ltimo desea saber si una persona est por encima o por debajo de la media de su edad. Las escalas relativas como la inteligencia toman como punto de referencia no un cero absoluto sino un promedio estadstico al cual puede asignrsele tanto el valor 0 como el valor 100 o cualquier otro, y entonces estas escalas relativas son especialmente aptas para comparar la situacin de un individuo respecto de otros y ver as si tiene ms o si tiene menos inteligencia que el resto. Ms an: si quien mide altura no es un fsico sino un mdico o un psiclogo (por tanto ya estamos midiendo personas, no objetos), empiezan a cobrar sentido las expresiones altura normal o altura anormal, por la misma razn que tiene sentido hablar de inteligencia normal o inteligencia anormal. Quienes construyeron los tests de inteligencia no empezaron eligiendo a un individuo con inteligencia nula (o sea, un cero absoluto) y a partir de all luego los dems valores (10, 20, 30, etc). Ellos comenzaron eligiendo una gran cantidad de individuos y luego obtuvieron un promedio (supuestamente el promedio de toda la poblacin humana, si acaso la muestra fuese representativa). A dicho promedio le adscribieron convencionalmente el valor 100 y as, si algn nuevo sujeto llegara a obtener cero segn esta nueva escala, no significar que no tiene inteligencia (cero absoluto), sino slo que su capacidad intelectual est muy por debajo de la media poblacional (cero relativo). Hasta aqu puede quedar justificado el uso de escalas relativas en ciencias sociales, pero, entonces, porqu ciertas magnitudes fsicas como la temperatura se miden habitualmente en escalas relativas y no absolutas, que ya dijimos seran preferibles? En el caso especial de la temperatura podemos invocar razones histricas y prcticas. Tomemos con la mano un objeto cualquiera: inferimos que tiene una cierta temperatura a juzgar por la sensacin trmica que nos produce. Supongamos ahora que el cuerpo que sostenemos se empieza a enfriar. Llegar un momento en que el fro es tan intenso que nuestros dedos se congelan y dejan de funcionar nuestros termorreceptores, o sea, no experimentamos ya ninguna sensacin y quedamos anestesiados. Significa esto que el cuerpo no puede seguir enfrindose? No. Puede seguir hacindolo aunque ya no podamos darnos cuenta por el tacto, y entonces, para averiguarlo, decidimos tomar otro punto de referencia, como por ejemplo su dureza. Podemos as saber si se sigue o no enfriando examinando si su dureza aumenta o no, pero aqu tambin la dureza puede tener un lmite, y el hecho de que el cuerpo haya alcanzado una dureza mxima y no pueda endurecerse ms, ello no significa necesariamente que no pueda seguir enfrindose. De hecho, podemos seguir eligiendo ms criterios hasta el infinito, pero la termodinmica ha venido a resolver este problema tomando como punto de referencia no la sensacin trmica ni la dureza del cuerpo, sino el movimiento de sus molculas. Y as, cuando las molculas cesan todo movimiento el cuerpo ya no podr seguir enfrindose alcanzando entonces lo que se llama su temperatura absoluta, designada convencionalmente como el cero grado en la escala Kelvin, creada a tal efecto. Esta escala es absoluta porque el cero grado corresponde realmente a la ausencia de temperatura. Podra argumentarse que esto no es as que cero grado est indicando un fro intenssimo en lugar de ausencia de temperatura pero no debemos olvidar que la termodinmica, al crear esta escala, equipar temperatura a movimiento molecular y no a sensacin trmica y entonces el cero grado, al indicar ausencia de movimiento molecular, indica tambin ausencia de temperatura. Si nuestros termorreceptores pudiesen hipotticamente percibir la sensacin trmica a cero grado Kelvin sin quedar arruinados, seguramente retiraramos violentamente la mano y nadie podra convencernos de que all no hay temperatura, pero esto es porque estamos habituados a equiparar temperatura con sensacin trmica y no con movimiento molecular. Por lo dems, se supone que el cero absoluto es inalcanzable tanto tcnicamente como en teora, porque si cesara el movimiento molecular la materia dejara de existir. La idea de equiparar temperatura con movimiento molecular deriva de la teora cintica del calor del siglo pasado, y sostiene que el movimiento genera calor. Entonces, si las molculas comienzan a moverse cada vez ms rpidamente, el cuerpo empezar a aumentar su temperatura. Obviamente que esto no es ms que una teora: el da de maana puede aparecer otra que tome como referencia de temperatura no el movimiento sino otro parmetro hoy desconocido, con lo cual se construir una nueva escala con el cero ms alejado y donde el cuerpo podr seguir enfrindose an cuando haya cesado todo movimiento molecular. Esto prueba que, en el fondo, el cero absoluto es paradjicamente relativo, pues todo depender de qu significado le demos a temperatura: si sensacin trmica, dureza, movimiento molecular o un parmetro an no descubierto. Histricamente, la primera escala de temperatura que se cre no fue la escala Kelvin, ya que no exista la idea de vincular la temperatura con el movimiento molecular y construir, sobre esa base, una escala. Pero los fsicos necesitaban contar igualmente con alguna que pudiese medir esta magnitud, y fue as que se crearon varias, como la escala centgrada (Celsius), la escala Farenheit y la escala Reamur. La escala Celsius le adjudic un poco arbitrariamente el cero al punto de congelamiento del agua y el 100 a su punto de ebullicin (todo a presin

atmosfrica normal), dividindose luego en 100 partes iguales la escala entre uno y otro valor. Presumiblemente la practicidad de esta escala radica en el hecho de que la mayora de los objetos que manipulamos o los ambientes donde habitamos estn entre 0 y 100 grados Celsius, utilizndose la escala Kelvin slo para objetos muy fros. Haciendo las transformaciones necesarias (0 grado Kelvin corresponden a -273 grados Celsius) podramos usar tambin la escala Kelvin pero no lo hacemos, entre otras razones, por una cuestin psicolgica o de acostumbramiento a las mismas cifras de siempre. En otros casos el desacostumbramiento puede ser menos difcil, y es cuando no hay que habituarse a nuevas cifras sino simplemente a nuevas denominaciones. Tal es el caso del pasaje de los milibares a los hectopascales (escala de presin atmosfrica): aqu no se cambi de escala sino de nombre, ya que, por ejemplo, 1008 hectopascales siguen siendo 1008 milibares.

Adems del hecho de que una tiene un cero arbitrario y la otra un cero absoluto, hay otra diferencia entre las escalas relativas y absolutas, y que de alguna forma ya empezamos a adelantar. En las escalas de intervalos iguales, que son relativas, no se puede decir que un sujeto con CI 160 tenga el doble de inteligencia que otro de 80, del mismo modo que dos grados no es el doble de temperatura que un grado en la escala Celsius. A lo sumo podemos llegar a decir que la diferencia de inteligencia que hay entre 120 y 140 es la misma que hay entre 100 y 120. En las escalas de cocientes, que son absolutas, podemos obtener en cambio ambos tipos de informacin como ocurre con las escalas de peso, sonido, longitud o densidad. Adems de la inteligencia, otras escalas de intervalos iguales son la energa y las fechas del calendario: del 2 al 4 de junio hay el mismo intervalo temporal que hay entre 4 y 6 de junio, pero carecer de sentido decir que el 4 de junio es el doble del 2 de junio. Observemos la figura 6. En la escala absoluta s tiene sentido decir que 6 metros (altura del objeto E) es el doble de 3 metros (la altura de B). O sea, se cumple la igualdad E = 2.B. Si intentamos trasladar esto mismo a la escala relativa esta igualdad no se cumple, pues 4 no es el doble de 1. Para que la expresin E = 2.B valga en la escala relativa debemos sumarle el nmero 2, que es la distancia que hay entre el cero arbitrario y el absoluto (ya que aqu la escala relativa aparece corrida dos lugares). La nueva frmula para esta escala ser E = 2.B + 2, y entonces s se cumple que 4 = 2.1 + 2. Todo esto es bastante terico, porque slo lo podemos hacer si conocemos el corrimiento de la escala relativa respecto de la absoluta, o sea, si conocemos la distancia del cero arbitrario al cero absoluto, cosa que no siempre podemos hacerlo ni tampoco necesitarlo. Desde este punto de vista, la escala absoluta pasa a ser un caso especial de la escala relativa donde la distancia entre los ceros arbitrario y absoluto es nula. Esta clasificacin en cuatro niveles ya es clsica y corresponde a Stevens, pero no han faltado otras variantes entre las que podemos mencionar la de Coombs, quien agrega dos niveles ms: a) Entre la nominal y la ordinal incluye la escala parcialmente ordenada (figura 8). Se trata en ltima instancia de una variante de la escala ordinal donde en algunas categoras, como B y C, no se conoce la relacin de mayor o menor que tienen entre s: A es mayor que B o que C, y por otro lado B o C son mayores que D, pero se desconoce si B es mayor, menor o igual a C. FIGURA 8

A > B > C > D > E B A > C > D > E

Escala ordinal

Escala parcialmente ordenada

b) Entre la ordinal y la de intervalos iguales, Coombs agrega la escala mtrica ordenada, una variante de la escala de intervalos iguales donde en vez de ser estos iguales son distintos pero estn ordenados creciente o decrecientemente. A diferencia de la escala meramente ordinal, aqu no slo se ordenan las categoras, sino tambin los intervalos de acuerdo a su tamao. Evidentemente informa ms que la simple escala ordinal pero menos que la de intervalos iguales propiamente dicha, pues no aclara cunto mayor es un intervalo que otro. Siempre estamos haciendo mediciones. Por ejemplo, cuando decimos que tal o cual individuo es catlico (medicin nominal), o que tal sujeto tiene ms mrito que otro (medicin ordinal), o cuando decimos que tal otro sujeto tiene 30 aos (medicin intervalar). Pero la importancia de la medicin no reside simplemente en el hecho de que siempre estamos haciendo mediciones, sino en que el acto de medir nos permite conocer cmo varan los fenmenos de la realidad tanto en cantidad como en calidad, lo cual a su

vez es muy importante porque es gracias a que existen unas variaciones que dependen causalmente de otras, que podemos organizar nuestro conocimiento del mundo.

CAPTULO 2: ESTADSTICA DESCRIPTIVA


2.1 GENERALIDADES El propsito fundamental de la estadstica descriptiva es resumir y organizar una gran cantidad de datos referentes a una muestra (lo ms habitual) o a una poblacin. Se supone que los datos resumidos y organizados permiten describir adecuadamente la muestra o la poblacin a los efectos de conocerla y, eventualmente, utilizarlos en la estadstica inferencial para obtener conclusiones a partir de ellos. Para resumir y organizar los datos se utilizan diferentes procedimientos, llamados tcnicas descriptivas: la matriz de datos permite ordenarlos, las tablas de frecuencias (o tablas de distribucin de frecuencias) permiten agruparlos, los grficos permiten visualizarlos, y las medidas estadsticas y las medidas de asimetra y curtosis permiten resumirlos reducindolos a un solo dato. Secuencia para organizar y resumir datos individuales A medida que se van utilizando estos procedimientos, los datos van quedando cada vez ms resumidos y organizados. El empleo de dichos procedimientos propios de la estadstica descriptiva sigue un orden determinado, como puede apreciarse en el siguiente esquema:

DATOS ORDENADOS (matriz de datos)

DATOS RECOLECTADOS (entrevistas, cuestionarios, tests, etc)

DATOS AGRUPADOS POR FRECUENCIA (tabla de frecuencias)

DATOS AGRUPADOS POR INTERVALOS (tabla de frecuencias por intervalos)

DATOS VISUALIZADOS (grficos)

DATOS SINTETIZADOS (medidas estadsticas y medidas de asimetra y curtosis)

Como puede verse: a) Los datos quedan recolectados mediante entrevistas, cuestionarios, tests, etc. b) Los datos quedan ordenados mediante una matriz de datos (lo cual permite resumir la informacin en unas pocas pginas). c) Los datos quedan agrupados mediante tablas de frecuencias (lo cual permite resumir la informacin en una sola pgina). d) Los datos quedan visualizados mediante grficos. e) Los datos quedan sintetizados mediante las medidas estadsticas y otras (lo cual permite resumir la informacin en uno o dos renglones). Puede entonces decirse que, mediante una matriz de datos, una tabla de frecuencias (1), un grfico o con medidas estadsticas, etc, la muestra o la poblacin (conjuntos de datos) puede quedar adecuadamente descrita. Estas sucesivas abstracciones estadsticas implican: a) la reduccin del espacio fsico donde queda guardada la nueva informacin, y b) la desaparicin de considerable informacin irrelevante. Debe distinguirse el fin o propsito perseguido (por ejemplo ordenar los datos), del medio utilizado para ello, que e la tcnica descriptiva (por ejemplo, la matriz de datos). 2.2 ORDENAMIENTO Y AGRUPACIN DE LOS DATOS: MATRICES Y TABLAS Una vez que los datos han sido recolectados, se procede a continuacin a ordenarlos en una matriz de datos y luego a agruparlos en una tabla de frecuencias. La forma de ordenarlos y agruparlos depender del tipo de variable considerada. Por ejemplo, si son datos relativos a variables cualitativas (niveles de medicin nominal y ordinal), no podremos utilizar tablas de

frecuencias por intervalos. El siguiente cuadro indica de qu manera se pueden ordenar y agrupar los datos segn cada nivel de medicin de la variable: Ejemplos de organizacin de los datos segn el nivel de medicin Datos ordenados Nivel nominal (Ejemplo: variable religin) Matriz de datos Sujeto x (religin) Juan Catlica Pedro Catlica Mara Juda Antonio Protestante Luis Protestante Jos Protestante Matriz de datos Sujeto x (clase social) Juan Alta Pedro Media Mara Media Antonio Media Luis Baja Jos Baja Datos agrupados por frecuencia Tabla de frecuencias x (religin) f Catlica 2 Juda 1 Protestante 3 n=6 f = frecuencia n = tamao de la muestra Tabla de frecuencias x (clase social) Alta Media Baja f 1 3 2 n=6 Datos agrupados por intervalos

Nivel ordinal (Ejemplo: variable clase social)

f = frecuencia n = tamao de la muestra

Nivel cuantitativo (Ejemplo: variable edad)

Matriz de datos Sujeto x (edad) Juan 15 Pedro 15 Mara 15 Antonio 16 Luis 16 Jos 16 Ana 16 Gabriela 16 Susana 17 Martn 17 Sergio 17 Pablo 17 Daniel 17 Graciela 17 Daniela 17 Beatriz 17 Oscar 18 Felipe 18 Alberto 18 Mnica 19 Marta 19 Mariana 20

Tabla de frecuencias x (edad) 15 16 17 18 19 20

f 3 5 8 3 2 1 n = 22

Tabla de frecuencias por intervalos x (edad) f 15-16 8 17-18 11 19-20 3 n = 22 f = frecuencia n = tamao de la muestra

f = frecuencia n = tamao de la muestra

Una vez confeccionada la matriz de datos, se procede luego a resumir an ms esta informacin mediante una tabla de frecuencias o, si cabe, en una tabla de frecuencias por intervalos. Una tabla de este ltimo tipo se justifica cuando la tabla de frecuencias original es demasiado grande y por tanto de difcil manejo para procesar la informacin. Sea de la forma que fuere, los datos ordenados segn sus frecuencias suelen denominarse distribucin de frecuencias (13). Las tablas de frecuencias contienen tres elementos importantes: las frecuencias, el tamao de la muestra y los intervalos (en este ltimo caso slo para variables cuantitativas).

a) Frecuencia.- La frecuencia (f) se define como la cantidad de datos iguales o que se repiten. Por ejemplo: la frecuencia 2 indica que el dato catlico se repite dos veces, la frecuencia 3 que el dato clase media se repite tres veces, y la frecuencia 8 que el dato 17 aos se repite ocho veces. A veces resulta necesario expresar las frecuencias de otra manera, como puede apreciarse en la siguiente tabla ilustrativa: Tipos de frecuencias que pueden indicarse en una tabla de frecuencias x (edad) 15 16 17 18 f 3 7 8 2 n = 20 f% 15% 35% 40% 10% n = 100% F 3 10 18 20 -----F% 15% 50% 90% 100% -----fr 0.15 0.35 0.40 0.10 n=1 Fr 0.15 0.50 0.90 1 ------

Frecuencia absoluta (f).- Es la cantidad de datos que se repiten. Por ejemplo, la frecuencia 3 indica que hay tres personas de 15 aos. La suma de todas las frecuencias absolutas equivale al tamao de la muestra. Frecuencia porcentual (f%).- Es el porcentaje de datos que se repiten. Por ejemplo, la frecuencia porcentual 15% indica que el 15% de la muestra tiene la edad de 15 aos. La suma de todas las frecuencias porcentuales es 100%. Frecuencia acumulada (F).- Es el resultado de haber sumado las frecuencias anteriores. Por ejemplo, la frecuencia acumulada 10 resulta de sumar 7+3, e indica la cantidad de veces que se repiten las edades 16 y 15. La ltima de todas las frecuencias acumuladas, que en el ejemplo es 20, debe coincidir con el tamao de la muestra. Frecuencia acumulada porcentual (F%).- Es el porcentaje de las frecuencias acumuladas. Frecuencia relativa (fr).- A veces tambin llamada proporcin, es el cociente entre la frecuencia de un dato x y la frecuencia total o tamao de la muestra. En la prctica, el tamao de la muestra se considera como 1, a diferencia del tamao de la muestra en la frecuencia porcentual, que se considera 100%. Frecuencia relativa acumulada (Fr).- Es el resultado de haber sumado las frecuencias relativas anteriores. Por ejemplo: la frecuencia relativa 0.90 indica que en 0.90 casos sobre 1 las edades estn comprendidas entre 15 y 17 aos. Frecuencias parciales y frecuencia total.- Tanto las frecuencias absolutas como las porcentuales o las relativas pueden ser frecuencias parciales o una frecuencia total, siendo sta ltima la suma de todas frecuencias parciales. Las frecuencias porcentuales y las frecuencias relativas comparan la frecuencia parcial con la frecuencia total, y sirven para establecer comparaciones entre muestras distintas. Por ejemplo, si en una muestra de 1000 hombres, solo votaron 200, y en una muestra de 600 mujeres solo votaron 200 mujeres, en trminos de frecuencias absolutas existe la misma cantidad de votantes masculinos y femeninos, es decir 200, pero en proporcin, las mujeres votaron ms (la tercera parte del total) que los hombres (la quinta parte del total). Esta informacin se obtiene al convertir las frecuencias absolutas en frecuencias porcentuales o en frecuencias relativas (o proporciones). 2) Tamao de la muestra.- Otro concepto importante es el tamao de la muestra (n), que designa la cantidad total de datos. Obviamente, la suma de todas las frecuencias f debe dar como resultado el tamao n de la muestra, por lo que el tamao de la muestra coincide con la frecuencia total. 3) Intervalos.- Un intervalo, tambin llamado intervalo de clase, es cada uno de los grupos de valores ubicados en una fila en una tabla de frecuencias. Por ejemplo el intervalo 15-16 significa que en esa fila se estn considerando las edades de 15 a 16 aos. La frecuencia correspondiente a un intervalo es igual a la suma de frecuencias de los valores en l includos (2). Los intervalos presentan algunas caractersticas, que son las siguientes: Tamao del intervalo (a).- Tambin llamado amplitud o anchura del intervalo, es la cantidad de valores de la variable que se consideran conjuntamente en ese intervalo. Por ejemplo, el intervalo 15-16 aos tiene una amplitud de 2, puesto que se consideran dos valores: 15 y 16. En otro ejemplo, el intervalo 20-25 aos tiene una amplitud de 6, puesto que se consideran seis valores. En general, puede calcularse el tamao de un intervalo restando el lmite superior y el inferior y sumando al resultado el nmero 1. Por ejemplo, 25 menos 20 da 5, y sumndole 1 da 6. Los ejemplos indicados corresponden a variables discretas, lo que significa que no podrn encontrarse valores intermedios entre dos intervalos. Por ejemplo, entre los intervalos 15-16 y 17-18 no se encontrarn valores intermedios entre 16 y 17 aos. Tngase presente que: a) preferiblemente los intervalos deben tener un tamao constante, de manera tal que no se pueden considerar como intervalos 15-16 y 17-20, porque tienen diferentes tamaos; y b) los intervalos han de ser mutuamente excluyentes, de manera tal que cuando se trata de variables discretas, no pueden definirse los intervalos 15-16 y 16-17, porque el valor 16 aos est en ambos intervalos y no se podr saber con seguridad en qu intervalo ubicar dicho valor.

El problema se puede presentar con las variables continuas, donde, por definicin, podra aparecer algn valor intermedio entre dos intervalos. Por ejemplo, si se considera la variable continua ingresos mensuales y se consideran en ella los intervalos 1000-2000 dlares y 3000-4000 dlares, puede ocurrir que un dato obtenido de la realidad sea 2500 dlares, con lo cual no podr ser registrado en ningn intervalo. En tal caso se deberan reorganizar los intervalos como 1000-2999 dlares y 3000-4999 dlares, con lo cual el problema estara resuelto. Desde ya, puede ocurrir que aparezca un ingreso mensual de 2999,50 dlares, en cuyo caso en principio deberan reorganizarse nuevamente los intervalos como 1000-2999,50 dlares y 2999,51-4999 dlares. La forma de reorganizar los intervalos depender entonces del grado de precisin que pretenda el investigador o del grado de precisin del instrumento de medicin disponible. Lmites del intervalo.- Todo intervalo debe quedar definido por dos lmites: un lmite inferior y un lmite superior. Estos lmites, a su vez, pueden ser aparentes o reales (Pagano, 1998:38-39). Considrese el siguiente ejemplo: Lmites aparentes 95-99 90-94 85-89 80-84 75-79 Lmites reales 94.5-99.5 89.5-94.5 84.5-89.5 79.5-84.5 74.5-79.5

Si la variable considerada es discreta, carecer de sentido la distincin entre lmites reales o aparentes. Si se conviene que los valores que la variable puede adoptar son nmeros enteros, se considerarn solamente los intervalos 95-99, 90-94, etc. Estos intervalos son en rigor reales, porque expresan los valores reales que puedan haber, que no son fraccionarios. Slo en el caso de las variables continuas adquiere sentido la distincin entre lmites reales y aparentes. Si la variable es continua, deberan tenerse en cuenta los lmites reales. Por ejemplo, si un valor resulta ser 94.52, entonces ser ubicado en el intervalo 94.5-99.5. Sin embargo, an en estos casos, lo usual es omitir los lmites reales y presentar slo los lmites aparentes (Pagano, 1998:39). En todo caso, los lmites reales se utilizan a veces cuando se intenta transformar la tabla de frecuencias por intervalos en un grfico. En principio, en ningn caso deber haber una superposicin de valores, como en el caso de los intervalos 20-21 y 21-22, donde el valor 21 est includo en ambos intervalos, violndose as la regla de la mutua exclusin. Si acaso se presentara esta situacin, o bien podr ser adjudicada a un error del autor de la tabla, o bien deber traducrsela como 20-20.99 y 21-22.99. Punto medio del intervalo (xm).- Es el valor que resulta de la semisuma de los lmites superior e inferior, es decir, el punto medio del intervalo se calcula sumando ambos lmites y dividiendo el resultado por dos. Por ejemplo, el punto medio del intervalo 15-20 es 17.5. El punto medio del intervalo sirve para calcular la media aritmtica. Intervalos abiertos y cerrados.- Idealmente, todos los intervalos deberan ser cerrados, es decir, deberan estar especificados un lmite superior y uno inferior de manera definida. Sin embargo, en algunos casos se establecen tambin intervalos abiertos, donde uno de los lmites queda sin definir. En el siguiente ejemplo, 18 o menos y 29 o ms son intervalos abiertos. Obviamente, en este tipo de distribucin los intervalos dejan de ser de tamao constante. Intervalos 18 o menos 19-23 24-28 29 o ms Cantidad de intervalos.- La cantidad de intervalos es inversamente proporcional al tamao de los mismos: cuanto menor tamao tienen los intervalos, ms numerosos sern. El solo hecho de emplear intervalos supone una cierta prdida de la informacin. Por ejemplo, si se considera el intervalo 15-18 aos, quedar sin saber cuntas personas de 16 aos hay. Para reducir esta incertidumbre, podra establecerse un intervalo menor (15-16 aos), pero con ello habr aumentado la cantidad de intervalos hasta un punto donde la informacin se procesar de manera ms difcil. Consiguientemente, al agrupar los datos hay que resolver el dilema entre perder informacin y presentar los datos de manera sencilla (Pagano R, 1998:37) (Botella, 1993:54), es decir, encontrar el justo equilibrio entre el tamao de los intervalos y su cantidad. En la prctica, por lo general (Pagano, 1998:37) se consideran de 10 a 20 intervalos, ya que la experiencia indica que esa cantidad de intervalos funciona bien con la mayor parte de las distribuciones de datos (3). Se pueden sintetizar algunas reglas importantes para la construccin de intervalos de la siguiente manera: a) Los intervalos deben ser mutuamente excluyentes. b) Cada intervalo debe incluir el mismo nmero de valores (constancia de tamao).

c) La cantidad de intervalos debe ser exhaustiva (todos los valores deben poder ser includos en algn intervalo). d) El intervalo superior debe incluir el mayor valor observado (Botella, 1993:54). e) El intervalo inferior debe incluir al menor valor observado (Botella, 1993:54). f) En variables continuas, es aconsejable expresar los lmites aparentes de los intervalos, que los lmites reales. 2.3 VISUALIZACIN DE LOS DATOS: GRFICOS Una vez que los datos han sido organizados en tablas de frecuencias, es posible seguir avanzando organizndolos, desde all, de otras maneras diferentes y con distintos propsitos. Una de estas maneras es la utilizacin de representaciones grficas, algunas de las cuales son aptas para representar variables cualitativas (niveles nominal y ordinal) y otras para variables cuantitativas. Al tratarse de esquemas visuales, los grficos permiten apreciar de un golpe de vista la informacin obtenida. Diagrama de tallo y hojas Esta tcnica de visualizacin de datos es aqu mencionada en primer lugar porque puede ser considerada un procedimiento intermedio entre la tabla de frecuencias y el grfico. Fue creada por Tukey en 1977 (citado por Botella, 1993:59) y presenta, entre otras, las siguientes ventajas: a) permite conocer cada puntuacin individual (a diferencia de la tabla de frecuencias por intervalos, donde desaparecen en ellos); y b) puede ser considerada un grfico si hacemos girar 90 el listado de puntuaciones o datos. A continuacin se describe la forma de construir un diagrama de tallo y hojas, tomando como ejemplo la siguiente distribucin de datos ordenados: 32-33-37-42-46-49-51-54-55-57-58-61-63-63-65-68-71-72-73-73-73-75-77-77-78-83-85-85-91-93 Tallo 3 4 5 6 7 8 9 Hojas 237 269 14578 13358 123335778 355 13 Procedimiento para realizar el diagrama de tallo y hojas a) Se construye una tabla como la de la izquierda con dos columnas: tallos y hojas. b) Se identifican cules son los valores extremos: 32 y 93. c) Se consideran los primeros dgitos de cada valor: 3 y 9. d) En la columna tallos se colocan los nmeros desde el 3 hasta el 9. e) En la columna hojas se colocan los segundos dgitos de cada valor que empiece con 3, con 4, con 5, etc.

Girando la tabla obtenida 90 hacia la izquierda, se obtendr algo similar a un grfico de barras, que muestra por ejemplo que la mayor concentracin de valores es la que comienza con 7. Una utilidad adicional del diagrama de tallo y hojas es que permite comparar visualmente dos variables, es decir, dos conjuntos de datos en los anlisis de correlacin, como puede apreciarse en el siguiente ejemplo: Hojas (Grupo control) 87655 44322110 876655 111000 Tallo 1 2 3 4 5 Hojas (Grupo experimental)

9 124 5667788899 00023344 555

Visualmente es posible darse una idea de los resultados del experimento: los datos del grupo experimental tienden a concentrarse en los valores altos, y los del grupo de control en los valores bajos. Pictograma Es una representacin grfica en la cual se utilizan dibujos. Por ejemplo, en el siguiente pictograma cada cara puede representar 100 personas:

Varones

Mujeres

100 personas

Sector circular Representacin grfica de forma circular donde cada porcin de la torta representa una frecuencia. Para confeccionarlo se parte de una tabla de frecuencias donde estn especificadas las frecuencias en grados (f), las cuales se calculan mediante una sencilla regla de tres simple a partir de las frecuencias absolutas (f). Por ejemplo, si 825 es a 360, entonces 310 es igual a 360 x 310 dividido por 825, lo cual da un resultado de 135. Por lo tanto, para representar la frecuencia 310 deber trazarse un ngulo de 135. Estos valores pueden verse en el ejemplo siguiente, donde se han representado dos sectores circulares distintos, uno para varones y otro para mujeres: x (patologa) Angina Bronquitis Sarampin Otras Total Sexo Varones 310 297 123 95 825 Mujeres 287 429 120 80 916 Total 597 726 243 175 1691 f (varones) 135 130 54 41 360 f (mujeres) 113 169 47 31 360

Bronquitis

Bronquitis

Angina Saram pin Otras Angina Otras

Saram pin

Varones

Mujeres

Para realizar estos sectores se traza un ngulo de por ejemplo 130 y dentro de coloca la palabra bronquitis, y as sucesivamente. El crculo para mujeres es algo mayor que el crculo para hombres, porque en la muestra hay ms mujeres que hombres. Para lograr estos tamaos debe calcularse el radio. Por ejemplo, si se ha elegido un radio masculino de 4 cm, el radio femenino puede calcularse mediante la frmula siguiente: El radio femenino es igual al radio masculino multiplicado por la raz cuadrada del n femenino, resultado que se dividir por la raz cuadrada del n masculino, donde n = tamao de la muestra de cada sexo. Si el radio masculino es 4 cm, con esta frmula se obtendr un radio femenino de 4,22 cm. Diagrama de barras Representacin grfica donde cada barra representa una frecuencia parcial. En el eje de las ordenadas se indican las frecuencias absolutas, y en el eje de absisas se representan los valores de la variable x. De esta manera, las barras ms altas tienen mayor frecuencia.

Existen diferentes tipos de diagramas de barras, de los cuales se ilustran tres: las barras simples, las barras superpuestas y las barras adyacentes. Los dos ltimos tipos dan informacin sobre dos variables al mismo tiempo, que son sexo y estado civil en los ejemplos que siguen:

Barras simples

Barras superpuestas

f 25 20 15 10 5

f 25 20 15 10 5

Solteros Casados Separados x

Solteros Casados Separados

Barras adyacentes

f 25 20 15 10 5 Adolescentes

Adultos

Solteros Casados Separados

Las barras tambin pueden disponerse horizontalmente. Mediante el diagrama de barras pueden representarse variables cualitativas y cuantitativas discretas. Histograma de Pearson Utilizado para representar variables cuantitativas continuas agrupadas en intervalos, este grfico se compone de barras adyacentes cuya altura es proporcional a las respectivas frecuencias parciales. En el ejemplo siguiente, se presenta la tabla de frecuencias por intervalos y su histograma correspondiente: x (longitud) 1-1.99 2-2.99 3-3.99 Total f 3 5 2 10

f 5 4 3 2 1

1 x

Como pude apreciarse, en las absisas se indican los lmites inferiores de los intervalos. Cuando los intervalos no son iguales, en lugar de indicar las frecuencias absolutas pueden indicarse las alturas (h). Esta ltima se obtiene dividiendo la frecuencia parcial por el tamao del intervalo correspondiente. Polgono de frecuencias Es un grfico de lneas rectas que unen puntos, siendo cada punto la interseccin del punto medio del intervalo (indicado en las absisas) y la frecuencia correspondiente. Tomando el ejemplo anterior, el polgono de frecuencias sera el siguiente:

f 5 4 3 2 1

1.5

2.5

3.5

punto medio (xm)

Un polgono de frecuencias puede obtenerse tambin a partir del histograma correspondiente. Para ello basta con indicar los puntos medios de cada lnea horizontal superior de cada barra del histograma, y luego unirlos con lneas rectas. Otra alternativa para este tipo de diagrama es el polgono de frecuencias acumuladas, donde se indican las frecuencias acumuladas en lugar de las frecuencias habituales. Ojiva de Galton Grfico en el cual se consignan en las ordenadas las frecuencias acumuladas y en las absisas los lmites superiores de cada intervalo (aunque tambin pueden indicarse los puntos medios de cada intervalo). Por ejemplo: x (longitud) 1-1.99 2-2.99 3-3.99 Total f 3 5 2 10 F 3 8 10

F 10 9 8 7 6 5 4 3 2 1

1.99

2.99

3.99

lm superior (Ls)

La ojiva de Galton tambin puede representar frecuencias acumuladas decrecientes. 2.4 SNTESIS DE LOS DATOS: MEDIDAS ESTADSTICAS DE POSICIN Los datos individuales pueden ser sintetizados mediante medidas de posicin, medidas de dispersin (ambas se llaman medidas estadsticas), medidas de asimetra y medidas de curtosis. En este tem se describen las medidas de posicin. Definicin Las medidas de posicin pueden ser definidas de diversas formas (4). En esta nota proponemos la siguiente definicin: Las medidas de posicin son datos estadsticos que intentan representar un conjunto de datos individuales respecto de una variable. Esta definicin se refiere a tres cuestiones: 1) Son medidas estadsticas, es decir, no son medidas individuales. Una medida de posicin representa a todo un conjunto de datos, y no son los datos individuales. Por ejemplo, un promedio de edades representa a todas las edades del grupo, y no es la edad individual de uno de sus miembros, aunque pueda coincidir numricamente con ella. As, si el promedio de edades es 20 aos y una de las personas del grupo tiene 20 aos, el primer dato es una medida estadstica y el segundo una medida individual. En otros trminos, las medidas estadsticas no describen individuos, sino poblaciones o muestras. Por ejemplo, no tiene sentido explicar que una persona es anciana porque vive en una poblacin cuyo promedio de edad es 70 aos. 2) Son medidas representativas, es decir, intentan representar y sintetizar a todas las medidas individuales. El conjunto de todas las medidas individuales puede recibir diversos nombres, tales como muestra y poblacin, con lo cual tiene sentido afirmar proposiciones tales como una medida de posicin representa una muestra o una poblacin. Por ejemplo, es posible representar las notas obtenidas por un grupo de alumnos de diversas maneras: a) El promedio de las notas es de 7.35 puntos (en este caso usamos una medida de posicin llamada media aritmtica). b) La mitad de los alumnos ha obtenido una nota superior a 6,5 puntos (en este caso utilizamos otra medida de posicin llamada mediana). c) La nota que ms se ha repetido fue 7 puntos (en este caso usamos la medida de posicin llamada modo). La pregunta acerca de cul de las tres medidas de posicin representa mejor al conjunto de datos individuales es el problema de la representatividad de la medida de posicin, y la estadstica suministra,

como se ver, diversos criterios para evaluar la mejor forma de representar un cierto nmero de datos individuales. 3) Son medidas que miden una variable, es decir, algn atributo o propiedad de los objetos. En el ejemplo anterior la variable medida es el rendimiento acadmico, pero tambin pueden obtenerse medidas de posicin representativas de un conjunto de edades, de profesiones, de clases sociales, de puntuaciones de un test, de cantidad de dientes, etc. De otra manera: no tiene sentido decir que una medida de posicin represente un conjunto de personas, pero s tiene sentido decir que representan las edades de un conjunto de personas. Caractersticas de las principales medidas de posicin Las medidas de posicin pueden ser de tendencia central y de tendencia no central. Las primeras se refieren a los valores de la variable que suelen estar en el centro de la distribucin (Kohan, 1994:69). Por ejemplo: la media aritmtica, la mediana y el modo son las ms conocidas, pero tambin est la media aritmtica ponderada (til cuando hay valores que se repiten y que requieren atencin diferencial), la media geomtrica (Kohan, 1994:71-72), la media armnica, la media antiarmnica, la media cuadrtica, la media cbica, etc. Las medidas de posicin no centrales son los cuartiles, deciles y percentiles (Kohan, 1994:79), que reciben genricamente el nombre de cuantiles o fractiles (5). Los cuantiles se clasifican entonces en cuartiles, quintiles, deciles y percentiles, segn que dividan la serie ordenada de valores en cuatro, cinco, diez o cien partes iguales. De acuerdo a Botella (1993:99), las medidas de posicin no centrales son datos o valores que ocupan una posicin especial en la serie de datos. Cuando una medida de posicin es un dato que ocupa un lugar central, la llamamos medida de tendencia central. En el siguiente cuadro se especifican las definiciones y caractersticas principales de las medidas de posicin. Medida MODO Definicin Es el dato o valor que ms se repite, o sea, el de mayor frecuencia. Caractersticas Resulta til si hay muchos datos repetidos (altas frecuencias). Puede calcularse cuando hay valores muy extremos. El modo muestral no es un estimador suficiente del modo poblacional porque no incluye todos los datos. En distribuciones multimodales es posible que la muestra no sea homognea, y que est constituda por varios estratos. Es posible convertir una distribucin multimodal en una modal reorganizando los intervalos. Si una distribucin no tiene modo, podra obtenerse reorganizando los datos en intervalos. Es la medida ms til en escalas ordinales siempre que los valores centrales sean iguales. No est influenciada por los valores extremos (por ello por ejemplo puede aplicarse desconociendo estos o sea cuando hay lmites superiores o inferiores abiertos). Puede usarse cuando hay intervalos abiertos, siempre que el orden de la mediana no se corresponda con ellos. Es til cuando unos pocos datos difieren mucho del resto. No es til si hay muchos datos repetidos (altas frecuencias). La mediana muestral no es un estimador suficiente de la mediana poblacional porque no incluye todos los datos. Es til es distribuciones muy asimtricas (extremos no compensados). La mediana coincide con el Q2 (cuartil 2), el D5 (decil 5) y el P50 (percentil 50) (8). Est influenciada por los valores extremos (por ejemplo, no puede utilizarse cuando hay valores extremos desconocidos o intervalos abiertos, salvo que estos puedan cerrarse). No conviene cuando los valores extremos son muy altos o muy bajos. Es til en distribuciones simtricas (con extremos compensados). No puede usarse en escalas nominales ni ordinales. Es siempre superior a la media geomtrica y a la media armnica. La media muestral es un estimador suficiente de la media poblacional porque incluye todos los datos. No necesariamente coincide con alguno de los valores. La media aritmtica tiene varios otras propiedades (7). Es til cuando hay gran cantidad de valores. Puede tambin utilizarse como medida de dispersin.

MEDIANA

Es el dato o valor que divide por la mitad la serie de datos ordenados creciente o decrecienteme nte, es decir, es el valor central de la serie. Es el promedio aritmtico de todos los datos o valores.

MEDIA ARITMTICA

CUANTIL

Es el dato o valor que

-Cuartiles

-Deciles

-Percentiles

divide la serie ordenada de datos en partes iguales. Valores que dividen la serie en cuatro partes iguales. Valores que dividen la serie en diez partes iguales. Valores que dividen la serie en cien partes iguales.

Suelen utilizarse los cuartiles, los deciles y los percentiles.

Tres cuartiles dividen la serie en cuatro partes iguales.

Nueve deciles dividen la serie en diez partes iguales.

Noventa y nueve percentiles dividen la serie en cien partes iguales. Tambin se llaman centiles.

Relacin entre modo, mediana y media aritmtica.- a) La experiencia indica que la relacin entre estas tres medidas es: Modo = (3 . Mediana) (2 . Media aritmtica). Esta relacin es conocida como la frmula de Pearson. b) Cuanto ms simtrica es una distribucin (por ejemplo en una curva normal), ms tienden a coincidir los valores de las tres medidas. Media armnica y media geomtrica.- Otras medidas de posicin asociadas a la media aritmtica son la media armnica y la media geomtrica. La media armnica es una medida de posicin que suele utilizarse cuando se comparan cantidades constantes de una variable con cantidades variables de otra. Se emplea por ejemplo en fsica o en msica. La media armnica se utiliza en problemas tales como el siguiente: Cul es la velocidad promedio de un mvil que recorre una trayectoria sobre un cuadrado de 200 km de lado? Las cantidades variables son las velocidades diferentes en cada lado del cuadrado, mientras que la cantidad constante es 200 km. Para calcularla, se utiliza una frmula donde el numerador es la cantidad de lados (en este caso cuatro), y el denominador es la suma de las inversas de las diferentes velocidades (por ejemplo 1/200 kmh, ms 1/150 kmh, etc). La media geomtrica es una medida de posicin utilizada en variables tales como tasas de crecimiento, tasas de mortalidad, tasas de inters o cualquier otra expresada en porcentajes. La media geomtrica no est tan influenciada por los valores extremos como en la media aritmtica La media geomtrica se utiliza en problemas tales como el siguiente: En un banco se colocan 100$ al 10% en el primer mes, al 6% en el segundo mes, al 4% en el tercer mes y al 8% en el cuarto mes. Cul es la tasa de inters promedio obtenida? Para calcular la media geomtrica, es decir, la tasa de inters promedio, se utiliza la frmula correspondiente. En este caso se multiplican los valores $110, $106, $104 y $108, que expresan el capital no acumulado ms el inters de cada mes, y el resultado se lo eleva a la raz cuarta (porque son cuatro los meses). El resultado es $106.9 que, restado a $100, da $6.9. Esto significa que la tasa de inters promedio es del 6.9%. Clculo analtico de las medidas de posicin: frmulas Para calcular una determinada medida de posicin puede haber diversas frmulas. La eleccin de la frmula adecuada depender de la forma en que estn organizados los datos individuales. En principio, los datos pueden estar organizados de cuatro maneras: 1) Datos desordenados. Por ejemplo, las edades de un grupo de cuatro personas son 17, 29, 17 y 14. Cuando se recolecta informacin, generalmente se obtienen datos desordenados, frente a lo cual convendr ordenarlos. 2) Datos ordenados. Por ejemplo, las edades del mismo grupo de personas son 14, 17, 17 y 29, si hemos decidido ordenarlas en forma creciente, aunque tambin podemos ordenarlas decrecientemente. 3) Datos agrupados por frecuencia. Por ejemplo, hay dos edades de 17 aos, una edad de 14 aos y una edad de 29 aos. O, lo que es lo mismo, la frecuencia de la edad 17 es 2, y la frecuencia de las restantes edades es 1. 4) Datos agrupados por intervalos. Por ejemplo, hay 3 edades comprendidas en el intervalo 14-17 aos, y una edad comprendida en el intervalo 18-29 aos. La estadstica va agrupando los datos siguiendo el orden anterior. Cuanto ms avance en este proceso, ms habr logrado sintetizar y organizar los datos individuales. En el siguiente cuadro se sintetizan las diversas reglas o frmulas para calcular las medidas de posicin, segn como estn organizados los datos individuales y segn los niveles de medicin que admiten. Ntese que en algunos casos no es posible especificar ninguna frmula, y entonces el clculo se har siguiendo la

regla indicada para los mismos. Por ejemplo: para calcular el modo de un conjunto de datos ordenados, debe buscarse el dato o valor que ms se repite (6).

Clculo de medidas de posicin segn los niveles de medicin que admiten y segn la forma de organizacin de los datos individuales.
Preparado por: Pablo Cazau

Medida de posicin Modo

Nivel de medicin Nominal Ordinal Cuantitativo

Datos ordenados Valor que ms se repite Valor que ms se repite Valor que ms se repite

Datos agrupados por frecuencia Valor con la mayor frecuencia Valor con la mayor frecuencia Valor con la mayor frecuencia

Datos agrupados por intervalos

----------------------f - fant Mo = Li + ---------------------- . a (f - fant) + (f- fpos) -----------n/2 - Fant Mn = Li + ---------------------- . a f ( xm.f) X = --------n t.n/4 - Fant Qt = Li + ---------------- . a f t.n/10 - Fant Dt = Li + ---------------- . a f t.n/100 - Fant Pt = Li + ---------------- . a f

Mediana

Ordinal Cuantitativo

Valor central de la serie ordenada de valores Valor central de la serie ordenada de valores

Valor que corresponde a la frecuencia acumulada n/2 Valor que corresponde a la frecuencia acumulada n/2

Media aritmtica Cuartil

Cuantitativo

x X = ----n
Valores que dividen la serie en cuatro partes iguales. Por tanto, hay 3 cuartiles: Q1, Q 2 y Q3 Valores que dividen la serie en diez partes iguales. Por tanto, hay 9 deciles: desde el D1 hasta el D9 Valores que dividen la serie en cien parte iguales. Por tanto, hay 99 percentiles: desde el P1 hasta el P99

( x.f) X = --------n
Valor que corresponde a la frecuencia acumulada t.n/4, expresin llamada cuartil de orden o Q0 (1) Donde t puede valer 1, 2 o 3. Por tanto, hay 3 cuartiles: Q1, Q2 y Q3 Valor que corresponde a la frecuencia acumulada t.n/10, expresin llamada decil de orden o D0 (1) Donde t puede valer entre 1 y 9. Por tanto, hay 9 deciles: desde el D1 hasta el D9 Valor que corresponde a la frecuencia acumulada t.n/100, expresin llamada percentil de orden o P0 (1) Donde t puede valer entre 1 y 99. Por tanto, hay 99 percentiles: desde el P1 hasta el P99

Cuantitativo

Decil

Cuantitativo

Percentil

Cuantitativo

(1) Si no puede identificarse unvocamente una frecuencia acumulada, y por tanto un valor determinado de x, puede ser calculada por interpolacin. En realidad, los cuantiles se utilizan preferentemente cuando los datos estn agrupados por intervalos.

A continuacin, se suministran ejemplos de cmo calcular cada medida de posicin teniendo en cuenta las reglas y frmulas del esquema anterior. a) Clculo del modo para datos ordenados (niveles nominal, ordinal y cuantitativo) Nivel nominal: perro, perro, gato, gato, gato, gato (por tanto, el modo es gato) Nivel ordinal: grande, grande, mediano, mediano, mediano, chico, chico, chico, chico (por tanto, el modo es chico) Nivel cuantitativo: 6, 6, 7, 7, 7, 7, 8, 9, 10, 10, 11 (por tanto, el modo es 7) b) Clculo del modo para datos agrupados en frecuencia (niveles nominal, ordinal y cuantitativo) Nivel nominal x (religin) f Catlicos 56 Protestantes 78 Judos 45 Budistas 24 Otros 31 El modo es Protestantes Nivel ordinal x (dureza) f Muy duro 18 Duro 8 Intermedio 13 Blando 16 Muy blando 7 El modo es Muy duro Nivel cuantitativo x (edad) f 30 aos 6 31 aos 14 32 aos 19 33 aos 24 34 aos 15 El modo es 33 aos

Como puede verse, el modo es el valor de la variable x que est ms repetido. c) Clculo del modo para datos agrupados por intervalos (nivel cuantitativo) x (cantidad piezas dentarias) 10-18 19-27 28-36 37-45 f 6 8 24 2 n=40

Una vez confeccionada la tabla de frecuencias por intervalos, se procede en dos pasos: a) Se identifica cul es el intervalo de mayor frecuencia. En este caso, es 28-36. b) Se aplica la frmula correspondiente: f - fant Mo = Li + ---------------------- . a (f - fant) + (f- fpos) 24 - 8 Mo = 28 + ---------------------- . 8 = 31.37 piezas dentarias (24 - 8) + (24 - 2) d) Clculo de la mediana para datos ordenados (niveles ordinal y cuantitativo) Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o ascendente. Si el conjunto de datos contiene un nmero impar de elementos, el central es la mediana. Si hay un nmero par, la mediana es el promedio de los dos datos centrales. Ejemplos para el nivel ordinal: Nmero impar de datos: alto, alto, alto, alto, medio, medio, medio, medio, medio, medio, bajo (por tanto, la mediana es = medio). Nmero par de datos: En el nivel ordinal no puede calcularse un promedio si los dos valores centrales son distintos. Si los dos valores centrales son iguales, ese es el valor de la mediana. Ejemplos para el nivel cuantitativo: Nmero impar de datos: 13, 13, 13, 14, 14, 17, 18, 19, 19 (por tanto, la mediana es 14)

34
Nmero par de datos: 11, 11, 12, 13, 14, 15, 16, 18, 18, 18 (por tanto, la mediana es el promedio entre 14 y 15, o sea 14.5). e) Clculo de la mediana para datos agrupados por frecuencia (niveles ordinal y cuantitativo) x (das) 1 2 3 4 5 f 7 9 14 10 2 n = 42 F 7 16 30 40 42

La variable es aqu cantidad de das de posoperatorio. El procedimiento es el siguiente: a) Se calcula la mediana de orden: Mn0 = n/2 = 42/2 = 21 b) Se identifica cul es el valor de x que corresponde a la frecuencia acumulada que contiene el valor 21: Dicha frecuencia acumulada es 30, y, por lo tanto Mn = 3 das f) Clculo de la mediana para datos agrupados por intervalos (nivel cuantitativo) x 0-3 3-6 6-9 9-12 12-15 15-18 18-21 21-24 f 8 10 11 12 9 7 6 5 n = 68 F 8 18 29 41 50 57 63 68

Ntese que para calcular la mediana se precisa informacin sobre frecuencias acumuladas, razn por la cual se ha agregado la columna respectiva. Se procede en dos pasos: a) Se identifica cul es el intervalo que debe ser considerado, para lo cual se calcula la mediana de orden: Mn0 = n/2 = 68/2 = 34 Tomando en cuenta las frecuencias acumuladas, el valor 34 entra en la frecuencia acumulada 41, y, por lo tanto, el intervalo a considerar ser 9-12. b) Se aplica la frmula de mediana: n/2 - Fant Mn = Li + ---------------------- . a f 34 - 29 Mn = 9 + ---------------------- . 3 = 10.25 12 Tngase presente que si la variable fuera discreta y medible slo en nmeros enteros, sera Mn = 10. Si la variable fuese cantidad de materias aprobadas, el alumno con 10 materias aprobadas est en el lugar central de la serie, es decir, habra un 50% de compaeros con menos materias aprobadas y un 50% con ms materias aprobadas. g) Clculo de la media aritmtica para datos ordenados (nivel cuantitativo) Dados los siguientes dados ordenados: 2-2-3-4-4-4-5-5-6-7-8-10 Se puede calcular la media aritmtica aplicando la frmula:

x
Pgina 34 de 331

35
X = ----n 2 + 2+3+4+4+4+5+5+6+7+8+10 60 X = ---------------------------------------- = --------- = 5 12 12
h) Clculo de la media aritmtica para datos agrupados por frecuencia (nivel cuantitativo) x (edad) 18 19 20 23 25 26 28 f 3 1 2 4 2 2 2 n = 16 f.x 54 19 40 42 50 52 56 363

Ntese que para el clculo de la media aritmtica se ha agregado una columna con los productos de x . f. Se aplica la frmula de media aritmtica:

( x.f) 54+19+40+42+50+52+56 363 X = --------- = ----------------------------------- = -------- = 22.68 aos = 23 aos. n 16 16


i) Clculo de la media aritmtica para datos agrupados por intervalos (nivel cuantitativo) x 0-3 3-6 6-9 9-12 12-15 15-18 18-21 21-24 f 8 10 11 12 9 7 6 5 n = 68

xm
1.5 4.5 7.5 10.5 13.5 16.5 19.5 22.5

xm.f
12 45 82.5 126 121.5 115.5 117.6 112.5 732.5

Ntese que para el clculo de la media aritmtica se ha agregado una columna con los puntos medios de los intervalos y otra con los productos de las frecuencias por los puntos medios. Se aplica la frmula de media aritmtica:

( xm.f) 732.5 X = ------------- = ---------- = 10.77 n 68


El mtodo corto y el mtodo clave son dos mtodos alternativos para calcular la media aritmtica, siendo el ltimo slo aplicable cuando el tamao de los intervalos es constante. De acuerdo al mtodo corto, la media aritmtica se calcula sumando al punto medio del intervalo de mayor frecuencia, el cociente entre la sumatoria de los productos entre cada frecuencia y la diferencia entre el punto medio de cada intervalo menos el punto medio del intervalo de mayor frecuencia, y la sumatoria de frecuencias (n). De acuerdo al mtodo clave, la media aritmtica se calcula sumando al punto medio del intervalo de mayor frecuencia, el producto entre el tamao del intervalo y un cociente, donde el numerador es la sumatoria de los productos entre las frecuencias y el llamado intervalo unitario (que resulta de dividir la diferencia entre cada punto medio y el punto medio del intervalo de mayor frecuencia, por el tamao del intervalo), y donde el denominador es la sumatoria de frecuencias (n). j) Clculo del cuantil para datos ordenados (nivel cuantitativo) 1-1-1-1-1-2-2-2-3-3-3-3-4-5-6-6-6-6-7-7-8-8-9
Pgina 35 de 331

36
Si en la serie anterior resaltamos los tres valores que la dividen en cuatro partes iguales, esos valores sern los cuartiles Q1, Q2 y Q3: 1-1-1-1-1-2-2-2-3-3-3-3-4-5-6-6-6-6-7-7-8-8-9 Q1 = 2 Q2 = 3 Q3 = 6 Sin embargo, es ms prctico agrupar los datos por frecuencias o por intervalos, a los efectos del clculo de los cuantiles (cuartiles, deciles o percentiles). k) Clculo del cuantil para datos agrupados por frecuencia (nivel cuantitativo) x (edad) 18 19 20 23 25 26 28 f 3 1 2 4 2 2 2 n = 16 F 3 4 6 10 12 14 16

Se pueden calcular, por ejemplo, Q1, Q2 y Q3. El primer paso consiste en averiguar los respectivos cuartiles de orden. Para Q1 es Q0 = t.n/4 = 1.16/4 = 4 Para Q2 es Q0 = t.n/4 = 2.16/4 = 8 Para Q3 es Q0 = t.n/4 = 3.16/4 = 12 El segundo y ltimo paso consiste en identificar el valor de x correspondiente al cuartil de orden respectivo. Q1 = 4 Q2 = Est entre 20 y 23 Q3 = 25 l) Clculo del cuantil para datos agrupados por intervalos (nivel cuantitativo) x (puntaje) 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100 f 1 3 5 6 10 12 13 9 4 3 n = 66 F 1 4 9 15 25 37 50 59 63 66

Se pueden calcular, por ejemplo, Q3, D7 y P45. El primer paso consiste en averiguar los cuantiles de orden: Para Q3 es Q0 = t.n/4 = 3.66/4 = 49.5 Para D7 es D0 = t.n/10 = 7.66/10 = 46.2 Para P45 es P0 = t.n/100 = 45.66/100 = 29,7 El segundo paso consiste en identificar el intervalo que corresponde al cuantil de orden en la columna de frecuencias acumuladas: El valor 49.5 corresponde al intervalo 60-70
Pgina 36 de 331

37
El valor 46.2 corresponde al intervalo 60-70 El valor 29.7 corresponde al intervalo 50-60 El tercer y ltimo paso consiste en aplicar la frmula basndose en la informacin del intervalo identificado. Si la frmula pide el dato de la frecuencia acumulada anterior y esta no existe, se coloca 0 (cero). En el ejemplo del clculo del D7, se aplica la siguiente frmula: t.n/10 - Fant Dt = Li + ------------------- . a f 46.2 - 37 D7 = 60 + ---------------- . 11 = 67.78 13 Clculo visual de las medidas de posicin: grficos Es posible utilizar un procedimiento grfico para calcular ciertas medidas de posicin, tales como el modo y la mediana. Por ejemplo, el modo se puede calcular a partir de un histograma. La mediana tambin puede calcularse con un histograma, aunque lo ms habitual es hacerlo mediante una ojiva. a) Clculo del modo mediante un histograma Una vez construido el histograma a partir de una tabla de datos agrupados por intervalos: 1) Se considera el rectngulo de mayor frecuencia (mayor altura). 2) Dentro del mismo se trazan dos rectas como est indicado en el grfico siguiente. 3) Por la interseccin de ambas rectas se traza una recta perpendicular al eje de absisas. 4) El punto del eje de las absisas por donde pasa la recta perpendicular corresponde al modo (en el ejemplo, el modo es 4.80).

f 5 4 3 2 1

1 x

10

b) Clculo de la mediana mediante una ojiva En este caso pueden utilizarse dos procedimientos: 1) Una vez trazada la ojiva, a) se ubica en el eje de las ordenadas a la mediana de orden (Mn 0 ); b) por la mediana se orden se traza una recta paralela al eje x hasta que intersecte la ojiva; c) por este punto de interseccin se traza una recta paralela al eje y hasta que intersecte el eje x. En este punto estar ubicada la mediana. 2) Se trazan en el mismo eje de coordenadas las ojivas creciente y decreciente de la misma distribucin de datos. Luego, a) se traza una recta paralela al eje y que pase por la interseccin de ambas ojivas y por algn punto del eje x; b) el punto del eje x por donde pasa dicha recta corresponde a la mediana. Criterios de eleccin de medidas de posicin 1) La eleccin de una medida de posicin debe tener en cuenta el nivel de medicin de la variable que se mide:

Pgina 37 de 331

38
Modo Mediana Nivel nominal SI NO Nivel ordinal SI SI. Siempre y cuando los dos valores centrales con n = par sean iguales. En caso contrario usar el Modo. NO SI SI Nivel cuantitativo

Media aritmtica Cuantiles

NO

NO

NO

SI Cuando no haya valores extremos alejados ni valores extremos abiertos. En caso contrario, usar el Modo o la Mediana (*). SI

(*) Hay al menos tres situaciones donde se preferir la mediana a la media (Botella, 1993:115): a) cuando la variable es ordinal, b) cuando haya valores extremos que distorsionen la interpretacin de la media, y c) cuando haya intervalos abiertos, como en el caso de variables como ingresos mensuales.

2) La eleccin de una medida de posicin debe tener en cuenta la forma en que estn organizados los datos. Por ejemplo: en ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el valor ms frecuente del conjunto de datos. Es por esta razn que rara vez utilizamos el modo de un conjunto de datos no agrupados como medida de tendencia central. Por esta razn, debemos calcular el modo en datos agrupados en una distribucin de frecuencias (Levin y Rubin, 1996). 3) La eleccin de una medida de posicin de una muestra debe tener en cuenta el grado de fidelidad con que representa a la medida de posicin poblacional. Botella (1993:114) afirma, en este sentido, que si no hay ningn argumento en contra, siempre se preferir la media, no slo porque permite la utilizacin de otras medidas estadsticas (por ejemplo el desvo estndar), sino porque es ms representativa de la media poblacional que el modo o la mediana con respecto al modo o la mediana poblacional. 2.5 SNTESIS DE LOS DATOS: MEDIDAS ESTADSTICAS DE DISPERSIN Definicin Las medidas de dispersin, llamadas tambin medidas de variabilidad o de variacin, son datos estadsticos que informan acerca del grado de dispersin o variabilidad de los datos individuales de una muestra o una poblacin, respecto de una variable. En otras palabras, indican el grado de homogeneidad o de heterogeneidad del conjunto de los datos. Por ejemplo, indican cun alejados o cun cercanos se encuentran los datos de algn valor central como la media aritmtica: una muestra cuyos datos son 3-4-5 es menos dispersa que una muestra cuyos datos son 1-4-7. Algunos autores (Botella, 1993:325) han relacionado la dispersin de los datos -para los niveles de medicin nominal y ordinal- con los conceptos de entropa y de incertidumbre e incluso han propuesto a la primera como una medida que permite cuantificar la dispersin: a mayor dispersin de los datos, hay mayor entropa y mayor incertidumbre. Por ejemplo, las siguientes dos muestras tienen cada una 40 sujetos que han elegido determinados colores para representar la idea de paz: Muestra A: Muestra B: Blanco 28 8 Verde 3 8 Amarillo 3 8 Celeste 3 8 Rosa 3 8

Si habra que adivinar qu color eligi determinado sujeto de la muestra A, cabra proponer el color blanco porque fue el ms elegido. En cambio, la incertidumbre aumenta si habra que elegir lo mismo en la muestra B. En esta muestra hay ms entropa, es decir, ms desorden, mientras que en la muestra A los datos estn ms ordenados alrededor de un valor muy repetido, como el blanco. La muestra B es ms dispersa, es decir, ms heterognea, mientras que la muestra A es menos dispersa, es decir, ms homognea. La homogeneidad no debe relacionarse con la repeticin de frecuencias (3-3-33) sino con la repeticin de valores iguales o muy cercanos entre s (28 sujetos eligieron blanco). Una medida de posicin no alcanza para describir adecuadamente una muestra. Se obtiene una informacin ms precisa y completa de ella cuando adems se utiliza una medida de dispersin. Por ejemplo, la muestra 1 de datos 3-4-5 y la muestra 2 de datos 1-4-7 tienen la misma medida de posicin: la media aritmtica en ambos casos es 4. Sin embargo, se trata evidentemente de dos muestras diferentes, por cuanto la segunda es ms dispersa que la primera, es decir, sus datos estn ms alejados de la media aritmtica.

Pgina 38 de 331

39
En la primera muestra el promedio de las desviaciones respecto de la media es 1 (de 3 a 4 hay 1, y de 5 a 4 hay 1), mientras que el promedio de las desviaciones en la segunda muestra es 3 (de 1 a 4 hay 3, y de 7 a 4 hay 3). Por lo tanto, ambas muestras pueden representarse de la siguiente manera: Muestra 1: 4 + 1 (se lee 4 ms/menos 1) Muestra 2: 4 + 3 (se lee 4 ms/menos 3). Las medidas de dispersin tienen una importancia adicional porque (Levin y Rubin: 1996): a) Proporcionan informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos. b) A veces resulta indispensable conocer la dispersin de una muestra porque muestras demasiado dispersas pueden no ser tiles para poder sacar conclusiones tiles sobre la muestra. Levin y Rubin indican que, ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir los que presentan esa dispersin antes de abordar esos problemas. Caractersticas de las principales medidas de dispersin En general, las medidas de dispersin ms utilizadas sirven para la medicin de variables en el nivel cuantitativo. Seguidamente se examinarn las siguientes medidas de dispersin: rango, desviacin media, varianza, desvo estndar, desvo intercuartlico y coeficiente de variacin. En el siguiente cuadro se especifican las definiciones y caractersticas principales de las medidas de dispersin. Medida RANGO Definicin Es la diferencia entre los valores mximo y mnimo de la variable. Caractersticas De uso limitado, no es una buena medida de dispersin. Es muy sensible a los valores extremos e insensible a los valores intermedios. Est muy vinculada al tamao de la muestra: es probable que la muestra de mayor tamao presente mayor rango aunque las poblaciones de referencia tengan igual dispersin (Botella, 1993). Se llama tambin amplitud. Considera desviaciones absolutas, es decir, no las considera con valores negativos (de otro modo, el promedio de las desviaciones, por un teorema de la media aritmtica, dara cero). Esto representa una dificultad de clculo, por lo que se utiliza la varianza. Es un valor esencialmente no negativo (10). Matemticamente es buena medida de dispersin, pero da valores muy altos, por lo cual en estadstica descriptiva se utiliza el desvo estndar (9). Se apoya en una propiedad de la media aritmtica segn la cual la suma de los cuadrados de las desviaciones respecto a la media es un valor mnimo. La varianza permite comparar la dispersin de dos o ms muestras si sus medias aritmticas son similares (Botella, 1993). Si se suma una constante a un conjunto de valores, la varianza no se modifica (Botella, 1993). Si se multiplica por una constante a un conjunto de valores, la varianza de los nuevos valores el igual al producto de la varianza de las originales por el cuadrado de la constante (Botella, 1993). Es un valor esencialmente no negativo (10). Es la medida de dispersin ms utilizada. Se la emplea conjuntamente con la media aritmtica como medida de posicin. La raz cuadrada permite compensar el cuadrado de la varianza. Si se suma una constante a un conjunto de valores, el desvo estndar no se modifica (Botella, 1993). Si se multiplica por una constante a un conjunto de valores, el desvo estndar de los nuevos valores el igual al producto del desvo estndar de las originales por el cuadrado de la constante (Botella, 1993). Se llama tambin desviacin tpica, o tambin desviacin estndar (Pagano, 1998:71). Expresa el rango del 50% central de la serie de valores. Se llama tambin amplitud intercuartil. Permite comparar la dispersin de dos o ms muestras con diferentes medias aritmticas: a mayor coeficiente de variacin, mayor dispersin. No se expresa en unidades como la variable en estudio (por ejemplo, para
Pgina 39 de 331

DESVIACION MEDIA

VARIANZA

Es el promedio de las desviaciones de todos los valores respecto de la media aritmtica. Es el promedio de los cuadrados de las desviaciones con respecto a la media aritmtica.

DESVIO ESTNDAR

Es la raz cuadrada de la varianza (11)

DESVIO INTER CUARTILICO COEFICIENTE DE VARIACION

Es la diferencia entre el Q3 y el Q1. Es el cociente entre el desvo estndar y la media aritmtica.

40
edad, no se expresa en aos). Puede considerarse como un ndice de la representatividad de la media aritmtica: cuanto mayor es el coeficiente de variacin, menos representativa es la media (Botella, 1993). Clculo analtico de las medidas de dispersin: frmulas En este tem se indican las frmulas para calcular medidas de dispersin, y se suministran ejemplos de cada caso. Clculo de las medidas de dispersin segn la forma de organizacin de los datos individuales
Preparado por: Pablo Cazau

Medida de dispersin Rango Desviacin media

Datos ordenados R = xmay - xmen

Datos agrupados por frecuencia R = xmay - xmen

Datos agrupados por intervalos No

Desvo estndar

|x X| Dm = --------------n (x X )2 S = ---------------n
El segundo miembro es a la raz cuadrada

|xX|.f Dm = -----------------n ( x X )2 . f S = ------------------n


El segundo miembro es a la raz cuadrada

| xm X | . f Dm = -------------------n ( xm X )2 . f S = ---------------------n
El segundo miembro es a la raz cuadrada

Varianza Desvo intercuartlico Coeficiente de variacin

Es el cuadrado del desvo estndar (S2)

Es el cuadrado del desvo estndar (S2)

Es el cuadrado del desvo estndar (S2)

DQ = Q3 Q1 S CV = ----X

DQ = Q3 Q1 S CV = ----X

DQ = Q3 Q1 S CV = ----X

Cuando hay que calcular varianza o desvo estndar poblacionales, se utiliza n en el denominador, pero cuando se calculan las correspondientes medidas muestrales (o cuando la muestra es muy pequea), se utilizar n1 (12). a) Clculo del rango para datos ordenados y para datos agrupados por frecuencia Se puede aplicar a estas muestras la frmula del Rango R = xmay - xmen Muestra 1: 80, 100, 100, 110, 120. Aqu el rango R es = 120 80 = 40. Muestra 2: 30, 50, 70, 120, 180. Aqu el rango R es = 180 30 = 150 Como se ve, la muestra 2 es ms dispersa porque tiene mayor rango. No se puede calcular el rango para datos agrupados por intervalos porque se desconocen cules son los valores mximo y mnimo. b) Clculo de la desviacin media para datos ordenados La serie ordenada de datos puede ser la siguiente: 2, 3, 5, 6, 7, 9, 10 Como primer paso se calcula la media aritmtica: X 2+3+5+6+7+9+10 = --------------------------- = 6 7

Como segundo y ltimo paso, se calcula la desviacin media: |xX| |2-6| + |3-6| + |5-6| + |6-6| + |7-6| + |9-6| + |10-6| Dm = --------------- = --------------------------------------------------------------------- = 2.29 N 7
Pgina 40 de 331

41
c) Clculo de la desviacin media para datos agrupados por frecuencia A la siguiente tabla de frecuencias (f) deber agregarse una columna (f.x) para calcular la media aritmtica, y luego otras dos columnas (x-X) y (| x-X | . f) para calcular la desviacin media: x 70 80 90 100 110 120 130 140 f 45 63 78 106 118 92 75 23 n = 600 f.x 3150 5040 7020 10600 12980 11040 9750 3220 62800 |x-X| 35 25 15 5 5 15 25 35 160 |x-X|.f 1575 1575 1170 530 590 1380 1875 115 8810

Primero se calcula la media aritmtica: ( x.f) 62800 X = --------- = ------------ = 104.66 = 105 n 600 Finalmente se calcula la desviacin media: |xX|.f 8810 Dm = ------------------ = ------------ = 14.68 n 600 d) Clculo de la desviacin media para datos agrupados por intervalos Se procede de la misma manera que en el caso anterior, con la diferencia que en lugar de considerar los valores x, se consideran los puntos medios de los intervalos (xm). e) Clculo del desvo estndar para datos ordenados Para la serie de valores 5, 6, 10, su media aritmtica es 7. Una vez conocido este valor, puede obtenerse el desvo estndar de la siguiente forma: ( x X )2 (5-7)2 + (6-7)2 + (10-7)2 S = ------------------- = ------------------------------------ = 4.66 = 2.2 n 3 f) Clculo del desvo estndar para datos agrupados por frecuencia x (edad) 18 19 20 23 25 26 28 f 3 1 2 4 2 2 2 n = 16 f.x 54 19 40 42 50 52 56 363 xX -5 -4 -3 0 +2 +3 +5 ( x X )2 25 16 9 0 4 9 25 ( x X )2 . f 75 16 18 0 8 18 50 185

Primero se calcula la media aritmtica, que arroja un valor de X = 23. Finalmente, se aplica la frmula de desvo estndar: ( x X )2 . f 185 S = ---------------------- = ------------ = 11.56 = 3.2 n 16 Puede tambin utilizarse una frmula ms sencilla a los efectos del clculo (Bancroft, 1960:80): x2.f S = ----------- - (X) 2
Pgina 41 de 331

42
n Donde el primer trmino del segundo miembro es a la raz cuadrada. g) Clculo del desvo estndar para datos agrupados por intervalos Se procede del mismo modo que en el caso anterior, con la diferencia que se calcula el punto medio xm de los intervalos en lugar del valor x. h) Clculo de la varianza El procedimiento es el mismo que en el caso del desvo estndar. Slo debe tenerse presente que la varianza es el cuadrado del desvo estndar. i) Clculo del desvo intercuartlico Dada la siguiente serie, obtener el desvo intercuartlico: x 0-20 20-40 40-60 60-80 80-100 f 2 4 5 8 1 n = 20

Primero se calculan los Q3 y Q1 aplicando la frmula explicada en medidas de posicin. Finalmente, se aplica la frmula del desvo intercuartlico: DQ = Q3 Q1 = 70 35 = 35 Una variante es el empleo del desvo semi-intercuartlico, es decir, el desvo intercuartlico dividido dos. Se trata de una medida de dispersin propuesta por Galton en 1889, y que resulta recomendable cuando hay algn valor extremo que pudiera distorsionar la representatividad de la media aritmtica (Botella, 1993). j) Clculo del coeficiente de variacin Si una muestra tiene una media aritmtica 111 y el desvo estndar 18, entonces su coeficiente de variacin es: S 111 CV = ----- = ---------- = 0.16 X 18 Cuanto mayor es el CV, mayor es la dispersin. Tambin puede calcularse un coeficiente de variacin porcentual, multiplicando CV por 100. En el ejemplo: CV% = 0.16 . 100 = 16%. Clculo visual de las medidas de dispersin: grficos Botella (1993:143) menciona dos procedimientos para expresar grficamente medidas de dispersin: el diagrama de caja y bigotes (Tukey, 1977) y el diagrama de bigotes verticales. Diagrama de caja y bigotes

Pgina 42 de 331

43
75 80 85
Xmn

90

95
Q1

100

105
Q3

110

115

120
Xmx

125

130

B
Xmn Q1 Q3 Xmx

Puede apreciarse a simple vista que la distribucin de valores B es ms dispersa que A no slo porque la diferencia entre los valores mximo y mnimo (rango) es mayor, sino tambin porque lo es la diferencia entre los cuartiles primero y tercero. Diagrama de bigotes verticales

Nivel de ansiedad

4 Curso

El grfico representa las medias aritmticas de nivel de ansiedad de diversos cursos de alumnos. En cada media aritmtica se han trazado bigotes verticales que representan los respectivos desvos estndar. Puede entonces apreciarse, por ejemplo, que a medida que aumenta la media aritmtica, tiende tambin a aumentar el desvo estndar. 2.6 SNTESIS DE LOS DATOS: ASIMETRA Y CURTOSIS Un conjunto de datos o distribucin de datos queda exhaustivamente descrito cuando pueden especificarse una medida de posicin, una medida de dispersin, un ndice de asimetra y un ndice de curtosis. Las medidas de asimetra y curtosis se refieren a la forma de la distribucin y, aunque no son tan importantes como las medidas de posicin y dispersin y son muy poco utilizadas, aportan tambin informacin sobre la distribucin de los valores de una muestra o poblacin. Asimetra La asimetra hace referencia al grado en que los datos se reparten equilibradamente por encima y por debajo de la tendencia central (Botella, 1993:169). Por ejemplo, en la siguiente tabla se puede apreciar que en el curso A muchos alumnos obtuvieron buenas notas, en el curso C muchos alumnos obtuvieron bajas notas, y en el curso B estn equilibrados. x (nota) 10 9 8 f (curso A) 5 10 15 f (curso B) 2 5 8 f (curso C) 1 2 3
Pgina 43 de 331

44
7 6 5 4 3 2 1 0 22 16 12 8 6 3 2 1 n = 100 10 15 20 15 10 8 5 2 n = 100 6 8 12 16 22 15 10 5 n = 100

Representando las tres distribuciones de datos con curvas en un grfico con las frecuencias en las ordenadas y los valores de x en las absisas, se obtiene lo siguiente:

Curso A

Curso B

Curso C

Media

Modo

Media Modo Asimetra cero

Modo

Media

Asimetra negativa (curva hacia la derecha)

Asimetra positiva (curva hacia la izquierda)

Han sido propuestos diversos ndices de asimetra para cuantificar el grado de asimetra de una distribucin de datos. De entre ellos pueden citarse los siguientes (Botella, 1993:170): Indice de asimetra mediamodo Es la distancia entre la media y el modo, medido en desvos estndar: X - Mo As = ------------S Indice de asimetra media-mediana (Kohan, 1994:93) Es la distancia entre la media y la mediana multiplicada por tres, medida en desvos estndar: X - Mn As= ------------S Indice de asimetra de Pearson Es el promedio de los valores z elevados al cubo (donde z es el cociente entre la diferencia entre x y la media aritmtica, y el desvo estndar). Indice de asimetra intercuartlico Es el cociente entre la diferencia Q3-Q2 y Q2-Q1, y la diferencia Q3-Q1

Los tres ndices se interpretan de manera similar: si resultan ser nmeros negativos, la curva ser asimtrica hacia la derecha, y si dan resultados positivos, la curva ser asimtrica a la izquierda. El resultado 0 (cero) indicar asimetra nula (simetra perfecta). Existen otros muchos tipos de curvas: parablicas, hiperblicas, bimodales, etc, pero una forma usual es la curva simtrica, llamada tambin curva normal o campana de Gauss. Curtosis La curtosis hace referencia a la forma de la curva de la distribucin de datos en tanto muy aguda (mayor apuntamiento o mayor curtosis: leptocrtica) o muy aplanada (menor apuntamiento o menor curtosis: platicrtica).

Pgina 44 de 331

45
Leptocrtica Mesocrtica Platicrtica

Del mismo modo que sucede con la asimetra, tambin se han propuesto diversos ndices de curtosis. Si el ndice es positivo, su apuntamiento es mayor que el de una distribucin normal y la curva ser leptocrtica, y si es negativo, su apuntamiento es menor y la curva ser platicrtica (Botella, 1993).
NOTAS (1) Segn Botella (1993:49) la distribucin de frecuencias es un instrumento diseado para cumplir tres funciones: a) proporcionar una reorganizacin y ordenacin racional de los datos recogidos; b) ofrecer la informacin necesaria para hacer representaciones grficas; y c) facilitar los clculos necesarios para obtener los estadsticos muestrales. (2) Cuando se confecciona una tabla de frecuencias por intervalos con la intencin de elaborar grficos o medidas estadsticas a partir de ella, deben asumirse ciertos supuestos que implican un margen de error, pero que son imprescindibles. Estos supuestos, llamados supuestos de concentracin intraintervalo, son dos. a) El supuesto de concentracin en el punto medio del intervalo, segn el cual todos los valores de la variable son el mismo, a saber, el punto medio del intervalo. b) El supuesto de distribucin homognea, segn el cual los valores incluidos en un intervalo se reparten con absoluta uniformidad en su interior. Es decir, que si en un intervalo hay cinco observaciones [valores observados en la variable] aceptaremos que sus valores son los que tendramos si partiramos al intervalo en cinco subintervalos de igual amplitud y asignramos a cada individuo el punto medio de un subintervalo (Botella, 1993:56). (3) Hay quienes recurren a la frmula de Sturges para calcular la cantidad de intervalos que resulta deseable tomar en funcin del tamao de la muestra. Esta frmula es: Nmero de intervalos = 1 + (log n / log 2), donde n designa el tamao de la muestra. Por ejemplo, aplicando la frmula para n = 40, la cantidad deseable de intervalos es 6.3, con lo cual podrn elegirse entre 6 o 7 intervalos. Una vez determinada la cantidad de intervalos, slo resta dividir el tamao de la muestra por 6 o 7, de lo que resultar el tamao de cada intervalo. (4) Por ejemplo, las medidas de posicin son aquellas que caracterizan la posicin de un grupo respecto de una variable (Kohan, 1994:69). Otras definiciones se refieren a la utilidad de estas medidas, y entonces por ejemplo se definen como ndices diseados especialmente para revelar la situacin de una puntuacin con respecto a un grupo, utilizando a ste como marco de referencia (Botella, 1993:83). (5) Estrictamente hablando, ciertos cuantiles como el cuartil 2, el decil 5 y el percentil 50 resultan ser medidas de tendencia central, ya que coinciden con la mediana. (6) Estrictamente, dato y valor no son sinnimos, aunque aqu se emplearn indistintamente ambas expresiones. El valor es uno de los componentes del dato: los otros dos son la unidad de anlisis y la variable. (7) Botella (1993:105-111) describe seis propiedades de la media aritmtica: 1) La suma de las diferencias de n puntuaciones de la media aritmtica, o puntuaciones diferenciales, es igual a cero. 2) La suma de los cuadrados de las desviaciones de unas puntuaciones con respecto a su media es menor que con respecto a cualquier otro valor. 3) Si sumamos una constante a un conjunto de puntuaciones, la media aritmtica quedar aumentada en esa misma constante. 4) Si multiplicamos una constante a un conjunto de puntuaciones, la media aritmtica quedar multiplicada por esa misma constante. 5) La media total de un grupo de puntuaciones, cuando se conocen los tamaos y medias de varios subgrupos hechos a partir del grupo total, mutuamente exclusivos y exhaustivos, puede obtenerse ponderando las medias parciales a partir de los tamaos de los subgrupos en que han sido calculadas. 6) Una variable definida como la combinacin lineal de otras variables tiene como media la misma combinacin lineal de las medias de las variables intervinientes en su definicin. (8) Equivalencias entre cuantiles (Botella, 1993:89): Cuartiles Q1 Q2 Q3 Deciles D1 D2 D3 D4 D5 D6 D7 Percentiles P10 P20 P25 P30 P40 P50 P60 P70 P75 Pgina 45 de 331

46
D8 D9 P80 P90

(9) Para la varianza, las unidades son el cuadrado de las unidades de los datos. Estas unidades no son intuitivamente claras o fciles de interpretar. Por esta razn, tenemos que hacer un cambio significativo en la varianza para calcular una medida til de la desviacin, que sea menos confusa. Esta medida se conoce como la desviacin estndar, y es la raz cuadrada de la varianza. La desviacin estndar, entonces, est en las mismas unidades que los datos originales (Levin y Rubin, 1996). La varianza como tal se utiliza ms frecuentemente en estadstica inferencial (Pagano, 1998:77). (10) La raz cuadrada de un nmero positivo puede ser tanto positiva como negativa. Cuando tomamos la raz cuadrada de la varianza para calcular la desviacin estndar, los estadsticos solamente consideran la raz cuadrada positiva (Levin y Rubin, 1996). (11) La desviacin estndar nos permite determinar, con un buen grado de precisin, dnde estn localizados los valores de una distribucin de frecuencias con relacin a la media. El teorema de Chebyshev dice que no importa qu forma tenga la distribucin, al menos 75% de los valores caen dentro de + 2 desviaciones estndar a partir de la media de la distribucin, y al menos 89% de los valores caen dentro de + 3 desviaciones estndar a partir de la media. Con ms precisin: Aproximadamente 68% de los valores de la poblacin cae dentro de + 1 desviacin estndar a partir de la media. Aproximadamente 95% de los valores estar dentro de + 2 desviaciones estndar a partir de la media. Aproximadamente 99% de los valores estar en el intervalo que va desde tres desviaciones estndar por debajo de la media hasta tres desviaciones estndar por arriba de la media (Levin y Rubin, 1996). (12) Esto se debe a que los especialistas en estadstica pueden demostrar que si tomamos muchas muestras de una poblacin dada, si encontramos la varianza de la muestra para cada muestra y promediamos los resultados, entonces este promedio no tiende a tomar el valor de la varianza de la poblacin, a menos que tomemos n1 como denominador de los clculos (Levin y Rubin, 1996). (13) El concepto de distribucin de frecuencias es uno de los ms bsicos de la estadstica descriptiva, y hace referencia a un conjunto de valores de una variable ordenados de acuerdo con sus frecuencias. Las distribuciones de frecuencias pueden expresarse en forma de tablas, grficos, medidas de posicin, medidas de dispersin, de asimetra y de curtosis. Estas ltimas cuatro medidas pueden considerarse propiedades o caractersticas bsicas de una distribucin frecuencial.

CAPTULO 3: PROBABILIDAD Y CURVA NORMAL


La curva normal es uno de los temas fundamentales de la estadstica que utiliza la informacin provista por la estadstica descriptiva y permite el paso a la estadstica inferencial en el sentido de proveer una herramienta para obtener conclusiones respecto de la poblacin. La comprensin de este tema exige un conocimiento mnimo de la teora de la probabilidad. 3.1 EL CONCEPTO DE PROBABILIDAD Se entiende por probabilidad el grado de posibilidad de ocurrencia de un determinado acontecimiento. Dicha probabilidad puede calcularse en forma terica o emprica, a partir de las llamadas probabilidad clsica y frecuencial, respectivamente. El concepto de probabilidad ha demostrado ser de importante utilidad en ciertos enfoques sistmicos, especialmente en los mbitos de la termodinmica y la teora de la informacin. 1. Concepto de probabilidad.- Entendida como medida de la posibilidad de la ocurrencia de un determinado acontecimiento, la probabilidad abarca un espectro que se extiende desde la certeza (el acontecimiento ocurrir con total seguridad), hasta la imposibilidad (es imposible que el acontecimiento ocurra), pasando por todos los grados intermedios (es muy probable que ocurra, es medianamente probable, es poco probable, etc). Por ejemplo, el suceso 'obtener un nmero entre 1 y 6 tirando un dado' equivale a la certeza; el suceso 'obtener un 7 arrojando un dado' equivale a la imposibilidad; y el suceso 'obtener un 2 arrojando un dado' equivale a uno de los grados intermedios de probabilidad. Es habitual representar el grado de probabilidad mediante un nmero que puede variar entre 1 (certeza) y 0 (imposibilidad). La probabilidad puede entonces valer 1, 0, 0.50, 0.80, etc. Por ejemplo, una probabilidad de 0.1 es muy baja, y una probabilidad de 0.98 muy alta. Una probabilidad intermedia es 0.50 o tambin, si la expresamos en trminos de porcentajes corriendo la coma dos lugares hacia la derecha, obtenemos una probabilidad del 50 por ciento. Tal el caso de obtener una cara arrojando una moneda. Los aspectos ms importantes del concepto de probabilidad han sido sintetizados en los llamados axiomas de probabilidad: Axioma 1: Evento seguro.- La probabilidad del conjunto universal o espacio muestral es igual a 1. Por ejemplo, el espacio muestral para un dado es 1, 2, 3, 4, 5, 6. Axioma 2: Evento imposible.- La probabilidad del conjunto vaco es igual a 0. Por ejemplo, que salga un 7 tirando un dado. Axioma 3: Evento aleatorio.- La probabilidad de un evento es un nmero real mayor o igual que 0 y menor o igual que 1. Axioma 4: Eventos aleatorios compuestos excluyentes.- La probabilidad de un evento ms la probabilidad del evento contrario es igual a 1. Por ejemplo, la probabilidad que un dado salga 1 o 2 ms la probabilidad que un dado salga 3, 4, 5 o 6 es igual a 1. En smbolos: p + q = 1.
Pgina 46 de 331

47
2. Probabilidad clsica y probabilidad frecuencial.- Si bien existen diferentes teoras y enfoques acerca de la probabilidad, explicaremos a continuacin los dos planteos ms habituales, siguiendo un ordenamiento histrico e incluso sistemtico: el clsico y el frecuencial. En ltima instancia, se trata de dos modos diferentes de calcular la probabilidad de la ocurrencia de un fenmeno. a) Probabilidad clsica (Laplace).- Suele tambin denominarse probabilidad terica o a priori, y se define como el cociente entre el nmero de casos favorables y el nmero de casos equiprobables posibles. Aclaremos esta aparentemente engorrosa definicin. Sabemos que un dado tiene seis caras, numeradas del uno al seis. La probabilidad de obtener la cara tres, por ejemplo, es de un sexto, es decir de un caso favorable (porque hay una sola cara con el tres) sobre seis casos equiprobables y posibles (caras 1-2-3-4-5-6). Aplicando la definicin de probabilidad, es: p= Casos favorables 1 ----------------------------------------------------- = 0.1666 Casos equiprobables posibles 6

Para poder calcular esta probabilidad necesitamos, obviamente, conocer todos los casos posibles (requisito de exhaustividad), pero adems debemos saber que todos esos casos posibles tienen la misma probabilidad de salir (requisito de equiprobabilidad), vale decir, debemos tener la suficiente seguridad de que ninguna cara tendr mayor o menor probabilidad de salir que otra cara cualquiera, como puede ocurrir, por ejemplo, con los dados 'cargados'. Una aclaracin respecto de la expresin 'casos favorables'. Debemos evitar aqu la connotacin subjetiva del trmino. Un caso favorable es simplemente un caso del cual queremos conocer la probabilidad de su ocurrencia. Puede incluso tratarse de un terremoto o una enfermedad, aunque estos eventos no sean 'favorables' desde otro punto de vista ms subjetivo. Respecto de la expresin 'casos equiprobables posibles', esta alude al hecho antes indicado de que para calcular una probabilidad en sentido clsico, deben cumplirse los dos requisitos de exhaustividad y equiprobabilidad. Puede suceder, en efecto, que alguno de estos requisitos no se cumpla. 1) Exhaustividad: Este requisito puede no cumplirse en dos casos. Primero, puede ocurrir que al arrojar un dado, este quede parado en equilibrio sobre alguno de sus vrtices o aristas. Como posibilidad existe, pero es remotsima. Debido a que esta posibilidad es muy baja, a los efectos prcticos la consideramos nula y seguimos aplicando la definicin clsica de probabilidad, como si todos los casos posibles fueran, como en el caso del dado, solamente seis. Segundo, puede ocurrir que no sepamos cuntas caras tiene el dado (en la situacin anterior s sabamos esta cantidad, descartando las alternativas remotas), an cuando sepamos que todas tienen la misma probabilidad de salir. En este caso, al desconocer el nmero de casos posibles, la definicin clsica de probabilidad resulta inaplicable, quedndonos la opcin de aplicar la probabilidad frecuencial. 2) Equiprobabilidad: Este requisito puede no cumplirse cuando el dado est 'cargado' lo que hace que, por ejemplo, el tres tenga mayores probabilidades de salir que el cuatro. En este caso, podemos calcular la probabilidad mediante la probabilidad frecuencial. En sntesis hasta aqu: cuando ninguno de estos requisitos, o ambos, no pueden cumplirse, nos queda an la opcin de calcular la probabilidad en forma emprica, lo que nos lleva al tema de la llamada probabilidad frecuencial. b) Probabilidad frecuencial.- Suele tambin denominarse probabilidad emprica o a posteriori, y es definible como el cociente entre el nmeros de casos favorables y el nmero de casos observados. En un ejemplo, supongamos que no conocemos cuntas caras tiene un dado (es decir desconocemos la cantidad de casos posibles), y queremos averiguar qu probabilidad tiene de salir el uno. Obviamente no podemos decir 'un sexto' o 'uno sobre seis' porque no sabemos cuntas caras tiene el dado. Para hacer este clculo decidimos hacer un experimento, y arrojamos un dado comn de seis caras (aunque nosotros ignoramos este detalle) por ejemplo diez veces, constatando que el uno sali cinco veces, cosa perfectamente posible. Conclumos entonces que la probabilidad de obtener un uno es de cinco sobre diez, es decir, de 0.5. Si tomamos al pie de la letra este valor, podramos conclur que el dado tiene... 2 caras!, cada una con la misma probabilidad de 0.5. Aplicando la definicin de probabilidad frecuencial, resulta: p= Casos favorables 5 -------------------------------- = 0.5 Casos observados 10

Otro ejemplo: supongamos que conocemos perfectamente que el dado tiene seis caras, pero no sabemos si las probabilidades de salir son iguales o no para todas ellas, ya que sospechamos que el dado puede estar 'cargado'. Para determinar la probabilidad de salir del nmero uno hacemos el mismo experimento, dndonos un valor de 0.7. Este valor, si lo tomamos al pie de la letra, nos hara pensar que el dado est preparado para que tenga tendencia a salir el nmero uno, ya que su probabilidad de ocurrencia es bastante alta. La probabilidad frecuencial se llama tambin 'a posteriori' debido a que 'slo despus' de hacer nuestra observacin o nuestro experimento podemos saber el valor de la probabilidad, y no 'antes', como en el caso
Pgina 47 de 331

48
de la probabilidad clsica, donde 'antes' de arrojar el dado ya sabemos que la probabilidad de cada cara es de 0.1666. La denominacin 'frecuencial' alude al hecho de el clculo de probabilidades se realiza en base a la frecuencia con que sale una determinada cara o posibilidad, frecuencia que es relativa porque la comparamos con la cantidad de casos observados. Por ejemplo, en nuestro ltimo ejemplo la frecuencia absoluta es 7, porque de 10 veces que arrojamos el dado, 7 veces sali el nmero deseado. En cambio la frecuencia relativa es 0.7, y resulta de dividir la frecuencia absoluta por el nmero de casos observados.
Las probabilidades clsica y frecuencial se llaman tambin probabilidades lgica e inductiva, respectivamente. a) Probabilidad lgica: si yo tengo un dado perfectamente balanceado (o sea que las seis caras tienen la misma probabilidad de salir), no necesitar arrojarlo para saber qu probabilidad tiene de salir el nmero 3. Como ya s que tiene seis caras equiprobables, su probabilidad ser de uno sobre seis (p=1/6). b) Probabilidad inductiva: puede ocurrir, sin embargo, que el dado no est balanceado, o que yo no sepa si el nmero 3 figura en dos caras y el 5 en ninguna, etc., y slo s que tiene 6 caras. A priori, o sea antes de arrojar los dados, en estos casos no puedo saber qu probabilidad tiene el 3 de salir, debido a mi desconocimiento del dado. No obstante tengo un medio de saberlo: arrojo el dado una gran cantidad de veces (cuantas ms veces mejor) y voy anotando los nmeros que aparecieron. Si constato que el 3 sali en un 50% de los casos, entonces puedo concluir que la probabilidad ser de tres sobre seis (p=3/6=1/2). Este dato no me aclara definitivamente si el dado estaba desbalanceado o si en realidad en tres de sus caras estaba el nmero 3; slo me sugiere la probabilidad de aparicin del nmero en cuestin. En suma: en la probabilidad lgica y debido a que conozco el dado, puedo calcular qu probabilidad tiene de salir determinado nmero sin necesidad de hacer ninguna prueba. Es una probabilidad deductiva, puesto que deduzco de los datos conocidos la probabilidad de cada alternativa. En cambio en la probabilidad inductiva no conozco la naturaleza del dado, y entonces slo puedo concluir la probabilidad de aparicin de un cierto nmero siguiendo un razonamiento inductivo, vale decir, a partir de los casos observados que fui anotando. Las mismas consideraciones que hicimos con las caras de un dado tambin podemos hacerlas con los naipes de un mazo y con los individuos de una poblacin. En estadstica, puesto que generalmente desconocemos la naturaleza de la poblacin, el tipo de probabilidad empleado es el inductivo.

c) La ley de los grandes nmeros.- Tambin llamada principio de la estabilidad de la frecuencia relativa, nos permite unificar conceptualmente los dos tipos de probabilidad recin examinados, y puede expresarse de la siguiente manera: a medida que aumenta la cantidad de ensayos, el valor de la probabilidad emprica obtenido se va aproximando cada vez ms al valor de la probabilidad terica. Ley de los Grandes Nmeros Cantidad de ensayos arrojando una moneda una vez 2 veces 3 veces 4 veces 10 veces 100 veces 1000 veces 1000000 veces Probabilidad terica de salir cara 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 Probabilidad emprica obtenida para cara 0 0.5 0.3333 0.25 0.3 0.4 0.45 0.4999999999999

Siguiendo el esquema adjunto, si arrojamos una moneda por primera vez (primer ensayo), la probabilidad terica de salir cara es de 0.5, cosa que sabemos ms all de hacer o no esa experiencia. Sin embargo, puede ocurrir que salga ceca, y entonces conclumos que la probabilidad emprica es 0, pues no sali ninguna cara. Al arrojar la moneda por segunda vez, la probabilidad terica sigue siendo 0.5, ya que el dado no tiene 'memoria': por ms que haya salido cien veces cara, la 101 vez sigue teniendo la misma probabilidad de salir cara. La probabilidad emprica, en cambio, nos da por ejemplo tambin 0.5, porque la primera vez no sali cara pero la segunda s, con lo cual habr salido cara la mitad de las veces, o sea hay una probabilidad de 0.5. Al tercer tiro vuelve a aparecer ceca, con lo cual sobre tres tiros habr salido slo una cara (la segunda vez), y entonces la probabilidad emprica es de un tercio (0.333). Lo que dice la ley de los grandes nmeros es que, si seguimos aumentando la cantidad de tiros, el valor de la probabilidad emprica se ir aproximando cada vez ms a la probabilidad terica de 0.5, es decir, se verifica una tendencia de la frecuencia relativa a estabilizarse en dicho resultado, y por ello esta ley se llama tambin principio de la estabilidad de la frecuencia relativa. La probabilidad (p) vara entre 0 y 1 Imposible 0 0 Probabilidad de Grados intermedios de probabilidad 0.25 0.50 0.75 1/4 1/2 3/4 Probabilidad de Probabilidad de Probabilidad de
Pgina 48 de 331

Seguro 1 1 Probabilidad de

49
extraer un as de espadas de un mazo de cartas francesas extraer un naipe de copas de un mazo de cartas espaolas obtener cara arrojando una moneda extraer una bolilla roja de una caja donde hay 3 rojas y una blanca extraer una bolilla roja de un bolillero de bolillas rojas

d) Probabilidad y variable aleatoria.- Las variables aleatorias son variables donde cada uno de sus valores puede asumir un valor de probabilidad entre 0 y 1. Las variables aleatorias pueden ser discretas o continuas. La variable nmero del dado es discreta, y por ejemplo su valor 2 asume un valor de probabilidad de 1/6. Las distribuciones de probabilidad son modelos donde se emplean variables aleatorias. Por ejemplo la distribucin normal (para probabilidad continua), la distribucin binomial y la distribucin de Poisson (para probabilidad constante), y la distribucin hipergeomtrica (para probabilidad variable). 3. Algunas aplicaciones del concepto de probabilidad.- La teora de las probabilidades, importante rama de la matemtica, ha permitido encarar la investigacin de sistemas, tanto cerrados como abiertos, bajo este relativamente nuevo enfoque. Ejemplos particularmente representativos aparecen en la termodinmica y en la teora de la informacin. a) Probabilidad en termodinmica.- La evolucin de los sistemas cerrados o abiertos puede medirse segn varios parmetros, como por ejemplo el grado de entropa o desorden, pero tambin segn el grado de probabilidad que pueden alcanzar cuando evolucionan hacia estados de equilibrio (como en el sistema cerrado) o hacia estados uniformes (como en el sistema abierto). As, se dice que la tendencia general de los procesos fsicos entendidos como sistemas cerrados apunta a la entropa creciente o estados de creciente probabilidad, mientras que los sistemas abiertos, como por ejemplo los sistemas vivos, consiguen mantenerse en un estado de mnima entropa, es decir, en un estado de alta improbabilidad estadstica. b) Probabilidad en Teora de la Informacin.- En la Teora de la Informacin se emplea tanto la probabilidad clsica como la probabilidad frecuencial. Es posible ilustrar esta cuestin con el siguiente ejemplo (Lichtenthal, 1970): Un forastero llega a un pueblo y pregunta: "Llover esta tarde?", a lo cual un vecino contesta "s". Esta respuesta provee mucha informacin o poca informacin? Todo depende de quien la reciba. a) Si la respuesta la recibe el mismo forastero, el "S" implica bastante informacin, porque desconoce el clima del pueblo. El "S" encierra para l tanta informacin como el "No", porque, al no conocer el clima habitual de la zona, para l ambas respuestas son igualmente probables (equiprobabilidad), y por consiguiente evala la probabilidad de que llueva o no en base a una probabilidad terica o a priori. b) Si la respuesta la escucha otro vecino, el "S" tiene un valor informativo prcticamente nulo porque todos en el pueblo saben que casi siempre llueve por las tardes. No es ninguna novedad el "S", es decir encierra poqusima informacin. En cambio si nuestro vecino hubiese escuchado "No" se sorprendera mucho, y la cantidad de informacin es mucha. El "S" y el "No" no son igualmente probables, cosa que el vecino descubri por experiencia, por haber vivido un tiempo en el pueblo (la probabilidad es, en este caso, frecuencial, y las posibles alternativas no son equiprobables). Los ejemplos vienen a destacar una idea muy importante que vincula informacin con probabilidad, y que es la siguiente: el contenido informativo de un mensaje est ntimamente ligado a su improbabilidad o 'valor sorpresa'. Por ejemplo, cuando ms nos 'sorprende' la respuesta, o cuando ms 'improbable' o 'inesperada' la juzgamos, ms informacin encierra. De aqu una importante definicin de informacin, como aquello que hace disminuir la incertidumbre del receptor. Si al vecino le dicen que "s llover en este pueblo esta tarde" esto no es sorpresa para l, no reduce su incertidumbre y, por consiguiente, apenas si contiene informacin. 4. Vocabulario.- La teora de la probabilidad utiliza cierta terminologa tcnica. Algunos de los principales trminos son los siguientes: Espacio muestral: es el conjunto S de todos los resultados posibles de un experimento dado. Por ejemplo, los resultados posibles del experimento de arrojar un dado son 1, 2, 3, 4, 5 y 6. Muestra: es un resultado particular, o sea, un elemento de S. Por ejemplo, arrojar un dado y obtener 4. Espacio finito de probabilidad: se obtiene al asignar a cada muestra de un espacio muestral finito una determinada probabilidad de ocurrencia en forma de nmero real. La probabilidad de un evento es igual a la suma de las probabilidades de sus muestras. Si en un espacio finito de probabilidad cada muestra tiene la misma probabilidad de ocurrir, se llamar espacio equiprobable o uniforme. Existen tambin espacios muestrales infinitos. Evento: Un evento A es un conjunto de resultados, o sea, un subconjunto de S. Por ejemplo, un evento puede ser arrojar dos veces un dado obtenindose por ejemplo un 4 y un 3. Si el evento tiene una sola muestra, se llama evento elemental. El conjunto S o espacio muestral es de por s un evento (en este caso se lo llama cierto o seguro, pues es seguro que arrojando un dado se obtendr 1, 2, 3, 4, 5 o 6), mientras que tambin se considera evento al conjunto vaco (se lo llama imposible: no es posible que no salga ningn nmero). Se pueden combinar eventos entre s para formar nuevos eventos, por ejemplo: A unin B es el evento que sucede si y slo si A o B o ambos suceden. A interseccin B es el evento que sucede si y slo si A y B suceden simultneamente.
Pgina 49 de 331

50
A complemento de A es el evento que sucede si y slo si A no sucede. Dos eventos son mutuamente excluyentes cuando no pueden suceder simultneamente. De una manera ms sencilla pueden identificarse los siguientes tipos de eventos:
Eventos Simple o elemental Compuestos De un mazo de cartas sacar un 3. Frmulas (a) p (A) = casos favorables / casos posibles p (A o A) = p (A) + p (-A) p (A o B) = p (A) + p (B) p (A y B) = p (A) . p (B) Ejemplo 4/52 = 0.077

Contrarios: sacar una carta que sea un 4/52 + 48/52 = 1 3 o no sea un 3. No contrarios: sacar una carta que sea 4/52 + 4/52 = un 3 o un as. 2/13 No Sacando una sola carta: sacar una 4/52 . 13/52 = excluyentes carta que sea un 3 y que sea de 1/52 o conjuntos corazn (c). Sacando Eventos independientes p (A y B) = 13/52 . 13/52 = dos o ms (con reposicin): de un p (A) . p (B) 1/16 cartas mazo sacar dos corazones reponiendo la primera (b). Eventos dependientes (sin p (A y BsiA) = 13/52 . 12/51 = reposicin): de un mazo p (A) . p (BsiA) 0.059 sacar 2 corazones sin reponer (a). (a) Las frmulas para eventos excluyentes son el teorema de las probabilidades totales. La frmula p (A y B) = p (A) . p (B) es el teorema de las probabilidades compuestas para eventos independientes. La frmula p (A y BsiA) = p (A) . p (BsiA) es el teorema de las probabilidades compuestas para eventos dependientes (probabilidad condicional). (b) Eventos independientes: Se dice que un evento B es independiente de un evento A si la probabilidad de que B suceda no est influenciada porque A haya o no sucedido. (c) Combinando los teoremas de las probabilidades totales de las probabilidades compuestas para eventos independientes, se pueden hacer otros clculos, como por ejemplo calcular la probabilidad de sacar un 3 o un corazn, pero no ambos (o sea, no un 3 de corazn), mediante la frmula p (A o B no ambos) = p (A) + p (B) p (A y B) = 4/52 + 13/52 (4/52 . 13/52) = 4/13.

Excluyentes o alternativos

3.2 ANLISIS COMBINATORIO Una de las aplicaciones de la teora de la probabilidad es el anlisis combinatorio, que estudia cuntos grupos distintos de elementos se pueden formar con un nmero finito de elementos. Por ejemplo: a) cuantos nmeros de tres cifras (grupos) se pueden formar con los elementos 6, 7, 8 y 9 (un ejemplo de nmero podra ser 768). Por convencin, se designa con la letra m al nmero total de elementos (en el ejemplo son 4), y se designa con la letra n la cantidad de elementos por grupo (en el ejemplo son 3). Los tipos de grupos ms importantes que se consideran en el anlisis combinatorio son las variaciones (V), las permutaciones (P) y las combinaciones (C), y en ningn caso se considera que los elementos se repiten dentro del grupo (como por ejemplo en 667, donde se repite el 6). En el siguiente cuadro se presentan las definiciones de las variaciones, las permutaciones y las combinaciones, y las respectivas frmulas para calcular la cantidad de variaciones, permutaciones y combinaciones. Para comprender las mismas, tngase presente el sencillo concepto de factorial. El nmero factorial de x es aquel que resulta de multiplicar x por cada uno de sus decrecientes hasta llegar al 1. Por ejemplo, el factorial de 4 (que se simboliza 4!) es igual a 24, porque 4! = 4.3.2.1.
Variaciones Definicin: Para que los grupos sean variaciones deben diferir en al menos un elemento (por ejemplo 678-679) o en su orden de sucesin (por ejemplo 678-786). Frmula: Vm,n = m! / (m-n)! La expresin Vm,n se lee cantidad de variaciones de m elementos, de n elementos cada variacin. Permutaciones Definicin:Para que los grupos sean permutaciones deben diferir slo en su orden de sucesin (por ejemplo 678-786). Frmula: Pm = m! La expresin Pm se lee cantidad de permutaciones de m elementos de m elementos cada permutacin. La permutacin es el nico caso donde se considera m = n, pues la permutacin es un caso especial de variacin. Ejemplo: Cuntos nmeros de 3 cifras pueden formarse con los dgitos 4, 5 y 6, sin repetir ninguno de ellos? Pgina 50 de 331 Combinaciones Definicin:Para que los grupos sean combinaciones deben diferir slo en por lo menos un elemento (por ejemplo 678-679). Frmula: Cm,n = Vm,n / Pn Cm,n = m! / n! (m-n)! La expresin Cm,n se llama nmero combinatorio y se lee cantidad de combinaciones de m elementos, de n elementos cada combinacin. El nmero combinatorio es igual a 1 en dos casos: cuando m = n y cuando n = 0. Ejemplo: Cuntos grupos distintos pueden formarse con los colores A, V y R tomndolos de a dos?

Ejemplo: Cuntos grupos de 3 personas se pueden formar con 5 candidatos? m=3

51
n=5 V5,3 = 60 grupos o variaciones. m=n=3 P3 = 6 nmeros o permutaciones. m=3 n=2 C3,2 = 3 grupos o combinaciones.

La relacin entre la teora de la probabilidad y el anlisis combinatorio reside en que, tomando como punto de partida las frmulas de la cantidad de variaciones, permutaciones o combinaciones, se puede luego calcular la probabilidad de ocurrencia de uno de los grupos de elementos. Las frmulas de variaciones, permutaciones o combinaciones indican el nmero de casos posibles. Experimento binomial.- El nmero combinatorio puede ser utilizado en los llamados experimentos binomiales, es decir, en experimentos donde se cumplen las siguientes condiciones: Condiciones Es una secuencia de repeticiones del mismo ensayo o experimento. Cada ensayo tiene solamente dos resultados posibles (xito-fracaso). Los ensayos son independientes es decir, no se influyen entre s. La probabilidad de un resultado (por ejemplo xito) es igual para todos los ensayos (equiprobabilidad). La variable es discreta. Ejemplo Sacar 3 bolillas de una urna. La bolilla solamente puede salir blanca o negra. Antes de sacar la siguiente bolilla se introduce la anterior en la urna (con reposicin). Todas las bolillas tienen la misma probabilidad de salir blancas (por ejemplo si se considera blanca como xito). No hay grados intermedios entre blanco y negro.

La frmula para calcular la probabilidad de obtener n xitos con m ensayos es la siguiente:

pn = Cm,n . pn . (1 p)m-n

donde: m = nmero de ensayos (o n, segn otra nomenclatura). n = nmero de xitos (o k, segn otra nomenclatura). Cm,n = nmero combinatorio. pn = probabilidad de xitos. Ejemplo: cul es la probabilidad de obtener 6 caras al arrojar una moneda 10 veces? Como m = 10 y n = 6, resulta pn = 0,2050.

En lugar de realizar los clculos utilizando la frmula anterior, se puede utilizar una llamada tabla de probabilidades binomiales. Los experimentos binomiales y la curva normal, que se estudia en el punto siguiente, son dos tipos frecuentes de distribucin de probabilidades.
Algunos tipos de distribuciones de probabilidad son los siguientes: 1) Distribucin normal (para probabilidad continua).- Se representa mediante la curva de Gauss o curva normal, conforma de campana. Es una funcin unimodal, continua, donde la probabilidad es un rea que se acumula de izquierda a derecha, siendo la total igual a 1. La curva es simtrica. Hay tres tipos de distribucin normal: no estandarizada, estndar con z y estndar con t. a) Distribucin normal no estandarizada.- Sus parmetros son la media aritmtica y el desvo estndar. La media aritmtica, la mediana y el modo coinciden en el punto central. La variable x puede tomar cualquier valor, positivo o negativo. b) Distribucin normal estndar con z.- Caso particular donde la media aritmtica asume el valor 0 (cero) y el desvo estndar el valor 1 (uno). c) Distribucin normal estndar con t.- La curva es ms chata que en el caso anterior, lo que indica mayor dispersin ya que aqu se desconoce el desvo poblacional: al tener menos informacin, se supone que los valores se distribuyen con mayor dispersin. El aplanamiento de la curva depende del tamao de la muestra (grados de libertad): cuando ste aumenta, la curva va aproximndose a la forma menos achatada o aplanada de la distribucin z. 2) Distribucin asimtrica de Chi-cuadrado o x2.- Curva asimtrica a la derecha, unimodal, donde x2 asume slo valores positivos. A medida que aumentan los grados de libertad, la curva se hace cada vez ms simtrica. Los grados de libertad dependen de la cantidad de grupos e tratamiento (o sea de las diferentes categoras de la variable: los grados de libertad se expresan como k 1, donde k = nmero de categoras de la variable). Chicuadrado se usa cuando hay variables nominales. 3) Distribucin asimtrica de Snedecor o F.- Curva asimtrica a la derecha, unimodal, donde F asume slo valores positivos. A medida que aumentan los grados de libertad, la curva se hace cada vez ms simtrica. F es el cociente entre variancias: F = variancia 1 / variancia 2, y se calcula en base al nivel alfa de significacin, los grados de libertad del numerador y los grados de libertad del denominador. 4) Distribucin binomial (para probabilidad constante).- Considera un esquema de pruebas repetidas con probabilidad constante, donde se realizan experimentos en los cuales se busca obtener x xitos y n-x fracasos. 5) Distribucin de Poisson (para probabilidad constante).- Descubierta por Poisson en el siglo 19, considera un esquema de pruebas repetidas con probabilidad constante. Es el caso lmite de la probabilidad binomial, donde la probabilidad es constante y los sucesos son independientes. Es totalmente compatible con la distribucin binomial,

Pgina 51 de 331

52
pero solo viene tabulada para nmeros grandes (n = 20 o ms) y para probabilidades muy pequeas (inferiores al 5%), razn por la cual se la llama tambin distribucin de los sucesos raros. La funcin de probabilidad P(x) de la distribucin de Poisson se calcula en base a una tabla especial o bien en base al siguiente cociente: Numerador: producto del nmero e elevado a la menos Lambda, por Lambda elevado a la x. Lambda es el coeficiente de Poisson una constante igual a n.p. La variable discreta es x, y el nmero e es igual a 2,71828. Denominador: Factorial de x. Si Lambda es un valor muy pequeo, la curva es marcadamente asimtrica y decreciente. Al crecer Lambda, va tomando forma de campana, o sea se asemeja cada vez ms a la distribucin normal. 6) Distribucin hipergeomtrica (para probabilidad variable).- Como la distribucin binomial, es un esquema de pruebas repetidas, con la diferencia que es con probabilidad variables pues es sin reposicin y los sucesos son dependientes. La dispersin es menor que en la distribucin binomial, por lo que se la considera una distribucin ms precisa.

3.3 DEFINICIN Y CARACTERSTICAS DE LA CURVA NORMAL Si se tomaran nueve personas al azar para medir la variable frecuencia cardaca, podran obtenerse, por ejemplo, los siguientes resultados: tres personas con 62, cinco personas con 70 y una persona con 84 pulsaciones por minuto. Representando visualmente esta situacin mediante un polgono de frecuencias, se obtiene el grfico 1. Si se registrara la frecuencia cardaca de 80 personas ms, probablemente se obtendra resultados similares al polgono de frecuencias del grfico 2. Finalmente, si se consideraran infinito nmero de personas, la representacin visual se asemejara al grfico 3, denominado curva normal, curva de Gauss o campana de Gauss (por su forma acampanada). Como puede apreciarse, ciertas variables continuas como la frecuencia cardaca, la glucemia, la estatura, el peso, la agudeza visual, el cociente intelectual, y otras, tiende a adoptar la forma de una curva normal a medida que aumenta la cantidad de casos observados (3). Aunque esta curva es una idealizacin, porque no pueden medirse infinitos casos, tiene, como se ver, su utilidad, an cuando las variables que se estudian desde este modelo no siguen estrictamente la distribucin de la curva normal. Pruebas como por ejemplo el chi cuadrado permiten determinar si una distribucin es lo suficientemente parecida a una distribucin normal como para poder aceptar el modelo de la curva normal para estudiarla. De hecho, muchas variables tienen distribuciones lo suficientemente similares a una distribucin normal como para tratarlas como tales sin cometer grandes errores. En relacin con estas cuestiones, conviene recordar aqu el teorema del lmite central, que dice que cualquiera sea la poblacin de donde se tome una muestra, la distribucin de los valores de la muestra se aproximan o asemejan cada vez ms a una distribucin normal a medida que el tamao n de la muestra aumenta. En la prctica se consideran normales a las muestras cuyo tamao es igual o superior a 30. f

Grfico 1

Grfico 2

Grfico 3

5 3 1

62

70

84

70

La curva normal tiene entonces algunas caractersticas que son las siguientes: a) Es la idealizacin de un polgono de frecuencias con tendencia central para una gran cantidad de casos. Por esta razn tiene la apariencia de una curva y no de una lnea quebrada, ya que el polgono de frecuencias tiene infinito nmero de lados. b) Tiene forma de campana: no tiene otras formas similares como puede ser la forma de herradura o la forma de una campana invertida. c) Es simtrica respecto de un eje vertical, lo que las diferencia de otras curvas como por ejemplo la hiprbole equiltera. La simetra de la curva normal implica que la media aritmtica, la mediana y el modo coinciden en el punto central. Consecuentemente, la curva normal es unimodal (en cambio, una campana invertida podra ser bimodal). Tambin implica que la distancia del cuartil 1 al cuartil 2 es igual a la distancia entre el cuartil 2 y el cuartil 3.
Pgina 52 de 331

53
d) Es asinttica respecto del eje x. Esto significa que la curva y el eje de las absisas se cortan en el infinito, lo cual implica que cualquier valor de x tiene potencialmente alguna frecuencia, y ninguna frecuencia igual a 0. e) La curva normal puede adoptar diferentes formas: mesocrtica, platicrtica o leptocrtica. f) Los puntos de inflexin (donde la curva cambia de cncava a convexa y viceversa) se encuentran en los puntos correspondientes a la media aritmtica ms/menos un desvo estndar. g) Hay muchas posibilidades de curvas normales, dependiendo de cules sean los valores de las medias aritmticas y los desvos estndar. La ms importante es aquella que tiene como media aritmtica 0 (cero) y como desvo estndar 1 (la unidad). En este caso, la curva normal se designa como distribucin o curva normal estndar o estandarizada. h) Est comprobado que en una curva normal, y siempre idealmente, alrededor de un 68% de los casos posibles estn comprendidos entre menos un desvo estndar y ms un desvo estndar ( 1), alrededor de un 95% estn comprendidos entre menos 2 y ms dos desvos estndar ( 2), y alrededor de un 99% estn comprendidos entre menos tres y ms tres desvos estndar ( 3), segn lo ilustra el siguiente esquema:

Esto significa por ejemplo que una persona tiene una probabilidad del 68% de tener una frecuencia cardaca comprendida entre menos un desvo estndar y ms un desvo estndar. Si la media aritmtica de esta distribucin fuera 80 pulsaciones por minuto y el desvo estndar fuera de 10 pulsaciones por minuto, entonces la frecuencia cardaca de una persona cualquiera tendra un 68% de probabilidades de valer entre 70 y 90 pulsaciones por minuto. Siguiendo el mismo criterio, tambin puede calcularse la probabilidad de aparicin de un valor comprendido entre menos tres desvos estndar y la media aritmtica (99% dividido 2), la probabilidad de aparicin de un valor comprendido entre menos dos desvos estndar y la media aritmtica (95% dividido 2), la probabilidad de aparicin de un valor comprendido entre menos un desvo estndar y ms dos desvos estndar (68% dividido 2, ms 95% dividido 2), y la probabilidad de obtener cualquier otro valor intermedio (como el comprendido entre -1.27 desvos y +2.56 desvos), para lo cual se habr de consultar una tabla especialmente confeccionada para tal efecto. 3.4 PUNTAJES BRUTOS Y PUNTAJES ESTANDARIZADOS Antes de hacer referencia a las utilidades prcticas de la curva normal, convendr aclarar algunos conceptos tales como los de puntaje bruto y puntaje estandarizado. Para designar los diferentes valores que asume una variable para una determinada unidad de anlisis, en estadstica descriptiva suele emplearse la expresin dato. Por ejemplo, un dato puede ser Juan mide 1.70
Pgina 53 de 331

54
metros. Muchos datos, sin embargo, se distribuyen de acuerdo a una curva normal, y esta clase de datos suelen ser tpicamente puntuaciones o puntajes de tests o pruebas de evaluacin. Por ejemplo, Juan obtuvo 90 puntos en el test de inteligencia de Weschler, o Pedro obtuvo 7 puntos en el examen de geografa. Esta es la razn por la cual, en lo que sigue se utilizar la expresin puntaje en lugar de dato, pero debe tenerse presente que todo puntaje es, siempre, un dato. Se llama puntaje bruto, directo u original al puntaje obtenido por un sujeto en una prueba. Por ejemplo, podra resultar de la suma de respuestas correctas, valiendo cada una de ellas un punto (Kohan, 1994:138). Los puntajes brutos presentan sin embargo algunos inconvenientes. Por ejemplo: a) Si una persona obtuvo 4 puntos en una prueba acadmica, podemos suponer que obtuvo un bajo puntaje porque lo comparamos con el puntaje mximo, que es 10. Sin embargo, no nos sirve para comparar a esa persona con el resto de la poblacin, ya que si los dems alumnos obtuvieron en promedio 2 puntos, la calificacin 4 ser, entonces, alta. b) Si una persona obtuvo 8 puntos en geografa y 5 puntos en matemticas, podemos suponer que obtuvo ms puntaje en geografa. Sin embargo, esta suposicin es errnea si resulta ser que el puntaje mximo en geografa es 20 y el puntaje mximo en matemticas es 6, en cuyo caso habr obtenido mayor puntaje en matemticas. Estas y otras dificultades pueden resolverse transformando los puntajes brutos en otros llamados puntajes estandarizados (o tambin puntajes transformados, porque resultan de haber transformado los puntajes brutos). Estos puntajes estandarizados permitirn, por ejemplo, comparar el puntaje de un sujeto con toda la poblacin, o bien comparar dos puntajes de pruebas con diferentes sistemas de evaluacin (1). Los puntajes estandarizados pueden ser lineales o no lineales, segn que resulten de transformaciones lineales o no lineales (Kohan, 1994:138). En el primer caso existe una proporcionalidad entre los puntajes brutos y sus correspondientes puntajes estandarizados, ya que la transformacin opera segn una ecuacin lineal o ecuacin de primer grado y, por tanto, no deforma la distribucin de los puntajes brutos. En lo que sigue se describen sucintamente tres ejemplos de puntajes estandarizados de uso frecuente: los puntajes estandarizados z (puntaje reducido), Z (puntaje derivado) y P (puntaje percentil). El puntaje reducido z es un dato transformado que designa a cuntas unidades de desvos estndar por arriba o por debajo de la media se encuentra un dato en bruto (Pagano, 1998:84). Para transformar un dato en bruto x en un puntaje z se utiliza la frmula: z = (x - X) / s. Pueden destacarse tres caractersticas de los puntajes z (Pagano, 1998:86-87): a) tienen la misma forma que el conjunto de datos en bruto; b) la media de los puntajes z es siempre igual a cero; y c) el desvo estndar de los puntajes z es siempre igual a 1. El puntaje derivado Z (tambin llamado a veces puntaje derivado T) tiene la ventaja sobre el puntaje reducido z que no tiene valores negativos y que pueden despreciarse los decimales por ser una cantidad pequea (Kohan, 1994:141). Para transformar un puntaje reducido z en un puntaje derivado Z se utiliza la frmula: Z = (z.10) + 50, ya que este puntaje derivado considera la media aritmtica como 50 y el desvo estndar como 10. Existen otras modalidades de puntajes derivados (Botella: 1993:161). Uno muy conocido en psicologa es el llamado cociente intelectual o CI, que considera como media aritmtica a 100 y como desvo estndar a 15. El puntaje percentil P es un puntaje no lineal y es tambin de uso frecuente por su facilidad de comprensin, aunque tenga el inconveniente de que su distribucin toma una forma que no responde a la realidad de las funciones psicolgicas. Para transformar un puntaje z en un puntaje percentil hay que recurrir a una tabla especial, que se describe ms adelante. Como se puede apreciar en el esquema siguiente, el puntaje percentil P no es proporcional al resto de los puntajes, pero si lo es respecto de las reas cubiertas bajo la curva normal, reas que a su vez indican la probabilidad de ocurrencia de un puntaje cualquiera. En efecto, puede verse que los puntajes percentiles P estn concentrados en aquellos lugares donde el rea bajo la curva es mayor y, adems, cuanto mayor es esta rea mayor ser el percentil correspondiente. Las correspondencias entre los diferentes puntajes pueden visualizarse mediante el siguiente esquema (2): Equivalencias de puntajes brutos y estandarizados

Pgina 54 de 331

55
f (frecuencia)
X = media aritmtica s = desvo estndar x = puntaje bruto z = puntaje reducido Z = puntaje derivado P = percentil

50% del rea probabilidad = 0.5

50% del rea probabilidad = 0.5

x -3s -2s -1s X +1s +2s +3s z

-5

-4

-3

-2

-1

+1

+2

+3

+4

+5

Z 0 10 20 30 40 50 60 70 80 90 100 P

P0

P2

P16

P50

P84

P98

P100

As por ejemplo, puede apreciarse que un puntaje bruto correspondiente a ms un desvo estndar corresponde a un puntaje reducido z de +1, a un puntaje derivado Z de 60, y a un percentil de 84. Especialmente cuando se trata de averiguar valores intermedios (por ejemplo el puntaje bruto correspondiente a ms 1.62 desvos estndar) debe recurrirse al empleo de frmulas y tablas. El siguiente esquema indica la forma de hacerlo: Reglas de transformacin de puntajes (de utilidad para resolver aplicaciones prcticas de la curva normal)

Pgina 55 de 331

56
Tabla: entrar por z PUNTAJE REDUCIDO (z) x = (z.s) + X Tabla: entrar por p AREA EXPRESADA COMO PROBABILIDAD (p)

z = (x - X) / s PUNTAJE BRUTO (x)

Z = (z.10) + 50

z = (Z-50) / 10

Multiplicar por 100

Dividir por 100

PUNTAJE DERIVADO (Z)

AREA EXPRESADA COMO PORCENTAJE (%)

m% Pm

Pm m%

m = un nmero cualquiera entre 0 y 100

PERCENTIL (P)

En este esquema, las flechas ms gruesas indican los procedimientos habituales en las aplicaciones prcticas de la curva normal, mientras que aquellas y las flechas ms finas indican mas bien los procedimientos que se piden en ejercitaciones en cursos de estadstica. 3.5 APLICACIONES DE LA CURVA NORMAL El modelo matemtico de la curva normal tiene varias aplicaciones prcticas, como por ejemplo en psicologa y ciencias de la educacin. Pagano (1998:81) invoca tres razones principales que explican su importancia en estas disciplinas: 1) Muchas variables psicolgicas tienen distribuciones muy semejantes a la curva normal, tales como altura, peso e inteligencia. 2) Muchas pruebas de inferencia empleadas para analizar experimentos tienen distribuciones muestrales que poseen una distribucin muestral al aumentar el tamao de la muestra. 3) Muchas pruebas de inferencia requieren distribuciones muestrales que se asemejen a la curva normal, como la prueba z, la prueba t de Student o la prueba F. Consiguientemente, gran parte de la importancia de la curva normal aparece conjuntamente con la estadstica inferencial. En lo que sigue se suministran algunos ejemplos de aplicaciones prcticas de la curva normal con puntajes estandarizados. En primer lugar se expone un problema tpico y la forma de resolverlo teniendo en cuenta las reglas de transformacin de puntajes (ver esquema anterior). En segundo lugar, se presentan algunas variantes posibles dentro del problema tpico u otros. Problema tpico.- La variable peso en una poblacin de mujeres adultas tiene una distribucin aproximadamente normal, con una media aritmtica (X) de 60 kg y un desvo estndar (s) de 6 kg. Calcular la probabilidad de que una mujer adulta de esa poblacin tomada al azar tenga un peso mayor a 68 kg. Resolucin del problema tpico.- Cuando el enunciado del problema afirma que la variable tiene una distribucin aproximadamente normal, ello significa que puede ser resuelto recurriendo al modelo de la curva normal. A partir de aqu, los pasos para resolverlo son los siguientes: a) Lo primero que debe especificarse son los datos y las incgnitas. Los datos son tres: la media aritmtica (60 kg), el desvo estndar (6 kg), y finalmente un valor de la variable a partir del cual debe estimarse su probabilidad (68 kg). En smbolos: X = 60 kg s = 6 kg x = 68 kg En este caso el problema solicita resolver una sola incgnita: la probabilidad de que una persona tomada al azar tenga ms de 68 kg (tambin podra haber solicitado averiguar la probabilidad de que tenga menos de 50 kg, o la probabilidad de que tenga entre 40 y 60 kg). En smbolos:
Pgina 56 de 331

57
p 68 kg > x b) Antes de seguir adelante, siempre convendr trazar la curva normal y especificar la informacin revelante para resolver el problema. En este caso es:

Segn el esquema de reglas de transformacin de puntajes, si a partir de un valor dado de x (68 kg) se quiere calcular su probabilidad p, antes deber transformarse el valor x a un puntaje reducido z, el cual constituye una incgnita (?) que deber resolverse. Asimismo se raya el rea bajo la curva que se extiende desde 68 hacia la derecha, porque es esa probabilidad (proporcional al rea rayada) la que debe averiguarse (es decir, 68 o ms). c) Se aplica la frmula de transformacin del puntaje x en puntaje z: z = (x - X) / s z = (68 60) / 6 = 1.33 d) Se recurre a la Tabla de reas bajo la curva normal estandarizada para hallar la probabilidad p a partir de z = 1.33. Para ello, puede utilizarse indistintamente la Tabla 1 o la Tabla 2 (ver Anexo). Se utilizar la Tabla 1, donde puede verse que a un valor z = 1.33 corresponde una probabilidad p = 0.9082. e) Sin embargo, esta tabla indica la probabilidad de z o menos, es decir, la zona rayada hacia la izquierda de z. Por lo tanto, como lo que interesa es la probabilidad de un valor de z o mayor, se restar al valor p = 1 (el total del rea bajo la curva) el valor p = 0.9082. En smbolos: Area total 1.0000 Menos rea hacia la izquierda 0.9082 Area hacia la derecha 0.0918 Por lo tanto, la probabilidad de que una mujer adulta pese ms de 68 kg es de p = 0.0918. Traduciendo la probabilidad a porcentajes, puede decirse que existe un 9.18% de probabilidades de que la mujer pese 68 kg o ms. De idntica manera, puede decirse que el percentil P que ocupa una mujer adulta de 68 kg es, siguiendo las pautas del esquema de reglas de transformacin de puntajes: P91 (calculado y redondeado a partir de p = 0.9082), lo cual significa que una mujer que pese 68 kg tiene por debajo aproximadamente un 91% de personas que pesan menos que ella. Algunas variantes posibles.- Los siguientes ocho casos ilustran algunos ejemplos de problemas que pueden resolverse mediante la curva normal y los puntajes estandarizados. El problema tpico examinado precedentemente encuadra en el caso 4. En todos estos casos se trata de calcular la probabilidad de ocurrencia de un valor comprendido bajo el rea rayada de la curva ya que la probabilidad de ocurrencia del valor es proporcional al rea respectiva. Como se ver, en algunos casos conviene ms utilizar la Tabla 1 y en otros las Tabla 2 (ver Anexo).

Pgina 57 de 331

58

CASO 1

CASO 2

CASO 3

CASO 4

CASO 5

CASO 6

CASO 7

CASO 8

Caso 1.- Aqu se trata de averiguar la probabilidad p de que un valor cualquiera de la poblacin corresponda a z = +1.5. Para este caso convendr utilizar la tabla 1, donde primero se busca el valor +1.5 en la primera columna, y luego se busca su valor de probabilidad, que es p = 0.9332. Nota: si el valor de z hubiese sido +1.56, se busca primero z = 1.5 y luego se busca, en la primera hilera, el valor 0.06 (ya que 1.5 + 0.06 = 1.56). En el entrecruzamiento de 1.5 y 0.06 encontraremos, finalmente, el valor de la probabilidad p = 0.9406. Caso 2.- En este caso se procede de manera similar que en el caso anterior. Caso 3.- Aqu se trata de averiguar la probabilidad de que un valor z valga -2 o ms. Esta situacin exige dos pasos. El primer paso es idntico al caso 1. Sin embargo, este primer paso calcula la probabilidad de z hacia la izquierda, y lo que se necesita saber es la probabilidad de z hacia la derecha (zona rayada). Como se sabe que la totalidad del rea bajo la curva vale 1, para averiguar la zona hacia la derecha bastar con restar 1 de la probabilidad de la zona hacia la izquierda. En esto consiste el segundo y ltimo paso. Caso 4.- Aqu debe averiguarse la probabilidad de que un valor z valga 1.5 o ms. La opcin ms sencilla es aqu emplear la Tabla1, con la cual se calcula la probabilidad correspondiente a z = +1.5, que es p = 0.9332. Esta probabilidad corresponde a la zona rayada desde z hacia la izquierda, pero como debe averiguarse la probabilidad de z hacia la derecha, deber restarse 1 menos 0.9332.

Pgina 58 de 331

59
Caso 5.- Aqu debe averiguarse la probabilidad de que un valor z est comprendido entre -2.5 y +1.5. Una forma sencilla de resolver este problema es dividiendo el rea rayada en dos: una desde la mitad hacia la izquierda (0 a -2.5) y otra desde la mitad hacia la derecha (0 a +1.5). Se calcula luego la probabilidad de cada rea recurriendo a la Tabla 2, y finalmente se suman ambas probabilidades. Nota: para el clculo de la zona rayada de la mitad hacia la izquierda se buscar en la Tabla 2 el valor z = +2.5, porque es igual al valor z = -2.5 (por ser la curva normal simtrica). Caso 6.- Este caso es tan sencillo que no requiere el uso de tablas. La probabilidad de la zona rayada es p = 0.5 porque corresponde exactamente a la mitad de toda el rea bajo la curva, cuya p es igual a 1 (p = 1 equivale a la certeza). Caso 7.- Aqu debe calcularse la probabilidad de que un valor z est comprendido entre -2 y -1. En este caso, en lugar de sumar reas como en el caso 5, debern restarse reas. Recurriendo a la Tabla 1, se calcula primero la probabilidad correspondiente a z = -1 (que es p = 0.1587) y luego la probabilidad de z = -2 (que es p = 0.0228). La probabilidad resultante ser p = 0.1587 0.0228 = 0.1359. Caso 8.- Aqu debe calcularse la probabilidad de que un valor z est comprendido entre +1 y +2. Se puede proceder de la misma forma que en el caso 7, es decir, restando las probabilidades correspondientes a z = +2 y z = +1.
NOTAS (1) Botella (1993:153) refiere que los puntajes estandarizados son tiles en los siguientes casos: a) al hacer comparaciones entre unidades de distintos grupos: se pueden comparar, mediante puntuaciones estandarizadas, distintas observaciones de un mismo sujeto o de sujetos diferentes; b) al hacer comparaciones entre variables medidas de distinta forma, debido a que los puntajes estandarizados son adimensionales. Por ejemplo, comparar una altura expresada en centmetros con otra expresada en metros; y c) al comparar observaciones de distintas variables: por ejemplo, comparar la altura y el peso de un sujeto. (2) En el esquema puede apreciarse que z contempla valores que se extienden a -5 o +5.desvos estndar. En la prctica, sin embargo, se consideran solamente valores entre -3 y +3 por razones prcticas. En efecto, los valores superiores a +3 o menores a -3 cubren reas muy pequeas bajo la curva, es decir, la probabilidad de ocurrencia de puntajes mayores que +3 o menores que -3 son muy improbables, estando muy alejados de la media aritmtica. (3) Hay muchas formas en que los datos pueden distribuirse, y en todos esos casos existe cierta regularidad en los mismos. Por ejemplo, hay una tendencia a que la mitad de las veces salga cara arrojando una moneda, y tambin hay una tendencia a que la mitad de las veces se opte por un producto A y no uno B (suponiendo que lo hay ninguna razn para elegir uno u otro). Estos hechos sugieren que los datos de una manera regular, y los estadsticos propusieron diversos modelos de distribucin, uno para cada forma regular de distribucin de datos, como por ejemplo el modelo Bernouilli o el modelo binomial. La nocin de permanencia estadstica (Vessereau A, 1962:15) hace referencia a ciertas uniformidades en los datos de la realidad. Por ejemplo: a) la cantidad de varones y la de mujeres tiende a ser aproximadamente igual; b) el tamao de las galletitas que fabrica una mquina tiende a ser aproximadamente igual; c) la proporcin entre granos esfricos de arvejas y granos arrugados de arvejas tiende a ser del 75% y del 25% aproximadamente, o sea, siempre tiende a encontrarse aproximadamente 75 granos esfricos cada 100, y 25 granos arrugados cada 100; d) la estatura de las personas tienden siempre a estar alrededor de un valor medio, siendo frecuente encontrar estaturas de 1.70 metros pero raro encontrar estaturas de 2 metros. Estas uniformidades sugieren la presencia de leyes que rigen la forma en que se distribuyen los datos. Como hay muchas formas en que los datos pueden distribuirse, tambin habr muchas leyes que describen dichas distribuciones. Entre las ms conocidas (Vessereau A, 1962:16-24) se cuentan la ley binomial, la ley de Laplace-Gauss y la ley de Poisson. Por ejemplo, la ley de Laplace-Gauss describe las distribuciones que siguen una curva normal: cuando una magnitud recibe la influencia de una gran cantidad de causas de variacin, y estas son todas muy pequeas e independientes unas de otras, se demuestra que los valores individuales de las mediciones se distribuyen respondiendo a la ley de LaplaceGauss (Vessereau A, 1962:20). Otros autores consideran fundamentales a las distribuciones normal, binomial y de Student, y hacen referencia a otras, como la distribucin chi cuadrado (x2) que, a diferencia de la primeras, no es paramtrica, es decir, no requiere supuestos tan rigurosos acerca de la poblacin, como por ejemplo de que esta se distribuya normalmente (Kohan N, 1994:191). Hay otras leyes que tienen alcance ms general, como por ejemplo la ley de distribucin de las medias (Vessereau A, 1962:24) que establece que, cualquiera que sea la distribucin (binomial, gaussiana, etc), el desvo estndar de las medias aritmticas de todas las muestras posibles de n elementos disminuye inversamente a la raz cuadrada de n. Esto significa que cuanto ms grandes sean las muestras, menos desviacin o dispersin habr entre sus medias aritmticas.

Teorema de Chebicheff.- Esta desigualdad se aplica a cualquier tipo de distribucin (normal o no), hiptesis, ley, etc, y por ello puede actuar como prueba de consistencia. Se emplea cuando no se sabe qu tipo de distribucin tiene la muestra o poblacin. Esta desigualdad brinda el lmite inferior (probabilidad mnima) de los casos ms probables segn cualquier ley, teora, etc. Ms concretamente, sirve para determinar la probabilidad mnima de un intervalo centrado en la media, y que abarca tantas dispersiones en menos y tantas en ms. Generalmente se toman +2 y -2. La frmula es: P (m t . x m + t . ) 1 (1/t2) donde: P = Probabilidad mnima.
Pgina 59 de 331

60
m = Media aritmtica. = Desvo estndar. t = Cantidad de desvos estndar (en general se toman 2). m t . = Lmite inferior. m + t . = Lmite superior. x = Valor que est entre ambos lmites. m t . x m + t . = Intervalo Como se considera generalmente t = 2, resulta ser: P (m 2. x m + 2 . ) 0.75 Ejemplo de problema.- En una muestra, la media aritmtica es 60 y el desvo estndar es 20. Determinar el intervalo de x que abarque por lo menos el 75% de los casos ms probables. P (m 2. x m + 2 . ) 0.75 P (60 2. 20 x 60 + 2 . 20) 0.75 P (20 x 100) 0.75 El intervalo obtenido nos asegura que por lo menos (probabilidad mnima) el 75% de los casos ms probables estn entre 20 y 100.

CAPTULO 4: CORRELACIN Y REGRESIN


4.1 INTRODUCCIN El anlisis de correlacin permite averiguar el tipo y el grado de asociacin estadstica entre dos o ms variables, mientras que el anlisis de regresin permite hacer predicciones sobre la base de la correlacin detectada. Ms concretamente, una vez realizado el anlisis de correlacin, pueden obtenerse dos resultados: que haya correlacin o que no la haya. Si hay correlacin, entonces se emprende un anlisis de regresin, consistente en predecir cmo seguirn variando esas variables segn nuevos valores. Por ejemplo, si sobre la base de haber examinado a 40 alumnos se concluye una alta correlacin en sus notas en ambos parciales, conociendo la nota del primer parcial de un alumno nmero 41, podremos predecir con algn margen de seguridad cunto se sacar este alumno en el segundo parcial. En general el anlisis de correlacin se realiza conjuntamente con el anlisis de regresin. Mientras el anlisis de correlacin busca asociaciones, el anlisis de regresin busca predicciones, es decir, predecir el comportamiento de una variable a partir del comportamiento de la otra. As, la correlacin y la regresin estn ntimamente ligadas. En el nivel ms sencillo, ambas implican la relacin entre dos variables y utilizan el mismo conjunto de datos bsicos, pero mientras la correlacin tiene que ver con la magnitud y la direccin de la relacin, la regresin se centra en el uso de la relacin para hacer una prediccin. Esta ltima es sencilla cuando la relacin es perfecta, pero la situacin es ms compleja si la relacin es imperfecta (Pagano, 127). La correlacin es til porque permite hacer predicciones, porque permite establecer correlaciones (paso previo para la determinacin de una conexin causal), y para realizar pruebas de confiabilidad de instrumentos de medicin como los tests (prueba test-retest) (Pagano, 99). Por ltimo, vale la pena aclarar que en el contexto de un estudio cientfico, no basta con determinar el grado de correlacin entre dos variables en una muestra. Es necesario adems establecer, mediante una prueba de significacin (por ejemplo la prueba t), si la correlacin establecida en la muestra puede extenderse a toda la poblacin con un determinado nivel de confianza. Esta tarea corresponder a la estadstica inferencial. Correlacin lineal.- Las relaciones entre variables pueden ser de muchos tipos. a) Hay relaciones deterministas que responden a modelos matemticos tericos, como por ejemplo la relacin entre la intensidad de una corriente y la resistencia del conductor, o bien, la relacin entre la factura de consumo de agua y el nmero de metros cbicos consumidos. Estas relaciones son habituales en ciencias exactas. b) Otras relaciones no son tan deterministas, pero pueden eventualmente parecerse slo parecerse- a algn modelo matemtico terico determinista, en cuyo caso se concluye que ese modelo explica bien la relacin, aunque no lo haga perfectamente. Estas relaciones son habituales en las ciencias sociales (Botella, 1993:181). Dentro de los muchos modelos tericos a los cuales podra ajustarse una relacin no determinista se cuentan los modelos lineales, los modelos cuadrticos, los modelos cbicos, etc. El primero se representa mediante una recta, y los restantes mediante diversos tipos de curva como parbolas e hiprbolas. El presente artculo har referencia, por razones de simplicidad, a las relaciones lineales y, por tanto, a la correlacin lineal. Correlacin y causalidad.- El hecho de que dos variables estn correlacionadas, no significa necesariamente que una sea la causa y la otra el efecto: la correlacin no siempre significa causalidad. Entre otras cosas, una alta correlacin puede deberse a que ambas variables X e Y dependen cada una independientemente de otra variable Z, y entonces, al variar Z hace variar conjuntamente a X e Y, produciendo un efecto de alta
Pgina 60 de 331

61
correlacin que puede dar la apariencia de causalidad. Por dar un ejemplo: entre memoria visual (X) y memoria auditiva (Y) puede haber una alta correlacin, pero ello no significa que la memoria visual sea la causa de la memoria auditiva, ya que ambas pueden estar dependiendo de otro factor Z ms general, llmese "memoria", o "cantidad de ARN". Si realizar el anlisis de correlacin es algo relativamente fcil (se trata de recoger datos y aplicar una frmula), determinar el vnculo causal suele implicar un procedimiento ms laborioso, como por ejemplo la ejecucin de un diseo experimental que implique la comparacin de dos grupos sometidos a condiciones diferentes y donde haya un control sobre la influencia de variables extraas. El siguiente esquema permite visualizar algunos pasos posibles para llevar a cabo un anlisis de correlacin seguido de un anlisis de regresin. El esquema sintetiza, al mismo tiempo, los temas a tratar en el presente artculo.

Si las variables son

CUANTITATIVAS Se calcula la correlacin con

CUALITATIVAS ORDINALES Se calcula la correlacin con

METODO ANALITICO Coeficiente de correlacin de Pearson

METODO GRAFICO Diagrama de dispersin

METODO ANALITICO Coeficiente de correlacin por rangos de Spearman

Se calcula la regresin (prediccin) con

METODO ANALITICO Mtodo de los cuadrados mnimos

Para interpretar mejor este coeficiente, se calcula el coeficiente de determinacin

METODO GRAFICO Recta de regresin

4.2 EL ANLISIS DE CORRELACIN Juan se sac una buena nota en el primer parcial, y por lo tanto es bastante probable que tambin saque buena nota en el segundo parcial. Esta persona tiene ms edad y por lo tanto es ms probable que le falte alguna pieza dentaria. Abundan esta clase de razonamientos en la vida cotidiana, que suelen aceptarse sin demasiada crtica. Sin embargo, en un estudio cientfico es habitual que estas hiptesis deban ser comprobadas ms all de las certidumbres subjetivas. Para constatar si hay realmente asociacin entre dos o ms variables cualesquiera, se emplea una herramienta denominada anlisis de correlacin, que tambin evala el grado o intensidad en que dichas variables estn asociadas. Se examina aqu el caso ms sencillo (dos variables), que se estudia dentro de la estadstica bivariada. En el siguiente ejemplo se exponen tres posibles distribuciones de frecuencias bivariadas (1) referidas a las primeras y segundas notas de exmenes parciales. Alumno A B C D E F G Tabla X 3 4 6 6 8 9 10 1 Y 2 5 5 6 6 9 9 Tabla 2 X Y 3 3 4 4 6 6 6 6 8 8 9 9 10 10 Tabla X 3 4 6 6 8 9 10 3 Y 2 3 5 5 7 8 9

X = Nota del primer parcial Y = Nota del segundo parcial

Pgina 61 de 331

62
En la Tabla 1 se han consignado las notas de los parciales de un grupo de 7 alumnos ordenadas en forma creciente. Un somero examen visual de la tabla revela que hay bastante asociacin entre las variables X e Y: quienes sacaron buena nota en el primer parcial tienden a sacar buena nota en el segundo, y lo mismo para quienes sacaron bajas notas, con lo cual ambas variables tienden a variar concomitantemente o conjuntamente. Sin embargo, debe tenerse presente que la asociacin o correlacin entre ambas variables no depende de la similitud entre X y Y, sino de la similitud de sus modos de variacin. As, en la Tabla 2 las notas de los primeros y segundos parciales de cada alumno son iguales, y en la Tabla 3 la nota del segundo parcial es diferente, pero siempre menor en un punto. Sin embargo, en ambas tablas la correlacin es la misma. El anlisis de correlacin busca establecer esencialmente tres cosas: 1) Presencia o ausencia de correlacin.- Dadas dos o ms variables, si existe o no correlacin entre ellas. 2) Tipo de correlacin.- En caso de existir correlacin, si esta correlacin es directa o inversa. En la correlacin directa, ambas variables aumentan (o disminuyen) concomitantemente, y en la correlacin inversa ambas variables varan inversamente, o tambin puede decirse "en relacin inversamente proporcional", lo que significa que cuando una aumenta la otra disminuye, o viceversa (2). En el siguiente esquema se muestran algunos ejemplos de correlacin directa e inversa. Tipos de correlacin Tipo Correlacin directa o positiva Definicin Ambas variables aumentan (o disminuyen) en forma concomitante. Ejemplos en psicologa Cociente intelectual/calificacin: A mayor CI, mayor calificacin obtenida en el examen. Tiempo/retencin: A mayor tiempo para memorizar, mayor cantidad de palabras retenidas. Test laboral/rendimiento futuro: A mayor puntaje en un test de aptitud tcnica, mayor rendimiento en dicha rea dentro de x aos (esto es tambin un modo de estimar la validez predictiva de un test). Edad/memoria: Al aumentar la edad, disminuye la memoria. Numero de ensayos/cantidad de errores: Al aumentar el nmero de ensayos, disminuye la cantidad de errores. Cansancio/atencin: Al aumentar el cansancio disminuye la atencin.

Correlacin inversa o negativa

Una variable aumenta y la otra disminuye (o viceversa) en forma concomitante.

3) Grado de correlacin.- El grado o intensidad de la correlacin, es decir, cunta correlacin tienen en trminos numricos. Para hacer todas estas averiguaciones, se puede recurrir a tres procedimientos. a) El mtodo tabular.- Una correlacin podra constatarse con la simple visualizacin de tablas de correlacin como las indicadas anteriormente, pero habitualmente las cosas no son tan fciles, sobre todo porque hay bastante mayor cantidad de datos, y porque estos casi nunca registran los mismos incrementos para ambas variables. Por lo tanto, debe abandonarse la simple visualizacin de las tablas y utilizar procedimientos ms confiables, como los grficos (diagramas de dispersin o dispersiogramas) y los analticos (por ejemplo el coeficiente de Pearson). b) El mtodo grfico.- Consiste en trazar un diagrama de dispersin. c) El mtodo analtico.- Consiste en aplicar una frmula que permita conocer no slo el tipo de correlacin (directa o inversa) sino tambin una medida cuantitativa precisa del grado de correlacin. La frmula del coeficiente de Pearson es un ejemplo tpico para medir correlacin entre variables cuantitativas. 4.3 CLCULO GRFICO DE LA CORRELACIN Un grfico es mucho mejor que una tabla para apreciar rpidamente si hay o no correlacin entre variables. Existen varias maneras de graficar la correlacin (3), pero aqu se describir el procedimiento clsico: el diagrama de dispersin. El diagrama de dispersin es bsicamente una nube de puntos, donde cada punto corresponde al entrecruzamiento de cada par de valores de X e Y. Este diagrama puede realizarse independientemente del clculo analtico de la correlacin. Por ejemplo, el diagrama de dispersin correspondiente a la Tabla 1 se asemeja al diagrama A del esquema de diagramas de dispersin. A este diagrama se ha agregado a ojo una lnea imaginaria, que viene a representar ms o menos el ordenamiento lineal de los puntos (que van desde abajo a la izquierda hacia arriba a la derecha). El diagrama se llama 'de dispersin' porque muestra cun dispersos (prximos o alejados) estn los puntos alrededor de dicha recta. Fcil es advertir que cuanto ms alineados estn, ms correlacin habr. En el ejemplo A del esquema sobre diferentes diagramas de dispersin, los puntos tienden a ubicarse en las

Pgina 62 de 331

63
proximidades de la recta imaginaria, lo que indica que estn poco dispersos. Si los puntos figurasen ms alejados habra ms dispersin, y por lo tanto menor correlacin entre X e Y. El caso B muestra correlacin inversa, pues el ordenamiento de los puntos indican que, a medida que aumenta X, va disminuyendo Y. As entonces, cuando la lnea imaginaria va de abajo a la izquierda hacia arriba a la derecha, hay correlacin directa, y cuando va desde arriba a la izquierda hacia abajo a la derecha hay correlacin inversa. Dicho ms tcnicamente, en el primer caso la recta tiene una inclinacin o pendiente positiva, y en segundo su pendiente es negativa. El caso C revela, por su parte, que a medida que aumenta Y, los valores de X ni aumentan ni disminuyen, permaneciendo fijos en el valor 5. Por lo tanto no hay correlacin. En general no la hay cuando una de las variables no vara (en este caso X permanece constante en el valor 5). El caso D es similar al anterior: all los valores de Y permanecen constantes en el nmero 4, mientras va variando X. Tampoco hay correlacin. El caso E muestra un ejemplo donde varan ambas variables, pero sin embargo no hay correlacin. En esa nube es imposible trazar una lnea imaginaria representativa de la orientacin de los puntos, simplemente porque no hay tal orientacin lineal. Los valores que van asumiendo las variables son en principio aleatorios (varan al azar). Tampoco hay correlacin. El caso F nos muestra un caso de correlacin perfecta o mxima (en este caso directa), pues no hay dispersin de puntos alrededor de la lnea imaginaria: todos estn sobre ella. Estas regularidades perfectas no suelen encontrarse fcilmente, ni menos an en ciencias sociales, porque los fenmenos obedecen siempre a muchas causas que estarn actuando para romper la armona natural entre X e Y. Tambin hay casos de correlacin no lineal, donde en lugar de una recta imaginaria se traza una curva. En este artculo se presentan solamente los casos ms sencillos, es decir, los casos de correlacin lineal, representables mediante rectas. Diferentes diagramas de dispersin
Y 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X Y 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X Y 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X

A) Correlacin directa

B) Correlacin inversa

C) Sin correlacin

Y 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X

Y 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X

Y 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X

D) Sin correlacin

E) Sin correlacin

F) Correlacin directa perfecta

Pgina 63 de 331

64
Si bien una nube de puntos puede dar una idea de si hay o no correlacin, o de si es directa o inversa, todava no proporciona informacin sobre cuanta correlacin hay. Esta informacin se obtiene mediante un clculo analtico. 4.4 CLCULO ANALTICO DE LA CORRELACIN La correlacin se calcula analticamente mediante ciertos coeficientes, que sern distintos segn se trate de correlacionar variables nominales, ordinales o cuantitativas, y segn se trate de otras consideraciones varias. Si bien existen muchos coeficientes de correlacin (4), en lo que sigue se explicarn algunos de los ms utilizados: el coeficiente de correlacin lineal de Pearson (para variables cuantitativas), y el coeficiente de correlacin por rangos de Spearman (para variables cualitativas ordinales). a) Coeficiente de correlacin lineal de Pearson Este coeficiente (que se designa con r), fue creado por Karl Pearson (1857-1936) para relacionar variables cuantitativas (es decir, variables que, como nota de examen, se miden mediante nmeros). El coeficiente de Pearson es un nmero comprendido entre -1 y +1, y que posee un determinado signo (positivo o negativo). El valor numrico indica cuanta correlacin hay, mientras que el signo indica qu tipo de correlacin es (directa si el signo es positivo, inversa si es negativo). En el siguiente esquema se muestran algunos posibles valores de r. Algunos valores del coeficiente de Pearson

Correlacin inversa mxima (-1)

Baja correlacin inversa (-0.15) Correlacin nula (0)

Alta correlacin directa (+0.70) Correlacin directa mxima (+1)

Cuanto ms cerca de cero est el coeficiente de correlacin obtenido, tanto menor correlacin habr. Cabra preguntarse: hasta qu valor se considera que hay correlacin? desde qu valor no la hay? Esto es una cuestin que depende de varias cosas, y hace a la cuestin de la relatividad del coeficiente de Pearson. En efecto, su interpretacin depende de varios factores, como por ejemplo: a) la naturaleza de las variables que se correlacionan; b) la significacin del coeficiente; c) la variabilidad del grupo; d) los coeficientes de confiabilidad de los tests; e) el propsito para el cual se calcula r. El valor r = 0,70 puede indicar alta correlacin para cierto par de variables, pero baja correlacin para otras variables distintas. Otro ejemplo: un r de 0,30 entre estatura e inteligencia o entre tamao craneal y habilidad mecnica indicara una correlacin mas bien alta, puesto que las correlaciones entre variables fsicas y mentales suelen ser mucho ms bajas, a menudo iguales a cero. Otro ejemplo: un r de 0,30 entre inteligencia y nota de examen, o entre puntaje en ingls y puntaje en historia es considerada bajsima, ya que los r en estos campos suelen extenderse entre 0,40 y 0,60. Otro ejemplo: semejanzas entre padres e hijos, en cuanto a rasgos fsicos y mentales, se expresan por valores entre 0,35 y 0,55, y por lo tanto un r de 0,60 sera alto. Respecto de la frmula para calcular el coeficiente de correlacin de Pearson ("r"), no hay una nica manera de presentarla, y la eleccin de una u otra depender de la forma de presentacin de los datos. Por ejemplo, si los datos estn agrupados en una tabla de frecuencias, se utiliza cierta frmula (Bancroft, 1960:190), mientras que si los datos no estn agrupados en frecuencias, podrn utilizarse cualquiera de las frmulas indicadas en el siguiente esquema (5): Frmula 1 { ( x X) (y Y) } r = ------------------------------Frmula 2 { ( x X) (y Y) } r = ------------------------------Pgina 64 de 331

65
n x . y Se usa esta frmula cuando dan como datos las medias de X e Y y sus respectivos desvos estndar. Frmula 3 (Z x . Zy) r = --------------------n Se usa esta frmula cuando dan como datos los puntajes estandarizados Z. ( x X)2 . (y Y)2 (El denominador debe elevarse a la raz cuadrada). Se usa esta frmula cuando dan como datos las medias aritmticas de X e Y. Frmula 4

n (x.y) x . y r = -----------------------------------------------n x2 (x)2 . n y2 (y)2


(Ambos factores del denominador se elevan a la raz cuadrada) Se utiliza esta frmula (llamada frmula del producto momento) cuando no se conocen ni medias aritmticas ni desvos estndar.

A continuacin se suministra un ejemplo de cmo calcular el coeficiente "r" utilizando la frmula 2. Se trata de determinar el coeficiente de Pearson para dos variables X e Y (que podran ser por ejemplo las notas del primero y segundo parcial). Tambin se pide interpretar el resultado. La tabla 1 son los datos dados, mientras que la tabla 2 es una ampliacin que debe hacerse para poder obtener ms informacin y poder as aplicar la frmula: Tabla 1 Alumno A B C D E N=5 alumnos Tabla 2 xX -3 -2 0 2 3 0 X=7 Y=8 Con los datos obtenidos se aplica ahora la frmula 2: { ( x X) (y Y) } 16 r = ---------------------------------------- = ----------------------- = +0.99 raz de ( x X)2 . (y Y)2 raz de 26,10 Interpretando el resultado, se puede decir que la correlacin obtenida es directa o positiva y es adems, muy alta. Coeficientes derivados.- A partir del coeficiente "r" de Pearson (en cualquiera de sus formas) se pueden derivar otros, segn la informacin que se quiera obtener: 1) Coeficiente de determinacin (r2): es el coeficiente "r" elevado al cuadrado. El coeficiente de determinacin indica qu porcentaje de la variacin de Y est determinada por las variaciones de X. Por ejemplo, para un "r" de 0,70, hay un coeficiente de determinacin de 0,49, lo que significa que el 49% de la variacin de Y est determinada por la variacin de X. 2) Coeficiente de alienacin (k): llamado tambin de no correlacin, no indica la correlacin sino la falta de correlacin entre dos variables (o grado de independencia). Para calcularlo se aplica la frmula siguiente: r2 + k2 = 1 [1] Por ejemplo, si sabemos que "r" es de 0,50, aplicando la frmula indicada tenemos que "k" vale 0,86, con lo cual el grado en que falta la correlacin resulta ser mayor que el grado en que s hay correlacin. yY -2 -1 0 1 2 0 ( x X) (y Y) 6 2 0 2 6 16 ( x X)2 9 4 0 4 9 26 (y Y)2 1 1 0 1 1 10 X 4 5 7 9 10 35 Y 6 7 8 9 10 40

Pgina 65 de 331

66
Idnticamente, si "r" vale 1 entonces "k" vale 0, y viceversa. Cuanto mayor es el coeficiente de alienacin tanto menor es la correlacin, y por tanto menos confiables sern las predicciones que -anlisis de regresin mediante- se hagan sobre esa base. 3) Coeficiente de indeterminacin (k2): es el coeficiente "k" pero elevado al cuadrado. Mide el grado en que la variacin de Y no est determinada por la variacin de X. La frmula del coeficiente de indeterminacin es deducible de la anterior [1]. 4) Coeficiente de eficiencia predictiva (E): suele utilizarse para, sabiendo "r", estimar rpidamente el poder predictivo de la correlacin "r". Su frmula es: E = 100 . (1 - 1-r2) donde 1-r2 debe elevarse a la raz cuadrada. Por ejemplo si la correlacin "r" es de 0,50, la eficiencia predictiva ser del 13%. Pero cuando "r" sube a 0,98, la eficiencia predictiva ser del 80%. La correlacin debe ser entonces de 0.87 o ms para que la eficiencia predictiva sea mayor al 50%. Matriz de correlaciones.- En muchas investigaciones se estudian muchas variables, y se intenta cuantificar mediante el coeficiente r sus relaciones dos a dos, es decir, las relaciones de cada variable con cada una de las dems (Botella, 1993:202). A los efectos de comparar estos diferentes valores de r se traza una matriz de correlacin, que puede tener la siguiente forma: Variable X Variable Variable Variable Variable X Y W Z Variable Y r = -0.17 Variable W r = -0.11 r = +0.46 Variable Z r = -0.30 r = +0.17 r = +0.10

La matriz permite visualizar inmediatamente, entre otras cosas, cules son los coeficientes de correlacin ms altos (en este caso, entre Y y W). Ntese que no han sido llenados los casilleros donde se cruzan las mismas variables (por ejemplo X con X), porque carece de sentido hacerlo y su correlacin es siempre perfecta y positiva (r = +1). b) Coeficiente de correlacin por rangos de Spearman Se trata de un coeficiente de correlacin utilizado para estudiar la asociacin entre dos variables ordinales. Se representa con la letra griega rho, y sus frmulas son las siguientes: Frmula 1 6 d2 = 1 - --------------------------n (n + 1) (n 1) x2 + y2 + d2 = -------------------------------2 . x2. y2 La frmula para obtener x2 o y2 es la misma en ambos casos, y es x2 = y2 = (n3 n) / 12 En el denominador, la raz cuadrada afecta a x2. y2 En ciertos casos conviene utilizar la primera frmula, y en otros casos la segunda. Por ejemplo (Kohan, 1994:256), si no hay empates en los rangos o son muy pocos, se utilizar la frmula 1, y si hay empates en los rangos, se utilizar la frmula 2. Para comprender esto, se suministran a continuacin dos ejemplos diferentes: uno sin empates y otro con empates. Ejemplo 1.- En este ejemplo (tomado de Kohan, 1994:256) se utiliza el coeficiente de Spearman para evaluar el grado de asociacin entre dos variables ordinales: X (autoritarismo) e Y (bsqueda de status). Por ejemplo, permitir averiguar si a medida que aumenta el autoritarismo en las personas tiende tambin a aumentar la bsqueda de status social. Para ello se toma una muestra de 12 sujetos, y se obtienen los siguientes resultados: Sujeto A B C D E F G H I x (rango por autoritarismo) 2 6 5 1 10 9 8 3 4 y (rango por bsqueda de status) 3 4 2 1 8 11 10 6 7 d -1 2 3 0 2 -2 -2 -3 -3 d2 1 4 9 0 4 4 4 9 9 Frmula 2

Pgina 66 de 331

67
J K L n = 12 12 7 11 12 5 9 0 2 2 0 4 4 d2 = 52

Esta tabla indica, por ejemplo, que el sujeto A se situ en un segundo lugar en autoritarismo y en un tercer lugar en bsqueda de estatus. Aplicando la frmula 1, se obtiene un coeficiente de Spearman de 0.82, lo cual sugiere una alta correlacin entre autoritarismo y bsqueda de status. Ejemplo 2.- Aqu se trata de obtener el coeficiente de Spearman cuando hay empates en los rangos. Los empates ocurren cuando dos o ms sujetos tienen el mismo rango en la misma variable. Por ejemplo (ver tabla siguiente), los sujetos A y B obtuvieron el mismo puntaje en la variable X (o sea, obtuvieron ambos cero). Otro tanto ocurri con los sujetos C y D y con los sujetos J y K, siempre en relacin a la misma variable X. En el caso de la variable Y todos los puntajes fueron diferentes, y por lo tanto no hubo empates. Cuanto mayor es la cantidad de empates, ms conveniente resultar utilizar la frmula 2. Sujeto x (rango por autoritarismo) Puntaje 0 (1) 0 (2) 1 (3) 1 (4) 3 (5) 4 (6) 5 (7) 6 (8) 7 (9) 8 (10) 8 (11) 12 (12) Rango 1.5 1.5 3.5 3.5 5 6 7 8 9 10.5 10.5 12 y (rango por bsqueda de status) Puntaje Rango 42 3 46 4 39 2 37 1 65 8 88 11 86 10 56 6 62 7 92 12 54 5 81 9 d d2

A B C D E F G H I J K L n = 12

-1.5 -2.5 1.5 2.5 -3.5 -5 -3 2 2 -1.5 -5.5 3.5

2.25 6.25 2.25 6.25 9 25 9 4 4 2.25 30.25 9 d2 = 109.5

Para hallar el coeficiente de Spearman en estos casos, puede procederse se acuerdo a tres pasos: a) Reasignacin de rangos.- En la columna de Puntaje de la variable X se ha agregado entre parntesis el rango u orden que ocupara el sujeto. Este agregado sirve al nico efecto de determinar el rango definitivo que se le asignar, y que aparece en la columna Rango, de la misma variable. La forma de calcular este rango definitivo es simple. Por ejemplo, si se consideran los sujetos A y B, se suman los rangos 1 y 2, con lo cual se obtiene el valor 3. Este valor se divide por la cantidad de empates, que en este caso es 2, y se obtiene el valor 1.5, que ser el rango definitivo de ambos sujetos. b) Correccin de la suma de los cuadrados.- Para poder aplicar la frmula 2, y puesto que hay empates, deben modificarse los valores de x2 y de y2 es decir, las sumatorias de los cuadrados de los valores de cada variable. Para modificar dichos valores deben restarse a ellos E, cuyo valor se entiende a partir de la siguiente frmula donde dicho factor se ha restado: n3 n x2 = --------- - E 12 123 12 23 2 23 2 23 - 2 = ------------ - ( --------- + --------- + --------- ) 12 12 12 12 = 143 1.5 = 141.5

El valor 2 significa que hay sido dos los valores empatados. En este caso, los empates se han dado en tres oportunidades (sujetos A-B, C-D y J-K), y por ello se suman los tres cocientes. Como en la variable Y no se han verificado empates, el clculo no incluir el factor de correccin: n3 n 123 12 y = --------- = -----------12 12
2

= 143

c) Aplicacin de la frmula 2.- Se aplica la frmula con los valores corregidos del siguiente modo: x2 + y2 + d2 141.5 + 143 109.5 = -------------------------------- = ------------------------------ = 0.616
Pgina 67 de 331

68
2 . x2. y2 2 141.5 . 143

Si no se hubieran introducido las correcciones indicadas, el valor del coeficiente de Spearman hubiera sido ms elevado, aunque en este caso la diferencia es poco importante y slo conviene corregir cuando hay gran cantidad de empates (Kohan, 1994:258). 4.5 UN EJEMPLO: CONSTRUCCIN Y VALIDACIN DE TESTS El anlisis de correlacin se aplica en muchos mbitos de la psicologa, como por ejemplo en la teora factorialista de la inteligencia, en el anlisis de actitudes en psicologa social, y tambin en la construccin de pruebas psicodiagnsticas (6). Como ejemplo, a continuacin se inventar un test, no slo para ver como se realiza esta tarea, sino tambin para ver el modo en que interviene en este proceso el anlisis de correlacin. La idea de construir un supuesto Test de personalidad de Prez pudo haber comenzado al leer los diversos trastornos de personalidad del DSM-IV. Uno de ellos es el trastorno narcisista, otro el trastorno esquizoide, y as sucesivamente. El DSM-IV propone diversos criterios para identificarlos, pero aqu se ha elegido otro camino: tomar un test creado ad hoc. Pensando en la cuestin, cabe imaginarse que un individuo narcisista podra muy bien estar cmodo con un dibujo como el esquema 6, donde aparece un gran punto rodeado de otros ms pequeos que lo admiran, mientras que un esquizoide preferira el esquema 7, representativo de un patrn de distanciamiento de las relaciones sociales.

Esquema 6

Esquema 7

Acto seguido, se eligen mil sujetos con diagnsticos diversos de personalidad y se les pregunta qu dibujo les gusta ms. Aqu es donde interviene el anlisis de correlacin, que permitir ver el grado de asociacin entre el diagnstico y el dibujo elegido. Una muy alta correlacin aparecera, por ejemplo, si gran cantidad de sujetos con trastorno narcisista eligen el esquema 6, con lo cual, en lo sucesivo se podr tomar este test sin necesidad de explorar sus conductas y ver si cumplen los criterios del DSM-IV, un trmite que suele ser arduo. Desde ya, construir un test exige una gran cantidad de controles y precauciones que no vienen al caso exponer aqu. Por ejemplo, debe determinarse su validez y su confiabilidad. El anlisis de correlacin permite, precisamente, determinar por ejemplo un tipo especial de validez: la validez predictiva, que pueden verse claramente en las pruebas de orientacin vocacional. As, por ejemplo, una forma de establecer si un test de este tipo evala la vocacin de un sujeto, es esperar varios aos y ver si ese sujeto tuvo xito en la profesin sugerida por el test. Como puede apreciarse, aqu se recurre nuevamente al anlisis de correlacin, al compararse la profesin diagnosticada con la profesin elegida exitosamente. Una alta correlacin entre ambas variables es indicador de la validez predictiva del test en cuestin. El anlisis de correlacin permite tambin determinar otros tipos de validez como la validez inter-test, que compara los resultados de un test vocacional con otro test vocacional. Si ambos arrojan aproximadamente los mismos resultados en un conjunto de sujetos, entonces tienen validez inter-test, comparacin que fue posible por un anlisis de correlacin. 4.6 EL ANLISIS DE REGRESIN

Pgina 68 de 331

69
El objetivo del anlisis de regresin es establecer una prediccin acerca del comportamiento de una variable Y conociendo el correspondiente valor de X (o viceversa) y el grado de correlacin existente entre ambas variables. Para ello es preciso conocer la llamada recta de regresin (7), que es la recta imaginaria que mejor representa el conjunto de pares de valores de las variables X e Y. En el siguiente eje de coordenadas, estn representados por ejemplo cinco de esos pares de valores, mediante cinco puntos. La recta de regresin dibujada sera la que mejor representa esos puntos, por cuanto la distancia de los puntos a la recta (representada con una lnea punteada) es la mnima. Esta distancia recibe el nombre de regresin, de manera tal que cuanto menor es la regresin de los puntos, mayor ser la correlacin entre ellos.

Recta de regresin

x
La recta de regresin es, de muchas rectas posibles, la que mejor representa la correlacin o, ms tcnicamente, es la nica que hace mnima la suma de los cuadrados de las desviaciones o distancias de cada punto a la recta. Es, adems, la mejor manera de poder hacer predicciones. Las desviaciones de los puntos respecto de la recta se adjudican a factores no controlados (que suelen ser particularmente importantes en las ciencias sociales), y se parte del supuesto de que si no hubiera factores extraos que afecten la relacin entre X e Y, entonces no habra desviaciones y la correlacin sera perfecta. La recta de regresin puede trazarse a ojo, pero este procedimiento no tiene precisin. El anlisis de regresin propone un mtodo mucho ms preciso, consistente en hallar la recta de regresin por una va analtica. Este clculo de la recta de regresin consiste en hallar la ecuacin de la recta de regresin, y eventualmente luego dibujndola en un diagrama de coordenadas cartesianas. Una vez en posesin de esta ecuacin, podrn hacerse predicciones a partir de la ecuacin misma o bien a partir de la recta trazada en el diagrama de coordenadas. Ambos procedimientos sern examinados a continuacin con los nombres de clculo analtico de la regresin y clculo grfico de la regresin, respectivamente. 4.7 CLCULO ANALTICO DE LA REGRESIN El clculo analtico de la regresin consiste en averiguar la ecuacin de la recta de regresin. Ello permitir realizar predicciones en base a dicha ecuacin. Una vez que se cuenta con un determinado conjunto de pares de valores obtenidos de la realidad, puede determinarse la ecuacin de la recta que los representan por dos mtodos: el mtodo de los cuadrados mnimos, y el mtodo de las desviaciones. Antes de examinarlos, debe tenerse presente que la forma general de una ecuacin de una recta es y = a + b.x (8). Determinar la ecuacin de la recta significa asignarle un valor al parmetro a y otro valor al parmetro b. Los mtodos indicados tienen como fin determinar el valor de ambos parmetros. a) Mtodo de los cuadrados mnimos.La ecuacin de la recta que tiene la forma y1 = a + b . x1 se obtiene averiguando los valores a y b. Una vez obtenidos ambos valores, puede realizarse una prediccin cualquiera: a partir de x1 como el valor conocido, se puede predecir el valor de y1. Las frmulas para el clculo de a y b son las siguientes: n (x.y) x . y b = -----------------------------n x2 - ( x)2
Pgina 69 de 331

70
a = Y - b . X (donde Y y X son las respectivas medias aritmticas) Como puede apreciarse, primero debe calcularse b, ya que para calcular a se requiere conocer b. b) Mtodo de las desviaciones.La ecuacin de la recta se obtiene a partir de la siguiente expresin: y = r . (Sy / Sx) . (x - X) + Y En esta ecuacin de la recta, la expresin r . (Sy / Sx) se llama coeficiente de regresin. Como puede apreciarse, la aplicacin del mtodo de las desviaciones requiere conocer las medias aritmticas y los desvos estndar de X e Y. Tambin requiere conocer el coeficiente de correlacin r, para lo cual resulta aqu recomendable utilizar la frmula nmero 1. Ejemplo de prediccin en base a la ecuacin de la recta.- Si se dispone ya de una ecuacin de la recta, ser muy sencillo hacer una prediccin del valor de y en funcin del valor de x. En cambio, si debe hacerse esa prediccin a partir de una simple lista de pares de valores correlacionados, primero deber obtenerse la ecuacin de la recta, para lo cual, a su vez si la idea es aplicar el mtodo de las desviaciones- deben conocerse las medias aritmticas de x e y, los desvos estndar de x e y, y la correlacin r entre x e y. Considrese la siguiente lista de pares de valores ordenados: Sujeto A B C D E F X (edad) 2 3 5 6 6 8 Y (puntaje test) 55 60 65 80 85 75

A los efectos de poder obtener informacin sobre las medias aritmticas, los desvos estndar y el coeficiente de correlacin (necesarios para calcular la ecuacin de la recta), se ampla la tabla anterior de la siguiente manera: Sujeto A B C D E F Total X (edad) 2 3 5 6 6 8 30 Y (puntaje test) 55 60 65 80 85 75 420 (X-X) -3 -2 0 1 1 3 --(Y-Y) -15 -10 -5 10 15 5 --(X-X) (Y-Y) 45 20 0 10 15 15 105

Aplicando la frmula correspondiente, se obtienen las medias aritmticas de X e Y (que son 5 y 70). Aplicando la frmula correspondiente, se obtienen los desvos estndar de X e Y (que son 2 y 10.8). Aplicando la frmula 1, se obtiene el coeficiente de correlacin (que es r = +0.81). Finalmente, se obtiene la ecuacin de la recta utilizando el mtodo de loas desviaciones: y = r . (Sy / Sx) . (x - X) + Y y = 0.81 (10.8 / 2) . (x 5) + 70 Esta expresin se transforma de manera tal que adopte la forma tpica de la ecuacin de la recta, con lo cual se obtiene: y = 47.85 4.43 . x Una vez que se cuenta con la ecuacin de la recta, ahora s pueden hacerse predicciones. Por ejemplo, si a un nio que 10 aos se le toma el test, cul ser el puntaje ms probable que obtendr? y = 47.85 4.43 . x y = 47.85 4.43 . 10 = 92.15 y = 92.15

Pgina 70 de 331

71
4.8 CLCULO GRFICO DE LA REGRESIN El clculo grfico de la regresin consiste en trazar la recta de regresin en base a la ecuacin de la recta obtenida en el clculo analtico. Ello permitir realizar predicciones en base a dicha recta trazada en el diagrama de coordenadas cartesianas. La recta de regresin, como toda recta, puede determinarse por dos puntos. Un punto es la ordenada al origen, y el otro punto es la interseccin de las medias aritmticas de x e y. Este ltimo punto se llama baricentro. Tomando el ejemplo anterior, la ordenada al origen es 47.85, mientras que el baricentro queda determinado por las medias aritmticas 5 y 70, con lo cual la recta de regresin ser la siguiente:

Y 90 80 70 60 50 40 30 20 10 0 0 1 2 3 4 5 6 7 8 9 10 X

Ejemplo de prediccin en base a la recta del diagrama cartesiano.- Considerando solamente la recta dibujada, puede hacerse una prediccin (mtodo grfico). Por ejemplo, si se sabe que x = 7, puede predecirse que el valor de y ser 82 de la siguiente manera:

Y 90 80 70 60 50 40 30 20 10 0 0 1 2 3 4 5 6 7 8 9 10 X

Error estndar de la prediccin.- En el ejemplo anterior la prediccin realizada es slo probable, lo que significa que se est cometiendo algn error en la estimacin del valor y. Ello es as porque se ha calculado el coeficiente de correlacin r y la ecuacin de la recta de regresin en base a una muestra (en este caso de apenas seis sujetos) y con esta informacin se est intentando predecir un valor nuevo que no est en la muestra, es decir, que pertenece a la poblacin. Adems, se est suponiendo (Kohan N, 1994:228) que la muestra ha sido tomada al azar, y que ambas variables se distribuyen normalmente. Es posible estimar el error estndar cometido en base a la siguiente expresin:

est

= y . 1 r2

Esto es, el error estndar es igual al desvo estndar poblacional multiplicado por la raz cuadrada de la diferencia entre 1 y el cuadrado del coeficiente de correlacin. En el ejemplo anterior, el desvo estndar vala 10.8 y el coeficiente de correlacin vala 0.82. Reemplazando, se obtiene:

est

= 10.8 . 1 0.822 = 6.2

Esto significa que el valor de y predicho y = 82, estar en un 68% de los casos entre 82 6.2, es decir entre 88.2 y 75.8. O si se quiere, hay un 68% de probabilidades que el valor de y se encuentre entre 88.2
Pgina 71 de 331

72
y 75.8. Desde ya, tambin puede calcularse este intervalo de confianza en base a un 95% o un 99% de probabilidades, en cuyo caso el intervalo de confianza deber ser mayor.
NOTAS (1) Una distribucin de frecuencias bivariada es un conjunto de pares de valores, correspondientes a dos variables observadas conjuntamente, con sus respectivas frecuencias. Cuando la distribucin se registra en una tabla de doble entrada se obtiene una tabla de contingencia. En cada celda de esta tabla se indica la frecuencia con que se observ cada par de valores. (2) Algunos autores (por ejemplo Botella, 1993:183), clasifican en tres los casos posibles de relacin lineal entre variables. a) Relacin lineal directa: se dice que dos variables X e Y mantienen una relacin lineal directa cuando los valores altos en Y tienden a emparejarse con valores altos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores bajos en X. Por ejemplo: la relacin entre inteligencia y rendimiento. b) Relacin lineal inversa: se dice que dos variables X e Y mantienen una relacin lineal inversa cuando los valores altos en Y tienden a emparejarse con valores bajos en X, los valores intermedios en Y tienden a emparejarse con valores intermedios en X, y los valores bajos en Y tienden a emparejarse con valores altos en X. Por ejemplo: la relacin entre tiempo y errores. c) Relacin lineal nula: se dice que hay relacin lineal nula entre dos variables cuando no hay un emparejamiento sistemtico entre ellas en funcin de sus valores. Por ejemplo: la relacin entre estatura e inteligencia. (3) Otra forma de apreciar grficamente la correlacin es mediante el ngulo de correlacin: dadas las dos rectas y1 = a + b . x1 y x1 = a + b . y 1 , el punto donde se intersectan se llama centroide. El ngulo entre ambas rectas se llama ngulo de correlacin. Cuanto menor es este ngulo, ms correlacin hay (Kohan, 1994:224). (4) Adems del clsico coeficiente "r" de Pearson, existen otros tambin destinados a medir el grado de asociacin entre variables. En el esquema siguiente se resumen algunos ejemplos. No deben confundirse los coeficientes derivados del coeficiente de Pearson, con estos otros coeficientes de correlacin, que en general fueron diseados de manera diferente o para otros propsitos. Nombre Coeficiente de Pearson Condiciones de aplicacin Se aplica sobre variables cuantitativas (de intervalos iguales o de cocientes). Adems, las variables deben estar distribuidas normalmente, o al menos tratarse de distribuciones bastante simtricas respecto de la media. Se llama tambin coeficiente de correlacin producto-momento de Pearson. De fcil clculo e interpretacin como el anterior, pero su uso se limita a dos variables nominales, con dos categoras cada una. Se utiliza sobre todo cuando son muchas observaciones y muy pocos valores ordinales alcanzados por ellas. Se busca computando las concordancias e inversiones en las ordenaciones que representan las dos variables y se aplica la frmula. No es ms que el coeficiente de Pearson aplicado a variables ordinales. Utilizado para variables cuantitativas (de intervalos iguales o de cocientes), debe reunir dos requisitos: que la curva de distribuciones sea bastante simtrica y unimodal, y que la asociacin de variacin sea al menos aproximadamente rectilnea. Para correlacionar simultneamente ms de dos variables. Para variables nominales.

Coeficiente Q de Yule Coeficiente de asociacin (gamma) de Goodmann y Kruskal Coeficiente (Rho) de Spearman Coeficiente Etha

Coeficiente de correlacin mltiple Coeficiente Phi

Otros coeficientes son: el Coeficiente (Tau) de Kendall (Kohan, 1994:260), el Coeficiente de Wilcoxon, el Coeficiente de Flanagan, el Coeficiente de correlacin multiserial de Jaspe, el Coeficiente T de Tschuprow, el Coeficiente de correlacin tetracrica (Kohan, 1994:281), etc. Un ejemplo de aplicacin del Coeficiente Q de Yule (poco usado hoy en da) es el clculo de la correlacin entre dos variables nominales con dos categoras cada una: por un lado sexo (masculino-femenino) y por el otro nivel de ingresos (alto-bajo). Primero, se construye una tabla de doble entrada que organice la informacin obtenida en la muestra. Por ejemplo: Alto A C Bajo B D

Masculino Femenino

Segundo, aplicar la frmula de Q: A.D B.C Q = ---------------A.D + B.C Los valores de Q varan entre -1 y +1 y se interpretan igual que el clsico coeficiente r de Pearson. Eventualmente, tambin podr establecerse la significacin del coeficiente de correlacin obtenido recurriendo a la prueba de t Student. La frmula de t que puede utilizarse lleva como numerador el producto de r por la raz cuadrada de N-2 (N es el tamao de la muestra), y el denominador es la raz cuadrada de 1-r2. Todos los coeficientes de correlacin pueden aplicarse en psicologa, por ejemplo, en experimentos sobre el aprendizaje, en la teora factorialista de Spearman, y en psicometra cuando por ejemplo debemos establecer el grado de correlacin entre dos tests, o el grado de correlacin de un mismo test tomado en dos momentos diferentes.

Pgina 72 de 331

73
(5) En algunos textos de estadstica se describen frmulas abreviadas para facilitar los clculos cuando se dispone de un nmero grande de pares de valores. La disponibilidad actual de calculadoras de mesa y ordenadores personales hacen innecesarias estas frmulas (Botella, 1993:193). (6) La construccin de tests puede llevarse a cabo para realizar una investigacin ad hoc para la cual no hay instrumentos de medicin conocidos, o bien para crear una prueba que pueda ser utilizada por otros en diferentes circunstancias, aunque esto ltimo es ms raro en un mercado sobresaturado de pruebas psicomtricas y proyectivas donde es realmente muy difcil posicionar un test que pueda representar una mejora respecto de los anteriores. (7) Tambin puede ser una curva, pero en este artculo se describe solamente la regresin lineal, que se representa mediante una recta. (8) El valor a es la ordenada al origen, y el valor b es el coeficiente angular o pendiente de la recta, que equivale a la tangente del ngulo alfa (formado por la recta y otra recta paralela a la absisa). La ecuacin de la recta tambin puede representarse como x = a + b.y, en cuyo caso el parmetro a significar la absisa al origen. En este artculo no se considerar esta segunda expresin por razones de simplicidad, y por cuanto la idea es poder predecir un valor y en funcin de un valor x, y no un valor x en funcin de un valor y. As, la ecuacin y = a + b.x permite predecir cunto valdr y en funcin de x, mientras que la ecuacin x = a + b.y permite predecir cunto valdr x en funcin de y. Ambas rectas de regresin se cortan en un punto llamado centroide, y la correlacin entre las dos variables est dada por el ngulo entre las dos rectas: si este ngulo vale 0, la correlacin es 1 (Kohan N, 1994:224).

CAPTULO 5: ESTADSTICA INFERENCIAL


5.1 INTRODUCCIN A diferencia de la estadstica descriptiva, la estadstica inferencial va ms all de la mera descripcin de la muestra por cuanto se propone, a partir del examen de sta ltima, inferir una conclusin acerca de la poblacin, con un cierto nivel de confianza (o, complementariamente, con un cierto nivel de error). Las muestras de las cuales se ocupa la estadstica inferencial son muestras probabilsticas, es decir, aquellas en las cuales es posible calcular el error cometido al estimar una caracterstica poblacional (Kohan N, 1994:144) (1). Clsicamente, la estadstica inferencial se ocupa de dos cuestiones: la estimacin de parmetros y la prueba de hiptesis, aunque por lo general, la mayora de las aplicaciones de la estadstica inferencial pertenecen al rea de la prueba de hiptesis (Pagano, 1998:209). De acuerdo al mismo autor (1998:155), en la estimacin de parmetros el investigador busca determinar una caracterstica de la poblacin a partir de los datos de la muestra. Por ejemplo, tomando la variable edad, podra concluir que la probabilidad de que el intervalo 4050 contenga la media de la poblacin es de 0.95. En cambio en la prueba de hiptesis, el investigador rene datos en una muestra para validar cierta hiptesis relativa a una poblacin. Ejemplos: a) para validar la hiptesis de que la media poblacional no tiene una diferencia significativa con la media muestral, toma ambas medias y las compara estadsticamente mediante la prueba de la media; b) para validar la hiptesis de que en la poblacin el mtodo de enseanza A es mejor que el B, el investigador toma dos muestras de alumnos y a cada uno le aplica un mtodo de enseanza diferente. El tipo de conclusin que se busca aqu podra ser que las mayores calificaciones en un grupo que en otro se deben al mtodo de enseanza aplicado y no al azar, y, adems, que dicha conclusin no se aplica slo a la muestra sino a toda la poblacin. En la estadstica inferencial se pueden hacer inferencias espaciales e inferencias temporales. Una inferencia espacial implica suponer, a partir de la muestra, cmo es la poblacin total. Una inferencia temporal es un caso especial donde, a partir de ciertos datos actuales podemos inferir o suponer ciertos otros datos que podamos obtener en el futuro, vale decir una poblacin potencial. 5.2 ESTIMACIN DE PARMETROS Esta tarea consiste en, partiendo de ciertos valores de la muestra llamados estadsticos o estadgrafos (por ejemplo la media aritmtica muestral), inferir ciertos otros valores de la poblacin llamados parmetros (por ejemplo la media aritmtica poblacional o esperanza). Ello es as porque en general lo que interesa es la poblacin, no la muestra. Cuando un investigador observa que en una muestra el 80% de las personas lee el diario, le interesar averiguar a partir de all qu porcentaje o proporcin de la poblacin lee el diario, ya que por ejemplo su inters es editar un nuevo peridico. De la misma forma, cuando un investigador observa que la media aritmtica muestral de la frecuencia cardaca es 80 pulsaciones por minuto, le interesar averiguar si ello se cumple tambin en la poblacin, ya que por ejemplo su inters puede ser comparar la frecuencia cardaca de sus pacientes con toda la poblacin para decidir sobre su salud en base a un criterio estadstico. Como puede verse, lo ms habitual es inferir medias aritmticas (promedios) y proporciones (porcentajes). As, a partir de la media aritmtica muestral se infiere la media aritmtica poblacional, y a partir de la proporcin observada en la muestra se infiere la proporcin en la poblacin. Existen dos tipos de estimacin de parmetros: la estimacin puntual y la estimacin intercalar (Pagano R, 1998:304). La estimacin puntual consiste en inferir un determinado valor para el parmetro. Por ejemplo, inferir que la poblacin debe tener puntualmente una media aritmtica de 80.
Pgina 73 de 331

74
La estimacin intervalar consiste en inferir dentro de qu intervalo de valores estar el parmetro con un determinado nivel de confianza. Por ejemplo, inferir que la poblacin debe tener una media aritmtica entre 75 y 83, con un nivel de confianza de 0.95 (esto es, hay un 95% de probabilidades de que el parmetro poblacional se encuentre entre 75 y 93) o, si se quiere, con un nivel de riesgo (4) de 0.05 (esto es, hay un 5% de probabilidades de que el parmetro no se encuentre entre esos valores). En general, resulta mucho ms riesgoso afirmar que el parmetro vale 80 que afirmar que vale entre 75 y 83. Por esta razn, se prefiere bajar este riesgo y establecer un intervalo de confianza, que podr ser de 0.90, 0.95, 0.99, etc, segn elija el investigador. Hay diferentes procedimientos de estimacin de parmetros, segn se trate de estimar medias o proporciones, o segn se trate de estimar parmetros de variables cualitativas (con dos categoras o con ms de dos categoras) o cuantitativas. En lo que sigue se dan algunos ejemplos combinados. Estimacin de la media poblacional para variables cuantitativas.- Conociendo la media muestral, es posible averiguar con un cierto nivel de confianza (por ejemplo 0.95), entre qu valores de la variable estar la media poblacional. Estos valores se llaman lmite superior del intervalo (Ls) y lmite inferior del intervalo (Li). Para obtener ambos valores se utilizan las siguientes frmulas: Ls = X + z . (S / n) Li = X - z . (S/ n) Donde: Ls = Lmite superior del intervalo de confianza. Li = Lmite inferior del intervalo de confianza. X = Media aritmtica muestral. S = Desvo estndar muestral. n = Tamao de la muestra. Si se trata de una muestra chica (menor a 30) se considera n-1. (S / n) = Desvo estndar poblacional. Cuando no tenemos el desvo estndar de la poblacin (hecho muy frecuente) se utiliza el desvo muestral (Rodrguez Feijo N, 2003). z . (S/ n) = Error muestral o estndar (error que puede cometerse al inferir la media poblacional) (3). z = Puntaje estandarizado que define el nivel de confianza. Si se desea un nivel de confianza de 0.90, debe consignarse z = 1.64. Si se desea un nivel de confianza de 0.95, debe consignarse z = 1.96. Si se desea un nivel de confianza de 0.99, debe consignarse z = 2.58. Para valores intermedios de nivel de confianza, pueden consultarse las tablas de reas de z (ver captulo sobre probabilidad y curva normal).

Ejemplo (Rodrguez Feijo N, 2003).- En una muestra probabilstica de 600 nios de 10 aos de Capital Federal el cociente intelectual promedio obtenido fue de 105 con una desviacin estndar de 16. Con un intervalo de confianza del 95%, entre qu lmites oscilar el CI promedio de los nios de 10 aos de Capital Federal? Ls = X + z . (S / n) = 105 + 1.96 (16 / 600) = 106.27 Li = X - z . (S/ n) = 105 - 1.96 (16 / 600) = 103.73 Respuesta: con un riesgo de 5% de equivocarse en la estimacin, el CI promedio de los nios de 10 aos de Capital Federal oscila entre 103.73 y 106.27 puntos. Estimacin de proporciones para variables cualitativas de dos categoras (Kohan N, 1994:166).- Conociendo la proporcin muestral, es posible averiguar con cierto nivel de confianza (por ejemplo 0.99) entre qu proporciones estar la proporcin poblacional. Tngase presente que una variable con dos categoras es una variable que tiene solamente dos posibilidades de variacin (por ejemplo: el sexo). Para obtener los lmites superior e inferior del intervalo de confianza, se utilizan las siguientes frmulas: Ls = p + z . ( p . q / n) Li = p - z . ( p . q / n)
Nota: La raz cuadrada afecta a p, q y n.

Donde: Ls = Lmite superior del intervalo de confianza. Li = Lmite inferior del intervalo de confianza. p = Proporcin muestral z = Puntaje estandarizado que define el nivel de confianza. Si se desea un nivel de confianza de 0.90, debe consignarse z = 1.64. Si se desea un nivel de confianza de 0.95, debe consignarse z = 1.96. Si se desea un nivel de confianza de 0.99, debe consignarse z = 2.58. Para valores intermedios de nivel de confianza, pueden consultarse las tablas de reas de z (ver captulo sobre probabilidad y curva normal). q = Proporcin que falta para llegar al 100%. Por ejemplo: si p es 65%, entonces q = 35%).
Pgina 74 de 331

75
n = Tamao de la muestra. Si se trata de una muestra chica (menor a 30) se considera n-1. Ejemplo.- En una muestra probabilstica de 100 personas, el 20% son masculinos. Con un intervalo de confianza del 99%, entre qu proporciones oscilar el porcentaje de masculinos en la poblacin? Ls = 20% + 2.58 . ( 20 . 80 / 100) = 30.3% Li = 20% 2.58 . ( 20 . 80 / 100) = 9.7% Respuesta: con un riesgo de 1% de equivocarse en la estimacin, la proporcin de masculinos en la poblacin oscila entre el 9.7% y el 30.3%. 5.3 PRUEBA DE HIPTESIS Las pruebas de hiptesis se utilizan para probar alguna hiptesis en investigacin cientfica (10). Cuando el investigador propone una hiptesis, su deseo ser poder confirmarla (porque l mismo la propuso o porque cree intuitivamente en ella). Si decide hacer una prueba estadstica para salir de dudas, entonces realizar una prueba de hiptesis y establecer dos hiptesis estadsticas: su propia hiptesis, a la que convertir en hiptesis alternativa, y la opuesta, que llamar hiptesis nula, y la tarea consistir en intentar probar esta ltima. Si la rechaza, aceptar la alternativa, y si la acepta, rechazar la alternativa (7). Existe una gran variedad de pruebas de hiptesis, pero todas ellas tienen en comn una determinada secuencia de operaciones, que son las siguientes: 1) Formulacin de la hiptesis de investigacin y obtencin de los datos.- El investigador comienza formulando la hiptesis que pretende probar. Por ejemplo, que una determinada droga cura una enfermedad. Luego, disea un experimento y lo ejecuta para obtener datos que permitan aceptar o no la hiptesis. Por ejemplo, administra la droga a un grupo y al otro no, para comparar los resultados. Estrictamente, este primer paso no forma parte de la prueba estadstica de la hiptesis pero es una condicin necesaria para realizarla, y ello por tres motivos: a) si no hay datos empricos, no puede realizarse ningn estudio estadstico, del mismo modo que si no hay combustible, el motor no funcionar; b) si los datos obtenidos en el experimento o en la observacin son lo suficientemente convincentes como para aceptar o rechazar la hiptesis de investigacin, no ser necesario emplear una prueba estadstica de hiptesis, con lo cual, este primer paso permite decidir si cabe o no aplicarla, an cuando se sepa que en la inmensa mayora de los casos s cabe hacerlo. Por ejemplo, si el 100% de los pacientes tratados con una droga se cura, mientras que el 100% de los pacientes no tratados sigue enfermo, es posible concluir, sin la ayuda de la estadstica, que cabe aceptar la hiptesis de investigacin segn la cual la droga cura. Sin embargo, en la realidad no suelen obtenerse datos tan auspiciosos, por lo que se requiere una prueba estadstica; y c) para obtener datos se utiliza un determinado diseo de investigacin, y la eleccin de la prueba estadstica de hiptesis ms adecuada depender del tipo de diseo de investigacin utilizado. En suma, es importante saber qu diseo est usando el investigador, cules son las variables que puede controlar y en funcin de esto buscar la prueba estadstica adecuada (Kohan, 1994:357). 2) Formulacin de la hiptesis alternativa y la hiptesis nula.- Si la prueba estadstica resulta necesaria, la hiptesis de investigacin es reformulada en trminos estadsticos, obtenindose la hiptesis alternativa (Ha). A continuacin, se formula, en los mismos trminos, la hiptesis nula (Ho), que es la opuesta de la alternativa. Ambas reformulaciones incluyen consideraciones del tipo hay o no hay una diferencia significativa entre. Por ejemplo, si la hiptesis de investigacin sostiene que la droga cura, la hiptesis alternativa dir que hay una diferencia significativa entre los resultados del grupo de pacientes tratado y el grupo de pacientes no tratado. Por lo tanto, la hiptesis nula sostendr que no hay una diferencia significativa entre ambos grupos. En este caso, adems, la Ha plantea un cambio (la droga cura), mientras que la Ho plantea la permanencia de un estado (la droga no cura). Lo que siempre se intentar probar es la hiptesis nula para un determinado nivel de significacin o de riesgo. Si rechazamos la hiptesis nula aceptamos la alternativa, y si no rechazamos la hiptesis nula, rechazamos la alternativa, ya que ambas son mutuamente contradictorias (8). Al estimar parmetros o probar hiptesis pueden cometerse errores. Suelen describirse dos tipos de errores (Kohan N, 1994:178): El error Tipo I consiste en rechazar la hiptesis nula cuando en realidad es verdadera. O sea, creer que la muestra NO es representativa de la poblacin, cuando s lo es. Es el error del desconfiado. El error Tipo II consiste en aceptar la hiptesis nula cuando en realidad es falsa. O sea, creer que la muestra SI es representativa de la poblacin, cuando no lo es. Es el error del ingenuo. La probabilidad de cometer el error I se simboliza con la letra griega alfa (), y la probabilidad de cometer el error II se simboliza con la letra griega beta () (Kohan N, 1994:185). Estos errores no son errores que cometan inadvertidamente los investigadores. Como la hiptesis nula se rechaza o se acepta en base a determinado nivel de significacin o de riesgo de equivocarse, siempre habr algn riesgo de error, que podr ser mayor o menor segn el nivel de riesgo elegido, pero que no obliga necesariamente a invalidar los resultados. Debe tenerse presente que siempre que se concluya algo sobre
Pgina 75 de 331

76
la poblacin a partir de la muestra, el procedimiento estar teido de algn grado de incertidumbre, es decir, siempre habr algn grado de probabilidad de cometer alguno de los dos tipos de errores. 3) Seleccin de la prueba de hiptesis ms adecuada.- Qued dicho que hay una gran cantidad de pruebas de hiptesis y su eleccin depende de la hiptesis alternativa que se formule, del nmero de casos examinados, del nivel de medicin utilizado, etc (Kohan N, 1994:176). Por ejemplo, a) si la hiptesis es direccional (es decir, especifica una relacin de mayor que o bien una relacin de menor que), se utilizar una prueba de hiptesis de una cola, mientras que si la hiptesis es no direccional (indica una relacin de diferente a), se utilizar una prueba de hiptesis de dos colas (11); b) si se conoce el desvo estndar poblacional, puede aplicarse la prueba z, mientras que si solamente se conoce el desvo estndar muestral, se aplicar la prueba t de Student; c) si se opera con variables medidas en un nivel nominal, puede utilizarse la prueba de chi cuadrado; si se trabaja con muestras muy pequeas (por ejemplo de 5 a 10 datos), la prueba t de Student es til. Seala Vessereau que se trata de un aporte importante por cuanto durante mucho tiempo se ha credo que era imposible sacar buen partido de las muestras muy pequeas (Vessereau A, 1962:33); d) La prueba ANOVA (anlisis de varianza): as como se pueden comparar las medias de dos muestras, existen pruebas que permiten confrontar su variabilidad (varianza o desviacin tpica). Estas pruebas sirven, entre otras, para resolver los problemas siguientes: 1) Reconocer si un grupo de muestras es homogneo; y 2) determinar, en la variabilidad de una poblacin de medidas, la parte que corresponde al azar y la que debe atribuirse a causas de variacin sistemticas, llamadas causas controladas o asignadas (Vessereau A, 1962:38). 4) Determinacin del nivel de significacin.- El nivel de significacin es la probabilidad de rechazar Ho siendo esta verdadera (error tipo I). Cada investigador elige su nivel de significacin, es decir, su probabilidad de equivocarse en el sentido indicado. Por ejemplo, puede elegirse un 5% o un 1% de probabilidad de error (o, lo que es lo mismo, un 95% o un 99% de probabilidad de no equivocarse). Seala Kohan (1994:177) que el nivel de significacin elegido depender de la importancia prctica de la investigacin. Por ejemplo, para un estudio sobre los efectos de una droga en el sistema nervioso se usar un nivel de significacin muy bajo, como por ejemplo un 0.01%, lo que minimiza al extremo su probabilidad de producir intoxicacin. Lo usual es especificar un nivel de significacin (probabilidad de cometer el error tipo I) y no el nivel de significacin (probabilidad de cometer el error tipo II). Una aclaracin ms detallada del concepto de significacin estadstica puede consultarse ms adelante en este mismo captulo. 5) Determinacin del tamao de la muestra.- En principio, el tamao de la muestra n ya fue determinado en el momento de elegir y ejecutar el diseo de investigacin: cuanto mayor haya sido el tamao de la muestra elegido, menor ser el error de (Kohan, 1994:178). Sin embargo, tambin puede procederse al revs: si se elige un determinar nivel , puede determinarse por medios matemticos el tamao de la muestra n adecuado a ese nivel (Kohan N, 1994:181-185). As, por ejemplo, en general si el investigador desea un menor margen de error, deber aumentar el tamao de la muestra. Adems del tamao de la muestra, debern tambin determinarse la curva operativa caracterstica (Kohan N, 1994:180) y el poder de eficiencia de la prueba (o tambin potencia), definido este ltimo como la probabilidad de rechazar la hiptesis nula cuando es realmente falsa. Por consiguiente, el poder de eficiencia se define como 1 - , es decir, 1 menos la probabilidad del error II (no rechazar la hiptesis nula cuando es realmente falsa) (Kohan N, 1994:185). Tngase presente: 1- 1- Nivel de error tipo I Nivel de confianza Nivel de error tipo II Nivel de confianza Es la probabilidad de cometer el error tipo I. Probabilidad de rechazar la Ho cuando es verdadera. Es la probabilidad de NO cometer el error tipo I. Probabilidad de NO rechazar (aceptar) la Ho cuando es verdadera. Es la probabilidad de cometer el error tipo II. Probabilidad de NO rechazar (aceptar) la Ho cuando es falsa. Es la probabilidad de NO cometer el error tipo II. Probabilidad de rechazar la Ho cuando es falsa. Se llama poder de eficiencia o potencia de la prueba.

6) Determinacin de la distribucin muestral de la prueba estadstica para Ho.- Seala Kohan (1994:186187) que cuando un investigador eligi una prueba estadstica, necesita saber cul es su distribucin muestral, que es una distribucin terica que se obtendra si se sacaran al azar todas las muestras posibles del mismo tamao de una poblacin (12). El conocimiento de esta distribucin muestral permite estimar la probabilidad de la ocurrencia de ciertos valores. 7) Definicin de la zona de rechazo.- Sobre la base de los puntos 3, 4, 5 y 6 deber ahora establecerse la zona de rechazo de la Ho. Para una mejor comprensin de este concepto, se puede trazar una lnea horizontal sobre la cual se podrn definir las zonas de rechazo y de no rechazo de la Ho. En esa lnea horizontal se indicarn valores que van desde -3 hasta +3, pasando por el 0 (cero). Estos valores
Pgina 76 de 331

77
corresponden a puntajes estandarizados, como por ejemplo z, si la prueba estadstica elegida es la prueba z, o t, si la prueba elegida es la prueba t de Student:

-3 +3 -3 +3

-2

-1

+1

+2

-2

-1

+1

+2

Las zonas de rechazo se definirn segn se trate de pruebas de hiptesis de una cola (hiptesis direccionales) o de dos colas (hiptesis no direccionales), segn el siguiente esquema:

z
Zona de rechazo Zona de aceptacin

Prueba de una cola a la izquierda

z
Zona de aceptacin Zona de rechazo

Prueba de una cola a la derecha

z
Zona de rechazo Z de aceptacin Zona de rechazo

Prueba de dos colas

Para determinar una zona de rechazo (o tambin zona crtica) es preciso indicar un determinado valor de z (o de t) que sirva para delimitar la zona de rechazo () de la zona de aceptacin (1 - ). Ese valor recibe el nombre de z terico, z crtico o punto crtico, que se calcula en base a una tabla de z (o de t) y en base al nivel de significacin elegido. Existe una relacin bsica entre , y el tamao de muestra n. Puesto que es la probabilidad de que la estadstica de prueba (por ejemplo el z emprico) caiga en la regin de rechazo, un incremento en el tamao de esta regin aumenta , y simultneamente disminuye , para un tamao de muestra fijo. El reducir el tamao de la regin de rechazo disminuye y aumenta . Si se aumenta el tamao de muestra entonces, se tiene ms informacin en la cual basar la decisin y ambas y decrecern. 8) Decisin final (6).- Si el dato emprico (llamado z emprico) obtenido cae dentro de la zona de rechazo, se rechaza la Ho y por tanto se acepta la Ha. En cambio, si el dato cae fuera de esta zona de rechazo, no se rechaza (se acepta) la Ho, siempre para un nivel de significacin elegido (Kohan N, 1994:189). Por ejemplo:

Pgina 77 de 331

78

z
-1.80 -1.65 Zona de aceptacin de la Ho Zona de rechazo de la Ho

z terico = -1.65 z emprico = -1.80

En este ejemplo, se puede apreciar que el z terico delimita las zonas de rechazo y aceptacin de la Ho. Como de los datos del experimento result un z emprico ubicado dentro de la zona de rechazo, se decide rechazar la Ho y, por lo tanto, se acepta la Ha. Sintticamente, el procedimiento bsico general para realizar las pruebas de hiptesis con z o t es el siguiente: 1) Se hace un listado con los datos disponibles: tamao de la muestra, media muestral, desvo poblacional (o desvo muestral si no est el desvo poblacional: en el primer caso se aplica z, y en el segundo t), el nivel de significacin alfa, y el nmero de colas (una cola a la izquierda o a la derecha en hiptesis direccionales del tipo menor que o mayor que; dos colas en hiptesis no direccionales). 2) Se dibuja la curva normal y se marca el valor o los valores de z crtico (o t crtico), rayando la parte correspondiente. 3) Se calcula el z o t emprico (por frmula). 4) Se calcula el z o t crtico (por tabla). 5) Se indica en el dibujo el z o y emprico. Si cae dentro de la zona rayada o crtica, se rechaza la hiptesis nula, y si cae fuera de la zona rayada o crtica, no se rechaza la hiptesis nula. 5.4 EJEMPLOS DE PRUEBAS DE HIPTESIS Existe una enorme cantidad de tipos de pruebas de hiptesis, adaptables a diversas necesidades y objetivos. En lo que sigue se suministran ejemplos de algunas de las pruebas ms frecuentes. 1) Prueba de la media.- Aqu no hay que estimar un intervalo para la media poblacional (como en la estimacin de parmetros), sino probar la hiptesis segn la cual no hay diferencia estadsticamente significativa entre la media poblacional y la muestral. Esta prueba, llamada tambin prueba de la media, se entiende cabalmente a partir de un conocimiento mnimo sobre distribucin muestral y teorema central del lmite (12). Existe una gran diversidad de pruebas de la media, segn que se conozca o no se conozca el desvo estndar poblacional (en cuyo caso se utiliza una prueba z o una prueba t, respectivamente), segn que la hiptesis sea direccional (prueba de una cola) o no direccional (prueba de dos colas), y segn se aplique a una sola muestra (Pagano R, 1998:293) o a dos muestras (Pagano R, 1998:317). Ejemplo.- Se supone que la estatura media de la poblacin de alumnos de una universidad es menor que 1.68 m, y su desvo estndar poblacional es de 0.10 m. Se cuenta con una muestra de 36 alumnos, con una media muestral de 1.65 m. Probar la hiptesis con un nivel de significacin o riesgo del 5%. Resolucin.- a) En primer lugar convendr ordenar los datos que suministra el problema: Tamao de la muestra (n) = 36. Media aritmtica de la muestra (X) = 1.65 m. Nivel de significacin () = 5% = 0.05. Media aritmtica de la poblacin () = 1.68 m. Desvo estndar de la poblacin () = 0.10 m.

b) En segundo lugar, se establecen la hiptesis alternativa y la hiptesis nula. La hiptesis alternativa (Ha) sostiene que la media poblacional es menor que 1.68 m, o sea < 1.68 m. Ntese que, primero, la Ha siempre se refiere a la poblacin, no a la muestra; segundo, es la hiptesis deseable por el investigador y por tanto la que se quiere probar; tercero, en este caso particular la hiptesis se refiere a una permanencia, no a un cambio, ya que sostiene que la estatura media poblacional sigue siendo menor que 1.68 m. a pesar de la muestra, que parece sugerir lo contrario; de esto ltimo se desprende, en cuarto lugar, que la muestra no sera representativa de la poblacin, es decir, la diferencia entre muestra y poblacin sera significativa y en este caso debida al azar. La hiptesis nula (Ho) sostiene que la media poblacional es igual a 1.68 m, o sea = 1.68 m. Estrictamente hablando la Ho, por ser la opuesta a la Ha, debera proponer > 1.68 m, pero en la prctica se utiliza la igualdad.

Pgina 78 de 331

79
La hiptesis nula (Ho) sostiene que la diferencia entre la media muestral y la media poblacional no es estadsticamente significativa para el nivel de significacin del 5%, o sea, la muestra es representativa de la poblacin. 2) Se calcula el z emprico mediante la siguiente frmula: X - 1.65 1.68 ze = -------------- = ------------------ = - 1.8 / n 0.10 / 36 3) Se calcula el z terico mediante la tabla de z para un nivel de significacin del 5%. Como se trata de una hiptesis alternativa direccional que especifica una direccin de menor que, se emplea la tabla de reas de z hacia la izquierda (ver apndice). Puesto que se pide un nivel de significacin del 5%, traduciendo este valor a probabilidades obtenemos 0.05. A continuacin, se busca el valor de z que corresponde aproximadamente a esa probabilidad. Hay dos valores que se aproximan idnticamente: 0.0505 y 0.0495. Eligiendo arbitrariamente el primero, se obtiene: zt = -1.64 4) Se define la zona de rechazo mediante zt y se indica el valor de ze:

z
-1.8 -1.64 Zona de aceptacin de la Ho Zona de rechazo de la Ho

z terico = -1.64 z emprico = -1.8

5) Como ze cae dentro de la regin de rechazo o regin crtica, entonces se rechaza la Ho, y por lo tanto, se acepta la Ha segn la cual la estatura media poblacional es menor que 1.68 m. En este caso se puede estar cometiendo un error tipo I, es decir, rechazar la Ho cuando es verdadera, con una probabilidad de = 0.05 (o si se quiere, existe una probabilidad del 5% de estar rechazando la Ho cuando es verdadera). 2) Prueba de hiptesis de correlacin (13).- La prueba de hiptesis que permite estudiar la significacin de una correlacin entre dos variables intenta probar la hiptesis nula que sostiene que la correlacin entre las dos variables ser cero en la poblacin origen. Las hiptesis estadsticas de esta prueba son: Ho) = 0 Ha) 0 La significacin del coeficiente de correlacin se estudia por medio de la distribucin t de Student. Para ello se obtiene el valor de: que se sita bajo la distribucin t (n-2,). Ejemplo.- Sean, a efectos didcticos, las siguientes seis observaciones obtenidas en dos variables X e Y: X 10 10 12 12 14 16 Y 13 16 12 17 15 15

Resolucin.- Aplicando la expresin del coeficiente de correlacin lineal de Pearson, se obtiene r = 0.1225. Si se quiere contrastar la hiptesis nula Ho) = 0, se deber estudiar la significacin del valor r obtenido. Para estudiar su significacin se debe transformar, en primer lugar, el valor de la correlacin en un valor t (t emprico) y, en segundo lugar, comparar dicho valor con el valor de las tablas de la t de Student (t terico) con n-2 grados de libertad (ver Tabla t en Anexo).

Pgina 79 de 331

80

El valor proporcionado por las tablas es t (4, 0.05)= 2.776. As, puesto que el valor obtenido es inferior al de las tablas se concluye que los datos no aportan informacin para rechazar la hiptesis nula Ho en funcin de la cual las dos variables no estn correlacionadas en la poblacin origen de la muestra. Panorama final.- El siguiente cuadro describe algunas de las principales pruebas de hiptesis: Prueba z Puntaje reducido. Se utiliza cuando se conoce el desvo poblacional. H (0) H (A) Zona de rechazo A la izquierda del punto crtico (una cola a la izquierda) A la derecha del punto crtico (una cola a la derecha) Dos colas A la izquierda del punto crtico (una cola a la izquierda) A la derecha del punto crtico (una cola a la derecha) Dos colas A la derecha del punto crtico (una cola a la derecha) Valor emprico (se calcula por frmula) z= Numerador: media muestral menos media poblacional. Denominador: desvo poblacional dividido por la raz cuadrada de n. t= Numerador: media muestral menos media poblacional. Denominador: desvo muestral s dividido por la raz cuadrada de n. X2 = Sumatoria de Numerador: cuadrado de la diferencia entre f (0) y F (e) Denominador: F (e) F= Numerador: variancia entre grupos. Denominador: variancia en cada grupo. (F se calcula por computadora). Valor crtico (se calcula por tabla) Calcular por tabla en base a

=x

<x

=x

>x

t (n-1) t de Student con n-1 grados de libertad. Se utiliza cuando se desconoce el desvo poblacional pero s el desvo muestral (s).

1 = 2 =x

1 2 <x

Calcular por tabla en base a y a n-1

=x

>x

X2 Chi cuadrado. Busca si hay diferencia significativa entre muestra y poblacin. Slo para variables cualitativas. F F de Snedecor o ANOVA. Busca si hay diferencias significativas entre medias de muestras o poblaciones. Busca decidir si la variacin entre tratamientos prevalece sobre la variacin aleatoria.

1 = 2 f (0) = f (e)

1 2 f (0) f (e)

Calcular por tabla en base a y a k-1

1 = 2 = 3

1 2 3 (o al menos dos distintas)

A la derecha del punto crtico (una cola a la derecha)

Calcular por tabla en base a , a k-1 y a n-k

z y t corresponden a distribuciones normales. X2 y F corresponden a distribuciones asimtricas a la izquierda.


Smbolos: x = Valor de la media poblacional. = Media poblacional o esperanza. n = Tamao de la muestra. = Nivel de significacin. Pgina 80 de 331

81
n-1 = Grados de libertad. F (0) = Frecuencia observada. F (e) = Frecuencia esperada. k-1 = Grados de libertad (N de categoras menos uno). n k = Grados de libertad. ANOVA = Anlisis de la variancia. La variancia entre grupos consiste en las distintas respuestas de la VD ante la aplicacin de los distintos niveles de la VI. La variancia en cada grupo consiste en las generadas por las diferencias individuales y otras eventualidades del experimento. Por ejemplo, esta prueba permite indagar si el aerobismo o la caminata mejoran el funcionamiento cardiovascular. La hiptesis nula considera aqu que no hay diferencias en cuanto a funcionamiento cardiovascular entre el grupo aerbico, el grupo caminante y el grupo control (1 = 2 = 3).

5.5 EL CONCEPTO DE SIGNIFICACIN ESTADSTICA En este tem se ofrecen mayores detalles este importante concepto de la estadstica inferencial, con un tercer ejemplo de prueba de hiptesis. Uno de los fines de la estadstica inferencial consiste en determinar si la diferencia entre dos conjuntos de datos es o no significativa. En el contexto de la investigacin cientfica, ambos conjuntos de datos pueden consistir en dos muestras (por ejemplo entre el grupo experimental y el grupo de control), o bien entre una muestra y una poblacin de la que fue extrada. 1) Diferencia entre muestras.- Cuando la investigacin incluye un diseo experimental, es sabido que las muestras (entonces designadas como grupo experimental y grupo de control), en general exigen un tratamiento estadstico antes y despus de la manipulacin, es decir, antes y despus de su exposicin a la influencia de la variable experimental x. a) Antes de aplicar x lo que se exige es que no haya diferencias significativas entre los grupos experimental y de control, tanto en lo referente a x como en las variables de control (es decir a las variables extraas relevantes que requieren ser controladas). b) Despus de aplicar x, lo que se espera como deseable (para aceptar la hiptesis de investigacin) es que haya diferencias significativas en cuanto a x entre ambos grupos. La teora de las muestras (2) es til para poder determinar si las diferencias observadas entre dos muestras son realmente debidas al azar o si son significativas, lo que puede llevar a un proceso de toma de decisiones gracias a las pruebas de hiptesis y de significacin que se pueden hacer (Kohan N, 1994:144). 2) Diferencia entre muestra y poblacin.- Queda, no obstante, otra tarea adicional para la estadstica inferencial: establecer si las conclusiones obtenidas para la muestra experimental, luego de la exposicin a x, pueden extenderse lcitamente a toda la poblacin, habida cuenta de que la ciencia busca un conocimiento vlido y universal. Esta tarea es lo que Kohan describe como probar hiptesis vlidas para la poblacin correspondiente, conociendo la informacin de las muestras (Kohan N, 1994:144). La misma autora indica que para que las conclusiones que se obtienen a partir de las muestras sean vlidas, stas deben ser representativas de la poblacin. El objetivo de este tem es explicar con un ejemplo de qu manera se puede alcanzar el objetivo 1b, es decir, como se puede probar si hay o no diferencias significativas entre un grupo experimental y un grupo de control. Los resultados de un experimento requieren un tratamiento estadstico que permita orientar al investigador acerca de si la hiptesis de investigacin debe ser rechazada o no rechazada, para lo cual deber establecer convencionalmente un determinado nivel de significacin que permita diferenciar resultados estadsticamente significativos de resultados estadsticamente no significativos. Seguidamente se explica en detalle esta aseveracin. En los informes de investigacin suelen aparecer expresiones del tipo "los resultados del experimento son estadsticamente significativos". Seguidamente se aclarar en forma intuitiva qu quiere decir esto, siguiendo los lineamientos didcticos de Len y Montero (1995:105-130). Supngase un sencillo experimento, donde se trata de probar si un choque emocional altera o no el recuerdo de los sucesos inmediatamente anteriores al mismo. Para ello, se tomaron dos grupos de estudiantes: el grupo experimental presenci una pelcula donde haba una escena violenta, y el grupo de control presenci la misma pelcula pero sin la escena violenta. Los resultados fueron los siguientes: el grupo sometido al choque emocional lograba luego recordar un promedio de 10, mientras que el grupo sin choque emocional lograba recordar ms sobre las escenas del film: por ejemplo, un promedio de 15. Esquemticamente: Grupo Grupo I (vieron escena violenta) Grupo II (no vieron escena violenta) Choque emocional SI NO Recuerdo 10 15

Pgina 81 de 331

82
Lo que debe ahora establecerse es si esta diferencia en los recuerdos entre 10 y 15 es o no significativa, es decir, si va o no ms all del simple azar. Si se concluye que NO es significativa, entonces las diferencias entre 10 y 15 se deben al azar, pero si se concluye que SI es una diferencia significativa, entonces no debe descartarse la influencia del choque emocional sobre la memoria. La expresin 'significativa' quiere decir una diferencia lo suficientemente grande como para pensar que el choque emocional influye sobre los recuerdos. En principio, para averiguar si la diferencia es o no significativa, puede apelarse a dos procedimientos, que podran llamarse el procedimiento intuitivo y el procedimiento estadstico. a) El procedimiento intuitivo es muy simple: se advierte que la diferencia entre ambos grupos es 15-10=5, y entonces se piensa: "evidentemente, hay una diferencia significativa". Si ambos grupos hubiesen obtenido 15, se pensara que no habra diferencia significativa y entonces se concluira que el choque emocional no influye sobre el recuerdo. Como puede notarse, este procedimiento intuitivo tiene el problema de la subjetividad en la estimacin de los resultados. Tal vez para otro investigador no hubiese sido significativa la diferencia de 5 sino una diferencia mayor, como por ejemplo 8. Ambos investigadores polemizaran fundamentando sus argumentaciones sobre la base de simples impresiones o creencias, es decir, jams llegaran a un acuerdo, y, en el mejor de los casos, acordaran buscar un procedimiento ms objetivo. En este caso contrataran a un tcnico en estadstica para que hiciera una estimacin como la que ahora se pasa a explicar. b) El procedimiento estadstico es ms complejo que el anterior: en lugar de intentar averiguar si la diferencia entre las promedios 15 y 10 es "intuitivamente significativa", lo que intentar probar es si la diferencia es "estadsticamente significativa". Cabe aqu anticipar algo que sealan Len y Montero: "Encontrar una diferencia de valores que no es estadsticamente significativa equivale a decir que esa diferencia la hemos encontrado por casualidad. O lo que es lo mismo, si repitiramos el proceso, el promedio de diferencias encontradas sera cero". Qu significa esta ltima expresin? Significa que si se hicieran otros experimentos con otros grupos, puesto que las diferencias que se obtienen obedecen a la casualidad, una vez se podra encontrar una diferencia de 5, otra vez una diferencia de 3, otra vez una diferencia de -4, etc, es decir, saldran nmeros al azar cuyo promedio tendera a cero, puesto que si dicho promedio tendiese a 5, entonces los resultados ya podran ser pensados como significativos. A partir del ejemplo, se puede ahora examinar el concepto de significacin estadstica, central dentro de la teora de las muestras (5). Len y Montero proponen imaginar por un momento una variante del experimento anterior, donde ninguno de los dos grupos fue expuesto al choque emocional, es decir, ambos grupos vieron la misma pelcula sin la escena violenta. Desde ya, este experimento carece de sentido, porque lo que interesa es ver si hay o no diferencias entre dos grupos en lo concerniente a capacidad de recordar, sometidos cada uno a 'diferentes' condiciones experimentales (uno vio la escena violenta y el otro no). Sin embargo, analizar lo que sucedera en este experimento imaginario resultar til para entender la idea de significacin estadstica, como enseguida se ver. En este experimento imaginario, puesto que ambos grupos no recibieron el estmulo violento, es esperable que los rendimientos mnmicos sean iguales, o por lo menos aproximadamente iguales, porque siempre cabe la posibilidad de la intervencin de pequeas variables no controladas. Repitiendo varias veces el experimento, una vez podramos obtener una diferencia de 0, otra vez una diferencia de 0.5, otra vez una diferencia de -1, etc. Si el experimento se repitiese diez mil veces, es razonable pensar que habra muy pocos casos donde la diferencia fuese muy extrema (por ejemplo 7 o -7), y muchos casos prximos a una diferencia de 0. Las diferencias obtenidas en los diez mil experimentos podran resumirse, segn este criterio, en la tabla 1. Tabla 1 Diferencias entre los 2 grupos 7 6 5 4 3 2 1 0 -1 -2 -3 -4 Cantidad de experimentos (frecuencias) 5 25 90 280 680 1200 1690 2000 1700 1190 720 290

Pgina 82 de 331

83
-5 -6 -7 Total 100 26 4 10.000

Los resultados de la tabla 1 permiten ver, en efecto, que hay muy pocos experimentos donde la diferencia entre grupos es muy grande (en apenas 5 experimentos la diferencia fue 7), mientras que hay muchos experimentos donde la diferencia entre grupos es nula (hay 2000 experimentos donde la diferencia fue 0). La tabla tambin informa sobre lo siguiente: a) La cantidad de casos que obtuvieron como diferencia entre +1 y -1 fue de 5.390 casos (que resulta de sumar 1690 + 2000 + 1700). Ello representa el 53,9% ms prximo a cero del total de casos. b) La cantidad de casos que obtuvieron como diferencia entre +3 y -3 fue de 9180 casos. Esto representa el 91,8% ms prximo a cero del total de casos, y se puede graficar mediante una curva normal tal como aparece en el grfico 1. En este grfico se puede visualizar fcilmente que el 91,8% de los experimentos obtuvo una diferencia de -3 hasta +3. Grfico 1

2000 Frecuencias F

9 91,8%

z z
-7 +7 -6 -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 +6

D Diferencias
Una vez hechos estos clculos, ahora cabe hacerse una pregunta fundamental: dentro de qu intervalo de diferencias cabra admitir que las diferencias responden al simple azar? Dentro del intervalo -1 y +1? Dentro del intervalos -3 y +3? Por las dudas, se considerar convencionalmente este ltimo intervalo. Esto quiere decir, por ejemplo, que si en un experimento se obtuvo una diferencia de 2, entonces se considerar que dicha diferencia se debe al azar (pues 2 est entre -3 y +3), mientras que si en otro experimento se obtuvo una diferencia de 6, entonces se considerar que dicha diferencia no se debe al azar (pues 6 est fuera del intervalo entre -3 y +3), es decir, se considerar que la diferencia es 'estadsticamente significativa'. Supngase ahora el experimento original, donde un grupo era sometido al estmulo violento y el otro no, es decir, donde los grupos son sometidos a diferentes condiciones experimentales. En uno de dichos experimentos se ha obtenido, por ejemplo, una diferencia de 2.5; por lo tanto, deber concluirse que esta diferencia no es 'estadsticamente significativa' porque est comprendida dentro del 91,8% de los casos ms prximos a cero (o sea, entre -3 y +3), segn la convencin propuesta. En cambio, si la diferencia encontrada en otro experimento de este tipo hubiese sido de 5, este valor cae fuera del intervalo entre -3 y +3, y por lo tanto es 'estadsticamente significativo' (ver grfico 2). Desde ya, para decidir esto se ha considerado que el porcentaje que permite discriminar lo que es significativo de lo que no lo es era 91,8%. Si se hubiese elegido el 99%, una diferencia de 5 como resultado hubiese resultado estadsticamente no significativa. Sealan Len y Montero: "el investigador [es quien] determina el porcentaje que sirve para discriminar la significacin de la no significacin. Este tanto por ciento se denomina 'nivel de confianza', y tiene sus valores ms frecuentes entre 95% y 99%". Cuanto mayor es el porcentaje elegido, ms exigente deber ser en cuanto a la tipificacin de un resultado como estadsticamente significativo.
Pgina 83 de 331

84
En los informes de investigacin, en vez de citarse el nivel de confianza, se suele citar su complementario, que es el 'nivel de significacin' o 'nivel de riesgo'. En el caso del ejemplo, si el nivel de confianza era del 91,8%, el nivel de significacin o de riesgo ser lo que falta para completar 100%, es decir, el 8,2% (ver grfico 2). Ms an, inclusive, es frecuente expresar este nivel de significacin no en trminos de porcentajes sino en trminos de probabilidad, con lo cual, en vez de afirmarse 8,2%, se afirmar 0.082. Grfico 2

Nivel de significacin (o de riesgo) 4,1% 4

Nivel de confianza 91,8% 9

Nivel de significacin (o de riesgo) 4,1% 4

z z
-7 +7
Resultados estadsticamente significativos s Resultados estadsticamente NO significativos Resultados estadsticamente significativos s

-6

-5

-4

-3

-2

-1

+1

+2

+3

+4

+5

+6

Las expresiones 'confianza' y 'riesgo' resultan esclarecedoras para entender estos conceptos: si un experimento cae dentro del nivel de confianza se puede decir con tranquilidad, con 'confianza', que los resultados no son estadsticamente significativos, pero si cae dentro del nivel de riesgo, el investigador se estara 'arriesgando' a sostener que los resultados son estadsticamente significativos, es decir, a aceptar la hiptesis segn la cual un choque emocional efectivamente influye sobre los recuerdos. Len y Montero indican que encontrar diferencias estadsticamente significativas no es el propsito final del investigador, ni lo ms importante. Lo que el investigador persigue es en realidad determinar la significacin terica, ms que la significacin estadstica que le sirve como medio, es decir, si resulta o no relevante para alguna finalidad. As por ejemplo, si se ha constatado que un tratamiento para adelgazar produce una prdida de 2 Kg, esto puede ser estadsticamente significativo, pero mientras que para un investigador nutricionista ser adems tambin importante desde el punto de vista terico, para un vendedor de esa dieta no, porque 2 Kg. no le proporciona un buen argumento de venta. Una ltima acotacin. Podra ocurrir que algunos investigadores que hicieran el experimento del choque emocional hubiesen obtenido diferencias extremas, como por ejemplo -7 o +7, mientras que otros hubiesen obtenido diferencias ms prximas a cero, con lo cual los primeros hubiesen aceptado la hiptesis del choque emocional, mientras que los segundos la hubiesen rechazado. Este desacuerdo entre investigaciones puede ocurrir, con lo cual deber emprenderse lo que se llama un 'meta-anlisis', es decir, un procedimiento que permita integrar los resultados acumulados de una serie de investigaciones.
NOTAS (1) Las muestras no probabilsticas solo suelen usarse como primera aproximacin en trabajos piloto, pero no puede saberse cun confiables son sus resultados (Kohan N, 1994:146). (2) Toda teora de las muestras es una estadstica inferencial, pues se infieren a partir de los valores estadsticos hallados en las muestras los valores paramtricos ms probables para las poblaciones de las cuales hemos extrado las muestras (Kohan N, 1994:145). (3) Cuanto mayor es el error estndar, mayor es el intervalo de confianza. El error estndar es mayor cuando z es mayor, o sea, cuanto menor es el riesgo que se quiere correr; cuando n es menor (si se quiere ms precisin se necesitar una muestra ms grande), y cuando S es mayor. En sntesis: cuanto menor es el riesgo que se quiere correr, cuanto menor es el tamao de la muestra y cuanto mayor es el S (desvo estndar muestral), mayor ser el intervalo de confianza. (4) Este nivel de riesgo es tambin llamado nivel de significacin (Rodrguez Feijo N, 2003).

Pgina 84 de 331

85
(5) "La teora sobre las muestras... es til [entre otras cosas] para poder determinar si las diferencias observadas entre dos muestras son realmente debidas al azar o si son significativas, lo que puede llevar a un proceso de toma de decisiones gracias a las pruebas de hiptesis y de significacin que se pueden hacer" (Kohan N, 1994:144). (6) La prueba de hiptesis tiende a ser denominada en la actualidad teora de la decisin (Kohan N, 1994:173). Con ello se quiere significar que la prueba de hiptesis se lleva a cabo sobre la base de una teora llamada teora de la decisin. (7) Un experimento clsico para probar la hiptesis del investigador es comparar dos muestras: el grupo experimental y el grupo de control. Si hay diferencia significativa entre la muestra experimental y la muestra de control, entonces NO hay diferencia significativa entre la muestra experimental y la poblacin. (8) Puede llamar la atencin que el investigador no pruebe directamente su hiptesis alternativa sino que lo haga indirectamente, probando la hiptesis nula. Por qu proceder para apoyar una teora mostrando que hay poca evidencia para apoyar la teora contraria? Por qu no apoyar directamente la hiptesis alternativa o de investigacin? La respuesta est en los problemas para evaluar las posibilidades de decisiones incorrectas. El argumento que en general puede encontrarse en los textos de estadstica es el siguiente: Si la hiptesis de investigacin es verdadera (por ejemplo una vacuna cura el resfriado), la prueba de la hiptesis nula (la contraria a la hiptesis de investigacin) deber conducir a su rechazo. En este caso, la probabilidad de tomar una decisin incorrecta corresponde a cuyo valor fue especificado al determinar la regin de rechazo. Por lo tanto, si se rechaza la hiptesis nula (que es lo deseable) se conoce inmediatamente la probabilidad de tomar una decisin incorrecta. Esto proporciona una medida de confianza de la conclusin. Supngase que se utiliza el razonamiento opuesto, probando la hiptesis alternativa (de investigacin) de que la vacuna es efectiva. Si la hiptesis de investigacin es verdadera, la estadstica de prueba probablemente caer en la regin de aceptacin (en lugar de la de rechazo). Ahora, para encontrar la probabilidad de una decisin incorrecta de debe evaluar , la probabilidad de aceptar la hiptesis nula cuando esta es falsa. A pesar de que esto no representa un gran esfuerzo para el problema de la vacuna contra el resfriado, es un trabajo adicional que se debe hacer y en algunos casos es muy difcil calcular . As que, para resumir, es mucho ms fcil seguir el camino de la prueba por contradiccin. Por lo tanto, el estadstico elegir la hiptesis contraria a la de la investigacin como hiptesis nula y su deseo es que la prueba conduzca a su rechazo. Si es as, el estadstico conoce el valor de y tiene una medida inmediata de la confianza que se puede depositar en esta conclusin. (9) Autores como Hernndez Sampieri et al (1996:91) nos ofrecen una interesante tipologa de hiptesis nulas que contemplan varias posibilidades. Concretamente, hacen referencia a: 1) hiptesis nulas descriptivas de una variable que se va a observar en un contexto (por ejemplo la expectativa de ingreso mensual de los trabajadores de la corporacin T no oscila entre 50.000 y 60.000 pesos colombianos); 2) hiptesis que niegan o contradicen la correlacin entre dos o ms variables (por ejemplo no hay relacin entre la autoestima y el temor de logro); 3) hiptesis que niegan que haya diferencia entre grupos (por ejemplo no existen diferencias en el contenido de sexo en las telenovelas S, L y M); y 4) hiptesis que niegan la relacin de causalidad entre dos o ms variables (por ejemplo la percepcin de la similitud en religin, valores y creencias no provoca mayor atraccin fsica). A nuestro entender, una visin ms completa de las hiptesis nulas debera considerar al menos cuatro sentidos, que podemos designar respectivamente en trminos de hiptesis nula de estimacin, hiptesis nula de correlacin, de causalidad y de validez externa: a) La hiptesis nula de estimacin vendra a afirmar que los estadsticos muestrales no son representativos de los parmetros poblacionales. b) La hiptesis nula de correlacin vendra a afirmar que no existe una correlacin significativa entre dos o ms variables. El nivel de significacin es en estos casos el que establece a priori el investigador cuando califica ciertos intervalos del coeficiente de correlacin como alto, medio, bajo, etc. c) La hiptesis nula de causalidad vendra a afirmar que los cambios en la variable dependiente Y no son adjudicables a los cambios de la variable independiente X. Pagano, por ejemplo, refiere que la hiptesis nula indica que la variable independiente no influye sobre la variable dependiente (Pagano, 1998:212). Este segundo sentido de hiptesis nula es el ms frecuentemente mencionado en los tratados sobre el tema. d) La hiptesis nula de validez externa vendra a indicar que las conclusiones obtenidas en la muestra no son extensibles -con el nivel confianza requerido- a toda la poblacin. Este tipo de hiptesis vendra entonces a negar la validez externa de un experimento, entendiendo aqu validez externa como requisitos de los diseos experimentales tal como por aparecen en gran parte de la bibliografa sobre el tema (por ejemplo Campbell D y Stanley J, 1995:16). Autores como Tamayo pareceran considerar este sentido de hiptesis nula cuando la incluyen dentro de las hiptesis estadsticas, definiendo stas ltimas como suposiciones sobre una poblacin que se realizan a partir de los datos observados, es decir, de una muestra (Tamayo M, 1999:120). La hiptesis nula de estimacin corresponde a la primera tarea de la estadstica inferencial: la estimacin de parmetros. Las hiptesis nulas de correlacin y de causalidad corresponderan a la prueba de hiptesis donde se busca establecer si y se debe a x y no al azar, y la hiptesis nula de validez externa corresponderan a la prueba de hiptesis donde se busca generalizar los resultados a toda la poblacin. (10) Debe diferenciarse la hiptesis de investigacin (H), la hiptesis alternativa (Ha) y la hiptesis nula (Ho). La hiptesis de investigacin resulta, segn Vessereau (1962:28), de consideraciones tericas o bien est sugerida por los datos mismos. A los efectos de probar la hiptesis de investigacin, deber drsele una forma estadstica, con lo cual se convierte en la hiptesis alternativa (esta forma estadstica significa que incluye por ejemplo alguna afirmacin acerca de si hay o no diferencias significativas). A su vez para probar esta hiptesis alternativa deber probarse la hiptesis nula, que no es otra cosa que la negacin de la hiptesis alternativa. Ms concretamente, por lo general, la hiptesis de investigacin predice una relacin entre dos o ms variables (por ejemplo, que los nios que tienen mayor dominio del ojo izquierdo obtendrn puntajes de rendimiento en lectura bastante inferiores a los de los otros alumnos). Para probar esta hiptesis de manera estadstica, el investigador debe transformarla en hiptesis alternativa y luego negarla mediante la hiptesis nula. La hiptesis nula no siempre refleja las expectativas del investigador en relacin con el resultado del experimento. Por lo general, se opone a la hiptesis de investigacin, pero se la utiliza porque resulta ms apropiada para la aplicacin de los procedimientos estadsticos. La hiptesis nula determina que no existe relacin entre las variables consideradas (por ejemplo, en lo que respecta al rendimiento en la lectura, no hay ninguna diferencia entre los nios que poseen mayor dominio del ojo izquierdo y los dems). Por lo general, cuando se

Pgina 85 de 331

86
formula una hiptesis nula, se espera que sea rechazada. Si esto ltimo ocurre, se acepta la hiptesis de investigacin (Van Dalen: 189-190). (11) Las pruebas de una cola y dos colas tambin se llaman pruebas de un extremo y dos extremos, o tambin unilaterales y bilaterales, o tambin one tailed test o two tailed test. (12) Dada una poblacin de la cual se conoce su media aritmtica, por ejemplo 70, su varianza, y su tamao N, por ejemplo 4, puede llevarse a cabo el siguiente procedimiento: a) primero se sacan todas las muestras posibles del mismo tamao. La cantidad de muestras posibles se puede calcular mediante un nmero combinatorio, y as, por ejemplo, de una poblacin de N = 4, se pueden obtener un total de 6 muestras de n = 2. b) A continuacin se calculan las medias aritmticas de cada una de las muestras posibles, con lo cual se obtiene una distribucin muestral de medias aritmticas. Por ejemplo, las medias aritmticas de las 6 muestras pueden ser: 50, 60, 70, 80 y 90. c) Seguidamente se calcula la media aritmtica de todas estas medias aritmticas, y se obtiene un valor de 70. Como puede apreciarse, esta media de todas la medias muestrales coincide con la media poblacional. La estadstica ha demostrado que esta distribucin de medias de todas las medias muestrales sigue el modelo de la curva normal, y se ha establecido as el teorema central de lmite, que dice que si se sacan repetidamente muestras de tamao n de una poblacin normal de cierta media y cierta varianza, la distribucin de las medias muestrales ser normal con una media igual a la media poblacional y con una varianza igual a la varianza poblacional dividido n. Desde ya, la precisin de la aproximacin mejora al aumentar n. De todo ello se desprende que si se selecciona una muestra cualquiera y sta tiene una determinada varianza (o sea, un determinado desvo estndar respecto de la media de las medias), se habr cometido un determinado error, llamado en este caso error estndar, por haber trabajado con una muestra en lugar de haberlo hecho con la poblacin. La frmula del error estndar no es otra cosa que el desvo estndar de la muestra en cuestin, lo que es igual al desvo estndar poblacional dividido por la raz cuadrada del tamao n de la muestra (Rodrguez Feijo, 2003) (Kohan N, 1994:150-153). (13) Extrado de http://www.bibliopsiquis.com/psicologiacom/vol5num1/2815/. Otro ejemplo de prueba de hiptesis de correlacin puede encontrarse en Kohan (1994:234).

Pgina 86 de 331

87

PARTE II: METODOLOGA DE LA INVESTIGACIN

Pgina 87 de 331

88

CAPTULO 6: INVESTIGACIN E INVESTIGACIN CIENTFICA


La investigacin -ms all de si es cientfica o no lo es- es un proceso por el cual se enfrentan y se resuelven problemas en forma planificada, y con una determinada finalidad. Una forma de clasificar los diferentes tipos de investigacin en general es a partir de su propsito o finalidad: fines distintos corresponden a diferentes tipos de investigacin. Toda investigacin, y en particular la investigacin cientfica, tiene un determinado mtodo y un determinado encuadre, que sern descritos en este captulo donde adems se sugiere, finalmente, un proyecto para la formacin de investigadores cientficos.

1. QU ES INVESTIGACIN
Partiendo de una definicin simple, pero no menos correcta, puede decirse que la investigacin es un proceso por el cual se enfrentan y se resuelven problemas en forma planificada, y con una determinada finalidad. En esta definicin deben destacarse cuatro ideas importantes: "proceso", "problema", "planificada" y "finalidad". 1) Proceso.- Como muchas palabras que terminan en cin, investigacin puede designar dos cosas: la accin de investigar, o bien el efecto, resultado o producto de esa accin. En nuestra definicin adoptamos el primer sentido, es decir, un sentido ms dinmico y menos esttico: la investigacin es algo que hace la gente, acciones que requieren tiempo. Que la investigacin sea un proceso significa que no es algo que ocurra instantneamente, sino que se da a lo largo de un tiempo, es decir que tiene una secuencia cronolgica. Hay algunas investigaciones que duran unos pocos minutos, como investigar quien me escondi los zapatos, unas pocas horas o das, como podra ser investigar cmo ocurri un accidente callejero, mientras que otras llevan varios aos, como la investigacin de la eficacia de una cierta droga para curar cierta enfermedad. 2) Problema.- En nuestra definicin hablamos deliberadamente de 'problema', y no empleamos palabras como misterio o enigma, por cuanto ellas tienden a sugerir cuestiones que aceptamos como insolubles, como cuando se dice el misterio de la Santsima Trinidad, o el misterio de Mara, una mujer que, siendo virgen, pari un hijo. Por tanto, el problema que genera la investigacin debe ser, por lo menos en principio, solucionable -sea en el grado que sea-, si no, no hay investigacin posible. La investigacin implica no slo enfrentar un problema sino tambin resolverlo, pues de otra forma la investigacin no se completa como proceso: un investigador es un buscador de soluciones o si se quiere, un disolvedor de misterios. Si solamente nos ocupramos de enfrentar problemas sin resolverlos, haramos como Fabio Zerpa con el asunto de los platos voladores y como Charles Berlitz con el Tringulo de las Bermudas, para quienes cuantos ms misterios sin resolver haya, tanto mejor: es lo que podemos llamar una anti-investigacin, porque el fin no es solucionar misterios sino multiplicarlos. De alguna forma ellos saben de la fascinacin que ejercen los misterios sobre las personas, y de esa manera pueden vender muchos libros: Bunge llamaba a estos personajes "traficantes de misterios". Desde ya, estos traficantes de misterios ofrecen soluciones, como por ejemplo cuando dicen que las pirmides fueron construidas por extraterrestres, pero la solucin vuelve a encerrar un misterio an mayor, como por ejemplo de dnde vinieron o quienes eran aquellos presuntos extraterrestres. Estos traficantes seducen con lo misterioso, insisten en el enigma, no en la solucin. La investigacin cientfica procura resolver problemas, aunque detrs de ellos encuentra problemas ms grandes. Sin embargo, no insisten en el enigma sino en la solucin. Etimolgicamente, 'investigar' significa buscar, indagar. En ingls, investigacin se dice 'research', y precisamente 'search' significa buscar. Desde ya se trata, como hemos indicado, de una bsqueda de soluciones. En nuestra definicin habamos dicho que la investigacin implica enfrentar y resolver problemas. Ya hemos aclarado que 'resolver' problemas significa encontrarles soluciones. Aclaremos ahora un poco ms que significa 'enfrentar' problemas. Tanto en la vida cotidiana como en la investigacin cientfica enfrentamos problemas, pero mientras en la primera los problemas se presentan muy a pesar nuestro, en la ciencia los buscamos y los formulamos deliberadamente. El cientfico, a diferencia del hombre comn, es un problematizador por excelencia, es alguien que est 'mentalizado' para detectarlos. Mario Bunge deca que una de las tareas del investigador es tomar conocimiento de problemas que otros pueden haber pasado por alto. Por ejemplo, en la vida cotidiana nadie se plantea el problema de por qu se cae una manzana cuando la soltamos, salvo que sea Newton y se haya sentado debajo del manzano: "el trabajo cientfico consiste, fundamentalmente, en formular problemas y tratar de resolverlos" (Ander-Egg E, 1987:139). Ahora bien, sea que los problemas se busquen deliberadamente (como en la ciencia) o se encuentren inopinadamente (como en la vida cotidiana), el denominador comn es le hecho de que el problema debe ser enfrentado. La distincin entre buscar y encontrar puede tener una importancia psicolgica, pero es secundaria a los efectos de lo que aqu queremos ver, es decir, lo que es comn a cualquier investigacin.

Pgina 88 de 331

89
Lo importante ser para nosotros que en la investigacin se 'enfrentan' problemas, sea que estn buscados deliberadamente, sea que hayan sido encontrados 'sin querer'. En general, en los manuales de metodologa de la investigacin suele insistirse en el papel protagnico del problema en la investigacin, tal como podemos encontrarlo por ejemplo en Selltiz. El mismo Bunge tambin insiste en ello, dndonos una versin de investigacin con reminiscencias darwinianas, cuando la define como un proceso que "consiste en hallar, formular problemas y luchar contra ellos" (Bunge M, 1970:185). En sntesis, si tuvisemos que condensar en una frmula muy simplificada qu es la investigacin, podramos decir: "investigacin = problema + resolucin". Como podemos advertir, no puede haber investigacin sin un problema, pero, puede haber un problema sin investigacin? Respuesta: puede haberlo, como por ejemplo en los casos de resolucin de problemas en forma automtica, ya que la investigacin implica una forma planificada de resolucin, como enseguida veremos. Otro ejemplo puede ser agrandar el problema (la anti-investigacin de Fabio Zerpa), y otro ejemplo es cuando hay un problema pero no hay una inquietud por resolverlo. Yo tuve una novia que deca: "si un problema no tiene solucin, para qu hacerse problema?, y si tiene solucin, para qu hacerse problema?" Nunca supe si el problema que la desvelaba era yo, entre otras cosas porque no me dio tiempo: salimos solamente tres das. 3) Planificacin.- El tercer concepto includo en nuestra definicin de investigacin es el de planificacin: concretamente, cuando decimos que la investigacin implica resolver un problema en forma planificada. Para Bunge, el trmino 'problema' designa "una dificultad que no puede resolverse automticamente, sino que requiere una investigacin, conceptual o emprica" (Bunge M, 1970:195). Esto nos suscita la idea de que hay por lo menos dos formas de resolver problemas: automtica y planificada. a) Resolucin automtica.- Un problema puede ser resuelto automticamente, lo que significa que no exige mayormente esfuerzo intelectual, ingenio, creatividad o planificacin. Podemos mencionar tres modalidades de resolucin automtica de problemas: inmediata, rutinaria y aleatoria. En la resolucin inmediata, apenas aparece el problema aparece la solucin. Si tengo necesidad de una birome, la tomo del bolsillo y se acab el problema, es decir, no necesito hacer una 'investigacin' para buscar la birome (la investigacin, como veremos, supone una resolucin planificada). Si mi problema es conocer el origen del universo, puedo tener una solucin inmediata que me es provista por mi cosmovisin: lo cre Dios y punto. El dogma religioso suele prohibir la investigacin: las verdades estn dadas, no hay que buscarlas en ningn lado. La resolucin rutinaria implica llevar a cabo una serie de actividades en forma ordenada, mecnica o predeterminada. Muchas actividades cotidianas son rutinarias: si tengo que preparar la comida de todos los das, si tengo que entrar al auto, arrancarlo y andar, o si debo tomar el colectivo todos los das para ir a trabajar, ejecuto una serie de pasos ordenados, incluso sin pensarlos demasiado, en forma automtica. Nadie dira que preparar la comida de todos los das es 'hacer una investigacin': resolver un problema cotidiano no implica necesariamente investigar. Otro ejemplo: un cirujano que realiza su operacin nmero mil de vescula ya la hace casi con los ojos cerrados, en forma automtica y rutinaria, y por ende no investig nada. La diferencia que puede haber entre la resolucin rutinaria y la inmediata es tal vez solamente que la primera requiere cierto tiempo y, es, por lo tanto, un proceso. Finalmente, la resolucin aleatoria consiste en encontrar una solucin de manera fortuita, incluso sin haberla buscado. Podemos por ejemplo tener problemas de dinero, y encontramos en la calle cien pesos. Aqu nadie dira que hemos realizado una investigacin para resolver nuestro problema econmico. b) Resolucin planificada.- Como podemos imaginarnos, una resolucin planificada no es una resolucin automtica: exige cierto esfuerzo, exige cierta dosis de creatividad, exige trazarnos estrategias y tcticas. Como su nombre lo indica, exige trazarnos un 'plan' para resolver el problema, precisamente porque no podemos resolverlo automticamente. Cuando pierdo el botn de la camisa o los documentos y no puedo resolver el problema de manera automtica, inicio una 'investigacin', pero previamente hago una planificacin, por muy inconciente o rudimentaria que pueda ser, es decir, me organizo, me trazo un plan: primero busco en el piso, despus en la casa, despus en los lugares donde estuve, para lo cual a su vez pudo llamar por telfono a esos lugares o ir personalmente, etc. La investigacin supone una planificacin, pero la planificacin sola no es investigacin, porque requiere tambin la ejecucin del plan. Planificar sin ejecutar es como hacer el plano de una casa sin construirla. La planificacin, a su vez, supone una organizacin y un mtodo, pero no toda organizacin metdica de actividades supone planificacin: la resolucin rutinaria de problemas implica una organizacin de las conductas y un mtodo, pero su mismo carcter rutinario hace innecesaria una planificacin previa. Debemos entonces preguntarnos cmo debe ser esta organizacin metdica para que podamos hablar propiamente de una necesidad de planificacin, esto es, para que podamos hablar propiamente de investigacin. Ciertos autores (Matus C, 1985) distinguen entre planificacin normativa y planificacin estratgica, y aclaramos ante todo que lo que aqu estamos llamando planificacin corresponde con ste ltimo sentido. Una 'planificacin' normativa implica disear un plan en forma inflexible y rgida, sin tener en cuenta las posibles variaciones y sorpresas que la realidad pueda presentarnos. No admite ni prev cambios sobre la

Pgina 89 de 331

90
marcha. Se trata de una planificacin que pretende actuar sobre la realidad como Procusto, quien en lugar de construir un lecho acorde con las dimensiones del hombre, cortaba a ste para ajustarlo al lecho. Una planificacin estratgica, al revs, considera los imprevistos e instrumenta los modos de adaptarse a ellos introduciendo cambios en el plan original. Un fsico norteamericano, Robert Oppenheimer, deca que investigar significa pagar la entrada por adelantado y entrar sin saber lo que se va a ver. Como el lector habr advertido, una planificacin normativa no es en realidad tal, y est ms bien relacionada con la forma rutinaria de resolver problemas. La investigacin, en suma, implica una planificacin, sobreentendindose que se trata de una planificacin estratgica y no normativa. La planificacin implica trazar un plan constitudo por pasos sucesivos para resolver el problema. A grandes rasgos, estos pasos deben incluir la formulacin adecuada del problema (para tener claro qu es lo que requiere una solucin), la especificacin de los medios para recolectar, seleccionar, comparar e interpretar la informacin -necesaria para resolver el problema-, de la forma ms sencilla, breve y econmica posible. Deca Pedro Lan Entralgo: "el buen investigador ha de tener a la vez ideas nuevas, buena informacin y buena tcnica de trabajo. A los malos investigadores les falta siempre uno por lo menos de esos tres requisitos". El autor pensaba en la investigacin cientfica, pero sus requisitos son igualmente aplicables a cualquier otro tipo de investigacin, por ms cotidiana e intrascendente que pueda ser. Como dijimos, la investigacin implica entre otras cosas saber seleccionar la informacin pertinente, y buscarla en la forma ms sencilla posible. As, seleccionamos aquella informacin que juzgamos atingente o pertinente al problema. Si mi problema es encontrar el botn que perd, informacin no pertinente ser por ejemplo la cantidad de satlites de Jpiter, e informacin pertinente ser qu clase de objetos hay detrs del silln. La investigacin debe tambin buscar la sencillez (y hasta la elegancia), cuestin importante porque muchas veces se piensa que una investigacin es algo complicado: indudablemente muchas investigaciones son complicadas, pero ello no se debe a que el investigador se proponga deliberadamente sembrar dificultades. Por ejemplo, en una investigacin a veces debemos tomar una muestra que ya es representativa con 100 personas. Si tomamos 200 personas estamos complicando innecesariamente la investigacin, ya que se nos hace ms lenta y ms costosa. c) Una relacin entre resolucin automtica y resolucin planificada.- Cualquier tipo de investigacin, sea del hombre comn en su vida o el cientfico en su laboratorio, implica siempre, como hemos visto, una forma planificada de resolver el problema que la gener. Sin embargo, en el curso de la misma suelen aparecer secundariamente formas automticas de resolucin de problemas. Las investigaciones reales incluyen formas planificadas y formas automticas de resolucin, pero con la importante aclaracin que la intencin principal de la investigacin es la planificacin, no la resolucin automtica. Por ejemplo, la resolucin aleatoria puede darse en el curso de una resolucin planificada: Pasteur encontr la manera de 'pasteurizar' la leche por azar. Un da sin querer se le cay el preparado con bacterias patgenas y luego comprob que haban muerto todas por el brusco cambio de temperatura, consecuencia de esta cada. Esto del azar es un poco relativo, porque, como deca Claude Bernard, el eminente investigador del siglo XIX: quien no sabe lo que busca, no comprender lo que encuentra. Esto es importante porque si alguna vez encaramos una investigacin, no es raro que resolvamos el problema central o algn problema secundario en forma aleatoria, pero sabremos interpretarlos porque tenemos en mente una investigacin planificada en la cual sabemos lo que buscamos. En otro ejemplo menos cientfico, puede ocurrir que mientras investigamos dnde perdimos los documentos, nos sentamos a pensar y advertimos que lo hemos hecho encima de ellos: intentamos una resolucin planificada, pero desembocamos -por azar- en una resolucin aleatoria. Del mismo modo, la investigacin incluye modos inmediatos y modos rutinarios de resolucin de problemas. Mientras un cientfico investiga, resuelve en forma inmediata el problema de ponerse los anteojos, y resuelve en forma rutinaria muchas de sus actividades, como por ejemplo resolver mediante un algoritmo matemtico el nivel de significacin estadstico para los resultados de un experimento, tanto que incluso deja que se encargue de la tarea una computadora. 4) Finalidad.- La definicin, por ltimo, hace alusin a una finalidad. Toda investigacin es una actividad humana intencional, y persigue siempre un propsito especfico, ms all del fin genrico que es resolver un problema. La diversidad de finalidades es lo que nos dar la diversidad de investigaciones, es decir, los diferentes tipos de investigacin. Veamos algunos ejemplos.

2. TIPOS DE INVESTIGACIN
La cantidad de tipos de investigacin que se pueden hacer es prcticamente infinita. Vamos a recorrer solamente algunos ejemplos representativos. 1) La investigacin cotidiana.- La investigacin es un proceso que se infiltra e muchas de nuestras actividades diarias: investigamos cuando estudiamos, cuando jugamos, cuando aprendemos algo, cuando vamos a un boliche bailable a 'investigar', cuando 'investigamos' al vecino, etc. La investigacin es una actividad que suele infiltrarse dentro de otras actividades. Por lo tanto, no se necesita ser un cientfico para ser un investigador.

Pgina 90 de 331

91
Las investigaciones cotidianas son aquellas que realizamos todos los das, y en este sentido amplio, todos somos investigadores. Si yo llego a mi casa y me encuentro con que perd los documentos, voy a iniciar una investigacin para encontrarlos. Estn aqu todos los elementos de una investigacin: hay un problema (perd los documentos), hay una finalidad (quiero encontrarlos) y hay un intento por solucionar el problema en forma planificada: empiezo a averiguar en todos los lugares donde estuve, pregunto por telfono, dejo dicho que si los encuentran me avisen, etc, etc. 2) La investigacin infantil.- No se trata de la investigacin que podemos hacer nosotros como psiclogos 'sobre' el nio, sino de las investigaciones hechas 'por' el nio cuando indaga la realidad para satisfacer su natural curiosidad o para adaptarse mejor a ella. El nio es, no cabe duda, un investigador nato, y esto ya lo destacaron pensadores como Piaget y Freud. Para Piaget el nio es un verdadero investigador de la realidad: ya desde muy pequeo debe enfrentar problemas, los intenta resolver y lo hace en forma planificada con un fin: la adaptacin. No es la planificacin de un adulto, pero es tambin planificacin porque el nio, a su manera y en su nivel, tambin se organiza y al mismo tiempo gracias a ello tambin va organizando su actividad del mundo y su conocimiento de ste. Freud tambin habla de los nios investigadores al hablar de la 'investigacin sexual infantil', es decir, cuando indagan su sexualidad elaborando y poniendo a prueba sus teoras sexuales infantiles. Freud no dice 'creencias infantiles' sino 'teoras infantiles'. Si el nio tuviese simplemente creencias, creera dogmticamente en ellas y por tanto ni se preocupara por iniciar una investigacin. Lo que el nio arma son teoras, es decir, hiptesis, suposiciones y, como tales, se preocupar por ponerlas a prueba. Por ejemplo, no acepta sin ms la teora de la castracin: necesita verificarla, por ejemplo, espiando a la hermanita a ver si es cierto que a las mujeres le cortaron el pito o no. Esto implica hacer una investigacin. Desde ya, un nio de cinco aos no necesita dominar el pensamiento hipottico-deductivo del que habla Piaget para hacer investigaciones: ni sus hiptesis ni sus procedimientos para verificarla estn tan formalizados como en el adolescente, pero esto no le impide investigar y considerar a sus ideas como entidades que han de ser comprobadas en la realidad. 3) Otros tipos de investigacin.- Encontramos tambin investigaciones periodsticas (donde el problema puede residir en averiguar qu individuos se dedican a la corrupcin en el gobierno), investigaciones administrativas (donde el problema puede residir en averiguar qu funcionario fue el responsable de tal o cual acto administrativo), investigaciones criminales (como averiguar quin es el asesino), investigaciones judiciales (como resolver la imputabilidad o no de un acusado en el fuero penal, o la magnitud de la pena, etc.), investigaciones de mercado (el llamado 'marketing', para detectar perfiles de clientes potenciales), investigaciones literarias, filosficas, cientficas, etc. Desde ya, el hecho de llamar 'investigaciones' a tanta diversidad de actividades humanas obedece a que tienen ciertos caracteres en comn, caracteres que hemos resumido en nuestra definicin general. Por algo Irving Copi (1974:493) traza una interesante analoga entre la investigacin cientfica y la investigacin policial que llev a cabo Sherlock Holmes en uno de los cuentos de Conan Doyle. Y por algo Sigmund Freud traza tambin un paralelismo entre la investigacin analtica y la investigacin judicial (Freud S, 1906).

3. LA INVESTIGACIN CIENTFICA
Este tipo de investigacin debe definrsela por su finalidad y por su mtodo al mismo tiempo: la investigacin cientfica se caracteriza por buscar un conocimiento cada vez ms general, amplio y profundo de la realidad aplicando el llamado mtodo cientfico. Este ltimo se caracteriza porque es fctico, trasciende los hechos, se atiene a reglas, utiliza la verificacin emprica, es autocorrectivo y progresivo, presenta formulaciones generales, y es objetivo (Ander-Egg E, 1987:43). El producto final de la aplicacin del mtodo cientfico es la ciencia, definida como un conjunto de conocimientos racionales, ciertos o probables, que obtenidos de manera metdica y verificados en su contrastacin con la realidad se sistematizan orgnicamente haciendo referencia a objetos de una misma naturaleza, cuyos contenidos son susceptibles de ser transmitidos (Ander-Egg E, 1987:33). En suma, la investigacin cientfica es un procedimiento reflexivo, sistemtico, controlado y crtico que tiene por finalidad descubrir o interpretar los hechos y los fenmenos, relaciones y leyes de un determinado mbito de la realidad (Ander-Egg E, 1987:57).
Es habitual definir la investigacin cientfica como el motor de la ciencia, el seudpodo que extiende el conocimiento hacia regiones desconocidas, o, menos metafricamente, que es el procedimiento por el cual planteamos y verificamos hiptesis y teoras para que luego, los profesionales puedan aplicarlas exitosamente con una finalidad prctica, y los docentes difundirla a las nuevas generaciones. Sin embargo, las cosas no son tan ideales. Preferimos decir que el conocimiento cientfico no es de ninguna manera el mejor conocimiento, ni an tampoco el que ha tenido mayores xitos en cuanto a resultados prcticos se refiere. Por ejemplo: a) muchos procedimientos teraputicos no mejoraron y an empeoraron a los pacientes; b) muchos procedimientos no cientficos practicados por curanderos han demostrado ser ms eficaces. Como dice Feyerabend, "actualmente la ciencia no es superior a otras ideologas gracias a sus mritos, sino porque el show est montado a su favor".

Pgina 91 de 331

92
Muchas publicaciones cientficas forman parte de ese show, en la medida en que tienden a hipervalorar los procedimientos de investigacin cientfica de la psicologa, rescatando en ellos su ajuste a los canones de cientificidad consensualmente reconocidos. Sin embargo, procuramos tambin no mostrar el mtodo cientfico ni como infalible ni como el nico posible, como as tampoco afirmamos sin ms, en el otro extremo, que la ciencia es deleznable. En lugar de ello, intentamos describir y comprender la principal herramienta del investigador, llamada 'mtodo cientfico', hurgando al mismo tiempo en sus limitaciones y en sus posibilidades.

Etapas.- No siempre los tratadistas del mtodo cientfico siguen el mismo orden en sus etapas, por lo cual hay diversidad de esquemas. Casi la totalidad estn de acuerdo en tres pasos fundamentales: tema, problema, metodologa (Kerlinger, Ander Egg, Vandalen y Meyer, Morales, Arias G. Mc Guigan, Castro, Ackoff, Garza, Pozas, Brons, Galtung, Tamayo y Tamayo, Asti, Vera, Parinas, entre otros). Entre los ms conocidos tenemos (Tamayo, 1999:170):
Esquema Ackoff a) Planteamiento del problema. b) Marco terico. c) Hiptesis. d) Diseo. e) Procedimiento de muestreo. a) Planteamiento de la investigacin. b) Recoleccin de datos. a) Planteamiento. b) Levantamiento de datos. f) Tcnica y obtencin de datos. g) Gua de trabajo. h) Anlisis de los resultados. i) Interpretacin de los resultados. j) Publicacin de los resultados. c) Elaboracin de los datos. d) Anlisis. c) Elaboracin. d) Anlisis.

Esquema Pozas Esquema Vzquez-Rivas Esquema Pardinas

Esquema de Brons

Esquema Tamayo

a) Teora. f) Realizacin del diseo de prueba. b) Observacin. g) Conclusiones. c) Problema. h) Bibliografa. d) Hiptesis. i) Notas. e) Diseo de prueba. j) Cuadros y tablas. a) Especificacin, delimitacin y definicin del problema. b) Formulacin de la hiptesis. c) Toma, organizacin, tratamiento y anlisis de los datos. d) Conclusiones. e) Confirmacin o rechazo de los hijos. f) Presentacin del informe. a) Eleccin del tema (planteamiento inicial). b) Formulacin de objetivos (generales, especficos) c) Delimitacin del tema (alcances y lmites, recursos). d) Planteamiento del problema (descripcin, elementos, formulacin). e) Marco terico (antecedentes, definicin de trminos bsicos, formulacin de hiptesis, operacionalizacin de variables). f) Metodologa (poblacin y muestra, recoleccin de datos, procesamiento de datos, codificacin y tabulacin). g) Anlisis de la informacin y conclusiones. h) Presentacin del informe de investigacin.

Sea cual fuere la secuencia de pasos del mtodo cientfico, el xito de cualquier empresa cientfica depende de tres elementos: una clara identificacin de los objetos a investigar, una teora imaginativa que explique cmo se relacionan, y una idea precisa de los problemas concretos vinculados con la evidencia y las pruebas ms adecuadas al tema de estudio (Lazarsfeld, 1984:11).

4. EL MTODO EN LA INVESTIGACIN CIENTFICA


En ciertas ocasiones y en el contexto de la actividad cientfica en sentido amplio (investigacin, ejercicio profesional, etc.) resulta importante distinguir mtodos de tcnicas en trminos de la siguiente convencin: mtodos son procedimientos generales y tcnicas son procedimientos especficos aplicados en el marco de un mtodo. Pocas palabras se utilizan de una forma tan diversa y generalizada como 'mtodo' y 'tcnica'. Generalizada porque se emplean en todas las artes y todas las ciencias, y diversa porque suelen adjudicrseles significados diferentes. Suelen ser adems vocablos que se utilizan sin ser definidos explcitamente, de la misma manera que no nos sentimos obligados a definir la palabra 'ventilador' cuando hablamos de los ventiladores. Hemos de reconocer que muchas veces no es necesario definir los trminos 'mtodo' y 'tcnica' cuando los empleamos en la vida cotidiana, en las artes o en la ciencia, pero puede resultar importante especificar sus respectivos significados en aquellas ocasiones en las cuales: a) se utilicen ambos trminos para describir procedimientos en el contexto de la actividad cientfica; b) se utilicen ambos trminos con sentidos diferentes; y c) cuando sea necesario diferenciarlos si con ello se clarifican aquellos procedimientos. Por empezar, convengamos en que tanto el mtodo como la tcnica se refieren a procedimientos para hacer o lograr algo, es decir, son medios orientados hacia un fin. Tal es el sentido que recogen las definiciones lexicogrficas a partir de los usos ms habituales: "tcnica es un conjunto de procedimientos

Pgina 92 de 331

93
de un arte o ciencia"; "mtodo es el orden que se sigue en las ciencias para investigar y ensear la verdad" (Diccionario Aristos, 1968). Vamos ahora a la diferencia bsica entre mtodo y tcnica: un mtodo es un procedimiento general orientado hacia un fin, mientras que las tcnicas son diferentes maneras de aplicar el mtodo y, por lo tanto, es un procedimiento ms especfico que un mtodo. Por ejemplo: hay un mtodo general para asar la carne, aunque pueden usarse diferentes tcnicas: a la parrilla, al horno, a la cacerola, con un horno de microondas, etc. Esta distincin entre mtodo y tcnica como procedimiento general y especfico respectivamente, es la ms aceptada y reconocida dentro de la comunidad cientfica. Greenwood seala, por ejemplo, al hablar de mtodos y tcnicas de investigacin, que "un mtodo puede definirse como un arreglo ordenado, un plan general, una manera de emprender sistemticamente el estudio de los fenmenos de una cierta disciplina. Una tcnica, por el contrario, es la aplicacin especfica del mtodo y la forma especfica en que tal mtodo se ejecuta" (Greenwood, 1973:106). Greenwood hace una analoga diciendo que el mtodo es a la tcnica como la estrategia a la tctica, es decir, la tcnica est subordinada al mtodo: es un auxiliar de ste. Bunge sigue la misma orientacin para distinguir mtodo de tcnica, cuando seala por ejemplo que "la ciencia es metodolgicamente una a pesar de la pluralidad de sus objetos y de las tcnicas correspondientes" (Bunge, 1969:36), o que "la diversidad de las ciencias est de manifiesto en cuanto atendemos a sus objetos y sus tcnicas; y se disipa en cuanto se llega al mtodo general que subyace a aquellas tcnicas" (Bunge, 1969:38). El mismo autor (1969:24) distingue mtodos generales y mtodos especiales, y tiende a reservar el nombre de tcnicas en relacin con estos ltimos destacando, de esta forma, el carcter de especificidad de la tcnica en relacin al mtodo. En suma, para Bunge: "el mtodo cientfico es la estrategia de la investigacin cientfica: afecta a todo el ciclo completo de investigacin y es independiente del tema en estudio. Pero, por otro lado, la ejecucin concreta de cada una de esas operaciones estratgicas depender del tema en estudio y del estado de nuestro conocimiento respecto a dicho tema. As, por ejemplo, la determinacin de la solubilidad de una sustancia dada en el agua exige una tcnica esencialmente diversa de la que se necesita para descubrir el grado de afinidad entre dos especies biolgicas" (Bunge, 1969:31). Por tanto, si hemos de respetar la convencin precedente, resultar correcto decir "utilic esta tcnica para aplicar este mtodo", y resultar incorrecto decir "utilic este mtodo para aplicar esta tcnica" (an cuando en esta ltima expresin se entienda mtodo como un conjunto de pasos para aplicar la tcnica). Veamos algunos ejemplos donde cabe hacer distinciones entre mtodo y tcnica: Ejemplo 1: psicoterapia.- Hay un mtodo general para curar a un paciente: escuchar su problema, intervenir teraputicamente, verificar la cura, etc. A partir de este procedimiento genrico, cada terapeuta instrumentar diferentes tcnicas (las que dependeran del marco terico que utilice, de sus preferencias personales, de su adecuacin al paciente y al problema, etc.). Por ejemplo la tcnica de la prescripcin del sntoma, la tcnica de la asociacin libre, la tcnica de la desensibilizacin sistemtica, la tcnica Phillips 66 para terapia grupal, la tcnica de la interpretacin onrica, la hipnosis, etc. Ejemplo 2: matemticas.- Hay un mtodo general para realizar una operacin de suma, que bsicamente consiste en relacionar dos o ms elementos llamados sumandos y generar un tercero llamado resultado. Para ello pueden utilizarse diferentes procedimientos llamados tcnicas: sumar mentalmente, sumar con una calculadora, sumar con los dedos, sumar con un baco, etc., y hasta pedirle a otra persona que haga la suma por uno. Suelen denominarse algoritmos a cada una de estas formas diferentes de realizar un clculo. Ejemplo 3: metodologa de la investigacin.- Dentro del mtodo general de recoleccin de datos, se pueden utilizar diferentes tcnicas: la entrevista, el cuestionario, el test, la observacin, etc. Tambin, dentro del mtodo de muestreo hay diferentes tcnicas: el muestro estratificado, el muestreo por conglomerados, etc. Ejemplo 4: ciencias naturales.- En astronoma, dentro del mtodo general de observacin de los astros, se pueden implementar diferentes tcnicas: utilizar un telescopio reflector, un radiotelescopio, etc. En biologa, dentro del mtodo general de observacin microscpica, puede usarse la tcnica del microscopio ptico, la del microscopio electrnico, etc. As como dentro de un mismo mtodo se pueden usar tcnicas diferentes, tambin dentro de diferentes mtodos se pueden usar las mismas tcnicas. Por ejemplo, la tcnica de los tests se puede usar dentro de un mtodo para diagnosticar (en la clnica) o en el contexto de un mtodo para verificar una hiptesis (en la investigacin). De la misma manera, la tcnica del horno de microondas puede ser utilizada dentro del mtodo general para asar carne, o tambin dentro del mtodo general para llevarle la contra a mi suegra (por cuanto a ella no le gusta que la comida se haga en esa clase de artefactos). Una tcnica inadecuada puede arruinar un buen mtodo, y, alternativamente, un mal mtodo puede echar a perder una buena tcnica. Por ejemplo, la observacin participante es una buena tcnica, pero si con ella se procurar verificar experimentalmente una hiptesis, se arruina el mtodo experimental y se desaprovecha la tcnica El fin de la tcnica debe ser congruente con el fin del mtodo dentro del cual se utiliza. Esta ltima cuestin tiene relacin con la eficiencia y la eficacia de la tcnica. Decimos que alguien es eficiente cuando hace bien las cosas, y que es eficaz cuando consigue lo que se propone, es decir, la eficiencia tiene que ver con los medios, y la eficacia con los fines. Considerando estas diferencias, podemos decir que tanto los mtodos como las tcnicas pueden ser eficientes y eficaces: eficientes si estn bien aplicados, y eficaces si alcanzan el fin que se propusieron. Como hemos dicho antes, una tcnica puede ser
Pgina 93 de 331

94
eficiente pero no eficaz, es decir, puede estar bien usada pero ser irrelevante respecto del fin general del mtodo donde est inscripta. Por ltimo, resulta importante destacar que si el mtodo alude a un procedimiento general y la tcnica a uno especfico, forzosamente habrn de ser trminos relativos. Por ejemplo, un mismo procedimiento podr ser considerado general en relacin a otro ms especfico, o viceversa. As, la hipnosis es una tcnica si lo inscribimos dentro del mtodo teraputico, pero ser un mtodo si intentamos discriminar diferentes formas de hipnotizar (con la mano, con un objeto pendular, con un casete subliminal, etc.) las que, entonces, habremos de considerar tcnicas. De la misma forma, la tcnica del microscopio ptico es tal en relacin al mtodo general de observacin de clulas, pero es un mtodo en relacin con las diferentes maneras de implementarlo: la tcnica de la hematoxilina-eosina, etc.

5. EL ENCUADRE EN LA INVESTIGACIN CIENTFICA


Entre otras funciones, el encuadre es un sistema de reglas que nos suministra, tanto en la clnica como en la investigacin, un teln de fondo fijo o constante que nos permite detectar con facilidad las posibles variaciones en aquellos aspectos de la situacin que pueden interesarnos. Una mosca viajera.- Dnde podemos detectar mejor una mosca caminando? Cundo camina sobre una pantalla donde estn proyectando una pelcula, o cuando camina sobre un cuadro colgado de la pared? Evidentemente podremos ver con mayor facilidad el desplazamiento de la mosca sobre un cuadro porque ste, al ser esttico, permite visualizar ms fcilmente cualquier cosa que se mueva. En una pantalla, en cambio, el movimiento de las imgenes nos dificulta ver el movimiento de la mosca, porque... todo se est moviendo. Hasta aqu, podemos ir sacando la siguiente conclusin: si yo quiero detectar variaciones (como el desplazamiento de una mosca), tengo que contar con un fondo fijo y constante (como por ejemplo un cuadro), es decir, tengo que hacer un 'encuadre' (poner en un cuadro). En las situaciones clnicas e investigativas trabajamos con variables, es decir, con atributos del sujeto que se supone que variarn. Y para detectar esas variaciones de las variables deber armar un fondo de constancia y fijeza, llamado encuadre. Se trata de una de las funciones del encuadre, y para comprenderla mejor veamos algunos ejemplos. Encuadre psicoteraputico.- Imaginemos que con nuestro paciente no establecemos ningn encuadre definido: quedamos en que l puede venir cuando se le antoja, a la hora que quiera, nosotros podemos o no atenderlo ese da segn nuestras ganas, pudindolo hacer en la cocina o en el garaje. Y encima de todo, nuestro paciente puede pagarnos lo que l quiera y cuando quiera. Tampoco establecemos las reglas de juego dentro de la sesin: si quiere asociar libremente que lo haga, y si no, no. Por nuestra parte, mientras tanto tenemos derecho a hacernos una siesta o mirar el programa de Tinelli por la televisin. En este contexto no podemos evaluar, por ejemplo, variables importantes como son las resistencias o las transferencias del paciente. No podremos saber si lleg tarde porque no hay encuadre o porque tiene resistencias, como as tambin ser difcil saber si nuestra paciente se quita la blusa en nuestra cocina por una falta de encuadre o por una intensificacin de la transferencia positiva, otra variable indispensable en el tratamiento analtico. En cambio, procedamos ahora a establecer un encuadre: fijamos reglas como horarios definidos, comportamientos en la sesin, honorarios, etc. Cuando todo esto se mantiene constante o fijo, cualquier variacin en la resistencia o en la transferencia ser inmediatamente detectada. Por ejemplo, si tras haber fijado un encuadre determinado, la paciente se quita la blusa, es decir, no respeta cierta regla del encuadre, entonces no habremos de pensar que falta un encuadre, sino que la transferencia positiva se ha manifestado. En cuanto a las resistencias, una medida de esta puede darla la magnitud de las violaciones al encuadre: y si no hay encuadre, resultar ms difcil evaluar la resistencia. O para decirlo en otras palabras: si no creamos como fondo un marco de conductas esperables, nos resultar ms difcil identificar conductas inesperadas o llamativas, y es as que un psictico puede pasar mucho ms desapercibido en una murga que en un grupo de estudio, donde el encuadre es menos flexible o permisivo.
El encuadre en psicoanlisis.- Seala Freud en la Conferencia 28, que la cura analtica impone al mdico y enfermo un difcil trabajo que es preciso realizar para cancelar unas resistencias internas. Pero este trabajo al que Freud se refiere, para ser fructfero, debe realizarse bajo determinados condiciones, que implican obligaciones que debe cumplir el analista (abstinencia, etc.), el paciente (asociar libremente, etc.) y ambos en un contrato que establece tiempo, honorarios, cantidad de sesiones, y que contribuyen a garantizar que dicho trabajo se realizar sin mayores obstculos. Un ejemplo de situacin que puede amenazar este encuadre pactado entre paciente y analista es la intromisin de la familia del primero. Freud, en la Conferencia 28 ms adelante, ofrece un ejemplo de una mujer a quien tuvo ocasin de tratar, pero el encuadre fue afectado por la intromisin de su madre, y el tratamiento no pudo proseguir: la madre tom rpidamente su decisin: puso fin al daino tratamiento. Esto viola el encuadre porque la paciente ya no est en condiciones de pactar libremente con el analista un conjunto de obligaciones que son las que permitirn el anlisis.

Pgina 94 de 331

95
Otros ejemplos los suministra Freud en sus artculos sobre la transferencia, donde la paciente se enamora del analista y, lejos de interpretarse esta situacin como transferencial, analista y paciente se convierten en amantes violando el primero la regla de la abstinencia, una de las reglas del encuadre. Dentro del encuadre est contemplado por ejemplo el tiempo y el dinero. Indica Freud que debe darse al paciente una hora determinada, que le pertenece por completo, y paga por ella aunque no la use. De otro modo puede empezar a aprovechar para faltar, lo cual pone de manifiesto la importancia del encuadre para el tratamiento. Slo en casos extremos, como alguna enfermedad orgnica, podemos suspender momentneamente esta regla. En casos leves pueden bastar tres horas semanales: si son ms espaciadas cuesta ms seguir la vida actual del paciente, con riesgo para la cura, lo cual destaca nuevamente la importancia del encuadre para el tratamiento. El encuadre tambin debe incluir honorarios. Freud reconoce haber hecho tratamientos gratuitos con el fin de eliminar toda fuente de resistencia, pero tal actitud no fue beneficiosa, pues la gratuidad intensifica mucho algunas resistencias del neurtico: en las mujeres, por ejemplo la tentacin implicada en la transferencia, y en hombres jvenes, la rebelda contra el deber de gratitud, vinculada al complejo del padre. La ausencia de honorarios hace perder la relacin entre mdico y paciente todo carcter oral, quedando ste privado de un motivo principal para la cura. El tratamiento analtico moviliza la energa preparada para la transferencia para luchar contra las resistencias, y muestra al paciente los caminos para canalizarla. Un encuadre adecuado permite cumplir con estas tareas.

En el caso de investigaciones que indagan la eficacia de tratamientos, est descontada entonces la importancia de fijar un mismo encuadre en todos los casos, para que influyan lo menos posibles las variables extraas ajenas al tratamiento. Encuadre experimental.- El experimento es un procedimiento incluido en las investigaciones cientficas tpicas. Aunque no es tan habitual denominarlo encuadre, tambin en una situacin experimental existe la necesidad de crear un teln de fondo constante para poder identificar, por contraste, la variacin de las variables. O'neil ha definido un experimento como un modelo particular de variacin y constancia con lo cual quera decir que un experimento consiste en hacer variar una variable para ver como vara otra, pero manteniendo todos los dems factores constantes. Si quiero saber si influye o no la msica funcional sobre el rendimiento de los empleados, har variar la variable msica funcional y ver si hay una variacin concomitante en los rendimientos, pero para ello tuve que mantener constantes otras variables que podran tambin haber influido en el rendimiento, como el salario. Si en el medio del experimento aumento todos los sueldos, no podr saber si la variacin en los rendimientos obedece al salario o al cambio en la msica funcional. Encuadre psicodiagnstico.- Otro ejemplo de encuadre en el contexto de la metodologa de la investigacin es el referido al empleo de los instrumentos de medicin. La toma de un test puede realizarse con fines clnicos, laborales, forenses, etc., pero tambin con fines de investigacin del test mismo, como por ejemplo cuando la prueba en cuestin est recin inventada y atraviesa an un periodo de prueba donde constataremos su validez y su confiabilidad. Puede tambin servir a fines puramente estadsticos, como cuando queremos determinar la media de cociente intelectual de una poblacin dada, o a fines de investigacin pura, como cuando queremos verificar la hiptesis segn la cual los tiempos de reaccin a una consigna son directamente proporcionales a la ansiedad, con el fin de obtener una ley general del funcionamiento psquico. En cualquiera de los casos indicados es preciso tambin un encuadre. Por ejemplo, forma parte del encuadre la manera de administrar la consigna, que debe ser siempre la misma. No es lo mismo decir "dibuje SU familia" a decir "dibuje UNA familia", o a decir "Dibuje su familia haciendo algo". Si a todas las personas a quienes le tomo el mismo test le administro consignas diferentes, no podr contar con un mismo patrn para comparar sus respectivas respuestas. Una misma consigna para todos permite, en efecto, asegurarnos de que las variaciones en las respuestas respondern a variaciones individuales de los sujetos, y no a variaciones en las consignas. Porqu? Porque lo que nos interesa es precisamente la variabilidad individual, es decir, aquello que es propio de cada persona. Tambin forma parte del encuadre del proceso psicodiagnstico el comportamiento del psiclogo durante la toma. Si en el medio de una administracin yo empiezo a comportarme en forma rgida y autoritaria o de manera excesivamente permisiva y familiar, no sabr si las nuevas respuestas del sujeto derivan de su peculiar funcionamiento psquico frente a las consignas de los tests, o de mis nuevos comportamientos. Desde ya, yo puedo inventar un nuevo encuadre donde en el medio de la toma cambio ex profeso mi comportamiento, pero en este caso deber aplicar el mismo encuadre en todas las tomas y recin entonces podr comparar, sobre este fondo constante, la variabilidad inter- individual. Otras funciones del encuadre.- Siempre nos manejamos con encuadres, an en la vida cotidiana: este encuadre son las reglas de convivencia. Es esperable que cuando llamamos por telfono a alguien nos diga "Hola", y es esperable que cuando dos personas se presentan se extiendan la mano. En este marco de conductas predecibles, cualquier anomala, cualquier variacin ser inmediatamente detectada, cosa que no sucede cuando no hay reglas y cualquier cosa puede esperarse de cualquiera en cualquier momento. En estos casos, las funciones del encuadre social son variadas: puede servir para regular y tornar predecible el comportamiento ajeno ("no tengo que temer al otro si me acerco a saludarlo, pues estoy casi

Pgina 95 de 331

96
seguro que responder mi saludo amistosamente"), para identificarse con un grupo de pertenencia ("Yo te saludo dndote la mano porque somos de la misma cultura"), etc., etc. Pero fuera de estos encuadres socialmente instituidos, hemos mencionado otros encuadres ad hoc (o sea, construidos especialmente para ciertas situaciones especiales), como el teraputico y el psicodiagnstico. Tales encuadres suelen tener adems otras funciones, entre las cuales podemos citar dos como ejemplo. Una primera funcin del encuadre es la de proveer un marco disciplinario que otorgue seriedad y obligue a un compromiso con la tarea. Si decimos a un paciente que venga cuando quiera, la tarea teraputica puede perder importancia a su consideracin, es decir, puede pensar que la cura es una joda. Otras veces un encuadre, y sobre todo si es menos flexible, servir como metamensaje para aquellos pacientes que no les gusta someterse a ninguna disciplina y que necesitan alguien que les ponga lmites, o para aquellos otros que consideran que pueden controlar el tratamiento introduciendo las variaciones que se les antoje en las reglas del encuadre. Una segunda funcin es el hecho de que un encuadre contribuye a que tanto paciente como terapeuta puedan organizarse la vida racionalmente. En general, todas nuestras actividades cotidianas estn regladas en cuanto a horarios, das, etc. an las que pueden parecer ms espontneas como la planificacin del tiempo libre. Si no establecemos ningn encuadre en un tratamiento y nuestro paciente puede venir cuando se le antoja, deberemos estar todo el da esperando al paciente por las dudas que se le ocurra aparecer, y mientras tanto nosotros no podremos hacer ninguna otra actividad. O bien si la hacemos, el paciente nunca estar seguro de encontrarnos cuando venga a visitarnos.

6. LA FORMACIN DEL INVESTIGADOR CIENTFICO


La actividad cientfica es una empresa que tiene tres protagonistas principales: el investigador, el docente y el profesional. Mientras el primero desarrolla hiptesis, las pone a prueba y construye teoras, el docente transmite este conocimiento a los futuros profesionales, quienes lo aplicarn con un fin prctico. Existen carreras para ser profesional (todas las carreras de grado como Medicina, Psicologa, Ingeniera, Derecho, Agronoma, etc.). Existen tambin carreras para ser Profesor (los Profesorados), pero no han sido desarrolladas con la misma atencin y dedicacin las carreras para ser Investigador. Conviene hacer una diferencia entre una carrera, o una maestra de Investigador Cientfico y un Doctorado, tal como estos ltimos se implementan en las Universidades, habida cuenta que en estos ltimos existen asignaturas vinculadas con la Metodologa de la Investigacin, y hay adems que presentar un trabajo de investigacin como tesis. 1) Un Doctorado incluye asignaturas propias de la carrera de origen, y por lo tanto todos los alumnos estn graduados en la misma disciplina. En cambio, en una maestra de Investigador Cientfico todas las asignaturas estn relacionadas con la investigacin, sea cual fuere esta, y por lo tanto ser posible encontrar entre sus alumnos una diversidad de profesiones distintas o diferentes intereses disciplinares. 2) En un Doctorado suele no privilegiarse la enseanza prctica de la investigacin. Para hacer la tesis, los alumnos deben recurrir o bien a terceros, o bien a un padrino de tesis que tenga la buena voluntad de asistirlo. En cambio, en una carrera de investigador cientfico el objetivo fundamental es formar investigadores, sea cual fuese la disciplina que dominen, y, en ltima instancia, profesionalizar esta actividad. Los docentes comparten as ms la responsabilidad de la formacin de sus alumnos, los futuros investigadores. La Maestra de Investigacin Cientfica que proponemos puede cumplirse en dos aos, con un ttulo intermedio de Auxiliar en Investigacin Cientfico al ao, y de Investigador Cientfico al finalizar los estudios. Como requisitos de ingreso, puede considerarse la posibilidad de tomar dos exmenes, donde se evaluarn: a) Conocimientos de computacin (Entorno Windows, Aplicaciones Word, Access y Excel o equivalentes, y bsqueda bibliogrfica va Internet). Quienes no dominen estos temas, pueden cursar una asignatura de Informtica antes del comienzo del ao lectivo de la carrera o al menos durante el primer ao de la misma. b) Formacin intelectual: no son pruebas psicomtricas en el sentido tradicional, donde se evale el cociente intelectual, ni tampoco un examen de conocimientos generales, sino pruebas de manejo de situaciones e ideas. Generalmente, quienes ms posibilidades tienen de pasar esta prueba son aquellos que tienen un ttulo de grado, es decir, una formacin cientfica previa. No se trata, entonces, de un examen para el cual haya que 'prepararse' en base a un programa, ya que lo que evala es la educacin del pensamiento gestada a lo largo de los aos, incluso desde la infancia y la adolescencia. El principal objetivo de esta evaluacin es averiguar si la persona tiene dotes naturales mnimas para la investigacin: curiosidad, espritu crtico, disciplina intelectual, creatividad, disposicin para incorporar nuevas maneras de pensar, etc. Exponemos seguidamente los lineamientos generales de un proyecto de Plan de Estudios para una Maestra de Investigador Cientfico, que contempla una duracin de dos aos y la posibilidad de obtener un ttulo intermedio de Auxiliar. La inquietud apunta a la posibilidad de profesionalizar una actividad que, hoy por hoy, suele ejercerse a fuerza de experiencia, intuicin y autoaprendizaje. En el siguiente recuadro se indica un sistema tentativo de materias, distribuidas en cuatro cuatrimestres. A continuacin, damos algunas especificaciones sobre sus contenidos.

Pgina 96 de 331

97
MAESTRIA EN INVESTIGACION CIENTIFICA: ASIGNATURAS PRIMER CUATRIMESTRE Introduccin a la Investigacin Cientfica Investigacin Bibliogrfica Estadstica Descriptiva SEGUNDO CUATRIMESTRE Investigacin Emprica I (Campo) Estadstica Inferencial Teora de la Medicin TERCER CUATRIMESTRE Investigacin Emprica II (Experimental) Investigacin Terica Modelos Elucidatorios y Heursticos CUARTO CUATRIMESTRE Modelos Formales Corrientes Epistemolgicas Historia de la Investigacin cientfica

a) Introduccin a la Investigacin Cientfica: Asignatura que presenta e introduce en el plan de estudios de la maestra, explicando los lineamientos generales de la investigacin. La materia intentara resumir todo lo que se ver en los dos aos, para que el alumno pueda tener una visin global de los temas que ir viendo despus. b) Investigacin Bibliogrfica: Habitualmente, toda investigacin comienza con una bsqueda bibliogrfica de informacin sobre el tema que se quiere investigar ('review'), lo que incluye no solamente buscar y seleccionar ideas de otros pensadores, sino tambin las propias. A partir de esta investigacin bibliogrfica, la indagacin podr continuar con una investigacin terica, con una investigacin emprica de campo o con una investigacin emprica experimental, tres posibilidades contempladas en asignaturas subsiguientes. c) Investigacin Emprica I (Campo): Paralelamente a la explicacin de conceptos tericos (problema, hiptesis, ley, teora) y de conceptos bsicos sobre investigacin de campo, los alumnos llevarn a cabo bajo supervisin docente un trabajo de investigacin de campo. d) Investigacin Emprica II (Experimental): Junto al desarrollo de conceptos tericos (explicacin, prediccin, accin tecnolgica, observacin, teora del diseo experimental, inferencia cientfica), los alumnos realizarn una investigacin experimental bajo supervisin docente. Los conceptos tericos indicados para esta asignatura y para la anterior no necesariamente tienen relacin con las investigaciones experimentales o de campo, respectivamente. Mas bien los hemos distribuido en ambas materias porque todos ellos no pueden ser vistos en una sola. Los conceptos seleccionados siguieron el plan del texto de M. Bunge, "La investigacin cientfica: su estrategia y su filosofa" (Barcelona, Ariel, 1971). Esta obra est diseada para cursos, e incluye un panorama muy completo de la investigacin cientfica, por lo que puede servir como bibliografa de referencia bsica a lo largo de toda la carrera. Incluye tambin ms de 500 problemas para resolver como prctica. e) Investigacin terica: Mientras la investigacin emprica confronta ideas con la realidad, la investigacin terica confronta ideas entre s en un nivel de abstraccin mayor. En esta asignatura puede tambin incluirse la cuestin acerca de cmo organizar y redactar un informe o un artculo cientfico (temtica que tambin se aplica en relacin con las investigaciones bibliogrficas y empricas). f) Corrientes Epistemolgicas: Abarca la historia de la epistemologa desde los Segundos Analticos del Organon aristotlico, hasta un anlisis detallado de las corrientes contemporneas: Husserl, Bachelard, Piaget, Hempel, Carnap, Reichenbach, Popper, Feyerabend, Lakatos, Kuhn, etc. Como bibliografa de referencia puede utilizarse: Losee J., "Introduccin histrica a la filosofa de la ciencia", Madrid, Alianza, 1972, as como textos clsicos: los "Segundos Analticos" del "Organon" de Aristteles, Kuhn T., "La estructura de las revoluciones cientficas", Feyerabend P., "Tratado contra el mtodo", Bachelard G., "La formacin del espritu cientfico", "Popper K., "La lgica de la investigacin cientfica" y "El desarrollo del conocimiento cientfico", etc. g) Teora de la medicin: Tomando como referencia los niveles de medicin de Stevens (1948), esta asignatura explica qu significa medir, qu es un instrumento de medicin y cules son sus diferencias y semejanzas con un instrumento de observacin; los requisitos de tales instrumentos, tales como la validez y la confiabilidad; y una explicacin detallada de las propiedades matemticas de cada nivel de medicin. Asimismo, se podrn examinar los problemas particulares de medicin que presenta cada tipo de ciencia. h) Modelos Elucidatorios y Heursticos: Los modelos elucidatorios proveen un marco para aprender a definir. Ellos son, por ejemplo, el fenomenolgico, basado en la epistemologa husserliana, y el emprico, basado en la epistemologa neopositivista. Los modelos heursticos proveen marcos de referencia para el desarrollo de la creatividad, como por ejemplo los modelos estructural, dialctico, hermenutico, y los modelos visuales analgicos (simulacin computarizada, etc). Los modelos elucidatorios detienen el pensamiento fijndolo en definiciones, mientras que los modelos heursticos estimulan el movimiento de las ideas, son ms dinmicos. Los primeros aslan ideas, los segundos las relacionan. i) Modelos Formales: Provee marcos de referencia para la construccin de modelos, teoras y esquemas de planificacin en investigacin cientfica. Teora de Conjuntos, Teora de la Probabilidad, Teora de los Juegos, Teora de la Informacin, Ciberntica, Lgica formal, Teora General de los Sistemas, Modelos Inferenciales en la Ciencia, Camino Crtico, Modelos Estocsticos, Modelos Aleatorios, etc. j) Historia de la Investigacin cientfica: Aborda un enfoque particular dentro de la historia de la ciencia, a saber, detenindose en la descripcin y anlisis de las investigaciones ms sobresalientes de la historia del conocimiento: Galileo, Harvey, Mendel, Maxwell, Freud, etc. Segn la teora del aprendizaje social de Bandura, es posible aprender a investigar observando cmo los dems lo hicieron, y no leyendo un artculo que resume los resultados de una investigacin, ya que en ste ltimo no suelen figurar las marchas, contramarchas, obstculos y vacilaciones que inevitablemente estn
Pgina 97 de 331

98
siempre presentes en cualquier emprendimiento cientfico. Se procura que el alumno se lleve una imagen real, y no ideal, de la investigacin. k) Estadstica descriptiva e Inferencial: Incluye los contenidos tpicos de la asignatura homnima de carreras universitarias como Psicologa, Sociologa, Economa, etc., slo que vistos desde el punto de vista que puede interesar al investigador, es decir, principalmente como herramienta para establecer el grado de confianza de las conclusiones obtenidas en experimentos. Se puede hacer hincapi en el estudio de variables temporales y aleatorias, as como en el anlisis de correlacin y regresin y en las pruebas de significacin, herramientas de uso frecuente en las investigaciones.

Pgina 98 de 331

99

CAPTULO 7: TIPOS DE INVESTIGACIN CIENTFICA


Diversas clasificaciones se han propuesto para construir o contribuir a una taxonoma de la investigacin cientfica. En el presente captulo se pasa revista a algunas de ellas, de amplia difusin, que han utilizado diversos criterios tales como el objetivo o propsito de la investigacin: a) investigaciones pura, aplicada, profesional; b) investigaciones exploratoria, descriptiva, correlacional y explicativa; c) investigaciones terica y emprica; d) investigaciones cualitativa y cuantitativa; y e) investigaciones primaria y bibliogrfica.

1. INVESTIGACIN PURA, APLICADA Y PROFESIONAL


La investigacin cientfica pura tiene como finalidad ampliar y profundizar el conocimiento de la realidad; la investigacin cientfica aplicada se propone transformar ese conocimiento 'puro' en conocimiento utilizable; la investigacin profesional suele emplear ambos tipos de conocimiento para intervenir en la realidad y resolver un problema puntual. Lo que habitualmente se llama investigacin cientfica engloba solamente las dos primeras, en la medida en que ellas buscan obtener un conocimiento general, y no meramente casustico, ya que la investigacin pura (o bsica) busca ampliar y profundizar el conocimiento de la realidad. Ejemplo 1) En psicologa, la investigacin pura investiga el mecanismo de la proyeccin. La investigacin aplicada busca, utilizando como marco terico el conocimiento puro, un saber general que pueda utilizarse prcticamente. Por ejemplo, investigar alguna tcnica de diagnstico sobre la base del concepto freudiano de proyeccin, como podra ser un test proyectivo. Finalmente, la investigacin profesional consiste en intervenir en la realidad. Por ejemplo, diagnosticar una situacin usando la tcnica proyectiva descubierta y validada en la investigacin aplicada. Ejemplo 2) Un bioqumico estudia en su laboratorio la estructura molecular de ciertas sustancias (investigacin pura); luego, otro investigador utiliza este conocimiento para probar la eficacia de ciertas sustancias como medicamentos (investigacin aplicada); finalmente, el profesional har un estudio para determinar si a su paciente puede o no administrarle el medicamento descubierto (investigacin profesional). Ejemplo 3) Los matemticos desarrollan una teora de la probabilidad y el azar (investigacin pura); luego, sobre esta base, los especialistas en diseo experimental y en estadstica investigan diversos tipos de diseos experimentales y pruebas estadsticas (investigacin aplicada); finalmente, un investigador indagar la forma de utilizar o adaptar estos diseos y pruebas a la investigacin concreta que en ese momento est realizando (investigacin profesional). Ejemplo 4) Los antroplogos estudian el problema de la transculturacin y su influencia en el aprendizaje escolar de nios que llegan a una nueva cultura (tales problemas suelen provenir, por ejemplo, cuando un maestro argentino ensea a un nio que viene de una cultura diferente, donde no coincide la lgica de la enseanza con la lgica de apropiacin del conocimiento idiosincrsica del nio, o sea, no coinciden la forma de ensear con la de aprender). Un investigador aplicado disea tcnicas especiales para ensear a estos nios facilitndoles el aprendizaje, y un profesional investiga la forma de aplicarlas a ese caso particular.
Qu busca Investigacin pura Busca el conocimiento por el conocimiento mismo. Generaliza. "Se realiza con el propsito de acrecentar los conocimientos tericos para el progreso de una determinada ciencia, sin interesarse directamente en sus posibles aplicaciones o consecuencias prcticas; es ms formal y persigue propsito tericos en el sentido de aumentar el acervo de conocimientos de una determinada teora" (Ander-Egg, 1987:68). Elaborar una teora de la personalidad. Investigacin aplicada Busca recursos de aplicacin del conocimiento obtenido en la investigacin pura. Generaliza. Guarda ntima relacin con la investigacin pura o bsica, pues depende de sus descubrimientos y avances y se enriquece con ellos. "Se trata de investigaciones que se caracterizan por su inters en la aplicacin, utilizacin y consecuencias prcticas de los conocimientos" (Ander-Egg, 1987:68). Investigacin profesional Busca intervenir en la realidad utilizando los resultados de los otros dos tipos de investigacin. Singulariza. Utiliza las ideas elaboradas en la investigacin aplicada con el fin de resolver un problema singular y concreto.

Qu hace Diferencias ms especficas

Ejemplo en psicologa

Construir un test en base a una teora de la personalidad. Pgina 99 de 331

Investigar un paciente usando un test de personalidad.

100
Ejemplo en fsica Elaborar una teora de la superconductividad. Ensayar materiales superconductivos. Resolver un problema de instalacin elctrica usando superconductores.

1. Investigacin pura o bsica.- La investigacin pura busca el conocimiento por el conocimiento mismo, ms all de sus posibles aplicaciones prcticas. Su objetivo consiste en ampliar y profundizar cada vez nuestro saber de la realidad y, en tanto este saber que se pretende construir es un saber cientfico, su propsito ser el de obtener generalizaciones cada vez mayores (hiptesis, leyes, teoras). Algunos autores ofrecen su propia definicin de investigacin pura. Para Ander-Egg (1987:68), es la que se realiza con el propsito de acrecentar los conocimientos tericos para el progreso de una determinada ciencia, sin interesarse en sus posibles aplicaciones o consecuencias prcticas; es ms formal y persigue propsitos tericos en el sentido de aumentar el acervo de conocimientos de una teora. Para Rubio y Varas, tiene como finalidad primordial avanzar en el conocimiento de los fenmenos sociales y elaborar, desarrollar o ratificar teoras explicativas, dejando en un segundo plano la aplicacin concreta de sus hallazgos. Se llama bsica porque sirve de fundamento para cualquier otro tipo de investigacin (Rubio y Varas, 1997:120). Segn Tamayo, recibe tambin el nombre de pura y fundamental. Tiene como fin la bsqueda del progreso cientfico, mediante el acrecentamiento de los conocimientos tericos, sin interesarse directamente en sus posibles aplicaciones o consecuencias prcticas; es de orden formal y busca las generalizaciones con vista al desarrollo de una teora basada en principios y leyes (Tamayo, 1999:129). Afirmar que la simple curiosidad o el placer por conocer cuestiones que suelen carecer de utilidad prctica inmediata, es una motivacin frecuente para la investigacin pura puede sugerir que se trata de investigaciones intiles. Luego de haber presenciado como Faraday expona los resultados de una investigacin pura, una seora le pregunt para qu servan todas esas cosas, a lo cual el fsico ingls le respondi: Seora, para qu sirve un nio recin nacido?. Hacen investigacin pura, por ejemplo, un astrofsico que indaga el origen del universo, un psiclogo social que estudia el problema de la discriminacin, un psiclogo que estudia el aprendizaje para establecer las leyes que lo rigen, un fsico que explora la estructura subatmica de la materia o las vinculaciones de esta con la energa, un bilogo que intenta desentraar los orgenes de la vida, un gelogo que investiga la estructura interna de la tierra, etc. 2. Investigacin aplicada.- La investigacin aplicada busca o perfecciona recursos de aplicacin del conocimiento ya obtenido mediante la investigacin pura, y, por tanto, no busca la verdad, como la investigacin pura, sino la utilidad. En otras palabras, se trata aqu de investigar las maneras en que el saber cientfico producido por la investigacin pura puede implementarse o aplicarse en la realidad para obtener un resultado prctico. "En las ciencias aplicadas -nos dice M. Bunge- las teoras son la base de sistemas de reglas que prescriben el curso de la accin prctica ptima" (Bunge, 1969:683). La investigacin aplicada guarda ntima relacin con la investigacin bsica pues depende de los descubrimientos y avances de ella y se enriquece con ellos. Se trata de investigaciones que se caracterizan por su inters en la aplicacin, utilizacin y consecuencias prcticas de los conocimientos (Ander-Egg, 1987:68). A modo de ejemplo, pueden mencionarse cuatro maneras distintas cmo la investigacin aplicada puede obtener resultados prcticos: materiales, artefactos, tcnicas y campos. a) Materiales.- Utilizando como marco terico los resultados de la investigacin bsica, se pueden crear o perfeccionar nuevos materiales o sustancias que tengan alguna utilidad. Por ejemplo un nuevo medicamento, un novedoso material superconductivo que permita conducir la electricidad con el mnimo posible de disipacin de calor (lo que redunda en el fin utilitario de ahorrar energa), un novedoso material lo suficientemente inocuo o maleable que como para que pueda reemplazar a la plastilina con que los chicos juegan, etc. b) Artefactos.- La investigacin aplicada busca tambin inventar o perfeccionar mquinas, un motor de automvil que gaste menos, nuevas mquinas-herramientas, el detector de mentiras, etc. La rueda fue el resultado de una de las primeras investigaciones aplicadas que realiz el hombre, an cuando no tuviera bases cientficas explcitas en la investigacin pura (que en aquella poca, por lo dems, no exista). c) Tcnicas.- La investigacin aplicada se propone tambin descubrir nuevas tcnicas, o perfeccionar las ya existentes para mejorar su efectividad o adaptarlas a nuevos propsitos. Todas tienen sus alcances y sus limitaciones, y en todos los casos, debemos investigar su validez y su confiabilidad. Las tcnicas, que se definen lexicogrficamente como conjuntos de procedimientos de un arte o ciencia, pueden clasificarse con arreglo a varios criterios. Por ejemplo encontramos tcnicas puramente verbales (vgr. el test desiderativo), y tcnicas que emplean materiales (vgr. el test de Rorschach, que utiliza

Pgina 100 de 331

101
lminas), la tcnica de la hora de juego diagnstica que emplea juguetes, o, fuera de la psicologa, la tcnica de la hematoxilina (para visualizar estructuras microscpicas, donde se utiliza dicha sustancia). Propondremos aqu, sin embargo, otro criterio especialmente importante. De acuerdo a su finalidad, podemos agruparlas en tcnicas de in-put y tcnicas de out-put. En efecto, el valor instrumental de una tcnica reside en su capacidad para obtener datos de la realidad (in put), o bien en su capacidad para operar sobre ella (out put). Tcnicas de in put son, por ejemplo, las tcnicas de recoleccin de datos (entrevistas, cuestionarios, asociacin libre, etc.) que son -strictu sensu- tambin tcnicas de medicin. Todas estas tcnicas sirven para ingresar informacin acerca de la realidad, y por ello tambin podremos incluir la tcnica del detector de mentiras, del detector de radiactividad, del detector de metales, el empleo del termmetro o el barmetro, la tcnica del carbono-14 para averiguar la antigedad de los fsiles, etc. En psicologa, las tcnicas de in put son, en general, las llamadas tcnicas diagnsticas, como un test, mientras que en didctica podemos mencionar las tcnicas de evaluacin del aprendizaje o la enseanza. Las tcnicas de out put tienen como prototipo en psicologa las tcnicas teraputicas, porque con ellas pretendemos operar, es decir, producir algn efecto en la realidad, sea para modificarla o mantenerla sin cambios. En didctica, una tcnica audiovisual, por ejemplo, busca producir un cambio en los alumnos, ayudndolos a construir sus objetos de conocimiento, y lo mismo es aplicable a cualquier tcnica que sirva para ensear mejor. En oratoria, las tcnicas de persuasin son tcnicas de out put, mientras que en ingeniera encontramos por ejemplo las tcnicas metalrgicas y siderrgicas, que buscan producir un cambio, una transformacin en los metales para adaptarlos a usos especficos. En astronoma es difcil encontrar tcnicas de out put, puesto que el astrnomo no puede producir cambios en el universo, alterar la rbita de un planeta y hacer estallar un meteorito que se acerca peligrosamente a la tierra. Las tcnicas astronmicas son -por ahora- fundamentalmente de in put, es decir, tcnicas para ingresar informacin, para saber ms, acerca de los astros. Un ejemplo histrico de investigacin de tcnicas de out put, y ms concretamente de tcnicas teraputicas lo tenemos en Sigmund Freud, cuando sucesivamente fue probando y descartando diversas tcnicas, pasando por la hipnosis, por la tcnica del apremio hasta llegar, finalmente, a la interpretacin. Este ltimo ejemplo viene a mostrarnos que ciertas tcnicas pueden funcionar con tcnicas de in put y/o como tcnicas de out put al mismo tiempo Para Freud, la interpretacin era una tcnica que le serva tanto para hacer investigacin, es decir para incorporar informacin sobre el funcionamiento del psiquismo (in put), como tambin para producir un efecto teraputico en el paciente (out put). Otro ejemplo de tcnica mixta es la evaluacin mediante un examen final. A primera vista, parecera que tomar examen es una tcnica de in put, en cuanto el docente busca ingresar informacin acerca del desempeo del alumno. Sin embargo, un examen tiene tambin las caractersticas de una tcnica de out put, ms all de la intencin del docente, por cuanto incide en el aprendizaje: el alumno suele tener, en los exmenes, no slo la oportunidad de averiguar lo que no sabe, sino tambin eventualmente la de aprenderlo. Lo mismo sucede con los llamados exmenes a 'libro abierto', que son, en realidad, exmenes a 'cerebro abierto'. Y en particular, cuando se trata del ltimo examen de la carrera, se acenta an ms su carcter de tcnica de out put, en la medida que parece ejercer un efecto constituyente sobre el alumno al convertirlo, en virtud de un mero acto administrativo, nada menos que en un profesional. El hecho de que ciertas tcnicas funcionen inevitablemente -y a veces tambin inadvertidamente- como tcnicas de in put y de out put al mismo tiempo, puede originar ciertas dificultades metodolgicas. En este sentido, cabe mencionar la influencia de la pre-medida en los diseos experimentales y, ms clsicamente, la dificultad metodolgica advertida por Heisenberg en su principio de incertidumbre. En su interpretacin subjetivista, este principio establece que en toda medicin fsica influye inevitablemente sobre lo observado el observador, lo que significa que, al pretender aplicar una tcnica de medicin (in put) estamos al mismo tiempo ejerciendo una influencia sobre el fenmeno observado (out put). La importancia de la creacin y la revisin de tcnicas dentro de la investigacin aplicada reside al menos en dos cuestiones: a) Las tcnicas de recoleccin de datos debieran ser hoy ms importantes que nunca, ya que estamos en la era de la globalizacin y la informtica, donde la cantidad de informacin que recibimos es monstruosa. Entre otros, Alvin Toffler advirti acerca de los peligros que entraa esta situacin para el psiquismo; b) muchas de las tcnicas de recoleccin de informacin que usamos venimos usndolas y arrastrndolas como un mal hbito desde la primaria en nuestra profesin actual. Por ejemplo, el psiclogo que siempre vino usando una tcnica obsesiva donde no descuida ningn detalle, seguir con la tcnica obsesiva cuando deba realizar una entrevista. Se hace entonces emprender una investigacin aplicada para revisar estas tcnicas, cuestionarlas, criticarlas, mejorarlas, examinar sus alcances y sus limitaciones. Inclusive, tambin pueden inventarse nuevas tcnicas que antes jams haban usado y ponerlas a prueba, como un nuevo test o una nueva tcnica de entrevista. Por ltimo, digamos que una manera de examinar crticamente las tcnicas consiste en investigar su adecuacin con respecto: 1) a su finalidad: una tcnica que detecta especialmente actos fallidos no sirve cuando la finalidad es tomar apuntes en una clase, pero s cuando estamos en una entrevista o en una sesin usando un marco terico psicoanaltico. En otro ejemplo, un test, por ejemplo, es ms adecuado a la finalidad diagnstica, pronstica o de evaluacin de un tratamiento que a la finalidad del tratamiento en s, porque suponemos que un test no cura pero s puede diagnosticar, pronosticar o evaluar progresos en un tratamiento;

Pgina 101 de 331

102
2) al sujeto sobre el que se aplica la tcnica: para anotar lo que dice un profesor que habla muy rpido, tal vez lo mejor sea una tcnica de grabacin, y para un profesor aburrido, la tcnica onrica. Y en el mbito del ejercicio profesional, no podemos administrar el CAT a un adulto porque es un test hecho para nios; 3) al sujeto que aplica la tcnica: uno va eligiendo o adaptando una tcnica tambin de acuerdo a su idiosincrasia, personalidad o estilo de conducta. No se puede forzar a usar una tcnica obsesiva a un histrico. No estamos hablando aqu de patologas, sino de formas de ser, pues todos nosotros somos algo histricos, algo fbicos o algo obsesivos, y la cuestin est en poder aprovechar productivamente estas tendencias empleando en la profesin la tcnica ms til; 4) al marco terico desde donde estn operando: la tcnica tiene tambin que ser compatible con la teora que hemos adoptado. Ciertas tcnicas psicomtricas se adaptan a un marco terico piagetiano, las tcnicas proyectivas son ms apropiadas para un marco psicoanaltico, etc. No se trata simplemente de usar la tcnica que prescribe la teora, sino tambin se puede usar tcnicas de otra teora: lo importante es que no haya incompatibilidad. Por ejemplo, en principio no podramos usar la tcnica conductista de la desensibilizacin sistemtica si estamos en un marco psicoanaltico, porque mientras esa tcnica busca eliminar el sntoma, la teora, al revs, busca mantenerlo para poder analizarlo. d) Campos.- De lo que aqu se trata es de pensar y ensayar nuevos campos de aplicabilidad del saber puro. Por ejemplo, los principios de la fsica pueden aplicarse a la aeronutica, a la construccin de barcos, de ferrocarriles, a la tecnologa mdica, etc. Si tomamos como ejemplo las disciplinas de la salud, como la psicologa, los campos pueden clasificarse por lo menos segn tres criterios: a) El campo de la prevencin primaria, de la prevencin secundaria y el de la terciaria. Un psicopedagogo no tiene por qu estar constreido al campo de la prevencin secundaria, cuando tambin puede intervenir a nivel de prevencin primaria, por ejemplo, detectando precozmente dificultades de aprendizaje. b) El campo institucional, el campo grupal, el campo de lo individual. Aqu se trata de investigar si la psicopedagoga -por caso- es aplicable o no a situaciones donde quien tiene problemas de aprendizaje ya no es un individuo, sino un grupo o an una institucin. En el campo institucional puede investigarse por qu una institucin no aprende, o bien en qu medida un problema institucional puede generar problemas individuales o grupales de aprendizaje, en las personas o en los grupos que la integran. c) El campo clnico, el campo judicial y el campo laboral son tambin posibilidades de investigacin aplicada, ya que cada uno plantea problemas y procedimientos diferentes. d) Otros campos son la infancia, la adultez y la senectud. Por ejemplo, el psicopedagogo no tiene por qu atender solamente nios en edad escolar, pues tambin pueden tener problemas de aprendizaje los adultos (por ejemplo para aprender su trabajo). En fin, hay muchos otros campos para explorar, y muchos de ellos pueden encontrarse en las llamadas "incumbencias" profesionales, que aparecen por ejemplo en los planes de estudio de las carreras, y dicen para qu est habilitado un profesional, qu cosa puede hacer y qu cosas no. Tambin aparece en las leyes: para las incumbencias del psiclogo est por ejemplo la Ley de Ejercicio Profesional de la Psicologa, donde habla de campos de aplicacin en el rea docente, educacional, forense, laboral, etc. 3. Investigacin profesional.- La clasificacin clsica divide la investigacin en pura y aplicada, pero en este tem se incluye tambin la investigacin profesional, que debe ser diferenciada de la investigacin aplicada. De hecho, algunos autores parecen incluir dentro de la investigacin aplicada algunas caractersticas de la investigacin profesional. Por ejemplo, en el caso de las ciencias sociales, Ander-Egg (1987) describe la investigacin aplicada diciendo que busca "el conocer para hacer, para actuar (modificar, mantener, reformar o cambiar radicalmente algn aspecto de la realidad social). Le preocupa la aplicacin inmediata sobre una realidad circunstancial antes que el desarrollo de teoras. Es el tipo de investigacin que realiza de ordinario el trabajador o promotor social; en general, comprende todo lo concerniente al mbito de las tecnologas sociales que tienen como finalidad producir cambios inducidos y/o planificados con el objeto de resolver problemas o de actuar sobre algn aspecto de la realidad social" (Ander-Egg, 1987:68). La investigacin profesional se propone intervenir en la realidad utilizando los resultados de la investigacin pura y aplicada. Como esta tarea la realiza alguien a quien habitualmente llamamos 'profesional' (un mdico, un abogado, un ingeniero, un psiclogo clnico, etc.), hemos denominado con el mismo trmino a este tipo de investigacin. La investigacin profesional es as inherente a una profesin, a una prctica profesional. Un mdico, un psicopedagogo, un abogado debe investigar el caso que le presentan. En cambio, la investigacin cientfica no necesariamente est ligada a la prctica de una profesin: un profesional puede o no dedicarse, adems, a investigar en el sentido cientfico. De hecho, hay investigadores cientficos dedicados exclusivamente a esta actividad, y nunca ejercieron la profesin. La investigacin profesional se pone en marcha cuando un profesional es convocado para resolver un problema concreto sin intentar generalizaciones, y por lo cual cobrar honorarios. En cambio, el investigador puro o el aplicado, busca generalizar y su retribucin no se suele consignar como honorarios sino como sueldo. La investigacin profesional se propone obtener algn resultado (un diagnstico, una curacin, resolver un problema de aprendizaje, construir un edificio, etc.) en relacin con un caso nico y determinado: no busca generalizar, aunque para ello pueda utilizar los saberes generales obtenidos en la investigacin pura y la

Pgina 102 de 331

103
aplicada: en el curso de los dos ltimos siglos la enorme mayora de las innovaciones tcnicas han sido precedidas por investigaciones aplicadas, las que a su vez lo han sido por resultados bsicos. La investigacin profesional es, entonces, singular, en el sentido de que su finalidad no es obtener un conocimiento general, sino un conocimiento aplicable a un solo caso, a saber, aquel que se debe resolver en ese momento: planificar una clase, en el caso del docente, averiguar el origen de un problema de aprendizaje en el caso del psicopedagogo, construir un puente en el caso de un ingeniero, resolver un pleito en el caso de un abogado. En oposicin a la investigacin profesional, la investigacin pura no necesariamente est urgida por resolver un situacin prctica. En este nivel, un cientfico puede iniciar una investigacin motivado solamente por su curiosidad, lo que no quiere decir que en ciertos casos, como en algunas investigaciones aplicadas, haya de por medio un propsito prctico para el cual el investigador haya sido convocado por alguna institucin. En este sentido, la investigacin aplicada est a mitad camino entre la investigacin pura y la profesional, ya que en la investigacin aplicada no siempre hay tanta urgencia por resolver inmediatamente un problema: las tcnicas pueden investigarse y proponerse hoy, pero empezar a usarse ms tarde, cuando los profesionales adquieren informacin sobre ellas. Hay una relacin importante entre la investigacin profesional y la cientfica propiamente dicha (que incluye la pura y la aplicada): los resultados de la investigacin casustica del profesional, cuando no son archivados y olvidados, pueden servir como elemento de juicio para llegar a generalizaciones ms vastas mediante inducciones galileanas (a partir de un solo caso) o baconianas (a partir de varios). Freud, por caso, investig los casos de Dora y de Schreber con el fin de ampliar y profundizar su teora de los sueos y su teora de la psicosis, respectivamente. En oposicin a la investigacin profesional, la investigacin cientfica (pura, aplicada) busca siempre generalizar, e incluso para ello hasta puede partir de los datos de un caso singular abordado por un profesional, pero en este punto no estar haciendo una investigacin profesional, sino una investigacin cientfica. "Las prcticas profesionales no estn sometidas al doble imperativo de la universalizacin y la validacin de sus conclusiones cognoscitivas: les basta con alcanzar una adecuada 'eficacia local, particular', lograda en los marcos del problema prctico que intentan resolver..." (Samaja J, 1995:32). Tomemos el caso de la percepcin. Al investigador cientfico le interesa estudiar los fenmenos perceptivos con el fin de llegar a una comprensin general de la percepcin, incluso a formular hiptesis o teoras sobre la misma, como hicieron por ejemplo teoras como la Gestalt o el New Look. En cambio, al investigador profesional le interesa solamente la percepcin de su paciente: si est alterada o no, si tiene alteraciones cualitativas o cuantitativas, etc., y todo ello no para extraer conclusiones sobre la percepcin en general, sino como parte de un diagnstico de la situacin del paciente, lo que a su vez le servir para planificar un tratamiento. Otro ejemplo de investigacin profesional es la investigacin docente, cuando por ejemplo debe planificar una clase o un curso: debe hacer investigaciones bibliogrficas, investigacin sobre tcnicas didcticas, buscar el mejor ejemplo para una idea, etc., todo ello con vista a resolver esa clase o ese curso en particular. Las investigaciones clnicas que hace un psicopedagogo son tambin ejemplos de investigacin profesional. Por ejemplo, en un problema de aprendizaje, se trata de un problema de transculturacin? O tal vez se trata de un problema institucional, en cuyo caso la escuela misma anda mal, y esto se refleja en el aprendizaje de los alumnos? O tal vez el problema tiene su origen en una cuestin familiar, o en una simple cuestin de retraso madurativo, o en una cuestin orgnica que requiere la atencin de un neurlogo? Tal vez el problema est en una maestra que utiliza el 'horscopo piagetiano' (una mala interpretacin de la teora piagetiana) y que exige demasiado a un nio que teniendo 8 aos no sabe an clasificar o seriar? Todos estos interrogantes, entre otros, son los que pondrn en marcha la investigacin profesional.
La investigacin profesional se corresponde aproximadamente con lo que otros autores llaman investigacin-accin participativa, en el contexto de investigaciones en ciencias sociales. La Investigacin-Accin Participativa puede considerarse como un proceso que lleva a cabo una determinada comunidad para llegar a un conocimiento ms profundo de sus problemas y tratar de solucionarlos, intentando implicar a todos sus miembros en el proceso (Prez Serrano, 1990:134). La finalidad de la Investigacin-Accin Participativa es de inters para la poblacin, no slo para una institucin determinada: conocer para actuar, sensibilizar e implicar a la poblacin, transformar la propia realidad. Quienes investigan? Los investigadores, tcnicos y la poblacin (destinataria de la accin). Cmo se disea y ejecuta? Los grupos de trabajo disean y realizan todas las fases del anlisis de la realidad. Cul es su mbito? Son mbitos locales como barrios, zonas rurales, grupos, etc (Rubio y Varas, 1997:123).

Independientemente de las investigaciones profesionales que realiza, el profesional puede tambin tener la intencin de llevar a cabo o participar en investigaciones puras o aplicadas, motivado por el placer o la curiosidad, o tal vez por una finalidad ms prosaica relacionada con abultar el currculum o aumentar sus ingresos. Cevallos Garca y otros (2004) llevaron a cabo un estudio para conocer la actividad investigadora de un grupo de mdicos, sus actitudes hacia la investigacin y las dificultades que haban encontrado para investigar. Respondieron el cuestionario 174 mdicos de ambos sexos con una edad promedio de 43 aos, habindose obtenido los siguientes resultados: a) en los ltimos 5 aos, casi la mitad de los profesionales
Pgina 103 de 331

104
haba publicado un trabajo cientfico y el 38% haba presentado comunicaciones a congresos; b) la actitud hacia la investigacin revel que era apenas aceptable; y c) las dificultades encontradas para investigar fueron, desde las ms importantes a las menos importantes: la presin asistencial, la escasez de tiempo, las deficiencias estructurales, la ausencia de lneas de investigacin multicntricas, la falta de incentivacin y preparacin, y la ausencia de motivacin. Bases cientficas de la investigacin Si bien estamos presuponiendo que estos tres tipos de investigacin tienen todas una base cientfica, existieron o existen situaciones en la cuales ello no se cumple, o no se cumple totalmente. Por ejemplo, un gur pudo haber inventado o perfeccionado una tcnica de curacin basndose en la intuicin: hizo investigacin aplicada pero sin base cientfica. Tambin pueden encararse investigaciones profesionales sin una base cientfica. En nuestro pas, para rehabilitar a los alcohlicos la institucin Alcohlicos Annimos no admite mdicos, ni psiclogos ni ningn otro profesional, sino solamente a ex-alcohlicos. Yendo un poco ms lejos en el tiempo, los pueblos primitivos construan puentes sin tener conocimientos tericos de esttica (una rama de la fsica que estudia los cuerpos en reposo), utilizando para ello la intuicin, y una experiencia de fracasos acumulada a lo largo del tiempo. Inclusive ms: un profesional puede tener una buena base de conocimiento cientfico porque se recibi en la universidad pero, con el tiempo, poco a poco puede ir utilizando cada vez ms su saber cotidiano y menos el cientfico, en parte porque no se actualiza y, por tanto, puede seguir utilizando teoras que en el nterin ya fueron refutadas. Un ejemplo de investigacin psicopedaggica no cientfica es la que realiza la madre cuando trata de averiguar por qu su hijo tiene problemas de aprendizaje, y cuando formula hiptesis al respecto. A su manera ella tambin est haciendo una investigacin psicopedaggica, pero no podemos decir que sea cientfica. Todas estas investigaciones pueden tener indudable xito, desde ya, pero no discutiremos aqu este importante problema de status del saber cientfico en relacin con otros saberes, un tema del que, entre otros, se ocup Paul Feyerabend. Y una ltima observacin. Si bien la investigacin aplicada o la profesional pueden no estar basadas en las teoras cientficas producto de la investigacin pura, ellas mismas podran ser consideradas en s mismas cientficas por utilizar un 'mtodo' cientfico (Bunge, 1969:685). Bunge distingue, por caso, teoras cientficas, teoras tecnolgicas sustantivas y teoras tecnolgicas operativas. Podramos relacionar estos tres tipos de teoras con los tres tipos de investigacin que hemos descrito, en los siguientes trminos. Las teoras cientficas son elaboradas por la investigacin pura, y orientan o pueden orientar los otros dos tipos de investigacin, las cuales estn guiadas, adems, por teoras propias: la teora tecnolgica sustantiva orientara la investigacin aplicada, y la teora tecnolgica operativa la investigacin profesional. Investigacin y tica Cierta imagen clsica del cientfico que indaga a nivel de investigacin pura o bsica es aquella que lo pinta encerrado en una torre de cristal, y que est ms all del bien o del mal, por cuanto sus fines son desinteresados: le interesa conocer para satisfacer su curiosidad, independientemente de si su obra se utilizar para el bien o el mal. Desde este punto de vista, la investigacin aplicada est ms comprometida ticamente, por cuanto aqu ya no se produce simplemente conocimiento sino tcnicas o artefactos para operar sobre la realidad: una cosa es inventar un misil, y otra un marcapasos. Sin embargo, todava existe a este nivel un cierto grado de independencia, desde que se pueden inventar tcnicas o artefactos que, como el rayo lser, puede servir para el bien o para el mal. En la investigacin profesional, en cambio, el compromiso tico es insoslayable, porque a este nivel ya no se inventan tcnicas o artefactos, sino que directamente se las utiliza. Lo dicho no nos debe hacer pensar, sin embargo, que el investigador puro no tiene un compromiso tico con la sociedad, en la medida en que debe poder prever o imaginar el uso que podr drsele al conocimiento que produce. Einstein, por caso, parece no haber previsto el uso que se le dio en Hiroshima y Nagasaki a su conocida frmula de interconvertibilidad de la masa y la energa. De hecho, cuando se enter del desastre producido por la bomba atmica, se arrepinti pblicamente. En suma: en cualquiera de los tres tipos de investigacin existe una responsabilidad en lo que se produce como saber, en lo que se disea o en lo que se hace, con lo cual, la actividad de investigar tiene siempre implicancias ticas. Un ejemplo bastante extendido es aquel donde se realiza 'mal' una investigacin en forma deliberada con el fin de obtener algn resultado ventajoso en algn sentido (una 'mala' investigacin es aquella que no est de acuerdo con los patrones de procedimiento vigentes en cada poca. Por ejemplo, una investigacin que presenta como definitivos resultados que son provisorios, o como verdaderos resultados que son equivocados). Tomemos dos casos reales: a) Muchas investigaciones incompletas o insuficientes sobre nuevos medicamentos son presentadas por algunos laboratorios como investigaciones concluidas, y por una razn comercial lanzan prematuramente al mercado remedios an no suficientemente probados en seres humanos. En estos casos, a veces se utilizan
Pgina 104 de 331

105
como conejillos de Indias a la gente de los pases sub-desarrollados para probar la eficacia de medicamentos por los que luego pagarn fortunas en los pases desarrollados. b) Ciertas investigaciones de sondeos de opinin suelen ser tendenciosas, siendo contratadas especialmente por partidos polticos que compran encuestas 'arregladas' para su propio beneficio. Este procedimiento es una forma ticamente cuestionable de aplicar una hiptesis verificada por la Escuela del New Look, segn la cual tendemos a opinar como lo hace la mayora y, por lo tanto, 'si segn tal encuesta de opinin tanta gente vota a Fulano ser por algo, entonces yo tambin lo votar'. Otro caso similar est representado por aquella investigacin tendenciosa que intentaba persuadir a los ricos a estudiar en universidades privadas, en vez de en las pblicas, mostrando que quienes ms poder adquisitivo tenan, eran los que precisamente estudiaban en universidades privadas. Para ello, tomaron como indicadores de nivel de vida cosas como la casa donde viva, si tena o no electrodomsticos caros, el barrio de residencia, etc., con lo cual entraban en esta categora una gran cantidad de gente (lase: hijos de gente pudiente) que por s mismos no tenan en realidad ningn patrimonio personal. Esta investigacin tenda a contrarrestar la tendencia a estudiar en universidades pblicas, famosas por su prestigio y nivel acadmico. Con el mismo criterio utilizado por los promotores de la educacin privada, tambin podramos promocionar la educacin pblica bajo el lema: "Estudia en la UBA: millones de alumnos no se pueden equivocar", por parafrasear al humorista ingls Benny Hill, cuando dijo: "Coma en el restaurant de Harry: millones de moscas no se pueden equivocar". Interrelaciones entre los tres tipos de investigacin La investigacin profesional puede estar orientada o guiada por un marco terico producido por la investigacin pura y la investigacin aplicada (flechas 4 y 5). A partir de las hiptesis generadas en ellas, la investigacin profesional generar sus propias hiptesis, que convendr denominar 'hiptesis casusticas' por cuanto, a diferencia de las hiptesis propiamente dichas, no es general y est destinada a explicar solamente un caso en especial. As, no es lo mismo explicar el proceso de la percepcin en general, que explicar por qu un determinado paciente percibe como lo hace, explicacin que es inaplicable a otro paciente. La investigacin pura puede alimentarse de los datos producidos durante una investigacin profesional (flecha 6). La obra de Freud nos ofrece abundantes ejemplos: l construy una teora acerca del funcionamiento psquico en general, sobre la base de los datos que fue recolectando en su prctica profesional. La investigacin pura est tambin influenciada por los resultados de la investigacin aplicada (flecha 1). Por ejemplo, la tcnica del carbono-14 para estimar la antigedad de los fsiles, un producto de la investigacin aplicada, contribuy a modificar las teoras sobre el origen de la vida, a propsito del reciente descubrimiento, en la Antrtida, de los restos de un meteorito proveniente del planeta Marte. En otro ejemplo, la tcnica de la interpretacin contribuy a impulsar la investigacin pura en psicoanlisis, del mismo modo que la tcnica del taquitoscopio permiti verificar ciertas hiptesis de la teora del New Look. La investigacin aplicada suele utilizar los resultados de la investigacin pura (flecha 2), como cuando se disea un nuevo motor sobre la base de los principios de la termodinmica, o cuando se prueban nuevos medicamentos sobre la base de ciertas propiedades qumicas de algunas sustancias, descubiertas en el curso de la investigacin pura. Finalmente, la investigacin aplicada recibe el aporte de la investigacin profesional (flecha 3) en la medida en que, por ejemplo, esta ltima aporta elementos de juicio para evaluar la validez o la confiabilidad de tcnicas diagnsticas o teraputicas. Interrelaciones entre investigacin pura, aplicada y profesional

Investigacin p pura

1 2 4 5

Investigacin a aplicada

6
Investigacin p profesional

Pgina 105 de 331

106
Los tres tipos de investigacin y los contextos de la ciencia En otra oportunidad (Cazau, 1996:20) nos hemos referido a los contextos de la ciencia como etapas o vicisitudes que atraviesa el conocimiento cientfico. En este devenir, intervienen los tres tipos de investigacin descriptos, del modo en que se indica en el siguiente esquema. Analicemos en l columna por columna. Contextos Descubrimiento y justificacin Difusin Aplicacin Roles Investigador cientfico Transmisor/Receptor Profesional Tipos de investigacin Investigacin Pura o Aplicada Investigacin didctica Investigacin Profesional Tipos de ciencia Ciencia Pura o Aplicada Saber Transpuesto Ciencia Aplicada

Columna 1: Los cuatro contextos de la ciencia (descubrimiento, justificacin, difusin y aplicacin) se cumplen tanto en la actividad cientfica como en la vida cotidiana. Demos un ejemplo simple en este ltimo caso. Una madre se encuentra con un problema: su hijo no aprende. A partir de aqu ella intentar responder a este problema formulando una hiptesis, como por ejemplo que su hijo no aprende porque no lo castigan (contexto de descubrimiento). Hace la prueba, es decir le prohbe las vacaciones o las golosinas si no estudia bien, y la cosa funciona (contexto de justificacin). Comunica esto a sus amigas (contexto de difusin), quienes luego utilizan esta informacin con sus propios hijos (aplicacin). Estas cuatro etapas se cumplen tambin en la vida cientfica. Hay, sin embargo, por lo menos tres diferencias entre la actividad cotidiana y la actividad cientfica. a) El proceder cientfico es ms riguroso con la prueba de la hiptesis: el cientfico es una especie de neurtico obsesivo que hace sus verificaciones con el mximo rigor, cosa que no sucede en la vida cotidiana, donde incluso hasta aceptamos nuestras hiptesis como verdades absolutas. Por ejemplo, la teora de la madre del ejemplo es un equivalente de la teora del refuerzo negativo de un Skinner, cuyas pruebas estn llenas de controles experimentales. El resultado es que la hiptesis de Skinner est mucho mejor probada que la de la vida cotidiana. b) En la actividad cientfica, el conocimiento obtenido es includo en el marco de una teora ms amplia que permite sistematizar el saber, por ejemplo, dentro de una teora del aprendizaje. En la vida cotidiana, el conocimiento por ejemplo que a los chicos que andan mal hay que castigarlos no es includo explcitamente dentro de una teora, de un sistema hipottico-deductivo sino que se mantiene aislado, escindido del resto del saber. c) En tercer lugar, doa Rosa formula y pone a prueba sus hiptesis con un fin exclusivamente utilitario (que su hijo estudie bien), y no lo hace por una cuestin de simple curiosidad intelectual. En la actividad cientfica hay siempre una inquietud por conocer, adems de una intencin utilitaria. Columna 2: La investigacin pura se ocupa bsicamente de descubrir hechos, problemas o hiptesis, y de justificar (poner a prueba) estas ltimas. La investigacin aplicada procede de igual manera pero con tcnicas, materiales, etc., correspondiendo en estos casos hablar mas bien de invencin que de descubrimiento. Los resultados de estos dos tipos de investigacin son utilizados en la investigacin profesional, cuyos resultados a su vez pueden servir de fuente de datos para la investigacin pura y aplicada (doble flecha). Columna 3: Los investigadores cientficos -puros o aplicados- producen conocimiento, los profesores lo transmiten, los alumnos los reciben y los profesionales los aplican. Los alumnos tienen varias posibilidades: no solamente pueden convertirse en profesionales, que es lo que ocurre en la mayora de los casos, sino que tambin podrn convertirse en profesores, en investigadores puros y en investigadores aplicados. Estos diferentes roles pueden aclararse ms mediante la metfora del 'edificio de la ciencia'. Hay rascacielos como la fsica, pero hay tambin ranchitos como la parapsicologa, una ciencia que est en paales (o una protociencia como dira M. Bunge), donde hay muchos hechos constatados pero pocas teoras. La psicologa vendra a ser un edificio estndar pero de varios pisos. No es un rancho, pero tampoco un rascacielos. Si la ciencia fuera un edificio, el profesional es el que vive en los departamentos, el investigador puro es el constructor del edificio, y est en los stanos vigilando que el edificio no se caiga; mientras tanto, el investigador aplicado refacciona o ampla el departamento para hacerlo ms habitable, y el docente vendra a ser el que los muestra a los futuros adquirentes (alumnos) para vendrselos, y por ello la docencia es una profesin que exige, como la del vendedor, capacidad persuasiva. Tambin podramos ubicar a los usurpadores de viviendas, es decir, quienes, por ejemplo como los manosantas y astrlogos, se hacen pasar como psiclogos pero que no lo son porque no estn habilitados por el Estado, es decir, no han comprado su vivienda 'por derecha'. Adviertan entonces la diferencia entre el investigador, que construye ciencia, y el profesional, que la usa. Finalmente, los clientes de los profesionales seran las visitas que estos reciben en sus departamentos. Finalmente, hemos includo una categora especial de investigacin, la investigacin didctica, que indaga las maneras en que se transmiten los conocimientos desde el contexto de descubrimiento y justificacin hacia el contexto de aplicacin, y viceversa.

Pgina 106 de 331

107
Columna 4: Las ciencias puras son aquellas donde se realizan investigaciones puras, y las ciencias aplicadas, son aquellas donde se investigan nuevas herramientas para optimizar la aplicacin del conocimiento o extenderlo a otros campos. Algunos ejemplos pueden verse en el siguiente esquema. Puras Matemticas Fsica Qumica Biologa Psicologa Derecho Aplicadas Estadstica Ingeniera Farmacia Medicina, Veterinaria, Agronoma, etc. Psicopedagoga, etc. Abogaca

Piaget trabaj por ejemplo en el campo de la investigacin pura: l estudi la inteligencia y no encontramos en l un estudio sistemtico de sus implicancias pedaggicas o educativas, lo cual hubiera sido investigacin aplicada. Freud en cambio, trabaj en los dos campos: en la investigacin pura estudi los procesos inconcientes, las pulsiones, los afectos, y en la investigacin aplicada pens y ensay nuevas tcnicas teraputicas, como el apremio o la interpretacin. Si por ciencia aplicada entendemos tambin la aplicacin del conocimiento, deberemos incluir en ella a la investigacin profesional: si bien esta ltima es casustica (no busca un saber general, como la ciencia propiamente dicha), es 'ciencia' en tanto utiliza un procedimiento cientfico para validar sus hiptesis casusticas, y es 'aplicada' en tanto usa como marco terico el saber de la ciencia pura. Finalmente, en el contexto de difusin no encontramos un saber puro sino una transposicin de ese saber en un saber enseable y enseado (Chevallard, 1997).

2. INVESTIGACIN EXPLORATORIA, DESCRIPTIVA, CORRELACIONAL Y EXPLICATIVA


Segn su alcance, las investigaciones pueden ser exploratorias, descriptivas, correlacionales o explicativas. Estos tipos de investigacin suelen ser las etapas cronolgicas de todo estudio cientfico, y cada una tiene una finalidad diferente: primero se 'explora' un tema para conocerlo mejor, luego se 'describen' las variables involucradas, despus se 'correlacionan' las variables entre s para obtener predicciones rudimentarias, y finalmente se intenta 'explicar' la influencia de unas variables sobre otras en trminos de causalidad. Hyman clasifica las encuestas en tres grandes tipos (Hyman, 1955:100-101): descriptivas, explicativas y predictivas, aunque se ocupar en detalle solamente de las dos primeras.
Autores como Hyman (1955) se limitan a clasificar las investigaciones como descriptivas y explicativas, denominndolas metonmicamente como encuestas descriptivas y explicativas por cuanto la herramienta principal de recoleccin de datos es la encuesta. Este autor establecer una diferencia entre las encuestas descriptivas y las explicativas, aunque seala que tal distincin, si bien real, no es siempre factible, pues "muchas encuestas renen caractersticas combinadas de descripcin y explicacin" (Hyman, 1955:24). Su intencin, al explicar separadamente los principios de cada una, ha sido mas bien didctica.

Ms concretamente: dentro de las diferentes formas de clasificar los tipos de investigacin en ciencias sociales, una tipologa posible las clasifica, segn el alcance de la investigacin, en investigaciones exploratorias, descriptivas, correlacionales y explicativas. La clasificacin pertenece a Gordon Dankhe (1986) y aqu la explicitaremos basndonos en una sntesis realizada por Hernndez Sampieri y otros (1991). En la prctica, cualquier estudio puede incluir aspectos de ms de una de estas cuatro clases de investigacin, pero los estudios exploratorios ordinariamente anteceden a los otros porque sirven para empezar a conocer el tema. A partir de all se inicia una investigacin descriptiva, que por lo general fundamentar las investigaciones correlacionales, las que a su vez proporcionan informacin para llevar a cabo una investigacin explicativa. Una investigacin puede entonces comenzar siendo exploratoria, despus ser descriptiva y correlacional, y terminar como explicativa. No se puede hacer un estudio explicativo si antes, uno mismo u otro investigador no realiz antes un estudio descriptivo, como tampoco podemos iniciar este ltimo sin que alguien antes haya hecho una investigacin exploratoria. La historia de la ciencia nos muestra, primero, que una de estas etapas puede durar aos y puede haber quedado "olvidada" hasta que alguien retoma la siguiente etapa; y segundo, que los lmites entre una y otra etapa no son temporalmente exactos, pudiendo a veces superponerse. Las tres etapas persiguen propsitos diferentes: la investigacin exploratoria identifica posibles variables, la investigacin descriptiva constata correlaciones entre variables, y la investigacin explicativa intenta probar vnculos causales entre variables.
Ms concretamente: en la investigacin exploratoria buscamos informacin sobre algn tema o problema por resultarnos relativamente desconocido, como por ejemplo la cuestin de los prejuicios raciales. Este estudio culmina cuando hemos obtenido el conocimiento suficiente como para hacer un listado de los diferentes factores que suponemos vinculados con el prejuicio racial, como por ejemplo educacin recibida, religin, zona de residencia, edad, sexo, filiacin poltica, etc. En la investigacin descriptiva buscaremos correlacionar Pgina 107 de 331

108
estadsticamente cada uno de esos factores con el factor prejuicio racial, y termina cuando hemos constatado ciertas correlaciones lo suficientemente significativas como para sospechar la existencia de un vnculo causal. Por ltimo, en la investigacin explicativa intentaremos probar nuestra sospecha anterior, por ejemplo realizando un experimento que me permita concluir si el o los factores considerados son o no causa de la actitud prejuiciosa hacia personas de otras razas.

Seala Hyman que "los hallazgos de las encuestas descriptivas constituyen una gua para teorizar en las explicativas; la capacidad de conceptualizar un fenmeno, que es de enorme importancia en las encuestas descriptivas, resulta fundamental en las encuestas explicativas, ya que el mismo poder de conceptualizacin debe extenderse al problema de las variables independientes" (Hyman, 1955:116-117). Por lo comn, a la encuesta descriptiva se la relega a un segundo plano, otorgndosele un valor puramente emprico y de aplicacin. En contraste, a las encuestas explicativas se les otorga gran valor, dada la gran aceptacin de su papel en las ciencias sociales (Hyman, 1955:102). Investigacin exploratoria El objetivo de una investigacin exploratoria es, como su nombre lo indica, examinar o explorar un tema o problema de investigacin poco estudiado o que no ha sido abordado nunca antes. Por lo tanto, sirve para familiarizarse con fenmenos relativamente desconocidos, poco estudiados o novedosos, permitiendo identificar conceptos o variables promisorias, e incluso identificar relaciones potenciales entre ellas. La investigacin exploratoria, tambin llamada formulativa (Selltiz), permite conocer y ampliar el conocimiento sobre un fenmeno para precisar mejor el problema a investigar. Puede o no partir de hiptesis previas, pero al cientfico aqu le exigimos flexibilidad, es decir, no ser tendencioso en la seleccin de la informacin. En la investigacin exploratoria se estudian qu variables o factores podran estar relacionados con el fenmeno en cuestin, y termina cuando uno ya tiene una idea de las variables que juzga relevantes, es decir, cuando ya conoce bien el tema. Por ejemplo, cuando apareci por primera vez el Sida hubo que hacer una investigacin exploratoria, porque haba un desconocimiento de este tema. Otros ejemplos son investigar el tema drogadiccin para quien no lo conoce, o el tema salud mental en relacin con el entorno social. La investigacin exploratoria tiene otros objetivos secundarios, que pueden ser familiarizarse con un tema, aclarar conceptos, o establecer preferencias para posteriores investigaciones. La informacin se busca leyendo bibliografa, hablando con quienes estn ya metidos en el tema, y estudiando casos individuales con un mtodo clnico. Blalock destaca la tcnica de la observacin participante como medio para recolectar informacin. Es importante que la investigacin exploratoria est bien hecha, porque si no puede echarse a perder la subsiguiente investigacin descriptiva y la explicativa. Hernndez Sampieri y otros (1996:71) indican que los estudios exploratorios tienen por objeto esencial familiarizarnos con un tpico desconocido o poco estudiado o novedoso. Esta clase de investigaciones sirven para desarrollar mtodos a utilizar en estudios ms profundos. De hecho, una misma investigacin puede abarcar fines exploratorios, en su inicio, y terminar siendo descriptiva, correlacional y hasta explicativa: todo segn los objetivos del investigador. En su momento, fueron investigaciones exploratorias las primeras investigaciones sobre el Sida, sobre las vinculaciones potenciales entre histeria y sexualidad (Sigmund Freud), sobre el rendimiento de los obreros en las fbricas (Elton Mayo), etc. En su momento, cuando nada se saba sobre estas cuestiones, se emprendieron investigaciones para 'explorar' dichos temas y problemas. En un estudio exploratorio se puede partir de una hiptesis previa, o sea, podemos tener alguna idea previa sobre qu factores estn vinculados con la drogadiccin. Pero esta idea vaga es una gua muy general y slo nos sirve para descartar la influencia de factores tales como si hay o no atmsfera en Jpiter, por dar un ejemplo; no nos debe servir para descartar otros posibles factores relevantes (o que podran serlo), tales como la inestabilidad poltica, social o econmica de los pases donde aparece la drogadiccin. Investigacin descriptiva En un estudio descriptivo se seleccionan una serie de cuestiones, conceptos o variables y se mide cada una de ellas independientemente de las otras, con el fin, precisamente, de describirlas. Estos estudios buscan especificar las propiedades importantes de personas, grupos, comunidades o cualquier otro fenmeno. Las investigaciones descriptivas constituyen una "mera descripcin de algunos fenmenos" (Hyman, 1955:100), como por ejemplo describir la conducta sexual del hombre norteamericano, describir los sentimientos del pblico hacia los programas radiales, o describir la opinin norteamericana sobre la bomba atmica. Su objetivo central es "esencialmente la medicin precisa de una o ms variables dependientes, en alguna poblacin definida o en una muestra de dicha poblacin" (Hyman, 1955:102). "La conceptualizacin eficaz del fenmeno a estudiar constituye el problema terico fundamental que se plantea al analista de una encuesta descriptiva" (Hyman, 1955:129). Los estudios descriptivos (Hernndez Sampieri y otros, 1996:71) sirven para analizar como es y se manifiesta un fenmeno y sus componentes (ejemplo, el nivel de aprovechamiento de un grupo, cuntas personas ven un programa televisivo y porqu lo ven o no, etc.).

Pgina 108 de 331

109
Un ejemplo tpico de estudio descriptivo es un censo nacional, porque en l se intenta describir varios aspectos en forma independiente: cantidad de habitantes, tipo de vivienda, nivel de ingresos, etc., sin pretender averiguar si hay o no alguna correlacin, por ejemplo, entre nivel de ingresos y tipo de vivienda. Otro ejemplo de investigacin descriptiva puede ser aquella que intenta averiguar qu partido poltico tiene ms seguidores, o qu imagen posee cada partido poltico en la poblacin, o cuntas personas hacen psicoterapia en una determinada ciudad, o el ndice de productividad de una fbrica, o la cantidad de varones y mujeres que miran televisin, etc. Medir los diferentes aspectos de la personalidad de un sujeto (hipocondra, depresin, sociabilidad, etc.) es tambin un estudio descriptivo. Mientras los estudios exploratorios buscan descubrir variables, los descriptivos buscan describirlas midindolas, y, por tanto, requieren mayor conocimiento del tema para saber qu variables describir y cmo hacerlo. Los estudios descriptivos pueden ofrecer tambin la posibilidad de hacer predicciones incipientes, aunque sean rudimentarias. Por ejemplo, si sabemos el promedio de horas que miran TV los nios de la ciudad X, podemos predecir con cierta probabilidad el tiempo que mirar TV un nio determinado de dicha ciudad. Otro ejemplo: si sabemos, en base a una muestra, cunta gente votar a tal partido, podemos predecir con cierto margen de probabilidad o error, si triunfar en las elecciones. Segn Hyman, el objetivo fundamental de las encuestas de prediccin no es describir ni explicar una situacin 'actual', sino hacer una estimacin de algn estado de cosas 'futuro' (Hyman, 1955:101). El mismo autor proporciona un ejemplo de investigacin predictiva, que tuvo lugar en EEUU cuando el gobierno patrocin una encuesta que sirviese para orientar la poltica del control de la inflacin. Se buscaba informacin que permitiese pronosticar el curso de los rescates de bonos de guerra durante el prximo ao. La idea era recabar informacin directamente de las personas, porque hasta entonces los datos surgan de ndices globales, como la renta nacional, etc., que no arrojaban luz sobre el efecto diferencial que ciertos factores ejercen sobre los distintos sectores de la poblacin, ni indicaban las distintas motivaciones que los impulsaban. La informacin necesaria para formular el pronstico deba obtenerse analizando: a) datos econmicos sobre la tenencia de bonos y datos inferidos sobre la vulnerabilidad econmica de la familias, y b) datos psicolgicos sobre factores cognitivos o motivacionales en que se fundaba la compra y conservacin o rescate de bonos, en relacin con los diversos procesos econmicos previstos en el pas. Entre otras cosas, se pudo pronosticar por ejemplo que la reaparicin de bienes de consumo no sera muy significativa, ya que los tenedores de bonos queran conservarlos hasta su amortizacin. Investigacin correlacional Tiene como finalidad medir el grado de relacin que eventualmente pueda existir entre dos o ms conceptos o variables, en los mismos sujetos. Ms concretamente, buscan establecer si hay o no una correlacin, de qu tipo es y cul es su grado o intensidad (cun correlacionadas estn). En otros trminos, los estudios correlacionales pretenden ver cmo se relacionan o vinculan diversos fenmenos entre s (o si no se relacionan) (Hernndez Sampieri y otros, 1996:71). Por ejemplo, un estudio correlacional tratar de averiguar si hay alguna relacin entre motivacin y productividad laboral para los mismos sujetos (obreros de una fbrica), o si hay o no alguna relacin entre el sexo del cnyuge alcohlico y el nmero de divorcios o abandonos generados por el alcoholismo, o si hay alguna relacin entre el tiempo que se dedica al estudio y las calificaciones obtenidas. Consiguientemente, el propsito principal de la investigacin correlacional es averiguar cmo se puede comportar un concepto o variable conociendo el comportamiento de otra u otras variables relacionadas, es decir, el propsito es predictivo. Por ejemplo, si yo se que la ocupacin y la preferencia de voto estn correlacionadas, puedo predecir que los obreros tendern a votar a determinado partido poltico ms que a otro. No se trata de una prediccin incipiente como en la investigacin descriptiva, porque en los estudios correlacionales la prediccin est apoyada en evidencias ms firmes, a saber, en la constatacin estadstica de un vnculo de correlacin. Sealan Hernndez Sampieri et al (1991) que la investigacin correlacional tiene un cierto valor explicativo, que es parcial. Decir que los estudiantes obtuvieron mejores calificaciones 'porque' estudiaron ms tiempo es una explicacin, pero parcial, porque hay muchos otros factores que pudieron hacer incidido en sus buenas calificaciones. Los mismos autores advierten sobre la posibilidad de encontrar lo que ellos llaman "correlaciones espurias", es decir, correlaciones existentes entre variables pero que en realidad no expresan causalidad. Por ejemplo, hay una alta correlacin entre estatura e inteligencia, pero ello no nos autoriza a sostener que la estatura es la 'causa' de la inteligencia, o a decir que una persona es inteligente debido a su altura. Investigacin explicativa Las investigaciones descriptivas y correlacionales constituyen una mera descripcin de algunos fenmenos, para lo que se centran en la medicin de una o ms variables dependientes en alguna poblacin o muestra. La investigacin explicativa, en cambio, va ms all tratando de encontrar una explicacin del fenmeno en cuestin, para lo cual busca establecer, de manera confiable, la naturaleza de la relacin entre uno o ms efectos o variables dependientes y una o ms causas o variables independientes.

Pgina 109 de 331

110
As entonces, este tipo de investigacin va ms all de la simple descripcin de la relacin entre conceptos, estando dirigido a indagar las causas de los fenmenos, es decir, intentan explicar por qu ocurren, o, si se quiere, por qu dos o ms variables estn relacionadas. No es lo mismo decir que ocupacin y preferencia poltica estn relacionadas, a explicar por qu lo estn en trminos de un vnculo causa-efecto. Las investigaciones explicativas son ms estructuradas que las anteriores, y proporcionan adems un 'sentido de entendimiento' del fenmeno en estudio, es decir, procuran entenderlo a partir de sus causas y no a partir de una mera correlacin estadstica verificada con otras variables. Algunos llaman 'experimental' a la investigacin explicativa. Hernndez Sampieri et al (1991) sostienen que si bien la mayora de las investigaciones explicativas son experimentales, ciertos estudios no experimentales pueden aportar evidencia para explicar por qu ocurre un fenmeno, proporcionando as "un cierto sentido de causalidad". Hyman, en su anlisis de las investigaciones explicativas, sostiene que lejos de intentar la mera descripcin de un fenmeno como en las encuestas descriptivas, las encuestas explicativas tratan de encontrar una explicacin' del mismo (Hyman, 1955:100). En las encuestas explicativas, "se establece de manera confiable la naturaleza de la relacin entre uno o ms fenmenos (variables dependientes) y una o ms causas (variables independientes)" (Hyman, 1955:100). Los procedimientos para analizar encuestas explicativas "deben proporcionar pruebas confiables de la relacin entre el fenmeno y una o ms causas o variables independientes y, por tanto, solucionar el problema general del analista: hallar una explicacin" (Hyman, 1955:229). La encuesta explicativa "sigue el modelo de los experimentos de laboratorio, con la diferencia fundamental de que procura representar este diseo en un medio natural. En vez de crear y manejar las variables independientes cuyo efecto hay que descubrir, el analista de encuestas debe encontrar en el medio natural casos en que se den dichos factores. Mediante la medicin de su presencia y magnitud, es posible establecer, en el curso del anlisis, su relacin con el fenmeno. La restriccin del universo abarcado y el diseo de la muestra proporcionan la tcnica bsica mediante la que se excluyen otras fuentes de variacin del fenmeno en la encuestas explicativa" (Hyman, 1955:117). Clasificacin de las investigaciones explicativas.- Hyman clasifica las encuestas explicativas en tres grandes grupos, que son los siguientes: a) Encuestas tericas o experimentales.- Aqu, "la tarea adopta fundamentalmente la forma de verificacin de una 'hiptesis especfica' derivada de alguna teora ms amplia, en tanto determinante especial del fenmeno" (Hyman, 1955:100). b) Encuestas de evaluacin o programticas.- Son aquellas donde "los factores que 'han sido o pueden ser manejados por un organismo de accin social' se estudian desde el punto de vista de la ayuda que brindan para determinar el fenmeno. Aqu el objetivo inmediato es la aplicacin, modificacin o cambio de algn estado de cosas o fenmeno, tomando como base el conocimiento probado de los factores en juego. Tal fue el caso de la investigacin sobre el ausentismo: auspiciada por el gobierno, los hallazgos deban facilitar recomendaciones acerca de las medidas correctivas a adoptar en los talleres o en un ambiente ms amplio, mediante su manipulacin. Esto no significa que el planeamiento bsico de esas investigaciones no involucre consideraciones tericas [como en las encuestas tericas o experimentales], sino simplemente que los determinantes especficos que en ltima instancia constituyen el foco del anlisis son entidades manipulables" (Hyman, 1955:100). c) Encuestas de diagnstico.- "Implica una bsqueda de causas posibles en un mbito relativamente desconocido" (Hyman, 1955:100). Algunas diferencias entre los tres subtipos de investigaciones explicativas.- 1) A diferencia de las encuestas tericas o experimentales, donde se busca verificar una hiptesis especfica sobre los 'determinantes especiales' del fenmeno, a las encuestas de evaluacin y de diagnstico incumbe "verificar la 'contribucin de una serie de factores' a la causalidad de un fenmeno" (Hyman, 1955:100). 2) La encuesta programtica o de evaluacin "hace hincapi en los modos de anlisis denominados 'especificacin' y 'explicacin' (...). Adems, la encuesta terica pone el nfasis en el modo de anlisis llamado 'interpretacin'" (Hyman, 1955:101). La especificacin, la explicacin y la interpretacin son tres modos de anlisis que Hyman desarrolla ms adelante, en el captulo 7 titulado "La introduccin de variables adicionales y la elaboracin del anlisis". Estos tres modos de anlisis reciben en Hyman el nombre genrico de 'elaboracin', y consisten bsicamente en introducir variables adicionales para explorar con mayor detalle la original relacin X-Y. No se desarrolla aqu este punto, pero para que el lector pueda tener una idea aproximada del tema, hemos diseado el esquema, que intenta resumir las ideas de Hyman al respecto.

Pgina 110 de 331

111
t X X Y t Y X Y

t: Variable antecedente (t ( ocurre antes que x)

t: Variable interviniente

t: Variable contextual

( (t ocurre despus que x) I INTERPRETACIN

( (t ocurre al mismo tiempo que x) E ESPECIFICACIN

E EXPLICACIN

En la explicacin, el factor de prueba es una variable antecedente, en la interpretacin es una variable interviniente. En la especificacin se indica bajo qu circunstancias (variables contextuales) la relacin original X-Y es menos o ms pronunciada (Hyman, 1955:352). Se volver sobre este tema cuando se examinen ms adelante algunos ejemplos de relaciones entre variables. 3) Las encuestas programticas y tericas acentan la importancia de que la 'confiabilidad de las conclusiones est rigurosamente garantizada', en tanto que la encuesta de diagnstico puede reservar menos recursos a esas garantas y tratar de alcanzar, en un amplio mbito, comprensin o 'evidencia sugestiva'" (Hyman, 1955:101). 4) "La estructura conceptual de la encuesta terica ser ms 'abstracta', mientras que la encuesta programtica o de evaluacin utilizar variables ms 'concretas', y la de diagnstico participar de ambos niveles de conceptualizacin" (Hyman, 1955:101). Otras consideraciones 1. Una investigacin, puede incluir elementos de los diferentes tipos de estudio indicados? Muchas veces cuando se dice que un estudio es descriptivo, o correlacional, etc., esto no significa necesariamente que no incluya elementos o caractersticas de otros tipos de investigacin. Adems, una investigacin puede comenzar siendo descriptiva y terminar siendo luego correlacional. Inclusive ms: un estudio puede comenzar siendo explicativo porque procura averiguar la causa de la evasin de impuestos, pero luego, al revisarse la literatura. se comprueba que no hay nada investigado sobre el tema, con lo cual debe continuar investigando de manera exploratoria, pues se trata de indagar en un tema relativamente desconocido. 2. De qu depende que una investigacin comience como exploratoria, descriptiva, correlacional o explicativa? Que una investigacin comience como exploratoria, descriptiva, correlacional o explicativa depender del estado de conocimiento sobre el tema a investigar (lo que podemos saber a partir de la revisin de la literatura), y del enfoque que el investigador pretenda darle a su estudio. La revisin de la literatura sobre el tema puede revelarnos, en primer lugar, que no hay antecedentes sobre el tema, o que ellos son inaplicables a lo que queremos estudiar, en cuyo caso iniciaremos una investigacin exploratoria. En segundo lugar, puede revelarnos que ciertos estudios descriptivos han detectado y definido ciertas variables, en cuyo caso podremos iniciar un estudio descriptivo. En tercer lugar la revisin de la literatura puede revelarnos la existencia de una o varias relaciones entre conceptos o variables, en cuyo caso podremos emprender una investigacin correlacional. En cuarto y ltimo lugar, la literatura puede revelarnos que hay una o varias teoras aplicables a nuestro problema, con lo cual podremos comenzar un estudio explicativo. El enfoque que el investigador busque darle a su estudio tambin determinar el tipo de investigacin que elegir: a veces el propsito es simplemente describir, otras veces correlacionar, otras veces buscar causas, etc. 3. Cul es de los cuatro tipos de investigacin es mejor? Las cuatro son igualmente vlidas e importantes, por cuanto todas han contribuido al avance de la ciencia, porque han aumentado y profundizado el conocimiento del fenmeno en estudio. Un anlisis crtico de la propuesta tipolgica La tipologa de Dankhe representa un importante avance conceptual al discriminar las investigaciones descriptivas como diferentes de las correlacionales. De hecho, hay innumerables ejemplos de investigaciones descriptivas que no llegan a ser correlacionales, entre otras cosas porque no est como
Pgina 111 de 331

112
objetivo de la investigacin establecer relaciones entre variables. Por ejemplo, los censos describen el estado de variables demogrficas como sexo, edad, ocupacin, salario, nmero de hijos o vivienda, sin intentar relacionarlas entre s. En otro ejemplo, una empresa encuestadora es contratada por algn medio de comunicacin para que investigue el estado de la variable preferencia poltica de la poblacin: en estos casos su nico objetivo es describir la variable en cuestin, sin intentar establecer qu tipo de relacin puede tener con edad, sexo, etc. A lo sumo, podr cruzar la variable preferencia poltica con ellas, pero sin intentar un clculo de su grado de correlacin mediante coeficientes especiales como pueden ser el coeficiente Pearson, el coeficiente Spearman, tarea que ya caer dentro de los objetivos de una investigacin correlacional, que es en este caso poder hacer predicciones confiables. Por otro lado, nos permitiremos discrepar con los autores en algunas cuestiones relacionadas con los objetivos de una investigacin explicativa que, a nuestro entender, son presentados como demasiado laxos. Esquema 6 - Tipologia de Dankhe (1986) Tipo de investigacin Exploratoria Descriptiva Correlacional Explicativa Esquema X Y X ------ Y X Y X ------ Y X ------ Y X -----> Y Propsitos - Identifican variables promisorias - Sugieren relaciones potenciales entre variables - Describen -miden- las variables identificadas - Pueden sugerir relaciones potenciales entre variables (predicciones rudimentarias) - Determinan correlacin entre variables(predicciones ms firmes) - Sugieren vnculos causas entre las variables. O sea, buscan explicar por qu estn correlacionadas (explican una variable a partir de otra/s)

Una investigacin explicativa no se limita a sugerir vnculos causales entre variables sino que, fundamentalmente, se propone probarlos, para lo cual debe constatar que se cumplen los tres requisitos bsicos que definen un vnculo de ese tipo: primero, que haya correlacin significativa (lo que ya fue probado en la investigacin correlacional), segundo, que la supuesta causa ocurra antes que el efecto, y tercero, que haya suficientes motivos para descartar la influencia de otros posibles factores causales, adems del que se estudia. La investigacin explicativa se centra particularmente en esta ltima cuestin, y el recurso casi obligado para ello es el experimento. Segn algunos autores, la investigacin correlacional tendra un cierto valor explicativo porque proporciona 'explicaciones parciales', entendiendo por tales las que informan acerca de un nico factor, y no de todos los factores que inciden en un fenmeno. A nuestro entender, un anlisis de correlacin no intenta probar un vnculo causal, sino constatar estadsticamente un nivel de asociacin entre variables. Por lo tanto, si algn sentido tiene la expresin 'explicacin parcial' aplicada al anlisis de correlacin, ste slo puede consistir en que la presencia de correlacin es slo uno de los tres requisitos del vnculo causal antes indicados. Debido a que un anlisis de correlacin, por ltimo, no intenta probar conexiones causales, no resulta feliz la expresin 'correlacin espuria', utilizada por algunos autores. Segn estos, entre dos variables pueden existir 'correlaciones espurias', lo que ocurre cuando, a pesar de existir entre ambas existe una alta correlacin, no estn vinculadas causalmente, como el caso de la estatura y la inteligencia. A nuestro entender, lo correcto sera decir 'causalidad espuria' porque en el caso indicado no hay duda de que hay correlacin y, en todo caso, lo que se pone en tela de juicio es la presencia o no de un vnculo de causalidad. Algunos ejemplos de investigaciones descriptivas y explicativas Hyman suministra algunos ejemplos de investigaciones descriptivas y explicativas realizadas entre 1938 y 1946 en los EEUU. El lector podr apreciar en estos ejemplos algunas de sus caractersticas generales: a) Tamao grande: se estudia un gran nmero de casos, del orden de los miles (Hyman, 1955:45). b) Tarea colectiva: Salvo una excepcin, la investigacin no fue llevada a cabo por un estudioso, sino por una organizacin compuesta por muchas personas (Hyman, 1955:58). c) Patrocinio y subvencin: A veces, el problema en estudio no es el resultado de la eleccin individual de un investigador, sino que surge de las necesidades de la otra parte interesada, que patrocina y respalda la investigacin (Hyman, 1955:71). d) Temas controvertibles: por lo comn las encuestas giran alrededor de temas controvertibles, y el marco social donde se emprenden y cualquier solucin propuesta estn generalmente cargado de conflictos (Hyman, 1955:90). Esquema 7- Ejemplos de Hyman (1955) de investigaciones descriptivas y explicativas Encuesta Descriptiva Sub-tipo Ejemplos Encuesta N 2: La opinin pblica y la bomba atmica
Pgina 112 de 331

113
Encuesta N 3: Opinin norteamericana sobre la radio comercial Encuesta N 5: Conducta sexual de los norteamericanos Encuesta N 4: Prejuicio y personalidad Encuesta N 6: Conciencia de clase Encuesta N 1: Ausentismo industrial No hay ejemplos

Explicativa

Terica o experimental De evaluacin o programtica De diagnstico

Encuesta nmero 1: Ausentismo industrial.- Cierto organismo estatal de EEUU se propuso investigar ciertos hechos relacionados con la naturaleza y alcance del ausentismo en la industria blica, as como tambin determinar algunos de los factores que incidan en l. Se vio que a menudo se identificaba el ausentismo con mala voluntad por trabajar, y se lo consideraba un mal nacional que amenazaba el podero blico nacional. Los analistas encontraron que casi nunca se distingua ausencia voluntaria de involuntaria, y que el tema se trataba en voz baja. Se entrevistaron 1800 individuos (100 de 18 fbricas diferentes), y se computaron los ndices de ausentismo por fbrica y por individuo. Las variaciones en estos ndices se relacionaron con las caractersticas de los obreros, con sus condiciones de trabajo y con el grado de satisfaccin que sentan respecto de la planta y de la comunidad, todos factores determinados en las entrevistas. Otros factores se determinaron mediante observacin, como las condiciones objetivas internas de la planta y la comunidad. Encuesta nmero 2: La opinin pblica y la bomba atmica.- Una institucin plane sondear la opinin de los norteamericanos respecto de la bomba atmica y las cuestiones internacionales, con el fin de incorporar ms elementos de juicio para disear una poltica nacional al respecto. Una institucin sonde la opinin de una muestra de 3000 personas, y otra una de 600 personas. Se busc indagar qu conocimiento tenan sobre la bomba atmica, su existencia, su modo de fabricacin, los responsables de la misma, los pases que la posean, su grado de preocupacin y sus actitudes frente al control internacional de dicha arma. Tambin se indag opinin sobre relaciones internacionales, como la relacin del pas con la ONU, con Rusia y con otros pases. Encuesta nmero 3: Opinin norteamericana sobre la radio comercial.- La Asociacin de Radiodifusoras se propuso hacer una encuesta para determinar los puntos fuertes y dbiles de la radio y averiguar qu lugar ocupaba estas en las preferencias del pblico, con el fin de elaborar un plan de radiodifusin. Se constat que ciertos individuos y grupos criticaban el carcter comercial de la radio y el descuido de su responsabilidad pblica al no elevar el nivel cultural de sus programas. Se hicieron entrevistas personales a 2500 personas, buscndose indagar si ciertos programas y publicidades resultaban satisfactorios a la gente, y se investigaron actitudes frente al control de la radio por parte del estado. Se indag tambin la actitud de la gente frente a otros medios no radiales. Las opiniones se relacionaron con las caractersticas personales de los entrevistados, como la frecuencia con que escuchaban radio, el nivel de instruccin, sexo, edad, zona de residencia, etc. Encuesta nmero 4: Prejuicio y personalidad.- Una institucin decidi investigar el problema del prejuicio, lo que inclua un estudio tendiente a demostrar que ciertos factores de la personalidad del hombre moderno lo predisponen a exhibir hostilidad hacia grupos raciales y religiosos. El propsito primario no fue utilizar los resultados para hacer un programa contra el antisemitismo, sino contribuir al conocimiento de las fuentes del antisemitismo, intentando probar empricamente varias hiptesis acerca de lo correlatos del fenmeno del prejuicio. La orientacin terica de los investigadores los llev a concluir que el antisemitismo formaba parte de una pauta ms generalizada de sentimientos prejuiciosos, que integraba a su vez una pauta amplia y coherente de convicciones polticas y sociales. Se consider que los sentimientos autoritarios eran consecuencia de un sndrome ms bsico de personalidad, derivado a su vez de experiencias infantiles. Mediante cuestionarios, se indagaron a 2000 personas sobre antisemitismo, etnocentrismo, ideologa poltico econmica y ciertos rasgos ms bsicos de personalidad. Luego, se entrevist una muestra menor de personas que exhiban tipos particulares de actitudes que surgan de los cuestionarios, para determinar en detalle sus rasgos de personalidad y su historia y verificar las hiptesis principales. Encuesta nmero 5: Conducta sexual de los norteamericanos.- Kinsey y colaboradores realizaron entrevistas para informarse sobre el comportamiento sexual del norteamericano y establecer cules son los factores que explicaban las diferencias individuales y grupales en cuanto a conducta sexual. Se confeccion el Informe Kinsey en base a 5.300 entrevistas a varones blancos. Se procur que en los investigadores no influyeran prejuicios sobre lo que era sano o enfermo en la eleccin de historias o seleccin de tems. Fue una investigacin que encontr resistencias y crticas en la sociedad, dado lo controvertido del tema. Se obtuvo informacin sobre la historia de las conductas sexuales de cada interrogado, y sobre sus caractersticas personales. Se describi la conducta sobre todo en funcin del orgasmo, determinando su intensidad y frecuencia por distintas vas (masturbacin, emisin nocturna, desahogo homosexual, relaciones premaritales, extramaritales o maritales, etc). Se relacion el desahogo total, la suma de las conductas sexuales y los modos especficos de desahogo con factores como la edad, la educacin, la religin, el lugar de residencia y otros. Encuesta nmero 6: Conciencia de clase.- R. Centers proyect una encuesta buscando probar una teora segn la cual el status y el rol de una persona respecto de los procesos econmicos le imponen ciertas actitudes, valores e intereses vinculados con su rol y status en la esfera poltica y econmica. Adems, el
Pgina 113 de 331

114
status y el rol del individuo, en relacin con lo econmico, despiertan en l la conciencia de pertenencia a una clase social que comparte esas actitudes, valores e intereses. La finalidad de esta investigacin era terica, consistiendo en proporcionar una prueba objetiva de las hiptesis especficas deducidas de esta teora general del grupo de inters en la clases sociales. Centers se interesaba tanto por el conflicto de clases, como por la contribucin que podan aportar los cientficos sociales para comprender mejor las crisis, trastornos y cambios sociales. Se entrevistaron 1.200 individuos adultos, blancos y de sexo masculino, y, a fin de verificar la teora, se confeccion un cuestionario que abarc tres reas: la orientacin bsica en materia poltico econmica de los encuestados, la identificacin subjetiva del interrogado con una clase social, y la posicin objetiva de cada persona segn su nivel de vida, ocupacin y grado de poder o control ejercido sobre otros. La verificacin de la teora entra correlacionar los distintos ndices de estratificacin con las medidas de conciencia de clase y de ideologa poltico econmica.

3. INVESTIGACIN TERICA Y EMPRICA


Es posible distinguir dos actividades diferentes y complementarias en el mbito de la investigacin cientfica: la investigacin terica, que compara ideas entre s, y la investigacin emprica, que compara las ideas con la realidad. El escenario clsico de la investigacin terica es la biblioteca, y el de la investigacin emprica el laboratorio. En rigor, la gran mayora de los investigadores desarrollan al mismo tiempo una actividad terica y emprica, y la diferencia est mas bien en el nfasis en que ponen en cada una de ellas: hay investigadores mas bien orientados hacia la teora, y otros hacia la experiencia en la realidad. En una aproximacin grosera, podemos decir que la investigacin terica es una actividad por la cual relacionamos ideas entre s, mientras que la investigacin emprica se centra en confrontar las ideas con la realidad. Y as, cuando el investigador toma contacto con una idea -sea porque se le ocurri a l o porque la ley en algn lado-, tiene a partir de all dos opciones: relacionar esa nueva idea con otras que ya conoce (investigacin terica), o intentar examinarla o probarla a la luz de los hechos (investigacin emprica).
Dentro de la investigacin emprica suele distinguirse la investigacin de laboratorio y la investigacin de campo, segn el lugar donde los sujetos son investigados. En la investigacin de campo se estudia a los individuos en los mismos lugares donde viven, trabajan o se divierten, o sea, en su hbitat natural. Si se quiere saber cmo influye la televisin en la educacin infantil se utilizarn datos sobre nios que ven (o no) televisin en sus hogares. A nadie se le ocurrira encerrar durante meses o aos a varios nios en un laboratorio mirando televisin, para ver como evoluciona su educacin. Del mismo modo, tampoco se podra provocar un terremoto en una habitacin para ver cmo reacciona la gente all ubicada (salvo que se invente un sofisticado sistema de simulacin de sismos, pero esto ya sera costoso): slo se puede encarar este estudio a travs de una investigacin de campo, o sea en el lugar natural donde estos fenmenos ocurren. Tcnicas tpicas de recoleccin de datos en las investigaciones de campo son las encuestas o la observacin participante. La investigacin de laboratorio, en cambio, 'saca' a los sujetos de sus lugares naturales, los 'asla' de su entorno llevndolos a un lugar especial, el laboratorio, y que no necesariamente debe tener azulejos o probetas. Un ejemplo de laboratorio en psicologa es la cmara Gesell, o habitacin donde por ejemplo se deja jugar libremente a los nios mientras estudiamos sus reacciones a travs de un vidrio que permite verlos, y sin que ellos puedan advertir la mirada del investigador. Las investigaciones de laboratorio encuentran su justificacin en que permiten aislar el fenmeno de influencias extraas, de manera tal que, aplicado el estmulo, cualquier cambio en las respuestas ha de deberse con mucha mayor probabilidad a dicho estmulo y no a otras variables extraas. En la investigacin de campo los fenmenos en estudio estn ms expuestos a estas influencias externas, mientras que en las investigaciones de laboratorio puede aislrselos ms de ellas. Tngase presente que tambin puede introducirse un estmulo en una investigacin de campo, es decir, lo que se llama experimento puede realizarse tambin en este contexto. Refiere Vander Zanden (1986:619) que el experimento puede ser de laboratorio o de campo. En el primer caso se efecta en un recinto especial para controlar las condiciones con ms cuidado. En el segundo se realiza el experimento en el mundo real, introduciendo en la vida cotidiana de las personas la variable independiente. Cierto tipo de investigaciones se prestan para planificarse indistintamente como de laboratorio o de campo. As, si se quiere saber cmo influyen los ruidos sobre el estrs, hay dos alternativas: a) llevar dos grupos de personas a un lugar especial aislado, donde se los somete a uno a ruidos fuertes y al otro a ruidos dbiles, midiendo luego en ambos el estrs resultante (investigacin de laboratorio); b) medir directamente el estrs en personas que viven en lugares de mucho ruido y en lugares de poco ruido, para evaluar la diferencia (investigacin de campo).

Tomando como ejemplo al creador del psicoanlisis, podemos decir que hay un Freud terico y un Freud emprico. El primero es el que compara ideas de diversas teoras, o ideas dentro del mismo psicoanlisis. En otras palabras, es un Freud ms centrado en examinar relaciones entre ideas, conceptos, hiptesis, teoras, y de aqu que gran parte de la investigacin terica sea investigacin bibliogrfica (la otra parte no implica contacto con libros, ya que se refiere a la comparacin entre ideas nunca publicadas, fruto de la imaginacin del cientfico). El Freud emprico, en cambio, es que est en contacto directo con pacientes en la clnica a los efectos de poder descubrir o probar sus hiptesis, es decir, est ms directamente centrado en buscar inspiracin en los hechos para construir una teora o en la confrontacin de la teora con la realidad.

Pgina 114 de 331

115
Por ejemplo, el Freud terico (Freud S, 1916) establece una comparacin entre los sueos, actos fallidos o actos sintomticos, con los sntomas neurticos: al comparar ideas entre s est haciendo investigacin terica. En cambio el Freud emprico (Freud S, 1909) es el que toma contacto con los pacientes intentando verificar sus hiptesis sobre el sntoma, sobre los sueos o sobre los actos fallidos. En ltima instancia, la existencia de ambos modos de investigar se justifica a partir de la necesidad de satisfacer dos exigencias igualmente importantes en el conocimiento cientfico: la coherencia lgica de las ideas (investigacin terica), y la adecuacin de las mismas con la realidad (investigacin emprica). Centrarse exclusivamente en probar las hiptesis mediante los hechos implica el riesgo de descuidar la conexin lgica entre las mismas hiptesis, con lo cual no puede organizarse el conocimiento en teoras, es decir, en sistemas hipottico-deductivos donde unas ideas estn conectadas con otras por deduccin. Y al revs, concentrarse exclusivamente en armar una teora lgicamente coherente mediante la comparacin de ideas, implica el riesgo de construir un sistema especulativo que no tiene nada que ver con la realidad, es decir, de armar una teora perfectamente lgica pero tambin perfectamente falsa. La relacin entre investigacin emprica e investigacin terica puede comprenderse mejor a partir de la siguiente secuencia natural del proceso general de la investigacin: a partir del examen de los hechos, los cientficos emprenden una investigacin emprica (tpicamente exploratoria) que desembocar en la elaboracin de una hiptesis o teora. Esta a su vez requiere ser verificada, para lo cual se vuelve a realizar una investigacin emprica con ese propsito (tpicamente explicativa). En este esquema, las investigaciones tericas aparecen cuando a) un cientfico se propone comparar hiptesis o teoras entre s en trminos de nivel de verificacin, simplicidad, coherencia lgica y otros parmetros, o b) cuando un cientfico se propone comparar investigaciones empricas entre s en trminos de capacidad predictiva, nivel de verificacin, calidad metodolgica y otos parmetros (actividad habitualmente llamada metaanlisis). Para cualquiera de estas actividades, al investigador le basta con la consulta de libros y revistas especializadas, de all que su tarea sea eminentemente una investigacin bibliogrfica. La importancia del segundo tipo de estudio terico, es decir, la investigacin sobre investigaciones es que pone al descubierto sus fortalezas y debilidades. Por ejemplo (Annimo, 2005), una revisin de los estudios ms importantes publicados entre 1990 y 2003 en revistas cientficas influyentes revelaron que casi un tercio de los mismos mostraron resultados contradictorios o dbiles. En dicha revisin se indic que los hallazgos contradictorios y potencialmente exagerados son muy comunes en la investigacin clnica, por lo que tanto mdicos como pacientes no deben poner tantas esperanzas en un solo estudio porque los tratamientos suelen volverse obsoletos. Por ejemplo, un estudio contradictorio hall que el xido ntrico no aumentaba la sobreviva de pacientes respiratorios, a pesar de las confirmaciones previas, y que las terapias hormonales de reemplazo para mujeres menopusicas demostraron tener un efecto adverso como protectores de enfermedades cardiovasculares, cuando antes se haba concluido lo contrario. Tampoco la vitamina E logr prevenir los infartos.

4. INVESTIGACIN CUALITATIVA Y CUANTITATIVA


Cook y Reichardt hacen referencia a dos mtodos de investigacin: los cualitativos y los cuantitativos. Los autores sostienen al respecto dos cuestiones: a) El que un investigador utilice uno u otro mtodo no depende del paradigma que sostenga. De hecho, se han utilizado mtodos cualitativos dentro de paradigmas cuantitativos, y viceversa. Los autores suministran ejemplos de ello en relacin con los diversos tems que los diferencian (tems que se indican en el esquema 8). Del paradigma cualitativo se dice que postula una concepcin global fenomenolgica, inductiva, estructuralista, subjetiva, orientada al proceso y propia de la antropologa social. Del paradigma cuantitativo, en cambio, se dice que posee una concepcin global positivista, hipottico-deductiva, particularista, objetiva, orientada a los resultados y propia de las ciencias naturales. De acuerdo con algunos autores (Rubio J y Varas J, 1997:237), el mtodo cualitativo opera en dos momentos: 1) en un primer momento el investigador intenta (mediante grupos de discusin, entrevistas abiertas, historias de vida, etc) reproducir los discursos de determinado grupo social, comunidad o colectivo. O en su caso, produce o recopila documentos (relatos histricos, biogrficos, tradiciones orales, etc) referidos al mbito o poblacin en la que se centra la investigacin. 2) Posteriormente, se analiza e interpreta la informacin recogida. Esquema 8 Paradigmas de la investigacion cualitativa y cuantitativa (Cook y Reichardt). Paradigma cualitativo Aboga por mtodos cualitativos. Fenomenalismo y Verstehen (comprensin): interesado en comprender la conducta humana desde el propio marco de referencia de quien acta. Observacin naturalista y sin control. Paradigma cuantitativo Aboga por mtodos cuantitativos. Positivismo lgico: busca los hechos o causas de los fenmenos sociales, prestando escasa atencin a los estados subjetivos de los individuos. Medicin penetrante y controlada.

Pgina 115 de 331

116
Subjetivo. Prximo a los datos; perspectiva 'desde dentro'. Fundamentado en la realidad, orientado a los descubrimientos, exploratorio, expansionista, descriptivo e inductivo. Orientado al proceso Vlido: datos 'reales', 'ricos' y 'profundos'. No generalizable: estudios de casos aislados. Holista. Asume una realidad dinmica. Objetivo. Al margen de los datos; perspectiva 'desde fuera'. No fundamentado en la realidad. orientado a la comprobacin, confirmatorio, reduccionista, inferencial e hipottico deductivo. Orientado al resultado. Fiable: datos 'slidos' y repetibles. Generalizable: estudios de casos mltiples. Particularista. Asume una realidad estable.

b) La oposicin radical entre ambos tipos de mtodo no tiene sentido, y resaltan los beneficios potenciales del empleo conjunto de ambos mtodos. Se mencionan tres razones por las cuales pueden emplearse conjuntamente ambos mtodos: Objetivos mltiples, que obligan a usar diferentes mtodos. Los dos mtodos pueden vigorizarse mutuamente, brindando cada uno lo que el otro no puede dar. Como ambos mtodos tienen prejuicios, slo cabe llegar a la verdad usando tcnicas diferentes con las que se harn triangulaciones. Usar ambos mtodos tiene tambin sus desventajas: a) puede ser caro, b) puede suponer demasiado tiempo, y c) se puede carecer de adiestramiento en ambos mtodos.

5. INVESTIGACIONES PRIMARIA Y BIBLIOGRFICA


Un ltimo criterio para clasificar las investigaciones guarda relacin con la fuente de los datos consultados. En este sentido, los datos pueden ser clasificados como primarios o secundarios. Los datos primarios son aquellos obtenidos directamente de la realidad por mismo investigador mediante la simple observacin o a travs de cuestionarios, entrevistas, tests u otro medio. Los datos secundarios son los datos obtenidos de otras personas o instituciones (censos, estudios empricos de otros investigadores, metaanlisis, etc). A veces el inters de un investigador recae sobre este segundo tipo de fuentes, y ello por motivos muy diversos: a) no requieren tanto costo y esfuerzo como la obtencin de los datos primarios, b) no hay datos primarios disponibles, o c) necesidad de relacionar, sintetizar o integrar diversas investigaciones basadas en datos primarios, tal como ocurre por ejemplo en los llamados metaanlisis. En cualquier caso, el investigador habr de asegurarse que no hay razones para desconfiar de la verosimilitud de los datos secundarios. Por ejemplo, si un investigador hace un seguimiento de un grupo de pacientes para verificar si un tratamiento farmacolgico da resultados, est utilizando datos primarios. En cambio, si un investigador hace una recopilacin, una sntesis o una valoracin de diversas investigaciones sobre ese tratamiento farmacolgico, estar utilizando datos secundarios. En funcin de lo anterior, es posible entonces clasificar las investigaciones en primarias, si utilizan principalmente datos primarios, y en bibliogrficas, si utilizan principalmente datos secundarios, por cuanto la fuente de los datos secundarios se halla en material publicado (libros, revistas, etc). En la prctica, si bien muchas investigaciones se centran en los datos primarios, pueden tambin utilizar datos secundarios. Es el caso del mdico que adems de obtener datos a partir de sntomas y signos (datos primarios), los obtiene a partir de informes de laboratorio clnicos o de comunicaciones de familiares (datos secundarios).

6. CONCLUSIONES
El propsito principal de de la exposicin de diversas clasificaciones de las investigaciones es el de proveer un marco de referencia para tipificar una investigacin en particular, sea que ya est realizada, sea que deba an realizarse. As, por ejemplo, una determinada investigacin puede ser tipificada como pura, explicativa terica y primaria, si lo que busca es: a) realizar un estudio sobre conocimiento bsico, b) suministrar pruebas de vnculos causales, c) elaborar una teora sobre el tema elegido y d) basarse principalmente en datos obtenidos directamente de la realidad en vez de consultar informacin secundaria. Pura Exploratoria Emprica Terica Descriptiva Emprica Terica Correlacional Emprica Terica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria
Pgina 116 de 331

1 2 3 4 5 6 7 8 9 10 11

117
Explicativa Emprica Terica Aplicada Exploratoria Emprica Terica Descriptiva Emprica Terica Correlacional Emprica Terica Explicativa Emprica Terica Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica Primaria Bibliogrfica 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

El esquema intenta ordenar 32 tipos de investigacin combinando algunos de los criterios de clasificacin propuestos. En el mismo no se ha considerado el criterio que las clasifica como cualitativas y cuantitativas, principalmente porque en rigor toda investigacin tiene en mayor o menor medida algo de ambos aspectos. Por ejemplo, en las investigaciones exploratorias tiende a predominar el aspecto cualitativo, y en las investigaciones correlacionales o explicativas el aspecto cuantitativo. Debe tenerse presente, por ltimo, que estos tipos de investigacin no suelen encontrarse en la prctica en estado puro: una investigacin tpica no suele solamente primaria y emprica sino tambin bibliogrfica y terica, por cuanto es habitual que est precedida por una revisin de la literatura y pueda incluir alguna consideracin acerca de la teora de base. Si fue clasificada como primaria y emprica es al solo efecto de destacar que tales fueron sus propsitos principales.

Pgina 117 de 331

118

CAPTULO 8: CAUSALIDAD Y EXPERIMENTO


Antes de comenzar a describir las etapas de la investigacin tpica que constituyen la esencia de la metodologa de la investigacin, ser conveniente incursionar brevemente en los conceptos de causalidad y experimento para comprender mejor el resto del libro. Tpicamente el experimento es el dispositivo creado por el investigador para probar una relacin causal y cabe enmarcarlo, en ese sentido, dentro de una investigacin explicativa. En el presente captulo se enfocar la causalidad desde un punto de vista ms metodolgico que epistemolgico, es decir, atendiendo a las maniobras que realiza el investigador para probar la causalidad y no al concepto de causalidad en s tal como es utilizado en tanto referente terico de la actividad cientfica. Se har tambin una breve resea histrica de los mtodos de Stuart Mill, importante antecedente de las actuales concepciones de causalidad y experimento.

1. CAUSA Y CAUSALIDAD
Unicausalidad y policausalidad Respecto de la causalidad se pueden sustentar tres posiciones distintas: a) todo fenmeno tiene una sola causa (principio de unicausalidad); b) algunos fenmenos se deben a una sola causa, pero otros a varias; y c) todo fenmeno obedece a muchas causas (principio de policausalidad). El sentido comn sostiene habitualmente la primera postura. En la vida cotidiana las personas suelen basarse en este supuesto cuando afirman o creen en enunciados tales como "coma manzanas y adelgazar", o "si estoy enojado se debe simplemente a que usted me hizo enojar", etc., o bien "no aprob el examen porque el profesor se ensa conmigo". Si las personas se mantienen en esta ilusin de la nica causa se debe probablemente a que, entre otras razones, en la fantasa podrn controlar la ocurrencia o la no ocurrencia de los acontecimientos dominando un solo factor, o sea de la forma ms sencilla. Si alguien piensa que se resfri simplemente porque se desabrig, podr supuestamente controlar el resfro abrigndose bien. La psicologa conoce bien esta tendencia. De Vega refiere que el hombre de la calle utiliza un principio de parsimonia intuitivo cuando busca explicaciones causales a los fenmenos. Tendemos a sobreestimar el valor de las atribuciones unicausales, a conformarnos con una sola causa plausible, minimizando otras causas concurrentes (De Vega, 1984).
El principio de unicausalidad es utilizado tambin tendenciosamente para manipular la opinin pblica y difundir informacin falsa. Cierto ministerio argentino sugiere la idea que diversas afecciones tumorales y cardacas estn causadas por el cigarrillo. Hace ya mucho tiempo que la ciencia abandon la idea de la causa nica. Ningn fenmeno, por ms sencillo que sea, tiene una sola causa. En las afecciones indicadas intervienen gran cantidad de factores que, cuando se dan juntos, producen la enfermedad. Por lo tanto, esta ocurre cuando la persona fuma, tiene una cierta disposicin gentica a contraer cncer, cuando tiene altos niveles de colesterol, sobrepeso o estrs, entre otros. Esto explica porqu personas que no son fumadores activos ni pasivos tienen cncer, y personas que fumaron siempre no contraen cncer. Es probable que la no referencia al estrs, al smog ni al sobrepeso se deba a que el mismo Estado es en parte responsable del estrs de los ciudadanos y del smog circulante, y a que algunos funcionarios encargados de planificar estrategias preventivas padecen ellos mismos de sobrepeso. En suma: el cigarrillo parece cargar con toda la culpa de cnceres e infartos quedando en la penumbra los dems factores indicados, con lo cual queda desvirtuada la realidad de las cosas.

Sin embargo, cuando se empieza a advertir que las cosas no son tan sencillas se comienza a sostener insensiblemente la segunda postura, pero la tercera posicin ya es sustentada por la actitud cientfica. Aos de investigaciones ensean que la realidad es bastante ms compleja de lo que se supone y que cualquier fenmeno, por simple y anodino que parezca, obedece a muchas causas que actan conjuntamente para producirlo. Se podra pensar que la rotura de un vidrio tiene una sola causa: la piedra arrojada contra l. Este acontecimiento obedece sin embargo a muchas razones que intervienen simultneamente: el arrojar la piedra, su dureza, su trayectoria, su velocidad, la fragilidad del vidrio, el propio instinto de agresin, etc. etc. Conoc un nio que habiendo roto una ventana, se justific diciendo "qu culpa tengo yo si el vidrio es frgil". Podra tambin haber dicho, apelando a otra posible causa, "qu culpa tengo yo si el vidrio se interpuso en la trayectoria de la piedra". En suma: si se pretende ser un poco objetivo, debe admitirse que la realidad es compleja y aceptar que un fenmeno responde a una multiplicidad de causas que, actuando conjuntamente, producirn el fenmeno en cuestin. Pero, debido a que tampoco conocemos todas las causas que lo producen, slo podremos decir que la intervencin de las causas conocidas simplemente aumenta mucho la probabilidad de que el fenmeno ocurra. Cabe, por ltimo, una pregunta: si los cientficos aceptan el principio de policausalidad, porqu muchas investigaciones cientficas consideran slo una causa? Es posible citar dos razones importantes: a) es imposible poner a prueba simultneamente todas las causas posibles (entre otras cosas porque se desconocen), por lo que el cientfico decide probar uno por uno cada factor causal en investigaciones separadas e independientes; b) al cientfico suelen interesarle, por razones prcticas, slo ciertos factores
Pgina 118 de 331

119
causales y en ocasiones uno solo. Sostena Freud (1915) que en la causacin de la neurosis intervienen varias causas, como los factores constitucionales heredados y los conflictos sexuales infantiles. Freud, sin embargo, se centr en este ltimo factor, porque ese era su inters, aunque, por lo dems, poco poda estudiarse sobre el factor constitucional en aquel entonces. Si bien los cientficos suponen el principio de causalidad mltiple, intimamente anhelan a buscar una nica causa y, en el caso de los fsicos, una nica frmula que permita explicar el todo. Newton unific la mecnica terrestre con la mecnica celeste creando su mecnica clsica. Maxwell unific la electricidad y el magnetismo en su teora del electromagnetismo, aunque no pudo resumirlo en una sola frmula sino en cuatro. Einstein unific la teora de la gravedad de Newton y su propia teora sobre la velocidad de la luz en su teora general de la relatividad o teora del espacio-tiempo, y hasta el final de sus das intent unirla a su vez con el electrognetismo con la esperanza que lograr la frmula que lo explicase todo, pero no lo logr. De todas maneras tampoco lo iba a explicar todo porque an quedaba por incluir esa realidad subatmica infinitamente pequea de la que daba cuenta la teora cuntica, que siempre Einstein ignor olmpicamente porque no tena nada que ver con su visin determinista del universo. El estudio de las realidades infinitamente pequeas como las fuerzas nucleares fuertes y dbiles mostr que la gravedad misma no era una fuerza tan intensa: si un objeto cae desde un dcimo piso no sigue cayendo hasta el centro de la tierra porque lo detendr un pavimento, compuesto por tomos unidos por fuerzas nucleares fuertes y dbiles, que, entonces, son capaces de detener la fuerza gravitacional. Hoy en da los fsicos buscan todava una teora que lo unifique todo: la relatividad general y la mecnica cuntica o, si se quiere, una frmula que sintetice las cuatro fuerzas fundamentales de la naturaleza: la fuerza nuclear fuerte, la fuerza nuclear dbil, el electromagnetismo y la gravedad, y parece que un candidato potable es la teora de las cuerdas, supuestamente elaborada por fsicos igualmente cuerdos. Segn esta teora toda la realidad, desde las mnimas partculas terrestres hasta las estrellas ms lejanas, estn compuestas del mismo material: cuerdas increblemente pequeas que vibran de diferentes maneras, diferencias que dan lugar a los distintos tipos de partculas hasta ahora descubiertas por los fsicos. Hacia una definicin de causa Dentro de este principio de policausalidad es posible ahora intentar una definicin de causa en los siguientes trminos. Segn el supuesto de la policausalidad, un efecto es producido por varias causas. Las causas que determinan aprobar un examen son varias: haber estudiado, no estar nervioso, un profesor tolerante, etc. Esquemticamente, X representan las causas, e Y el efecto:

Haber estudiado (X) Tranquilidad (X) Profesor tolerante (X) Aprobar (Y)

Indudablemente que estudiar es una condicin necesaria, pero an no es suficiente para aprobar, pues puede ocurrir que los nervios nos traicionen o el profesor sea muy exigente. Otro tanto podemos decir de los otros factores: tener un profesor tolerante es condicin necesaria pero no suficiente, pues adems debemos haber estudiado y no estar nerviosos. Del mismo modo, la sola intervencin del factor tranquilidad, si bien necesario, no alcanza a ser suficiente por los mismos motivos anteriores. Nuestra primera conclusin es entonces esta: cada uno de los factores causales, considerados en forma independiente, son una condicin necesaria pero no suficiente. Sin embargo, si ahora en vez de considerarlos independientemente los consideramos conjuntamente, las cosas cambian, porque si todos esos factores se dan juntos entonces aprobamos el examen. Todos ellos juntos son entonces una condicin suficiente, lo que nos lleva a nuestra segunda conclusin: si consideramos a los factores causales conjuntamente, funcionan como condicin suficiente. De todo lo dicho se desprende que una condicin suficiente es el conjunto de todas las condiciones necesarias. En general, por causa entenderemos toda condicin necesaria y suficiente para que ocurra un fenmeno. Condicin necesaria es aquella que si no est, el efecto no se produce. Estudiar es condicin necesaria porque si no estudiamos, no aprobamos. Del mismo modo cierta capacidad mental es condicin necesaria para el aprendizaje (una piedra no puede aprender), y tambin es condicin necesaria para ser drogadicto haber tenido alguna experiencia con drogas. En cambio una condicin suficiente es aquella que si est, el fenmeno se produce. Condicin suficiente es la suma de estudiar, estar tranquilo y tener un profesor tolerante, pues si se dan estos tres factores

Pgina 119 de 331

120
aprobamos. Podemos decir tambin que una condicin suficiente para la ceguera es la destruccin del nervio ptico, o que un conflicto grupal es condicin suficiente para su bajo rendimiento. En la investigacin cientfica, las condiciones necesarias son importantes porque permiten excluir factores irrelevantes, y las condiciones suficientes porque permiten incluirlos. Selltiz, Wrightsman, Deutsch, y Cook (1980) dicen que en la prctica es, sin embargo, muy difcil encontrar condiciones necesarias y suficientes: la destruccin del nervio ptico no es la nica condicin necesaria y suficiente para la ceguera, pues sta puede existir an cuando no se haya destruido dicho nervio, o sea, puede haber otras condiciones distintas que produzcan este efecto. Por ello el cientfico debe buscar una constelacin de otras posibles causas (adems de la necesaria y suficiente), y que suelen clasificarse como condiciones contribuyentes, contingentes y alternativas. Veamos un ejemplo, tomado de los autores mencionados Es condicin necesaria y suficiente de la drogadiccin el hecho de no poder el sujeto suspender voluntariamente el consumo de drogas: si no puede suspender este consumo el sujeto es drogadicto, pero nadie que investigue sobre las causas de la drogadiccin se puede conformar con esta nica explicacin. Buscar entonces causas contribuyentes (ausencia de padre), contingentes (el habitual consumo de drogas en el barrio), y alternativas (presencia de un padre hostil). Condicin contribuyente es aquella que aumenta las probabilidades de ocurrencia del fenmeno, pero no lo hace seguro. La ausencia de padre aumenta las probabilidades que el adolescente sea drogadicto. Sin embargo, esta condicin contribuyente podr funcionar efectivamente como causa siempre y cuando en el barrio el consumo de droga sea habitual (condicin contingente). Y as, una condicin contingente es una situacin especial en la cual la condicin contribuyente puede realmente actuar como causa. En suma: en las vecindades donde el uso de drogas est generalizado (condicin contingente), la ausencia del padre del adolescente (condicin contribuyente), contribuye o ayuda a aumentar las probabilidades de que el muchacho sea drogadicto. Decimos que aumenta su probabilidad pero no lo hace 100% seguro, porque adems el sujeto debe no poder desprenderse voluntariamente de su hbito (condicin suficiente). La condicin contribuyente (ausencia del padre) tiene una condicin alternativa (presencia de un padre que trata en forma hostil o indiferente al sujeto). En rigor esta ltima es tambin una condicin contribuyente en tanto tambin aumenta la probabilidad que el hijo sea drogadicto. Lo que interesa entonces destacar ac, segn nuestro parecer, es que si una condicin contribuyente tiene alguna condicin alternativa que es tambin capaz de producir el fenmeno, entonces aumentan an ms las probabilidades de que este ocurra pues ambas condiciones cubrieron todo o casi todo el espectro de posibilidades de la situacin del padre. Requisitos de causalidad En toda investigacin explicativa lo que se hace es una prueba de causalidad, y para poder probar que realmente la relacin X-Y es causal deben cumplirse obligatoriamente tres requisitos: 1) Variacin concomitante (correlacin).- X (causa) e Y (efecto) deben variar conjunta o concomitantemente. Sin embargo, hay muchas situaciones donde dos variables aparecen estadsticamente correlacionadas, pero que sin embargo, carecen de todo vnculo causal. Por ejemplo, pues puede ocurrir que X e Y varen en el mismo sentido slo porque son ambas efectos de una causa desconocida Z. Evidentemente puede haber una alta correlacin entre el hecho de que un profesor comience una clase a las 20 horas y otro, en la misma aula, lo haga a las 22 horas, pero ello no significa que la primera situacin sea la causa de la otra. En estos casos, ambas variables dependen de una tercera, que es la organizacin horaria de la universidad. De la misma manera, hay una alta correlacin entre los hechos amanece en Buenos Aires y amanece en Chile, ya que cada vez que amanece en Buenos Aires, poco despus tambin amanece en Chile. Sin embargo, nadie se animara a decir que lo primero es la causa de lo segundo. La tercera variable de la cual dependen ambas es, en este caso, la rotacin de la tierra. Existe cierta tendencia muy humana a considerar que las simples correlaciones estadsticas indican una relacin causal. Antiguamente, se pensaba que cuando ocurran ciertos fenmenos como un viento que soplaba del este, el resultado era que a los nueve meses se produca el nacimiento de un hijo, ya que se haba atendido a la correlacin viento-nacimiento. Obviamente se trata este de un caso de correlacin sin causalidad, ya que el viento, si bien poda estar asociado por un nacimiento, nadie hoy en da dira que el viento es la causa del mismo. Y es que a nadie se le haba ocurrido por entonces relacionar el coito con el nacimiento: hoy sabemos que la relacin coito-nacimiento no slo es una correlacin sino que adems tambin es un vnculo causal.
Alternativamente, puede ocurrir que X e Y no aparezcan en un primer momento correlacionadas, pero ello no significa que no estn conectadas causalmente, ya que otras variables que no podemos controlar en ese momento pueden estar distorsionando la correlacin subyacente (como por ejemplo errores de medicin). Estas situaciones especiales no deben hacernos pensar que puede haber causalidad sin correlacin: all donde hay causalidad siempre ha de haber correlacin, aunque sta pueda aparecer encubierta.

La existencia de una correlacin (encubierta o no) es condicin necesaria para que hay un vnculo causal, pero an no suficiente, porque adems deben cumplirse los restantes dos requisitos.
Pgina 120 de 331

121
2) Ordenamiento temporal.- Para que X sea causa de Y es preciso que la causa X ocurra cronolgicamente antes que el efecto Y, o por lo menos simultneamente con l. No se rompe primero el vidrio y despus tiramos la piedra. Robert Koch, bacterilogo alemn, bromeaba con que haba un solo caso donde la causa sigue al efecto, y es cuando el mdico va detrs del fretro de su paciente. 3) Eliminacin de otros posibles factores causales.- Para que X sea causa de Y es preciso haber constatado que no hay otras causas ejerciendo influencia sobre el efecto Y. Si la tarea de establecer la correlacin era propia de una investigacin descriptiva, el trabajo de eliminar la influencia de otros posibles factores causales es ya lo ms caracterstico de una investigacin explicativa. En este contexto, los experimentos son los dispositivos ms aptos para ejercer un control sobre las variables extraas.

2. EL EXPERIMENTO
Definicin En un sentido amplio, es toda modificacin introducida deliberadamente en la realidad con el fin de examinar sus efectos o consecuencias. Ejemplo: cuando un nio intenta averiguar si su llanto atrae a su mam, est realizando un experimento. Un tipo especial de experimento es el experimento cientfico, donde se manipula una variable con el fin de examinar sus efectos en otra variable Clsicamente, un experimento es un dispositivo para probar un vnculo causal, para lo cual: a) el investigador hace intervenir deliberadamente la posible causa (variable independiente) para ver si influye sobre el efecto (variable dependiente), y b) al mismo tiempo controla la incidencia de otras posibles causas (variables extraas). Si estas otras causas no influyen o estn controladas, entonces aumenta la presuncin de que lo que hizo variar el efecto fue la nica causa que se hizo intervenir deliberadamente. En suma: un experimento es una situacin provocada y controlada. Oneil (1968) da una excelente definicin de experimento cuando dice que es un modelo particular de variacin y constancia, es decir, en todo experimento se hace variar X para ver cmo vara Y, mientras se mantienen constantes todos los otros posibles factores extraos.
La investigacin explicativa puede denominarse, segn Hyman, terica o experimental. Este autor parece considerar como sinnimos ambos trminos, pero a nuestro criterio cabe hacer una diferencia: en la investigacin experimental buscamos confrontar una hiptesis con la realidad, mientras que en la investigacin terica buscamos confrontar hiptesis entre s. Segn el mismo autor (1984:100), adems del propsito terico o experimental, una investigacin explicativa puede apuntar a objetivos ms prcticos, de aqu que tambin existan, de acuerdo a denominaciones de Hyman, estudios explicativos de diagnstico, de prediccin, y de evaluacin o programticos. En este texto centraremos nuestra atencin en la tarea principal: la prueba de la hiptesis causal. En otro orden de cosas, si bien lo que caracteriza la investigacin cientfica es la identificacin de las causas de los fenmenos, en nuestras investigaciones cotidianas no cientficas- muchas veces no nos tomamos esta molestia. De hecho, podemos resolver muchos problemas sin conocer las causas que los ocasionan, como por ejemplo: a) Golpeamos duramente el telfono y anda!!!; b) Reemplazamos un electrodomstico que no anda por otro que s funciona; c) Si la PC anda mal muchos tcnicos ni se preocupan por averiguar la causa: directamente formatean el disco rgido y reinstalan todos los programas. Estas actitudes son tambin observables en los mbitos que suponemos cientficos: la esquizofrenia o la epilepsia puede curarse con un electroshock, lo que no presenta gran diferencia con arreglar un telfono golpendolo.

Campbell y Stanley (1995:9) definen un experimento como aquella "parte de la investigacin en la cual se manipulan ciertas variables [llamadas variables experimentales] y se observan sus efectos sobre otras [llamadas variables dependientes]". En todo experimento se debe tomar la precaucin de que sobre la variable dependiente no influya ningn otro factor (que los autores llaman variable externa), para poder estar razonablemente seguros que el efecto producido se debe a la variable experimental. Finalmente, se tomarn ciertos otros recaudos que aseguren que los resultados del experimento podrn generalizarse a toda la poblacin. Consiguientemente, los tres tipos de variables involucradas en un experimento son: a) Variable experimental: Variable que se manipula para conocer cuales son sus efectos sobre otra. Campbell y Stanley tambin suelen referirse a ella con el nombre de estmulo experimental, y se la designa con la letra X. b) Variable dependiente: Variable sobre la cual supuestamente influye la variable experimental, y suele designrsela con la letra Y. Campbell y Stanley no utilizan estas denominaciones, y suelen referirse a las variables dependientes como los 'efectos' que se observan o miden (por ello las designan con la letra O, que indica un proceso particular de observacin o medicin). Por ejemplo, cuando los autores mencionados esquematizan un diseo en la forma O1--X--O2, estn queriendo decir que primero se observa o mide la variable dependiente (O1), luego se aplica el estmulo experimental (X), y finalmente se observa o mide si hubo o no algn cambio en la variable dependiente (O2). c) Variable externa: Variable que, de no ser controlada en el experimento, podra generar efectos que se confundiran con el del estmulo experimental (Campbell y Stanley, 1995:17). Campbell y Stanley suelen tambin referirse a ellas con el nombre de hiptesis rivales (Campbell y Stanley, 1995:20), mientras que otros autores como Selltiz y otros (1965) las llaman hiptesis alternativas. Algunos autores (Arnau Gras J,
Pgina 121 de 331

122
1980) llaman a las variables externas, variables 'extraas', que es la denominacin que se utilizar preferentemente en este libro. Mediante un breve ejemplo se puede ilustrar el papel de las variables experimentales, dependientes y extraas. Si quisiramos hacer un experimento para probar cierto mtodo educacional correctivo, podramos aplicarlo a un grupo de alumnos durante un tiempo, y luego observar y medir la mejora producida. Sin embargo, puede ocurrir que la mejora no obedezca al mtodo correctivo empleado, sino a un factor de maduracin que hizo que durante el tiempo que dur la experiencia los alumnos hicieron una remisin espontnea de sus dificultades escolares. La hiptesis que sostiene que la mejora obedece a una remisin espontnea se convierte as en una hiptesis rival que compite con la hiptesis de investigacin (que dice que la mejora es debida al mtodo correctivo). En este ejemplo, la variable experimental es el mtodo correctivo, la variable dependiente es la mejora de los alumnos, y la variable externa es la maduracin. Se hace preciso controlar la influencia de esta ltima variable, porque de otro modo no podramos saber si la mejora obedeci a ella o al mtodo correctivo. Tngase presente entonces, que la variable independiente (VI) se manipula, la variable dependiente (VD) se mide, y la variable extraa o externa (VE) se controla. Son tres operaciones diferentes: cuando se manipula la VI se ha hace variar a voluntad del investigador, y para ver si produce algn efecto sobre la VD, esta deber ser medida. Al mismo tiempo, se procurar anular la influencia de las VE, es decir, se las controlar. Medicin de la variable dependiente En algunos experimentos la variable dependiente se mide antes y despus de la aplicacin de la variable independiente, para constatar si hubo alguna variacin en ella. En otros, se mide solamente despus. En un sentido muy amplio, las variables independientes tambin se miden, entendiendo medicin como asignacin de una categora. Precisamente cada categora de la variable independiente suele denominrsela tratamiento experimental. Manipulacin de la variable independiente Hay dos formas de manipular la variable independiente: cuando el investigador provoca la variacin de la variable est haciendo una manipulacin de facto, mientras que cuando selecciona variaciones ya producidas naturalmente est haciendo una manipulacin ex post facto, expresin latina que significa "despus de ocurrido el hecho". Esta terminologa se propone en este libro. Muchas veces la VI se manipula ex post facto por existir cuestiones prcticas o ticas que impiden la manipulacin de facto. Tambin depende del tipo de investigacin experimental emprendido: en las investigaciones de laboratorio se realizan manipulaciones de facto, mientras que en las investigaciones de campo pueden realizarse ambos tipos de manipulacin. Ejemplo 1) Para estudiar la incidencia del estado civil de los padres en la condicin de drogadiccin filial, se seleccionan de la poblacin dos grupos: uno de padres casados y otro de padres divorciados. Se trata de una manipulacin ex post facto, porque los padres ya estaban casados o divorciados antes del estudio. Si hipotticamente se hubiera realizado una manipulacin de facto, el investigador habra pedido a ciertos padres que se divorciaran para ver la incidencia de este estado civil en la drogadiccin de los hijos. Ntese la diferencia: en el segundo caso se ha "provocado" deliberadamente el divorcio, mientras que en el primero se han "seleccionado" casos de divorcio ya ocurridos naturalmente. Ejemplo 2) La indagacin de la relacin ruido-hipoacusia puede llevarse a cabo como investigacin de campo o como investigacin de laboratorio. En este ltimo caso se lleva a los sujetos a un lugar especial -el laboratorio- y un grupo es expuesto a los ruidos y el otro no (manipulacin de facto). En la investigacin de campo, en cambio, los ruidos o los no-ruidos ya estn en los lugares naturales donde la gente vive (manipulacin ex post facto), con lo cual bastar con seleccionar el grupo experimental en la poblacin con ambiente ruidoso, y el grupo de control en la poblacin de entorno ms silencioso. Ejemplo 3) Como tercer ejemplo se pueden mencionar investigaciones que indagan la influencia del mtodo de aprendizaje de lectoescritura (variable independiente) sobre el rendimiento del alumno en lectoescritura (variable dependiente). Concretamente, se trata de averiguar si es ms eficaz el mtodo silbico o el mtodo global, eficacia medible a partir de los respectivos rendimientos de los alumnos. Una investigacin como la descrita puede realizarse, de dos maneras: a) Manipulacin ex post facto: se seleccionan alumnos o ex-alumnos de escuelas donde ya se hayan implementado los mtodo silbico y global, y se procede a comparar los respectivos rendimientos. b) Manipulacin de facto: se seleccionan dos escuelas y se les propone aplicar, desde el comienzo del ciclo lectivo, una el mtodo silbico y otra el mtodo global, y despus de uno o dos aos se analizan los rendimientos de los alumnos en cada una de esas instituciones educativas. A este ltimo tipo de manipulacin pueden oponrsele objeciones de tipo tico, porque se est exponiendo a la poblacin de una de las escuelas a un mtodo que considerado ineficaz y por ende perjudicial para los propsitos educativos. Ejemplo 4) Un ejemplo de manipulacin de facto en una investigacin de campo ocurri durante el "experimento" llevado a cabo por Orson Welles (aunque su intencin no haya sido hacer una investigacin sino lograr un efecto espectacular), cuando un buen da se le ocurri transmitir por la radio una falsa
Pgina 122 de 331

123
noticia: estaban descendiendo platillos voladores en las afueras de la ciudad, y los extraterrestres se acercaban amenazantes para invadir el planeta. Durante mucho tiempo se coment el descomunal efecto que produjo en la gente, que huy despavorida y hubo incluso algunos suicidios. Se trata de un ejemplo donde la manipulacin de la variable independiente (invasin extraterrestre) fue ejercida de facto, es decir, se provoc su presencia deliberadamente, y termin ejerciendo su influencia sobre la variable dependiente (conducta de la poblacin) en la forma indicada. Grupo experimental y grupo de control Muchos experimentos comparan dos grupos. Una vez extrada una muestra de una poblacin, dentro de la misma se seleccionan al azar dos grupos: el grupo experimental y el grupo de control. Se llama grupo experimental al que se somete a la influencia del posible factor causal que interesa (X), o sea a la influencia de la variable independiente o experimental, y se llama grupo de control a cualquier otro grupo usado como referencia para hacer comparaciones. Habitualmente los grupos de control son aquellos a los que no se somete a la influencia del posible factor causal. Ejemplo: a los efectos de investigar el estrs, el grupo experimental es el sometido a distintas intensidades de ruidos, y el grupo de control no. Otra posibilidad sera que a los diferentes grupos se los sometiera a diferentes intensidades de sonidos, en cuyo caso todos seran experimentales porque recibiran la influencia de X, pero al mismo tiempo seran grupos de control porque permitiran establecer comparaciones. Por ltimo, hay investigaciones donde se utiliza un solo grupo. En estos casos, este grupo funcionar como grupo experimental cuando recibe la influencia de X, y en otro instante de tiempo funcionar como grupo de control cuando no recibe esa influencia. Experimento y no experimento Un experimento implica siempre en mayor o menor medida crear una situacin controlada, donde mantenemos constantes ciertos factores y hacemos variar otros. Pero a veces, para probar una hiptesis, no podemos recrear una tal situacin, y debemos esperar a que ocurra espontneamente. Esto se aplicara por ejemplo en el caso de querer verificar la hiptesis de la periodicidad de las manchas solares o de los eclipses, en cuyo caso no tenemos otro remedio que esperar una determinada fecha para ver si se producen o no, y para colmo tampoco se pueden mantener constantes todos los otros posibles factores extraos. En cambio si lo que se quiere es verificar la temperatura de ebullicin del agua, aqu s se puede crear una situacin donde se pone a hervir agua y se comprueba con un termmetro a qu temperatura se transformar el vapor, manteniendo al mismo tiempo constantes otros factores como presin atmosfrica, cantidad de solutos disueltos, etc. Esta ltima es, entonces, una investigacin claramente experimental, mientras que el caso anterior del eclipse corresponde a una investigacin no experimental. Limitaciones del experimento En las investigaciones no experimentales debe esperarse a que ocurra el fenmeno para luego estudiarlo, y por ello se las llama tambin investigaciones ex-post-facto (despus de ocurrido el hecho). No es costumbre provocar la drogadiccin para estudiar luego sus consecuencias, as como tampoco se suele provocar un plenilunio (luna llena) para ver cmo influye sobre el comportamiento criminal de las personas, con lo cual en estos dos ltimos casos no puede emplearse un experimento. Realizar experimentos en ciencias sociales presenta algunas dificultades especiales: a) experimentar con seres humanos suele tener una limitacin tica. La alternativa podra ser encarnizarse con animales no humanos, pero aqu surge otra dificultad: puede desconocerse hasta qu punto las conclusiones obtenidas sobre animales son extensibles a los seres humanos. De hecho este problema se presenta an en ciencias biolgicas, cuando se investigan nuevas drogas para curar enfermedades; b) el ser humano es particularmente complejo, y por lo tanto puede resultar problemtico que un experimento pueda controlar una mayor cantidad de variables extraas. Experimento y diseo experimental El diseo experimental es un plan general para hacer un experimento, de la misma manera que el plano de una casa es un plan para construirla. Oneil (1968) define experimento como un modelo particular de variacin y constancia, definicin aplicable tambin al diseo experimental. Es particular porque se aplica a una muestra concreta, no a toda la poblacin, con lo cual luego deber resolverse si las conclusiones obtenidas para la muestra son igualmente aplicables a toda la poblacin, tarea que competer a la estadstica inferencial. Tambin es un modelo de variacin, porque el experimento consiste en hacer variar la variable independiente X para ver si tambin vara la variable dependiente Y. Es tambin un modelo de constancia porque al mismo tiempo que se hace variar las variables principales se deben controlar la influencia de las variables extraas, lo que puede hacerse mantenindolas en valores constantes.

Pgina 123 de 331

124
Validez interna y validez externa del experimento Es posible probar dentro de los estrechos lmites del laboratorio que el ruido produce estrs (validez interna), pero, la conclusin es aplicable a todas las otras personas que no participaron del experimento (validez externa)? Siguiendo cierta nomenclatura clsica, se dice que un experimento tiene "validez interna" cuando puede probar, con cierto margen de confiabilidad, que X es la causa de Y, y que el efecto Y no obedece a otros factores tales como el azar o la influencia de variables extraas. Asimismo, se dice que un experimento tiene "validez externa" cuando sus resultados pueden, tambin con cierto margen de confiabilidad, generalizarse a toda la poblacin, es decir, cuando hay una cierta seguridad que durante el experimento no estn ejerciendo influencia ciertos factores que, se supone, tampoco actan en la poblacin. Validez externa es, entonces, sinnimo de representatividad de la muestra experimental, y su importancia reside en que la representatividad permite la generalizacin y sta, a su vez, aumenta la capacidad predictiva de la hiptesis.
En los trminos de Campbell y Stanley, la validez interna es la "mnima imprescindible, sin la cual es imposible interpretar el modelo: introducan, en realidad, una diferencia los tratamientos empricos en este caso experimental concreto?. [Por su parte], la validez externa "plantea el interrogante de la posibilidad de generalizacin: a qu poblaciones, situaciones, variables de tratamiento y variables de medicin puede generalizarse este efecto?" (Campbell y Stanley, 1995:16). Por consiguiente, de acuerdo a Campbell y Stanley las variables 'externas' conciernen a la validez 'interna', aclaracin que hacemos para evitar que el lector se confunda al respecto (razn por la cual se prefiere en este libro la denominacin variable extraa).

Arnau Gras indica que "el problema surge cuando se produce una incompatibilidad entre ambos tipos de validez. En efecto, los controles que se utilizan para asegurar la validez interna tienden a comprometer la validez externa, es decir, a medida que se aumentan las restricciones sobre la situacin experimental, desfiguramos totalmente el contexto y limitamos automticamente la representatividad de la misma. Esto llevar, sin duda, a preguntarse, en el caso que se hallen comprometidos los dos tipos de validez, cul de los dos deber prevalecer. Segn Campbell (1957), la respuesta es clara: deber darse prioridad a la validez interna. Siempre ser mejor para la ciencia conseguir probar hiptesis que sacrificarlas en aras de generalizaciones vagas o imprecisas" (Arnau Gras J, 1980:350-352). No obstante, debe tenerse presente que Campbell y Stanley siguen considerando como objetivos dignos de alcanzar a los diseos ricos en una y otra validez. "As ocurre, particularmente, respecto de la investigacin sobre mtodos de enseanza, donde el desidertum ser la generalizacin a situaciones prcticas de carcter conocido" (Campbell y Stanley, 1995:17). Finalmente, hasta qu punto pueden resolverse los problemas de la validez interna y la validez externa en un diseo experimental? Al respecto, Campbell y Stanley sealan que mientras "los problemas de validez interna son susceptibles de solucin dentro de los lmites de la lgica de la estadstica probabilstica, los de validez externa no pueden resolverse en estricto rigor lgico en una forma ntida y concluyente" (Campbell y Stanley, 1995:39), habida cuenta de que, como dijo Hume, 'la induccin o generalizacin nunca tiene una plena justificacin lgica', es decir, los resultados del experimento no pueden generalizarse concluyentemente a toda la poblacin. Campbell y Stanley sugieren una solucin a este problema de validez externa, que consiste en procurar la mxima similitud entre experimentos y condiciones de aplicacin (que sea compatible con la validez interna), por cuanto la generalizacin resulta ms 'vlida' cuanto ms se asemeje la situacin experimental y la situacin con respecto a la cual se desea generalizar. El fundamento de este procedimiento se encuentra en la hiptesis de Mill acerca de la legalidad de la naturaleza, y que Campbell y Stanley describen como el supuesto del 'aglutinamiento': "cuanto ms cercanos se hallan dos acontecimientos en tiempo, espacio y valor..., ms tienden a ajustarse a las mismas leyes" (Campbell y Stanley, 1995:40). Las variables extraas Cuando se intenta averiguar si X es la causa de Y casi siempre existe la sospecha de que hay otras variables ajenas al experimento en s que pueden estar ejerciendo tambin influencia sobre Y, y entonces podr ocurrir que Y vara por influencia de esas otras variables ajenas y no por X. Por lo tanto, deben anularse al mximo estas influencias extraas para saber si realmente la variacin de Y se debe o no a X. Si por caso el inters est en averiguar la influencia causal de la educacin (X) sobre la inteligencia (Y), se procurar anular la influencia de variables extraas como por ejemplo la alimentacin, pues cabe la sospecha que la inteligencia tambin depende de ella. Ntese que se trata de una simple anulacin metodolgica pues no se est anulando la condicin causal de la alimentacin como tal, sino slo su influencia (de hecho, los nios del experimento continan alimentndose). Las variables extraas tambin han sido denominadas variables de control, factores de prueba, etc. y ha sido representada con diversos smbolos: con la letra t (Hyman, 1984:346), con la letra "z" (Blalock (1982:26), etc, adaptndolas a contextos particulares. Las variables extraas han sido clasificadas de diversas maneras, de las cuales se explicarn dos: a) las variables pueden ser organsmicas y situacionales, segn dependan de los individuos o de la situacin, y

Pgina 124 de 331

125
b) las variables extraas (Campbell y Stanley, 1995) pueden ser fuentes de invalidacin interna o fuentes de invalidacin externa, segn estn afectando, respectivamente, la validez interna o la validez externa. a) Variables extraas organsmicas y situacionales.- Las variables organsmicas son factores que dependen del sujeto mismo, tales como sus experiencias pasadas y los cambios debidos a la maduracin o al desarrollo. Si se quiere indagar la influencia de los premios o castigos (X) sobre el aprendizaje (Y), puede ocurrir que el sujeto aprenda mejor debido a sus cambios madurativos (variable extraa) y no a los refuerzos, sobre todo si el experimento implica un seguimiento de nios muy pequeos a lo largo de varios meses. Del mismo modo, si se quiere conocer la influencia del ruido (X) sobre el estrs (Y), puede ocurrir que ciertos sujetos sean hipersensibles a los ruidos por alguna experiencia traumtica o simplemente por factores constitucionales, y entonces revelen mayor nivel de estrs debido a su hipersensibilidad (variable extraa). Las variables situacionales son factores que dependen del ambiente. Al investigar cmo influye el ruido sobre el estrs, puede ocurrir que los sujetos elegidos para el experimento habiten en un pas econmicamente inestable, con lo cual el estrs se ver influenciado tambin por esta condicin (variable extraa), con lo que se corre el riesgo de no saber si el estrs se debe al ruido o a la inestabilidad econmica. Un caso muy especial de variable situacional son las variables derivadas del experimento, ya que muchas veces ocurre que es el mismo experimento quien influye sobre Y. Al investigar el vnculo ruido-estrs puede ocurrir que el sujeto, al sentirse como una especie de conejillo de Indias, por ese solo hecho aumente su nivel de estrs. Quizs estamos usando una amenazadora mquina para medir su estrs y el individuo se estresa con slo mirarla, con lo cual no se podr saber si tal estrs se debe al experimento mismo o a los ruidos. Esta influencia que puede ejercer la misma situacin experimental es llamada accin retroactiva por Oneil, influencia de la pre-medida por Selltiz, efectos de las mediciones previas segn Blalock, etc, pero todas esas denominaciones apuntan a la misma idea.
Un conocido ejemplo de influencia del experimento y que preocup durante mucho tiempo a los mdicos fue la llamada hipertensin del guardapolvo blanco. Cuando el mdico intentaba tomarle la presin a una persona, la sola presencia del galeno munido de un tensimetro bastaba para que la presin subiera espontneamente, con lo cual el mdico nunca poda saber si la hipertensin era un signo patolgico o simplemente un momentneo aumento de la presin ante la visin del guardapolvo blanco y el instrumento de medicin. Otro ejemplo aparece en Blalock (1982). Un grupo de obreras aument su rendimiento laboral pero no debido a que haba mayor iluminacin y horarios de descanso, como se pensaba, pues cuando estos factores se suprimieron, el rendimiento no decay. Este se deba en realidad a que fueron separadas y aisladas para realizar el experimento: esto las halag pues crean estar siendo objeto de un trato preferencial, y entonces aumentaron su rendimiento. Los factores debidos al experimento mismo no se ven slo en el mbito de las ciencias sociales: pueden detectarse tambin en experimentos de microfsica cuando se trata de averiguar la causa de ciertas caractersticas de las partculas subatmicas. Una de las interpretaciones del principio de incertidumbre de Heisenberg dice que, cuando el fsico quiere observar la trayectoria de una partcula subatmica, su sola presencia material hace que esa trayectoria se modifique, con lo cual nunca puede saber hasta qu punto depende de su presencia fsica o de otro factor que en ese momento resulte importante investigar.

b) Factores de invalidacin interna y externa como variables extraas.- La validez interna queda comprometida cuando en el experimento estn ejerciendo influencia ciertos factores llamados 'variables extraas', adems de X. Por ello, estas variables extraas son denominadas 'fuentes de invalidacin interna'. Se trata de factores que por s solos pueden "producir cambios susceptibles de confundirse con los resultados de X" (Campbell y Stanley, 1995:38). Del mismo modo, la validez externa queda comprometida cuando en el experimento estn ejerciendo influencia ciertos otros factores, que, por ello, son denominados 'fuentes de invalidacin externa'. Estas amenazas a la validez externa "pueden considerarse efectos de interaccin entre X y alguna otra variable" (Campbell y Stanley, 1995:38) relacionada con la situacin experimental, con lo cual la influencia que ejercen valen slo para el experimento, no para toda la poblacin. El experimento ideal sera aquel que puede controlar la influencia de la totalidad de las fuentes de invalidacin interna y externa. En la prctica, sin embargo, los diseos experimentales pueden controlar slo algunas fuentes de invalidacin, y otras no. El esquema 2 muestra precisamente qu fuentes de invalidacin interna y externa pueden ser controladas por cada diseo experimental (en este caso aparece el signo ms +), y qu fuentes no pueden controlar (en este caso aparece el signo menos -). Como puede observarse en el esquema, los diseos experimentales propiamente dichos son, en general, los que mejor controlan las fuentes de invalidacin interna, porque han sido pensados precisamente para ello. De hecho, son los diseos que ms recomiendan los autores del esquema (Campbell y Stanley, 1995:31). A continuacin se explicarn algunas de las ms corrientes fuentes o factores de invalidacin mencionados por Campbell y Stanley. Los autores describen un total de 12 fuentes: las primeras 8 son fuentes de invalidacin interna, y las ltimas 4 son fuentes de invalidacin externa (esquema 2). 1) Historia.- Acontecimientos especficos ocurridos entre la primera y la segunda medicin, adems de la incidencia de la variable experimental (Campbell y Stanley, 1995:17). "Como es obvio, estas variables suelen manifestarse con mayor frecuencia en experimentos a largo plazo" (Arnau Gras J, 1980:350-352).

Pgina 125 de 331

126
La variable historia es la contrapartida de lo que en el laboratorio fsico y biolgico ha sido denominado "aislamiento experimental" (Campbell y Stanley, 1995:79).
Un ejemplo de intervencin de la variable extraa historia puede ser el siguiente. Supngase que se quiere saber si determinada droga produce o no una disminucin de un tumor. Supngase tambin que, en lugar de elegir animales, para ello, se elige un grupo de personas y, antes de comenzar el experimento, se les mide el tamao del tumor (esto es lo que Campbell y Stanley llamaran primera medicin). A continuacin se manipula la variable independiente droga administrndoles a estas personas determinado medicamento. Luego de un tiempo de dos meses, se pide a los sujetos que vuelvan al hospital para medirles nuevamente el tamao del tumor (segunda medicin) para ver si aument, si disminuy o si sigue igual. Supngase que los tumores hayan disminuido significativamente de tamao. En este punto, un investigador un poco apresurado concluira que su droga surti efecto, pero, si fuese ms cuidadoso, considerara la posibilidad de la intervencin de la variable extraa historia. En efecto, tal vez la disminucin del tumor no obedeci a la droga (o solamente a ella), sino al hecho de que durante esos dos meses los pacientes iniciaron por propia voluntad una dieta estricta, y que fue esta variable extraa la que en realidad produjo el efecto deseado.

2) Maduracin.- Procesos internos de los participantes, que operan como resultado del mero paso del tiempo, y que incluyen el aumento de edad, el hambre, el cansancio y similares (Campbell y Stanley, 1995:17). El trmino abarca, entonces, "todos aquellos procesos biolgicos o psicolgicos que varan de manera sistemtica con el correr del tiempo e independientemente de determinados acontecimientos externos" (Campbell y Stanley, 1995:21). 3) Administracin de tests.- Influencia que ejerce la administracin de un test sobre los resultados de otro posterior (Campbell y Stanley, 1995:17). "Las medidas tomadas de los sujetos o los tests previamente suministrados, a fin de obtener datos para la posible formacin de grupos, pueden influir en los resultados finales, independientemente de la accin del tratamiento" (Arnau Gras J, 1980:350-352). 4) Instrumentacin.- Cambios en los instrumentos de medicin o en los observadores o calificadores participantes que pueden producir variaciones en las mediciones que se obtengan (Campbell y Stanley, 1995:17). La expresin se refiere entonces a "las variaciones autnomas en el instrumento de medicin que podran ser la causa de una diferencia O1-O2" (Campbell y Stanley, 1995:24). En un sentido muy amplio podran incluirse aqu los prejuicios de los mismos investigadores. Rollo May (1990:25) describe un experimento realizado por Robert Rosenthal, de la Universidad de Harvard, destinado a comprobar cmo influyen los prejuicios del investigador en los resultados de su experimento. Para ello, seleccion tres grupos de estudiantes avanzados de la carrera de psicologa, informndoles que habran de participar en un experimento con ratas que deban recorrer un laberinto. Al primer grupo de estudiantes les inform que las ratas con las que trabajaran eran muy inteligentes, al segundo grupo no les dijo nada sobre la inteligencia de las ratas, y al tercer grupo les advirti que sus ratas eran especialmente tontas. En realidad, todas las ratas eran aproximadamente iguales en cuanto a su capacidad, y a pesar de ello los resultados del experimento fueron sorprendentes. Las ratas del primer grupo se desempearon en el laberinto significativamente mejor que las dems, mientras que las del tercer grupo (supuestamente tontas) fueron las de peor rendimiento, incluso con un mal desempeo realmente llamativo. Rosenthal y sus colegas han repetido este experimento con muchas variantes, incluyendo pruebas donde en vez de ratas se trabajaba con seres humanos. La conclusin fue entonces la siguiente: no hay duda que el 'prejuicio', o la expectativa del experimentador influye en el rendimiento de los sujetos de prueba, a pesar de haberse adoptado todos los recaudos necesarios para que los distintos experimentadores dieran exactamente las mismas instrucciones a sus sujetos. La pregunta que faltaba responder era: pero entonces, cmo se comunica la expectativa del experimentador a las ratas u otros sujetos? Al parecer, concluye el equipo de Rosenthal, lo ms probable es que sea mediante movimientos corporales. Rosenthal est ahora tratando de determinar qu movimientos son esos y qu y cmo se comunica informacin a travs de los mismos. Para otros pensadores, adems de los movimientos corporales influira tambin el tono y la inflexin de la voz, y el lenguaje subliminal infinitamente matizado con el cual nos comunicamos sin saber que suele ser significativo. 5) Regresin estadstica.- Opera all donde se han seleccionado los grupos sobre la base de sus puntajes extremos (Campbell y Stanley, 1995:17). Estos puntajes extremos (sean muy altos o muy bajos) hacen surgir una diferencia entre el pretest y el postest ms all de los efectos de la variable experimental, diferencia adjudicable al fenmeno de la regresin estadstica. El concepto de regresin fue planteado por Francis Galton (1822-1911) cuando observ que los hijos de padres altos tienden a ser menos altos, y los hijos de padres bajos tienden a ser menos bajos que sus progenitores. Es decir, la talla de los descendientes tiende hacia la estatura media de la poblacin, movimiento regresivo que Galton expres en su principio de regresin. Este autor atribuy el fenmeno como una previsin de la naturaleza destinada a proteger la raza contra los extremos. Posteriormente, Karl Pearson retom estas investigaciones ideando la ecuacin de regresin, que permite hacer predicciones o estimaciones de una variable sobre la otra. Arnau Gras explica esta fuente de invalidacin en los siguientes trminos (1980:350-352): supongamos que se aplic un test de rendimiento, y se han seleccionado los sujetos con puntajes ms altos (por ejemplo, superiores al centil 85). Si a estos sujetos, luego de la aplicacin de X, se les toma un segundo

Pgina 126 de 331

127
test, la puntuacin media que obtendrn tender a desplazarse hacia la media de la poblacin original, o sea, tendern a bajar. Lo mismo hubiese sucedido si se elegan los puntajes ms bajos: en el segundo testo la media del grupo, baja en el primer test, se desplazara hacia la media real de la poblacin, o sea, sera mayor en este segundo test. Los efectos de regresin estadstica tienen como causas principales el azar, o bien, las propias deficiencias de los instrumentos de medicin. La regresin estadstica es una fuente de invalidacin, entonces, porque es una causa de la diferencia de puntajes entre un primer test y un segundo test, cuando en realidad la causa que nos interesa realmente comprobar es la de X: al haber regresin estadstica, los resultados quedan distorsionados por este factor. El esquema 1 nos ilustra ms claramente el fenmeno de la regresin estadstica. Esquema 1 El fenmeno de la regresin estadstica en los diseos experimentales A B C 100 90 80 70 60 50 40 30 20 10 0 100 90 80 70 95 85 75 65
La media aritmtica de una poblacin tiene un valor 50. De esa poblacin se extrae un grupo con puntajes altos, donde la media aritmtica es 85. Ms tarde, se vuelve a medir a ste ltimo grupo, obtenindose una media aritmtica menor (82,5), ms aproximada a la media poblacional 50. La diferencia de puntajes entre B y C se debe al fenmeno de la regresin estadstica y, de haberse aplicado X entre el pretest B y el postest C, la regresin puede confundirse con los efectos de X.

6) Seleccin: sesgos resultantes en una seleccin diferencial de participantes para los grupos de comparacin (Campbell y Stanley, 1995:17). Dice Arnau Gras: "la seleccin diferencial de los sujetos determina en muchos casos que los resultados acusen ms bien las diferencias existentes entre los grupos, que la accin del tratamiento experimental. Si se quiere probar, por ejemplo, la eficacia de un nuevo mtodo para el aprendizaje de lectura y se eligen para ello dos clases de alumnos de primer curso, puede ocurrir, independientemente del mtodo, que el grupo experimental tenga ms habilidad para la lectura que el grupo control" (Arnau Gras J, 1980:350-352). 7) Mortalidad experimental.- O diferencia en la prdida de participantes de los grupos de comparacin (Campbell y Stanley, 1995:17), lo que implica por ejemplo casos perdidos, y casos para los cuales slo se dispone de datos parciales (Campbell y Stanley, 1995:36). Esta fuente de invalidacin es ms importante si se produce en sujetos ubicados en los extremos de la distribucin (Arnau Gras J, 1980:350-352). Seala Arnau Gras que "esta posibilidad es muy alta en aquellos experimentos que se programan para periodos prolongados. Los sujetos pueden enfermar o cansarse, y no acudir cuando se aplican los tratamientos" (Arnau Gras J, 1980:350-352). Aclaramos que mortalidad experimental significa, entonces, que los sujetos han 'muerto' a los efectos del experimento, y no necesariamente que hayan fallecido. 8) Interaccin de seleccin y maduracin, etc.- En algunos de los diseos cuasiexperimentales de grupo mltiple, como el diseo 10, se confunde con el efecto de la variable experimental (Campbell y Stanley, 1995:17). Arnau Gras seala al respecto que "la interaccin entre seleccin y maduracin, entre seleccin e historia y otras condiciones puede comprometer seriamente la validez de los resultados experimentales. Puede ocurrir, por ejemplo, que si bien tanto el grupo experimental como el de control han presentado puntuaciones similares en el pretest, dado que el grupo experimental se halla ms motivado, o muestre ms rapidez en captar las explicaciones, obtiene un rendimiento superior en el retest que el grupo control, independientemente del tratamiento" (Arnau Gras J, 1980:350-352). Esquema 2 Fuentes de invalidacin para diseos experimentales segn Campbell-Stanley (Preparado por Pablo Cazau) Fuentes de invalidacin para diseos experimentales segn Campbell y Stanley (preparado por Pablo Cazau)
Estos cuadros se presentan con renuencia, pues pueden resultar demasiado tiles si se llega a confiar en ellos y no en el texto del libro. Ningn indicador de + o debe respetarse, a menos que el lector comprenda por qu se lo ha colocado (Nota de Campbell y Stanley). Signo negativo: imperfeccin definida Signo positivo: factor controlado Signo interrogacin: posible causa de preocupacin Espacio en blanco: factor no pertinente Diseos 1. Estudio de casos con pre una sola medicin

Fuentes de invalidacin interna


(1) (2) (3) (4) (5) (6) (7) (8) Historia Maduracin Tests Instrumentacin Regresin Seleccin Mortalidad Interaccin

Fuentes de invalidacin externa


(9) Interaccin de tests y X (10) Interaccin de seleccin y X (11) Dispositivos reactivos (12) Interferencia de X mltiples

10

11

12

Pgina 127 de 331

128
experimentales 2. Diseo pretest-postest de un solo grupo 3. Comparacin con un grupo esttico 4. Diseo de grupo de control pretest-postest 5. Diseo de 4 grupos de Solomon 6. Diseo de grupo de control con postest nicamente 7. Experimento de series cronolgicas 8. Diseo de muestras cronolgicas equivalentes 9. Diseo de materiales equivalentes 10. Diseo de grupo de control no equivalente 11. Diseos compensados 12. Diseo de muestra separada pretest-postest 12a. Variante a del diseo 12 12b. Variante b del diseo 12 12c. Variante c del diseo 12 13. Diseo de muestra separada prestest-postest con grupo de control 13a. Variante a del diseo 13 14. Diseo de series cronolgicas mltiples 15. Diseo de ciclo institucional recurrente (diseo de retazos) 02 < 01 y 05 < 04 02 < 03 02 < 04 06 = 07 y 02y = 02o 16. Anlisis de discontinuidad en la regresin

+ + + + + + + + + + + +

? + + + + + + + + + + + +

+ + + + + + + + + + + + + + + +

+ + + + ? + + + + ? ? ? ? + + +

? + + + + + + + ? + + + + + + + +

+ + + + + + + + + + + + + + + +

+ + + + + + + + + + + + +

+ + + + + + ? + ? + +

Diseos experimentales propiamente dichos

+ + ? + + + + + + -

? ? ? ? ? ? ? ? + + + + + + -

? ? ? ? ? ? ? + + + + + + ? -

Diseos cuasi experimentales

+ +

+ +

+ + +

+ ? ? ?

? ? ? +

+ + +

? + ? ?

+ + +

? ? ? -

+ + ? + +

9) Interaccin de tests y X.- Cuando un pretest podra aumentar o disminuir la sensibilidad o la calidad de la reaccin del participante a la variable experimental, haciendo que los resultados obtenidos para una poblacin con pretest no fueran representativos de los efectos de la variable experimental para el conjunto sin pretest del cual se seleccionaron los participantes experimentales (Campbell y Stanley, 1995:18). En otras palabras, "el efecto reactivo o interactivo del pretest puede restringir la posibilidad de generalizacin de los resultados experimentales. La previa aplicacin de un test puede incrementar o disminuir la sensibilidad de un grupo de sujetos en relacin con la variable independiente. De ah que los resultados obtenidos de un experimento en el que los sujetos han sido sometidos a una previa prueba, no podrn ser representativos del efecto de la variable experimental para una poblacin que no ha sido sometida a dicha prueba" (Arnau Gras J, 1980:350-352). 10) Interaccin de seleccin y X.- Este factor hace referencia a los efectos de interaccin de los sesgos de seleccin y la variable experimental (Campbell y Stanley, 1995:18). Se trata, en rigor, de un problema en el muestreo, es decir, en la seleccin de las muestras para el experimento. Dice Arnau Gras:"Si los grupos experimental y de control no han sido seleccionados al azar de la poblacin de donde proceden, los resultados difcilmente podrn extenderse a toda la poblacin. Sobre todo si se parte de grupos naturales o muestras no representativas es posible que determinado tratamiento interacte con el grupo experimental debido a sus caractersticas particulares" (Arnau Gras J, 1980:350-352). 11) Dispositivos reactivos.- O efectos reactivos de los dispositivos experimentales, que impediran hacer extensivo el efecto de la variable experimental a las personas expuestas a ella en una situacin no experimental (Campbell y Stanley, 1995:18). El efecto interactivo "suele ocurrir en aquellos experimentos en los que por parte de los sujetos se da una predisposicin a participar de ellos. Ejemplo tpico de este efecto lo encontramos en aquellos experimentos
Pgina 128 de 331

129
que se realizan con estudiantes de primer ao de especialidad, o bien, con sujetos voluntarios. Los sujetos voluntarios difieren considerablemente de los sujetos no voluntarios y, consecuentemente, no constituyen una muestra representativa. Este extremo atenta contra el principio del muestreo probabilstico. De ah que los resultados obtenidos de las situaciones en que los sujetos o bien estn predispuestos, o bien, tienen cierta familiaridad con las tcnicas experimentales, no pueden ser considerados como representativos" (Arnau Gras J, 1980:350-352). El factor reactividad se refiere tambin a que, por ejemplo, el mismo hecho de hacer una medicin previa, ya es un estmulo para el cambio. Por ejemplo, en un experimento sobre terapia para el control del peso, el pesaje inicial puede funcionar por s mismo como estmulo para adelgazar, aun sin tratamiento curativo alguno (Campbell y Stanley, 1995:24). 12) Interferencia de X mltiples.- Pueden producirse cuando se apliquen tratamientos mltiples a los mismos participantes, pues suelen persistir los efectos de tratamientos anteriores. Este es un problema particular de los diseos de un solo grupo de tipo 8 o 9 (Campbell y Stanley, 1995:18). Para Arnau Gras, este factor viene a ser una ampliacin de lo afirmado en el anterior. "As, en aquellos casos en que el experimento exige una exposicin repetitiva a dos o ms tratamientos, es posible que la accin de los tratamientos anteriores interacte con los tratamientos posteriores, a no ser que su accin quede eliminada con el tiempo. Siempre que precisamente no interese conocer el efecto de esta exposicin sucesiva, como ocurre en los experimentos sobre el aprendizaje y la transferencia" (Arnau Gras J, 1980:350-352). La seleccin de las tcnicas de control de las variables extraas es sumamente importante al disear un experimento, razn por la cual se desarrollar a continuacin ms en detalle esta cuestin. Control de las variables extraas Una de los propsitos principales de un experimento clsico es el control de las variables extraas de manera tal que no ejerzan influencia sobre la variable dependiente, o al menos que se conozca su grado de influencia sobre ella para luego descontarlo. Mtodos para controlar variables extraas son los siguientes: a) Eliminacin.- Cuando se sabe que existe una variable extraa que puede alterar los resultados de la investigacin, se puede simplemente eliminarla (Pick y Lpez, 1998). Sin embargo, este procedimiento es muy difcil de aplicar porque las variables, en tanto atributos de los fenmenos, no pueden eliminarse sin ms. En un ejemplo, nadie puede eliminar los vientos porque ellos podran influir sobre el estado de nimo de las personas (variable dependiente) adems del estado civil (variable independiente). b) Evitacin.- Aunque una variable no pueda eliminarse, puede realizarse el experimento en aquellas situaciones donde la variable extraa no acta. Siguiendo con el ejemplo, sera estudiar el vnculo entre estado civil y estado de nimo en lugares donde no sopla viento. c) Constancia.- Si la variable extraa no puede eliminarse ni evitarse, puede implementarse una situacin donde se mantenga en valores constantes. Siguiendo con el ejemplo, en un lugar donde sopla el mismo viento en forma permanente, cualquier variacin en el estado de nimo de las personas podr ser entonces atribuida a las diferencias en el estado civil. En otro ejemplo (ONeil, 1968), al estudiarse la incidencia del nivel escolar en la amplitud del vocabulario, puede seleccionarse una muestra con alumnos de la misma escuela, con aproximadamente el mismo coeficiente intelectual, y con padres con similar amplitud de vocabulario, etc., todas variables extraas que tambin pueden influir sobre la amplitud de vocabulario de los nios. Esta tcnica de control se emplea tambin en fsica, cuando por ejemplo se desea estudiar la relacin entre volumen y temperatura de un gas, manteniendo la presin constante. En los casos de experimentos con un grupo experimental y otro de control, se pueden mantener constantes los valores de las variables extraas en ambos grupos mediante la tcnica del apareamiento (o control por apareo de pares, o equiparacin por igualacin) (Campbell y Stanley, 1995:17) (Greenwood, 1973:109) (McCall, 1923) (Fisher, 1925), mediante la cual se forman grupos equivalentes, asignando al azar a cada grupo pares de sujetos con caractersticas psicolgicas iguales (Tamayo, 1999:54). De esta forma la nica diferencia entre ambos grupos ser que uno recibe la influencia de la variable independiente y el otro no, pudindose as llegar a una conclusin ms segura respecto de su influencia sobre la variable dependiente. La tcnica del apareamiento, ms concretamente, consiste en: primero, elegir dos sujetos que sean lo ms iguales posibles en cuanto a las variables consideradas relevantes; segundo, empezar a formar con uno de ellos el grupo experimental y con el otro el grupo de control; tercero, hacer lo mismo con nuevos pares de sujetos, hasta formar los dos grupos. Este procedimiento asegura, obviamente, la igualdad de ambos grupos, con lo cual se habr podido controlar la influencia de las variables extraas. Un ejemplo muy simple: si se quiere probar la eficacia de un determinado mtodo de enseanza, se eligen dos grupos de alumnos, pero, antes de utilizar con uno de ellos el mtodo en cuestin, se igualan por emparejamiento o apareamiento: se toman dos sujetos que tengan la misma inteligencia o la misma motivacin (variables relevantes extraas que tambin pueden influir sobre el rendimiento escolar) y se envan uno a cada grupo. Se hace lo mismo con otra pareja de sujetos, y as sucesivamente. Con ello, ambos grupos habrn quedado igualados, en el sentido de que tendrn ms o menos la misma inteligencia, la misma motivacin, etc., con lo cual, luego del experimento, cualquier variacin entre los dos grupos, en cuanto a rendimiento escolar, podr ser adjudicada al mtodo de enseanza y no a otras variables extraas como las indicadas.
Pgina 129 de 331

130
d) Balanceo.- Cuando las variables extraas no pueden mantenerse constantes se prepara un dispositivo de balanceo y de contrabalanceo donde de alguna manera los efectos de una variable extraa se compensen con los efectos de otra, con lo cual ambas se anulan en el conjunto. Un ejemplo de contrabalanceo (Pick y Lpez, 1998), aparece en ciertas investigaciones donde se pide a los sujetos que respondan varias veces a un mismo estmulo o a varios estmulos diferentes. Esta serie de respuestas puede provocar en los mismos dos reacciones: por un lado, fatiga, porque los sujetos se cansan de estar respondiendo; por otro lado, aprendizaje, ya que despus de presentar dos o tres veces el mismo estmulo el sujeto ya sabe cmo responder. Para evitar estos problemas, los grupos se pueden subdividir en subgrupos para que los efectos de la fatiga y/o aprendizaje queden anulados. El balanceo de las variables extraas se lleva a cabo mediante un procedimiento similar al diseo experimental del cuadrado latino (vase ms adelante en este libro) con la salvedad que en este se balancea variables independientes, no extraas. e) Aleatorizacin.- Consiste en seleccionar a los sujetos al azar (Campbell y Stanley, 1995:17) (Greenwood, 1973:109) (McCall, 1923) (Fisher, 1925). Propuesto por Fisher pero anticipado por McCall en la dcada del '20, se trata de un procedimiento que "sirve para lograr, dentro de lmites estadsticos conocidos, la igualdad de los grupos antes del tratamiento" (Campbell y Stanley, 1995:18). Esta tcnica de control es una de los ms sencillas y ms utilizadas en ciencias sociales, sobre todo cuando se llevan a cabo estudios experimentales. Se parte del postulado de que si la seleccin y distribucin de sujetos en grupos de control fue hecha al azar, podemos inferir que las variables extraas, desconocidas por el investigador, se habrn repartido tambin al azar en ambos grupos, y as quedarn igualadas (Pick y Lpez, 1998). Por ejemplo, si se quiere estudiar la influencia del ruido sobre el estrs, los sujetos elegidos no podrn ser todos ellos veteranos de guerra o bien todos ejecutivos, porque entonces las variables extraas experiencias traumticas y tipo de ocupacin estarn tambin influyendo sobre los niveles de estrs. En cambio si se toman los sujetos al azar (donde entrarn verosmilmente veteranos y no veteranos, ejecutivos y no ejecutivos), esto se supone que garantizar la heterogeneidad del grupo en cuanto a experiencias traumticas y ocupaciones, con lo que la influencia de stas se reducir considerablemente hasta un nivel aceptable donde su intervencin no resulta significativa, ya que ambos grupos (experimental y de control) tendrn aproximadamente la misma proporcin de veteranos La ventaja de la aleatorizacin no reside en su sencillez sino tambin en que permite controlar al mismo tiempo gran cantidad de variables extraas, incluso aquellas que son desconocidas para el investigador. Como no se pueden mantener constantes tantas variables extraas al mismo tiempo, se puede lograr el mismo control mediante la aleatorizacin, situacin en la cual si bien no se mantienen constantes sus valores, sus fluctuaciones quedan razonablemente neutralizadas. Cabra preguntarse: para qu recurrir a la aleatorizacin, si se puede controlar las variables extraas mantenindolas constantes? Sera como decir que al estudiar el vnculo ruido-estrs se seleccionan solamente a veteranos de guerra (es decir se mantiene constante la variable extraa experiencias traumticas pasadas) y entonces, cualquier variacin en el grado de estrs entre los que recibieron ruidos y los que no, se deber solamente al factor ruido ya que ambos grupos, al ser todos veteranos de guerra, estn en igualdad de condiciones. Esta solucin sera viable si fuese solamente una la variable extraa que hay que controlar, pero habitualmente son muchas y realmente resulta muy difcil, cuando no imposible, mantenerlas constantes a todas, o sea, reunir un grupo homogneo respecto de todas las variables extraas. De hecho, ya poder seleccionar un grupo donde todos sean veteranos de guerra y al mismo tiempo todos ejecutivos es bastante engorroso. Se elige entonces el procedimiento de la aleatorizacin: el azar, como la muerte, es el gran nivelador, y por s solo es capaz de colocar en igualdad de condiciones a todos los sujetos de un experimento. La aleatorizacin presenta la ventaja de su fcil implementacin, pero tambin que permite igualar los grupos con respecto a muchas variables extraas, incluso aquellas que son desconocidas por el investigador. Se ha adjudicado el mrito de haber introducido esta tcnica de control a Fisher, pero McCall es en rigor el precursor, cuando dijo un par de aos antes que "as como se puede lograr la representatividad por el mtodo aleatorio [...] tambin se puede conseguir la equivalencia por el mismo medio, siempre que el nmero de sujetos sea lo suficientemente grande" (McCall, 1923). La aleatorizacin es una tcnica que Campbell y Stanley prefieren al clsico mtodo de la igualacin por equiparacin (Campbell y Stanley, 1995:18). Es posible tambin una combinacin de equiparacin y aleatorizacin para obtener mayor precisin estadstica, como en el caso de la tcnica del 'bloqueo' (Campbell y Stanley, 1995:10; 35/36). f) Distribucin de frecuencias.- La tcnica de la distribucin de frecuencias (Greenwood, 1973) intenta igualar los grupos a partir de armar dos que tengan aproximadamente las mismas medidas estadsticas, como por ejemplo, que ambos tengan la misma media aritmtica y el mismo desvo estndar respecto de las variables consideradas relevantes. Pruebas de confirmacin y pruebas de refutacin Dos tipos de sospechas pueden poner en marcha una investigacin explicativa, y, en particular, un experimento: primero, se puede sospechar que cierto o ciertos factores S son la causa de un fenmeno; segundo, que cierto factor NO es la causa de un fenmeno dado a pesar de las apariencias (por ejemplo, a
Pgina 130 de 331

131
pesar de la alta correlacin). En el primer caso se emprende una prueba de confirmacin, y en el segundo caso, una prueba de refutacin. a) Si el investigador piensa que uno o varios factores son causa de cierto efecto, est haciendo una prueba de confirmacin. Una prueba de confirmacin no es una prueba donde se confirma una hiptesis, ya que el resultado puede confirmar o refutar la hiptesis (aceptacin o rechazo), sino una prueba diseada con la intencin de confirmar la sospecha de causalidad. Si una prueba de confirmacin fuese una prueba donde se confirma una hiptesis, para qu realizarla si ya se conoce el resultado? b) Si el investigador piensa, en cambio, que un cierto factor no es la causa de un fenmeno a pesar de la alta correlacin constatada entre ambas, entonces estar emprendiendo una prueba de refutacin, como por ejemplo la llamada prueba de espureidad (o prueba de falsedad, pues se busca probar que a pesar de parecer verdadera, la causa no lo es). La prueba de espureidad tiene la estructura de un experimento crucial, donde se busca decidir entre dos hiptesis alternativas y donde una de ellas debe quedar refutada. Una prueba de refutacin no es, entonces, una prueba donde se refuta una hiptesis sino slo donde se intenta refutarla, pudindose o no tener xito en dicho intento. La sospecha que pone en marcha este tipo de investigacin puede surgir antes, durante o despus de una prueba de confirmacin. A veces en el curso de la investigacin y antes de poder confirmar o rechazar la hiptesis, puede surgir una fuerte sospecha de que X no es la causa de Y sino Z, o sea, otra variable. En este punto se podrn abandonar los intentos originales por confirmar y emprender una prueba de refutacin, consistente en tratar de demostrar que X no es la causa sino Z. Si bien una investigacin puede estar orientada hacia la modalidad confirmatoria o hacia la modalidad refutatoria, cuando luego deben aplicarse pruebas estadsticas que apoyen las conclusiones se sigue clsicamente el esquema de la refutacin plantendose la denominada hiptesis nula. Experimentos bivariados y multivariados El experimento clsico es bivariado, es decir, procura probar la conexin entre una variable independiente (causa X) y una variable dependiente (efecto Y). Tal es el caso del abordaje de hiptesis como "la memoria depende de la edad", "ambientes con msica aumentan el rendimiento laboral", etc., o de aquellas otras que la divulgacin cientfica suele expresar ms literariamente como "el mal humor es una hormona" y "la tristeza atrae a los virus". Ejemplos de relaciones bivariadas son las siguientes:
X X X X = = = = Edad Nivel econmico Area geogrfica Mtodo de enseanza Y = Memoria Y = Hbitos alimenticios Y = Drogadiccin Y = Rapidez del aprendizaje Y = Voto decidido Y = Desercin escolar X X X X = = = = Incentivo Nivel socioeconmico Cantidad de ensayos Desercin escolar Y Y Y Y = = = = Rendimiento Inteligencia Nmero de errores Drogadiccin

X = Proximidad elecciones X = Padres separados

X = Frustracin X = Drogadiccin

Y = Agresin Y = Soledad

Sin embargo, segn las necesidades y posibilidades de la investigacin, tambin puede contemplar el estudio de ms de una variable independiente o ms de una dependiente, en cuyo caso se habla de experimentos multivariados, mltiples o factoriales. Tanto los experimentos bivariados como los multivariados requieren el control de las variables extraas.
Como indican Campbell y Stanley (1995:14), los diseos que estudian una sola variable por vez resultan demasiado lentos para la investigacin de ciertos temas como al aprendizaje. Desde la dcada del 50 en adelante tiende a enfatizarse la importancia de considerar diseos multivariados, sea que consistan en estudiar varias variables independientes a la vez, sea que consistan en estudiar varias variables dependientes, sea que consistan en ambas cosas simultneamente. Uno de los pioneros de estos enfoques fue Fisher, cuyos procedimientos eran multivariados en el primer sentido y bivariados en el segundo.

Por lo general, en los experimentos multivariados la variable dependiente (Y) sigue siendo una sola, y lo nico que aumenta es el nmero de variables independientes o experimentales (X1, X2, X3, etc), pues lo que se busca investigar son varios posibles factores causales al mismo tiempo, con el objeto de probar cul o cules de ellos influyen como causa y en qu medida lo hacen. Ejemplos de investigaciones multivariadas son la indagacin simultnea de la edad, el sexo y la situacin familiar como posibles causas de la drogadiccin. O la msica, el color de las paredes y la temperatura ambiente como posibles factores que influyen sobre el rendimiento laboral. Tales diseos multivariados se justifican por ejemplo cuando: a) no se puede aislar y controlar en la realidad las distintas variables independientes, con lo que no queda otro remedio que considerarlas conjuntamente mediante un diseo mltiple; b) cuando resulta menos costoso en tiempo y dinero tratar conjuntamente todas las variables en lugar de hacer varios diseos bivariados separados (como X1-Y, X2Y, etc). Ejemplos de relaciones multivariadas son las siguientes:

Pgina 131 de 331

132
Variables independientes o experimentales Variable dependiente Ejemplo 1 X1 = Nmero de palabras a recordar X2 = Nivel de ansiedad Y = Memoria Ejemplo 2 X1 = Variedad vegetal X2 = Tipo de suelo X3 = Clima Y = Velocidad de crecimiento Ejemplo 3 X1 = Mtodo de enseanza X2 = Personalidad profesor X3 = Proximidad exmenes Y = Rendimiento escolar

En sntesis:

X1 X Y
Experimento bivariado

X2 Xn

Experimento multivariado

Un inventario de relaciones entre variables Dentro del esquema de un experimento bivariado y, con mayor razn, dentro de uno multivariado, existen muchas posibilidades de combinacin entre variables. Sin pretender ser exhaustivos, los siguientes son algunos ejemplos de ellas:

Esquemas lineales 1 X X 2 X Xn X

X X Xn

X X Xn X

X 5 X Xn 6

X X Xn

Xn

X 7 X Xn X 8 X

X X Xn

z
9

Pgina 132 de 331

133
Esquemas cibernticos

10

11

12

X
Xn significa una X o ms

Se han clasificado estos diferentes esquemas en lineales y cibernticos. Estos ltimos estudian especficamente procesos de feedback o retroalimentacin: no es lo mismo estudiar como influye la alimentacin en la inteligencia (esquema lineal X Y), que estudiar como ambas variables se influyen mutuamente (X Y). Ntese que en ninguno de los esquemas se utiliza la letra Y, que representa la variable dependiente o efecto. En realidad en cualquiera de estos esquemas se puede sustituir alguna X por Y, siempre y cuando a la Y llegue una flecha y al mismo tiempo no salga ninguna flecha de ella. Estas sustituciones, sin embargo, careceran de sentido en los esquemas cibernticos, donde todas las variables son al mismo tiempo independientes y dependientes, pues todas ellas influyen y son influidas. Ejemplo 1) Este es el esquema clsico ms simple, donde se procura investigar la influencia que ejerce la variable independiente X sobre la variable dependiente Y. Por ejemplo, la influencia de las fases lunares sobre el comportamiento agresivo. Mediante este esquema puede llevarse a cabo, por ejemplo, una investigacin para averiguar si el sexo influye en la forma de percibir los mensajes publicitarios. Se pueden tomar dos grupos de personas: uno de hombres y otro de mujeres, preferiblemente elegidos al azar, y pedirles que opinen sobre un mismo mensaje publicitario que se le entrega recortado de un diario o revista. Como tems para este instrumento de medida (en este caso un cuestionario), se le pueden preguntar qu fue lo que ms le llam la atencin del aviso (imagen, texto, colores, etc.), si lo consideran interesante (mucho, poco, nada), qu cree que intenta decir el mensaje (vender, sugerir, seducir, ensear, etc), y cualquier otro tem que tambin evale especficamente la forma de percibir. Una vez contestados todos los cuestionarios, se comparan las respuestas masculinas y femeninas intentando averiguar si las diferencias son significativas (no debidas al azar, por ejemplo). Finalmente, convendr que el mensaje publicitario elegido sea neutro respecto del sexo, o sea, que publicite un producto o servicio tanto para hombres como para mujeres (una aspirina, un viaje al Caribe, etc.), para que luego las diferencias en las respuestas no sean adjudicadas a la ndole del mensaje sino a las caractersticas personales de los sujetos. Ejemplo 2) En este esquema se introduce una variable interviniente, as llamada porque interviene entre otras dos de manera tal que es efecto de la primera pero a la vez causa de la segunda. Por ejemplo, es lugar comn considerar que el fro es la causa de la gripe. Sin embargo, esta relacin no es tan directa: en rigor, podra pensarse que el fro hace que las personas busquen los lugares cerrados (variable interviniente), lo cual a su vez aumentara la probabilidad de contagio gripal. Hyman (1984:353-356) propone un ejemplo de variable interviniente. Originalmente, los datos de una investigacin descriptiva pueden hacer sospechar que el nivel de educacin de las personas (X) es lo que determina sus intenciones de voto (Y) o sea, sus intenciones por participar activamente del sistema democrtico, sea porque la educacin ensea la importancia del voto, sea porque simplemente se advirti una alta correlacin entre ambos factores (personas poco instruidas tienden a no votar, personas instruidas tienden a querer votar). Esta sospecha surge del siguiente cuadro: Cuadro I Secundario Primario Intencin de voto 92% 82%

Puede sin embargo suponerse que en realidad entre X e Y se interpone una variable interviniente: el inters en poltica (z), de forma tal que el nivel de educacin determina el inters en poltica y recin ste es la causa directa de la intencin de votar:

Pgina 133 de 331

134

Nivel de educacin

Inters en poltica

Intencin de voto

Para examinar entonces esta nueva relacin entre inters en poltica e intencin de voto se recolect la siguiente informacin, que revela la existencia de un factor causal ms directo (el inters en poltica): Cuadro II Mucho inters Moderado inters Poco inters Intencin de voto Secundario Primario 99% 98% 93% 90% 56% 59%

Se podra aqu argumentar que en rigor el nivel educativo es tambin causa, aunque indirecta, de la intencin de votar. Esto es admisible, pero tambin es cierto que lo que al cientfico le interesa a veces es una causa ms directa para poder controlar mejor la aparicin o la no aparicin de Y. Es ms difcil controlar la intencin de votar a partir del nivel educativo pues puede ocurrir que cierto tipo de educacin no despierta inters en poltica. En cambio el inters poltico es ms seguro para controlar la intencin de voto. Esta es slo una razn prctica para elegir causas directas, pero hay tambin una razn terica: no aumenta en mucho el conocimiento de un fenmeno sus causas remotas. Efectivamente, cuanto ms indirecta o remota sea la causa menor inters tendr para el cientfico: una causa remota de la drogadiccin es por ejemplo la existencia del sol, ya que si no hay sol no hay fotosntesis, y por lo tanto no hay plantas, y por lo tanto no habr ni cocana ni marihuana, con lo cual no habr drogadiccin. La explicacin de la adiccin a las drogas por el sol resulta ser inatingente. Ejemplo 3) Una investigacin que siga este esquema podra consistir en averiguar cmo influyen sobre el rendimiento escolar el mtodo de enseanza, la personalidad del profesor y la proximidad de los exmenes. Para examinar todas estas variables a la vez hay varias tcnicas, de las cuales puede citarse a modo de ejemplo la tcnica del cuadrado latino. Antes de ser utilizado en la investigacin experimental, el cuadrado latino era un simple entretenimiento que en la poca medieval reemplazaba a la televisin, slo que haca pensar. Consista en disponer en una tabla cuadrada letras de tal forma que ninguna de ellas poda repetirse en ninguna columna vertical- ni hilera horizontal-. Por ejemplo, si las letras eran A, B y C, el cuadrado latino se solucionaba del siguiente modo: A C B B A C C B A

Aqu la letra A aparece slo una vez en cualquier columna o hilera, y lo mismo sucede con las letras B y C. Una vez resuelto, se intentaran luego pruebas ms difciles utilizando por ejemplo cuatro columnas, cuatro hileras y cuatro letras, y as sucesivamente. Con el cuadrado latino, en el ejemplo indicado, se investigan cuatro variables (tres independientes y una dependiente), y el nmero de columnas o hileras guarda relacin no con el nmero de variables sino con el nmero de categoras de las mismas. Si se quiere estudiar la influencia de tres variables independientes (mtodo de enseanza, personalidad del profesor y proximidad de los exmenes) sobre la variable dependiente (rendimiento escolar), y tomar tres categoras para cada una de esas variables, puede organizarse el experimento sobre la base del siguiente cuadrado: Examen lejano M1 M2 M3 Examen intermedio M2 M3 M1 Examen prximo M3 M1 M2

Profesor A Profesor B Profesor C

En este cuadrado quedaron formados nueve casilleros. En la prctica, esto significa que se han tomado nueve grupos de alumnos, y as por ejemplo el primer grupo est formado por alumnos que tienen el profesor A, cuyos exmenes estn lejanos, y con los cuales se utiliz el mtodo de enseanza M1, y as sucesivamente con los dems grupos. Obsrvese que los nmeros 1, 2 y 3, las tres categoras de la variable mtodo de enseanza, han sido dispuestas de acuerdo al criterio del cuadrado latino: no se repite
Pgina 134 de 331

135
ninguna cifra ni por hilera ni por columna. Esto resulta muy importante porque mezcla todas las variables y categoras lo suficiente como para que no haya predominio de ninguna en especial en el conjunto de los nueve grupos. As por ejemplo, si en lugar de haber puesto en la primera hilera horizontal M1, M2 y M3 se hubiese puesto M1, M1 y M1, en esa hilera habra un neto predominio del mtodo de enseanza 1 y del profesor A. En cambio, con la disposicin del cuadrado latino se procura que no aparezcan estos predominios. Obviamente el cuadrado no contempla todas las posibilidades de combinacin, pues faltan por ejemplo los grupos con profesor A, cercana de exmenes y mtodo de enseanza 1. Esta y otras posibilidades fueron anuladas para evitar el predominio anteriormente citado, y los nueve grupos seleccionados bastan para poder emprender la investigacin con ellos sin considerar los 27 posibles, con el consiguiente ahorro de esfuerzo, tiempo y dinero. El hecho de que no aparezcan los predominios indicados tiene un motivo fundamental. Siguiendo con el ejemplo anterior, si en la primera hilera aparecen predominando el profesor A y el mtodo de enseanza 1, un muy alto rendimiento escolar en esos tres grupos no se sabra si atribuirlo al profesor o al mtodo de enseanza, con lo cual habrase desvirtuado el propsito del experimento, a saber, conocer el grado de influencia causal de cada uno de los factores considerados. Una vez que se ha seguido durante meses la evolucin de los nueve grupos formados, hipotticamente pueden haberse obtenido los siguientes valores de rendimiento escolar: Examen lejano 9 6 3 Examen intermedio 5 1 8 Examen prximo 2 8 4

Profesor A Profesor B Profesor C

Estos valores no son frecuencias sino ndices de rendimiento escolar, que pueden resultar por ejemplo del promedio de calificaciones de los alumnos de cada grupo. Por ejemplo, 9 fue el promedio de calificaciones obtenido por el grupo con profesor A, examen lejano y mtodo de enseanza 1. Cmo se analiza esta informacin? El primer lugar se puede comenzar observando dnde estn las calificaciones ms altas (8-8-9), y se ve que coinciden justamente con los grupos donde se aplic el mtodo de enseanza 1. En segundo lugar se puede observar dnde estn las calificaciones ms bajas (12-3), que aparecen en los grupos donde se us el mtodo de enseanza 3. Ambas observaciones sugieren que el factor mtodo de enseanza es muy importante para el rendimiento escolar, y adems que las otras dos variables tienen escasa influencia, ya que por ejemplo tanto en los grupos con bajas calificaciones como en los de altas calificaciones, existieron diversos profesores y diversos grados de proximidad temporal al examen. Adems, por ejemplo, cada profesor tuvo alumnos con rendimientos muy dismiles en sus respectivos tres grupos. Los resultados de la investigacin tambin podran haber sido estos otros: 5 4 4 5 9 4 Caso A 1 1 2 6 5 7 6 5 6 Caso B 6 5 6

En el caso A pueden sacarse dos conclusiones importantes: primero, que el rendimiento escolar aumenta notablemente con la feliz combinacin del profesor C que imparte el mtodo de enseanza 3 lejos de los exmenes (promedio de calificaciones 9), con lo cual pueden organizarse las clases en un colegio con estos criterios; y segundo, que la proximidad de los exmenes disminuye notablemente el rendimiento escolar, pues all las calificaciones fueron bajas (1-1-2) en comparacin con las calificaciones de los otros grupos. En el caso B el anlisis de los datos revela que ninguno de los tres factores es ms importante que el otro, ejerciendo todos ellos una influencia ms o menos igual, que hasta incluso podra ser nula. En el anlisis de los datos es tan importante darse cuenta qu dicen como qu no dicen, y as, el caso B no informa acerca del porqu de las calificaciones regulares (5-6-7), lo cual puede atribuirse a alguna variable contextual como por ejemplo la edad de los alumnos: en la adolescencia, se piensa en cualquier cosa menos en estudiar. Ejemplo 4) Este esquema resulta ser una combinacin de los esquemas 1 y 3. Ejemplo 5) Tericamente cabe la posibilidad de investigar simultneamente dos variables dependientes (dos efectos) de una nica causa. Tal es el caso del enunciado "el ruido produce estrs y tambin hipoacusia", pero en estas situaciones lo habitual es desglosar el enunciado en dos hiptesis diferentes ("el ruido produce estrs" y "el ruido produce hipoacusia") y emprender dos investigaciones diferentes y bivariadas, con lo que se vuelve al primer esquema simple (ejemplo 1). Y si bien es posible tambin desglosar una investigacin bivariada en varias bivariadas, si se prefiere la primera es porque ahorra tiempo y esfuerzo o porque no es posible separar en la realidad la influencia de las otras posibles causas.

Pgina 135 de 331

136
El esquema del ejemplo 5 sirve tambin para probar relaciones espreas. Blalock (1982:78) cita un ejemplo donde se constat una alta correlacin entre la religin y la preferencia poltica, lo que llev a pensar que era la religin no que determinaba a sta ltima. No obstante, se sospech que en realidad la influencia provena del tipo de ocupacin, o sea de si las personas eran empleados u obreros. El esquema correspondiente es:

Tipo de ocupacin

Religin

Preferencia poltica

Los datos que llevaron a la suposicin de un vnculo causal entre X e Y haban surgido del cuadro siguiente, donde figuran por igual obreros y empleados sin discriminar, ya que an no se sospechaba la influencia del tipo de ocupacin: Protestantes 62% 38% Catlicos 38% 62%

Republicanos Demcratas

Cuando se empez a pensar en la espureidad de este vnculo entre religin y preferencia poltica se construyeron dos nuevos cuadros con la misma muestra de sujetos que haba servido para el primero: uno con empleados solamente y otro con slo obreros, siendo los resultados los siguientes. Empleados Republicanos Demcratas Obreros Republicanos Demcratas Protestantes 56% 14% Protestantes 6% 24% Catlicos 24% 6% Catlicos 14% 56%

Estos datos muestran que efectivamente el vnculo X-Y es espreo, y adems agrega elementos de juicio favorables a la hiptesis del tipo de ocupacin como factor causal. Este segundo ejemplo nos muestra adems que el cuadro trivariado del primer ejemplo puede ser desglosado en dos cuadros bivariados, uno para cada categora de la variable adicional. Las pruebas de espureidad pueden establecer inequvocamente que la relacin X-Y no es causal, pero algunas veces no alcanzan para probar simultneamente que Z sea la causa real de Y, con lo cual el investigador se ve obligado a recurrir a algn tipo de diseo experimental bivariado para llevar a cabo esta ltima prueba de confirmacin, o bien a realizar una nueva prueba de espureidad si se sospecha de una nueva variable adicional Z, como factor causal real. Otro ejemplo donde puede probarse una relacin esprea es el siguiente: una investigacin descriptiva revel que exista una alta correlacin entre el estrs y el tiempo en que las personas estaban fuera del hogar. En un primer momento se sospech que el estrs se deba a esas prolongadas ausencias, pero por uno u otro motivo fue creciendo en el investigador la sospecha de que el tiempo de alejamiento (variable independiente) no era la causa del estrs (variable dependiente) sino el tipo de ocupacin de la persona (variable adicional), y que si las dos primeras estaban altamente correlacionadas era porque sobre ellas actuaba independiente y simultneamente el tipo de ocupacin (o sea, el tipo de ocupacin influye tanto sobre el estrs como sobre el tiempo de alejamiento del hogar). Esquemticamente:

Pgina 136 de 331

137
Tipo de ocupacin

Tiempo de ausencia

Estrs

En este esquema las dos flechas llenas indican que efectivamente Z es causa de X y de Y, y la flecha punteada indica que la relacin X-Y es esprea, es decir, aparenta ser un vnculo causal pero no lo es. Pero, cmo se ha procedido para llegar a esas conclusiones? La alta correlacin existente entre X e Y, que haba hecho suponer al investigador que exista un vnculo causal, surgi originalmente a partir de la lectura del cuadro siguiente: % de estresados 80% 60%

Ms tiempo fuera del hogar Menos tiempo fuera del hogar

Una vez que se afianz la creencia de que este vnculo slo tiene apariencia de causal pero en realidad no lo es (relacin esprea), y de que la causa pareca ser en realidad el tipo de ocupacin, el investigador procedi a recoger los datos en un segundo cuadro pero, esta vez, incluyendo la variable adicional Z para ver si se produca algn cambio: % de estresados Ms tiempo fuera del hogar Menos tiempo fuera del hogar 81% 78% 62% 61%

Ejecutivos No ejecutivos

Este nuevo cuadro trivariado- confirma la espureidad del vnculo original X-Y. En efecto, aqu se aprecia que la diferencia en el porcentaje de estresados entre los que estn ms tiempo y menos tiempo fuera del hogar (81% y 78%, o bien 62% y 61%), no es significativa si la comparamos con la diferencia en el porcentaje de estresados entre los ejecutivos y los no ejecutivos (81% y 62%, o bien 78% y 61%), todo lo cual indica que el estrs no es debido al mayor o menor tiempo fuera del hogar sino al tipo de ocupacin. Ms concretamente, vemos que la diferencia en cuanto a porcentaje de estresados entre ejecutivos y no ejecutivos es del 19% (que resulta de restar 81% y 62%), diferencia que es grande en comparacin con la diferencia en el porcentaje de estresados entre los que estn ms tiempo y menos tiempo alejados del hogar, que es apenas del 3% (resultado de restar 81% y 78%). Hyman la denomina variable antecedente (z) porque ocurre antes que X e Y. Otro ejemplo de variable antecedente son los factores genticos. El hecho de que se haya encontrado una alta correlacin entre la raza (X) y ciertos tipos de cncer (Y) no prueba necesariamente que la raza sea la causa de esas patologas: raza y cncer dependen de factores genticos (Z), por ejemplo: si se piensa que entre X e Y hay una relacin causal es porque se constat alta correlacin, pero sta puede deberse simplemente a que raza y cncer estn determinados por el mismo cromosoma, portador al mismo tiempo del gen del color de piel (raza) y del gen que predispone al cncer. Otro investigador podr sospechar otra cosa: que el cncer se debe a la raza y que los factores genticos no influyen, si por ejemplo piensa que el color de piel hace que los rayos ultravioletas solares penetren ms profundamente en los tejidos y tengan ms probabilidades de producirles lesiones malignas. En estos casos la investigacin estar encaminada a probar que X es causa de Y, en lugar de intentar probar que no lo es por existir otro sospechoso ms convincente (z). Ejemplos 6 y 7) Estos esquemas resultan ser combinaciones de otros esquemas. Ejemplo 8) Este caso es citado por caso por Blalock (1982:82) como ejemplo de complicacin de fuentes de espureidad: el vnculo entre religin (X superior) y preferencia poltica (Xn) puede obedecer a dos causas comunes (X izquierda y X derecha): la religin y la regin del pas. Ejemplo 9) Este esquema ilustra lo que Hyman llama variable contextual. Una investigacin descriptiva realizada en cierto pas (variable contextual) ha revelado que hay una alta correlacin entre el sexo de los estudiantes y la carrera que estos eligen, ya que por ejemplo los hombres se orientan sobre todo hacia la ingeniera y las mujeres hacia la psicologa:
Pgina 137 de 331

138

z X Y

Pas

Sexo

Carrera

Suponiendo que la investigacin haya sido hecha a escala internacional, puede llegarse a advertir que la relacin sexo-carrera sufre variaciones segn el pas considerado. Podrase quizs constatar que en los pases socialistas aumenta la proporcin de mujeres que estudian ingeniera, etc. Sobre la original relacin X-Y est entonces actuando una variable contextual (pas), la que obviamente no se tendr en cuenta si la investigacin es slo a nivel nacional, en cuyo caso deja de ser variable adicional y pasa a ser una constante. Por lo general las variables contextuales son espacio-temporales. La relacin sexo-carrera no slo puede depender de la regin o pas, sino tambin de la poca considerada: hace 60 o 70 aos la proporcin de mujeres que estudiaban medicina era considerablemente menor. Ejemplo 10) Algunas relaciones causales pueden darse en cualquiera de ambos sentidos: si bien es cierto que el incentivo aumenta el rendimiento, un mejor rendimiento puede a su vez funcionar como incentivo. O tambin la droga hace que un adolescente falte al colegio, y a su vez la ausencia del colegio hace que vaya a otros lugares donde puede adquirir el hbito. En ltima instancia cul de los dos factores ser considerado causa depende de la decisin del investigador, lo que viene a mostrar que fuera de todo contexto no se puede saber si una variable dada es independiente o dependiente, y slo se sabr viendo cmo est relacionada con otra variable: si como causa o como efecto. El solo hecho de pensar que la variable conducta en psicologa es dependiente (bajo el supuesto que la psicologa estudia las causas de la conducta), no debe excluir la posibilidad de que, en este mismo mbito, pueda ser considerada a veces como independiente, en la medida que se pretenda investigar cmo influye, por caso, el comportamiento sobre la autoestima. En algunos de sus escritos Freud consider al sntoma en su doble aspecto de causa y efecto. Lo entendi como efecto cuando sugiri que un sentimiento de culpa o una intensa fijacin anal (causa) puede hacer que el paciente sea un manitico de la limpieza (sntoma-efecto); y lo entendi como causa, cuando agreg que su mana por la limpieza (sntoma-causa) puede tornarse tan insoportable para el mismo sujeto que se defienda de ella con una extrema suciedad (efecto, o sntoma secundario). Ejemplos 11 y 12) Estos esquemas resultan ser complejizaciones del esquema 10. Estas variantes admiten an esquemas ms complejos donde intervienen 5, 10 o 30 variables al mismo tiempo con realimentaciones positivas y negativas. Por ejemplo: en una ciudad cuando aumenta el nmero de habitantes aumenta la cantidad de basura; cuando sta aumenta se incrementa la cantidad de bacterias, y esto a su vez provoca un aumento en las enfermedades infecciosas. Este incremento de enfermedades a su vez hace descender el nmero de habitantes, lo que a su vez har descender la cantidad de basura, y as sucesivamente. Finalmente, puede consignarse que: a) Los ejemplos 2 y 5 son algunas de las formas en que puede presentarse una prueba de espureidad b) Los ejemplos 5, 2 y 9 respectivamente, indican segn Hyman (1984:351) tres maneras en que las variables extraas, que l llama aqu variables adicionales (z), pueden estar ejerciendo su influencia:

Pgina 138 de 331

139
z X X Y z Y X Y

Variable antecedente EJEMPLO 5

Variable interviniente EJEMPLO 2

Variable contextual EJEMPLO 9

Los esquemas nos muestran que z acta como variable antecedente cuando ocurre cronolgicamente antes de X; que acta como variable interviniente cuando ocurre despus de X; y que acta como variable contextual cuando ocurre al mismo tiempo (simultneamente) que X.

3. LOS CNONES DE STUART MILL


En el siglo pasado, John Stuart Mill present una serie de procedimientos destinados a descubrir y a probar conexiones causales, basndose en las ideas de Francis Bacon y algunos autores medievales. En el presente tem se explican estos mtodos con ejemplos, se exponen comentarios sobre ellos, algunas de las crticas que han recibido, y se resean brevemente sus antecedentes histricos con el fin de completar la informacin sobre los conceptos de causalidad y experimento desde un punto de vista histrico. John Stuart Mill (1806-1873), filsofo, psiclogo y metodlogo de la ciencia britnico, tuvo que esperar ms de veinte aos en poder casarse con su novia Harriet Taylor, durante los cuales debi sufrir los prejuicios victorianos de la poca. Fue, tal vez por eso, un ardiente defensor de los derechos de las mujeres a decidir por s mismas y no por las presiones sociales (entre otras cosas defendi el sufragio femenino), y fue tambin tal vez por ello que, decidido a indagar las causas de tal demora, plante sus famosos cnones para descubrir y probar vnculos causales. Una presentacin de los mtodos de Mill Comenzaremos dando una explicacin sencilla de cada uno de los mtodos de Stuart Mill, para lo cual nos guiaremos siguiendo el esquema 1. Asimismo, utilizaremos un mismo ejemplo hipottico para todos los mtodos, para simplificar la explicacin. El ejemplo en cuestin es el siguiente: se trata de utilizar los mtodos de Mill para descubrir y probar las causas de los problemas de aprendizaje en los nios (fenmeno). Entre las causas posibles estn A (mala alimentacin), B (el colegio), C (el maestro), y D (los vnculos familiares). Antes de ver cmo se aplican a este problema los mtodos de S. Mill, hagamos una breve aclaracin sobre la expresin "circunstancias antecedentes" que aparece en el esquema 1. En principio, la expresin 'antecedentes' puede tener dos sentidos distintos, que podemos designar como ontolgico y metodolgico: 1) en un sentido ontolgico, circunstancias antecedentes son circunstancias que ocurren temporalmente 'antes' que el fenmeno (Copi, 1974:431). Por ejemplo, el ruido se produce antes que la reaccin de estrs; y 2) en un sentido metodolgico, circunstancias antecedentes puede aludir a que son circunstancias que deben formularse 'antes' de la aplicacin del mtodo (por ejemplo, esta interpretacin es mencionada por Losee como una condicin de aplicabilidad del mtodo de la diferencia en Losee, 1979:158). Por ejemplo, antes de investigar sobre el estrs, debemos especificar al ruido como un factor con l relacionado. Mill considera el primer sentido pues 'causa' es, para l, el antecedente necesario e invariable de un fenmeno (Fatone, 1969:167). El hecho de que, como veremos, Mill defina sus mtodos en trminos de "la circunstancia es la causa (o el efecto) de...", alude simplemente a que sus mtodos sirven tanto para buscar la causa de un efecto, como para buscar el efecto de una causa, es decir, ms genricamente, para estudiar en qu concuerdan o en qu difieren casos diferentes (Fatone, 1969:167). El segundo sentido es igualmente compatible con la posicin de Mill, porque no contradice su pretensin de que los mtodos permiten 'descubrir' causas, lo cual puede hacerse perfectamente antes de la fase probatoria, o fase de aplicacin propiamente dicha del mtodo. Finalmente, diferenciemos circunstancia antecedente de circunstancia comn y circunstancia relevante. Circunstancias comunes son aquellas circunstancias antecedentes que aparecen cuando tambin aparece el fenmeno. Por su parte, las circunstancias antecedentes elegidas se supone que son circunstancias relevantes a los efectos de la explicacin del fenmeno.

Pgina 139 de 331

140
Esquema 1: Los mtodos de Stuart Mill Mtodo Concordancia Diferencia Conjunto de concordancia y diferencia Residuos Variacin concomitante
A: Mala alimentacin B: Colegio C: Maestro

Casos N1 N2 N3 N1 N2 N1 N2 0N3 N1 N1 N2

Circunstancias Antecedentes ABC BC C AB B ABC BC C ABC Se sabe que A Se sabe que B A B 2A B

Fenmeno X X X X no-X X X no-X XYZ X Y X 2X

Conclusin C es causa (o efecto) probable de X A es causa (o efecto) probable de X B es causa (o efecto) probable de X C es causa (o efecto) probable de Z A es causa (o efecto) probable de X

X: Problema de aprendizaje Y: Problema de conducta en la escuela Z: Problema de conducta en la casa

1. Mtodo de la concordancia (o del acuerdo).- "Si dos o ms casos del fenmeno que se investiga tiene slo una circunstancia en comn, esa circunstancia es la causa (o el efecto) del fenmeno en cuestin". Las definiciones de los mtodos son prcticamente textuales de Stuart Mill (1843). Siguiendo el esquema adjunto, vemos que en el primer caso se trata de un nio con problemas de aprendizaje (X). Este fenmeno se presenta con ciertas circunstancias en comn: este nio tiene mala alimentacin (A), va a un determinado colegio (B) y tiene determinado maestro (C). Pero hemos avanzado poco: cualquiera de esos tres factores puede o no estar relacionado con el problema de aprendizaje. Para empezar a sacar algunas conclusiones, entonces, debemos seguir examinando otros casos. En el segundo caso, tenemos otro nio con el mismo problema de aprendizaje, slo que el factor A no est presente, pues est bien alimentado, pero sin embargo los otros dos s, pues concurre al mismo colegio y tiene el mismo maestro que el nio del primer caso. Hasta aqu, en principio se pueden concluir dos cosas: a) que el factor A no es la causa del problema de aprendizaje, pues ste se produce estando o no estando presente dicho factor; y b) que la causa del problema de aprendizaje queda circunscripto a los factores B y C, o a alguno de ellos. Sin embargo, la conclusin que nos debe interesar hasta ahora, de acuerdo al espritu de los mtodos de Mill, es la segunda: se trata de procedimientos que no intentar probar que un factor NO es causa de otro, sino que probar que un factor SI lo es. A diferencia del enfoque popperiano, aqu el propsito de la investigacin no es refutar sino probar factores, an cuando un resultado de esta prueba pueda desembocar secundariamente en una refutacin. Retomando: como todava nuestra conclusin no es satisfactoria (no sabemos si el factor causal es B o C), pasamos a examinar un tercer caso, donde est presente como circunstancia solamente C, y vemos que el efecto 'problema de aprendizaje' sigue producindose. Ahora s podemos concluir que C tiene importancia causal respecto de X, porque hay una 'concordancia': cada vez que aparece C aparece X, cuando todos los dems factores varan. Veamos este otro ejemplo: "Es interesante sealar que uno de los sntomas frecuentes de los casos de extrema angustia ante el combate es una inhibicin del lenguaje, que puede ir desde la mudez completa hasta la vacilacin y el tartamudeo. Anlogamente, el que sufre de pnico escnico agudo es incapaz de hablar. Muchos animales tienden a dejar de emitir sonidos cuando estn atemorizados, y es obvio que esta tendencia tiene un valor adaptativo, al impedirles atraer la atencin de sus enemigos. A la luz de estos elementos de juicio, cabra sospechar que el estmulo del temor tiene una tendencia innata a provocar la respuesta de una suspensin de la conducta vocal" (John Dollard J y Millar N, "Personalidad y psicoterapia", citado por Copi, 1974:428). El esquema sera el siguiente: Caso Caso 1 Caso 2 Caso 3 Circunstancia Antecedente Fenmeno AB Mudez A C Mudez A D Mudez

A: temor, angustia, pnico. B: estar en combate. C: estar en un escenario. D: un animal en su hbitat. Pgina 140 de 331

141
Los factores variables, es decir, las circunstancias que no estn siempre presentes cada vez que se produce mudez son los lugares: una batalla, un escenario, una selva, pero el factor comn es siempre el temor, de lo cual se concluye la relacin causal entre el temor y la mudez: en todos los casos, ambos factores 'concuerdan'. Otro ejemplo: "Se observ que los habitantes de varias ciudades presentaban una proporcin mucho menor de caries dentales que el trmino medio de toda nacin y se dedic cierta atencin a tratar de descubrir la causa de este fenmeno. Se hall que las circunstancias propias de estas ciudades diferan en muchos aspectos: en latitud y longitud, en elevacin, en tipos de economa, etc. Pero haba una circunstancia que era comn a todas ellas: la presencia de un porcentaje raramente elevado de flor en sus aguas, lo que significaba que la dieta de los habitantes de esas ciudades inclua una cantidad excepcionalmente grande de flor. Se infiri de ello que el uso de flor puede causar una disminucin en la formacin de caries dentales y la aceptacin de esta conclusin condujo a adoptar tratamientos a base de flor, para este propsito, en muchas localidades (Copi, 1974:427). 2. Mtodo de la diferencia.- "Si un caso en el cual el fenmeno que se investiga se presenta y un caso en el cual no se presenta tienen todas tienen todas las circunstancias comunes excepto una, presentndose sta solamente en el primer caso, la circunstancia nica en la cual difieren los dos casos es el efecto, o la causa, o una parte indispensable de la causa de dicho fenmeno". En el primer caso, hay un nio con problemas de aprendizaje (X) que tiene mala alimentacin (A) y que va a un determinado colegio (B). En cambio, en un segundo caso est la situacin de un nio sin problemas de aprendizaje (no-X), con buena alimentacin pero que va al mismo colegio. Del anlisis de ambos casos se puede concluir que A es la causa del problema, porque cuando aparece A el fenmeno se produce y cuando no aparece A el fenmeno no se produce (o si se quiere, porque la 'diferencia' entre la produccin y la no produccin del fenmeno radica en A). Ejemplo: "En 1861, Pasteur finalmente aport una prueba general contra la generacin espontnea. Hizo hervir un caldo de carne en un frasco con un cuello delgado muy largo hasta que no qued ninguna bacteria. Esto se probaba por el hecho de que poda mantener el caldo en el frasco durante un periodo indefinido sin que se produjeran cambios, pues el estrecho cuello no permita que nada penetrara en l. Luego rompi el cuello y en pocas horas aparecieron microorganismos en el lquido, y la carne estaba en plena descomposicin. Prob que el aire transportaba tales organismos filtrndolo dos veces con filtros estriles y mostrando que poda provocar la putrefaccin con el primer filtro, pero no con el segundo (H Pledge, "La ciencia desde 1500". Citado por Copi, 1974:433). 3. Mtodo conjunto de la concordancia y la diferencia.- "Si dos o ms casos en los cuales aparece el fenmeno tienen solamente una circunstancia en comn, mientras que dos o ms casos en los cuales no aparece no tienen nada en comn excepto la ausencia de esta circunstancia, la circunstancia nica en la cual difieren los dos grupos de ejemplos es el efecto, o la causa, o parte indispensable de la causa del fenmeno". Este mtodo resulta de aplicar la concordancia y la diferencia en una misma investigacin. Por ejemplo: a) Aplicando el mtodo de la concordancia a los casos 1 y 2, se concluye provisoriamente que la causa del problema de aprendizaje puede ser B o C. b) Para decidir cul de estos dos factores es la causa, aplicamos ahora el mtodo de la diferencia a los casos 2 y 3, donde podemos concluir que la causa del problema es B. El mtodo de la diferencia y el mtodo conjunto de la concordancia y la diferencia son los dos nicos procedimientos donde contamos con fenmenos o efectos que NO se han producido (no-X). Ejemplo: "Eijkman aliment a un grupo de pollos exclusivamente con arroz blanco. Todos ellos desarrollaron una polineuritis y murieron. Aliment a otro grupo de aves con arroz sin refinar. Ni uno solo de ellos contrajo la enfermedad. Luego reuni los residuos del refinamiento del arroz y aliment con ellos a otros pollos polineurticos, que al poco tiempo se restablecieron. Haba logrado asignar con exactitud la causa de la polineuritis a una dieta defectuosa. Por primera vez en la historia, haba conseguido producir experimentalmente una enfermedad debida a deficiencias de alimentacin y haba podido curarla. Fue un trabajo notable, que dio como resultado medidas teraputicas inmediatas (Jaffe B, "Avanzadas de la ciencia". Citado por Copi, 1974:436). 4. Mtodo de los residuos.- "Restad de un fenmeno la parte de la cual se sabe, por inducciones anteriores, que es el efecto de ciertos antecedentes, y entonces el residuo del fenmeno es el efecto de los antecedentes restantes". El primer caso corresponde a un nio con mala alimentacin (A), que va a un determinado colegio (B) y que tiene determinado maestro (C). Este nio presenta problemas de aprendizaje (X), problemas de conducta en la escuela (Y) y problemas de conducta en el hogar, es decir, se trata de una configuracin de tres fenmenos discriminables y relacionados entre s.

Pgina 141 de 331

142
Por los resultados de investigaciones anteriores, sabemos que A es la causa de X, y que B es la causa de Y. Por lo tanto, C ser la causa de Z, por ser el factor 'residual' de un fenmeno tambin 'residual'. Como puede apreciarse, este mtodo slo puede aplicarse cuando se aplic alguno de los otros mtodos de Mill, gracias a los cuales se haba podido concluir que A es causa de X y que B es causa de Y. Un ejemplo muy citado de este mtodo es el descubrimiento del planeta Neptuno por Adams y Le Verrier. Se haba estudiado el movimiento del planeta Urano con ayuda de las teoras de Newton, y se bosquej su rbita en la suposicin de que el Sol y los planetas interiores a ella eran los nicos cuerpos que influan sobre ella. Pero las posiciones de Urano obtenidas por clculo no coincidan con las observadas. Suponiendo que estas diferencias podran explicarse por la accin gravitacional de un planeta exterior a la rbita de Urano, se calcul la posicin de tal planeta hipottico (cuya conducta se ajustara a los principios comunes de la mecnica celeste), tomando como base para el clculo las perturbaciones en el movimiento de Urano. En las cercanas del lugar calculado fue descubierto, en efecto, el planeta Neptuno. Dicho descubrimiento se acredita por ese motivo al mtodo de los residuos (Cohen y Nagel, 1979:87-88). El mtodo de los residuos resulta particularmente til en aquellos casos donde no podemos encontrar un caso donde falte alguna posible causa, o donde las posibles causas no pueden ser eliminadas por experimentacin. En el ejemplo del problema de aprendizaje, cuando no es posible encontrar ni producir ningn caso en el cual falte A, B o C. Fatone da otro ejemplo: "el pndulo puede ser sustrado a la influencia de una montaa, pero no a la influencia de la tierra, para ver si seguir oscilando en caso de que la accin de la tierra fuera suprimida" (Fatone, 1969:168). 5. Mtodo de la variacin concomitante.- "Un fenmeno que vara de cualquier manera, siempre que otro fenmeno vara de la misma manera es, o una causa, o un efecto de este fenmeno, o est conectado con l por algn hecho de causalidad". En los dos casos aqu considerados, el problema de aprendizaje (X) del nio tiene como circunstancias comunes tanto la mala alimentacin (A) como el colegio donde concurre (B). As las cosas no podemos concluir nada, salvo que podamos constatar que cuando aumenta la alimentacn deficitaria, tambin se agrava correlativamente el problema de aprendizaje. Esquemticamente: si la mala alimentacin aumenta al doble (2A) y correlativamente el problema de aprendizaje se agrava tambin al doble (2X), entonces podemos concluir que A es la causa de X, porque se ha producido una 'variacin concomitante' entre A y X: a medida que se incrementa un factor, se incrementa el efecto. Como podemos apreciar, este es el nico mtodo de los cinco que introduce un anlisis cuantitativo del problema: los cuatro mtodos anteriores implicaban una consideracin cualitativa, es decir, de 'presencia' o 'ausencia' de factores, y no de cambios cuantitativos en los mismos. Ejemplo: El fenmeno de las mareas puede podra producirse por la atraccin gravitacional de la luna o por la presencia de estrellas fijas. Sin embargo, cuando se produce un cambio en la atraccin gravitacional lunar, tambin se produce una alteracin en el nivel del mar. De esta manera, se puede concluir que las mareas estn producidas por la atraccin gravitacional lunar. Crticas y comentarios a los mtodos de Mill Los cnones de Mill estaban destinados a averiguar las relaciones de causalidad, esto es, los "antecedentes invariables e incondicionales" de todos los fenmenos (Ferrater Mora, 1979:2228). La expresin 'averiguar' alude aqu tanto a descubrir relaciones causales, como a probarlas. En efecto, Stuart Mill haba propuesto sus mtodos como instrumentos de 'descubrimiento' de conexiones causales, y como procedimientos de 'prueba' de las mismas. Una buena parte de las crticas apuntan precisamente a estas dos pretensiones, que examinaremos por separado. Un examen ms completo de estas crticas pueden encontrarse en (Copi, 1974:451-459) y en (Cohen y Nagel, 1979:72-90). 1. Los mtodos de Mill como instrumentos para descubrir conexiones causales.- Imaginemos que, aplicando el mtodo de la concordancia para averiguar las causas del problema de aprendizaje, consideramos un cuarto caso donde incluimos una nueva circunstancia antecedente D (por ejemplo, ser drogadicto), y que haba estado presente tambin en los tres casos anteriores. En esta nueva situacin, el esquema sera el siguiente: Caso Caso Caso Caso 1 2 3 4 ABCD BCD CD D X X X X

Si constatamos que el problema de aprendizaje (X) se produce tambin en presencia del factor D, concluiremos entonces que D es la causa de X. Por lo tanto, cuando habamos aplicado el mtodo de la concordancia considerando solamente los tres primeros casos, habamos concluido errneamente que la causa era C, debido a que no habamos

Pgina 142 de 331

143
considerado 'todos' los factores atinentes o relevantes a la cuestin. El mtodo no nos ayuda entonces a 'descubrir' nuevos posibles factores atinentes, entre los cuales podra estar la 'verdadera' causa. Esta crtica es extensible a los dems mtodos. Como indica Copi, "los mtodos no pueden usarse a menos que se tengan en cuenta todas las circunstancias atinentes al fenmeno. Pero las circunstancias no llevan rtulos que digan 'atinente' o 'no atinente'. Los problemas de atinencia son problemas relativos a la 'conexin causal', algunos de los cuales, al menos, deben hallarse resueltos 'antes' de que sea posible aplicar los mtodos de Mill. Por consiguiente, los mtodos de Mill no son 'los' mtodos para descubrir conexiones causales, pues algunas de estas conexiones deben ser conocidas previamente a toda aplicacin de esos mtodos" (Copi, 1974:456). Crticas similares formulan Cohen y Nagel (1979:89), cuando sostienen que para que los mtodos de Mill sirvan para descubrir causas, deben incluir entre las circunstancias antecedentes la causa verdadera: "si no hemos tenido la fortuna de incluirla, eliminaremos todas las alternativas sin descubrir la causa de X". El problema no pasa solamente por no haber seleccionado todos los factores atinentes, sino que tambin puede pasar por haberlos seleccionado mal. Un ejemplo particularmente risueo nos lo suministra Copi (1974:453): tomo whisky con soda y me emborracho, tomo vino con soda y me emborracho, tomo ron con soda y me emborracho, y tomo gin con soda y tambin me emborracho. Por lo tanto, lo que me emborracha es la soda, porque concuerda siempre la soda con la borrachera. Esta mala seleccin de los factores relevantes me impide descubrir la verdadera causa de la borrachera, lo que ilustra otro aspecto del problema de los mtodos de Mill para descubrir conexiones causales. En realidad, el factor concordante que habra que haber seleccionado es el componente de alcohol presente en todas las bebidas consideradas. 2. Los mtodos de Mill como reglas para probar conexiones causales.- Copi (1974:457-459) sostiene dos razones para negarles valor demostrativo a los cnones de Mill. a) Puesto que los mtodos, como hemos visto en el pargrafo anterior, no pueden ayudarnos a seleccionar todos los factores atinentes, la afirmacin de que uno de los factores considerados es la causa del fenmeno no tiene valor de prueba. El experimento de la soda que emborracha no logr probar la causa de la borrachera. b) Las correlaciones entre factores y fenmenos no siempre son prueba de un vnculo causal, y los mtodos de Mill, especialmente el de las variaciones concomitantes, concluyen un vnculo causal all donde hay una simple correlacin. Por ejemplo (Copi, 1974:458), el hecho de que la velocidad diaria del viento en Chicago vare proporcionalmente durante un ao o ms con la tasa de nacimientos en la India, no indica que un factor sea la causa del otro. Desde ya, cuanto mayor sea el nmero de casos donde hay correlacin, tanto mayor ser la probabilidad que dicha relacin sea causal, pero, como no se pueden examinar todos los casos posibles, las conclusiones nunca sern seguras. Tal el tipo de cuestionamiento que hace Copi a los mtodos de Mill como instancias de prueba de conexiones causales: los mtodos de Mill son inductivos, no deductivos, y por tanto nunca podrn conferir necesariedad a un vnculo causal. Este tipo de crtica podemos incluso encontrarla varios siglos antes, cuando Nicols de Autrecourt (siglo XIV) cuestiona el mtodo de la concordancia propuesto por entonces diciendo que no puede establecerse que una correlacin cuya vigencia se ha observado deba continuar mantenindose en el futuro, con lo cual no se puede conseguir conocimiento necesario de las relaciones causales (Losee, 1979:52). En la misma lnea de pensamiento se inscribe la conocida posicin escptica de Hume (1711-1776) al respecto (Losee, 1979:110). Tengamos presente, por ltimo, que la presencia de correlacin no asegura que haya un vnculo causal, por cuanto la correlacin entre los fenmenos estudiados podra muy bien deberse a que son efectos de una misma causa. Stuart Mill haba llegado a advertir esto cuando consider los fenmenos altamente correlacionados del da y de la noche (Losee, 1979:164): en realidad, dicha correlacin obedece a que ambos fenmenos dependen de ciertas condiciones, como por ejemplo la rotacin diurna de la tierra, lo que viene a mostrarnos que Mill tuvo conciencia de las limitaciones de sus mtodos. Examinmoslas brevemente. 3. La autocrtica de Stuart Mill.- Los diversos cuestionamientos que hemos detallado apuntan, en general, al mal uso de los mtodos ms que al pensamiento original de Stuart Mill, por cuanto ste ya se haba percatado acerca de los alcances y las limitaciones de ellos. Mill haba propuesto sus mtodos como reglas para probar conexiones causales, pero "en sus momentos ms prudentes, sin embargo, restringi la prueba de la conexin causal a aquellos argumentos que satisfacan el mtodo de la diferencia" (Losee, 1979:165). Adems, Mill sostuvo que el mtodo de la diferencia era el ms importante en cuanto a su potencial para descubrir causas, y que, en este sentido, contrastaba con el mtodo de la concordancia, que tena dos importantes limitaciones (Losee, 1979:158159). El primer lugar, el mtodo de la concordancia slo sirve cuando se hizo un inventario exacto de las circunstancias relevantes, con lo cual su xito depende de las hiptesis previas sobre las circunstancias relevantes. En nuestro ejemplo del problema de aprendizaje, ya hemos dicho que si no inclumos el factor drogadiccin como causa y ste factor es efectivamente causal, las conclusiones seguirn un camino equivocado.

Pgina 143 de 331

144
En segundo y ltimo lugar, el mtodo de la concordancia no sirve si est funcionando una pluralidad de causas. "Mill reconoci que un tipo determinado de fenmenos puede ser el efecto de diferentes circunstancias en diferentes ocasiones" (Losee, 1979:158-159). Por ejemplo, en la siguiente situacin: Caso 1 2 3 Circunstancias antecedentes Fenmenos ABEF abe ACD acd ABCE afg

es posible que B causara 'a' en los casos 1 y 3, y que D causara 'a' en el caso 2. Debido a que esta posibilidad existe, slo se puede conclur que es probable que A sea la causa de 'a'. En general, Stuart Mill estableci la limitacin de sus mtodos en su carcter inductivo. En efecto, Para l, "la lgica debe estudiar principalmente la teora de la induccin como el nico mtodo adecuado para las ciencias. Los conocimientos cientficos son producto de la induccin, pues las mismas generalidades ideales que se suponen adquiridas 'a priori' son el resultado de generalizaciones inductivas. La previsin de los fenmenos tiene, por tanto, un carcter probable [que] no es nunca seguridad definitiva" (Ferrater Mora, 1979:2227-2228). 4. Reivindicacin de los mtodos de Mill.- Copi los cuestiona los mtodos de Mill como instancias de descubrimiento y de prueba, pero los reivindica diciendo que, si se agrega una hiptesis adicional que postule un universo finito de causas, pueden obtenerse conclusiones seguras o necesarias, es decir, fundadas en la deduccin, y no en la induccin (los mtodos de Mill son esencialmente inductivos). En el ejemplo del problema de aprendizaje, si agregamos como premisa adicional que las 'nicas' causas posibles del problema de aprendizaje X son A, B y C, entonces la conclusin de que C es la causa efectiva es necesaria. As presentados, los mtodos de Mill "aparecen como instrumentos para someter a ensayo la hiptesis. Sus enunciados describen el mtodo del 'experimento controlado', que constituye un arma indispensable de la ciencia moderna" (Copi, 1974:461). Copi redondea su reivindicacin, sealando que si bien las leyes causales nunca pueden ser descubiertas con los mtodos de Mill, ni pueden estos establecer 'demostrativamente' [deductivamente] su verdad, estos mtodos "constituyen los modelos bsicos a los cuales debe adecuarse todo intento por confirmar o refutar, mediante la observacin o el experimento, una hiptesis que confirme una conexin causal" (Copi, 1974:464). Cohen y Nagel tambin cuestionan los mtodos como procedimientos de descubrimiento y de prueba, pero los reivindican indicando que, aunque no pueden servir para probar causas, sirven para eliminar otras. Copi dice: "los mtodos de Mill son esencialmente eliminatorios". En el ejemplo del problema de aprendizaje, aunque mtodos como el de la concordancia no prueban con certeza que C es la causa de X, s prueban con certeza que A y B no lo son. Cohen y Nagel sealan, as, que los mtodos de Mill "son de indudable valor en el proceso de llegar a la verdad, pues al eliminar las hiptesis falsas, restringen el campo dentro del cual podemos encontrar las verdaderas. Y an cuando no logren eliminar todas las circunstancias irrelevantes, nos permiten establecer (con cierta aproximacin) de modo tal las condiciones para la produccin de un fenmeno que podamos distinguir aquella hiptesis que, desde el punto de vista lgico, es preferible a sus rivales" (Cohen y Nagel, 1979:90). Antecedentes histricos Stuart Mill no es del todo original al plantear sus mtodos. Su mrito reside en haber revisado, sistematizado y propagandizado las ideas al respecto de Francis Bacon quien, a su vez, tampoco fue el primero en formular los mtodos inductivos, ya que encontramos importantes antecedentes en algunos pensadores medievales, como por ejemplo en Robert Grosseteste, Juan Duns Escoto o Guillermo de Occam. Consiguientemente, podemos trazar dos etapas histricas hasta desembocar en los mtodos de Mill del siglo XIX: los medievales y Francis Bacon (despus de Bacon y antes de Stuart Mill, el ingls David Hume haba escrito ocho reglas "para juzgar sobre causas y efectos", entre las cuales estaban los mtodos de la concordancia, de la diferencia y de las variaciones concomitantes. Ver Losee, 1979:115). Para todo ello, nos guiaremos por el esquema 2. Esquema 2: Algunos antecedentes histricos de los mtodos de Mill Grosseteste (1168-1253) Concordancia Diferencia Conjunto V.Concomitante Duns Escoto (1265-1308) B G. de Occam (1280-1349) C D E Galileo (1564-1642) F. Bacon (1561-1626) F G H

(Para las letras maysculas, remitirse al texto). Pgina 144 de 331

145
1. Los medievales.- A) Grosseteste contribuy a desarrollar nuevas tcnicas inductivas para descubrir principios explicativos. Sugiri por ejemplo un procedimiento para saber si una hierba tena efecto purgante: deban examinarse numerosos casos donde se administrase la hierba en condiciones donde no hubiera otros agentes purgantes. Se trata (Losee, 1979:42) de un procedimiento inductivo que luego describira Stuart Mill como el mtodo conjunto de la concordancia y la diferencia. B) Duns Escoto propuso el mtodo de la concordancia, pero le asign mritos muy modestos: sostena que, si cada vez que se daba la circunstancia A se produca el efecto X, varindose todas las otras circunstancias, el cientfico estaba autorizado a afirmar que A 'puede' ser la causa de X, pero no a que necesariamente A 'debe' ser su causa (Losee, 1979:43). Escoto habl de 'uniones disposicionales' entre un efecto y su circunstancia antecedente, es decir, de uniones constatadas en la experiencia y que, como tales, no podan ser consideradas uniones necesarias. C) Nos cuenta Losee: "Occam formul un procedimiento para extraer conclusiones acerca de las uniones disposicionales siguiendo un Mtodo de la Diferencia. El mtodo de Occam consiste en comparar dos casos: un caso en que el efecto est presente, y un segundo caso en que el efecto no est presente. Si se puede mostrar que existe una circunstancia que est presente cuando el efecto est presente, y ausente cuando est ausente [...], entonces el investigador est autorizado a concluir que la circunstancia 'puede ser' la causa del efecto". "Occam mantena que, en el caso ideal, el conocimiento de una unin disposicional poda establecerse sobre la base de solamente una asociacin observada. Sealaba, sin embargo, que en un caso as se debe estar seguro de que todas las dems causas posibles del efecto en cuestin no estn presentes. Observ que, en la prctica, es difcil determinar si dos conjuntos de circunstancias difieren slo en un aspecto. Por esta razn, instaba a investigar muchos casos, con el fin de minimizar la posibilidad de que un factor no localizado sea el responsable de la aparicin del efecto" (Losee, 1979:43). D) Crombie (1979:36) indica que Occam tambin propuso un mtodo similar al luego conocido como mtodo de la concordancia y la diferencia. Mediante dicho procedimiento, Occam pens que, ya que el mismo efecto poda tener diferentes causas, era preciso eliminar las hiptesis rivales. E) En su "Dilogo sobre los dos sistemas principales del mundo" (1632), Galileo hace discutir a Salviati (que representa el pensamiento de Galileo) y a Simplicio (que representa a los aristotlicos). Refiere Crombie (1979:126-127) que en este texto Galileo habla de un procedimiento igual al mtodo de las variaciones concomitantes de Stuart Mill (o al mtodo de los grados de comparacin de Bacon), cuando dice: "As digo que si es verdad que un efecto puede tener solamente una causa, y si entre la causa y el efecto hay una conexin precisa y constante, entonces cuando quiera que se observe una variacin precisa y constante en el efecto, debe haber una variacin precisa y constante en la causa". Para ejemplificar el procedimiento, Galileo nos suministra el ejemplo de las mareas, que hemos explicado brevemente ms arriba. Sin embargo (Losee, 1979:65), Galileo no aval los otros mtodos de Bacon: las hiptesis sobre idealizaciones no pueden obtenerse de la induccin por enumeracin simple ni por los mtodos de la concordancia y la diferencia, siendo preciso que el cientfico intuya qu propiedades de los fenmenos son la base adecuada para la idealizacin, y qu propiedades pueden ignorarse. 2. Francis Bacon.- Bacon propondr sus 'tablas' como un nuevo procedimiento inductivo que reemplazara al hasta entonces conocido mtodo de la induccin por simple enumeracin, tambin llamado induccin incompleta. En su "Novum Organum", nos cuenta que "esta especie de induccin que procede por la va de la simple enumeracin no es sino un mtodo de nios, que no conduce sino a conclusiones precarias y que corre los ms grandes riesgos por parte del primer ejemplo contradictorio que puede presentarse; en general, se pronuncia segn un nmero de hechos demasiado pequeo, y solamente de esa especie de hechos que se presentan a cada instante. Pero la induccin verdaderamente til en la invencin y en la demostracin de las ciencias y de las artes hace una eleccin entre observadores y las experiencias, separando de la masa, por exclusiones y rechazos convenientes, los hechos no concluyentes; luego, despus de haber establecido proposiciones en nmero suficiente, se detiene al fin en las afirmativas y se atiene a estas ltimas" (Bacon F, "Novum Organum", I, 105). Para aclarar estas ideas de Bacon, retomemos brevemente el ejemplo del problema de aprendizaje y veamos cmo podra resolverse mediante la induccin por enumeracin simple y por la induccin baconiana. a) Induccin por enumeracin simple: el primer nio pertenece al colegio B, y tiene problemas de aprendizaje; el segundo nio tambin pertenece al colegio B y tambin tiene problemas de aprendizaje; y as sucesivamente con otros nios. Por lo tanto, se concluye que la causa del problema de aprendizaje es el colegio B. b) Induccin baconiana: usando por ejemplo el mtodo de la concordancia, vemos que el primer nio pertenece al colegio B, tiene al maestro C y tiene mala alimentacin, y vemos que tiene problemas de aprendizaje. El caso del segundo nio es igual, pero est bien alimentado, y el caso del tercer nio es igual pero est bien alimentado y no va al colegio B. Por lo tanto, puesto que en los tres casos concuerda siempre el maestro C, esta ser probablemente la causa del problema de aprendizaje. Esta conclusin es ms firme que aquella otra ofrecida por el mtodo de la induccin por enumeracin simple. Ciertos autores (por ejemplo Fatone 1969:165) han declarado que la propuesta de F. Bacon se opone a la induccin
Pgina 145 de 331

146
llamada completa, consistente en derivar del total de casos una afirmacin general que vale precisamente para todos esos casos. En rigor, la propuesta de Bacon iba tanto contra la induccin por enumeracin simple como contra la induccin completa o matemtica. Para l, ni la experiencia bruta ni los razonamientos vacos, respectivamente, son el camino de la ciencia. El cientfico no debe ser, deca Bacon en el libro 1, aforismo 95 del "Novum Organum", ni una hormiga, que lo nico que hace es almacenar (comida = informacin), ni una araa que teje redes con material fabricado por ella misma. El cientfico debe estar en el punto medio: debe ser una abeja que extrae materiales en los jardines, pero luego puede elaborar esa materia prima con un 'arte que le es propio'. Esta elaboracin de la informacin que nos brinda la naturaleza es posible gracias a la utilizacin de una nueva herramienta (un 'novum organon'), constitudo fundamentalmente por las 'tablas', antepasados directos de los 'mtodos' de Mill. Las 'tablas' de Bacon son tres: de presencia, de ausencia y de comparacin, y corresponden, respectivamente, a los mtodos de la concordancia, de la diferencia y de las variaciones concomitantes (F, G y H del esquema 2). "En la tabla de presencia se registrarn todos los casos diferentes en que se da el mismo fenmeno; en la de ausencia, los casos en que el fenmeno que interesa no se da a pesar de que tienen circunstancias comunes con aquel en que se da; en la tabla de comparacin, los casos en que el fenmeno presenta variaciones o diferencias [...]. As fundaba Bacon el mtodo, que consiste en buscar los fenmenos tales que: cuando se da uno de ellos se da el otro; cuando no se da uno de ellos no se da el otro; y cuando uno de ellos vara, vara el otro. Comprobada esta triple relacin, poda enunciarse la relacin forzosa que exista entre los hechos" (Fatone, 1969:166). Los mtodos de Mill y los mtodos experimentales actuales A partir de Stuart Mill, los mtodos para probar conexiones causales siguieron evolucionando de manera notable hasta muy entrado el siglo XX. En tren de establecer una comparacin entre los cnones de prueba de Mill y los actuales, podemos trazar, en forma muy escueta, el siguiente panorama. Los mtodos experimentales actuales presentan una gran semejanza con los mtodos de la diferencia y de la variacin concomitante, mientras que tienen poco que ver con los mtodos de la concordancia y de los residuos. La semejanza con el mtodo de la diferencia radica en que precisamente en los modelos experimentales actuales, una situacin tpica es aquella donde se comparan dos grupos: a uno se lo somete a la influencia de un posible factor causal A y al otro no, en la esperanza de que luego el primer grupo presente el efecto X y el segundo no. La semejanza con el mtodo de la variacin concomitante radica en el anlisis cuantitativo, tpico de los mtodos actuales. Muchas veces no basta con someter a un grupo a la influencia de un posible factor causal A, sino que adems se introducen variaciones cuantitativas en dicho factor para ver si se produce una variacin concomitante en el efecto X. Un ejemplo son los experimentos sobre nuevas drogas para curar enfermedades. El mtodo de los residuos no guarda relacin con los mtodos actuales sencillamente porque no se trata de un procedimiento experimental. Hemos ya dicho que uno de los motivos por los cuales se utilizaba este mtodo era para investigar situaciones donde no se podan introducir cambios artificialmente. El mtodo de la concordancia, por ltimo, es bastante diferente a ciertos procedimientos experimentales actuales tpicos. Mediante el mtodo de Mill, comparbamos distintos casos donde se produce el efecto X y donde hay diferentes causas posibles. Por ejemplo, en un caso tenemos las causas posibles A-B-C y el efecto X. En cambio, en el procedimiento actual no se hace un descarte progresivo de causas hasta que quede, por ejemplo, C. En su lugar, se selecciona previamente la causa C y se la somete a prueba y los dems factores (A y B) son tratados como variables extraas, buscndose controlar su influencia con procedimientos tales como la aleatorizacin. Un pionero de este procedimiento fue Fisher, que lo propone alrededor de 1925 (Fisher, 1954).

Pgina 146 de 331

147

CAPTULO 9: LAS ETAPAS DE LA INVESTIGACIN TPICA


A lo largo del presente texto se explicarn los pasos o etapas de una investigacin tpica, es decir, emprica. Este tipo de investigacin podr ser pura o aplicada, pero en general seguir la pauta de una investigacin correlacional o explicativa, primaria y cuantitativa. Cada etapa ser tratada en detalle en los siguientes captulos de este libro: Etapas de la investigacin tpica (visin panormica) 1) Planteo del problema 2) Revisin bibliogrfica 3) Planteo del marco terico 4) Planteo de objetivos 5) Formulacin de la hiptesis 6) Identificacin, categorizacin y operacionalizacin de las variables 7) Definicin de la poblacin 8) Seleccin de la tcnica de muestreo 9) Seleccin o construccin de los instrumentos de medicin 10) Seleccin del diseo de investigacin 11) Recoleccin y organizacin de los datos 12) Anlisis e interpretacin de los datos 13) Presentacin de los resultados Captulo Captulo 10

Captulo 11 Captulo 12 Captulo 13 Captulo 14 Captulo 15

En el presente captulo se presenta una primera vista panormica de las etapas de una investigacin tpica, y que habitualmente se cumplen en la mayora de las investigaciones que podemos encontrar en las publicaciones cientficas. As es que a continuacin se explica brevemente cada etapa utilizando un ejemplo nico: una investigacin que indague acerca de las relaciones entre estado civil y estado de nimo. Tngase presente que, dependiendo de cada investigacin en particular, algunos de los pasos indicados pueden saltearse, cambiarse el orden, e incluso volver sobre alguno de los pasos anteriores. 1) Planteo del problema.- El problema se expresa mediante una pregunta, la cual deber ser contestada en la investigacin. Por ejemplo: Existe alguna relacin significativa entre estado civil y estado de nimo?. Debe diferenciarse el problema del tema. El tema de la investigacin es bsicamente la variable dependiente. En nuestro ejemplo, cualquiera de ambas podra serlo: el estado civil puede depender del estado de nimo (estoy triste por lo tanto me divorcio) o el estado de nimo puede depender del estado civil (estoy soltero y por lo tanto estoy alegre). En este paso, por tanto, deberemos decidir cul ser nuestra variable dependiente. Por ejemplo, elegimos estado de nimo. 2) Revisin bibliogrfica.- Su funcin bsica es la de conocer qu soluciones dieron otros autores al mismo problema o problemas similares que pretendemos resolver en nuestra investigacin. Emprendemos aqu la ardua tarea de revisar todo las investigaciones realizadas concernientes a la relacin entre estado de nimo y estado civil, para lo cual deberemos recorrer bibliotecas, la red Internet, etc. La idea es hacer una sntesis de todo lo encontrado utilizando solamente los abstracts de las investigaciones encontradas. Tal vez podramos encontrarnos con que nuestra investigacin ya fue realizada, pero ello no debe desilusionarnos: por lo general nuestra investigacin partir de muestras diferentes, utilizar otros instrumentos de medicin, etc., lo cual la convierte en una investigacin original que complementar la ya realizada. En todo caso, en nuestro informe final consignaremos en qu medida nuestra investigacin coincide o no con los resultados de otras investigaciones, y qu razones podran dar cuenta de las diferencias. 3) Planteo del marco terico.- Las variables elegidas han de ser definidas dentro de un marco terico. Por ejemplo, para definir estado civil podemos tomar como referencia el Cdigo Civil del pas donde hacemos la investigacin, mientras que para definir estado de nimo podremos tomar el DSM-IV. Otros ejemplos de marcos tericos para otras variables pueden ser el psicoanlisis, el cognitivismo, la teora de la gestalt, la teora del aprendizaje de Skinner, etc. En suma, en este caso se sintetizarn los marcos tericos utilizados, mientras que las definiciones tericas de las variables se especifican en un paso ulterior 4) Planteo de objetivos.- Supondremos que en nuestro ejemplo realizaremos una investigacin de campo, experimental, descriptivo-explicativa y con datos principalmente primarios. Suelen especificarse un objetivo general y objetivos especficos. En nuestro ejemplo, el objetivo general podra ser probar si existe o no una relacin significativa entre estado civil y estado de nimo, y algunas objetivos ms especficos podran ser revisar las investigaciones recientes sobre el tema, discutir las diferencias encontradas con otras investigaciones sobre el mismo tema, o examinar la incidencia de las variables edad y nivel de instruccin en la muestra seleccionada.

Pgina 147 de 331

148
5) Formulacin de la hiptesis.- La hiptesis es nuestra respuesta tentativa al problema, y puede formularse en forma general y especfica. La forma general sera existe una relacin significativa entre estado civil y estado de nimo. Un ejemplo de hiptesis ms especfica sera las personas solteras tienden a sufrir estados depresivos. En una hiptesis especfica, pueden especificarse varias cosas: el vnculo entre las variables (en vez de decir existe una relacin entre decimos es la causa de), alguna categora de alguna variable (en vez de estado civil decimos casado), o alguna dimensin o indicador de alguna variable (en vez de estado de nimo decimos presentan desinters por el mundo exterior). Normalmente, la hiptesis que ser verificada en la investigacin es la hiptesis general. Si hemos decidido que nuestra investigacin sea exploratoria, en lugar de una hiptesis pueden realizarse algunas conjeturas acerca de las variables o factores relevantes vinculadas con el tema. Las conjeturas son meras sospechas que luego, si se encuentran suficientes elementos de juicio para considerarlas dignas de ser probadas, sern convertidas en hiptesis. 6) Identificacin, categorizacin y operacionalizacin de las variables.- Respecto de la identificacin, nos preguntaremos qu variables principales vamos a considerar: estado civil y estado de nimo. Seguidamente, las clasificamos segn diversos criterios: simples o complejas, manifiestas o latentes, organsmicas o situacionales, etc. En general, las clasificaciones que no pueden obviarse son: independiente o dependiente (estado civil ser independiente y estado de nimo, dependiente), y cualitativa o cuantitativa. Esta ltima clasificacin es importante porque especifica en qu nivel de medicin la mediremos. Por ejemplo, estado civil ser una variable cualitativa nominal, mientras que estado de nimo ser una variable cualitativa ordinal. En principio no tendra mucho sentido clasificar estado civil como ordinal, porque no podemos decir ms casado, algo casado o nada casado. Respecto de la categorizacin, asignaremos categoras a las variables (para estado civil pueden ser soltero, casado, separado de hecho, divorciado, juntado, viudo, etc., y para estado de nimo pueden ser muy deprimido, deprimido, alegre y muy alegre). En cuanto a la operacionalizacin, si las variables son complejas seleccionaremos dimensiones e indicadores. Dimensiones de estado de nimo podran ser manifestaciones fsicas y manifestaciones psquicas, y sus respectivos indicadores, postura corporal e inters por el trabajo. Como estado civil es una variable simple, seleccionaremos un solo indicador. Por ejemplo, aquello que nos responde el sujeto cuando le preguntamos por su estado civil. 7) Definicin de la poblacin.- Especificamos la poblacin que queremos estudiar. Por ejemplo, todas las personas entre 20 y 60 aos que vivan en la ciudad de Buenos Aires en un mes y ao determinado. Por lo tanto, nuestra unidad de anlisis sern personas (y no por ejemplo grupos o familias). La definicin de la poblacin supone siempre especificar sus componentes, llamados unidades de anlisis. 8) Seleccin de la tcnica de muestreo.- Podramos elegir una muestra de tipo probabilstico: elegimos al azar una cierta cantidad de nmeros telefnicos. Hay otros procedimientos menos aconsejables porque no son aleatorios, como elegir a las personas que conocemos de nuestro entorno (familiares, amigos, vecinos, etc). Es estos casos la muestra estar sesgada por nuestras preferencias y por un determinado estrato social o zona geogrfica. Las muestras sern diferentes segn el tipo de investigacin a realizar. En un estudio descriptivo puede utilizarse una muestra de 1000 personas extradas de la poblacin, y a las cuales encuestaremos. En un estudio explicativo experimental, las muestras consistirn por ejemplo en dos grupos: el primero conformado por personas solteras, y el segundo por personas casadas. Tambin podemos elegir tantos grupos como categoras tenga la variable estado civil. 9) Seleccin o construccin de los instrumentos de medicin.- Hay varios tests que miden estado de nimo, como por ejemplo el Cuestionario de Depresin. Si no hemos encontrado ningn instrumento apto para medir nuestras variables, deberemos construirlos nosotros mismos. En nuestro ejemplo, deberemos construir un test para medir estado de nimo. Para medir estado civil obviamente no se requiere ningn test: basta con preguntarle a la persona cul es su estado civil. La construccin de nuestro test implicar cumplir estos pasos: a) Seleccionar los tems, es decir, las preguntas o las pruebas que incluir. Para nuestro ejemplo, uno de los tems puede ser la pregunta Se siente triste la mayor parte de los das?. b) Categorizar los tems, es decir, establecer las respuestas posibles que podr responder cada sujeto en cada tem. Por ejemplo para el tem anterior, las posibles categoras pueden ser s y no. c) Construir un sistema de puntuacin de las respuestas. Por ejemplo asignamos arbitrariamente el nmero 1 si contest que s y 0 si contest que no. Luego, sumando todos los puntos de cada tem, deberemos obtener un ndice, en este caso, un ndice de estado de nimo. Tambin aqu estableceremos como interpretar estos ndices. Por ejemplo, si obtuvo ms de 20 categorizaremos al sujeto como muy deprimido, si obtuvo entre 15 y 19 puntos lo ubicaremos como deprimido, y as sucesivamente. d) Finalmente determinaremos la validez y la confiabilidad del instrumento as construido. 10) Seleccin del diseo de investigacin.- Como estamos suponiendo que nuestra investigacin es explicativa y adems indaga una sola variable causal, se podran elegir alguno de los seis diseos experimentales bivariados que propone Selltiz, fundamentando adems esta eleccin.
Pgina 148 de 331

149
11) Recoleccin y organizacin de los datos.- Para la recoleccin de los datos, aplicamos o administramos los instrumentos de medicin. Tomamos a los sujetos elegidos un test de estado de nimo y les preguntamos su estado civil. De todos los pasos de esta investigacin, este es el nico en el cual tomamos contacto con los sujetos del estudio. Todos los otros pasos los podemos realizar solos en nuestro lugar de trabajo. La organizacin de los datos, supone realizar ciertas operaciones como la construccin de una matriz de datos, la tabulacin, la graficacin y la obtencin de medidas estadsticas de posicin y de dispersin. a) Construccin de la matriz de datos.- Organizamos y sintetizamos toda la informacin obtenida en una matriz, que, en nuestro ejemplo puede asumir la siguiente forma: Sujeto A B C Etc Estado civil Soltero Soltero Casado Etc Estado de nimo Muy deprimido Alegre Deprimido Etc

En el caso de tratarse de variables cuantitativas, en esta matriz se consignarn en las columnas de las variables los puntajes brutos, los puntajes estandarizados y/o los percentiles. Por ejemplo, si utilizamos el WISC-III para medir inteligencia en nios, Juancito pudo haber obtenido respectivamente 121, 114 y 82. b) Tabulacin.- Toda la informacin de la matriz de datos la organizamos aqu en una tabla de doble entrada, es decir, una tabla que permita cruzar las dos variables en juego: Muy deprimido 7 ? ? ? ? ? ? Deprimido ? ? ? ? ? ? ? Alegre ? ? ? ? ? ? ? Muy alegre ? ? ? ? ? ? ? TOTALES ? ? ? ? ? ? ?

Soltero Casado Separado de hecho Divorciado Juntado Viudo TOTALES

Por ejemplo, hemos colocado la frecuencia 7 en el primer casillero porque hemos encontrado siete casos de sujetos solteros muy deprimidos. c) Graficacin.- Opcional. Sirve para presentar la informacin de las tablas de una forma ms intuitiva y rpidamente comprensible. d) Obtencin de medidas de posicin, dispersin y correlacin.- Generalmente pueden obtenerse a partir de la tabla de doble entrada. Como en el ejemplo que estamos siguiendo las variables no son cuantitativas, no podremos utilizar la media aritmtica ni el desvo estndar. Deberemos usar medidas estadsticas para variables cualitativas, como el modo o la mediana (medidas de posicin), y otras. Por ejemplo, si la categora que ms se repite para la variable estado de nimo es alegre, entonces alegre es el modo. Las medidas de correlacin, finalmente, permiten organizar la informacin acerca de la relacin entre dos o ms variables (en este caso, entre estado civil y estado de nimo). 12) Anlisis e interpretacin de los datos.- Respecto del anlisis de los datos, de acuerdo a los fines que nos hayamos propuesto y si resultare necesario, podremos optar por varias posibilidades dentro de la amplia gama de pruebas estadsticas tales como la prueba t, la prueba z, etc., tarea que generalmente se confa a algn especialista en estadstica. Tales pruebas tienen como finalidad ofrecer una prueba matemtica que permita decidir si aceptaremos o rechazaremos nuestra hiptesis. La interpretacin de los datos es opcional pero recomendable. En este paso arriesgamos algunas conjeturas personales acerca del porqu de la asociacin detectada entre ambas variables. Por ejemplo, hemos encontrado una alta asociacin entre alegra y casado quiz porque el matrimonio permite compartir trances y dificultades ms fcilmente, con lo cual hay menor margen para la depresin. La interpretacin de los datos puede hacerse desde algn marco terico existente o bien, si somos audaces e imaginativos, podemos crear nuestro propio marco terico porque no hay ninguno que nos satisfaga. 13) Presentacin de los resultados.- Mientras fuimos cumpliendo los pasos anteriores, es muy probable que hayamos escrito varias hojas en borrador. Con este material redactamos nuestro informe final, luego el abstract o resumen del mismo, luego seleccionamos un ttulo para nuestro informe y, finalmente, publicados los resultados (por ejemplo envindolos a una revista cientfica). Este proceso se realimenta continuamente: en cuanto damos a conocer nuestro trabajo a la comunidad cientfica, desde ese momento entra a formar parte de la bibliografa existente sobre el tema y, por tanto, ser consultado por otro investigador que se encuentre en la etapa de la revisin bibliogrfica.

Pgina 149 de 331

150
Este libro presentar en los captulos siguientes cada etapa de la investigacin con mayor detalle, tal como puede apreciarse en el siguiente esquema: Etapas de la investigacin tpica (visin ms detallada) 1) Plantear del problema 2) Revisar bibliogrfica 3) Plantear del marco terico 4) Plantear de objetivos 5) Plantear la hiptesis 6) Clasificar la hiptesis 7) Definir las unidades de anlisis 8) Definir conceptualmente las variables 9) Clasificar las variables 10) Definir operacionalmente las variables 11) Categorizar las variables 12) Definir de la poblacin 13) Seleccionar la tcnica de muestreo 14) Seleccionar o construir los instrumentos de medicin 15) Seleccin del diseo de investigacin 16) Recolectar los datos 17) Organizar los datos 18) Analizar los datos 19) Interpretar los datos 20) Redactar de los resultados 21) Publicar los resultados Captulo Captulo 10

Captulo 11

Captulo 12 Captulo 13 Captulo 14

Captulo 15

Pgina 150 de 331

151

CAPTULO 10: PROBLEMA, BIBLIOGRAFA, TEORA Y OBJETIVOS


En este captulo se describirn los cuatro primeros pasos de una investigacin tpica: el planteo del problema que la investigacin debe resolver, la revisin bibliogrfica, el planteo del marco terico y el planteo de los objetivos de la investigacin.

1. PLANTEO DEL PROBLEMA


El problema de investigacin es aquel que la investigacin busca resolver, y por tanto el que dar sentido a sta. El problema suele ser definido tambin como toda situacin considerada como difcil de resolver, y que por tanto necesita de la investigacin para resolverse (Tamayo, 1999:169), o como aquel mbito de la investigacin para el que la ciencia no tiene todava una solucin satisfactoria (Len y Montero, 1995:22). Autores como Tamayo destacan que el problema encierra aspectos conocidos y desconocidos, y que la idea es descubrir los desconocidos que integran la situacin problemtica (Tamayo, 1999:169). Formulacin.- Si la investigacin cientfica es un automvil, el combustible que la alimenta son los hechos. Pero lo que la pone en marcha no es un hecho sino un problema y, obviamente, la intencin del investigador por resolverlo. Lewis Carroll, en "Alicia en el pas de las maravillas", hace decir a uno de sus personajes que "como no tena respuesta para ninguno de sus problemas, el modo de formularlos no importaba demasiado". Pero en el caso de la investigacin cientfica s interesa cmo se plantear el problema. La importancia de formularlo correctamente fue alguna vez destacada por Claude Bernard, cuando dijo que el experimentador que no sabe lo que est buscando, no comprender lo que encuentra. La correcta formulacin de un problema supone: a) Expresarlo en forma de interrogante. La pregunta es la forma gramatical que asume el problema. b) Expresarlo en forma lo suficientemente concreta como para que pueda ser resuelto efectivamente por la va cientfica, es decir, para que sea solucionable cientficamente. As, el problema de la existencia de Dios no es lo suficientemente concreto pues no hay investigacin cientfica que pueda resolverlo, siendo mas bien un problema filosfico. Sealan Selltiz y otros (1980) que el problema debe reducirse a dimensiones manejables o a un cierto nmero de sub-tareas, cada una de las cuales debe ser abordada en un solo estudio. c) Expresarlo en forma lo suficientemente clara como para saber qu datos buscar para resolverlo. As, el problema de si el perro del comisario ladra o no, adems de ser un problema cotidiano y no cientfico, no es lo suficientemente claro ya que no especifica si el comisario "tiene" un perro o si el comisario "es" un perro, con lo cual no se sabr qu datos buscar para resolverlo: si los datos sobre el perro o los datos sobre su dueo. Del mismo modo, no puede decirse simplificadamente "voy a investigar el problema de la droga". Esta es una afirmacin ambigua que puede apuntar tanto al problema de cules son las causas de la drogadiccin como al problema de cmo fabricar droga sin que se entere la polica. En cambio, problemas bien planteados son por ejemplo: qu incentiva el rendimiento escolar?, o influye la educacin recibida sobre la ideologa poltica de las personas? Se trata de problemas solucionables y donde se sabe el tipo de informacin a buscar para resolverlos. El problema es del investigador.- Conviene distinguir claramente el problema que llev a hacer la investigacin, del problema que se busca resolver con la investigacin. Por ejemplo, una cosa es el problema que tienen las personas que no pueden superar su miedo a volar, y otra es el problema de examinar la eficacia de tratamientos para perder ese miedo. El primero es un problema de la poblacin, que engendra o motiva un nuevo problema, el del investigador. La justificacin del problema.- En muchos informes de investigacin se especifica porqu es importante el abordaje del problema. Esta justificacin no se refiere a la importancia personal que el problema puede tener para el investigador, sino a la importancia que tiene para la comunidad cientfica y la poblacin en general. Se supone que resolver el problema implicar aumentar en amplitud y profundidad el conocimiento de la realidad, o bien prestar algn beneficio prctico inmediato. As, aunque un problema puede ser muy importante en tales sentidos, no alcanza a justificarse si su investigacin es ms de lo mismo, es decir, si ya hay una gran cantidad de investigaciones que trataron la cuestin de la misma manera. La justificacin es lo que orienta la eleccin del problema, que puede seleccionarlo el mismo investigador o la institucin para la cual trabaja. Sealan Hernndez Sampieri R y otros (1996:17) que los criterios principales para evaluar el valor potencial de una investigacin son: conveniencia, relevancia social, implicaciones prcticas, valor terico y utilidad metodolgica. Agregan que el planteamiento de un problema de investigacin cientfico no puede incluir juicios morales o estticos, pero debe cuestionarse si es o no tico llevarlo a cabo. El problema y el tema.- Debe distinguirse claramente el problema del tema de investigacin. Un tema puede ser el insomnio, mientras que los problemas que pueden tratarse dentro de esa amplia temtica pueden ser existen tratamientos eficaces contra el insomnio? cules son las causas del insomnio? o hay

Pgina 151 de 331

152
alguna relacin entre insomnio y sedentarismo? Cuando la investigacin contempla independientes y dependientes, es habitual considerar al tema como la variable dependiente. variables

Problema e hiptesis.- Mientras que el problema es la pregunta, la hiptesis es la respuesta tentativa. Sealan Selltiz y otros (1980) que si no hay suficientes conocimientos para proporcionar una base para hacer una hiptesis, como ocurre en los estudios exploratorios, la formulacin del problema incluir una indicacin de las reas sobre las que se desea establecer una hiptesis. En cambio si ya existen conocimientos relevantes concernientes al problema, la formulacin de ste ltimo incluir hiptesis como gua para la recogida de datos y para su anlisis, y como medio para poder relacionar el estudio con otros similares o con un cuerpo de teora en general. Sealan Hernndez Sampieri R y otros, (1996:17) que plantear el problema de investigacin es afinar y estructurar ms formalmente la idea de investigacin, desarrollando tres elementos: objetivos de investigacin, preguntas de investigacin y la justificacin de sta. Los tres elementos deben ser capaces de guiar a una investigacin concreta y con posibilidad de prueba emprica. Los objetivos y preguntas de investigacin deben ser congruentes entre s e ir en la misma direccin. 3. Los objetivos establecen qu pretende la investigacin, las preguntas nos dicen que respuestas deben encontrarse mediante la investigacin y la justificacin nos indica porqu debe hacerse la investigacin.

2. REVISIN BIBLIOGRFICA
Slo cuando se tiene el claro el problema a resolver en la investigacin, se pueden comenzar a buscar qu otras soluciones o respuestas se dieron al mismo. La importancia de esta revisin bibliogrfica reside en que: a) permite saber si otras investigaciones ya han resuelto eficazmente el problema, con lo cual toda nueva investigacin ser superflua. En raro encontrar esta situacin porque un problema cientfico en rigor no termina nunca de resolverse toda vez que siempre podrn aportarse nuevos elementos de juicio para reforzar la hiptesis o para refutarla; b) permite detectar investigaciones que hayan resuelto el problema solo parcialmente, con lo cual la nueva investigacin intentar completar la respuesta. Por ejemplo, puede ocurrir que un problema haya sido tratado solamente en un estudio exploratorio, con lo cual la nueva investigacin intentar continuarlo mediante una investigacin descriptiva. Para Tamayo, la revisin bibliogrfica es el fundamento de la parte terica de la investigacin, y permite conocer a nivel documental las investigaciones relacionadas con el problema planteado. Presenta la teora del problema aplicada a casos y circunstancias concretas y similares a las que se investiga (Tamayo, 1999:186).

3. PLANTEO DEL MARCO TERICO


En el marco terico se expresan las proposiciones tericas generales, las teoras especficas, los postulados, los supuestos, categoras y conceptos que han de servir de referencia para ordenar la masa de hechos concernientes al problema o problemas que son motivo de estudio e investigacin. Tambin, en las investigaciones avanzadas, puede ser el encuadre en que se sitan las hiptesis a verificar (Ander-Egg, 1987:154). Destacan Hernndez Sampieri y otros (1996:54) que para elaborar el marco terico es necesario detectar, obtener y consultar la literatura y otros documentos pertinentes para el problema de investigacin, as como extraer y recopilar de ellos la informacin de inters. La construccin del marco terico depende de lo que encontremos en la revisin de la literatura: a) que existe una teora completamente desarrollada que se aplica a nuestro problema de investigacin, b) que hay varias teoras que se aplican al problema de investigacin, c) que hay generalizaciones empricas que se aplican a dicho problema o d) que solamente existen guas an no estudiadas e ideas vagamente relacionadas con el problema de investigacin. En cada caso vara la estrategia para construir el marco terico. Con el propsito de evaluar la utilidad de una teora para nuestro marco terico podemos aplicar cinco criterios: a) capacidad de descripcin, explicacin y prediccin, b) consistencia lgica, c) perspectiva, d) fructificacin y e) parsimonia. 8. El marco terico orientar el rumbo de las etapas subsecuentes del proceso de investigacin (Hernndez Sampieri R y otros, 1996:54). Las funciones que se atribuyen al marco terico son, entre otras, a) delimitar el rea de la investigacin; b) sugerir guas de investigacin; c) compendiar los conocimientos existentes en el rea que se va a investigar; d) Expresar proposiciones tericas generales (Tamayo, 1999:139). El marco terico incluye tambin las definiciones de los principales conceptos de la investigacin, por cuanto en rigor toda definicin es una teora acerca de lo definido, en tanto se consideren las llamadas por Copi (1974) definiciones tericas. Destacan Selltiz y otros (1980) que sean o no establecidas las hiptesis, la investigacin requiere una definicin de conceptos a utilizar en la organizacin de los datos. Algunas de estas definiciones sern formales: dan a conocer la naturaleza general del proceso o fenmeno a indagar y su relacin con otros estudios o con la teora cientfica existente. Otras sern definiciones de trabajo, las cuales permiten la recogida de datos que el investigador est dispuesto a aceptar como ndice de sus conceptos (Selltiz y otros, 1980). Debe aclararse que las definiciones tericas se explicitan en el marco terico, mientras que las definiciones operacionales se explicitan ms adelante, cuando se definen las variables.
Pgina 152 de 331

153
4. PLANTEO DE OBJETIVOS
Si el problema asume gramaticalmente la forma de una pregunta, los objetivos tienen la forma gramatical de un verbo en infinitivo. Como el objetivo supone acciones a realizar, deben ser expresados mediante verbos, tales como explorar, describir, correlacionar o probar. El planteo de objetivos supone entonces elegir qu tipo de investigacin se realizar. Ser un estudio exploratorio, descriptivo, explicativo o una combinacin de ellos? Ser una investigacin primaria o bibliogrfica? A veces se especifica un objetivo general y objetivos especficos. Estos ltimos corresponden a las diversas sub-tareas en las cuales se descompone la tarea principal, o bien pueden hacer referencia a otros objetivos fuera del problema de investigacin pero que por alguna razn han sido considerados dentro de la misma.

Pgina 153 de 331

154

CAPTULO 11: HIPTESIS Y VARIABLES


Las investigaciones tpicas comienzan planteando una hiptesis que deber ser probada. La excepcin son las investigaciones exploratorias, donde el poco o nulo conocimiento sobre el tema a investigar puede impedir su formulacin: a veces slo se alcanzan a plantear conjeturas que podrn o no convertirse en hiptesis. La diferencia radica en que la conjetura no est apoyada por suficientes elementos de juicio como para merecer el esfuerzo de disear una investigacin que la pondra a prueba. Segn Hernndez Sampieri y otros, (1996:103), en efecto, hay investigaciones que no pueden formular hiptesis porque el fenmeno a estudiar es desconocido o se carece de informacin para establecerlas, pero ello slo ocurre en los estudios exploratorios y en algunos estudios descriptivos. Para poder probar una hiptesis, debe estar adecuadamente formulada, y debern estar identificados sus componentes bsicos: las unidades de anlisis y las variables. En el caso de stas ltimas, en particular, debern estar adecuadamente definidas y categorizadas. Ms concretamente, los pasos que deben cumplirse en esta etapa de la investigacin son los siguientes: 1) Plantear la hiptesis. 2) Clasificar la hiptesis. 3) Definir las unidades de anlisis. 4) Definir conceptualmente las variables. 5) Clasificar las variables. 6) Definir operacionalmente las variables. 7) Categorizar las variables.

1. HIPTESIS
Definicin La hiptesis es bsicamente una respuesta tentativa al problema de investigacin. Si el problema es porqu lloran los bebs?, una hiptesis puede ser los bebs lloran porque tienen hambre, o los bebs lloran porque no ven a la madre, etc. De esta forma, un mismo problema puede ser respondido con varias hiptesis. Entre las principales caractersticas de las hiptesis pueden mencionarse las siguientes: 1) Una hiptesis es una proposicin general, sinttica y verificable. Es una proposicin, o sea una afirmacin (o negacin) acerca de algo. Cuando se dice aprendizaje no se est afirmando ni negando nada, pero cuando se dice que el aprendizaje es estimulado con premios aqu ya se est afirmando algo. Aunque tambin una negacin es una proposicin (el aprendizaje no es estimulado por premios), lo habitual en la ciencia es la formulacin de hiptesis en forma positiva o afirmativa. Mientras los problemas se expresan mediante preguntas, las hiptesis se expresan mediante proposiciones. De los varios tipos de proposiciones que hay, y siguiendo la tradicin aristotlica del Organon, las hiptesis suelen expresarse como proposiciones hipotticas, y, ms concretamente (Len y Montero, 1995:22), en la forma condicional <Si entonces>. La proposicin categrica Los bebs lloran porque tienen hambre puede convertirse en la proposicin hipottica Si X es un beb que llora, entonces X tiene hambre. La proposicin hipottica debe adems ser general: se supone y pretende que la hiptesis sea aplicable a todos los individuos (incluso a los desconocidos, con lo que la hiptesis tiene tambin un carcter predictivo). El anterior ejemplo sobre el aprendizaje es una proposicin general; en cambio, "Juancito aprende ms cuando es premiado" es singular, y en este sentido no es una hiptesis. A lo sumo podr ser una proposicin deducible de una hiptesis ("el aprendizaje aumenta con los premios") cuando no el resultado de una observacin. El requisito de la generalidad deriva de una exigencia del conocimiento cientfico que dice que tiene que ser general pues esto no slo aumenta el saber sobre la realidad sino que adems, al ser predictivo, tiene una mayor utilidad prctica.
El requisito de la generalidad es importante para diferenciarlo del sentido del trmino hiptesis que suele utilizarse en la vida cotidiana. Si alguien no llega a la cita, buscamos alguna hiptesis para explicar esta situacin: haba huelga de transportes, tuvo un accidente, se qued dormido leyendo este libro, etc. Son todas respuestas tentativas que despus podrn o no verificarse o no. Sin embargo, esta hiptesis no es general sino singular, porque est destinada a dar una respuesta a ese problema especfico (aqu y ahora alguien no lleg a la cita), y es inaplicable a todos los casos donde alguien no llega.

La hiptesis tambin debe ser una proposicin sinttica. De acuerdo con cierta clasificacin de inspiracin kantiana (Mc Guigan, 1978:53), las proposiciones pueden ser analticas, contradictorias y sintticas. Las proposiciones analticas son siempre verdaderas: "lo que es, es", o "el tringulo tiene tres ngulos", etc. Las proposiciones contradictorias son siempre falsas: "una empanada no es una empanada", "un cuadriltero tiene cinco lados", etc. Lo caracterstico de estas proposiciones es que se conoce su verdad o su falsedad simplemente por el examen de la misma proposicin, con lo que no se requiere confrontarlas con la realidad: no se precisa observar un tringulo para saber que tiene tres ngulos, porque el significado de tringulo ya lo implica.
Pgina 154 de 331

155
Si en las proposiciones analticas (o contradictorias) se tiene siempre la certeza de su verdad (o falsedad), en las proposiciones sintticas no es posible saber de antemano (o "a priori") si son verdaderas o falsas. Por ejemplo "el lpiz es azul", o "la frustracin genera agresin". Puesto que se desconoce su verdad o falsedad, requerirn entonces ser verificadas empricamente, lo que constituye otra de las caractersticas de una hiptesis. Pero para poder verificar una proposicin sinttica esta deber ser, obviamente, verificable. "Lucifer vive en el infierno" es una proposicin sinttica pues no se sabe de antemano si esto es cierto o no, pero no es verificable pues no se cuenta con ninguna experiencia que pueda probarlo. Cabe recordar que una hiptesis es una respuesta a un problema, y si se desea que ste sea solucionable se deber buscar una respuesta verificable. "La frustracin genera agresin" s es verificable, por ejemplo dando a las personas ciertos problemas para resolver que en realidad son insolubles, y luego medir sus niveles de agresin. Es entonces posible administrar estmulos frustrantes y observar luego si aparecen o no respuestas agresivas. Para que una hiptesis sea verificable, deben poder extraerse de ella consecuencias lgicas y por esa va comprobar su acuerdo con los hechos conocidos o desconocidos. As, la hiptesis todos los cuervos vuelan es verificable porque puede deducirse de ella el enunciado verificable este cuervo vuela. 2) Las hiptesis surgen de una teora previa y a veces tambin de la experiencia. Aunque formular una hiptesis requiere cierta dosis de creatividad, se basa siempre en una teora previa, implcita o explcita. As, para responder a la pregunta por qu los bebs se chupan el dedo?, puede plantearse la hiptesis de la alucinacin de pecho o la hiptesis de la reaccin circular primaria. En el primer caso se ha tomado como referencia la teora freudiana, y en el segundo caso la teora piagetiana. En otro ejemplo, frente al problema de porqu existe el dolor, puede plantearse la hiptesis de que se trata de un aviso natural de alguna enfermedad para alertar al sujeto y poder combatirla, lo cual supone una teora acerca del funcionamiento de los seres vivos. Las hiptesis cientficas requieren que las teoras de base estn claramente explicitadas, y por esta razn se suele requerir que en la presentacin de una tesis se incluya el marco terico. A veces las hiptesis surgen de la experiencia. Luego de haber visto muchas veces que luego del relmpago viene el trueno, se puede formular la hiptesis El relmpago es la causa del trueno, hiptesis que supone tambin un marco terico que, en este caso, podra ser la teora de que todo tiene una causa, o la teora de que la sucesin regular de dos sucesos supone causalidad.
Hernndez Sampieri y otros (1996:103), refieren que las hiptesis surgen normalmente del planteamiento del problema y la revisin de la literatura, y algunas veces de teoras. Por su parte, Selltiz y otros (1980) sealan que una hiptesis puede originarse a partir de cuatro fuentes: como una simple sospecha, como resultado de otros estudios, como consecuencia lgica de una teora, o finalmente como resultado de la observacin de ciertas relaciones entre variables. Tanto si nace de una sospecha como si surge de estudios anteriores, la hiptesis estar aislada de un cuerpo de teora, lo cual no sucede cuando la hiptesis surge como consecuencia lgica de una teora. En realidad puede cuestionarse esta ltima afirmacin: toda hiptesis est conectada con algn cuerpo de teora, aunque no se trate de una teora cientfica sino de un simple cuerpo de creencias, que en sentido amplio es tambin una teora.

3) Las hiptesis cientficas han de ser relevantes, en el sentido que procuran dar explicaciones "esperables" de acuerdo al contexto donde se trabaja. En un contexto cientfico no puede afirmarse como hiptesis que "la neurosis se debe a que existe el universo". Indudablemente esto no carece de sentido, porque si no habra universo no habra personas y por lo tanto tampoco neurticos, pero sta no es la explicacin esperable en un contexto psicolgico. Del mismo modo, en el contexto de la qumica sera irrelevante explicar un incendio diciendo que se debi a que se quera cobrar el seguro. La explicacin relevante en el mismo contexto es aportada por la teora de la combustin. 4) Tras la aparente complejidad de su indagacin, el cientfico trata de buscar la solucin ms sencilla, por lo que las hiptesis que plantea suelen ser simples. De hecho, dadas dos hiptesis alternativas que fueron ambas verificadas con la misma fuerza, se tiende a preferir la ms simple, o sea, aquella que con los mismos elementos explica ms, o aquella que muestra una realidad ms armnica y uniforme, o hasta incluso aquella que resulta psicolgicamente ms entendible o ms plausible. 5) Algunas veces se proponen varias hiptesis para resolver un problema (multiplicidad), y luego se va haciendo una seleccin sobre la base de los elementos de juicio a favor o en contra de cada una de ellas. Hempel (1977) cita un ejemplo donde para resolver el problema de por qu las mujeres parturientas contraan la fiebre puerperal, se haban propuesto seis hiptesis alternativas. 6) Las hiptesis son proposiciones tentativas acerca de las relaciones entre dos o ms variables (Hernndez Sampieri y otros, 1996:103), aunque tambin la hiptesis puede hacer referencia a una sola variable, como por ejemplo en la mayora de los pacientes psicticos presentan delirios, como en las investigaciones descriptivas. En las investigaciones correlacionales y explicativas, la hiptesis permite al investigador relacionar variables entre s para determinar cmo varan unas en funcin de otras y, de esta manera, ampliar y profundizar su comprensin de la realidad.

Pgina 155 de 331

156
Clasificacin de las hiptesis De las diversas taxonomas existentes, dos clasificaciones pueden ser de inters para la metodologa de la investigacin. 1) La primera clasificacin las ordena en hiptesis descriptivas, correlacionales y explicativas o causales, segn correspondan a investigaciones descriptivas, correlacionales o explicativas, respectivamente. Las hiptesis descriptivas, por tanto, se refieren a una sola variable, como por ejemplo la mayora de los grupos humanos tienen alta cohesin, donde la variable es cohesin grupal. Las hiptesis de correlacin afirman una cierta asociacin estadstica o concomitancia entre dos o ms factores o variables, como "a mayor cohesin grupal mayor eficacia laboral". Esta hiptesis dice que cuanto ms unido es un grupo mejor trabaja, o sea informa que los factores cohesin y eficacia estn altamente correlacionados: cuando aumenta uno tambin aumenta el otro. La correlacin podr ser directa (ambos factores aumentan, o ambos disminuyen), o inversa (uno aumenta y el otro disminuye, o viceversa). Sin embargo, la hiptesis no dice explcitamente que un factor sea la causa del otro (aunque pueda uno suponerlo ntimamente o leerlo entre lneas), o sea que explcitamente no est formulada como hiptesis causal. Hubiera sido as en la hiptesis "la causa de la eficacia laboral es la cohesin grupal", o "la cohesin grupal determina la eficacia laboral", donde la expresin "determina" ya sugiere en forma explcita la idea de un vnculo causa-efecto. Las hiptesis causales tienen mayores pretensiones: no solamente afirman que dos factores se encuentran correlacionados sino que adems arriesgan la idea que hay un vnculo causal entre ellos, o sea uno es la presunta causa y el otro el efecto. Las hiptesis de este tipo son claramente explicativas (explican la eficacia a partir de la cohesin), mientras que las hiptesis de correlacin son mas bien descriptivas, pues resumen las observaciones realizadas sobre cierta cantidad de grupos donde se constat una cierta regularidad entre la cohesin y la eficacia. Normalmente, las hiptesis de correlacin van surgiendo en el transcurso de una investigacin descriptiva, pero a medida que avanza esta descripcin el investigador puede ir alimentando la sospecha de que entre ciertos factores no slo hay una correlacin sino tambin una relacin causal, que deber ser probada mediante una investigacin explicativa. Cuando autores como Selltiz y otros (1980) sealan que la funcin de la hiptesis es sugerir explicaciones de ciertos hechos y orientar la investigacin de otros, estn probablemente indicando la funcin de las hiptesis explicativas por un lado, y de las hiptesis descriptivas y correlacionales por el otro. 2) La segunda clasificacin ordena las hiptesis en hiptesis sustantivas e hiptesis estadsticas. Las primeras son propiamente las hiptesis que se quiere probar en la investigacin. Cuando esta prueba requiere un procedimiento estadstico, entonces la hiptesis sustantiva se traduce al lenguaje de la estadstica y se trabaja sobre ella desde este punto de vista. Otros autores ofrecen clasificaciones ligeramente diferentes encuadrables en este segundo criterio clasificatorio. Por ejemplo, Mora y Araujo (1971) refieren que en la investigacin usamos dos tipos de hiptesis: sustantivas y auxiliares. Las sustantivas relacionan las variables que queremos estudiar. Las auxiliares pueden ser de validez o estadsticas. Las hiptesis de validez relacionan las variables conceptuales o latentes con los indicadores u observaciones. Las hiptesis estadsticas relacionan las unidades de anlisis observadas con el universo al que pertenecen. Los problemas de medicin tienen que ver con las hiptesis auxiliares de validez. Otros autores (Hernndez Sampieri y otros, 1996:103) indican que las hiptesis se clasifican en: a) hiptesis de investigacin, b) hiptesis nulas, c) hiptesis alternativas. A su vez, las hiptesis de investigacin se clasifican de la siguiente manera: a) Hiptesis descriptivas del valor de variables que se van a observar en un contexto. b) Hiptesis Hiptesis que establecen simplemente relacin entre las Bivariadas correlacionales variables Multivariadas Hiptesis que establecen cmo es la relacin entre las Bivariadas variables (hiptesis direccionales) Multivariadas c) Hiptesis de Hiptesis que slo establecen diferencia entre los grupos a comparar. la diferencia de Hiptesis que especifican a favor de qu grupo, de los que se comparan, es la diferencia. grupos d) Hiptesis Bivariadas causales Multivariadas Hiptesis con varias variables independientes y una dependiente. Hiptesis con una variable independiente y varias dependientes. Hiptesis con varias variables tanto independientes como dependientes. Hiptesis con presencia de variables intervinientes. Hiptesis altamente complejas. Puesto que las hiptesis nulas y las alternativas se derivan de las hiptesis de investigacin, pueden clasificarse del mismo modo pero con los elementos que las caracterizan. Las hiptesis estadsticas son la
Pgina 156 de 331

157
transformacin de las hiptesis de investigacin, nulas y alternativas en smbolos estadsticos. Se clasifican en: a) hiptesis estadsticas de estimacin, b) hiptesis estadsticas de correlacin, y c) hiptesis estadsticas de la diferencia de grupos (Hernndez Sampieri y otros, 1996:103). Estos mismos autores agregan que la formulacin de hiptesis va acompaada de las definiciones conceptuales y operacionales de las variables contenidas dentro de las hiptesis, lo que puede considerarse en relacin con las llamadas hiptesis de validez mencionadas por Mora y Araujo (1971). Componentes de la hiptesis: los conceptos Desde el punto de vista lgico la proposicin es una estructura intermedia entre el concepto y el razonamiento: varios conceptos constituyen una proposicin, y varias proposiciones un razonamiento. Por consiguiente la hiptesis, al ser una proposicin, puede descomponerse en sus elementos constitutivos llamados conceptos. El concepto (Selltiz y otros, 1980) es una representacin abreviada de una diversidad de hechos, o sea que su utilidad es la de simplificar el pensamiento, y sirven para organizar los datos y relacionarlos entre s.
No debe confundirse el concepto con el trmino: el primero es una idea, mientras que el segundo es una mera palabra. Muchas teoras utilizan el mismo trmino como por ejemplo, "transferencia", pero cada una lo conceptualiza de diferente manera y entonces son conceptos diferentes: una cosa es la transferencia en el psicoanlisis, otra en las teoras del aprendizaje, y otra el ARN de transferencia en biologa. Otro tanto puede decirse del trmino "resistencia", que puede apuntar a un concepto de la fsica o del psicoanlisis.

Si bien se emplean conceptos en la vida cotidiana ("golosina", "alegra"), y los hay tambin en la filosofa ("ente", "alma"), los conceptos que aqu interesan son aquellos que pueden ser tratados cientficamente, y que suelen ser llamados constructos.
Respecto del constructo, indica Arnau Gras (1980) que la mejor forma en que el cientfico limita su objeto de observacin es mediante el concepto, una abstraccin hecha de algn aspecto o rasgo que presentan las cosas observadas. Por ejemplo: inteligencia, rendimiento, agresin, emocin, tendencia, etc. El constructo es un concepto creado deliberadamente con fines cientficos y que, a diferencia del concepto propiamente dicho, posee dos caractersticas: a) se relaciona con otros constructos (aspecto relacional), y b) puede observarse y medirse (aspecto reductivo). Para Arnau Gras (1980:129), si un concepto puede observarse y medirse, y si puede vinculrselo con otros conceptos a travs de una hiptesis, entonces puede usrselo en la investigacin cientfica y recibe el nombre de "constructo".

Por ejemplo, en la hiptesis "en la provincia de Buenos Aires, a mayor densidad poblacional menor solidaridad entre los habitantes", los conceptos que la componen son: "rea geogrfica", "densidad poblacional", "solidaridad", habitantes y la relacin a mayor a menor. Los conceptos de una hiptesis pueden clasificarse de la siguiente manera: Conceptos objetivos Primera Empricos: Son directamente observables. clasificacin Tericos: Son indirectamente observables. Segunda Unidades de anlisis: Son los objetos (o sujetos a estudiar). clasificacin Variables: Son las propiedades de los objetos. Relacionan conceptos objetivos entre s.

Conceptos relacionales

a) Conceptos objetivos y relacionales.- Como puede apreciarse en el ejemplo anterior, algunos conceptos se refieren a entidades (habitantes) y propiedades de estas entidades (ser solidarios), mientras que otros simplemente relacionan dichos conceptos (a mayor a menor). Alguna vez la lgica medieval los denomin, respectivamente, conceptos categoremticos y sincategoremticos. En otro ejemplo: la hiptesis hay una asociacin significativa entre inteligencia y rendimiento escolar contiene como trminos objetivos inteligencia, rendimiento escolar y, tcitamente, alumnos. Contiene adems el trmino relacional hay una asociacin significativa entre. b) Conceptos empricos y tericos.- Los conceptos tienen diversos grados de abstraccin, desde los ms empricos como perro o sexo a los ms abstractos como inteligencia o personalidad: los primeros son directamente observables, y los segundos no, pero pueden traducirse a otros conceptos ms empricos mediante un proceso llamado operacionalizacin. Por ejemplo, traducir inteligencia como habilidad para el clculo. Los conceptos involucrados en una hiptesis deben poder observarse y medirse. Un concepto es tanto ms terico cuanto ms distancia hay entre el concepto y el objeto de la realidad representado, y, como indican Selltiz y otros (1980), ms posibilidad de falsas interpretaciones del mismo hay. Esta primera clasificacin de conceptos objetivos se relaciona con la segunda clasificacin de conceptos objetivos de la siguiente manera: mientras las unidades de anlisis de consideran habitualmente conceptos empricos, las variables pueden ser conceptos tericos o empricos.
Pgina 157 de 331

158
c) Unidades de anlisis.- Las unidades de anlisis son los elementos cuyas propiedades se quieren investigar. En psicologa, unidades de anlisis pueden ser personas, grupos, familias, instituciones, y hasta funciones psquicas como la percepcin, la memoria, etc. Cuando debe especificarse la poblacin que se estudiar, es decir, el conjunto de las unidades de anlisis, se especifican tambin estas, y, por caso, en lugar de decir genricamente personas se puede decir adultos mayores de 65 aos, masculinos y que viven en Argentina, o bien pacientes con medicacin antidepresiva registrados durante 2005 en el Hospital Durand. En biologa las unidades de anlisis pueden ser organismos vivientes, ecosistemas, clulas, etc. En fsica tomos o partculas subatmicas, en astronoma, estrellas, planetas o galaxias, etc. Entre los conceptos objetivos tambin estn las variables, cuya importancia exige un tratamiento ms extenso en el siguiente tem.

2. VARIABLES
Definicin Las variables (V) son atributos, propiedades o caractersticas de las unidades de anlisis (UA), susceptibles de adoptar distintos valores o categoras. Ejemplos de variables como atributos de las personas son la edad, el sexo, la inteligencia, la estatura, la personalidad, la memoria, la zona de residencia, la ocupacin, el grado de solidaridad, el color de cabello o el estado civil. Ejemplos de atributos de una poblacin son la densidad y el tamao. Los valores o categoras de la variable pueden variar tanto entre sujetos (unos pueden ser ms inteligentes que otros), como en el mismo sujeto a lo largo del tiempo (por ejemplo la edad). Se las llama variaciones interindividuales y variaciones intraindividuales.
Las variaciones interindividuales son propias de lo que en psicologa evolutiva se llaman estudios transversales (se realizan en un aqu y ahora), mientras que las variaciones intraindividuales conciernen mas bien a estudios longitudinales (que se realizan a lo largo del tiempo). El sexo puede variar de una persona a otra, pero no dentro de la misma persona (salvo que se haga una operacin para cambiar de sexo). La preferencia por un equipo de ftbol vara de una persona a otra, pero no suele variar con el tiempo dentro de la misma persona. La edad, finalmente, es una variable que vara tanto interindividualmente como intraindividualmente. Lo que nunca puede suceder, por una cuestin lgica, es que haya variables que varen dentro de una persona y que no puedan nunca variar de una persona a otra. La razn es que si la propiedad vara dentro de la misma persona, existe la posibilidad de que dos personas tengan diferentes valores para esa variable, con lo cual habr una variacin interindividual.

La variable puede variar de dos formas: si es asunto de presencia o ausencia, la variacin es factorial, y si es asunto de grados, es funcional (ONeil, 1968). Por ejemplo, la variable terremoto puede adoptar dos valores: s (presencia) o no (ausencia). En cambio la variable cantidad de hijos puede adoptar diversos grados: 1, 2, 3, 4, etc. Muchas variables admiten ambos tipos de variacin, segn el inters del investigador: la variable cantidad de hijos por ejemplo, puede variar factorialmente, si se eligen arbitrariamente los valores con hijos (presencia) y sin hijos (ausencia). Finalmente, refieren Selltiz y otros (1980) que las variables (y, en general, los conceptos) pueden definirse de dos maneras: formalmente (para relacionarlos con la teora), y prcticamente (para vincularlos con los hechos y poder hacer la investigacin). O sea que de los conceptos pueden darse definiciones formales y definiciones de trabajo. La definicin de trabajo de Selltiz no es otra cosa que la definicin operacional y el proceso de llegar a ella se llama operacionalizacin. Relacin entre variables y unidades de anlisis Se enumeran a continuacin algunas reglas bsicas de investigacin, concernientes a las precauciones que deben tomarse al establecer relaciones entre unidades de anlisis y variables. 1) Unidades de anlisis y variable son conceptos diferentes pero relacionados.- La diferencia entre una unidad de anlisis y una variable es la misma que hay entre una cosa y una propiedad. Una cosa puede ser una mesa, y una propiedad puede ser su color, forma o tamao. Una cosa puede ser un metal, y una propiedad su maleabilidad. Una cosa puede ser un conejo, y una propiedad su talla o el estado de su sistema inmunolgico. Una cosa tambin puede ser una persona y como propiedades tener el sexo, la inteligencia, la preferencia poltica, la edad, la raza, etc. Ahora bien: la cosa es la unidad de anlisis, mientras las propiedades son las variables, con lo cual stas ltimas resultan ser atributos, propiedades o caractersticas de las unidades de anlisis. Una investigacin puede trabajar, por ejemplo, con 200 unidades de anlisis (200 personas) y con slo dos variables (peso y talla); otra investigacin puede trabajar con 30 unidades de anlisis (30 estudiantes) y cuatro variables (rendimiento, tipo de enseanza recibida, personalidad e inteligencia); y as sucesivamente.

Pgina 158 de 331

159
2) Unidades de anlisis y variables son conceptos relativos.- Lo que en una investigacin es una unidad de anlisis, en otra puede funcionar como variable: si persona es una cosa, entonces memoria puede ser una variable; pero si memoria es la cosa, entonces capacidad de almacenamiento puede ser una variable. Dentro de una misma investigacin el mismo concepto no puede ser ambas cosas, o sea, unidad de anlisis y variable al mismo tiempo. Por ejemplo, al investigar en los individuos la relacin entre inteligencia y alimentacin, claramente inteligencia es una variable. Sin embargo, en las investigaciones emprendidas por Charles Spearman, por citar un ejemplo histrico, la inteligencia es considerada la unidad de anlisis, de la cual se estudian algunas variables mediante el anlisis factorial, como la inteligencia verbal y la inteligencia manual, en sus mutuas relaciones. Las siguientes afirmaciones ilustran la relatividad de las ideas de unidad de anlisis y variable. Juan (UA) es inteligente (V) La inteligencia (UA) es inteligencia verbal (V) La inteligencia verbal (UA) es comprender palabras (V). La transformacin de una variable en unidad de anlisis (por ejemplo inteligencia en la primera afirmacin se transforma en inteligencia en la segunda afirmacin) tiene, sin embargo, un lmite. Este lmite aparece cuando una variable ya no se puede transformar ms en unidad de anlisis. En el ejemplo, la variable emprica "comprensin de palabras" no puede ya ser considerada unidad de anlisis porque no se pueden seguir extrayendo variables de ella. En este caso, decimos que la variable se ha convertido en un indicador. El concepto de indicador ser examinado al tratar el tema de la operacionalizacin. Un ltimo ejemplo donde un mismo concepto puede ser entendido como una unidad de anlisis o como una variable es el siguiente: un sonido en tanto 'propiedad de algo' es una variable (por ejemplo propiedad de un sonajero), pero en tanto 'elemento que tiene una propiedad' es una unidad de anlisis (por ejemplo el sonido tiene altura, intensidad o timbre). 3) La variable debe ser un atributo atingente o congruente con la unidad de anlisis.- Esto significa que la variable elegida tiene que ser efectivamente una propiedad de la unidad de anlisis considerada. Por ejemplo, no tiene sentido decir que el estado civil es una caracterstica de un grupo, o que el sexo sea una propiedad de una organizacin. Desde ya, puede ocurrir que una misma variable sea aplicable a ms de una unidad de anlisis: la cohesin puede predicarse tanto de una pareja, como de un grupo o una organizacin. Ejemplos de unidades de anlisis y variables en psicologa son: Unidad de anlisis Individuo Pareja Grupo Organizacin Variables Edad, inteligencia, personalidad, preferencia sexual, etc. Estado civil, diferencia de edades, promedio de edades, personalidad del cnyuge masculino, coincidencia de personalidades, cantidad de hijos, etc. Cohesin, tamao, tipo de liderazgo, productividad, etc. Cultura organizacional, antigedad, grado de apertura al exterior, etc.

4) Toda investigacin debe incluir al menos una unidad de anlisis, y cada unidad de anlisis una variable.Carece de sentido decir "voy a iniciar una investigacin sobre las personas": hay que aclarar qu aspectos o caractersticas de las personas vamos a investigar, an cuando luego se cambien sobre la marcha. Una investigacin sencilla puede considerar solamente un tipos de unidad de anlisis y una variable (ejemplo, indagar las preferencias polticas de los estudiantes). Una investigacin ms compleja puede incluir dos unidades de anlisis, cada una con su o sus correspondientes variables (ejemplo, indagar la relacin entre la inteligencia de las personas y el grado de cohesin de los grupos que integran). La definicin conceptual de las variables Para poner a prueba la hiptesis es preciso dar una definicin conceptual de las variables que contiene. Ello permitir luego clasificarlas, operacionalizarlas y categorizarlas. En la vida cotidiana lo habitual es usar las palabras, no definirlas. De hecho, a la hora de definirlas se suelen encontrar dificultades, en parte por falta de entrenamiento. As, cuando se intenta definir profesin se dice profesin es lo que uno hace, lo cual puede confundirse con oficio o hobby. En la investigacin cientfica se exigen definiciones explicitas y desprovistas de ambigedad y, adems, preferiblemente definiciones conceptuales, es decir, que indiquen atributos esenciales y no se limiten a dar ejemplos. Una definicin conceptual de la variable ausentismo laboral puede ser el grado en el cual un trabajador no se reporta a trabajar a la hora programada para hacerlo (Hernndez Sampieri y otros, 1996:102). Por tanto, una definicin conceptual no otra cosa que el significado de la palabra, significado que surge a partir del marco terico utilizado (y por ello algunos autores llaman definicin terica a la definicin conceptual). Por ejemplo, la variable inteligencia ser definida conceptualmente segn que se considere la teora de Piaget, la teora de Weschler o la teora de Gardner. Otras veces la variable es definida lexicogrficamente, es decir, apelando a la definicin del diccionario comn. As, la variable sexo puede definirse como condicin orgnica que distingue al hombre de la
Pgina 159 de 331

160
mujer. A partir de all, la sociologa ampliar la definicin y en funcin de ella buscar algn indicador sencillo, como por ejemplo la informacin que ofrece el documento de identidad, mientras que la medicina considerar otra definicin y buscar varios indicadores: la cromatina (sexo cromatnico), los cromosomas X e Y (sexo cromosmico), la estructura de los genitales (sexo gonadal) y la apariencia externa (sexo fenotpico) Esta diferente tipificacin del sexo har entonces que la primera variable sea clasificada como simple y la segunda como compleja. Tambin har que se den diferentes definiciones operacionales de las variables y que se las categorice de manera diferente (masculino y femenino en el primer caso, y en el segundo caso masculino normal, femenino normal, sndrome de Turner, sndrome de Klinefelter, seudohermafroditismo masculino, etc). Por tanto, dar una definicin conceptual de la variable es lo que permitir luego clasificarla, operacionalizarla y categorizarla. Clasificacin de las variables Las variables se pueden clasificar segn diversos criterios: Criterio Segn su Segn su Segn su Segn su Segn su Segn su Tipos de variables Independientes / Dependientes / Extraas Cualitativas / Cuantitativas (discretas y continuas) Organsmicas / Situacionales Empricas o manifiestas / Tericas o latentes Simples / Complejas Activas / Asignadas

funcin en la investigacin nivel de medicin mbito de accin distancia al plano emprico nivel de complejidad manipulacin

a) Segn su funcin en la investigacin.- Las variables pueden ser independientes, dependientes y extraas. Se trata de variables relevantes porque por uno u otro motivo deben ser tenidas en cuenta en las investigaciones. La variable independiente (VI) es la que hace variar el investigador para ver si se produce tambin una variacin en la variable dependiente (VD). Esta ltima entonces se define como la variable que vara o puede variar con la VI: la variable dependiente no necesariamente debe variar, pero s es cierto que sobre ella recae una expectativa de variacin. Finalmente, la variable extraa (VE) es aquella que tambin puede hacer variar la variable dependiente pero que se la controla para que no lo haga, o, al menos, para conocer su grado de influencia para luego descontarlo del efecto de la variable independiente. En las hiptesis causales, la VI es la posible causa y la VD es el posible efecto, mientras que en las hiptesis correlacionales, puede decirse que la VI es aquella de la cual se sospecha que es la causa, aunque dicha hiptesis no la plantee explcitamente como tal. En sntesis hasta aqu: la variable dependiente es aquella que supuestamente depende de otra variable, llamada independiente, y la variable independiente es aquella de la cual supuestamente depende la variable dependiente. En la hiptesis que dice que "nuestra impresin de las personas depende de cmo hablan" se est considerando que la impresin es la variable dependiente y el modo de hablar la variable independiente.
Un tema clsico de la tradicin cientfica norteamericana de la dcada del 40 fue las investigaciones sobre la relacin entre frustracin y agresin. Un experimento tpico consisti, por ejemplo, en reunir un grupo de personas y darles para resolver problemas que eran en realidad insolubles, aunque no se les informaba de esto ltimo. A medida que estas personas intentaban resolver los problemas, iba incrementndose su frustracin, y, algunos antes y otros despus, empezaban a manifestar comportamientos agresivos con diferentes modalidades e intensidades contra quienes les haban propuesto los problemas, lo que vena a sugerir que la frustracin produca agresin. Fuera de estas situaciones experimentales, en la vida cotidiana no es impensable suponer que cuando a una persona no le ofrecen un trabajo que le haban prometido, o cuando no es correspondida en su amor (frustracin), puede desarrollar hacia el otro un comportamiento agresivo en una amplia gama que va desde la calumnia hasta el ataque fsico. En este contexto, se dice que la agresin depende de la frustracin y, por lo tanto, que la agresin es la variable dependiente porque depende de la otra variable que es la frustracin, mientras que esta ltima ser la variable independiente porque es la que supuestamente hace variar la agresin. La expresin supuestamente se aplica aqu porque un objetivo central de la investigacin ser determinar si hay o no una relacin entre X e Y, es decir, corroborar o refutar la hiptesis original.

En psicologa, la variable dependiente es por lo comn la respuesta de la persona y, segn Arnau Gras (1980), puede adoptar cualquiera de estas caracterizaciones: 1) una reaccin concreta, como la muscular o la glandular, 2) un movimiento manifiesto y externo, como levantar una pata, donde estn involucrados varios msculos, 3) una respuesta global en funcin de un fin, como presionar una barra para abrir una caja, sin importar qu rgano o grupo muscular se emple, 4) una respuesta a una necesidad, como por ejemplo la conducta de ataque, y 5) respuestas amplias y complejas, como la ansiedad, el poder. Respecto de las variables extraas, el tema ya fue tratado en otro captulo, donde haban quedado clasificadas como organsmicas y situacionales y como fuentes de invalidacin interna y externa. Cabe reiterar, finalmente, tres importantes cuestiones que giran en torno a la relacin entre la variable independiente X y la variable dependiente Y:
Pgina 160 de 331

161
1) Cmo se decide cul es la variable independiente y cul la dependiente? En principio, el criterio consiste en pensar cul es la causa y cul el efecto. Cuando se quiere investigar si tal droga produce o no la curacin de una enfermedad, la droga ser claramente la causa (o la supuesta causa), y la curacin el efecto, es decir, la variable independiente X ser la droga, y la variable dependiente Y ser el efecto curativo. Hay casos, sin embargo, donde cualquiera de ambas variables podra ser la causa o el efecto de la otra. As por ejemplo, en principio, podra suponerse que la agresin depende de la frustracin, pero tambin, y con el mismo fundamento, que la frustracin depende de la agresin (por ejemplo, cuanto ms agresiva es una persona ms ser reprimida y, por ende, ms frustrada se sentir). Indudablemente, se tiene todo el derecho de elegir una u otra posibilidad, y de esta eleccin depender qu se considerare como X y qu como Y, orientando esta eleccin, en consecuencia, toda la investigacin. Sea cual fuere la variable elegida como la posible causa (X), un requisito indispensable para poder avanzar en la investigacin es que dicha variable debe poder ser manipulada por el investigador, es decir, ste debe poder hacerla variar a voluntad, para ver si se produce o no una variacin en la variable dependiente Y, o efecto. Cierto tipo de investigaciones no se interesan, sin embargo, por indagar una relacin causa-efecto, sino simplemente por averiguar si dos variables estn o no asociadas estadsticamente, es decir, si suelen darse juntas. En estos casos, la eleccin de la variable independiente no se realizar en funcin de pensarla como la causa, sino de pensarla como aquella variable que puede ser manipulada por el investigador para establecer su grado de asociacin estadstica con la variable dependiente. Este tipo de investigaciones suelen perseguir una finalidad exclusivamente prctica (pues no buscan indagar vnculos de causalidad). Ejemplos tpicos son las investigaciones de mercado: a una empresa puede interesarle si hay o no asociacin estadstica entre el nivel socioeconmico de las personas y el color que prefieren en los envases de la leche, porque de ello depender en qu barrios distribuir los envases de tal o cual color, y, con ello, podrn maximizarse las ventas. 2) Qu significa la expresin "depende"? Como qued sugerido, que Y depende de X puede significar dos cosas: una dependencia estadstica o una dependencia causal. Una cosa es que dos variables se den habitualmente juntas sin que necesariamente una sea la causa y otra el efecto (dependencia estadstica), y otra es que dos variables estn relacionadas como causa y efecto (dependencia causal). El color de la piel y la forma del crneo son variables que estn bastante asociadas estadsticamente: las personas de piel negra son dolicocfalas, las de piel amarilla son braquicfalas y las de piel blanca son mesocfalas. Esto no significa que el color de la piel sea la causa de la forma del crneo, ni que la forma del crneo sea la causa del color de la piel: simplemente, ambas variables suelen darse juntas o, dicho en trminos ms tcnicos, existe entre ellas una alta correlacin. En cambio, el color de la piel y la aceptacin social, adems de estar asociadas estadsticamente (los negros no son aceptados en ciertos barrios, etc.), hay tambin una dependencia causal: ciertas personas son aceptadas o rechazadas debido a su color de piel. De lo dicho se desprende que una dependencia estadstica no prueba necesariamente que haya una dependencia causal. Para que hay una dependencia causal deben cumplirse, adems de la dependencia estadstica, otra serie de condiciones, como por ejemplo la antecedencia temporal (la causa nunca puede ocurrir despus del efecto). En ocasiones suele asignarse sin ms un vnculo causal a una mera asociacin estadstica o correlacional. Refieren Campbell y Stanley que "si pasamos revista a las investigaciones sobre educacin, pronto nos convenceremos de que son ms los casos en que la interpretacin causal de la informacin correlacional se exagera que aquellos en que se la desconoce..." (Campbell y Stanley, 1995:124). 3) Habida cuenta que la variable dependiente es aquella que depende de la independiente, de qu depende a su vez la variable independiente? La variable independiente tiene dos fuentes posibles de variacin: la variacin natural y la variacin provocada. Con variacin natural queremos decir que, en la realidad, siempre es posible considerar que sobre la variable independiente actan otras variables, lo que no es sino un caso particular del principio general que sostiene que, al estar todas las variables relacionadas, cualquier variable influye sobre otras, y a su vez recibe la influencia de otras tantas. Por ejemplo, as como la variable dependiente agresin puede recibir la influencia de la variable independiente frustracin, esta ltima tambin puede recibir la influencia de la variable educacin (si consideramos que cierto tipo de educacin ensea al sujeto a tolerar mejor la frustracin), de la variable edad (si consideramos que un nio se frustra ms fcilmente que un adulto), de variables de ndole bioqumica (si consideramos que la presencia de determinados neurotransmisores pueden acentuar o no la tolerancia a la frustracin), etc. Todas estas variables que influyen o influiran sobre la variable independiente frustracin ejercer su accin en forma natural, es decir, sin la presencia de alguien (un investigador) que las haga variar deliberadamente. Cuando esto ocurre, podemos hablar de una variacin provocada. Las variaciones provocadas tienen sentido entonces en una situacin experimental donde hay un investigador que deliberadamente haga variar la variable para producir un determinado efecto sobre la frustracin, con el fin de estudiar cientficamente la naturaleza de la relacin entre ellas.

Pgina 161 de 331

162
b) Segn su nivel de medicin.- Las variables pueden ser cualitativas o cuantitativas segn que se midan no numricamente o numricamente. Las variables religin o sexo son cualitativas, mientras que las variables edad o peso son cuantitativas. Sin embargo, depender de una decisin del investigador considerar una variable como cualitativa o cuantitativa, segn su criterio. Si considera para estatura los valores alta, media y baja la estar considerando cualitativa; no as si selecciona los valores 1,60m, 1,70m, etc. Si se desea tener precisin en la medicin, deber preferirse siempre que se pueda el nivel cuantitativo. En las variables cuantitativas, los nmeros deben ser empleados como indicadores de cantidad, no como simples etiquetas. La variable jugador de ftbol admite como categoras defensor, atacante, mediocampista, etc, pero tambin pueden expresarse con los nmeros 1 al 11, lo cual no significa que esta variable sea cuantitativa. Las variables cuantitativas pueden a su vez ser discretas y continuas segn como sea la escala numrica. Por ejemplo, si slo se registran nmeros enteros, es una variable discreta (por ejemplo cantidad de hijos), pero si se registran adems nmeros intermedios fraccionarios hasta donde el instrumento de medicin lo permita, es una variable continua (por ejemplo tiempo, que puede admitir los valores una hora, una hora y 10 minutos y una hora, 10 minutos y 25 segundos). En las variables continuas es siempre posible agregar otro valor entre dos valores dados cualesquiera hasta donde el instrumento lo permita, porque hay instrumentos ms precisos y menos precisos. c) Segn su mbito de accin.- Las variables pueden ser organsmicas y situacionales. Las primeras son propias del sujeto (temperamento, tolerancia a la frustracin, etc), mientras que las segundas son propias del ambiente o la situacin que rodea al sujeto (clima poltico, clima meteorolgico, tipo de tarea a realizar, etc.). Seala Arnau Gras (1980) que la variable situacional son estmulos provenientes del medio fsico o social, como la modalidad o tipo de tarea a realizar. Las organsmicas suponen cualquier caracterstica biolgica, fisiolgica o psicolgica del organismo. Por ejemplo historias de refuerzo, emotividad, actitudes, motivos, etc. Variables organsmicas o situacionales pueden ser las variables independientes (Arnau Gras, 1980), las variables dependientes y las variables extraas. d) Segn su distancia al plano emprico.- Las variables pueden ser empricas -o manifiestas- y tericas -o latentes-. Las primeras pueden observarse y medirse directamente (por ejemplo color de ojos) mientras que las segundas slo pueden observarse y medirse indirectamente traduciendo sus trminos abstractos a trminos empricos. Inteligencia es una variable terica porque slo puede medirse a travs de sus indicadores empricos, como por ejemplo "aptitud para comprender refranes". e) Segn su nivel de complejidad.- Las variables pueden ser simples o complejas. Esta clasificacin es correlativa de la anterior: las variables simples son empricas, y las variables complejas son tericas. Las variables simples son aquellas que, para conocerlas, requieren un solo indicador (para conocer la edad de una persona basta con preguntarle, o bien basta con mirar su documento de identidad, o bien mirar su partida de nacimiento, etc). En cambio las variables complejas requieren de varios indicadores (para conocer la inteligencia de una persona le aplicamos un test donde hay varios tems). f) Segn su manipulacin.- Las variables pueden ser activas o asignadas segn como sean manipuladas, entendiendo por manipulacin la accin que realiza el investigador de cambiar sus valores. Refiere Arnau Gras (1980) que una variable es activa si el experimentador puede manipularla directamente (premios, castigos) y por ello se la llama tambin variable experimental. La variable asignada en cambio, resulta difcil o imposible de manipular, como las variables organsmicas. Se las llama asignadas pues se manipulan por seleccin de los sujetos, pero no pueden ser provocadas directamente por el experimentador. As, cuando investiga una variable activa, se eligen los grupos al azar pero cuando emplea una asignada, se seleccionan dos grupos que difieren en las categoras de dicha variable. g) Otras clasificaciones.- a) Lazarsfeld y Menzel (citados por Korn, 1969) clasifican las variables segn el tipo de unidad de anlisis al que se refieren. Hay variables que son propiedades de unidades de anlisis muy amplias (como las propiedades de un grupo o una sociedad), y otras que son propiedades de sujetos individuales. b) Arnau Gras (1980) utiliza un criterio terico-explicativo segn el cual las variables pueden ser estmulos, respuestas o variables intermediarias entre el estmulo y la respuesta. Las variables estmulo son cualquier aspecto mensurable del ambiente fsico o social, presente o pasado, que puede afectar la conducta del organismo. Las variables de respuesta son las medidas obtenidas de diversos aspectos de la conducta de los sujetos. Las variables intermediarias son los procesos que se intercalan entre las dos anteriores, aunque no todos los psiclogos admiten la necesidad de tales variables. Estudiar cmo varan las variables permite obtener conclusiones sobre la aceptacin o rechazo de la hiptesis. Este paso fundamental, sin embargo, no puede llevarse a cabo si antes no se ha sometido a todas las variables de la hiptesis a un doble proceso: la operacionalizacin o definicin operacional y la categorizacin.

Pgina 162 de 331

163
Categorizacin de las variables Es la adjudicacin de categoras o valores a una variable. A su vez, las categoras o valores son las diferentes posibilidades de variacin que una variable puede tener. Por ejemplo, las categoras de clase social pueden ser alta, media y baja, y los valores de tiempo de reaccin pueden ser un segundo, dos segundos, etc.
Se acostumbra a llamar categoras a aquellas que no admiten un tratamiento cuantitativo por medio de clculos, y por lo tanto regularmente se expresan en palabras. Tales son las categoras de clase social, de raza, de partido poltico, etc. En cambio suelen llamarse valores a las posibilidades de variacin cuantitativa, por lo que han de expresarse numricamente. Es el caso de las variables cuantitativas peso, altura, ingreso mensual, edad, nmero de hijos, cantidad de ingesta diaria de alcohol, etc.

La eleccin del conjunto de categoras o valores depender de la naturaleza de la variable, del objetivo de la investigacin y del grado de precisin que se quiere alcanzar. Respecto de la naturaleza de la variable, no pueden elegirse verde o amarillo como categoras de la variable ocupacin. Respecto del objetivo de la investigacin, seala Korn (1969) que el sistema de categoras elegido debe tener relevancia para el contexto donde se aplicar, ya que toda variable tiene una amplitud de variacin tericamente mucho mayor que la que resulta relevante en cada situacin especfica. Si acaso el estudio se centra en un pas donde slo hay dos clases sociales netamente diferenciadas, entonces slo se indicarn dos categoras. Respecto del grado de precisin deseable, muchas veces puede aumentarse este eligiendo categoras intermedias, y agregar a las clases alta, media y baja las categoras media alta y media baja. El investigador tiene una cierta libertad para elegir las categoras de su variable. No obstante ello, y sea cual fuese el sistema de categoras seleccionado, ste debe reunir dos requisitos: a) las categoras deben ser mutuamente excluyentes. No puede decirse que las categoras de la variable religin son cristianos y catlicos porque hay una superposicin en las mismas; b) deben ser adems exhaustivas, o sea deben agotar todas las posibilidades de variacin, con lo cual no podra decirse que las categoras de la variable raza son solamente blanca y negra. Hay veces en que son muchas las categoras que habra que agregar para cumplir con este requisito, en cuyo caso pueden agruparse a todas las restantes bajo una categora residual caratulada como Otras. Estos dos requisitos sirven en la medida en que permiten ubicar a cualquier sujeto en una y slo una categora sin que surjan dudas. Si hay que ubicar al Papa no se sabr si ponerlo en cristianos o catlicos, de aqu que pueda tambin definirse la exclusin mutua como la imposibilidad de que un sujeto cualquiera pueda adquirir ms de un valor de la variable. En el caso de la variable ocupacin, puede ocurrir que un individuo sea al mismo tiempo mdico y psiclogo, en cuyo caso se podrn abrir categoras mixtas (por ejemplo mdico y psiclogo) con lo que queda igualmente salvado el requisito de la mutua exclusin. De idntica forma y para el segundo requisito, si hay que ubicar a un japons y slo se cuenta con las categoras blanco y negro no se podr hacerlo por falta la categora oriental; de aqu que tambin podamos definir la exhaustividad como la imposibilidad de no poder categorizar a un sujeto cualquiera. La definicin operacional de las variables u operacionalizacin Definir operacionalmente una variable es especificar qu operaciones o actividades debe realizar el investigador para medirla. Estas operaciones se llaman indicadores, y, cuando recogen informacin de la realidad son capaces de convertirla en datos. Las variables simples se operacionalizan con un solo indicador, mientras que las variables complejas requieren varios indicadores. a) Operacionalizacin de variables simples.- Por ejemplo, operacionalizar la variable sexo significa especificar qu actividad realizar el investigador para medirla: mirar el documento de identidad, preguntar al sujeto cual es su sexo, observar su aspecto fsico general, observar si tiene o no la nuez de Adn, observar sus genitales externos, etc. Estas diversas operaciones se llaman indicadores. Desde ya, el investigador no realizar todas esas operaciones, sino que elegir alguna que suponga confiable y representativa de la variable. Nadie elegira como indicador observar si tiene o no pantaln, sino mas bien preguntar al sujeto cual es su sexo. Y si acaso existiesen razones para dudar de su respuesta, podr optarse por un indicador ms confiable: mirar el documento de identidad.
La definicin operacional es el conjunto de procedimientos que describe las actividades que un observador debe realizar para recibir las impresiones sensoriales (sonidos, impresiones visuales o tctiles, etc) que indican la existencia de un concepto terico en mayor o menor grado (Reynolds, 1971:52). La definicin operacional entonces, indica operaciones para medir una variable, y, aunque estas operaciones sern denominadas en el presente libro indicadores, no todos los autores coinciden con esta convencin lingstica o no son explcitos respecto a ella. Por ejemplo: a) un indicador es una propiedad manifiesta u observable que se supone est ligada empricamente, aunque no necesariamente en forma causal, a una propiedad latente o no observable que es la que interesa (Mora y Araujo, 1971); b) se denomina indicador a la definicin que se hace en trminos de variables empricas de las variables tericas contenidas en una hiptesis (Tamayo, 1999:126); c) un indicador de una variable es otra Pgina 163 de 331

164
variable que traduce la primera al plano emprico (Korn, 1965). Por su parte, Hernndez Sampieri y otros (1996:242) llaman indicador al dato obtenido con la operacin.

Otros ejemplos de operacionalizacin de variables simples son las siguientes: Variable simple Denticin Ambulacin Estrs Ausentismo laboral Profesin Enuresis nocturna Peso Frecuencia cardaca Grado de alfabetizacin Indicador Observar la cantidad y el tipo de piezas dentarias de una persona Medir el nmero de veces que una rata cruza una lnea marcada en el piso (Lores Arnaiz, 2000). Medir el nivel de cortisol (Lores Arnaiz, 2000). Revisar de las tarjetas de asistencia al trabajo, durante el ltimo trimestre (Hernndez Sampieri y otros, 1996:102). Preguntarle al sujeto cul es su profesin. Averiguar cuantas noches por mes y cuantas veces cada noche se orina involuntariamente. Observar el registro en la balanza. Tomar el pulso y contar la cantidad de pulsaciones por minuto. Obtener el porcentaje de analfabetos sobre el total de la poblacin (Korn, 1965).

Cuando se realiza la operacin especificada como indicador, se obtiene un dato, el cual a su vez permitir ubicar al sujeto en alguna categora de la variable: Variable simple Peso Indicador Observar el registro en la balanza. Dato 89 Kg Categora 80-90 Kg

Diversas tcnicas pueden utilizarse para operacionalizar variables, como por ejemplo la observacin (utilizada por ejemplo en la operacin mirar la apariencia de la persona), los tests psicomtricos o proyectivos (utilizada por ejemplo en la operacin tomar un test), las tcnicas conductuales (utilizadas por ejemplo en la operacin dar un estmulo tctil a una persona), las tcnicas psicofisiolgicas (utilizadas por ejemplo en la operacin registrar las respuestas elctricas del tejido vivo), las tcnicas anatmicas (utilizadas por ejemplo en la operacin de hacer una diseccin del lbulo frontal), el cuestionario (utilizada por ejemplo en la operacin preguntar al sujeto cul es su profesin), etc. b) Operacionalizacin de variables complejas.- A diferencia de las variables simples, la operacionalizacin de variables complejas supone especificar varias operaciones o indicadores, y a veces muchos. Por ejemplo, la variable inteligencia se explora a travs de tantos indicadores como pruebas o preguntas tenga el test de inteligencia. Uno puede ser pedir al sujeto que arme un rompecabezas, otro puede ser pedirle al sujeto que explique el significado de una palabra, otro pedirle al sujeto que haga una operacin aritmtica, etc. De la misma forma, la variable clase social se explora a travs de indicadores tales como preguntar al sujeto cual es su ingreso mensual, preguntarle si utiliza o no tarjeta de crdito, preguntarle en qu barrio vive, preguntarle por su nivel de instruccin, preguntarle por su ocupacin, etc. En ciertos pases y culturas las personas de distinta clase social se visten inexorablemente en forma muy distinta, y basta este solo indicador para saber enseguida a qu clase social pertenece una persona sin necesidad de investigar su nivel econmico, el prestigio de su ocupacin, su nivel de educacin, etc. En estos casos clase social pasa a ser una variable simple y se la mide con un nico indicador, que puede ser la operacin observar como se viste la persona. Cuando una variable slo puede ser medida a travs de tests, cuestionarios o entrevistas, seguramente se trata entonces de una variable compleja. Nadie administrara un test a una persona para conocer su edad o su estatura. Dos cuestiones ms deben ser tratadas a propsito de la operacionalizacin de las variables complejas: la seleccin de los indicadores y la especificacin de las dimensiones. Respecto de la seleccin de los indicadores, debe partirse de la base que el universo de indicadores es amplio y complejo. A medida que la discusin del concepto se ampla, se va modificando su definicin conceptual y el nmero de indicadores posibles se aumenta, lo cual se denomina comnmente universo de indicadores (Tamayo, 1999:126). Un problema que debe resolverse es como seleccionar los indicadores necesarios y suficientes para medir adecuadamente la variable. En principio, dos muestras diferentes de indicadores pueden ser igualmente eficaces para medirla, como lo sugiere la teora de la intercambiabilidad de ndices, basada en la experiencia de que, dado un gran universo de tems o indicadores, cualquiera que sea la muestra elegida para formar el instrumento clasificatorio, no se hallarn grandes diferencias (Lazarsfeld, 1980). En la prctica, la seleccin de indicadores se basa en parte en la intuicin (Mora y Araujo, 1971), y en parte en criterios ms objetivos (Lazarsfeld, 1980): elegir indicadores altamente correlacionados con la variable (indicadores expresivos) o indicadores que supuestamente son el efecto de la variable o causa (indicadores predictivos).
Pgina 164 de 331

165
Por ejemplo (Lazarsfeld, 1980), al buscar indicadores de la variable antisemitismo pueden seleccionarse dos tipos de indicadores, o una mezcla de ambos: a) la obediencia y el respeto a la autoridad son las virtudes ms importantes que debe aprender un nio. Esta es una afirmacin que figura en un cuestionario que mide antisemitismo y el sujeto debe responder si est o no de acuerdo. Pero este indicador no expresa directamente la variable antisemitismo sino autoritarismo, y si es seleccionado es solamente porque se sabe que hay una alta correlacin entre ambas variables; b) la mayora de la gente no se da cuenta hasta qu punto nuestras vidas estn regidas por las conspiraciones de los polticos. Este indicador ya expresa directamente el antisemitismo, y est en una relacin de causa-efecto con el mismo: el grado de antisemitismo es la causa de que la persona responda si est o no de acuerdo con dicha afirmacin. Lazarfeld (1980) llama al primer tipo indicador expresivo, y al segundo indicador predictivo pues slo se puede predecir una respuesta con cierta seguridad sobre la base de un vnculo causal. El mismo autor sugiere buscar primero indicadores expresivos y luego indicadores predictivos Por ejemplo para la variable personalidad autoritaria se buscan primero indicadores expresivos; por ejemplo indicadores de convencionalismo, supuestamente correlacionado con personalidad autoritaria (cmo decorara su pieza?, qu sentimientos le inspira el pelo corto y el pelo corto y el lpiz labial en la mujer?), indicadores de supersticin, tambin supuestamente correlacionada con la variable principal (cree en profecas?), etc. Finalmente se buscan indicadores predictivos (quines fueron las personalidades ms destacadas de Alemania? cul es la mejor forma de gobierno?, etc) (Lazarsfeld, 1980). Otras reglas tiles para seleccionar indicadores son las siguientes (Mora y Araujo, 1971): a) seleccionar indicadores redundantes (preguntas de un cuestionario que indagan los mismo de diferente forma para ver si el sujeto se contradice), y b) seleccionar indicadores muy diferentes entre s para cubrir todo el espectro de dimensiones de la variable o todo el espectro de caractersticas del sujeto que responde (en un cuestionario incluir preguntas personales mezcladas con preguntas impersonales). Respecto de la especificacin de las dimensiones, muchos autores sealan que, en el caso de las variables complejas, resulta necesario o conveniente especificar dimensiones y luego, desde all, especificar los indicadores. Mientras que algunos autores (Hernndez Sampieri y otros, 1996:100) se limitan a las definiciones conceptuales y operacionales, otros (Tamayo, 1999:159) (Korn, 1969) indican que los pasos de la operacionalizacin de una variable compleja son la definicin nominal, la definicin real (o enumeracin de dimensiones) y la definicin operacional (o enumeracin de indicadores). Definir tericamente, realmente y operacionalmente una variable permitira entonces traducirla en propiedades observables y medibles, descendiendo cada vez ms desde lo general a lo singular. El esquema correspondiente sera:

Variable

Dimensin 1

Dimensin 2

Dimensin 3

Indicador 1 Indicador 3

Indicador 2

Indicador 1

Indicador 2

Las dimensiones son aspectos o facetas de una variable compleja. Por ejemplo, dimensiones de inteligencia podran ser inteligencia verbal, inteligencia manual e inteligencia social; dimensiones de memoria podran ser memoria visual, memoria auditiva y memoria cintica, o tambin memoria de corto plazo y memoria de largo plazo; dimensiones de clase social podran ser nivel socio-econmico y nivel de instruccin; dimensiones de creatividad podran ser creatividad plstica y creatividad literaria, etc. Pueden tambin establecerse subdimensiones, como por ejemplo las subdimensiones creatividad en prosa y creatividad en poesa para la dimensin creatividad literaria. Cuanta ms cantidad y niveles de dimensiones y subdimensiones requiere una variable, tanto ms compleja ser sta.
La seleccin de las dimensiones depender de cmo se haya definido conceptualmente la variable. Si en la definicin de clase social se ha recalcado la importancia del nivel econmico y del nivel de instruccin, pueden adoptarse estos dos aspectos como dimensiones, es decir, se piensa que lo econmico y lo educativo es algo importante para saber a qu clase social pertenece una persona. De idntica manera, si se adopta la teora de Gardner de las inteligencias mltiples para dar una definicin conceptual de inteligencia, entonces corresponder elegir como dimensiones inteligencia verbal, matemtica, artstica, intrapersonal, interpersonal, kinestsica, etc. Pgina 165 de 331

166
Una vez que se han identificado las dimensiones, el proceso contina seleccionando indicadores para cada dimensin o subdimensin, lo cual es una manera de organizar los indicadores asegurndose de no omitir ningn aspecto relevante de la variable. Como puede apreciarse, a medida que se especifican dimensiones y luego indicadores, hay un acercamiento cada vez mayor al plano emprico. Para la variable clase social se pasa, por ejemplo, de la dimensin nivel socio-econmico a la subdimensin nivel econmico, y desde aqu al indicador preguntar cual es su patrimonio actual o al indicador preguntar si es propietario, que constituirn elementos de juicio para decidir a qu clase social pertenece el sujeto.
Si un profano pregunta qu es la inteligencia y recibe una definicin terica o conceptual, mucho no habr entendido, pero si le enumeran dimensiones como inteligencia verbal, manual o social, habr comprendido algo ms porque es algo ms prximo a la realidad; y finalmente, su comprensin ser ms completa si se mencionan indicadores como preguntar si sabe utilizar palabras, si es hbil con las manos, si es hbil para tratar con personas, si puede encontrar el absurdo en frases del tipo qu lstima que el sol se ponga de noche porque ese es justo el momento donde ms lo necesitamos! o como llova, Juan se sumergi en el ro para no mojarse.

Conviene aclarar tambin que un mismo indicador puede corresponder a dos dimensiones distintas. Por ejemplo el indicador preguntar a qu colegio asiste puede corresponder a nivel de instruccin pero tambin a nivel socio-econmico. Conviene tambin aclarar que lo que en una investigacin es considerada una dimensin, en otra puede funcionar como variable principal. Por ejemplo, en un estudio sobre creatividad, creatividad literaria ser una dimensin, pero en un estudio ms especfico sobre creatividad literaria, esta pasar a ser la variable. Relaciones entre la categorizacin y la operacionalizacin Las dimensiones, subdimensiones e indicadores de una variable son a su vez, estrictamente hablando, tambin variables, porque son susceptibles de variar segn sus propias categoras. Por ejemplo, la dimensin nivel de instruccin puede variar como primaria, secundaria o universitaria, y por ende es una variable. A medida que se pasa de las dimensiones a las subdimensiones y de estas a los indicadores, dichas variables se tornan cada vez menos simples y ms empricas o manifiestas. El siguiente esquema ilustra la idea de que las variables, dimensiones, subdimensiones e indicadores pueden todos categorizarse. Por ejemplo, para la variable actitud discriminatoria se pueden especificar tres categoras: alta, media y baja. Para la subdimensin discriminacin sexual hacia el sexo opuesto tambin, y para el indicador discriminacin sexual en la eleccin de puestos (por ejemplo, preguntar al sujeto si deben darse puestos de trabajo a hombres o a mujeres), se han indicado dos categoras: hombre y mujer. Cuando el sujeto elige una de las categoras (por ejemplo hombre) se dice que se ha obtenido un dato.

Pgina 166 de 331

167

A ACTITUD DISCRIMINATORIA

A S SEXUAL

B R RACIAL

H HACIA SEXO OPUESTO

H HACIA HOMOSEXUALES

E ELECCION PUESTO

I INTELIGENCIA

Operacionalizacin

DATO 1 Elige hombre E

C Categorizacin

Suele a veces confundirse categoras con dimensiones, y al respecto deben tenerse en cuenta las siguientes precisiones: a) A un determinado sujeto puede inclurselo solamente en una categora (o es de clase alta, o es de clase baja, o es de clase media, etc), mientras que el mismo sujeto incluye todos los aspectos o dimensiones (tiene determinado nivel socio-econmico, determinado nivel de instruccin, etc). b) Lo anterior de debe a una cuestin lgica: las categoras son excluyentes (o) y las dimensiones estn en conjuncin (y). Para la variable clase social se habla de alta o baja, pero en las dimensiones se habla de nivel-socioeconmico y nivel de instruccin. El o indica exclusin mutua, y el y indica conjuncin. c) Dos variables relacionadas en una hiptesis pueden tener distintas categoras pero no las mismas dimensiones, pues seran la misma variable. d) Las categoras son los valores posibles de una variable, mientras que las dimensiones son los aspectos discernibles que sirven para describirla.

Pgina 167 de 331

168

CAPTULO 12: TCNICAS DE MUESTREO E INSTRUMENTOS DE MEDICIN


En este captulo se desarrollarn los siguientes pasos de la investigacin cientfica tpica: a) definir la poblacin, b) decidir como extraer de ella una muestra, y c) seleccionar o construir los instrumentos de medicin que se aplicarn a los individuos seleccionados.

1. DEFINICIN DE LA POBLACIN
Antes de seleccionar la tcnica de muestreo adecuada al problema y a los objetivos de la investigacin, se requiere definir la poblacin y las unidades de anlisis que la compondrn. Las unidades de anlisis son aquellas entidades cuyas propiedades son las variables que quieren estudiarse. Las unidades de anlisis pueden ser personas (alumnos, pacientes, lderes, payasos, soldados, etc), organizaciones (comerciales, no gubernamentales, hospitales, medios de comunicacin, etc), familias, grupos de autoayuda, etc. Deben tambin definirse sus propiedades y sus coordenadas de lugar y tiempo. Por ejemplo, una poblacin estar constituida por todos los alumnos varones de quinto grado de las escuelas pblicas (propiedades) de la ciudad de Buenos Aires (lugar) durante el ao 2005 (tiempo).

2. SELECCIN DE LA TCNICA DE MUESTREO


Una tcnica de muestreo es un procedimiento para extraer una muestra de una poblacin, mientras que una muestra es una parte de la poblacin que est disponible, o que se selecciona expresamente para el estudio de la poblacin. Representatividad de la muestra.- Es deseable y hasta imprescindible que una muestra sea representativa de la poblacin. Cuatro mujeres no es una muestra representativa de los habitantes de una ciudad, porque las mujeres son la mitad de los habitantes. Que la muestra sea representativa es importante porque luego se podrn extender a toda la poblacin las conclusiones que se hayan extrado de ella. De acuerdo a Tamayo (1999:185), son cuatro las condiciones que garantizan la representatividad de una muestra: a) definir y delimitar la poblacin a la que deben extenderse las conclusiones obtenidas a partir de la muestra; b) garantizar que cada unidad de poblacin tenga igual probabilidad de ser incluida en la muestra; c) utilizar un muestreo no viciado por posibles relaciones existentes entre las unidades de poblacin; y d) tomar una muestra amplia a fin de reducir al mximo el error de muestreo. De una manera ms simplificada, puede decirse que una muestra es representativa si: a) si tiene un tamao adecuado, y b) si fue elegida al azar. Esta ltima condicin introduce el tema de las diferentes tcnicas de muestreo, clasificables como probabilsticas y no probabilsticas. Tamao de la muestra.- El tamao de la muestra es la cantidad de datos que sern extrados de la poblacin para formar parte de la muestra (Valds F, 1998). Si bien existen procedimientos matemticos para calcular el tamao de una muestra, esta tarea puede a veces tornarse compleja dado el tipo de problema a investigar y la poblacin considerada. Hernndez Sampieri (1996:228) sugieren tomar como referencia los tamaos de muestra elegidos por otros investigadores. Por ejemplo, es habitual que para poblaciones nacionales (por ejemplo un pas) se tome una muestra al azar no menor a 1000 sujetos, mientras que para poblaciones regionales (por ejemplo una provincia, una ciudad), se consideren de 300 a 700 sujetos para estudios sobre conducta y actitudes, de 500 sujetos para estudios mdicos, y de 100 sujetos para experimentos de laboratorio y estudios econmicos. Seala Tamayo (1999:198) que el tamao de la muestra depende del grado de error que sea tolerable en las estimaciones muestrales y de los objetivos de investigacin. En otras palabras, si uno est dispuesto a tolerar un mayor error, puede tomar una muestra de menor tamao por cuanto ser menos representativa. En general, el tamao de la muestra no debe ser ni muy grande (porque entonces, si bien es representativa, supone un esfuerzo adicional intil trabajar con ella), ni muy pequea (porque entonces puede no ser representativa). La estadstica ha desarrollado ciertas frmulas especiales para calcular tamaos de muestra de acuerdo al grado de error que se est dispuesto a cometer, al grado de homogeneidad de la muestra y a otras consideraciones. Refiere Tamayo (1999:147) que a mayor grado de heterogeneidad de las unidades de poblacin y menor tamao de la muestra, mayor probabilidad de que sta resulte insuficiente. El tamao de la muestra se calcula con base a la varianza de la poblacin y la varianza de la muestra. Esta ltima expresada en trminos de probabilidad de ocurrencia. La varianza de la poblacin se calcula con el cuadrado del error estndar, el cual determinamos. Cuanto menor sea el error estndar, mayor ser el tamao de la muestra (Hernndez Sampieri y otros, 1996:233). Tcnicas de muestreo.- Las tcnicas para recoger muestras pueden clasificarse de acuerdo a dos criterios diferentes:

Pgina 168 de 331

169
a) Segn el nmero de muestras tomadas de la poblacin, los muestreos pueden ser simples, dobles o mltiples (Rodas y otros, 2001) segn que elijan una muestra, dos muestras o ms de dos muestras. A veces es preciso extraer una segunda muestra cuando los resultados de la primera no alcanzan o no son definitivos. Por ejemplo el investigador toma una segunda muestra al azar entre aquellos que no respondieron un cuestionario y entrevista a los sujetos seleccionados a fin de obtener la informacin y mayor confiabilidad de los datos (Tamayo, 1999:148). En otro ejemplo, al probar la calidad de un lote de productos manufacturados, si la primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja una calidad intermedia, ser requerir la segunda muestra (Rodas y otros, 2001). Los muestreos dobles o mltiples pueden a su vez ser transversales o longitudinales, segn que las muestras sean extradas simultnea o sucesivamente en el tiempo. Algunos autores (Tamayo, 1999:148) denominan a estos ltimos muestreos cronolgicos, como el caso donde se requieren extraer varias muestras de conducta a lo largo del tiempo, a intervalos regulares, con el fin de estudiar su evolucin. Otros ejemplos de muestreos dobles o mltiples son los muestreos estratificados o los muestreos por conglomerados, que sern mencionados ms adelante como modalidades de los muestreos probabilsticos. b) Segn el modo de elegir los individuos de la muestra, los muestreos pueden ser de dos grandes tipos: probabilsticos (los individuos son elegidos al azar), y no probabilsticos (no elegidos al azar). En el primer caso, cualquier individuo tiene la misma probabilidad de ser incluido en la muestra, y en el segundo caso no. Adems, en el primer caso la generalizacin de los resultados a toda la poblacin es ms vlida que en el segundo. En los muestreos probabilsticos pueden usarse tres procedimientos de seleccin: la tmbola, la tabla de nmeros random (al azar) y la seleccin sistemtica. Todo procedimiento de seleccin depende de listados, ya sea existentes o construidos ad hoc, como por ejemplo el directorio telefnico, listas de asociaciones, listas de escuelas oficiales, etc. Cuando no existen listas de elementos de la poblacin se recurren a otros marcos de referencia que contengan descripciones del material, organizaciones o sujetos seleccionados como unidades de anlisis. Algunos de estos pueden ser los archivos, hemerotecas y los mapas (Hernndez Sampieri y otros, 1996:233). Algunos tipos de muestreo probabilstico o aleatorio son los siguientes: Muestreo simple.- Se eligen los individuos utilizando, por ejemplo, una tabla de nmeros aleatorios. Refieren Rodas y otros (2001) que si la poblacin es infinita, esta tarea se torna imposible, por lo cual se recurre a otros tipos de muestreo aleatorio como el sistemtico, el estratificado o el muestreo por conglomerados. Muestreo sistemtico.- Consiste en la seleccin de las unidades de muestreo de acuerdo con un nmero fijo k, es decir, se elige una unidad cada k veces (Tamayo, 1999:150). Ms especficamente, una muestra sistemtica es obtenida cuando los elementos son seleccionados en una manera ordenada. La manera de la seleccin depende del nmero de elementos incluidos en la poblacin y el tamao de la muestra. El nmero de elementos en la poblacin es, primero, dividido por el nmero deseado en la muestra. El cociente indicar si cada dcimo, cada onceavo, o cada centsimo elemento en la poblacin va a ser seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemtica puede dar la misma precisin de estimacin acerca de la poblacin, que una muestra aleatoria simple cuando los elementos en la poblacin estn ordenados al azar (Rodas y otros, 2001). El muestreo sistemtico se llama tambin muestreo a intervalos regulares (Tamayo, 1999:147). Muestreo estratificado.- Se divide la poblacin en estratos (por ejemplo por clase social, por edades, etc) y de cada estrato, que es ms homogneo que la poblacin, se extrae una muestra mediante muestreo aleatorio simple o sistemtico. En general, la estratificacin aumenta la precisin de la muestra, es decir, presenta menor error muestral que el muestreo simple (Vallejo Ruiloba J y otros, 1999:70) (Hernndez Sampieri y otros, 1996:233) (Rodas O y otros, 2001). Cuando la cantidad de individuos seleccionada en cada estrato es proporcional a la cantidad total del estrato poblacional, se habla de muestreo proporcional. En oposicin, en un muestreo no proporcional el nmero de casos sacado de cada uno de los diversos estratos del universo en cuestin no guarda relacin con el nmero de unidades del estrato (Tamayo, 1999:149). Muestreo por conglomerados.- Se divide la poblacin en conglomerados, generalmente geogrficos como por ejemplo en barrios o en ciudades, y de cada uno se extrae una muestra mediante un procedimiento aleatorio simple o sistemtico, pudiendo no considerarse en el proceso algunos conglomerados. Si bien es til para poblaciones grandes (Vallejo Ruiloba y otros, 1999:70), usualmente es menos preciso o sea, tiene mayor error muestral que los otros procedimientos, a igual tamao de la muestra (Vallejo Ruiloba y otros, 1999:70). Sin embargo, una muestra de conglomerados puede producir la misma precisin en la estimacin que una muestra aleatoria simple, si la variacin de los elementos individuales dentro de cada conglomerado es tan grande como la de la poblacin (Rodas y otros, 2001). El muestreo por conglomerado generalmente se halla includo en un procedimiento polietpico (vase ms adelante). Muestreo polietpico.- Es una combinacin encadenada de otros tipos de muestreo aleatorio y se utiliza en los muestreos muy grandes. Es complejo y requiere para la interpretacin de los resultados

Pgina 169 de 331

170
transformaciones nicamente disponibles en programas muy especficos (Vallejo Ruiloba y otros, 1999:70). Criterio Segn el nmero de muestras Segn el modo de elegir a los individuos Tipo de muestreo Simple Doble Mltiple Probabilstico o aleatorio

No probabilstico o no aleatorio Mixto

Simple Sistemtico Estratificado Por conglomerados Polietpico Accidental Intencional Combina probabilsticos y no probabilsticos.

En el muestreo no probabilstico los individuos no tienen la misma probabilidad de ser incluidos en la muestra, o al menos no puede conocerse dicha probabilidad, por cuanto la seleccin depende de algn criterio del investigador diferente a la eleccin por azar. Por ello, segn Hernndez Sampieri y otros (1996:233) se llaman tambin muestreos dirigidos, y segn Rodas (2001) muestreos de juicio. De acuerdo a Vallejo Ruiloba y otros (1999:70), se trata de muestreos no aleatorios por cuanto la eleccin de los sujetos no es debida al azar. Los muestreos no probabilsticos son vlidos si un determinado diseo de investigacin as lo requiere, pero sin embargo, si bien los resultados son generalizables a la muestra en s o a muestras similares, no son generalizables a una poblacin (Hernndez Sampieri y otros, 1996:233). Algunos tipos de muestreo no probabilstico o no aleatorio son los siguientes: Muestreo accidental.- Consiste en tomar casos hasta que se complete el nmero de elementos deseados, es decir, hasta que la muestra alcanza el tamao precisado (Tamayo, 1999:147). Por ejemplo, seleccionar una muestra de sujetos voluntarios para estudios experimentales y situaciones de laboratorio (Hernndez Sampieri y otros, 1996:233). Muestreo intencional.- O sesgado, donde el investigador selecciona los elementos que a su juicio son representativos, lo cual exige un conocimiento previo de la poblacin que se investiga para poder determinar categoras o elementos que se consideran como tipo o representativos del fenmeno que se estudia (Tamayo, 1999:148). Por ejemplo seleccionar una muestra de sujetos expertos en estudios exploratorios, o una muestra de sujetos-tipo en otra clase de estudios (Hernndez Sampieri y otros, 1996:233). Existen an otras tcnicas no probabilsticas, como por ejemplo el muestreo por cuotas, frecuente en estudios de opinin y mercadotecnia (Hernndez Sampieri y otros, 1996:233). Finalmente, en el muestreo mixto se combinan diversos tipos, probabilsticos y no probabilsticos; por ejemplo, pueden seleccionarse las unidades de la muestra aleatoria y luego aplicarse el muestreo por cuotas (Tamayo, 1999:149). Las tcnicas de muestreo no son procedimientos ciegos, estando guiados por una teora del muestreo, o estudio de las relaciones existentes entre una poblacin y muestras extradas de la misma. Esta teora permite, por ejemplo: a) estimar cantidades desconocidas tales como los parmetros poblacionales, a partir de los estadsticos muestrales, o b) determinar si las diferencias observadas entre dos muestras son debidas al azar, o si son realmente significativas.

3. SELECCIN DEL INSTRUMENTO DE MEDICIN


Todo instrumento de medicin intenta medir algo. Este algo es algn aspecto recortado de la realidad, habitualmente designado como variable. Como la variable puede adoptar diferentes valores, el instrumento de medicin informar acerca de qu valor adopt la variable aqu y ahora, en esta persona o en este objeto. Ejemplos de instrumentos de medicin clsicos en las ciencias naturales son el barmetro (mide la presin atmosfrica), la balanza (mide el peso), el cronmetro (mide la duracin), el tensimetro (mide la presin arterial), etc. Las ciencias sociales disponen tambin de una amplia gama de instrumentos de medicin, como por ejemplo los tests psicomtricos (pueden medir inteligencia), los tests proyectivos (pueden medir personalidad, gravedad de la patologa mental, etc), los cuestionarios (pueden medir actitudes, personalidad, estado de nimo, intereses vocacionales, etc), o los exmenes (pueden medir el rendimiento del alumno). Las entrevistas e incluso la simple observacin pueden ser considerados instrumentos de medicin. Por ejemplo, la observacin del juego de un nio durante una hora (la llamada hora de juego diagnstica) permite medir variables como tolerancia a la frustracin, creatividad, etc. Un mismo instrumento de medicin puede ser utilizado de diversas maneras. Por ejemplo un cuestionario puede administrarse en forma personal, por telfono o por correo (Hernndez Sampieri y otros, 1996:338). Esto es importante porque todo instrumento de medicin va acompaado de ciertas instrucciones acerca de
Pgina 170 de 331

171
cmo debe ser administrado y como debe ser analizado. La administracin es el proceso que transforma informacin en datos, mientras que el anlisis transforma los datos en conclusiones significativas acerca de la variable medida. Algunos instrumentos de medicin son tan genricos que pueden utilizarse en todas las disciplinas: una regla puede medir la longitud de una planta en botnica o la altura de una letra en grafologa, mientras que un cronmetro puede medir la velocidad de un automvil en cinemtica o el tiempo de reaccin en psicologa. Ello se debe a que el espacio y el tiempo son ejemplos de magnitudes fundamentales que impregnan toda la realidad. La medicin de las variables puede realizarse mediante un instrumento de medicin ya existente, o bien, si no existe o no hay garantas de su validez y confiabilidad, mediante un instrumento construido ad hoc. Segn Hernndez Sampieri y otros (1996:338), los pasos genricos para construir un instrumento de medicin son: 1) Listar las variables a medir. 2) Revisar sus definiciones conceptuales y operacionales. 3) Elegir uno ya desarrollado o construir uno propio. 4) Indicar niveles de medicin de las variables (nominal, ordinal, por intervalos y de razn). 5) Indicar como se habrn de codificar los datos. 6) Aplicar prueba piloto. 7) Construir la versin definitiva. La prueba piloto consiste en aplicar el instrumento a un nmero pequeo de casos para examinar si est bien construido (por ejemplo, en un cuestionario si las preguntas sern entendidas por los sujetos). Errores en la medicin.- Al medir se pueden cometer dos tipos de errores a) sistemticos o de sesgo o constantes: un error constante es introducido en la medida por algn factor que sistemticamente afecta a la caracterstica a medir o al propio proceso de medida, y por ello suele pasar desapercibido; b) variables o al azar: debidos a influencias pasajeras, sea que procedan de la misma persona y del procedimiento de medida (Selltiz y otros, 1980). Por ejemplo, cuando se aplica un test para medir inteligencia, se comete un error constante cuando se lo toma siempre en lugares ruidosos, con lo cual el resultado no reflejar solamente la inteligencia sino tambin la tensin derivada del ambiente. En cambio, se comete un error variable cuando algunas de las personas estn muy cansadas. Del mismo modo, al medir la longitud de una mesa se comete un error constante cuando las marcas de la regla no son exactamente de un centmetro, y un error variable cuando el investigador se distrae momentneamente al efectuar la medicin. Lo ideal sera que los resultados de una medicin reflejen solamente la caracterstica o propiedad que se est midiendo, pero desgraciadamente puede haber otros factores no controlados o desconocidos que pueden desvirtuar el proceso de medicin, hacindole perder precisin. Selltiz y otros (1980) agrupan en nueve las posibles fuentes de variaciones en los resultados o puntuaciones de los instrumentos de medida, y que son fuentes de error: 1. Verdaderas diferencias en la caracterstica que se intenta medir: idealmente las diferencias medidas que se obtienen reflejan las verdaderas diferencias entre los individuos. Se tratara del nico caso donde la medicin no es errnea. 2. Verdaderas diferencias en otras caractersticas relativamente estables del individuo, que afectan su puntuacin: variables como la inteligencia pueden contaminar medidas sobre la caracterstica actitud. 3. Diferencias debidas a factores personales transitorios, como humor, fatiga, grado de atencin, etc, que son pasajeros. 4. Diferencias debidas a factores de situacin: la entrevista a una ama de casa puede estar influida por la presencia del esposo. 5. Diferencias debidas a variaciones en la administracin: la forma de obtener la medida puede influir en sta, como cuando el entrevistador cambia el tono de la pregunta, aade preguntas, etc. 6. Diferencias debidas al mtodo de muestreo de los tems: una entrevista o cuestionario contiene slo algunas preguntas de todas las posibles. El tamao de esta muestra influir tambin sobre la medida. 7. Diferencias debidas a la falta de claridad del instrumento de medida: los sujetos pueden interpretar de distinta forma las preguntas por estar expresadas ambiguamente. 8. Diferencias debidas a factores mecnicos tales como rotura de lpices, preguntas poco legibles, falta de espacio para responder, etc. 9. Diferencias debidas a factores en el anlisis: como los errores que comete el investigador al tabular, puntuar y analizar los datos obtenidos. Generalmente la construccin de un cuestionario exige mucha atencin, rigor, y conocimientos de estadstica suficientes para examinar su validez y su confiabilidad. Sealan Mora y Araujo (1971) que un mal resultado de la investigacin puede deberse a que se parti de una hiptesis equivocada o bien que se usaron malos instrumentos de medicin. Consiguientemente, toda medida debe reunir dos requisitos: validez y confiabilidad (o confianza). La validez puede estar afectada tanto por errores constantes como variables, pero la confiabilidad generalmente est afectada por errores variables (Selltiz y otros, 1980). Generalidades sobre validez y confiabilidad.- Validez y confiabilidad son dos requisitos que debe reunir todo instrumento de medicin para cumplir eficazmente su cometido, es decir, medir. La validez implica

Pgina 171 de 331

172
relevancia respecto de la variable a medir, mientras que la confiabilidad implica consistencia respecto de los resultados obtenidos. Como instrumento de medicin del aprendizaje, la prueba escrita debe ser vlida y debe ser confiable. Es posible imaginarse una prueba escrita algo grotesca, donde el alumno debe contestar cinco preguntas en un minuto. Podemos pensar que esta prueba mide el nivel de aprendizaje alcanzado? No estar midiendo en realidad la velocidad de escritura, o la paciencia del alumno? En este caso la prueba no es vlida, porque est midiendo otra cosa que nada tiene que ver que lo que originalmente se quera medir. Consiguientemente, se dice que un instrumento es vlido cuando mide lo que pretende medir. Si la prueba escrita mide realmente el aprendizaje alcanzado, entonces es vlida. Cabe imaginar ahora una prueba escrita vlida, donde el alumno debe elaborar la respuesta a dos o tres preguntas en dos horas. Cuando esta prueba escrita es corregida por el profesor A, el B y el C, aparecen tres notas distintas, y hasta incluso uno de los profesores aprueba al alumno y los otros no. Los tres profesores son concientes de que estn midiendo la misma variable -aprendizaje- por lo que la prueba es vlida, pero sin embargo... no es confiable, porque los resultados son dispares. La prueba hubiese sido confiable si, por ejemplo, hubiera utilizado el sistema de multiple choice, en cuyo caso las notas de todos los profesores hubiese sido la misma por haber aplicado todos ellos el mismo criterio estndar de evaluacin (esto no significa que una prueba deba siempre utilizar el sistema de multiple choice). Consiguientemente, se dir que un instrumento de medicin es confiable (o fiable) cuando presenta cierta consistencia o constancia en los resultados. En lo que sigue, se harn algunas otras consideraciones respecto de cmo pueden determinarse la validez y la confiabilidad en los tests psicolgicos, siguiendo el ordenamiento propuesto en (Casullo, 1980). Validez.- Un test psicolgico es vlido cuando efectivamente mide lo que pretende medir. Si en un supuesto test de creatividad, las preguntas son del tipo "en qu ao Coln descubri Amrica", el test no estar midiendo creatividad sino memoria o cultura general. No es vlido porque no mide lo que efectivamente pretenda medir. Debido a que debemos saber lo que el test mide, tal vez sea preferible definir la validez, tal como lo sugiere Anastasi (1976) como el grado en que conocemos lo que el test mide. La validez de un test puede establecerse de diversas maneras, correspondiendo a cada una de ellas un tipo de validez distinto. En este sentido, se puede hablar de cuatro tipos de validez: a) Validez predictiva.- Se puede establecer la validez de un test viendo si el desempeo posterior del sujeto para la variable medida se corresponde con los puntajes obtenidos en el test. Por ejemplo, un test vocacional es vlido si las profesiones en las cuales los sujetos tuvieron xito corresponden a las profesiones sugeridas por el test. Obviamente, para saber si el test vocacional result vlido, habr que esperar, en este caso, varios aos. Otras veces, tal vez no sea necesario esperar tanto, tal como sucede en los tests que permiten conocer la propensin a sufrir desrdenes emocionales, o en los tests que permiten conocer el grado en que cierto tratamiento psiquitrico puede o no beneficiar a un paciente. b) Validez concurrente.- Se puede establecer la validez de un test examinando el grado de correlacin de sus puntajes con los puntajes de otro test que mide la misma variable. En otras palabras, la validez se evala aqu en trminos de 'concurrencia' de puntajes de tests diferentes. Por ejemplo, "se ha estudiado la validez concurrente de la Escala de Inteligencia Weschler comparando los puntajes obtenidos en ella con los obtenidos en la prueba Stanford Binet por los mismos sujetos" (Casullo, 1980). Como podemos apreciar, la validez concurrente se puede determinar slo a partir de haber constatado la validez de otro tipo de prueba que mide lo mismo. Como no puede hacerse una 'regresin al infinito', este otro tipo de prueba debe haber sido validada de acuerdo a un criterio distinto al criterio de concurrencia.
Una cuestin relacionada con la validez concurrente es el empleo en un test de indicadores de otra variable diferente, pero que est altamente correlacionada con la variable que intenta medir el test. Lazarsfeld (1980), por ejemplo, habla de los indicadores expresivos, los que, a diferencia de los predictivos (que miden la variable directamente), la miden indirectamente a travs de otra variable con la cual est altamente correlacionada. Por ejemplo, se puede medir la variable 'antisemitismo' recurriendo a indicadores de otra variable correlacionada, por ejemplo 'autoritarismo', mediante indicadores del tipo "La obediencia y el respeto a la autoridad son las virtudes ms importantes que debe aprender un nio".

c) Validez de contenido.- Un tests tiene validez de contenido si los diferentes tems o contenidos que lo componen (pruebas, preguntas, etc.) son una muestra representativa de la variable o constructo que se pretende medir. Si un test de inteligencia incluye una sola prueba (por ejemplo construir un rompecabezas), esa prueba mide efectivamente inteligencia pero no tiene validez de contenido porque no es por s sola representativa de la inteligencia del sujeto: debe tambin incluir otras pruebas para medir otros tipos de inteligencia como por ejemplo la inteligencia social, o habilidad para relacionarse con las personas. En otro ejemplo, "una prueba o examen parcial que se elabore para evaluar el aprendizaje de los contenidos de las tres primeras unidades o temas de un programa debe incluir tems que abarquen todos los contenidos y objetivos de esa parte del programa" (Casullo, 1980). De igual forma, al disear una entrevista para diagnosticar una depresin mayor, por ejemplo, ella debe incluir todos los criterios que el

Pgina 172 de 331

173
DSM-IV establece para esa categora. En caso contrario, la entrevista como instrumento de medicin carecer de validez de contenido.
La validez de contenido plantea el problema de la adecuada seleccin de indicadores en la construccin de un test, es decir, de su grado de representatividad. Lazarsfeld (1980) seala al respecto que la teora de la intercambiabilidad de los ndices se basa en que la experiencia ha demostrado que, dado un gran nmero de tems o indicadores, cualquiera que sea la muestra elegida para construir el instrumento de medicin, no se hallarn grandes diferencias. Si las hay o no depender, en todo caso, de la certeza de la inferencia de caractersticas latentes a partir de los datos manifiestos, lo cual a su vez depende de varios factores, entre los que se puede citar el grado en que la pregunta - indicador est sujeta a interpretaciones diversas.

d) Validez de constructo.- Tambin llamada validez estructural (Casullo, 1980), la validez de constructo implica que los distintos indicadores o pruebas de un test son el producto de una buena operacionalizacin, es decir, cuando reflejan la definicin terica de la variable que se pretende medir. Por caso, de una concepcin piagetiana de inteligencia no surgirn las mismas pruebas que de una concepcin weschleriana. Segn Casullo, este es el tipo de validez bsico que debe tenerse en cuenta al disear instrumentos de medicin: "la validez estructural supone bsicamente que la tcnica psicomtrica tenga definido claramente el constructo terico que pretende medir, pueda operacionalizarlo a travs de indicadores coherentes y a partir de ellos se puedan obtener ndices" (Casullo, 1980). Cuando el conjunto de indicadores de un test se obtuvo mediante el procedimiento estadstico llamado anlisis factorial, hablamos entonces de validez factorial del test. Confiabilidad.- La confiabilidad se logra cuando aplicada una prueba repetidamente a un mismo individuo o grupo, o al mismo tiempo por investigadores diferentes, da iguales o parecidos resultados (Tamayo, 1999:68). Ms concretamente, un test psicolgico es confiable cuando, aplicado al mismo sujeto en diferentes circunstancias, los resultados o puntajes obtenidos son aproximadamente los mismos. Veamos tres cuestiones que son importantes en esta definicin: el 'mismo' sujeto, las 'diferentes' circunstancias, y los resultados 'aproximadamente' iguales. Con respecto a la primera cuestin, es obvio y hasta esperable que si tomo un test a 'diferentes' personas obtenga puntajes diferentes. Si todas las personas tuviesen la misma inteligencia, carecera de sentido tomarles un test. Tambin es esperable que cuando le tomamos el test a una 'misma' persona en diferentes circunstancias, me de aproximadamente el mismo puntaje. En caso contrario la prueba no es confiable, por lo que entonces la confiabilidad se determina tomando el test a la misma persona, no a personas diferentes. Con respecto a la segunda cuestin, las diferentes circunstancias en que se toma la prueba a la misma persona pueden ser varias: en diferentes instantes de tiempo, con diferentes administradores del test, con diferentes evaluadores de los resultados, en diferentes ambientes fsicos, etc. Si, a pesar de todas estas condiciones diferentes, un mismo sujeto obtiene mas o menos el mismo puntaje, el test resulta altamente confiable. No obstante ello, tampoco de trata de tentar al diablo: los tests incluyen siempre elementos que intentan asegurar la confiabilidad, como por ejemplo la consigna que prescribe que el administrador deber hacer determinada pregunta y no otra, que deber responder a preguntas del sujeto de determinada manera y no de otra, que deber tomar el test en un ambiente sin ruidos, etc, todo ello para que no influya la forma peculiar de administrar el test sobre el puntaje. Como seala Casullo, "cuando pretendemos mantener constantes o uniformes las condiciones en las que se toma una prueba, controlando el ambiente, las instrucciones, el tiempo, el orden de las preguntas, lo que intentamos es reducir la varianza de error a los efectos de que los puntajes sean ms confiables" (Casullo, 1980). Con respecto a la tercera cuestin, no podemos esperar que los resultados sean exactamente los mismos, es decir, siempre habr una 'varianza', es decir, una variacin en los resultados. El problema es decidir si esa variacin es lo suficientemente pequea como para decidir que el test es confiable o, si por el contrario, refleja un problema de confiabilidad, es decir, es lo suficientemente grande como para declararla no confiable. En otras palabras y como dice Anastasi (1976), toda medida de confiabilidad de un instrumento de medicin denota qu proporcin de la varianza total en los puntajes es varianza de error. Ms claramente: cuando medimos una variable, como por ejemplo autoconcepto o inteligencia, debemos estar relativamente seguros de saber en qu medida el puntaje refleja realmente el estado de la variable y en qu medida es el resultado de otras variables extraas como fatiga, sesgos del evaluador, ansiedad, etc. Seala al respecto Casullo que "el 'puntaje verdadero' podra determinarse haciendo un promedio de los puntajes obtenidos en distintas evaluaciones sucesivas de la variable en cuestin" (Casullo, 1980), ya que se supone que cada puntaje obtenido es resultado tanto de la variable a medir como de la influencia de otros factores. La parte del puntaje debido a la influencia de la variable suele llamarse varianza 'verdadera' y la parte del puntaje que resulta de los otros factores suele llamarse varianza de error, la que est expresando el error de medicin. La varianza verdadera ms la varianza de error se llama varianza total. Para determinar la confiabilidad de un test se utiliza el anlisis estadstico de correlacin. En general, cuanto ms alta es la correlacin entre los diferentes puntajes obtenidos por un mismo sujeto, ms confiable resulta el test. En muchos tests, y luego de haber sido probados muchas veces, se puede obtener un coeficiente de confiabilidad para dicho test, lo cual a su vez permite evaluar los lmites razonables del puntaje verdadero en base a cualquier puntaje obtenido.
Pgina 173 de 331

174
Para quienes tengan cierto conocimiento de curvas normales, la expresin e = s . 1 - r me indica el error de medicin aceptable (e) que puedo cometer al evaluar un puntaje de una variable en base a una muestra o poblacin con un determinado desvo estndar (s) y con un instrumento de medicin cuyo coeficiente de confiabilidad es (r). Por ejemplo, si el desvo estndar es 15 y el coeficiente de confiabilidad es 5, aplicando la frmula obtengo un error de medicin de 5. Esto significa que si el verdadero puntaje de un sujeto es 110, podemos esperar que al serle administrada la prueba obtenga un puntaje entre 105 y 115 (o sea entre menos 5 y ms 5) en el 68% de los casos (68% porque hemos considerado un solo desvo estndar).

El requisito de la confiabilidad supone que la variable a medir se mantiene estable en el tiempo. Esto, sin embargo, no siempre es aplicable, como por ejemplo cuando se administran sucesivas pruebas de estado de ansiedad a lo largo de un tratamiento psicoteraputico. En estos casos lo que se espera es que los puntajes vayan cambiando, no que se mantengan similares. Veamos diferentes maneras en que puede determinarse la confiabilidad de un test. a) Repeticin de test.- Consiste en volver a tomar la misma prueba al mismo sujeto o grupo de sujetos: esta segunda prueba se llama retest. Un ejemplo de la tcnica de test-retest puede ser la siguiente: primero tomamos una prueba de aptitud matemtica a un grupo de alumnos (test), y luego, al da siguiente, volvemos a tomar la misma prueba aunque con diferentes contenidos (retest). Cuanto ms 'iguales' sean los puntaje obtenidos por cada alumno, tanto ms confiable es la prueba. Notemos que entre el primero y el segundo da las condiciones pudieron haber cambiado de manera tal de incidir sobre los resultados de la segunda prueba. Por ejemplo, un alumno recibi una mala noticia y no pudo concentrarse en la segunda evaluacin, sacando un puntaje mucho menor. Otros factores pudieron haber sido variaciones climticas, ruidos repentinos, etc., o incluso la incorporacin de nuevos conocimientos si la segunda prueba tuvo el carcter de un examen recuperatorio. En general, cuanto ms tiempo transcurra entre la primera y la segunda administracin de la prueba, ms factores pueden estar influyendo sobre los puntajes de la segunda, ms distintos sern con respecto a la primera y, por tanto, menos confiable ser la prueba. Segn Casullo, "es posible citar ejemplos de tests psicolgicos que muestran una alta confiabilidad tras periodos de pocos das, la cual disminuye cuando el intervalo se extiende a diez o quince aos" (Casullo, 1980), sobre todo si en el transcurso de ese largo periodo de tiempo los sujetos maduraron o aprendieron cosas nuevas.
En general, "se sugiere que el intervalo entre la repeticin de las pruebas (test-retest) para todas las edades no sea mayor que seis meses. Este procedimiento nos permite hablar de la 'estabilidad' de las mediciones obtenidas administrando una tcnica psicomtrica. Contesta a la pregunta relativa a en qu medida las mediciones resultan estables a lo largo de un periodo de tiempo. Una alta confiabilidad de este tipo nos dice que las personas mantienen sus posiciones uniformes en el rango de la variable psicolgica que intenta medir la tcnica (aprendizaje, autocontrol o ansiedad estado). Esta forma de determinar la confiabilidad presenta algunas dificultades, como por ejemplo: a) la prctica puede causar un rendimiento diferente en el retest, y b) si el intervalo es corto las personas pueden recordar las respuestas" (Casullo, 1980).

b) Formas equivalentes.- Se puede establecer la confiabilidad de una prueba administrndola en diferentes momentos al mismo sujeto, pero tomando la precaucin de que la prueba sea diferente en cuanto a los contenidos aunque equivalente en cuanto a la forma. Por ejemplo, tomar dos exmenes escritos sobre diferentes temas, pero con la misma cantidad de preguntas, el mismo grado de dificultad, el mismo tipo de preguntas, etc. Esta forma de medir la confiabilidad tiene sus limitaciones; por ejemplo, si pensamos que la prctica influye en los puntajes del segundo examen, o sea, si los alumnos adquieren cierta destreza en la primera prueba que har subir los puntajes en la segunda. c) Divisin por mitades.- Se puede establecer la confiabilidad de un test dividindolo en dos partes equivalentes (equivalentes en grado de dificultad, etc.) y asignando un puntaje a cada parte. Si ambos puntajes son muy similares para un mismo sujeto, el test no slo tiene confiabilidad sino tambin consistencia interna. Esto ltimo no poda constatarse con la tcnica test-retest ni con la administracin de formas equivalentes. Otras veces se divide la prueba en tantas partes como tems tenga, como hicieron Kuder y Richardson, lo que permite examinar cmo ha sido respondido cada tem en relacin con los restantes (Casullo, 1980). Tengamos presente que cuando hablamos de consistencia interna nos podemos referir a consistencia de los tems o a consistencia de las respuestas del sujeto: la confiabilidad tiene relacin directa con el primer tipo de consistencia.

Pgina 174 de 331

175

CAPTULO 13: EL DISEO DE INVESTIGACIN


Un diseo de investigacin cientfica es bsicamente un plan para recolectar datos, aunque algunos autores incluyen tambin un plan para analizar los datos, fundamentalmente una prueba estadstica. El plan de recoleccin ha de ser lo ms sencillo y econmico posible, aunque ello no debe hacer pensar que un diseo de investigacin se pueda ejecutar en horas o das: una investigacin puede llevar meses y aos. Existe amplia bibliografa al respecto que propone una gran diversidad de criterios de clasificacin de los diseos de investigacin, especialmente para las ciencias sociales donde el objeto de estudio es ms complejo. Muchas veces los investigadores, a la hora de elegir un diseo, se encuentran con esa gran cantidad de propuestas, donde incluso llegan a mencionarse los mismos diseos con denominaciones diferentes. El presente artculo tiene como finalidad presentar algunas taxonomas de diseos de investigacin en ciencias sociales que orienten al investigador para construir un rbol de decisin cuando deba elegir el que ms se adapta a sus objetivos (por ejemplo realizar una investigacin exploratoria, descriptiva, correlacional o explicativa) y a los recursos con que cuenta (por ejemplo sujetos de experimentacin, tcnicos en estadstica, etc). Se ha presentado en primer lugar la versin Campbell y Stanley por ser un referente clsico, consultado por la mayora de los autores de las restantes versiones aqu presentadas. Si bien estos diseos han surgido principalmente de las ciencias sociales, algunos de ellos son aplicables tambin en la fsica, la qumica, la biologa y dems ciencias naturales.

1. VERSIN CAMPBELL Y STANLEY


Donald Campbell y Julian Stanley presentaron en 1963 una sistematizacin de diseos de investigacin experimental para las ciencias sociales. Los autores describen un total de diecisis diseos experimentales (agrupados en tres pre-experimentales, tres experimentales propiamente dichos y diez cuasiexperimentales), y examinan su validez interna y externa tomando en consideracin un total de doce fuentes corrientes de invalidacin que amenazan las inferencias vlidas. Los 16 diseos experimentales descriptos por Campbell y Stanley, son clasificados en tres grupos (esquema 1). a) Diseos preexperimentales: son 3, y no son recomendados por los autores. b) Diseos experimentales propiamente dichos: son 3, y son recomendados especialmente por esos autores. c) Diseos cuasiexperimentales: son 10, y son recomendados por Campbell y Stanley si no es posible aplicar uno mejor. Esquema 1 Diseos experimentales versin Campbell-Stanley (Preparado por Pablo Cazau)
TIPO Diseos pre experimentales NOMBRE 1. Estudio de casos con una sola medicin 2. Diseo pretest-postest de un solo grupo 3. Comparacin con un grupo esttico 4. Diseo de grupo de control pretest-postest 5. Diseo de 4 grupos de Solomon ESQUEMA X 01 X 0 02

Diseos experimentales propiamente dichos

Diseos cuasi experimentales

6. Diseo de grupo de control con postest nicamente 7. Experimento de series cronolgicas 8. Diseo de muestras cronolgicas equivalentes 9. Diseo de materiales equivalentes 10. Diseo de grupo de control no equivalente 11. Diseos compensados

X 01 ---------------------------02 R 01 X 02 R 03 04 R 01 X 02 R 03 04 R X 05 R 06 R X 01 R 02 01 02 03 04 X 05 06 07 08 X10 X00 X10 MbX00 X00 etc MdX00 etc

MaX10

McX10

0 X 0 ------------------0 0 X10 X20 X30 X40 ------------------------X20 X40 X10 X30 -------------------------

Pgina 175 de 331

176
X30 X10 X40 X20 ------------------------X40 X30 X20 X10 12 R 0 (X) R X 0

12. Diseo de muestra separada pretest-postest

13. Diseo de muestra separada pretest-postest con grupo de control

12b R 01 (X) R 02 (X) R X 03 13 R 0 (X) R X 0 ---------------------------R 0 R 0

12a R 0 (X) R X 0 ----------------------------R 0 (X) R X 0 12c R 01 X 02 R X 03 13a R 0 (X) R 0 X 0 ------------------R 0 (X) R 0 X 0 ------------------R 0 (X) R 0 X 0 R 0 R 0 ------------------R 0 R 0 ------------------R 0 R 0

14. Diseo de series cronolgicas mltiples 15. Diseo de ciclo institucional recurrente (diseo de retazos)

0000 X 0000 0000 0000 Clase A X 01 Clase B 02 X 03

16. Anlisis de discontinuidad en la regresin Para indicar grupos igualados por aleatorizacin se emplea el smbolo R (inicial de 'randomizacin'), y estn presentes solamente en los diseos experimentales propiamente dichos, porque la aleatorizacin es un requisito esencial para que un diseo sea experimental. Otro requisito es la presencia de grupos de control. En el diseo 3, que es preexperimental, se utiliza un grupo de control, pero estos no estn igualados por aleatorizacin, sino por otros procedimientos que suelen conducir a inferencias errneas (Campbell y Stanley, 1995:18).

Esquema ms preciso: A X 01 ---------------------------B1 R02 X 03 B2 R X 04 ---------------------------C 05 X -- -- -- -- -- -- -- -- -- --CGPC B 06 CGPC C 07 ---------------------------------------

Diseos preexperimentales Se trata de diseos que no son recomendados por Campbell y Stanley, pero que dichos autores emplean fundamentalmente para "ilustrar los factores de validez que requieren control" (Campbell y Stanley, 1995:139). Diseo 1: Estudio de un caso con una sola medicin.- Este diseo consiste en tomar un solo grupo por vez, someterlo a la accin de algn agente o tratamiento (X) que supuestamente provoque algn cambio, para luego proceder a estudiarlo (O). En estos estudios, "se compara implcitamente un caso nico, cuidadosamente estudiado, con otros acontecimientos observados de manera casual y recordados. Las inferencias se fundan en expectaciones generales de cules hubieran sido los datos de no haberse producido X, etc." (Campbell y Stanley, 1995:19). Se nos ocurre el siguiente ejemplo: 'este grupo de alumnos anda mejor ahora (O) que hay otro profesor (X)'. Campbell y Stanley asignan a este diseo un valor cientfico casi nulo por cuanto adolece de una importante falta de controles, y sostienen que, en lugar de haberse dedicado tanta energa al estudio intensivo del caso, se podra haberla derivado hacia el estudio comparativo con otro grupo de alumnos que hubieran seguido con el profesor anterior. Diseo 2: Diseo pretest - postest de un solo grupo.- Este diseo consiste, primero, en observar o medir un determinado grupo (O1); segundo, introducir un factor que supuestamente producir algn cambio en el mismo (X); y por ltimo, volver a observar o medir (O2) el grupo luego de haber aplicado X, para ver si se registr el cambio esperado.
Pgina 176 de 331

177
El problema que presenta este diseo, juzgado por los autores como un "mal ejemplo", es que pueden intervenir variables externas que ocasionen el cambio, independientemente de X. "Tales variables ofrecen hiptesis aceptables que explican una diferencia O1 -- O2 opuesta a la hiptesis de que X caus la diferencia" (Campbell y Stanley, 1995:20). Tales hiptesis aceptables son entonces hiptesis rivales, y entre ellas se pueden mencionar la historia, la maduracin, la administracin de tests, la instrumentacin y, en algunos casos, la regresin estadstica. En lo concerniente al factor historia, debe tenerse presente que "entre O1 y O2 pueden haber ocurrido muchos otros acontecimientos capaces de determinar cambios, adems de la X sugerida por el experimentador. Si el pretest (O1) y el postest (O2) se administraron en das distintos, los acontecimientos intermedios pueden haber causado la diferencia. Para convertirse en una hiptesis rival 'aceptable', tal acontecimiento debera haber afectado a la mayor parte de los estudiantes que integran el grupo examinado" (Campbell y Stanley, 1995:20). Por ejemplo, en 1940 se investig si la propaganda nazi (X) influa o no en las actitudes de los alumnos. Estos cambios, efectivamente, se verificaron, pero no pudo saberse si se debieron a la propaganda nazi o al hecho de que entre O1 y O2 se produjo la cada de Francia (factor de invalidacin 'historia'). En lo relativo a la maduracin, "es probable que entre O1 y O2 los estudiantes hayan aumentado de edad, apetito, fatiga, aburrimiento, etc., y acaso la diferencia obtenida refleje ese cambio y no el de X" (Campbell y Stanley, 1995:21). En cuanto al factor administracin de tests, cabe consignar que, por ejemplo en pruebas de rendimiento e inteligencia, los sujetos suelen desempearse mejor en el segundo test que en el primero, con lo cual no puede saberse si el mejor desempeo en el postest obedece a la toma del pretest o a X. En lo referente a la instrumentacin de pruebas, Campbell se refiere a un 'deterioro de los instrumentos' de medicin en el intervalo entre el prestest O1 y el postest O2. Por ejemplo, si se trata de observar cmo los alumnos participan en el aula, los observadores pueden observar de manera diferente la segunda vez (O2), como por ejemplo, ser ms hbiles o ser ms indiferentes en sus observaciones. Otro caso es cuando los observadores o administradores de tests son personas distintas en O1 y O2, tambin causa posible de diferencias entre ambas mediciones ms all del efecto de X. Por ltimo, en lo relativo al factor regresin estadstica, "si en una prueba correctiva se seleccionan alumnos para un experimento especial porque han tenido puntajes particularmente bajos en el test de rendimiento escolar (O1), en una prueba posterior en que se adopte la misma forma de antes u otras similar a ella, casi con seguridad O2 tendr para ese grupo un promedio ms elevado que O1. Este resultado confiable no se deber a ningn efecto genuino de X, a ningn efecto de la prctica de test y retest, etc. Es mas bien un aspecto tautolgico de la correlacin imperfecta entre O1 y O2" (Campbell y Stanley, 1995:24-25). Cuanto menor sea el grado de correlacin entre O1 y O2, mayor ser la regresin hacia la media. Los efectos de regresin son entonces acompaamientos inevitables de la correlacin imperfecta de test-retest para grupos "seleccionados por su ubicacin extrema" (Campbell y Stanley, 1995:27-28). Diseo 3: Comparacin con un grupo esttico.- Es un diseo en el cual se compara un grupo que ha experimentado X, con otro grupo que no ha experimentado X (llamado grupo esttico). Ejemplos: la comparacin de sistemas escolares con maestros universitarios (X), con otros sistemas con maestros no universitarios; la comparacin de alumnos que reciben cursos de lectura veloz (X), con otros que no los reciben; la comparacin entre quienes ven determinado programa de televisin (X), con otros que no lo ven. El lector advertir cierta semejanza con el diseo 6 (ver esquema 1), pero hay una diferencia: en el diseo 3 no se ha tomado la precaucin de asegurarse la equivalencia de ambos grupos mediante un mtodo como la aleatorizacin, precaucin que s se tom en el diseo 6. Por lo tanto, un factor no controlado por el diseo 3 es la seleccin previa de los sujetos de los grupos. As, en este diseo, "si hay diferencias entre O1 y O2, ello bien puede deberse al reclutamiento diferencial de las personas que componen los grupos: estos podran haber diferido aun sin la presencia de X" (Campbell y Stanley, 1995:29). Otro factor no controlado por el diseo 3 es la mortalidad experimental. An cuando se hubiera tomado la precaucin de igualar los grupos, persiste el problema del abandono selectivo de personas de uno de los grupos (mortalidad experimental). Diseos experimentales propiamente dichos Los diseos experimentales propiamente dichos que siguen son los recomendados en la actualidad por la literatura metodolgica y por Campbell y Stanley (Campbell y Stanley, 1995:31). Se trata de diseos con un gran poder de control de variables externas (extraas). Diseo 4: Diseo de grupo de control pretest - postest.- Este diseo clsico consiste en utilizar dos grupos equivalentes logrados por aleatorizacin (R), hacerles un pre-test a ambos (O1 y O3), aplicarle X al grupo experimental, y finalmente hacerles un post-test a ambos a ver si hubo alguna variacin como consecuencia del tratamiento experimental X. Con este diseo se pueden controlar una gran cantidad de fuentes de invalidacin interna. Por ejemplo:

Pgina 177 de 331

178
a) La historia "se controla en la medida en que los acontecimientos histricos generales que podran haber producido una diferencia del tipo O1-O2 causaran tambin una diferencia del tipo O3-O4" (Campbell y Stanley, 1995:32). La precaucin que debe tomarse en estos casos es que las historias 'intrasesionales' de cada grupo no sean tan diferentes entre s como para que se conviertan verosmilmente en una hiptesis rival a la hiptesis de investigacin de que X es la causa de la variacin. b) La maduracin y la administracin de tests "estn controladas en el sentido de que su manifestacin en los grupos experimentales y de control debera ser igual" (Campbell y Stanley, 1995:34). c) La instrumentacin "se controla con facilidad cuando se dan las condiciones para el control de historia intrasesional, en particular cuando se logra la O por medio de reacciones de los estudiantes a un instrumento fijo, como una prueba impresa" (Campbell y Stanley, 1995:34). El problema es ms grave cuando se recurre, en cambio, a observadores y entrevistadores, ya que diversos son los factores que pueden sesgar sus puntajes o registros. d) La regresin "se controla, en lo que a diferencia de medias concierne y por muy extremo que sea el grupo en los puntajes pretest, si tanto el grupo experimental como el de control se asignan al azar, tomndolos de este mismo conjunto extremo. En tales casos, el grupo de control regresiona tanto como el experimental" (Campbell y Stanley, 1995:34-35). e) La seleccin se controla asegurando la igualdad de los grupos mediante la aleatorizacin. Campbell y Stanley discuten aqu el valor de otro procedimiento para asegurar esta igualdad, la equiparacin (Campbell y Stanley, 1995:36), sealando su ineficacia como "nico" procedimiento, pudindose obtener mayor precisin estadstica cuando se lo combina con la aleatorizacin, procedimiento mixto llamado "bloqueo" (por ejemplo, asignar estudiantes a pares equiparados y asignando luego al azar un miembro de cada par al grupo experimental y otro al de control). f) Respecto de la mortalidad, "los datos de que disponemos gracias al diseo 4 permiten establecer qu mortalidad explica aceptablemente la ganancia O1-O2" (Campbell y Stanley, 1995:36), ya que suele ser precisamente en el grupo experimental donde se exige la concurrencia de los sujetos para su exposicin a X. La distinta concurrencia en el grupo experimental y en el de control produce una mortalidad que puede introducir sutiles sesgos. Examinemos ahora los factores que, en este diseo 4, atentan contra la validez externa, recordando que estas amenazas a la validez externa pueden considerarse como efectos de interaccin entre X y alguna otra variable. a) Interaccin de tests y X.- La toma de un pretest puede influir sobre los resultados del experimento, lo que llev a algunos experimentadores a elegir el diseo 6, que omite el pretest. "Cuando se emplea un test con procedimientos muy poco usuales, o cuando el test implica engao, reestructuracin conceptual o cognitiva, sorpresa, tensin, etc., los diseos con grupos no sometidos a pretest [como el diseo 6] continan siendo muy convenientes, aunque no imprescindibles" (Campbell y Stanley, 1995:42). b) Interaccin de seleccin y X.- El origen de este factor -como se dijo ms arriba- se encuentra en la obtencin de muestras no representativas. Al respecto, comentan Campbell y Stanley que este diseo 4, "dentro del mbito de las actitudes sociales, es tan exigente en lo que a cooperacin por parte de los participantes se refiere, que en definitiva la investigacin slo se hace con un pblico cautivo en vez de realizarla con ciudadanos comunes, que son a quienes quisiramos referirnos. En una situacin de esta ndole, el diseo 4 merecera un signo negativo en cuanto a seleccin [ver esquema 2]. No obstante, en la investigacin pedaggica nuestro universo de inters est constitudo por un pblico cautivo para el cual se pueden obtener diseos 4 de elevada representatividad" (Campbell y Stanley, 1995:44). c) Otras interacciones con X.- Las interacciones de X con los dems factores (mortalidad, tests, maduracin, historia, excepto regresin, que no interacciona con X), pueden tambin examinarse como amenazas a la validez externa. Esos distintos factores no fueron incluidos como encabezamientos de columnas del esquema 2, porque "no ofrecen bases firmes de discriminacin entre diferentes diseos" (Campbell y Stanley, 1995:45). d) Dispositivos reactivos.- El hecho de tener conciencia de participar de un experimento, predispone a los sujetos de una forma que no se da en situaciones no experimentales o naturales, lo cual dificulta la generalizacin de los resultados. Sin embargo, no por ello debe abandonarse la investigacin, sino mas bien mejorarla evitando la incidencia de estos dispositivos reactivos, para lo cual Campbell y Stanley ofrecen diversas sugerencias (Campbell y Stanley, 1995:45). Diseo 5: Diseo de cuatro grupos de Solomon.- Aunque el diseo 4 se usa ms, el diseo 5 tiene ms prestigio y fue el primero en considerar explcitamente los factores de validez externa. Como se ve en el esquema 3, este diseo usa cuatro grupos: a los dos del diseo 4 se agregan otros dos, -experimental y de control sin pretest-, lo que permite determinar tanto los efectos principales de los tests como la interaccin entre ellos y X (y por esto permite controlar el factor de invalidacin externa 'interaccin de tests y X'). "De ese modo, no slo se aumenta la posibilidad de generalizar, sino que adems se repite el efecto de X en cuatro formas diferentes: O2>O1, O2>O4, O5>O6 y O5>O3. Las inestabilidades concretas de la experimentacin son tales que, si esas comparaciones concuerdan, el vigor de la inferencia queda muy incrementado" (Campbell y Stanley, 1995:53). Diseo 6: Diseo de grupo de control con postest nicamente.- Este diseo no utiliza pretest, por cuanto aqu se considera que la simple aleatorizacin R es suficiente para asegurar la igualdad de los grupos, y en tal sentido el diseo 6 resulta preferible al 4 o al 5, donde deben tomarse pretests. Adems, hay casos
Pgina 178 de 331

179
donde no se pueden tomar pretest, respondiendo este diseo a esta necesidad. Campbell y Stanley examinan algunas ventajas y desventajas del diseo 6 con respecto al 4 o al 5, pero, en general, recomiendan el empleo del 6 (Campbell y Stanley, 1995:55).
Los diseos factoriales emplean recursos de los diseos 4, 5 y 6, pero ase aplican a situaciones donde estudia ms de una variable experimental X. As, "sobre la base conceptual de los tres diseos anteriores, pero en particular el 4 y el 6, pueden ampliarse las complejas elaboraciones tpicas de los diseos factoriales de Fisher, agregando otros grupos con otras X" (Campbell y Stanley, 1995:57). Los diseos factoriales presentan problemas especiales relacionados con la interaccin, las clasificaciones inclusivas y cruzadas, y los modelos factoriales finitos, fijos, aleatorios y mixtos.

Diseos cuasiexperimentales Un diseo cuasiexperimental es un diseo en el cual no hay un control experimental total o perfecto, tal como se podra conseguir en un diseo experimental autntico o propiamente dicho (Campbell y Stanley, 1995:70 y 139). "Son muchas las situaciones sociales donde el investigador puede introducir algo similar al diseo experimental en su programacin de procedimientos para la recopilacin de datos (por ejemplo, el cundo y el a quin de la medicin), aunque carezca de control total acerca de la programacin de estmulos experimentales (el cundo y el a quin de la exposicin y la capacidad de aleatorizarla), que permita realizar un autntico experimento. En general, tales situaciones pueden considerarse como diseos cuasiexperimentales" (Campbell y Stanley, 1995:70). Debido a que se carece de un control experimental total, es imprescindible que el investigador conozca a fondo las variables que su diseo no controla, y con este fin Campbell y Stanley confeccionaron la lista de verificacin de fuentes de invalidacin que figuran en el esquema 2 (Campbell y Stanley, 1995:70). No obstante sus imperfecciones, los autores recomiendan utilizar diseos cuasiexperimentales en aquellas configuraciones donde no haya modo alguno de recurrir a mejores diseos experimentales (Campbell y Stanley, 1995:11, 71 y 139). A continuacin, se examinan tres diseos experimentales unigrupales, o sea donde se trabaja con un solo grupo; los cinco que le siguen son diseos multigrupales (Campbell y Stanley, 1995:71). Diseo 7: Experimento de series cronolgicas.- En lo esencial, consiste "en un proceso peridico de medicin sobre algn grupo o individuo y la introduccin de una variacin experimental en esa serie cronolgica de mediciones" (Campbell y Stanley, 1995:76). Fue muy utilizado en ciencias fsicas y biolgicas, aunque tambin se lo emple alguna vez en ciencias sociales, como por ejemplo en los experimentos sobre factores que influyen sobre la produccin industrial (Campbell y Stanley, 1995:77). El ms grave inconveniente del diseo 7 es la imposibilidad de controlar el factor historia, es decir, la hiptesis rival de que no sea X lo que provoc el cambio sino otro acontecimiento ms o menos simultneo (7 Campbell y Stanley, 1995:9), como por ejemplo los efectos meteorolgicos, aunque tal vez convendra ms mencionar -aunque sean anlogos al factor maduracin- cambios peridicos referidos a costumbres institucionales como ciclos semanales de trabajo y pago de salarios, de trabajo y vacaciones, fiestas escolares, etc. (Campbell y Stanley, 1995:81). Otros factores que atentan contra la validez interna estn, no obstante, controlados: por ejemplo la maduracin, por ser generalmente un proceso uniforme y regular del que no es esperable que cambie mucho precisamente en el momento de aplicar X. Lo mismo vale para los tests: no es esperable que se produzca en ellos un error de medicin precisamente entre O4 y O5. Por su parte, "los efectos de la regresin suelen consistir en una funcin negativamente acelerada del tiempo transcurrido, razn por la cual no son aceptables como explicaciones de un efecto en O5 mayor que los efectos en O2, O3 y O4" (Campbell y Stanley, 1995:82). En cuanto a la seleccin como fuente de efectos principales, es obvio que quedar controlada si "en todas las O estn implicadas las mismas personas" (Campbell y Stanley, 1995:82), cosa que tambin resulta vlida para el diseo 2. Campbell y Stanley recomiendan utilizar este diseo, pero adoptando la precaucin de no realizar un experimento nico, que nunca es concluyente. An no utilizando un grupo de control, es preciso que varios investigadores repitan el diseo 7 en muchos lugares distintos (Campbell y Stanley, 1995:83). Diseo 8: Diseo de muestras cronolgicas equivalentes.- Se trata de un diseo con un solo grupo que utiliza dos muestras equivalentes de sesiones, con la variable experimental en una de ellas y no en la otra. El modelo puede verse en el esquema 3, aunque la intencin es obtener una alternancia aleatoria, y no regular como lo sugiere dicho esquema. Este diseo puede ser considerado como una variante del diseo 7, donde la diferencia est en que se introduce la variable experimental en forma reiterada, y no una sola vez (Campbell y Stanley, 1995:86). Empleado correctamente, se trata de un diseo en general vlido internamente. "La historia, que es el principal inconveniente del experimento con series cronolgicas, se controla presentando X en numerosas sesiones separadas, haciendo as improbable en extremo cualquier otra explicacin fundada en la coincidencia de acontecimientos externos. Las otras fuentes de invalidacin se controlan con la misma lgica detallada a propsito del diseo 7" (Campbell y Stanley, 1995:87). En cuanto a la validez externa, uno de los factores de invalidacin externa no controlados por este diseo es la interferencia de X mltiples (o sea, cuando se presentan muchos niveles de X para el 'mismo' conjunto de personas.
Pgina 179 de 331

180
Por ejemplo, si X1 tiene algn efecto prolongado que llega a influir en los periodos sin X (o X0), como parece por lo comn probable, este diseo 8 puede subestimar el efecto de X1. Y "por el contrario, el hecho mismo de que se produzcan frecuentes desplazamientos puede incrementar el valor del estmulo de una X, excediendo al que se dara en una presentacin continua y homognea. En [cierto estudio], las melodas hawaianas influiran sobre el trabajo de manera bastante diferente si se las intercalase durante todo un da entre otras formas de msica, que si constituyen el nico 'alimento' musical" (Campbell y Stanley, 1995:88). Diseo 9: Diseo de materiales equivalentes.- Este tipo de diseo se aplica "all donde la ndole de las variables experimentales sea tal que los efectos son permanentes, y los distintos tratamientos y repeticiones de ellos deben aplicarse a un contenido no idntico" (Campbell y Stanley, 1995:90). Por ejemplo, si queremos averiguar la incidencia del tipo de aprendizaje X (masivo o distribuido), en una primera etapa damos a un sujeto o un grupo una lista de palabras para aprender en forma masiva. Luego, en un segundo momento donde la consigna es aprender en forma distribuida, no podremos darles al mismo sujeto o grupo la misma lista de palabras, porque ya las habrn aprendido. Por lo tanto, le damos un 'material equivalente', por ejemplo, otro listado de palabras que sea equivalente al primero (palabras de igual nmero de slabas, de igual familiaridad, etc.). "A semejanza del diseo 8, el diseo 9 tiene validez interna en todos los puntos, y en general por los mismos motivos" (Campbell y Stanley, 1995:92). Sin embargo, el diseo presenta limitaciones en cuanto a la validez externa. Por ejemplo, en cuanto al factor interferencia de X mltiples, la validez externa est comprometida por la interferencia entre los niveles de la variable experimental o entre los materiales (Campbell y Stanley, 1995:92). Diseo 10: Diseo de grupo de control no equivalente.- Es un diseo muy usado en investigacin educacional, y "comprende un grupo experimental o otro de control, de los cuales ambos han recibido un pretest y un postest, pero no poseen [a diferencia del diseo 4] equivalencia preexperimental de muestreo" (Campbell y Stanley, 1995:93). O sea, los sujetos que se toman de una poblacin comn no son asignados en forma aleatoria a uno y otro grupo, sino que constituyen entidades formadas naturalmente (como una clase de alumnos), tan similares entre s pero no tanto como para que se pueda prescindir del pretest. "Cuanto ms similares sean en su reclutamiento el grupo experimental y el de control y ms se confirme esa similitud por los puntajes del pretest" (Campbell y Stanley, 1995:94) ms eficaz es el control. Entonces, dos cosas deben aclararse con respecto al diseo 10: primero, no debe confundrselo con el diseo 4 por las razones ya apuntadas, y segundo y a pesar de ello, debe admitirse que el diseo 10 es utilizable en muchas ocasiones donde no podemos usar los diseos 4, 5 o 6 (94). Diseo 11: Diseos compensados.- Abarcan todos aquellos diseos "en los cuales se logra el control experimental o se aumenta la precisin aplicando a todos los participantes (o situaciones) la totalidad de los tratamientos" (Campbell y Stanley, 1995:99). Un ejemplo es el cuadrado latino. En el esquema 3, las cuatro filas corresponden a cuatro grupos (o individuos) distintos. A cada grupo se lo va exponiendo a diferentes valores de la variable experimental X a lo largo de cuatro sucesivos tratamientos (las cuatro columnas). En otras palabras, cada grupo (o sujeto) pasa por todas las condiciones experimentales. "Obsrvese que cada tratamiento (o X) slo se da una vez en cada columna y cada fila" (Campbell y Stanley, 1995:100): esta disposicin permite 'compensar' los resultados de un grupo (o de un tratamiento) con el de otros grupos (o tratamientos), lo que a su vez permite inferir que las diferencias obtenidas en los distintos tratamientos experimentales (X1, X2, X3 y X4) no son debidas ni a discrepancias grupales iniciales ni a efectos de la prctica, la historia, etc. Diseo 12: Diseo de muestra separada pretest - postest.- Sealan Campbell y Stanley que para grandes poblaciones (ciudades, fbricas, escuelas, cuarteles), "suele ocurrir que, aunque no se pueden segregar subgrupos en forma aleatoria para tratamientos experimentales diferenciales, cabe ejercer algo as como un control experimental completo sobre el 'momento de aplicacin' y los 'destinatarios' de la O, utilizando procedimientos de asignacin aleatoria" (Campbell y Stanley, 1995:103). Este control est posibilitado por el diseo 12 que consiste, bsicamente, en medir una muestra antes de X, y otra equivalente despus de X. Guarda cierta semejanza con el diseo 2, pero a diferencia de ste, el diseo 12 puede controlar los factores tests e interaccin de tests y X. Algunas variantes del este diseo (12a, 12b y 12c, ver esquema 3) permiten controlar otros factores de invalidacin. Por ejemplo, el diseo 12a controla la historia pues "si el mismo efecto se da en varias ocasiones, la posibilidad de que sea resultado de acontecimientos histricos coincidentes se torna menos probable" (Campbell y Stanley, 1995:104). Asimismo, el diseo 12b permite controlar la maduracin, y el diseo 12c otros factores como la mortalidad. En general, todas estas variantes del diseo 12 "pueden resultar superiores en validez externa... respecto de los experimentos propiamente dichos de los diseos 4, 5 y 6. Estos diseos no requieren gran cooperacin de los participantes, ni que estn disponibles en ciertos lugares y momentos, etc., de modo que se puede utilizar un muestreo representativo de poblaciones previamente determinadas" (Campbell y Stanley, 1995:106). Diseo 13: Diseo de muestra separada prestest - postest con grupo de control.- Se trata del diseo 12 al cual se le agrega un grupo de control, constitudo por grupos comparables (aunque no equivalentes). Se trata de un diseo parecido al 10, "slo que no se vuelve a someter a test a las mismas personas y, por lo tanto, se evita la posible interaccin entre la administracin de tests y X" (Campbell y Stanley, 1995:107).
Pgina 180 de 331

181
La variante 13a controla perfectamente, como ningn otro diseo, tanto la validez interna como la externa, con lo cual cabe considerarlo como un diseo experimental propiamente dicho aunque, que se sepa, nunca fue utilizado. Su esquematizacin (esquema 3) se ve complicada por los dos niveles de equivalencia (R y R') que implica (Campbell y Stanley, 1995:107). Diseo 14: Diseo de series cronolgicas mltiples.- Se trata del diseo 7 al que se le ha agregado un grupo de control. "En los estudios de grandes cambios administrativos por medio de datos en series cronolgicas, al investigador le conviene buscar una institucin similar no sujeta a X [grupo de control], de la cual tomar una serie cronolgica de control anloga (idealmente, con X asignada al azar)" (109). Para Campbell y Stanley, se trata de un excelente diseo cuasiexperimental, acaso el mejor de los ms viables, y es particularmente apropiado para investigaciones en establecimientos educativos (Campbell y Stanley, 1995:110). Diseo 15: Diseo de ciclo institucional recurrente (o diseo de retazos).- Se trata de un diseo apto para aquellas situaciones donde se presenta en forma cclica, a cada nuevo grupo de participantes, cierto aspecto de un proceso institucional, como por ejemplo y tpicamente, un programa de adoctrinamiento. Este diseo intenta reunir las ventajas respectivas de los diseos 2 y 3 (ya que signos positivos y negativos son mayoritariamente complementarios, como se ve en el esquema 2). En efecto, en el diseo 15 "pueden medirse a la vez un grupo expuesto a X con otro que va a serlo; esa comparacin entre O1 y O2 corresponde as al diseo 3. La segunda medicin del personal de la Clase B, un ciclo despus, nos da el segmento de diseo 2" (Campbell y Stanley, 1995:112). De esta manera, tambin, el diseo 15 puede combinar estudios transversales (comparando dos grupos al mismo tiempo entre s) con estudios longitudinales (comparacin a travs del tiempo). Se supone que en este diseo se podr aplicar el postest O1 al mismo tiempo que el pretest O2 a otro. No siempre ocurre as: la variante presentada en el esquema 2 ilustra esta situacin y se trata de una representacin ms precisa del diseo 15, correspondiente al caso tpico de una situacin escolar (Campbell y Stanley, 1995:116). Diseo 16: Anlisis de discontinuidad en la regresin.- Campbell y Stanley ilustran este diseo con una investigacin (Campbell y Stanley, 1995:118) donde se trat de averiguar si recibir un premio (una beca, etc.) incida o no en el desempeo posterior del estudiante (en cuanto a logros, actitudes, etc.). Como el premio se otorga slo a los alumnos ms calificados, el problema que se presenta es que resulta difcil evaluar la incidencia del premio porque los alumnos ms calificados igualmente tendran mejor desempeo, an sin premio, dados sus buenos antecedentes en calificaciones. Segn cabe entender a partir de la muy breve explicacin que nos suministran los autores, el diseo 15 intenta averiguar si hay o no discontinuidad en la lnea de regresin. Por ejemplo, un alumno con calificacin 5 tendr luego un desempeo 5, uno con calificacin 6 tendr un desempeo de 6, y as sucesivamente, lo que permite predecir -mediante anlisis de regresin- que alguien con calificacin 8 tendr desempeo 8. Si este alumno con calificacin 8 recibi un premio, y si su desempeo resulta ser 10 en vez de 8, se habr producido una discontinuidad en la secuencia regresiva, y habremos podido demostrar el efecto del premio.

2. VERSIN LEN Y MONTERO


Len y Montero distinguen los mtodos descriptivos (observacin y encuesta), los mtodos experimentales (diseos experimentales con grupos), y los mtodos propios de la investigacin aplicada (diseos de sujeto nico y diseos cuasi experimentales). De una manera un tanto arbitraria pero que sirve como criterio de organizacin, los mtodos de investigacin en psicologa y educacin pueden ser clasificados de acuerdo a los objetivos que persiguen de la siguiente manera, teniendo en cuenta que los autores califican a los mtodos de investigacin como planes para la obtencin de datos (Len y Montero, 1995:15), y a los diseos como elaboraciones de un plan de actuacin una vez que se ha establecido el problema de investigacin (Len y Montero, 1995:14). No aparece clara la diferencia entre mtodo y diseo, pero debera entenderse que ambos son planes para obtener datos, slo que los diseos son procedimientos ms especficos enmarcados dentro de algo ms amplio, el mtodo, el cual depende del objetivo de la investigacin: Objetivos de la investigacin Mtodos descriptivos Mtodos experimentales Investigacin aplicada Diseos de investigacin (planes para la obtencin de datos) Observacin Diseos de investigacin con encuestas Diseos experimentales con grupos Diseos de N = 1 (diseos de sujeto nico) Diseos cuasi experimentales

La observacin puede funcionar tambin como un modo de acceder a problemas de investigacin. De hecho, muchas veces se comienza a investigar haciendo observaciones cada vez ms sistemticas para delimitar problemas y elaborar hiptesis sobre lo observado (Len y Montero, 1995:16). Diseos de investigacin con encuestas
Pgina 181 de 331

182
Se define encuesta como una investigacin destinada a conocer caractersticas de una poblacin de sujetos a travs de un conjunto de preguntas (Len y Montero, 1995:98). Diseos transversales Describen una poblacin en un momento dado. Diseos longitudinales Describen una poblacin a lo largo del tiempo, en varios momentos. Por ejemplo, investigar como cambia la intencin de voto a lo largo de una campaa electoral. Por ejemplo, investigar si hay relacin entre ser fumador y tener padres fumadores. Muestreos sucesivos con grupos de sujetos distintos La misma encuesta se aplica ms de una vez a muestras distintas. Se puede entender como una sucesin de estudios transversales. Por ejemplo investigar cambios en la actitud hacia el tabaco. Diseo de panel La misma encuesta se aplica ms de una vez a la misma muestra. A diferencia del anterior, este diseo se puede determinar qu sujetos han cambiado y quienes no (cuando los sujetos son distintos slo se puede hablar de un cambio general en la poblacin). Diseo de cohorte Se encuesta varias veces a los mismos sujetos, seleccionados por algn acontecimiento temporal que los identifica, como la edad, el haber estado en una guerra, haber pasado hambre, etc. Por ejemplo, investigar como distintas generaciones, afectadas por diferentes dictaduras, reaccionan ente los valores democrticos.

Diseos experimentales con grupos Son diseos experimentales donde se comparan dos o ms grupos, formados por distintos sujetos o por los mismos sujetos. Los grupos de sujetos distintos se llaman tambin grupos independientes (Shaughnessy y Zechmeister, 1990), pero Len y Montero prefieren obviar esta nomenclatura, que clasifican los diseos experimentales con grupos del siguiente modo: Diseos simples Estudian una sola variable independiente (Len y Montero, 1995:192). Diseos con grupos de sujetos distintos (a) Diseo de grupos aleatorios Los sujetos son asignados al azar a cada uno de los grupos (Len y Montero, 1995:134). Diseo de grupos aleatorios con bloques Se busca que los grupos sean lo ms similares posibles mediante el control de una o varias variables (Len y Montero, 1995:136,155) (b). Diseos con grupos con los mismos sujetos (o intra-sujeto, o de medidas repetidas) (c) Diseos factoriales (d) Se consideran ms de una VI, y se crean tantos grupos como combinaciones de los niveles de las VI (Len y Montero, 1995:221).

Diseos complejos Estudian ms de una variable independiente (Len y Montero, 1995:192)

(a) Los diseos de grupos aleatorios y de grupos aleatorios con bloques pueden ser considerados de aplicacin general, pero hay diseos para ciertos problemas especiales, como por ejemplo el diseo de control por placebo o diseo ciego (a un grupo se administra la medicina verdadera y al otro un sustituto), y el diseo del doble ciego (ni el experimentador ni los sujetos saben quienes reciben la medicina y el placebo) (Len y Montero, 1995:143). (b) Algunos ejemplos de diseo de grupos aleatorios con bloques son los siguientes (Len y Montero, 1995:138-143): 1- Varios sujetos por nivel y bloque.- Debe averiguarse la incidencia de la inteligencia sobre el rendimiento actual, y debe controlarse la variable extraa rendimiento anterior. Para ello, se crean tres bloques de sujetos: con rendimiento anterior alto, medio y bajo. Luego, de cada bloque se eligen al azar sujetos que irn al grupo experimental o al grupo de control (por ejemplo si hay cuatro sujetos por bloque, se asignan dos a un grupo y dos al otro).La variable extraa ha quedado bloqueada. Este diseo sirve especialmente cuando los grupos son pequeos, ya que en grupos grandes la probabilidad de que la asignacin aleatoria sin bloques produzca una distribucin descompensada es muy pequea. 2- Un sujeto por nivel y bloque.- Es el mismo caso anterior, solamente que se asignan solamente dos sujetos por cada bloque, iguales respecto de la variable extraa, y luego se asignan al azar a los grupos experimental y de control. Tiene la ventaja de producir grupos ms iguales, y por tanto aumenta la sensibilidad del experimento.

Pgina 182 de 331

183
3- Camada.- Los bloques se forman con sujetos de una misma camada (por ejemplo mellizos, trillizos, etc). Ellos formarn un bloque natural 4- Gemelos.- En lugar de camadas se utilizan gemelos, que son ms iguales que los mellizos debido a su carga gentica ms similar. (c) En los diseos con grupos con los mismos sujetos pueden producirse efectos distorsionantes debidos a la prctica, al orden de presentacin de los tratamientos, a la fatiga y a la motivacin (Len y Montero, 1995:164). Sin embargo la misma prctica puede ser objeto de estudio, como en los experimentos sobre el aprendizaje, donde a lo largo del tiempo se repite la misma condicin, presentndose una misma situacin al mismo grupo de sujetos. La VI ser el nmero de ensayos, y la VD el nmero de errores (Len y Montero, 1995:167). En los diseos intra-sujeto se utilizan diferentes tcnicas de control, que se utilizan en el contexto de dos estrategias principales: a) amortiguar un posible efecto distorsionador debido al orden de presentacin de los distintos tratamientos experimentales; b) si se conoce la cuanta del efecto distorsionador del orden de presentacin, entonces se evala dicha cuanta para restarlo del efecto de la variable principal. Las tcnicas de control son: la aleatorizacin por bloques (responde a la primera estrategia), el reequilibrado (se aplica dentro de las dos estrategias), y el diseo de cuadrado latino (responde a la segunda estrategia). Las tres tcnicas de control del efecto de orden de presentacin de los tratamientos experimentales son (Len y Montero, 1995:189): Aleatorizacin por bloques.- Cada tratamiento se aplica ms de una vez. Se establecen bloques de tratamientos de tamao igual al nmero de valores de la variable independiente VI. Dentro de cada bloque se incluye, en orden aleatorio, una tarea de cada condicin experimental. Reequilibrado.- Hacer una repeticin de la secuencia de presentacin de los tratamientos en orden inverso. Dicha inversin puede hacerse con los mismos sujetos o con sujetos distintos. Diseo de cuadrado latino.- El control se lleva a cabo mediante la seleccin de un grupo de secuencias de presentacin de entre todas las posibles. Se eligen tantas secuencias como tratamientos haya en el experimento, de tal modo que se cumpla la condicin de que un tratamiento experimental slo aparezca una vez en cada posicin dentro del conjunto de secuencias elegidas. (d) Los diseos factoriales son aquellos diseos con ms de una VI donde todos los niveles de una variable se combinan con los niveles del resto de las variables. Por ejemplo, un diseo 2x2 supone dos VI, cada una con dos valores (sexo es varn o mujer, distraccin es s o no), y sera el caso ms sencillo (Len y Montero, 1995:193). La estrategia del diseo factorial permite observar como se comporta una variable bajo todas las condiciones de la otra, lo que es una ventaja respecto de hacer, por ejemplo, dos diseos simples consecutivos, que dejaran fuera algunas combinaciones cruciales (Len y Montero, 1995:198). Los diseos factoriales admiten muchas extensiones adems del simple 2x2. Por ejemplo, se puede hacer uno de 7x9, aunque para ello se requeriran muchos sujetos, habida cuenta que al menos 10 sujetos debe haber en cada grupo, con lo cual debera contarse con 7x9x10 = 630 sujetos (Len y Montero, 1995:198). En el contexto de los diseos complejos, los autores destacan especialmente el concepto de interaccin, que es el efecto adicional de la VD a la suma de los efectos individuales de las variables independientes (Len y Montero, 1995:202). Estos efectos, que pueden ocurrir entre dos o ms variables independientes, pueden detectarse mediante un anlisis estadstico de varianza en trminos de si son o no estadsticamente significativos para determinado nivel de significacin (Len y Montero, 1995:208). Hay casos especiales de interaccin, donde aparece pero no puede ser explicada tericamente. Un caso especial de interaccin es el efecto suelo (o techo), que aparece en la VD si a partir de cierto valor no es posible obtener otros ms bajos (o ms altos), permaneciendo constantes a pesar de la variacin de VI (Len y Montero, 1995:221) Tcnicas de anlisis estadstico para diseos con grupos de sujetos distintos.- a) En los diseos de grupos aleatorios, si son dos grupos se utiliza la diferencia de medias de gruidos independientes y si son ms de dos grupos, se usa el anlisis de varianza de un factor. b) En los diseos de grupos aleatorios con bloques se utilizan las tcnicas anteriores, slo que el criterio de bloque ayuda a disminuir la varianza debida al error: slo habr que restarle la varianza debida a la variable bloqueada (Len y Montero, 1995:153). Tcnicas de anlisis estadstico para diseos con grupos con los mismos sujetos.- La tcnica ms utilizada es el anlisis de varianza, y ms concretamente el anlisis de varianza de un factor con medidas repetidas, tcnica que se utiliza cuando se emplea la aleatorizacin o el reequilibrado como tcnica de control. En el segundo caso se asume que no se quiere analizar estadsticamente el efecto debido al orden. Finalmente, si la VI tiene slo dos valores se puede analizar la diferencia entre grupos mediante la t de Student para datos apareados (Len y Montero, 1995:187). Tcnicas de anlisis estadstico para diseos complejos.- Se utiliza el anlisis de varianza, para lo cual debe tenerse en claro la cantidad de VI involucradas, especificando las que sean de medidas repetidas. Si se trata de grupos aleatorios x grupos aleatorios, se usa el anlisis de varianza de dos factores. Si se trata de
Pgina 183 de 331

184
grupos aleatorios x medidas repetidas, en anlisis de varianza de dos factores, uno con medidas repetidas, y si se trata de medidas repetidas x medidas repetidas, el anlisis de varianza de medidas repetidas con dos variables (Len y Montero, 1995:220). En los diseos experimentales con grupos lo ideal es asignar sujetos al azar a cada grupo. Sin embargo, en la prctica esto no es posible, ya que se cuenta con grupos ya formados (por ejemplo alumnos de un aula). En estos casos en lugar de asignar sujetos al azar se asignan grupos al azar, lo que igualmente permite el control de variables extraas, aunque en menor medida (Len y Montero, 1995:147). Requisitos de los diseos experimentales.- Las propiedades que deben exigirse a un experimento son la fiabilidad, la sensibilidad, la validez externa y la validez interna. Los experimentos son fiables cuando al repetirse se obtienen los mismos resultados, pero lo que hace que se obtengan los mismos resultados es que el experimento estuviera bien controlado (Len y Montero, 1995:119). Respecto de la sensibilidad, se espera que los aparatos, los registros, las unidades de medida sean lo suficientemente sensibles como para detectar los cambios en las conductas (Len y Montero, 1995:120). La validez interna se refiere al grado de seguridad con el que se pueden establecer las causas de las variaciones, y la validez externa consiste en el poder de generalizacin de los resultados obtenidos (Len y Montero, 1995:121). Diseos de N = 1 (diseos de sujeto nico) Son diseos donde se estudia un solo caso, como por ejemplo un paciente. El ejemplo tpico es el llamado estudio de casos, donde se describe en forma detallada las caractersticas de un individuo en condiciones especiales. Por ejemplo, en el caso de un paciente se narran su evolucin asociada a sucesivas intervenciones del terapeuta. Estos diseos normalmente no tienen control sobre las variables extraas, y sirven tambin para sugerir nuevas hiptesis. Freud y Piaget, entre otros, lo han utilizado (Len y Montero, 1995:228). Si en los diseos que estudian grupos se hace referencia a pre-medidas y posmedidas, en los diseos de sujeto nico puede tener importancia tambin referirse a lo que podemos llamar intra-medidas, con lo cual incluirn tres tipos de medidas: medidas antes, medidas mientras y medidas despus, referidas a series de mediciones de la variable dependiente antes de la aplicacin del tratamiento (lnea de base), durante la aplicacin del tratamiento (que a veces puede durar semanas, meses o aos), y despus de la aplicacin del tratamiento (fase de seguimiento). Mientras los diseos de investigacin por encuestas y los diseos experimentales con grupos deben lidiar contra las diferencias individuales de los sujetos (si estas persisten a pesar del control de variables son consideradas como errores), los diseos de sujeto nico no tienen este problema, y se basan en la idea segn la cual si un fenmeno es lo suficientemente bsico se tendr que producir en el resto de los sujetos. Por ejemplo, fueron utilizados en el anlisis del condicionamiento operante por Skinner (Len y Montero, 1995:226). Diseo AB Primero se establece una lnea de base sin tratamiento (A) y una vez estabilizada se produce la intervencin midiendo la nueva serie (B) (Len y Montero, 1995:239). Diseo ABAB Procede en cuatro fases, donde A es sin tratamiento y B es con tratamiento. Admite variantes, como BAB y ABA. El diseo ABA se llama de vuelta atrs, y sirve para, una vez retirado el tratamiento, examinar si hubo otras variables que actuaron simultneamente (Len y Montero, 1995:241). Diseos de lnea base mltiple Plan experimental donde varias conductas se registran simultneamente y donde se aplica el mismo tratamiento pero de forma escalonada. Es una extensin del AB donde no puede realizarse una retirada del tratamiento (Len y Montero, 1995:253) (a). (a) Un ejemplo es el siguiente (Len y Montero, 1995:246). Una madre quiere que su hija dedique ms tiempo al clarinete, al campamento y a la lectura. En la primera semana se establecieron lneas base de las tres conductas donde la madre slo se limitaba a recomendarle que dedicara 30 minutos a cada una. A la segunda semana la madre empez a premiar el clarinete, pero no las otras conductas, y se vio que la hija aumentaba su tiempo con el clarinete mientras que las otras conductas se mantenan en la lnea de base. A la tercera semana sum un premio al campamento y ocurri otro tanto, y a la cuarta semana sum un premio a la lectura, habiendo ocurrido lo mismo. Los diseos de sujeto nico se utilizan: a) cuando solo se dispone de un sujeto; b) cuando es difcil encontrar sujetos para un grupo de control, ya que en el diseo de sujeto nico el paciente es su propio control; c) cuando se busca comprobar la eficacia de una intervencin teraputica; y d) cuando la investigacin es sobre procesos muy bsicos o con clara base biolgica (por ejemplo que la emetina produzca nuseas, para que luego sirva como tratamiento contra el alcoholismo) (Len y Montero, 1995:234).

Pgina 184 de 331

185
Las tres fases bsicas de los diseos de sujeto nico son: establecer la lnea de base, aplicar la intervencin, e interpretar los resultados. Si se trata de un diseo para probar la eficacia de la emetina para el alcoholismo, establecer la lnea de base implicar realizar mediciones previas al experimento para examinar la tendencia de consumo de alcohol del sujeto o bien su variabilidad, que puede permanecer en la misma cuanta (Len y Montero, 1995:236). Un diseo de sujeto nico puede cumplir perfectamente los tres criterios de causalidad: que VI anteceda al VD, que haya covariacin entre ambas, y que puedan descartarse otras posibles causas adems de VI (Len y Montero, 1995:229). Validez de los diseos de sujeto nico.- La validez interna de estos diseos depende del correcto control de variables extraas, y valen las consideraciones para los diseos de grupos, aunque debe recordarse la importancia de variables como historia, maduracin, efecto experimentador, etc. Sin embargo, debe tenerse presente que en los diseos de sujeto nico las puntuaciones no son independientes, ya que dependen de las anteriores. El diseo AB encierra dificultades, por ser difcil desechar la influencia de variables extraas, aunque puede acumularse evidencia con ms sujetos equiparados. Tambin es importante la interaccin entre sujeto y tratamiento, pues no todos los sujetos responden del mismo modo al mismo, sea cual fuere. La validez externa est en tela de juicio, porque mal puede representar a toda la poblacin un solo sujeto. Sin embargo: a) puesto que estos diseos se usan en el mbito clnico, los sujetos suelen representar bastante bien a la poblacin a la que pertenece (por ejemplo un fbico); y b) los cambios producidos por el tratamiento son tan grandes que hay margen de sobre para esperar que se produzcan en otros sujetos (Len y Montero, 1995:247). El empleo de los diseos de sujeto nico es inadecuado en cuatro casos: a) cuando puede utilizarse un diseo de grupos; b) cuando la variabilidad de la conducta en la lnea de base es muy grande; c) cuando se precisa un informe sobre la eficacia de un tratamiento para utilizarlo en forma generalizada; y 4) cuando hay que hacer estudios comparativos de la eficacia de varios tratamientos alternativos (no se puede decir que un tratamiento es mejor que otro porque un sujeto mejor) (Len y Montero, 1995:248). Tcnicas de anlisis estadstico para diseos de sujeto nico.- Son tcnicas bastante ms complejas que las empleadas en diseos de grupos, por lo que a veces se recurre a una apreciacin no estadstica observando la evolucin del tratamiento en las grficas, que deben registrar un nmero grande de observaciones por serie (sin y con tratamiento), y registrar si en la lnea de base hubo cambios en la tendencia (a subir, a bajar, etc), y en el nivel (mayor o menor que los valores en el tratamiento) (Len y Montero, 1995:249). Diseos cuasi experimentales Los diseos cuasi experimentales presentan ms dificultades para establecerse su validez interna, pero menos dificultades para establecerse su validez externa. Tpicamente suelen utilizarse en psicologa del desarrollo (en diseos evolutivos la edad es la VI) y en programas de valoracin de tratamientos o intervenciones. Len y Montero presentan dos criterios para clasificar los diseos cuasi experimentales: Criterio clsico (Cook y Stanley, 1979) Diseo pre-post con un solo grupo Diseo pre experimental donde se utiliza una nica medida, en un solo grupo, antes y despus de la aplicacin del tratamiento para evaluar los cambios producidos por ste (Len y Montero, 1995:280). Diseo pre-post con grupo de control no equivalente Diseo cuasi experimental donde el grupo de control no se ha formado mediante asignacin aleatoria. Esto hace que haya mayor incidencia de las potenciales amenazas a la validez interna de la investigacin (Len y Montero, 1995:280). Diseo de series temporales interrumpidas con grupo de control no equivalente Diseo cuasi experimental donde se utilizan series de medidas repetidas antes y despus del tratamiento en un grupo, el experimental. Al mismo tiempo se toman medidas en otro grupo de control, que no recibe el tratamiento. La creacin de ambos grupos no es mediante asignacin aleatoria (Len y Montero, 1995:280). Diseo ex post facto prospectivo Diseo donde se seleccionan grupos de sujetos con diferentes valores en la VI y se les compara en la VD (Len y Montero, 1995:280). Diseo ex post facto retrospectivo Diseo donde se selecciona a los sujetos segn sus caractersticas en la VD para, de forma retrospectiva, buscar VI explicativas de la VD (Len y Montero, 1995:280).

Criterio ex post facto (Dunham, 1988)

Pgina 185 de 331

186
a) Criterio clsico.- Los diseos cuasi experimentales fueron sistematizados por Campbell y Stanley (1966) y por Cook y Campbell (1979), mientras Len y Montero presentan algunos de estos diseos ms utilizados en psicologa y educacin, basndose en la versin Cook y Stanley. Estos ltimos presentan 17 tipos de diseos cuasi experimentales agrupados en tres grandes bloques: diseos pre experimentales, diseos con grupo de control no equivalente, y diseos de series temporales interrumpidas, bloques que suponen una ordenacin segn el grado de interpretabilidad de los resultados en trminos de causacin. Len y Montero presentan solo un ejemplo de cada bloque. Un pre experimento es un diseo cuasi experimental donde la posibilidad de establecer relaciones causales entre la VI y la VD est muy limitada por la falta de control experimental y la falta de manipulacin de la VI (Len y Montero, 1995:280). Un cuasi experimento es un plan de recogida de datos donde el investigador, siguiendo un proceso similar al del experimento, o bien no puede manipular la variable de su inters o bien no tiene la capacidad de control requerida en un experimento (Len y Montero, 1995:280). Hay situaciones donde no se puede manipular la VI, como por ejemplo no se puede pedir a una familia que interacte con sus hijos de manera tal de producirles un trastorno esquizofrnico. Para estos casos pueden servir los diseos cuasi experimentales (Len y Montero, 1995:258-262): Diseo pre-post con un solo grupo.- Por ejemplo, en un grupo de 30 pacientes, medir antes y despus la severidad del trastorno esquizofrnico del entrenamiento de sus familias durante seis meses para que ofrezcan una interaccin afectiva adecuada. Diseo pre-post con grupo de control no equivalente.- Una mejora metodolgica respecto del diseo anterior supone introducir un grupo de control, slo que en este no se hizo una asignacin aleatoria del mismo por ser muy difcil, en la realidad, conseguir un grado aceptable de semejanza. Diseo de series temporales interrumpidas con grupo de control no equivalente.- Consiste en establecer una lnea base en dos grupos mediante una serie de medidas durante cierto tiempo. Luego, se aplica el tratamiento al grupo experimental y se registra una nueva serie de medidas en ambos grupos. Aunque el grupo de control no es equivalente, este diseo supone una mejora metodolgica pues las premedidas detectaran una supuesta tendencia a la mejora por causas ajenas al tratamiento, por ejemplo las debidas al apoyo familiar. b) Criterio ex post facto.- Este criterio, establecido por Dunham (1988) define diseo ex post facto como aquel donde se selecciona a los sujetos por sus caractersticas personales cuando alguna de ellas es considerada como VI y no puede ser manipulada (Len y Montero, 1995:280). El nombre deriva de que los sujetos son elegidos para la investigacin por sus caractersticas (sexo, edad, rasgos de personalidad, etc), esto es, despus del hecho de haberlas adquirido. En otras palabras, no se asignan aleatoriamente a los sujetos a los valores de la VI sino que se los selecciona por poseer ya un determinado valor en dicha variable. Cuando se trabaja con variables del organismo, se habla de grupos naturales. Diseo ex post facto prospectivo.- Se seleccionan grupos con diferentes valores de VI y se los compara respecto de la VD. Por ejemplo, sujetos previamente clasificados como muy motivados por el logro y poco motivados por el logro mostraron preferencias distintas en un juego donde la probabilidad de ganar dependa de sus elecciones. Diseo ex post facto retrospectivo.- Se selecciona una muestra de sujetos segn sus caractersticas respecto de la VD y luego, de forma retrospectiva, se buscan posibles VI explicativas. Por ejemplo, seleccionar un grupo de esquizofrnicos con diversos grados de severidad, y luego estudiar sus historias anteriores de interaccin familiar. El problema aqu no es solo que puede influir las expectativas del investigador, sino tambin el hecho de estar buscando una causa que no es, pues puede ocurrir que la verdadera causa, en el ejemplo, sea gentica, y lo que produce esquizofrenia no es la interaccin familiar sino rasgos psicticos de alguno de los padres (Len y Montero, 1996:264). Validez de los diseos cuasi experimentales.- a) Validez interna: la validez interna est limitada porque el investigador no puede manipular VI ni asignar aleatoriamente a los sujetos a las condiciones experimentales. Amenazas a la validez interna son la historia, la adaptacin a las pruebas, los instrumentos, la regresin a la media, etc. b) Validez externa.- Suele considerarse que est asegurada porque en muchos casos de diseos cuasi experimentales se trabaja en contextos naturales. Sin embargo, debe considerarse que la validez externa puede comprometerse por otras razones adems de trabajar en situaciones artificiales, como por ejemplo cuando la muestra no es representativa (muchas investigaciones cuasi experimentales trabajan con sujetos voluntarios) (Len y Montero, 1995:274). Tcnicas de anlisis estadstico para diseos cuasi experimentales.- La mayora de los datos en estos diseos se analizan mediante pruebas estadsticas de comparacin entre dos o ms muestras. Cuando las muestras son ms de dos o las VI son tambin plurales, se utiliza el anlisis de varianza. Por ejemplo, en los diseos con ms de una medida al mismo grupo se utilizar el modelo de medidas repetidas. Cuando este tipo de medida se combina con la de un grupo de control, se puede aplicar el diseo mixto (factor Inter.-sujetos y factor intra-sujetos) o un anlisis de covarianza. En este segundo caso se utiliza la medida
Pgina 186 de 331

187
del pretest, en ambos grupos, como covariable de la medida en el postest. O sea, antes de comparar a los dos grupos en el postest, se elimina la parte de la varianza debida a su situacin en el momento del pretest. Otra tcnica muy utilizada, el diseos retrospectivos, es la regresin, simple o mltiple (Len y Montero, 1995:276).

3. VERSIN ARNAU GRAS


Arnau Gras (1980) presenta la siguiente clasificacin de diseos de investigacin, en parte basada en Campbell y Stanley (1966): Diseos experimentales simples (o unifactoriales) Diseos bivalentes (VI asume dos valores) Diseos multivalentes (VI asume ms de dos valores) Diseos para dos VI Diseos de dos grupos al azar: a) Diseo de antes y despus. b) Diseo de slo despus. c) Diseo de Solomon. Diseos multigrupo totalmente al azar Modelo factorial fijo Modelo factorial al azar Modelo factorial mixto

Diseos experimentales factoriales Diseos experimentales de bloques homogneos Diseos intrasujeto (o de medidas repetidas)

Diseos de dos grupos apareados Diseos de doble bloqueo (cuadrado latino y cuadrado grecolatino) Diseos de bloques al azar Diseos de tratamiento por sujetos Diseos factoriales intrasujetos (o diseo tratamiento por tratamiento por sujetos) Diseos factoriales mixtos (tratamiento intra e intersujeto): Diseos contrabalanceados Tambin llamados conductuales Diseos de grupo nico Diseos de un solo grupo sin repeticin Diseos de antes y despus de un solo grupo Diseos de comparacin esttica Diseos de series temporales Diseos de antes y despus de grupo de control no equivalente

Diseos experimentales no estadsticos Diseos preexperimentales Diseos cuasiexperimentales Diseos experimentales

Desde que Fisher sent las bases para los diseos factoriales en 1935, se establece una diferencia entre los diseos simples (o de factor nico o de una sola VI) y los diseos factoriales (de dos o ms factores o de dos o ms VI) (Arnau Gras, 1980:356). Segn el nmero de factores independientes y la cantidad de tratamientos, Arnau Gras (1980:359) clasifica los diseos experimentales en bivalentes, multivalentes y factoriales. Los dos primeros son diseos simples, y todos ellos son diseos de grupos al azar. Estos ltimos es una categora de diseos donde los individuos son asignados al azar a los grupos, y donde cada condicin experimental es aplicada en forma independiente a cada grupo (y por ello se llaman tambin diseos de grupos independientes). Entre los diseos de grupos al azar se cuentan los diseos bivalentes, multivalentes y factoriales (Arnau Gras, 1980:369). Se menciona tambin la clasificacin de Castro (1975), que divide los diseos experimentales en univariables o multivariables, segn que utilicen una o ms VI., los que incluyen a su vez diversas categoras: Diseos univariables (Estudian una VI) Diseos multivariables (estudian dos o ms VI) Diseos Diseos Diseos Diseos Diseos Diseos bicondicionales. multicondicionales. reversibles multivariables. factoriales. jerrquicos. incompletos.

Diseos experimentales simples Heredados de la fsica, en ellos slo se vara un nico factor, mantenindose constante el resto. En cambio en psicologa, la mayora de las variables estn directamente relacionadas con las restantes, y el hecho de variar una de ellas implica la alteracin de las otras, por lo que la aplicacin de diseos simples presenta problemas, que son bsicamente dos: a) los resultados son ambiguos porque no se sabe bien qu variable
Pgina 187 de 331

188
afecta el fenmeno, y b) puede haber interaccin, lo que afecta especialmente la validez externa del diseo (Arnau Gras, 1980:353-354). Diseos bivalentes.- Aquellos donde la VI asume solamente dos valores. Tienen utilidad exploratoria, y tienen dos riesgos: a) el posible desconocimiento inicial sobre la relacin entre variables: segn los valores elegidos para VI, pueden dar resultados opuestos; y b) no pueden generalizarse los resultados ms all del experimento. El paradigma de experimentacin de los diseos de factor nico bivalentes es aquel donde se compara un grupo experimental con otro de control. Los sujetos son elegidos al azar de la poblacin, y luego son asignados al azar a cada grupo (Arnau Gras, 1980:370). Sus tres modalidades (antes y despus, slo despus y Solomon), tienen cada una sus ventajas e inconvenientes (Arnau Gras, 1980:379-376). Diseos multivalentes.- Plan experimental para dos o ms valores de VI. Se llaman tambin diseos funcionales. Son ms precisos que los anteriores para identificar la posible relacin VI-VD y para establecer relaciones cuantitativas entre ellas (Arnau Gras, 1980:364). En particular, el diseo multigrupo totalmente al azar de slo despus supone emplear tantos grupos como valores tenga VI (Arnau Gras, 1980:376). Diseos experimentales factoriales Los diseos factoriales son disposiciones donde se estudia la accin conjunta de dos o ms VI, llamadas tambin factores. Si es completo, habr tantos grupos como posibles combinaciones entre los tratamientos experimentales. Suponen un gran ahorro de tiempo y costos respecto de los diseos anteriores, suministran ms informacin que los diseos simples, permite calcular interaccin entre variables, y son ms realistas, especialmente en psicologa donde la conducta est determinada por varios factores (Arnau Gras, 1980:364 y 386). Un ejemplo es el diseo factorial de 2x3. Esto significa que indaga dos VI (pues hay dos nmeros), que la primera tiene dos categoras y la segunda tiene tres categoras, con lo cual quedaran formados seis grupos experimentales, cada uno representando una combinacin de valores de ambas variables (Arnau Gras, 1980:387). Efectos principales y secundarios.- En los diseos factoriales no slo se examinan los efectos principales o efectos de cada VI en forma independiente, sino tambin los efectos secundarios, tambin llamados efectos simples o efectos de interaccin, como por ejemplo el efecto de interaccin entre dos de las VI (Arnau Gras, 1980:388). Modelos factorial fijo, al azar y mixto.- En el modelo factorial fijo el investigador ha elegido de antemano o a priori los valores de las VI, mientras que en el modelo factorial al azar, los valores de VI fueron elegidos aleatoriamente de la poblacin general (por ejemplo elegir tratamientos al azar, si acaso el investigador no tuviese alguna preferencia por alguno de ellos). Un modelo mixto utiliza ambos criterios (Arnau Gras, 1980:398). Principio del confundido.- Como puede apreciarse, los diseos factoriales pueden llegar a incluir una gran cantidad de grupos experimentales. El riesgo que se corre es que la VI puede quedar contaminada o confundida, es decir, su cambio va acompaado sistemticamente por el cambio de otro factor no controlado (efecto de confusin). Por ejemplo la VI nivel socioecnomico constituye una variable confundida si vara sistemticamente con posibilidades econmicas futuras o escaso nivel cultural (variables extraas) cuando se trata de examinar su incidencia sobre la VD preferencia vocacional (Arnau Gras, 1980:402). Diseos experimentales de bloques homogneos Cuando los sujetos son muy distintos entre s aumenta la posibilidad de error al inferir relaciones causales, lo cual puede compensarse o bien utilizar grupos de gran tamao, o bien utilizar un nico sujeto, o bien utilizar diseos de bloques para reducir las diferencias individuales (Arnau Gras, 1980:407). Esta tcnica consiste e formar grupos homogneos o bloques, cuyos sujetos presentan valores iguales que eliminan la heterogeneidad intrabloque. Por ejemplo un bloque puede estar formado por pacientes fbicos, otro por pacientes obsesivos, etc. En este caso la variable de bloqueo es diagnstico (Arnau Gras, 1980:408). Los bloques pueden estar formados por un grupo de sujetos o por un solo sujeto (Arnau Gras, 1980:413), y la tcnica del bloqueo puede utilizar para diseos simples o diseos factoriales (Arnau Gras, 1980:432). Diseos de dos grupos apareados.- Los grupos se equiparan mediante la tcnica del apareamiento, que consiste en asignar al azar, a cada uno de los grupos, pares de sujetos con caractersticas similares en relacin con la VD (Arnau Gras, 1980:415). El apareamiento se puede realizar de diversas formas (Arnau Gras, 1980:420): aparear sujetos con alguna caracterstica similar altamente correlacionada con la VD, aparear sujetos con caractersticas psicolgicas similares, aparear sujetos, o aparear sujetos mediante otras tcnicas como el control acoplado (Arnau Gras, 1980:421) o el rendimiento previo (Arnau Gras, 1980:422). Diseos de doble bloqueo.- En este caso se consigue reducir an ms el error, por cuanto se clasifica a los sujetos de acuerdo a dos criterios, y no a uno, con lo cual se pueden controlar dos fuentes de variacin extraa (Arnau Gras, 1980:423). El ejemplo tpico es el diseo del cuadrado latino. Un ejemplo podra ser aplicarlo utilizando nivel de ansiedad y hora del da como variables extraas de bloqueo, formar un cuadro de doble entrada con nueve casilleros (ya que se asignaron 3 valores a ansiedad y 3 a hora del da). A
Pgina 188 de 331

189
continuacin, se forman nueve grupos de sujetos que son sometidos a distintos valores de VI (distintos tratamientos, por ejemplo memorizar una lista de palabras de diferente longitud), para ver como vara la VD (memoria). El cuadrado grecolatino supone la superposicin de dos cuadrados latinos: se estudian dos VI en lugar de una, siendo cada casillero alguna combinacin de dos valores de ambas variables (Arnau Gras, 1980:432). Diseos de bloques al azar.- Se ha comprobado que no hay diferencias notables en cuanto a los resultados en la aplicacin de estos diseos y los diseos de grupos apareados (Arnau Gras, 1980:436). Diseos intrasujeto (o de medidas repetidas) Son aquellos en los que el sujeto es considerado como su propio control. As, se aplican al mismo sujeto todas las condiciones experimentales. Cada sujeto constituye un solo bloque y la tcnica del bloqueo es llevada hasta sus ltimas consecuencias y como ello, la homogeneidad intrabloque aumenta la eficacia y sensibilidad del experimento (Arnau Gras, 1980:437). Son importantes los efectos de orden en esta clase de diseos, ya que el mismo puede hacer que las respuestas de los sujetos varpien ms en funcin de ensayos previos que el funcin de las diferencias de los tratamientos (Arnau Gras, 1980:446). Hay varios tipos de estos diseos: Diseos de tratamiento por sujetos.- Diseo donde se aplican todos los tratamientos (o sea todos los niveles de la VI) a cada uno de los sujetos, con el fin de minimizar la incidencia de las diferencias individuales. (Arnau Gras, 1980:438). Ello permite tambin realizar un anlisis de tendencias (Arnau Gras, 1980:441). Diseos factoriales intrasujetos (o diseo tratamiento por tratamiento por sujetos).- Diseo donde se manipulan dos o ms VI y se aplica cada combinacin de tratamientos en un orden sucesivo, a cada sujeto. Se trata de un diseo que se ajusta a la estructura lgica de los diseos de tratamiento por sujetos a de bloques al azar. Diseos factoriales mixtos (tratamiento intra e intersujeto).- Disposicin experimental donde algunas comparaciones de los tratamientos son intrasujetos y otras intersujetos. Los valores de una de las VI se aplican a cada uno de los sujetos (variable intrasujeto) y los valores correspondientes a una segunda o ms VI, se aplican a diferentes grupos de sujetos (variables intersujetos). Presenta las siguientes variedades: a) Diseos bifactoriales: se combinan dos factores independientes. El primer factor reaplica en todos sus valores a cada sujeto, y el segundo se aplicar al azar a diferentes grupos de sujetos, segn la cantidad de niveles Suele utilizarse en experimentos sobre aprendizaje y extincin (Arnau Gras, 1980:447). b) Diseos trifactoriales: extensin lgica del anterior donde se pueden emplear dos disposiciones bsicas. Primero, se aplican todos los valores de una VI a cada sujeto, mientras que las otras dos VI se aplican intersujetos. Segundo, se toman dos VI de medidas repetidas o intrasujeto, dejando la tercera como variable intersujetos (Arnau Gras, 1980: 450). c) Diseos con tcnica de bloqueo: combinacin de un diseo intrasujeto con un diseo de bloques al azar (Arnau Gras, 1980:454). Diseos contrabalanceados.- Si bien son considerados por Arnau Gras (1980:469) en el captulo correspondiente a diseos preexperimentales y cuasiexperimentales, este autor los considera una extensin de los diseos intrasujeto. El contrabalanceo permite compensar los posibles efectos positivos o negativos que se producen en una sucesin continua de tratamientos (Arnau Gras, 1980:465). Diseos experimentales no estadsticos En los diseos experimentales estadsticos hay un control estadstico de las diferencias individuales. Este esquema fue consolidado por Fisher hacia 1935, quien consider el anlisis estadstico y el diseo experimental como dos caras de la misma realidad. A este esquema se contrapone el anlisis experimental de la conducta, de inspiracin skinneriana, donde se considera que la variabilidad de la conducta no es algo inherente a ella o a los sujetos sino a factores que la controlan, siendo entonces el propsito descubrir mediante manipulacin experimental, los factores responsables de dicha variabilidad (Arnau Gras, 1980:470). Los aspectos ms importantes de estos diseos son: a) preferente inters por la variabilidad intrasujeto; b) despojar sal diseo de toda regla o norma previa a seguir; c) empleo preferente de sujetos nicos; d) el control, como manipulacin y eliminacin de variables, es uno de sus objetivos bsicos; e) el concepto de lnea de base o estado de conducta estable es la base de contrastacin de los cambios operados en la conducta por manipulacin de variables; f) la reversibilidad del proceso conductual, adquiere, en este contexto, un autntico valor demostrativo de la efectividad de los tratamientos (Arnau Gras, 1980:472). Diseos preexperimentales Estos diseos, que son aproximaciones experimentales, presentan serios problemas para ejercer un control experimental, segn Campbell y Stanley (1966). Entre ellos se pueden mencionar los siguientes: Diseos de un solo grupo sin repeticin.- Diseo de grupo nico donde a un grupo al azar o formado naturalmente se aplica la VI si medida previa, y luego se realiza la posmedida (Arnau Gras, 1980:457).

Pgina 189 de 331

190
Diseos de antes y despus de un solo grupo.- Diseo de grupo nico donde un grupo formado por algn sistema de muestreo se le aplica una premedida, un tratamiento con VI, y una posmedida (Arnau Gras, 1980:458). Diseos de comparacin esttica.- Permite comparar la posmedida de dos grupos sin premedida, aplicando VI slo a uno de ellos. Como los grupos fueron elegidos por seleccin, no hay una garanta que antes de la aplicacin de VI los grupos sean equivalentes (Arnau Gras, 1980:459). Diseos cuasiexperimentales Si en los diseos preexperimentales hay un defecto bsico que invalida cualquier resultado, en los cuasiesperimentales se constata un defecto bsico de control de las condiciones experimentales, pero pueden ofrecer la posibilidad de obtener resultados cientficamente vlidos (Arnau Gras, 1980:460). Se pueden mencionar como diseos cuasiexperimentales los siguientes: Diseos de series temporales.- A un grupo formado por seleccin (no por azar), se aplica una serie de premedidas en el tiempo, luego se aplica VI, y finalmente se aplica otra serie de posmedidas en el tiempo. Diseos de antes y despus de grupo de control no equivalente.- Se comparan dos grupos no formados por azar: se les toman a ambos una premedida y una posmedida, slo que uno se le aplica el tratamiento VI y al otro no.

4. VERSIN SELLTIZ ET AL
Selltiz, Jahoda, Deutsch, Cook (1980) describen, entre otros, los diseos experimentales divariados, entre los cuales hay varios tipos, pero el objetivo es siempre probar la relacin X-Y como causal. Cuando sospechamos que realmente hay pocas variables extraas utilizaremos un diseo ms simple, pero cuando no es as nos vemos obligados a tomar ms recaudos mediante un diseo ms complejo. Los diseos descritos por los autores son seis y no son los nicos posibles, y muchas de las ejemplificaciones no corresponden a ellos. En el esquema siguiente se resumen los distintos tipos de diseos experimentales divariados mencionados por los autores indicados, desde el ms sencillo al ms complejo. Todos los grupos fueron tomados al azar, y se supone adems que estn ejerciendo influencia variables adicionales o extraas al experimento: de otro modo no tendra sentido usar estos diseos, cuyo propsito es precisamente controlarlas. Diseos experimentales bivariados (Versin ligeramente modificada por el autor de Selltiz-JahodaDeutsch-Cook)
Tipo de diseo I. Solo despus Grupos Experimental Control Y antes ------X X ---Y despus Y2 Y2 Cambio (d) d = Y2-Y2 Interaccin (I) ---Ejemplos X = Proyeccin de un film de guerra Y = Opinin sobre la guerra X = Frustracin Y= Constructividad ldica X = Campaa publicitaria Y =Efectividad de la campaa X = Proyeccin de un film de guerra Y = Opinin sobre la guerra X = Curso de entrenamiento en relaciones humanas Y = Opinin sobre las relaciones humanas -----

II. Antes y despus con un grupo III. Antes y despus con grupos intercambiables IV. Antes y despus con un grupo de control V. Antes y despus con dos grupos de control

Experimental

Y1

Y2

d = Y2-Y1

----

Experimental Control

---Y1

X ----

Y2 ----

d = Y2-Y1

----

Experimental Control

Y1 Y1

X ----

Y2 Y2

d = Y2-Y1 d = Y2-Y1

----

Experimental Control I Control II

Y1 Y1 (Y1)

X ---X

Y2 Y2 Y2

d = Y2-Y1 d = Y2-Y1 d = Y2-Y1

I=d (d+d)

VI. Antes y despus con tres grupos de control

Experimental Control I Control II Control III

Y1 Y1 (Y1) (Y1)

X ---X ----

Y2 Y2 Y2 Y2

d = Y2-Y1 d = Y2-Y1 d = Y2-Y1 d = Y2-Y1

I=d (d+d-d)

Pgina 190 de 331

191
En la versin Selltiz-Wrightsman-Cook solamente figuran los diseos 1, 4 y 6. En dicha versin, el esquema 4 se llama diseo simple y el 6 se llama diseo ampliado o esquema de los cuatro grupos de Solomon. Esta ltima denominacin figura en ambas versiones.

En este esquema observamos las expresiones Y antes, X e Y despus. Si retomamos el ejemplo de la relacin ruido-estrs, Y antes significa la medicin del estrs antes de aplicar el ruido (o premedida de Y), X significa aplicacin del estmulo sonoro, e Y despus indica la medicin del estrs despus de haber aplicado dicho estmulo (posmedida de Y). Esta ltima medicin debe realizarse para constatar si hubo o no alguna diferencia. En funcin de lo dicho encontraremos dos tipos de diseo bivariado: a) de slo despus, donde no tomamos la premedida, sino solamente aplicamos el ruido y luego medimos el estrs; y b) de antes y despus, donde tomamos tanto la premedida como la posmedida. Se trata de diseos ms complejos y, como se ve en el esquema, admiten cinco variantes. 1) Diseo de slo despus.- Es un diseo sencillo donde trabajamos con un grupo experimental y otro de control, sin haber tomado a ninguno la premedida. Lo que hacemos es someter a estmulos sonoros (X) al grupo experimental, y luego averiguamos las posmedidas de estrs en ambos grupos (Y2 e Y2). Si hay diferencia significativa entre ambas medidas de estrs, cabe pensar entonces que X es la causa de Y. En otras palabras, la diferencia d (ver columna de cambio) debe ser distinta a cero. En principio, cuanto ms diferente de cero sea d, tanto ms probable es la influencia de X como factor causal. Si d da cero o valores muy prximos a cero no hubo cambio, o sea el nivel de estrs en ambos grupos es igual, de donde pensamos que el factor ruido no tuvo influencia causal. Supongamos un ejemplo numrico: Grupo Experimental Control Y antes ------X X ---Y despus 20 15 Cambio d = 20-15 = 5

En este experimento imaginario el nivel de estrs de quienes sufrieron ruidos es 20 (por ejemplo 20 ml de adrenalina en sangre), y el nivel de los que no sufrieron los ruidos es 15. Aparece una diferencia significativa, que es 5, y por lo tanto concluimos que el ruido ejerce influencia causal. Cuando aplicamos este diseo, estamos suponiendo que los niveles de estrs antes del ruido (premedidas) son aproximadamente iguales en ambos grupos y que tienen en este caso el mismo valor 15, pues ambos grupos fueron extrados de la misma muestra, se suponen homogneos entre s y los sujetos fueron elegidos al azar. De esta forma el grupo de control, al no haber sido expuesto a ruidos, seguir manteniendo el valor 15 de estrs, pero no as el grupo experimental. Esquemticamente, la situacin sera as: Grupo Experimental Control Y antes (15) (15) X X ---Y despus 20 15 Cambio d = 20-15 = 5

El valor 15 entre parntesis indica que slo suponemos dicho valor para ambos grupos antes de aplicar el ruido, pues en realidad en este tipo de diseo no hemos tomado efectivamente las premedidas. Si tenemos fuertes razones para suponer que las premedidas son iguales, no nos molestaremos en tomarlas, pero puede ocurrir que tengamos alguna duda y, al medirlas, comprobamos que en realidad son bastante distintas, como sera en el siguiente ejemplo hipottico: Grupo Experimental Control Y antes (20) (15) X X ---Y despus 20 15 Cambio d = 20-15 = 5

Si las cosas ocurren as, entonces nos hemos equivocado al suponer que el ruido causa el estrs, ya que en el grupo experimental el nivel de estrs antes y despus del ruido es igual. Por lo tanto, cuando tenemos suficientes razones para sospechar que las premedidas son distintas, debemos tomarnos la molestia de medirlas, y entonces ya no estaremos utilizando el diseo de slo despus, sino cualquiera de los diseos de antes y despus. En esta clase de diseos s habr de interesarnos tomar las premedidas y, cuando lo hacemos, pueden suceder dos cosas: a) que las premedidas sean iguales, situacin que es la ms deseable porque de entrada pone en el mismo nivel a todos los grupos respecto de la variable Y (estrs). Fueron grupos bien elegidos y proseguimos el experimento con ellos sin cambiarlos; b) que las premedidas sean distintas entre s, en cuyo caso volveremos a seleccionar otros grupos que sean homogneos respecto de sus premedidas, a efectos de nivelarlos. Otra posibilidad sera continuar con los grupos originales desiguales, pero en esta situacin habremos de tener en cuenta sus diferencias al momento de la evaluacin de los resultados finales.

Pgina 191 de 331

192
Antes de examinar los diseos de antes y despus, demos un ejemplo de diseo de slo despus (Selltiz). El problema que gener la investigacin fue saber hasta qu punto la proyeccin de un film de guerra (X) influa sobre la opinin de las personas sobre los temas blicos (Y). Antes de la proyeccin del film al grupo experimental, se parti de la base de que las personas de ambos grupos (experimental y de control) tenan ms o menos las mismas opiniones sobre la guerra, con lo cual no era necesario tomar las premedidas de Y. Acto seguido se proyectaron varios films de guerra slo al grupo experimental, y despus se hicieron encuestas sobre opiniones de temas blicos a ambos grupos: si haba diferencia significativa entre estas opiniones, entonces se comprobaba la influencia causal de la proyeccin del film, y si no, no.

2) Diseo de antes y despus con un grupo.- Es el diseo ms sencillo en cuanto utilizamos un solo grupo: el experimental. En l, medimos el estrs antes del estmulo sonoro (Y1), aplicamos este estmulo (X), y volvemos a medir el estrs despus (Y2). Si hay diferencia significativa entre Y2 e Y1, entonces el ruido es factor causal del estrs.
Selltiz da un ejemplo para el tipo de diseo 2. Se puede averiguar qu influencia tiene la frustracin (X) sobre la constructividad en el juego en los nios, para lo cual se ubican infantes con juguetes en una habitacin donde el investigador puede observarlos a ellos pero no estos a l. Los nios comenzarn a jugar, y se evala luego de cierto tiempo el grado de constructividad que despliegan. Luego se los somete a estmulos frustrantes (ocultarles los juguetes, mostraeles juguetes ms nuevos pero que no pueden tocar, etc.) y se mide despus nuevamente el grado de constructividad cuando sigan jugando para saber si hubo o no alguna variacin significativa. Este experimento resulta tambin til para evaluar el grado de sadismo del investigador.

La simplicidad de este diseo radica en que el investigador que lo utiliza supone que las distintas variables extraas que pueden actuar sobre el estrs estn razonablemente controladas o anuladas por la simple aleatorizacin, y no es necesario entonces el empleo de grupos de control. Sin embargo, si sospechamos que esas variables s estn ejerciendo su influencia, entonces deberemos usar diseos ms complejos, que enseguida veremos. Entre estas variables extraas hay dos que son particularmente importantes: la influencia de la premedida y la interaccin. Si creemos que la variable que interviene es solamente la premedida, optaremos por realizar un experimento segn el diseo de antes y despus con grupos intercambiables.
El diseo II presenta algunas insuficiencias que pueden compensarse utilizando un diseo I. Yabo (1971) describe una situacin en la cual primero se pens en utilizar un diseo II, pero luego se lo complet con un diseo I. Para probar cul es el efecto de una droga sobre la presin arterial en individuos hipertensos, a un grupo determinado de individuos con hipertensin se les mide la presin arterial antes y despus de la administracin de la droga, registrando as la diferencia observada. Cualquiera sea el sentido de la diferencia, sta se puede atribuir a: 1) El efecto de la droga. 2) Otros factores que cambien la presin arterial entre el pretest y el postest, sin que la droga tenga ninguna participacin. 3) Al azar, es decir que la diferencia observada sea consecuencia de la variabilidad biolgica que no tiene una clara explicacin, pero que siempre puede estar presente ya que es una propiedad de la naturaleza. 4) A la combinacin de dos o ms de las causas enumeradas anteriormente. La segunda de estas causas posibles puede eliminarse si al mismo tiempo que en el grupo tratado (I), se observan los cambios de la presin arterial en otro grupo (II) de hipertensos (aqu se aplicara el diseo I), con los cuales se procede en similar forma que con el grupo I, pero con la nica diferencia de que no se les administra la droga sino un placebo. Este grupo II es el grupo testigo o control. Si analizamos los cambios de presin arterial en el grupo tratado y al mismo tiempo los del grupo testigo, la diferencia que podemos observar entre ambos grupos se puede atribuir ahora a: 1) El efecto de la droga. 2) El efecto del azar. 3) La combinacin de las dos causas antes mencionadas Para eliminar al azar como causa de los efectos observados, se procedi luego a realizar una prueba o test de significacin estadstica.

3) Diseo de antes y despus con grupos intercambiables.- Se trata de un diseo especial para el control de la influencia de la premedida de Y. el slo hecho de tomar una premedida del estrs puede hacer aumentar el estrs de la persona (por ejemplo por sentirse investigada). Por lo tanto habr aqu dos factores concurrentes que producen estrs: la premedida y el ruido. Si queremos eliminar la influencia de la premedida recurrimos a un expediente muy simple: sencillamente no la tomamos. En el esquema general de los diseos experimentales bivariados se aprecia, efectivamente, que el grupo experimental no es premedido: solamente es expuesto a X y luego posmedido. Sin embargo, necesitamos conocer el valor de la premedida del grupo experimental, y entonces recurrimos a un procedimiento tambin sencillo: le tomamos la premedida a otro grupo (grupo de control), el cual, por haber sido tomado de la misma muestra que el grupo experimental, existe suficiente seguridad estadstica de que ambos grupos tendrn aproximadamente las mismas premedidas, o sea, el mismo nivel previo de estrs. Por lo tanto el valor de la premedida del grupo de control (Y1) podremos considerarlo como si fuese el valor de la premedida del grupo experimental, con lo cual slo nos resta comparar si sta ltima y la posmedida son o no iguales: si la diferencia se aproxima a cero, entonces el ruido no influye como causa, y en caso contrario, s. La nica utilidad que entonces tiene aqu el grupo de control es la de proveernos de un dato premedido. Notemos tambin que en este tipo de diseo la diferencia d se obtiene comparando una premedida con una posmedida, en contraste con el diseo de slo despus donde comparbamos dos posmedidas.

Pgina 192 de 331

193
Supongamos que queremos hacer una campaa publicitaria para vender relojes que funcionen con energa solar. Si queremos saber si fue o no efectiva podemos hacer una encuesta antes de la campaa preguntndoles a las personas sus preferencias en materia de relojes de distinto tipo, y luego otra encuesta despus de la campaa para ver si las preferencias cambiaron o no como consecuencia de la misma. Pero, el slo hecho de hacer una encuesta antes puede estar ya influenciando (influencia de la premedida) en el sentido que las personas podrn poner mayor inters en la campaa posterior, con lo cual sta ya no ser la campaa original (o bien la opinin previa puede influir en la opinin posterior por cierta tendencia de las personas a responder siempre lo mismo). Para evitar esa influencia, la encuesta previa la hacemos con personas de la misma poblacin pero que vivan fuera del alcance de la campaa publicitaria, con lo cual la encuesta posterior (posmedida) reflejar en el grupo experimental solamente la efectividad de la campaa, sin la influencia de la encuesta previa. Este experimento es entonces un ejemplo de aplicacin del diseo de antes y despus con grupos intercambiables.

4) Diseo de antes y despus con un grupo de control.- Es muy similar al esquema de slo despus, con la nica diferencia que aqu hemos tomado las premedidas para asegurarnos de la igualdad de condiciones de ambos grupos. Para que con este nuevo diseo podamos probar que X es causa de Y, debern verificarse simultneamente dos condiciones: que d sea distinto de cero, y que d sea igual o muy prximo a cero. Ejemplo: Grupo Experimental Control Y antes 15 15 X X ---Y despus 20 15 Cambio d = 20-15 = 5 d = 15-15 = 0

Este diseo nos sirve especialmente, entonces, para averiguar cmo son las premedidas entre s de ambos grupos, pero no permite controlar si hay o no influencia de la interaccin, influencia de la premedida, u otras influencias. Por lo tanto, lo aplicaremos cuando tenemos fuertes razones para pensar que todas estas variables extraas no estn ejerciendo influencia significativa.
Un ejemplo de aplicacin del diseo IV de Selltiz es un estudio en el cual se intenta demostrar la influencia del conflicto cognitivo en la adquisicin de la nocin de izquierda-derecha (Dalzon, 1988). La hiptesis que se intentaba probar era que los nios podran adquirir ms rpidamente la nocin de cuales son los lados izquierdo y derecho tanto para l mismo como para los dems, si interactuaba con otros nios de manera tal que se generaran entre ellos conflictos y discusiones acerca de cual es el lado izquierdo y cual el derecho. Para ello se tomaron dos grupos de 28 nios cada uno: a los nios del grupo experimental se los hizo interactuar entre s en una situacin artificial donde estaban obligados a discutir entre ellos cual era la izquierda y cual la derecha, y al grupo de control no. Ambos grupos fueron premedidos respecto de su nivel de adquisicin de la nocin de izquierda-derecha, y luego, en la posmedida, se comprob que el grupo experimental haba adquirido la nocin cognitiva ms rpidamente que los nios del grupo de control.

5) Diseo de antes y despus con dos grupos de control.- El propsito central de este tipo de diseo es el de controlar la influencia de la interaccin, y entonces lo aplicamos cuando sospechamos su existencia. El diseo puede medir tambin la influencia de la premedida; efectivamente, notemos que aqu la situacin de los grupos de control II y I es igual a la situacin de los dos grupos del diseo 3, el cual serva precisamente para el control de esta variable extraa. Aclaremos el concepto de interaccin. Supongamos que el hambre (X) produce agresividad (Y), como pueden sugerirlo los saqueos a los supermercados en pocas de crisis. Si pudisemos disponer de un agresivmetro, supongamos que el hambre produce una agresividad de 3. Por otro lado, otras observaciones nos pueden sugerir que tambin la fatiga produce agresividad: si la pelcula es muy larga el pblico se puede enojar. Supongamos que aqu la fatiga produce agresividad 1. El sentido comn puede sugerirnos que, si los factores hambre y fatiga actan conjuntamente, el sujeto responder con una agresividad 4 (3 por hambre y 1 por fatiga). Esquemticamente: X Hambre Fatiga Hambre + fatiga Y Agresividad 3 Agresividad 1 Agresividad 4

Sin embargo, puede ocurrir que estos efectos no sean aditivos. Si un individuo est hambriento y encima fatigado, probablemente no le quede mucha energa para ser agresivo, y entonces en estos casos podemos obtener un valor 0.5 para su agresividad. Qu ha ocurrido? Las variables hambre y fatiga han interactuado, o sea produjeron un efecto inesperado, no aditivo: la agresividad resultante fue mucho menor a la esperada, aunque en otros casos los efectos pueden ser mayores que la simple suma, vale decir que al interactuar, las variables potencien sus efectos como en el caso del consumo simultneo de alcohol y drogas. El primero produce dao cerebral 7 (una cifra cualquiera) y las segundas dao cerebral 9; pero, si ambos factores actan juntos, el dao cerebral no ser 16 sino 30. Definiremos entonces interaccin como toda situacin en la cual dos o ms variables, por el solo hecho de actuar conjuntamente sobre un efecto, producen una influencia no aditiva sobre ste, sea reducindolo, sea potencindolo. Se trata entonces de efectos combinados que van ms all de los simples efectos aditivos. Otros autores dan definiciones similares. Una de ellas, por caso, afirma que entre dos variables
Pgina 193 de 331

194
ocurre interaccin cuando el efecto que ejerce una de ellas en la variable dependiente cambia conforme los valores que adquiere la otra, es decir, cuando la accin de una de las variables depende de cmo acta una segunda (definicin de Reuchlin citada en Arnau Gras, 1980:392). La consideracin de la interaccin puede tener gran importancia prctica. Pinsese, por ejemplo, en la posibilidad de que dos tratamientos combinados (psicoterapia y farmacoterapia) puedan producir efectos curativos que van ms all de la simple suma de los efectos curativos de cada tratamiento.
Blalock (1982:85) cita un ejemplo para comparar los efectos aditivos (que este autor y otros varios llaman efectos principales) con los efectos de interaccin. Las variables educacin, sexo y raza determinan aditivamente el ingreso mensual: 2000 dlares por tener ttulo secundario, ms 2000 dlares por ser varn, ms 2000 dlares por ser blanco. Sin embargo esta aditividad puede distorsionarse, o sea pueden aparecer efectos de interaccin, como por ejemplo cuando la diferencia de ingresos entre blancos y negros es pequea para un bajo nivel educacional, pero mayor en los altos niveles de educacin. As, si un blanco posee solamente ttulo primario, su sueldo por ser blanco se acercar ms al sueldo de un negro con primaria y ganar en tal concepto slo 500 dlares ms (y no 2000). Estn aqu interactuando las variables educacin y raza produciendo un efecto no aditivo sobre el ingreso mensual.

Traslademos ahora el concepto de interaccin al diseo 5. En este caso lo que queremos averiguar es si hay o no interaccin entre la premedida (Y1) y la variable experimental (X), es decir, si producen o no un efecto no aditivo sobre la posmedida (Y2). Por lo tanto, la sospecha estar recayendo solamente en el grupo experimental, nico grupo donde ambos factores actan conjuntamente. Para saber si existe o no interaccin, primero averiguaremos los efectos que producen independientemente Y1 y X, o sea, cuando actan solos, lo que podemos saber mediante los grupos de control I y II respectivamente. Vemos as que el diseo 5 hace posible la separacin de la influencia de la variable experimental de la influencia de la premedida, an cuando haya interaccin entre ellas. Aclaremos que en el grupo de control II la premedida no fue efectivamente tomada (pues slo nos interesa la influencia de X), pero como necesitamos igualmente conocer su valor, simplemente la inferimos a partir de las premedidas de los otros dos grupos, pudiendo ser un simple promedio de ellas. En el esquema general de diseos experimentales bivariados, los parntesis significan que se trata de una premedida inferida. Comparemos ahora los siguientes dos ejemplos: uno donde no hay interaccin y otro donde s la hay. Cuadro A (sin interaccin) Grupo Experimental Control I Control II Y antes 15 15 (15) X X X Y despus 40 15 40 Cambio d = 25 d = 0 d = 25 Interaccin I = d (d + d) I = 25 (0 + 25) = 0

Cuadro B (con interaccin) Grupo Experimental Control I Control II Y antes 15 15 (15) X X X Y despus 40 15 20 Cambio d = 25 d = 0 d = 5 Interaccin I = d (d + d) I = 25 (0 + 5) = 20

El grupo de control I detecta si hay o no influencia de la premedida (pues all no se aplica ruido y mucho menos interviene la interaccin entre premedida y ruido). Si comprobamos que efectivamente no existe esta influencia (como en los cuadros A y B), cualquier diferencia entre las posmedidas del grupo de control II y el grupo experimental ser debida a la interaccin (tal como ocurre en el cuadro B). En el caso de constatarse la existencia de interaccin, el experimento deber complejizarse para poder ponderar su influencia segn qu valores asuman las variables interactuantes (pues puede ocurrir que para determinados valores la interaccin quede anulada, para otros potencie sus efectos y para otros los reduzca por debajo de lo aditivamente esperable). A partir de lo dicho fcil es darse cuenta que puede haber influencia de la premedida sin que haya interaccin (caso donde la premedida y X dan efectos simplemente aditivos), pero no puede haber interaccin sin influencia de la premedida (pues en estos diseos precisamente la interaccin se establece entre la premedida y X). En los cuadros A y B, observando los valores del grupo de control I nos damos cuenta que no hubo influencia de la premedida, lo cual no significa que sta pueda empezar a ejercer influencia a propsito de su accin conjunta con X en el grupo experimental.

Pgina 194 de 331

195
Muchas veces con slo mirar los valores de los cuadros podemos saber intuitivamente si hubo o no interaccin, pero si queremos conocer cuantitativamente su valor preciso aplicaremos la frmula de la interaccin (ubicada a la derecha de los cuadros A y B): a medida que el resultado se aproxime a cero, la interaccin ser cada vez menor. Cuando el valor obtenido es cero, no la hay.
Selltiz cita un ejemplo de diseo 5, donde los investigadores trataron de averiguar si los cursos de entrenamiento en relaciones humanas (X) influan o no sobre la informacin y opinin sobre temas de relaciones humanas en las personas que hicieron dichos cursos. Se supuso que poda haber interaccin entre la premedida (encuesta previa al curso) y la variable experimental (curso), y entonces se utilizaron otros dos grupos: uno hizo directamente el curso sin encuesta previa (grupo de control II), y el otro fue sometido a esta encuesta previa sn hacer el curso (grupo de control I), con lo cual pudieron medirse esas influencias en forma independiente.

6) Diseo de antes y despus con tres grupos de control.- Adems de medir la influencia de la interaccin y de la premedida, este diseo tiene la ventaja adicional de poder controlar la influencia de otras variables extraas desconocidas, tanto organsmicas (cambios madurativos, etc) como situacionales (clima, etc) que eventualmente puedan tambin estar ejerciendo su influencia. Este sexto diseo es igual al anterior excepto que tiene agregado un grupo de control III, que es precisamente el que nos permite averiguar si influyen o no las otras variables adicionales. En l volvemos a encontrar una premedida inferida, o sea un premedida no tomada pero cuyo valor se supone similar a las premedidas tomadas en los otros grupos. La necesidad de contar con este valor deriva del hecho que necesitamos compararlo con la posmedida correspondiente para ver si existe o no una diferencia d. El razonamiento que debe hacerse entonces es el siguiente: sobre la posmedida del grupo de control III nunca podr ejercer su influencia ni la premedida ni la variable experimental, pues no fueron aplicadas, ni mucho menos la interaccin entre ellas. Por lo tanto, cualquier diferencia que aparezca entre la premedida inferida Y1 y la posmedida Y2 ser debida a la influencia de las otras variables adicionales, lo cual nos permite entonces detectar sus intervenciones.
En el diseo VI cabe preguntarse por qu, si el grupo de control III no mide interaccin, en la frmula de interaccin aparece el valor d? Al respecto debe tenerse presente que d mide la influencia de variables desconocidas, y entonces pueden suceder dos cosas: a) d igual a 0. En este caso no hay problema, pues en la frmula de interaccin desaparece. b) d distinto de 0. Esto significa que las variables extraas desconocidas influyen. Y si influyen en el grupo de control III, tambin lo hacen en los grupos restantes. Por tanto, para evaluar la interaccin en d, d y d es preciso descontar la influencia de las variables desconocidas.

En sntesis: los tipos de diseo experimental aqu examinados estn destinados a probar si X es factor causal de Y mediante el control de las variables adicionales. Estas ltimas son fundamentalmente la influencia de la premedida, la interaccin, y otras posibles variables que pueda haber. Cuando consideramos que las variables adicionales ya estn controladas de antemano y suponemos que las premedidas son iguales o controlables, aplicamos el diseo 1. Cuando no conocemos las premedidas y creemos que son distintas, nos sacaremos la duda aplicando los diseos de antes y despus 2 y 4. Cuando sospechamos que adems puede ejercer influencia la premedida, aplicamos el diseo 3. Cuando pensamos que interviene la interaccin, aplicamos el diseo 5 y finalmente, cuando creemos que adems de la premedida y la interaccin intervienen otros factores que es preciso tambin controlar, nos decidiremos por el diseo 6. Cmo averiguar qu tipo de diseo fue aplicado en un experimento dado? Para saberlo podemos contar con una regla prctica: si en el experimento no se tomaron premedidas, se aplic el diseo 1, y si efectivamente fueron tomadas, quedan los diseos 2 al 6. Si se trabaj con un solo grupo se us el diseo 2, con tres grupos el diseo 5 y con cuatro grupos el diseo 6. Restan los diseos 3 y 4, ambos con dos grupos. Reconocemos la aplicacin del diseo 3 si se tom una sola premedida (al grupo de control), y fue usado el diseo 4 si se tomaron las premedidas en ambos grupos.

5. OTRAS VERSIONES
En una apretada sntesis, se presentan a continuacin otras versiones que, muy a grandes rasgos, coinciden con las versiones presentadas precedentemente. Tngase presente que casi todos los autores provienen de las ciencias sociales, y especialmente de la psicologa. En particular, Kohan es una autora especialista en estadstica. Versin Kohan Segn el grado de control de las variables, cabe distinguir tres tipos de investigacin: por observacin natural, por evaluacin sistemtica y por manipulacin experimental (Kohan, 1994:357-359). 1) Observacin natural.- Implica observar naturalmente sin artificios la conducta en algn atributo o variable que interese. No existe un control activo ni sobre los estmulos (VI) ni sobre las respuestas (VD). Lo nico que puede hacerse es controlar algo las variables extraas para que no contaminen las relaciones que se supone existen entre VI y VD.

Pgina 195 de 331

196
2) Evaluacin sistemtica.- Supone inducir a los sujetos a que expresen sus tendencias exponindolos a una evaluacin sistematizada igual para todos con estmulos controlados, como tests, etc. El investigador trata de controlar los sujetos slo en parte. Se trata de que estos produzcan respuestas que se cree reflejan sus caractersticas preexistentes, sin afectarse deliberadamente la naturaleza del atributo del cual dependen las respuestas. 3) Manipulacin experimental.- El investigador busca influir los determinantes de las respuestas y tambin trata de lograr un control definido sobre las variables extraas que pueden contaminar la experiencia mantenindolas constantes o varindolas sistemticamente. Tipos de diseos de investigacin.- Un diseo de investigacin es un plan, una estructura y una estrategia de investigacin concebido para dar respuesta a los interrogantes puestos por la investigacin y controlar la variancia (Kohan, 1994:359). Los diseos pueden clasificarse del siguiente modo: Ex post facto Experimentales

Estudian una VI

Diseo simple con sujetos elegidos al azar. Diseo de los sujetos apareados al azar. Apareamiento de sujetos por un atributo correlacionado con la VD. Empleo de los sujetos como su propio control. Diseo de tipo test antes-despus con grupo de control. Diseo antes-despus combinado con diseo solo-despus.

Estudian dos o ms VI

Diseo de tratamiento de niveles. Diseos factoriales.

Diseos ex post facto.- No se pueden manipular las VI o asignar sujetos a tratamientos a criterio del investigador, porque la VI ya ha ocurrido. El investigador comienza con la observacin de la VD y retrospectivamente estudia la o las VI para analizar sus posibles efectos sobre la primera. En sociologa, psicologa, educacin antropologa y ciencias polticas una gran proporcin de la investigacin ha sido ex post facto. Este tipo de investigacin tiene tres debilidades: no puede manipular VI, no puede aleatorizar, y tiene el riesgo de una interpretacin inadecuada (Kohan, 1994:362-363). Diseos experimentales.- Son aquellos donde el investigador mismo determina quin debe ser asignado a qu condiciones. Una investigacin es verdaderamente cientfica cuando el investigador puede manipular y controlar una o ms VI y observa la VD para ver si existe variacin concomitante con la manipulacin de la o las VI. Existe una gran diversidad de diseos, de los cuales Kohan (1994:363-373) menciona los que juzga fundamentales: Diseo simple con sujetos elegidos al azar.- Requiere dos grupos de sujetos: experimental y de control que se seleccionan al azar de una misma poblacin y luego se asignan aleatoriamente a las dos condiciones experimentales (o diferentes valores de la VI). Si hay diferencia entre las medias de los grupos, la prueba estadstica a utilizar ser z o t, segn el nmero de casos (Kohan, 1994:364). Diseo de los sujetos apareados al azar.- Si no puede utilizarse el azar para obtener grupos equivalentes, se utiliza la tcnica del apareamiento de los sujetos: las mediciones previas de VD se aparean y cada integrante de la pareja es asignada al azar a uno de ambos grupos. Un ejemplo de prueba estadstica que puede aplicarse es la prueba t (Kohan, 1994:364). Apareamiento de sujetos por un atributo correlacionado con la VD.- Se utiliza cuando no es posible aparear los sujetos con un pretest de VD, pero s con otra caracterstica correlacionada con ella. Ejemplo, si los nios son muy pequeos como para producir medidas estables de inteligencia, se pueden aparear segn el nivel educacional de los padres (Kohan, 1994:366). Empleo de los sujetos como su propio control.- Una de las mejores maneras en que puede reducirse el error debido a diferencias individuales entre los sujetos es que ellos mismos sea su propio control, es decir, son medidos sucesivamente bajo un tratamiento experimental y luego bajo otro. El problema es que los efectos de orden en que son presentados los tratamientos pueden influir en los resultados, que puede resolverse mediante el contrabalanceo: se sigue un orden para la mitad de los sujetos tomados al azar, y el orden inverso para la otra mitad. Se menciona la prueba t como ejemplo para evaluar los resultados (Kohan, 1994:367). Diseo de tipo test antes-despus con grupo de control.- Se cuenta con un grupo de control tomado al azar de la poblacin que no reciba tratamiento o que reciba un tratamiento neutro tipo placebo. Se comparan las medidas de pretest y postest entre ambos grupos, y puede utilizarse el apareamiento para formar grupos equivalentes, lo que es an mejor. La prueba t es mencionada como prueba estadstica en estos casos (Kohan, 1994:370). Diseo antes-despus combinado con diseo solo-despus.- Permite el control de la interaccin entre pretest y VI (Kohan, 1994:371). y equivale al diseo de Solomon. Como prueba estadstica puede utilizarse

Pgina 196 de 331

197
t para comparar las medias de los diversos grupos entre s, que son cuatro: dos experimentales o dos de control. Diseo de tratamiento de niveles.- El efecto sobre la VD del principal tratamiento experimental se evala en cada uno de los diversos niveles de una o ms VI, distintos niveles que pueden ser grupos de sujetos naturales (por ejemplo nios inteligentes y retardados). En otro ejemplo, se puede utilizar este diseo para evaluar el tratamiento psicoteraputico en histeria, ansiedad y obsesin, utilizando en cada uno de los tres niveles un grupo experimental y uno de control (Kohan, 1994:372). Diseos factoriales.- En estos casos el inters recae sobre el efecto separado o interactivo de dos o ms VI. Suelen requerir pruebas estadsticas de anlisis de variancia y anlisis factoriales, ms complejas (Kohan, 1994:373). Tcnicas estadsticas.- Las tcnicas estadsticas se utilizan en los tres grandes tipos de investigacin, y con diversos propsitos: para seleccionar muestras, para evaluar respuestas mediante construccin de tests o cuestionarios, para evaluar su validez y confiabilidad, o para controlar variables (Kohan, 1994:359). Es importante saber qu diseo est usando el investigador, cules son las variables que puede controlar y en funcin de esto buscar la prueba estadstica apropiada (Kohan, 1994:357). Versin Hernndez Sampieri et al Tipos de investigacin.- Los autores describen cuatro tipos de investigacin: la investigacin exploratoria, descriptiva, correlacional y explicativa (Hernndez Sampieri et al, 1996:57). En los primeros no se formulan hiptesis, en los segundos se formulan hiptesis descriptivas de una variable, en los terceros hiptesis correlacionales y de diferencia de grupos cuando estas ltimas no expliquen la causa que provoca tal diferencia, y en los ltimos hiptesis causales. Una misma investigacin puede abarcarse algunas o todas las hiptesis indicadas (Hernndez Sampieri et al, 1996:96-97). Diseos de investigacin.- Un diseo de investigacin es un plan o estrategia para responder a las preguntas de investigacin, le seala lo que debe hacer para alcanzar sus objetivos y analizar la certeza de la hiptesis formulada. Se pueden clasificar en diseos experimentales y no experimentales (Hernndez Sampieri et al, 1996:108-109). Los autores referidos clasifican los diseos experimentales siguiendo la versin Campbell y Stanley (1966), como diseos preexperimentales, experimentales puros o verdaderos, y cuasi experimentales. Respecto de los diseos no experimentales, Hernndez Sampieri et al (1996:187) los clasifican como transeccionales y longitudinales. Ms concretamente: Diseos experimentales (Campbell y Stanley, 1966) Diseos no experimentales Preexperimentales Experimentales puros Cuasiexperimentales Transeccionales o transversales (uno o ms grupos) Longitudinales (un grupo)

Descriptivos Correlacionales/causales De tendencia (trend) De evolucin (cohort) De panel

Diseos experimentales.- 1) En su acepcin ms general, un experimento consiste en aplicar un estmulo a un individuo o grupo de individuos y ver el efecto de ese estmulo en alguna(s) variable(s) del comportamiento de stos. Esta observacin se puede realizar en condiciones de mayor o menor control. El mximo control se alcanza en los <experimentos verdaderos>. 2) Deducimos que un estmulo afect cuando observamos diferencias en las variables que supuestamente seran las afectadas- entre un grupo al que se le administr dicho estmulo y un grupo al que no se le administr, siendo ambos iguales en todo excepto en esto ltimo. 3) Hay dos contextos en donde pueden realizarse los experimentos: el laboratorio y el campo. 4) En los cuasiexperimentos no se asignan al azar los sujetos a los grupos experimentales, sino que se trabaja con grupos intactos. 5) Los cuasiexperimentos alcanzan validez interna en la medida en que demuestran la equivalencia inicial de los grupos participantes y la equivalencia en el proceso de experimentacin. 6) Los experimentos <verdaderos> constituyen estudios explicativos, los preexperimentos bsicamente son estudios exploratorios y descriptivos; los cuasiexperimentos son fundamentalmente- correlacionales aunque pueden llegar a ser explicativos (Hernndez Sampieri et al, 1996:182). Diseos no experimentales.- La investigacin no experimental es aquella que se realiza sin manipular deliberadamente variables, y donde se observan fenmenos tal y como se dan en su contexto natural, para despus analizarlos (Hernndez Sampieri, 1996:189). Segn el nmero de momentos en el tiempo donde se recolectan datos, los diseos no experimentales pueden ser transeccionales o transversales, y longitudinales. 1) La investigacin no experimental es la que se realiza sin manipular deliberadamente las variables independientes, se basa en variables que ya ocurrieron o se dieron en la realidad sin la intervencin directa del investigador. Es un enfoque retrospectivo. 2) La investigacin no experimental es conocida tambin
Pgina 197 de 331

198
como investigacin expost-facto (los hechos y las variables ya ocurrieron) y observa variables y relaciones entre stas en su contexto natural. 3) Los diseos no experimentales se dividen en transeccionales y longitudinales. 4) Los diseos transeccionales realizan observaciones en un momento nico en el tiempo. Cuando miden variables de manera individual y reportan esas mediciones son descriptivos. Cuando describen relaciones entre variables con correlacionales y si establecen procesos de causalidad entre variables son correlacionales / causales. 5) Los diseos longitudinales realizan observaciones en dos o ms momentos o puntos en el tiempo. Si estudian a una poblacin son diseos de tendencia, si analizan a una subpoblacin o grupo espe