Vous êtes sur la page 1sur 4

Captulo 1.

Conceptos estadsticos fundamentales


Variabilidad
La variabilidad es una caracterstica intrnseca de cualquier proceso biolgico. Por ejemplo, la altura de plntulas de determinada especie, la ganancia en peso de terneros, la concentracin de azcar en frutos, estn sujetos a la variabilidad gentica que existe entre individuos. Sin embargo, aunque los individuos fuesen genticamente idnticos, existen otras fuentes que generan variabilidad, y que provocarn que la respuesta no sea exactamente la misma. Por ejemplo, las caractersticas del suelo donde se desarrollan las plntulas no sern idnticas aunque se tomen todos los recaudos, as como tampoco lo sern el riego, la cantidad de luz recibida, etc. A esta variabilidad gentica y ambiental se le suma la variabilidad generada por el proceso de medicin. Asimismo existen otras fuentes de variacin, que, a diferencia de las anteriores, son controladas, es decir generadas por el investigador. As, por ejemplo, un investigador puede estar interesado en el efecto de la aplicacin de un fertilizante nitrogenado sobre la altura de las plntulas. Entonces aplica fertilizante a cierta cantidad de plntulas mientras que otras son dejadas como control. En este contexto, es fundamental contar con herramientas de anlisis que permitan cuantificar las distintas fuentes de variacin que intervienen en un proceso, a fin de poder decidir, por ejemplo, si las variaciones en la altura de las plntulas se deben al tratamiento aplicado (el fertilizante nitrogenado en este caso) o se trata de variaciones aleatorias, generadas por fuentes no controladas y aleatorias. La estadstica provee las herramientas conceptuales y metodolgicas para satisfacer estos objetivos.

Tipos de estudios
Una investigacin cientfica puede encuadrarse bsicamente en dos tipos de situaciones, vinculadas con el proceso de recopilacin de la informacin:
Estudios observacionales o mensurativos: Son aquellos en los cuales el proceso que se observa no

est siendo controlado. Es decir que los datos existen sin necesidad de intervencin del investigador. Por ejemplo, se desea investigar el efecto del pastoreo sobre el banco de semillas en pasturas naturales. Para ello se eligen al azar lotes donde el ganado est presente y otros donde no lo est. El tratamiento pastoreo no fue asignado por el investigador, sino que los lotes que se seleccionaron presentaban o no el tratamiento. Esta particularidad trae como consecuencia que si se encuentran diferencias en el banco se semillas entre ambos grupos, no necesariamente sern atribuibles a la presencia de ganado. Podra argumentarse por ejemplo que la presencia de ganado en determinados lotes obedeci a una mayor cobertura y biomasa vegetal, debido a su vez a caractersticas diferenciales del suelo. Y stas son las verdaderas causales de las diferencias en el banco de semillas. Hablamos entonces de confusin de efectos, ya que no es posible separar el efecto del pastoreo de otros vinculados a las caractersticas de los lotes pastoreados. En los estudios observacionales, a la unidad que es seleccionada en forma aleatoria para su observacin se la denomina unidad de observacin o individuo. En nuestro ejemplo sera cada lote.
Estudios experimentales o manipulativos: Son aquellos en los cuales el investigador asigna activamente un tratamiento a los individuos a fin de observar la respuesta, hay una intervencin. Siguiendo con el ejemplo, supongamos que el investigador elige lotes al azar con las pastura y tambin al azar asigna ganado a algunos de ellos y clausura a los restantes. Al cabo de un tiempo caracteriza el banco de semillas de los lotes. As, si se encuentran diferencias en el banco se semillas entre ambos grupos, si bien no se descarta que puedan atribuirse a diferencias previas en las caractersticas de los

Captulo 1. Conceptos estadsticos fundamentales

lotes, la conclusin ms fuerte es que se deben a la presencia del ganado. Esto es as porque al asignar aleatoriamente la presencia de ganado a ciertos lotes, es poco probable que los lotes con mejores suelos (por ejemplo) hayan sido sorteados masivamente a uno de los dos grupos. Y cuanto mayor es la cantidad de lotes, menos probable es este desbalanceo de factores no controlados entre grupos. Se deduce entonces que los experimentos bien diseados y analizados proveen fuerte evidencia sobre el efecto de los tratamientos. En estos estudios, a la unidad a la que se le asigna un tratamiento en forma aleatoria para su observacin se la denomina unidad experimental. En resumen, en los estudios experimentales, a diferencia de los observacionales, los tratamientos son asignados al azar a los individuos, lo que permite establecer relaciones causa-efecto. Sin embargo, los estudios observacionales son los nicos abordajes posibles cuando los tratamientos no pueden ser asignados aleatoriamente, ya sea por la naturaleza del tratamiento (i.e. reas incendiadas vs no incendiadas en un parque nacional) o por razones ticas.

Clasificacin y escalas de variables


Las caractersticas de inters que registramos en las unidades observacionales o experimentales se denominan variables. Dichas variables son aleatorias, ya que su valor no es conocido de antemano. Las variables pueden tomar cualquier modalidad (valor) dentro de un conjunto determinado. Dicho conjunto o rango de valores posibles constituye el dominio de la variable. En funcin del tipo de dominio, las variables pueden ser clasificadas en: Cualitativas o categricas: Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos). Ej: Variedad de trigo, Raza, Sexo, Mejora a un tratamiento (S/No), etc. Cuantitativas o Numricas: Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos). A su vez, estas se dividen en: Discretas: son aquellas que no asumen valores intermedios entre dos valores sucesivos. Por lo tanto toman valores enteros. En general, las variables discretas son las que se cuentan. Ej: cantidad de cras/hembra, cantidad de frutos/planta, cantidad de incendios/ao, etc. Continuas: son aquellas que admiten infinitos valores entre dos valores cualquiera dentro del dominio. En este caso los valores de la variable pertenecen a los nmeros reales. Ej: Altura, edad, peso al nacer, etc. Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece como discreta. Este es el caso en que hay limitaciones en lo que concierne a la precisin del aparato de medicin de esa variable, por ejemplo si medimos la altura en cm de plntulas con una regla que ofrece dos decimales de precisin, podemos obtener ..., 1,65, 1,66, 1,67, 1,68, .... En realidad lo que ocurre es que con cada una de esas mediciones expresamos que el verdadero valor de la misma se encuentra en un intervalo de 0,005. Por lo tanto cada una de las observaciones representa ms bien un intervalo que un valor concreto. Otra diferencia entre variables es la escala de medicin. Se distinguen las siguientes escalas: Nominal: La variable tiene dos o ms categoras, pero estas no pueden ordenarse jerrquicamente. Ej: Especie, genotipo, sexo
Captulo 1. Conceptos estadsticos fundamentales

Ordinal o de rangos: La variable tiene dos o ms categoras que pueden ordenarse jerrquicamente, pero las diferencias entre categoras no son necesariamente equidistantes. Ej: grado de infeccin, ndices de abundancia De intervalos: Adems del orden entre categoras se establecen intervalos iguales en la medicin, por lo tanto tienen sentido las diferencias entre dos nmeros cualesquiera de la escala. El valor cero es arbitrario, es decir que no indica ausencia de la caracterstica. Ej: Temperatura, ao calendario De razn o cociente: Idem anterior salvo que existe el cero absoluto, que indica ausencia de la caracterstica. Ej: cantidad de frutos por planta, altura

Inferencia estadstica
La poblacin o universo es el conjunto de todas las unidades de inters (observacionales o experimentales) en donde los resultados del estudio debern extrapolarse. La cantidad total de individuos que constituyen la poblacin (tamao de la poblacin) puede ser conocida o no. Normalmente la poblacin de inters es demasiado grande para poder ser observada en su totalidad, (cuando esto ocurre hablamos de censo). Por eso es necesario recurrir al muestreo. La muestra es un subconjunto de la poblacin al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones). Esta formada por unidades experimentales o de observacin seleccionadas al azar de la poblacin. La inferencia estadstica es un conjunto de procedimientos que permite generar conclusiones sobre la poblacin a partir de los resultados obtenidos en una muestra de dicha poblacin. Para ello es necesario el uso de probabilidades, que permiten cuantificar la incertidumbre generada por el muestreo y asignar un margen de error a nuestras conclusiones. Ahora bien, la poblacin de inters puede no coincidir con la poblacin que en realidad podemos estudiar. Esto es as porque la poblacin que puede ser observada depende no solo de los objetivos de la investigacin, sino tambin de los recursos disponibles. Siendo que la inferencia se efecta slo sobre la poblacin de la cual la muestra fue extrada, es crtica la definicin de la poblacin a ser observada. Por ejemplo, un investigador puede estar interesado en comparar la densidad de oligoquetos en suelos de sistemas naturales (SN) y de sistemas agrcolas convencionales (SAC) en el sudeste bonaerense. Supongamos tres abordajes metodolgicos posibles, definidos por los recursos de los que dispone: a) elige al azar localidades del sudeste bonaerense y de stas elige, tambin al azar, lotes pertenecientes a SN y lotes con SAC. b) en cierta localidad del sudeste bonaerense selecciona lotes con SN de todos los lotes con SN existentes en la localidad y lotes con SAC de todos los lotes con SAC. c) En cierta localidad selecciona un lote con SN de todos los lotes con SN existentes en la localidad y un lote con SAC de todos los lotes con SAC. De cada lote extrae varias muestras de suelo. Si bien es su inters estudiar los lotes con SN y SAC del sudeste bonaerense, slo para el ensayo a) cumple con dicho objetivo. Para el ensayo b) la poblacin a la que puede generalizar los resultados se restringe a los lotes con SN y SAC de cierta localidad del sudeste bonaerense, mientras que en el c) la poblacin es excesivamente estricta: est constituida slo por los dos lotes analizados. Y ms an: en este ltimo caso, de encontrarse diferencias, stas no podrn ser atribuidas necesariamente al sistema productivo empleado sino que, por confusin de efectos, podran deberse a caractersticas propias de cada lote. En definitiva, la definicin de la poblacin de inters es la que debera determinar la seleccin de la muestra, ya que slo podr efectuarse inferencia a la poblacin de la cual la muestra fue extrada.
Captulo 1. Conceptos estadsticos fundamentales

Probabilidad
Si el nico propsito del investigador es describir los resultados de un ensayo particular, es suficiente con emplear estadsticos descriptivos. Sin embargo, si lo que se pretende es utilizar la informacin obtenida en el ensayo para extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido estudiados, entonces los estadsticos descriptivos constituyen slo el principio del anlisis, y debe recurrirse a mtodos de inferencia estadstica, los cuales implican el uso inteligente de la teora de la probabilidad. La probabilidad puede definirse como una cuantificacin de la incertidumbre en la ocurrencia de un suceso. Por qu es necesario el manejo de probabilidades para efectuar inferencia? Veamos un ejemplo. Al obtener en cierta localidad del sudeste bonaerense dos muestras, una de lotes con SN y otra de lotes con SAC, seguramente encontraremos diferencias en la densidad media de oligoquetos presentes en el suelo. Ahora bien, estas diferencias pueden deberse principalmente a dos razones: a) las dos muestras pertenecen a poblaciones con distinta cantidad media de oligoquetos, o b) las dos muestras pertenecen a poblaciones con igual cantidad media de oligoquetos y las diferencias se deben a diferencias aleatorias generadas por el proceso de muestreo Para decidir entre estas dos alternativas necesitamos de las probabilidades, que nos permitirn asignar un margen de error a nuestra decisin.

Captulo 1. Conceptos estadsticos fundamentales

Vous aimerez peut-être aussi