El Error Standard podramos expresarlo conceptualmente como el error que se puede cometer al intentar conocer a una Poblacin por una Mue s tra de s misma. La frecuencia absoluta de aparicin de rangos de glucemias en una Poblacin (estn todos, no es una muestra) de 4600 pacientes No diabticos fue la siguiente:
Tabla de Resultados
Histograma de frecuencia y polgono de frecuencia
[Index FAC] [Index CCVC] Bioingeniera e Informtica Mdica/Bioengineering- Medical Informatics Curso: Bioestadstica bsica para mdicos asistenciales 4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology
Conceptos y tipo de variable
Para facilitar la comprensin del ejemplo hemos transformado una variable continua como es la Glucemia en una cardinal como es el "rango de glucemia". Lo hemos hecho para que la "localizacin" de los valores de la variable sea ms simple. Los conceptos sobre las limitaciones (el Error ) de conocer a la poblacin por una muestra se aplican en los estudios que utilizan variables cualitativas nominales o cardinales, que "cuentan" para obtener la frecuencia de aparicin en cualquiera de sus modalidades. Por supuesto que ocurre lo mismo si se trabaja con relaciones de las frecuencias obtenidas, como son el "Riesgo o Prevalencia", el "Odds Ratio", etc. Es conveniente destacar que las "ideas fuerzas" que expondremos a continuacin son las mismas cuando se trabaja con variables cuantitativas continuas o discontinuas. En la analoga propuesta en este ensayo, se trata del mismo idioma, el mismo lenguaje.
Localizacin en la "Campana":
Al histograma de frecuencia que se denomina "Campana", lo simplificaremos para trabajar, "colgando" en cada "localizacin" el nmero de "habitantes" de ese valor de la variable all "alojados" o "ubicados" si se prefiere.
La lnea gruesa vertical que divide a esta "campana" con distribucin simtrica en fracciones iguales, es la lnea que ya estudiamos pasando simultnemente por el valor PROMEDIO , por el valor de la MEDIANA y por el valor del MODO. No est de ms recordar que en cada "localizacin" se alojan habitantes que comparten la identidad en cuanto al valor de la variable en el Eje de las X, pero que pertenecen a otras comunidades (Poblaciones). En este caso, esos otros "ocupantes" en cada "rango", podran pertenecer a poblaciones de pacientes Diabticos y de diversos tipos de Diabetes. A esos valores de la variable ("individuos") "alojados" en la misma localizacin que los miembros de la poblacin en estudio, pero que no pertenecen a ella, los ignoraremos, los discriminaremos, como si no "existiesen".
4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology El Azar del Muestreo
Si observa la campana de la poblacin del ejemplo encontrar, a los 4600 "pobladores", la totalidad, "localizados" segn cada valor de la variable de la poblacin. Observe que los valores en este caso son 7 (siete) rangos, las localizaciones tambin son 7 (siete), los pobladores son 4600 distribudos simtricamente. Una muestra es una fraccin de una poblacin que se obtiene tomando azarosamente a algunos miembros de la poblacin "muestreada". Idealmente una muestra sera una "miniatura " de la poblacin. La idea de muestra est concebida imaginando que la misma es una "copia a escala" de la poblacin. En el imaginario, la muestra no slo representa sino que reproduce (a escala) a la poblacin con sus caractersticas de distribucin. En nuestro ejemplo, no necesitamos hacer ningn "clculo de probabilidades" para saber que una muestra del 10% de la poblacin (460 pacientes) no ser obtenida, si de verdad es por azar, tomando un 10% de cada "localizacin". El azar, que garantiza ecuanimidad en la representacin; conspira contra la exactitud de la "copia a escala". Obtener tal tipo de copia sera "sacar la lotera", es posible pero muy poco probable.
Cantidad y representacin
Si por el azar del muestreo la "extraccin" no es proporcionalmente idntica para cada "localizacin", no hacen falta frmulas para intuir que las campanas de diversas muestras no sern iguales entre s, ni tampoco una "miniatura" exacta de la poblacin. Las campanas de las muestras no son un calco entre s; tampoco la contraccin (fraccin proporcional exacta si se prefiere) de la campana de la poblacin.
La muestra "ideal", la "miniatura" o "copia" a escala, en color rojo en el grfico, es muy til para captar algunas ideas que luego se expresarn en el "lenguaje" estadstico. Las localizaciones con pocos "habitantes" tienen menos probabilidades de obtener representantes en el muestreo; sin hacer clculos de probabilidades, slo observe las flechas punteadas en color rojo "buscando" representantes y en color celeste la frecuencia de aparicin de ese valor en la poblacin y en la muestra. No slo eso, mirando el grfico, reflexione sobre las chances de lograr "copia exacta" en la representacin si las posibilidades de simplemente "aparecer" ya son escasas. 4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology Tampoco es necesario un clculo matemtico complejo para percibir que cuanto menor proporcin de la poblacin sea includa en la muestra (ms pequea la muestra), mayor ser el Error en la Representacin de la Poblacin. Error por muestreo Comprendida la idea de que la muestra no es una representacin "exacta" de la poblacin, debemos asumir un Error en la representacin, un Error por muestreo, en las proyecciones y en las inferencias que inducimos desde una muestra a su poblacin. Si la mala noticia es que las muestras tienen ERROR, la buena noticia es que ese error puede ser calculado con notable precisin. En los prrafos y grficos anteriores se explic la idea de que hay una relacin inversa entre tamao de la muestra y Error por muestreo. El concepto "cuanto menor la muestra, mayor el Error" tiene una expresin matemtica que la Estadstica incluye en los clculos de proyeccin e inferencias. Error promedio o error standard
En nuestro conocida campana, dejamos la muestra ideal (miniatura) en color negro e incorporamos al grfico las imgenes de dos muestras de diferente tamao. La muestra mayor en color celeste y la muestra menor en color rojo. En la poblacin y en cada una de las muestras inclumos la lnea vertical que divide en dos fracciones iguales a cada campana. Es la lnea que contiene a la medida de tendencia central ; la lnea que en nuestro intento de comprensin, asumamos como referencia de localizacin o "Km 0".
El grfico no es "caprichoso" al dibujar cada lnea de referencia de localizacin, la referencia obtenida con la muestra ideal "miniatura" es coincidente con la medida de tendencia central verdadera, es decir la de la poblacin. No tiene Error de Muestreo. Conforme a las ideas que se discutieron previamente, las muestras reales no tendrn la medida de tendencia central igual a la de la poblacin de origen. En la realidad hay Error de Muestreo. La diferencia de la medida de tendencia central de la muestra con la referencia verdadera de la poblacin depender inversamente del tamao de la muestra. 4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology En el grfico, la muestra celeste, ms grande, tiene una referencia de localizacin ms prxima a la verdadera, con menor Error, que la muestra roja, ms pequea. El Error de muestreo se expresa en el lenguaje estadstico agregando a la medida de tendencia central de la muestra un valor, calculado teniendo en cuenta el tamao de la muestra, que informa cuan alejada est esa referencia de la real de la poblacin. El valor del Error de la muestra se denomina Error Promedio o Error Standard.
Clculo del error standard
Conocemos el nmero que figurar en el denominador de cualquier frmula que calcule el Error Standard (ES), ser el nmero de casos analizados, ser el tamao de la muestra en relacin inversa al ES. Nos falta colocar un nmero en el numerador de la Ecuacin que calcule el Error. En el caso de variables cuantitativas continuas , se utiliza como numerador al Desvo Standard obtenido en el muestreo. El Desvo Standard la estudiamos como una medida de distribucin; para nosotros, legos, una expresin de la dispersin de las localizaciones, de la manera en que se ubican con respecto a la lnea de referencia los valores de la variable. En nuestras humildes analogas, entendamos al Desvo como el "domicilio" del valor de la variable. En esa idea, el Desvo Standard (DS) o Desvo Promedio, como valor agregado a la medida de tendencia central (media y/o mediana) informa con la expresin DS si las localizaciones en general estn ms o menos alejadas de la lnea de referencia, del "Km 0" para nuestra traduccin al lenguaje cotidiano. Una muestra con gran DS, con mucha dispersin de las localizaciones, con amplia distribucin si se prefiere, ser ms difcil asumirla como representacin homognea (sin error de representacin) de una poblacin, ms an si las inclusiones son azarosas. Se comprende que para calcular el Error Standard de muestreo, el DS es directamente proporcional al ES ; DS y ES tienen relacin directa ( mayor DS , mayor ES ). As se llega a la expresin matemtica, en la que "n" es el tamao de la muestra.
Las razones matemticas para utilizar como denominador la raz cuadrada del tamao de la muestra escapan a la finalidad de este ensayo, nos basta con entender que tal artilugio aritmtico no cambia la esencia de las ideas que hemos discutido. Para trabajar matemticamente con variables cualitativas, la estadstica apela al recurso simple de contar las apariciones (frecuencia de aparicin) de cada opcin de la variable, ya que contamos cualidades y no valores cuantitativos. Obtenidas las frecuencias de aparicin en la muestra, la Estadstica relaciona estas frecuencias entre s de diversas maneras para trabajar con ellas (Riesgo, Odds , etc.) Estas relaciones o proporciones resultan de referir un nmero a otro. Ese otro nmero es el utilizado como referencia. Si de Riesgo o Prevalencia se trata, la relacin o proporcin se construye colocando en el numerador el nmero de Eventos contados y en el denominador el nmero total de referencia, el tamao de la muestra . De esta manera se expresa, por ejemplo, que el Riesgo de muerte durante la internacin por Infarto de miocardio (IAM) es de 0.1 o lo que es lo mismo 10% 10 / 100 . Con ello se dice que de cada 100 pacientes internados por IAM se mueren 10 pacientes. En realidad la muestra de estudio fue de 1040 pacientes y la cantidad de pacientes fallecidos fue de 104. El clculo de 104/1040 arroja como 4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology resultado 0.1 o sus expresiones porcentuales. En estos tratamientos matemticos se capta rpidamente que cuanto mayor sea el tamao de la muestra, cuanto ms cercano el tamao de la muestra al total de la poblacin, mayor ser la probabilidad de que la relacin hallada sea verdadera, se percibe que el Error de muestreo, el error por "reclutamiento" azaroso sea menor. Se ratifica la idea previa, a mayor tamao de la muestra, menor error. Estas relaciones proporcionales o, simplemente proporciones, aritmticamente, se calculan utilizando al tamao de la muestra como denominador, como referente; luego la proporcin hallada tiene relacin inversa con el tamao de la muestra. En un sentido aritmtico estricto, se podra decir que a mayor tamao de muestra, menor proporcin; "Riesgo" si fuese esa la proporcin estudiada. Esto carece de sentido porque es evidente que a mayor tamao de la muestra, mayor nmero de eventos, mayor numerador; el resultado neto es una proporcin ms cercana a la verdadera. En la expresin Riesgo, es mejor como idea interpretar que a mayor tamao de muestra, menor Error en la estimacin del Riesgo. Por la construccin matemtica del Riesgo, surge que el Error del Riesgo est en relacin directa al valor calculado . En realidad se sigue vinculando al Error con el tamao de la muestra y de manera inversa; mayor tamao de muestra, menor error. Si "P " es la proporcin hallada en la muestra, la ecuacin para calcular el Error Estndar (ES) que utilizan los expertos en Estadstica es:
Si repasamos lo expuesto previamente, caemos en la cuenta que el tamao de la muestra ( n ) aparece explcito en el denominador y est implcito en el numerador. Quizs lo nico que debamos recordar de esta ecuacin para nuestras expresiones idiomticas estadsticas es que, para calcular el ES en las relaciones obtenidas con variables cualitativas, el nmero "llave" es el tamao de la muestra; ratificando la idea de que a mayor tamao de muestra, menor error de muestreo, menor ES.
Index curso - Clase anterior - Clase siguiente
Publicacin: Septiembre 2005 Tope Preguntas, aportes y comentarios sern respondidos por el relator o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica Llene los campos del formulario y oprima el botn "Enviar" Preguntas, aportes o comentarios: 4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology
Nombre y apellido:
Pas:
Argentina Direccin de E-Mail:
Enviar Borrar Dr. Diego Esandi Co-Presidente Comit Cientfico Correo electrnico Dra. Silvia Nanfara Co-Presidente Comit Cientfico Correo electrnico Prof. Dr. Armando Pacher Presidente Comit Tcnico/Organizador Correo electrnico 1994-2005 CETIFAC - Bioingeniera UNER Webmaster Actualizacin: 15-sep-05 4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology