Vous êtes sur la page 1sur 7

Clase N 4: Error Standard

Raul E. Ortego, Carlos R. Secotaro


Index curso - Clase anterior - Clase siguiente

El Error Standard podramos expresarlo conceptualmente como el error que se puede cometer al intentar
conocer a una Poblacin por una Mue s tra de s misma.
La frecuencia absoluta de aparicin de rangos de glucemias en una Poblacin (estn todos, no es una
muestra) de 4600 pacientes No diabticos fue la siguiente:

Tabla de Resultados

Histograma de frecuencia y polgono de frecuencia

[Index FAC] [Index CCVC]
Bioingeniera e Informtica Mdica/Bioengineering- Medical Informatics
Curso: Bioestadstica bsica para mdicos asistenciales
4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Conceptos y tipo de variable

Para facilitar la comprensin del ejemplo hemos transformado una variable continua como es la Glucemia
en una cardinal como es el "rango de glucemia".
Lo hemos hecho para que la "localizacin" de los valores de la variable sea ms simple.
Los conceptos sobre las limitaciones (el Error ) de conocer a la poblacin por una muestra se aplican en
los estudios que utilizan variables cualitativas nominales o cardinales, que "cuentan" para obtener la
frecuencia de aparicin en cualquiera de sus modalidades. Por supuesto que ocurre lo mismo si se trabaja
con relaciones de las frecuencias obtenidas, como son el "Riesgo o Prevalencia", el "Odds Ratio", etc.
Es conveniente destacar que las "ideas fuerzas" que expondremos a continuacin son las mismas
cuando se trabaja con variables cuantitativas continuas o discontinuas.
En la analoga propuesta en este ensayo, se trata del mismo idioma, el mismo lenguaje.

Localizacin en la "Campana":

Al histograma de frecuencia que se denomina "Campana", lo simplificaremos para trabajar, "colgando" en
cada "localizacin" el nmero de "habitantes" de ese valor de la variable all "alojados" o "ubicados" si se
prefiere.

La lnea gruesa vertical que divide a esta "campana" con distribucin simtrica en fracciones iguales, es la
lnea que ya estudiamos pasando simultnemente por el valor PROMEDIO , por el valor de la MEDIANA y
por el valor del MODO.
No est de ms recordar que en cada "localizacin" se alojan habitantes que comparten la identidad en
cuanto al valor de la variable en el Eje de las X, pero que pertenecen a otras comunidades (Poblaciones).
En este caso, esos otros "ocupantes" en cada "rango", podran pertenecer a poblaciones de pacientes
Diabticos y de diversos tipos de Diabetes.
A esos valores de la variable ("individuos") "alojados" en la misma localizacin que los miembros de la
poblacin en estudio, pero que no pertenecen a ella, los ignoraremos, los discriminaremos, como si no
"existiesen".

4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology
El Azar del Muestreo

Si observa la campana de la poblacin del ejemplo encontrar, a los 4600 "pobladores", la totalidad,
"localizados" segn cada valor de la variable de la poblacin.
Observe que los valores en este caso son 7 (siete) rangos, las localizaciones tambin son 7 (siete), los
pobladores son 4600 distribudos simtricamente.
Una muestra es una fraccin de una poblacin que se obtiene tomando azarosamente a algunos
miembros de la poblacin "muestreada".
Idealmente una muestra sera una "miniatura " de la poblacin. La idea de muestra est concebida
imaginando que la misma es una "copia a escala" de la poblacin.
En el imaginario, la muestra no slo representa sino que reproduce (a escala) a la poblacin con sus
caractersticas de distribucin.
En nuestro ejemplo, no necesitamos hacer ningn "clculo de probabilidades" para saber que una muestra
del 10% de la poblacin (460 pacientes) no ser obtenida, si de verdad es por azar, tomando un 10% de
cada "localizacin". El azar, que garantiza ecuanimidad en la representacin; conspira contra la exactitud
de la "copia a escala".
Obtener tal tipo de copia sera "sacar la lotera", es posible pero muy poco probable.

Cantidad y representacin

Si por el azar del muestreo la "extraccin" no es proporcionalmente idntica para cada "localizacin", no
hacen falta frmulas para intuir que las campanas de diversas muestras no sern iguales entre s, ni
tampoco una "miniatura" exacta de la poblacin.
Las campanas de las muestras no son un calco entre s; tampoco la contraccin (fraccin
proporcional exacta si se prefiere) de la campana de la poblacin.

La muestra "ideal", la "miniatura" o "copia" a escala, en color rojo en el grfico, es muy til para
captar algunas ideas que luego se expresarn en el "lenguaje" estadstico.
Las localizaciones con pocos "habitantes" tienen menos probabilidades de obtener representantes en el
muestreo; sin hacer clculos de probabilidades, slo observe las flechas punteadas en color rojo
"buscando" representantes y en color celeste la frecuencia de aparicin de ese valor en la poblacin y en
la muestra.
No slo eso, mirando el grfico, reflexione sobre las chances de lograr "copia exacta" en la
representacin si las posibilidades de simplemente "aparecer" ya son escasas.
4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology
Tampoco es necesario un clculo matemtico complejo para percibir que cuanto menor proporcin de la
poblacin sea includa en la muestra (ms pequea la muestra), mayor ser el Error en la
Representacin de la Poblacin.
Error por muestreo
Comprendida la idea de que la muestra no es una representacin "exacta" de la poblacin, debemos
asumir un Error en la representacin, un Error por muestreo, en las proyecciones y en las inferencias
que inducimos desde una muestra a su poblacin.
Si la mala noticia es que las muestras tienen ERROR, la buena noticia es que ese error puede ser
calculado con notable precisin.
En los prrafos y grficos anteriores se explic la idea de que hay una relacin inversa entre tamao de
la muestra y Error por muestreo.
El concepto "cuanto menor la muestra, mayor el Error" tiene una expresin matemtica que la
Estadstica incluye en los clculos de proyeccin e inferencias.
Error promedio o error standard

En nuestro conocida campana, dejamos la muestra ideal (miniatura) en color negro e incorporamos al
grfico las imgenes de dos muestras de diferente tamao. La muestra mayor en color celeste y la
muestra menor en color rojo.
En la poblacin y en cada una de las muestras inclumos la lnea vertical que divide en dos fracciones
iguales a cada campana.
Es la lnea que contiene a la medida de tendencia central ; la lnea que en nuestro intento de
comprensin, asumamos como referencia de localizacin o "Km 0".

El grfico no es "caprichoso" al dibujar cada lnea de referencia de localizacin, la referencia obtenida con
la muestra ideal "miniatura" es coincidente con la medida de tendencia central verdadera, es decir la de
la poblacin. No tiene Error de Muestreo.
Conforme a las ideas que se discutieron previamente, las muestras reales no tendrn la medida de
tendencia central igual a la de la poblacin de origen.
En la realidad hay Error de Muestreo.
La diferencia de la medida de tendencia central de la muestra con la referencia verdadera de la poblacin
depender inversamente del tamao de la muestra.
4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology
En el grfico, la muestra celeste, ms grande, tiene una referencia de localizacin ms prxima a la
verdadera, con menor Error, que la muestra roja, ms pequea.
El Error de muestreo se expresa en el lenguaje estadstico agregando a la medida de tendencia central
de la muestra un valor, calculado teniendo en cuenta el tamao de la muestra, que informa cuan alejada
est esa referencia de la real de la poblacin.
El valor del Error de la muestra se denomina Error Promedio o Error Standard.

Clculo del error standard

Conocemos el nmero que figurar en el denominador de cualquier frmula que calcule el Error Standard
(ES), ser el nmero de casos analizados, ser el tamao de la muestra en relacin inversa al ES.
Nos falta colocar un nmero en el numerador de la Ecuacin que calcule el Error.
En el caso de variables cuantitativas continuas , se utiliza como numerador al Desvo Standard
obtenido en el muestreo.
El Desvo Standard la estudiamos como una medida de distribucin; para nosotros, legos, una expresin
de la dispersin de las localizaciones, de la manera en que se ubican con respecto a la lnea de referencia
los valores de la variable. En nuestras humildes analogas, entendamos al Desvo como el "domicilio" del
valor de la variable. En esa idea, el Desvo Standard (DS) o Desvo Promedio, como valor agregado a
la medida de tendencia central (media y/o mediana) informa con la expresin DS si las
localizaciones en general estn ms o menos alejadas de la lnea de referencia, del "Km 0" para nuestra
traduccin al lenguaje cotidiano.
Una muestra con gran DS, con mucha dispersin de las localizaciones, con amplia distribucin si se
prefiere, ser ms difcil asumirla como representacin homognea (sin error de representacin) de una
poblacin, ms an si las inclusiones son azarosas.
Se comprende que para calcular el Error Standard de muestreo, el DS es directamente proporcional al
ES ; DS y ES tienen relacin directa ( mayor DS , mayor ES ).
As se llega a la expresin matemtica, en la que "n" es el tamao de la muestra.


Las razones matemticas para utilizar como denominador la raz cuadrada del tamao de la muestra
escapan a la finalidad de este ensayo, nos basta con entender que tal artilugio aritmtico no cambia la
esencia de las ideas que hemos discutido.
Para trabajar matemticamente con variables cualitativas, la estadstica apela al recurso simple de
contar las apariciones (frecuencia de aparicin) de cada opcin de la variable, ya que contamos
cualidades y no valores cuantitativos.
Obtenidas las frecuencias de aparicin en la muestra, la Estadstica relaciona estas frecuencias entre s de
diversas maneras para trabajar con ellas (Riesgo, Odds , etc.)
Estas relaciones o proporciones resultan de referir un nmero a otro. Ese otro nmero es el utilizado como
referencia.
Si de Riesgo o Prevalencia se trata, la relacin o proporcin se construye colocando en el numerador el
nmero de Eventos contados y en el denominador el nmero total de referencia, el tamao de la
muestra . De esta manera se expresa, por ejemplo, que el Riesgo de muerte durante la internacin por
Infarto de miocardio (IAM) es de 0.1 o lo que es lo mismo 10% 10 / 100 . Con ello se dice que de
cada 100 pacientes internados por IAM se mueren 10 pacientes. En realidad la muestra de estudio fue de
1040 pacientes y la cantidad de pacientes fallecidos fue de 104. El clculo de 104/1040 arroja como
4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology
resultado 0.1 o sus expresiones porcentuales.
En estos tratamientos matemticos se capta rpidamente que cuanto mayor sea el tamao de la
muestra, cuanto ms cercano el tamao de la muestra al total de la poblacin, mayor ser la probabilidad
de que la relacin hallada sea verdadera, se percibe que el Error de muestreo, el error por
"reclutamiento" azaroso sea menor.
Se ratifica la idea previa, a mayor tamao de la muestra, menor error.
Estas relaciones proporcionales o, simplemente proporciones, aritmticamente, se calculan utilizando al
tamao de la muestra como denominador, como referente; luego la proporcin hallada tiene relacin
inversa con el tamao de la muestra. En un sentido aritmtico estricto, se podra decir que a mayor
tamao de muestra, menor proporcin; "Riesgo" si fuese esa la proporcin estudiada. Esto carece de
sentido porque es evidente que a mayor tamao de la muestra, mayor nmero de eventos, mayor
numerador; el resultado neto es una proporcin ms cercana a la verdadera.
En la expresin Riesgo, es mejor como idea interpretar que a mayor tamao de muestra, menor
Error en la estimacin del Riesgo.
Por la construccin matemtica del Riesgo, surge que el Error del Riesgo est en relacin directa al
valor calculado . En realidad se sigue vinculando al Error con el tamao de la muestra y de manera
inversa; mayor tamao de muestra, menor error.
Si "P " es la proporcin hallada en la muestra, la ecuacin para calcular el Error Estndar (ES) que
utilizan los expertos en Estadstica es:


Si repasamos lo expuesto previamente, caemos en la cuenta que el tamao de la muestra ( n ) aparece
explcito en el denominador y est implcito en el numerador.
Quizs lo nico que debamos recordar de esta ecuacin para nuestras expresiones idiomticas estadsticas
es que, para calcular el ES en las relaciones obtenidas con variables cualitativas, el nmero "llave" es el
tamao de la muestra; ratificando la idea de que a mayor tamao de muestra, menor error de
muestreo, menor ES.

Index curso - Clase anterior - Clase siguiente

Publicacin: Septiembre 2005
Tope
Preguntas, aportes y comentarios sern respondidos por el relator
o por expertos en el tema a travs de la lista de Bioingeniera e Informtica Mdica
Llene los campos del formulario y oprima el botn "Enviar"
Preguntas, aportes o
comentarios:
4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology




Nombre y apellido:

Pas:

Argentina
Direccin de E-Mail:


Enviar Borrar
Dr. Diego Esandi
Co-Presidente
Comit Cientfico
Correo electrnico
Dra. Silvia Nanfara
Co-Presidente
Comit Cientfico
Correo electrnico
Prof. Dr. Armando Pacher
Presidente
Comit Tcnico/Organizador
Correo electrnico
1994-2005 CETIFAC - Bioingeniera UNER
Webmaster Actualizacin: 15-sep-05
4to. Congreso Virtual de Cardiologa - 4th. Virtual Congress of Cardiology

Vous aimerez peut-être aussi