Vous êtes sur la page 1sur 8

Cuando usar anlisis estadstico

usarse cuando el estudio requiera describir aspectos o caractersticas de la realidad de modo local o global pero que la descripcin de estas caractersticas no sean tpicas de un solo elemento de la poblacin sino que lo sean de la poblacin misma. Un ejemplo tpico es el estudio del comportamiento de una enfermedad en un paciente contra el comportamiento de la misma enfermedad pero envarios pacientes. En otras palabras se requiere de un estudio estadstico cuando el fenmeno que se evala se presenta con regularidad de modo que el uso de las frecuencias o repeticin de la aparicin de las caractersticas sea esencial para el diagnstico de esa realidad local o global

Tipos de Anlisis Estadstico


Se distinguen tres tipos de anlisis estadstico segn el nmero de variables que se analicen conjuntamente; univariado, bivariado y multivariado

Qu es analizar?
Se entiende por anlisis la descomposicin del todo en partes de modo tal de evaluar cada una para luego integrarlas en la interpretacin. Por ejemplo cuando se observa que una persona est decada o sin nimo y tambin se observa que su temperatura es alta, se habr realizado el anlisis parcial del estado general de la persona (ya que se evaluaron dos caractersticas) pero que puede llevar a concluir (interpretar) que la persona tiene fiebre. Como se observa, el decaimiento y la temperatura alta han de observarse separadamente ya que cada caracterstica goza de entidad propia. En conclusin todo anlisis comienza siendo parcial y termina siendo integrador en la interpretacin

El anlisis multivariante es un mtodo estadstico utilizado para determinar la contribucin de varios factores en un simple evento o resultado.

Los factores de estudio son los llamados factores de riesgo (bioestadstica), variables independientes o variables explicativas. El resultado estudiado es el evento, la variable dependiente o la variable respuesta.

El anlisis multivariante mediante tcnicas de proyeccin sobre variables latentes tiene muchas ventajas sobre los mtodos deregresin tradicionales:

se puede utilizar la informacin de mltiples variables de entrada, aunque stas no sean linealmente independientes

puede trabajar con matrices que contengan ms variables que observaciones puede trabajar con matrices incompletas, siempre que los valores faltantes estn aleatoriamente distribuidos y no superen un 10% puesto que se basan en la extraccin secuencial de los factores, que extraen la mayor variabilidad posible de la matriz de las X (variables explicativas, tienen que ser dependientes) pueden separar la informacin del ruido. Se asume que las X se miden con ruido.

[editar]Tcnicas Multivariantes

Anlisis de Componentes principales Anlisis factorial Anlisis discriminante Anlisis de Correlacin Cannica Anlisis Cluster Anlisis de Escalamiento Dimensional Anlisis de correspondencias Anlisis factorial confirmatorio Modelo de Ecuaciones Estructurales (SEM), anlisis causal. Anlisis conjunto Escalamiento ptimo Regresin Lineal Multiple Regresin Logit y Probit Anlisis Manova

En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn terminologa inglesa) es una coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est particionada en ciertos componentes debidos a diferentesvariables explicativas. Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "anlisis de varianza de Fisher",

debido al uso de la distribucin F de Fisher como parte del contraste de hiptesis.

Introduccin
El anlisis de la varianza parte de los conceptos de regresin lineal(?). El primer concepto fundamental es que todo valor observado puede expresarse mediante la siguiente funcin:

Donde Y sera el valor observado (variable dependiente), y X el valor que toma la variable independiente. sera una constante que en la recta de regresin equivale a la ordenada en el origen, es otra constante que equivale a la pendiente de la recta, y es una variable aleatoria que aade a la funcin cierto error que desva la puntuacin observada de la puntuacin pronosticada. Por tanto, a la funcin de pronstico la podemos llamar "Y prima":

Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones esperadas, ms el error aleatorio: (1.1) Sabiendo este concepto, podemos operar con esta ecuacin de la siguiente forma: 1) Restamos a ambos lados de la ecuacin (para mantener la igualdad) la media de la variable dependiente:

2) Substituimos el error por la ecuacin resultante de despejar la ecuacin 1.1:

Por tanto...

Y reorganizando la ecuacin:

Ahora hay que tener en cuenta que la media de las puntuaciones observadas es exactamente igual que la media de las puntuaciones pronosticadas:

Por tanto:

Podemos ver que nos han quedado 3 puntuaciones diferenciales. Ahora las elevamos al cuadrado para que posteriormente, al hacer el sumatorio, no se anulen:

Y desarrollamos el cuadrado:

Podemos ver que tenemos los numeradores de las varianzas, pero al no estar divididas por el nmero de casos (n), las llamamos Sumas de Cuadrados., excepto en el ltimo trmino, que es una Suma Cruzada de Cuadrados (el numerador de la covarianza), y la covarianza en este caso es cero (por las propiedades de la regresin lineal, la covarianza entre el error y la variable independiente es cero). Por tanto:

O lo mismo que:

de un factor, que es el caso ms sencillo, la idea bsica del anlisis de la varianza es comparar la variacin total de un conjunto de muestras y descomponerla como:

Donde:

es un nmero real relacionado con la varianza, que mide la variacin debida al "factor", "tratamiento" o tipo de situacin estudiado. es un nmero real relacionado con la varianza, que mide la variacin dentro de cada "factor", "tratamiento" o tipo de situacin.

En el caso de que la diferencia debida al factor o tratamiento no sean estadsticamente significativa puede probarse que las varianzas muestrales son iguales:

Donde:
es el nmero de situaciones diferentes o valores del factor se estn comparando. es el nmero de mediciones en cada situacin se hacen o nmero de valores disponibles para cada valor del factor.

As lo que un simple test a partir de la F de Snedecor puede decidir si el factor o tratamiento es estadsticamente significativo. [editar]Visin

general

Existen tres clases conceptuales de estos modelos:


1. El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podran diferir nicamente en sus medias. (Modelo 1) 2. El Modelo de efectos aleatorios asume que los datos describen una jerarqua de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarqua. Ejemplo: El experimentador ha aprendido y ha considerado en el experimento slo tres de muchos ms mtodos posibles, el mtodo de enseanza es un factor aleatorio en el experimento. (Modelo 2) 3. El Modelo de efectos mixtos describen situaciones que ste puede tomar. Ejemplo: Si el mtodo de enseanza es

analizado como un factor que puede influir donde estn presentes ambos tipos de factores: fijos y aleatorios. (Modelo 3)

[editar]Supuestos

previos

El ANOVA parte de algunos supuestos que han de cumplirse:

La variable dependiente debe medirse al menos a nivel de intervalo. Independencia de las observaciones. La distribucin de los residuales debe ser normal. Homocedasticidad: homogeneidad de las varianzas.

La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un anlisis de regresin lineal)

El nmero de grados de libertad (gl) puede separarse de forma similar y corresponde con la forma en que la distribucin chicuadrado( o Ji-cuadrada) describe la suma de cuadrados asociada.

[editar]Tipos de modelo [editar]Modelo

I: Efectos fijos

El modelo de efectos fijos de anlisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta slo a la media, permaneciendo la "variable respuesta" con una distribucin normal.

Este modelo se supone cuando el investigador se interesa nicamente por los niveles del factor presentes en el experimento, por lo que cualquier variacin observada en las puntuaciones se deber al error experimental. [editar]Modelo

II: Efectos aleatorios (componentes de varianza)


Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. El ejemplo ms simple es el de estimar la media desconocida de una poblacin compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medicin. Este modelo se supone cuando el investigador est interesado en una poblacin de niveles, tericamente infinitos, del factor de estudio, de los que nicamente una muestra al azar (t niveles) estn presentes en el experimento. [editar]Grados de libertad [editar]Pruebas de significacin El anlisis de varianza lleva a la realizacin de pruebas de significacin estadstica, usando la denominada distribucin F de Snedecor. [editar]Tablas ANOVA Una vez que se han calculado las sumas de cuadrados, las medias cuadrticas, los grados de libertad y la F, se procede a elaborar una tabla que reuna la informacin, denominada "Tabla de Anlisis de varianza o ANOVA", que adopta la siguiente forma:

Fuente de variaci n Suma de cuadrados

Grado s de liberta d Cuadrado medio F

Intergrup o

t-1

Intragrup o o Error

N-t

Total

N-1

[editar]Ejemplos