Vous êtes sur la page 1sur 24

ANALISIS NO PARAMETRICO DE REGRESION

Karol Mgica de la Lanza G.

La teora clsica de la regresin se basa, en gran parte, en el supuesto que las observaciones son independientes y se encuentran idntica y normalmente distribuidas. Existen muchos fenmenos del mundo real que pueden modelarse de esta manera, para el tratamiento de ciertos problemas, la normalidad de los datos es insostenible.

En el intento de eliminar esa restriccin se disearon mtodos que hacen un nmero mnimo de supuestos sobre los modelos que describen las observaciones.

La teora de los mtodos no paramtricos trata, esencialmente, el desarrollo de procedimientos de inferencia estadstica, que no realizan una suposicin explcita con respecto a la forma funcional de la distribucin de probabilidad de las observaciones de la muestra.

La regresin no paramtrica es una coleccin de tcnicas para el ajuste de funciones de regresin cuando existe poco conocimiento a priori acerca de su forma. Proporciona funciones suavizadas de la relacin y el procedimiento se denomina suavizado.

Regresin no paramtrica En los anlisis paramtricos se comienza haciendo supuestos rgidos sobre la estructura bsica de los datos, luego se estiman de la forma ms eficiente posible los parmetros que definen la estructura y por ltimo se comprueba si los supuestos iniciales se cumplen.

no paramtrica, en cambio, desarrolla un modelo libre para predecir la respuesta sobre el rango de valores de los datos. Constituida por mtodos que proporcionan una estimacin suavizada de la relacin para un conjunto de valores (denominado ventana) de la variable explicativa.

Estos valores son ponderados de modo que, por ejemplo, los vecinos ms cercanos tengan mayor peso que los ms alejados dentro de una ventana de datos.

Importante por dos motivos: En etapas preliminares del anlisis de datos o en pruebas de diagnstico se utilizan grficos de dispersin en los cuales puede ser muy til ajustar una curva suavizada.

Forma la base a partir de la cual se extienden los conceptos para regresin no paramtrica mltiple. El anlisis de regresin considera que una variable respuesta Y es funcin de un conjunto de variables explicativas X1, X2,,Xp. En general, se asume que la relacin entre las variables es de tipo lineal y g(.) es una funcin que depende de parmetros (j)

ESTIMADORES
De pendiente y la ordenana al origen Alternativas para estimadores de minimos cuadrados.

Estimador de la pendiente de Theil


Obtener la estimacion de un punto del coeficiente de la pendiente. Datos del modelo clsico de regresin: i = + x1 + e i`
Xi= constantes conocidas

y = parametros conocidos i = valor observado de la variable aleatoria continua Y en xi

Para cada valor de x i se supone una subpoblacin de Y valores y las e i son mutuamente independientes. Las x i son todas distintas y se tiene que x1< x2<x3. Los datos se componen de n pares de observaciones de la muestra (x1,y1) (x2, y2)

Donde i esimo par representa las mediciones tomadas de la i-esima unidad de asociacin. Para obtener el estimador de Theil para primero se forman todas las pendientes posibles de la muestra Sij donde i<j Habra N= nC2 valores de S ij

El estimador de se designa es la mediana de los valores S ij = mediana de S ij

testosterona

230

175

315

290

275

150

360

425

Ac citrico

421

278

618

482

465

105

550

750

Los N= 8 c 2 = 28 valores ordenados de S ij

-.6618 .1445 .1838 .2532 .2614

.5037 .5263 .5297 .5348 .5637

.3216 .325 .3472 .3714 .3846 .4118 .4264 .4315 .4719

.5927 .6801 .8333 .8824 .9836 1.0 1.0078 1.0227 1.0294

Se designa i=1 y j=2 como los indicadores del primero y segundo valor de Y y X . Esposible calcular S 12 : S 12= (175-230) / (278-421)= -.3846 Cuando todas las pendientes se calculan en forma similar y se clasifican, -.3846 acaba como el dcimo valor en el arreglo ordenado.

La mediana de los valores S ij es 4878. En consecuencia, la estimacion del coeficiente de la pendiente de poblacin es = .4878

Estimador del coeficiente de la ordenada al origen


Dietz, recomienda 2 estimadores : , 1 M es la mediana de los N terminos Yi xi en donde es el estimador de Theil. Esto se recomienda cuando el investigador no se inclina a suponer que los terminos del error se distribuyen de forma simetrica alrededor de 0.

Si se inclina a suponer que los terminos de error se distribuyen en forma simetrica de los terminos de erros , Dietz recimienda 2M el cual es la mediana de los promedios por pares n(n+1)/2 de los terminos y Yi- xi.

Ejemplo
Los trminos ordenados son Yi -.4878 xi son 13.5396, 24.6362, 39.3916, 48.1730, 54.8804, 59.1500, 91.7100, 98.7810, la mediana 51.5267 es el estimador 1M

La mediana de estos promedios, 53.1432 es el estimador 2M. La ecuacion de estimacin entonces es yi=53.1432 +0.4878 x1, si se cree que la distribucin de los trminos de error es simtrica respecto a 0. si no existe la sospecha de simetra, la ecuacin de estimacin es yi= 51.5267 +.4878xi.

Vous aimerez peut-être aussi