Vous êtes sur la page 1sur 19

Universidad de Oriente

Ncleo de Anzotegui
Extensin centro Sur
Anaco. Edo. Anzotegui
Escuela de ingeniera
Departamento de Sistemas

PRUEBAS NO PARAMETRICAS Y ANALISIS DE SERIES DE TIEMPO

Asesor: Bachilleres:
Ing. Jess Campos Nathaly Barboza C.I.: 21.041.651
Edgar Requena
Angel Heriquez
Edwuar Maicario

Anaco, 18 de febrero del 2017


NDICE

Pg.
Pruebas no paramtricas .3
a) Prueba de signos .3
b) Pruebas de wilcoxon .5
c) Prueba U de Mann- Whitney ..7
Anlisis de series de tiempo .9
a) Promedio mvil ...9
b) Suavizacin exponencial .11
c) Regresin lineal ..13
Referencias Bibliografas .16
LAS PRUEBAS NO PARAMTRICAS
Una prueba no paramtrica es una prueba de hiptesis que no requiere que la
distribucin de la poblacin se caracterice en funcin de determinados parmetros. Por
ejemplo, numerosas hiptesis se basan en el supuesto de que la poblacin sigue una
distribucin normal con los parmetros y . Las pruebas no paramtricas no tienen este
supuesto, de modo que son tiles cuando sus datos sean firmemente no normales y
resistentes a transformaciones. Por esta razn es comn referirse a ellas como pruebas de
distribucin libre. En el artculo se describen y trabajan las pruebas no paramtricas, y se
resaltan su fundamento y las indicaciones para su empleo cuando se trata de una sola
muestra (prueba de signo), de dos muestras con datos independientes (U de Mann-
Whitney), de dos muestras con datos relacionados (T de Wilcoxon).

Las pruebas no paramtricas renen las siguientes caractersticas:

son ms fciles de aplicar;


son aplicables a los datos jerarquizados;
se pueden usar cuando dos series de observaciones provienen de distintas
poblaciones;
son la nica alternativa cuando el tamao de muestra es pequeo
son tiles a un nivel de significancia previamente especificado.

Prueba de los Signos

Se usa para hacer pruebas de hiptesis acerca de la mediana de una poblacin de una
variable continua.

Ho: La Mediana poblacional es igual a un valor dado.

Ha: La mediana es menor (mayor distinta) del valor dado.

La prueba estadstica est basada en la distribucin Binomial con probabilidad de


xito p=, puesto que la probabilidad de que un dato sea mayor o menor que la mediana es
. Para calcularla se determinan las diferencias de los datos con respecto al valor dado de
la mediana y se cuentan los signos positivos y negativos. Permite contrastar la hiptesis de
igualdad entre dos medianas poblacionales.
Cuando la hiptesis alterna es "mayor que" y el nmero de diferencias positivas es
mayor que las diferencias negativas entonces, el "p-value" se calcula por:

Donde c es el nmero de diferencias positivas y, n es igual al nmero de datos pero, si


hay datos de valor igual a la mediana que se asume en la hiptesis nula entonces, n es igual
al nmero de datos menos la cantidad de datos iguales a la mediana asumida, cuando el
nmero de diferencias positivas es menor que el nmero de diferencias negativas entonces
el "p-value" es igual a

Si la hiptesis alterna es "menor que" y el nmero de diferencias positivas es mayor


que el nmero de diferencias negativas entonces p-value = P 2 en caso contrario p-value
= P1. Cuando la hiptesis alterna es de dos lados y el nmero de diferencias positivas son
mayores que el nmero de diferencias negativas entonces el p-value = 2P 2, si hay menor
nmero de diferencias positivas entonces p-value=2P1 y si hay igual nmero de
diferencias positivas y negativas entonces, p-value=1.

Si n>20 se puede usar aproximacin Normal a una Binomial con p = q = 0.5, para
calcular los p-values. Es decir:

Prueba De Wilcoxon.
Es una prueba no paramtrica que sirve para comparar una misma poblacin antes y
despus de un estudio, para conocer si existen diferencias entre ambas. (2 muestras
relacionadas)
Permite contrastar la hiptesis de igualdad entre dos medianas poblacionales.
Paralela a la prueba paramtrica de contraste t para muestras relacionadas.
HO (hiptesis nula) afirma el estudio.
HA (hiptesis alternativa) contradice a la hiptesis nula
Ejercicio
Se desea saber si el nuevo mtodo de capacitacin con libros mejoro las habilidades
de los estudiantes en dicha materia ,para lo cual se observa el nivel de habilidades antes del
mtodo y despus del mtodo en una muestra de 22 estudiantes y se les califico sus
habilidades antes y despus del mtodo ,obteniendo los siguientes resultados:

rangos
Numero de puntaje Diferenci Diferencia con
Estudiante Antes (a). a absoluta rangos signos
s Despus (b) (b-a) ordenadas correcto
s
1 18 15 -3 2 1 1
2 60 70 10 3 2
-2
3 81 75 -6 4 3
-3
4 15 20 5 5 4
4.5
5 20 50 30 5 5
4.5
6 17 40 23 6 6
-6
7 26 50 24 8 7
-7.5
8 11 30 19 8 8
7.5
9 20 40 20 9 9
9
10 38 30 -8 10 10
10.5
11 80 85 5 10 11
10.5
12 59 86 27 11 12
12
13 12 72 60 19 13
13
14 87 98 11 20 14
15
15 88 79 -9 20 15
15
16 64 88 24 20 16
15
17 88 90 2 23 17
17
18 76 96 20 24 18
17.5
19 43 39 -4 24 19
17.5
20 90 98 8 27 20
20
21 40 60 20 30 21
21
22 50 60 10 60 22
22
Suma de rango
Positivos=-27.5
Negativos=223.
5

HO: no hay diferencia significativa debido al tratamiento


HA: hay diferencia significativa por el tratamiento
La columna de rangos con signos correctos se determin mediante el promedio de
rangos, si la diferencia absoluta se repite y los rangos con signos correctos preservan el
signo de la diferencia que le dio origen.
Para el rango 4 y 5 se promedi (4+5)/2 =4.5 y como el rango 4 corresponde a una
diferencia 5 positiva entonces se le asigna 4.5 positivo, lo mismo para el rango 5.en el caso
de los rangos 7 y 8, el promedio es 7.5 y como la diferencia de 8 corresponde a un valor
negativo y otro positivo, entonces se le asigna un rango con signo -7.5 y 7.5.

El estadstico de prueba en este caso es T=27.5 y el valor que deja un rea de 0.01
para 22 grados de libertad para una prueba de dos colas es igual a 48 adems si se aceptara
HO entonces ambas categoras (antes y despus)deberan tener una suma de rangos igual a
(27.5+223.5)/2=125.5.
Se rechaza HO se acepta HO
0 T=27.48 125.5

Por lo que se rechaza la HO y por lo tanto podemos concluir que a un nivel de


significancia de 0.01.el mtodo de capacitacin en libros mejoro las habilidades de los
estudiantes.
Prueba U DE MANN-WHITNEY
Es equivalente a la prueba de suma de rangos de Wilcoxon y a la prueba de dos
grupos de Kruskal-Wallis. Es la alternativa no paramtrica a la comparacin de dos
promedios independientes a travs de la T de Student. la versin no paramtrica de la
habitual prueba t de Student.

Ejemplo aplicable porque son:


Se utiliza cuando hay dos conjuntos aleatorios o dos muestras independientes .la
prueba tiene como funcin determinar si las dos muestras presentan los mismos promedios
poblacionales o no.
Muestra pequea
Se utiliza en muestras menores que 20(<20)
Ejercicio
En una universidad se est haciendo una prueba de aptitud mental ,se desea saber si la
aptitud mental de los hombres es la misma que de las mujeres o son distintas .para ello se
extrae una muestra de 5 mujeres y 9 hombres y se les califico en puntos el nivel de aptitud,
variando este ltimo en un rango de 400 a 1500 puntos y a cada puntacin se le asigna un
rango del 1 al 14 (rango 1=mayor puntuacin y rango 14=menor puntuacin todo sobre los
14 elementos de toda la muestra),obtenindose los siguientes resultados
Puntuaciones y rangos de mujeres y hombres en la prueba de aptitud mental
Mujeres Hombres
Puntuacin rango Puntuacin rango

1300 2
1200 3 1500 1
1400 5 700 13
1350 10 600* 10.5
800 4 1100 8
780 8 600* 10.5
total 30 1320 5
1150 7
600 14

Se calculan los estadsticos U total 71 Y U, de la siguiente manera:


N 1 ( N 1+1 )
U=N1.N2+ 2 - rangos 2

Que en este caso es igual a:


U= (5) (9)+5(6)/2 -30=40 y U= (5) (9)+9(10)/2 -71=19

La decisin es rechazar HO si el estadstico U es menor a / 2 , donde:

HO: U1-U2
HA: U1U2
Con un nivel de significancia de =0.05 se busca en la tabla de mann-whitney, se tiene

que el valor es 7, por lo que como u>7 entonces se acepta la hiptesis nula, de que no hay
diferencia en las aptitudes
Muestra grande
Se utiliza cuando la muestra es mayor a 20(>20), se aplica la prueba Z, en donde el
estadstico de prueba es
n 1++n 2+ 1/3
Z=R1-R2-[(n1-n2) n1+n2+1/2*] / n 1+n 2[]

Ejercicio N-1
En una escuela de msica se est haciendo una prueba de aptitud bucal, se desea
saber si la aptitud bucal de los hombres es la misma que de las mujeres o son distintas, para
ello se extrae una muestra de 25 mujeres y 15 hombres y que las calificaciones de ambos
grupos por rango son:

Rango para los hombres Rango para mujeres

26 6 38 7 33 39 16 19
10 14 24 20 1 2 37 29
30 17 40 27 9 5 23 31
3 22 25 28 13 36 15 18
32 34 12 4 21 8 11 35
total Rangos1 =487 Total= Rangos 2 =333
Se prueban las hiptesis
HO: u1-u2
HA: u1u2
Con un nivel de significancia de 0.05
R1=487 y R2=333, n1=25, n2=15
Por lo que Z estadstico es igual a: Z=-0.71
Se busca en la tabla normal 0.025 a la izquierda y 0.025 a la derecha es -1.96 y 1.96 y
como el estadstico cae entre estos dos valores, por lo tanto se acepta la hiptesis nula de lo
que no existe diferencia entre las aptitudes bucal de los hombres con el de las mujeres .

Anlisis de series de Tiempo


Una serie de tiempo es una serie de registros realizados en diversos periodos de
tiempo (das, semanas, meses, trimestres, aos).

Son un modo estructurado de representar datos. Visualmente, es una curva que


evoluciona a lo largo del tiempo. Por ejemplo, las ventas diarias de un producto pueden
representarse como una serie de tiempo. Vermorel J. (2012)

Una serie de tiempo es una secuencia de observaciones sobre intervalos de tiempo


separados de manera regular. Por ejemplo:

Las tasas mensuales de desempleo durante los cinco aos previos


La produccin diaria en una planta de manufactura durante un mes
La poblacin dcada por dcada de un estado en el siglo anterior

Componentes de una serie de tiempo

a) Tendencia: La tendencia a largo plazo de una serie de aumentar o disminuir


(tendencia creciente o tendencia decreciente).
b) Estacionalidad: La fluctuacin peridica en las series de tiempo dentro de un
perodo determinado. Estas fluctuaciones forman un patrn que tiende a repetirse de
un perodo estacional al siguiente.
c) Ciclos: Largas desviaciones de la tendencia debido a factores diferentes de la
estacionalidad. Los ciclos por lo general se producen durante un intervalo de tiempo
extenso, y los tiempos que transcurren entre los picos o valles sucesivos de un ciclo
no necesariamente son iguales.
d) Movimiento irregular: El movimiento que queda despus de explicar los
movimientos de tendencia, estacionales y cclicos; ruido aleatorio o error en una serie
de tiempo.

Mtodos de Suavizamiento de la Serie


La seleccin del mtodo de anlisis debe basarse en si los patrones son estticos
(constantes en el tiempo) o dinmicos (cambian en el tiempo), la naturaleza de los
componentes de tendencia y estacionales y hasta qu punto en el futuro desea pronosticar.

Promedio mvil

Suaviza los datos al promediar las observaciones consecutivas en una serie. Puede
utilizar este procedimiento cuando los datos no tienen un componente de tendencia. Si tiene
un componente estacional, establezca la longitud del promedio mvil para que sea igual a la
longitud del ciclo estacional.

Pronsticos:

Longitud: corta

Perfil: lnea plana

Un promedio mvil se utiliza cuando se quiere dar ms importancia a conjunto de


datos para obtener la previsin. Se construye sustituyendo cada valor de una serie por la
media obtenida con esa observacin y algunos de los valores inmediatamente anteriores y
posteriores. Se considerar el promedio mvil a partir de las tres observaciones ms
recientes. En este caso se utilizar la siguiente ecuacin:

Ecuacin general se expresa as:

xt 1
^x t= t n1
n

^x t = Promedio mvil de ventas en unidades en el periodo t


t = Sumatoria n veces de datos t

x t1 = ventas reales en unidades de los periodos anteriores t

n = nmeros de datos

El valor ajustado en el tiempo t es el promedio mvil no centrado en el tiempo t -1.


Los pronsticos son los valores ajustados en el origen del pronstico. Si usted pronostica 10
unidades de tiempo adelante, el valor pronosticado para cada tiempo ser el valor ajustado
en el origen.

Unas desventajas del promedio mvil que lo hacen poco atractivo como tcnica de
pronstico son:

1. Que todos los datos de una muestra se le dan peros iguales en vez de darle ms
peso a los datos ms recientes.

2. Solamente parte de los datos pasados se utilizan para hacer el pronstico.

Ejemplo N1: Si consideramos los siguientes datos que representan las ventas
minoristas mensuales de calzados en una zapatera durante diez aos consecutivos:

Ventas
Aos
(miles de Bs.F)
1996 328
1997 337
1998 341
1999 367
2000 385
2001 403
2002 389
2003 376
2004 428
2005 305
Para calcular el pronstico de ventas para el ao 2006, empleando el mtodo de promedio
mvil con n=3. Se toman el valor de las ventas de los ltimos tres aos y el valor de n o la
cantidad en la cual podremos pronosticar es n = 3

(376 +428+305)
^x t= =369,67
3

Es decir que mi tabla queda as:

Ventas
Aos
(miles de Bs.F)
1996 328
1997 337
1998 341
1999 367
2000 385
2001 403
2002 389
2003 376
2004 428
2005 305
2006 369,67

Ejemplo N2: El acueducto municipal de una ciudad surte el vital lquido a todos los
habitantes de dicha localidad y reas aledaas. La tabla refleja el nmero de acres-pie de
agua consumida en las cuatro estaciones de los tres aos anteriores.

Estacin Ao 1 Ao 2 Ao 3
Invierno 25 27 24
Primavera 47 46 49
Verano 68 72 70
Otoo 42 39 44

Determine los factores estacionales de las cuatro estaciones. Incluido el efecto


estacional, pronostique el consumo de agua para el prximo invierno, utilizando el mtodo
de promedio mvil con cuatro estaciones.

( 25+27+24 ) ( 47+ 46+49)


^x t= =25,333 ^x t= =47,333
3 3
(68+ 72+ 70) (42+39+ 44)
^x t= =70 ^x t= =41,67
3 3

Valores
Estacin Ao 1 Ao 2 Ao 3 Promedios F.E.
ajustados
Invierno 25 27 24 25,333 0,55 49,1
Primavera 47 46 49 47,333 1,03 44,7
Verano 68 72 70 70 1,5 47,37
Otoo 42 39 44 41,67 0.90 43,333
= 182 184 187 184,336 4
x = 45,5 46 46,75 46,084

Factores estacionales se calculan:


x^ t 25,333 47,333
F.E (invierno) = x = 46,084 = 0,55 F.E (primavera) = 46,084

= 1,03
70 41,67
F.E (verano) = 46,084 = 1,52 F.E (otoo) = 46,084 = 0,90

Valores ajustados
27 46
Invierno = 0,55 = 49,1 primavera = 1,03 = 44,7

72 39
Verano = 1,52 = 47, 37 Otoo = 0,90 = 43,333

Factores estacionarios con Promedio mvil


( 49,1+44,7 +47,37+ 43,333 )
^x invierno= =46,13
4

Por lo que se pronostic que para el prximo invierno el consumo de agua en el


acueducto municipal de una ciudad que surte a dicha localidad y reas aledaas, sera de
25,333 aproximadamente e incluyendo el efecto estacional se obtuvo un pronstico de
46,13 para el prximo invierno

Suavizacin exponencial
El mtodo de suavizacin o suavizamiento exponencial puede considerarse como una
evolucin del mtodo de promedio mvil ponderado, en ste caso se calcula el promedio de
una serie de tiempo con un mecanismo de autocorreccin que busca ajustar los pronsticos
en direccin opuesta a las desviaciones del pasado mediante una correccin que se ve
afectada por un coeficiente de suavizacin. (B. Salazar, 2016):

El pronstico de suavizacin exponencial simple es ptimo para patrones de


demanda aleatorios o nivelados donde se pretende eliminar el impacto de los
elementos irregulares histricos mediante un enfoque en perodos de demanda
reciente, este posee una ventaja sobre el modelo de promedio mvil ponderado
ya que no requiere de una gran cantidad de perodos y de ponderaciones para
lograr ptimos resultados. (B. Salazar, 2016)

Tanto para suavizar como para realizar pronsticos. Se emplea la siguiente frmula:

Donde:

Ejemplo N1

El comit de cultura de la Universidad de Oriente Ncleo Anzotegui, extensin


regin centro sur, est organizando un evento cultural donde le permitirn a los estudiantes
explotar sus talentos, para ello desea predecir el nmero de personas que asistirn en el ao
2017 mediante el mtodo de suavizacin exponencial (=0,10), el pronstico para el ao
2012 fue de 175. En la siguiente tabla se muestran los valores reales.

Ao Real
2012 180
Ft = F t 1 + (A t 1 F t 1)
2013 168

2014 159

2015 175

2016 190
2017 Valor a calcular

Ao Real Pronostico Ft ( = 0,10)


2012 180 175
2013 168 175 + 0,10 (180 175) = 175,5
2014 159 175,5 + 0,10 (168 175,5) = 174,75
2015 175 174,75 + 0,10 (159 174,75) = 173,18
2016 190 173,18 + 0,10 (175 173,18) = 173,36
2017 --- 173,36 + 0,10(190 173,36) = 175,02

Regresin lineal
La forma ms simple del modelo de regresin supone una tendencia lineal con el
tiempo. Si Y representa el valor estimado de la variable en el tiempo X, el modelo de
regresin est dado por:

Las constantes a y b se determinan a partir de los datos primarios con base en el mtodo de
mnimos cuadrados, como sigue. Sean (Yi, Xi) los datos primarios, donde Yi es la demanda
real en el tiempo Xi = 1,2,, n. Definimos:
Se puede probar tambin cun bien se ajusta Y a los datos primarios calculando el
coeficiente de correlacin (r), empleando la frmula:

Donde -1 r 1. Un juste lineal perfecto ocurre cuando r = 1. En general, entre ms cerca


est el valor de |r| a 1, mejor es el ajuste lineal. Por otra parte, r = 0 significa que es
probable que Y y X sean independientes. Sin embargo, es importante resaltar que r = 0 es
una condicin necesaria, pero no suficiente para la independencia, en el sentido de que dos
variables dependientes pueden tener r = 0.

Ejemplo N.1, La tabla siguiente contiene los resultados de las calificaciones Matemticas
(X) y Lengua (Y) de un grupo de 40 alumnos de secundaria. Determinar:

a Recta regresin de Y sobre X


b Recta de regresin X sobre Y
c Calcule e interprete el coeficiente de correlacin lineal

TABLA DE CLCULOS:
Respuesta a:


Para calcular la recta de regresin se aplicara la siguiente formula a = Y b X

Se calcula el promedio de X y Y:

214
x = = 5,35
40

238
Y = = 5,95
40

Se calcula el valor de b mediante la siguiente frmula:

0,7115

Para culminar se calcula el valor de la recta con la formula inicial de la siguiente


manera:


a = Y b X = 5,95 0,7115* 5,35 = 2,1436
Entonces la ecuacin de la recta queda expresada de la siguiente manera

Y = 2,1436 + 0,7115X

Respuesta b:

Para calcular la recta de regresin Y sobre X se aplicara la siguiente formula a` =

Y b X

Se calcula el promedio de X y Y:

214
x = = 5,35
40

238
Y = = 5,95
40

Se calcula el valor de b mediante la siguiente frmula:

0,9633

Para culminar se calcula el valor de la recta con la formula de la siguiente manera:

a= X b Y = 5,35 0,9633* 5,95 = - 0,3815

Entonces la ecuacin de la recta queda expresada de la siguiente manera

X` = -0,3815 + 0,9633Y

Respuesta C

La correlacin de Pearson se calcula de la siguiente manera:

r= bb = 0,71150.9633=0,8279
Puede deducir que existe una relacin entre las calificaciones de Matemtica y
Lengua, dicha relacin es positiva directa, es decir, alumnos con buenas calificaciones de
Matemtica corresponden con las buenas calificaciones de Lengua y a la inversa, a su vez
las rectas obtenidas son buenas rectas de ajuste, es decir expresan con una elevada
precisin la relacin matemtica lineal existente entre las calificaciones de las dos
asignaturas antes mencionadas.

BIBLIOGRAFA
Referencias electrnicas:
Por: Copyright (2016): pruebas no paramtricas, disponible en:
http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-and-
graphs/hypothesis-tests/nonparametrics-tests/understanding-nonparametric-tests/[2017,
febrero 25]
Por Vermorel J. (2012), Anlisis de series de tiempo, disponible en:
https://www.lokad.com/es/que-es-el-pronostico-de-series-de-tiempo [2017, febrero 25]
Minitab Inc. (2016), Serie de tiempo, disponible en:http://support.minitab.com/es-
mx/minitab/17/topic-library/modeling-statistics/time-series/basics/what-is-a-time-series/
[2017, febrero 25]
Gua de Terica. Asignatura: Estadstica. II- anlisis de series de tiempo, Ing. Campos J.,
ejemplo N1. Promedio Mvil, Pag-4. Disponible en: https://profjcampos.wordpress.com/
[2017, febrero 25]
Gua de ejercicios. Asignatura: Estadstica. II- anlisis de series de tiempo, Ing. Campos J.,
ejemplo N2. Promedio Mvil, Pag-2. Disponible en: https://profjcampos.wordpress.com/
[2017, febrero 25]
Por: Salazar B. (2010), suavizacin exponencial, Disponible en:
www.ingenieriaindustrialonline.com) [2017, febrero 25]

Por: ngel (2009), regresin lineal (documento en lnea) disponible en:


www.angelfire.com/ak6/ilb/5_2.pdf [2017, febrero 25]