Vous êtes sur la page 1sur 28

21/09/2013

SIMULAO DE SISTEMAS
AULA 4 COLETA E TRATAMENTO
DE DADOS DE ENTRADA
DOS MODELOS DE FILAS
Autor: Anibal Tavares de Azevedo

COLETA E TRATAMENTO DE DADOS


Os exerccios esto disponveis nos links dados abaixo:
Problema

Descrio

LINK

Lab 4 Exerccio 1

https://docs.google.com/spreadsheet/ccc?key=0Aoz
UGKjaO9uEdElYbzgtc3lIeHpOR0RBT2pJNjNFbUE&usp
=sharing

Lab 4 Exerccio 2

https://docs.google.com/spreadsheet/ccc?key=0Aoz
UGKjaO9uEdDhiTkt5U3J4Z2xzRDUwamZ4YXNCQVE&
usp=sharing

Lab 4 Exerccio 3

https://docs.google.com/spreadsheet/ccc?key=0Aoz
UGKjaO9uEdFFBenlKU3NVUnBjYVE2ampScGtlckE&u
sp=sharing

Lab 4 Exerccio 4

https://docs.google.com/spreadsheet/ccc?key=0Aoz
UGKjaO9uEdFNPMGpLZXZuMTk2d2dfR2dxSzhGaEE
&usp=sharing

21/09/2013

COLETA E TRATAMENTO DE DADOS


Os exerccios esto disponveis nos links dados abaixo:
Problema

Descrio

LINK

Lab 4 Exerccio 5

https://docs.google.com/spreadsheet/ccc?key=0Aoz
UGKjaO9uEdFEzcUpfQVdISG94NHluZWZYR2tRVUE&
usp=sharing

COLETA E TRATAMENTO DE DADOS


Aula preparada a partir do Captulo 2 - Modelagem dos Dados de
Entrada - do seguinte livro:

http://www.livrosimulacao.eng.br/

21/09/2013

COLETA E TRATAMENTO DE DADOS


Em um modelo de filas, os tempos de espera em fila ou no sistema
(fila + servio) so parmetros de desempenho do sistema.

Tempo em fila

Supermercado

Tempo Servio

Estes valores dependem dos fenmenos aleatrios do intervalo de


tempo entre as chegadas e do tempo de atendimento.

e
Intervalo entre
as chegadas

Tempo de
atendimento

COLETA E TRATAMENTO DE DADOS


Antes de realizar a coleta de dados necessrio definir o perodo
no qual a mesma dever ser realizada, isto , o perodo mais
crtico do sistema.

12:00

18:00

20:00
Horrio Crtico

21/09/2013

COLETA E TRATAMENTO DE DADOS


A coleta de dados visa formar uma amostra da populao. Trs
cuidados devem ser observados na obteno de uma amostra.

Populao
Amostra

(1) O tamanho da amostra deve estar entre 100 e 200


observaes. Amostras com menos de 100 observaes
podem comprometer a identificao do modelo
probabilstico e acima de 200 no trazem ganhos
significativos.
(2) Coletar e anotar as observaes na mesma ordem em
que o fenmeno ocorre de modo a permitir anlise de
correlao.
(3) Se existir suspeita de que os dados mudam em funo
do dia da coleta, ento, a mesma deve ser refeita em
outros dias.

COLETA E TRATAMENTO DE DADOS


Exemplo 1: Coleta de dados de chegadas
Tempo de ocorrncia de cada uma das chegadas (100 primeiros valores)
00:00:11 00:00:59 00:01:59 00:02:52 00:03:31 00:04:40 00:06:01 00:07:23 00:08:08 00:09:06
00:00:12 00:01:18 00:02:01 00:02:57 00:03:49 00:04:43 00:06:28 00:07:27 00:08:15 00:09:06
00:00:17 00:01:20 00:02:10 00:03:08 00:04:01 00:04:49 00:06:29 00:07:27 00:08:17 00:09:06
00:00:19 00:01:30 00:02:22 00:03:08 00:04:03 00:04:52 00:06:30 00:07:44 00:08:24 00:09:09
00:00:20 00:01:30 00:02:27 00:03:13 00:04:03 00:05:10 00:06:36 00:07:48 00:08:41 00:09:09
00:00:28 00:01:36 00:02:32 00:03:14 00:04:15 00:05:12 00:06:38 00:07:48 00:08:54 00:09:16
00:00:35 00:01:40 00:02:35 00:03:16 00:04:20 00:05:26 00:06:39 00:07:51 00:08:59 00:09:25
00:00:37 00:01:42 00:02:37 00:03:19 00:04:22 00:05:39 00:07:07 00:07:52 00:09:00 00:09:30
00:00:52 00:01:45 00:02:38 00:03:28 00:04:31 00:05:45 00:07:15 00:08:01 00:09:01 00:21:38
00:00:53 00:01:51 00:02:43 00:03:31 00:04:38 00:05:48 00:07:20 00:08:05 00:09:04 00:21:42

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 1: Coleta de dados de chegadas
Tempo de ocorrncia de cada uma das chegadas (100 ltimos valores)
00:21:51 00:23:38 00:25:26 00:26:27 00:27:46 00:29:25 00:30:48 00:32:02 00:32:35 00:33:51
00:21:58 00:23:58 00:25:30 00:26:55 00:28:06 00:29:37 00:30:58 00:32:06 00:32:38 00:33:53
00:22:09 00:24:02 00:25:38 00:26:56 00:28:09 00:29:39 00:31:04 00:32:07 00:32:50 00:34:05
00:22:09 00:24:05 00:25:50 00:26:57 00:28:21 00:29:42 00:31:13 00:32:11 00:32:59 00:34:09
00:22:31 00:24:32 00:25:54 00:27:12 00:28:28 00:29:45 00:31:31 00:32:14 00:33:01 00:34:17
00:22:43 00:24:40 00:26:03 00:27:22 00:28:31 00:29:48 00:31:36 00:32:19 00:33:21 00:34:20
00:22:50 00:24:56 00:26:07 00:27:27 00:28:43 00:29:49 00:31:38 00:32:27 00:33:29 00:34:31
00:22:50 00:25:03 00:26:08 00:27:30 00:29:07 00:29:55 00:31:56 00:32:31 00:33:42 00:34:36
00:23:09 00:25:22 00:26:18 00:27:39 00:29:13 00:29:56 00:32:01 00:32:34 00:33:46 00:34:39
00:23:19 00:25:25 00:26:26 00:27:42 00:29:24 00:30:39 00:32:01 00:32:34 00:33:50 00:34:47

COLETA E TRATAMENTO DE DADOS


Obtendo intervalo de tempo entre as chegadas
1

21/09/2013

COLETA E TRATAMENTO DE DADOS


Obtendo intervalo de tempo entre as chegadas

COLETA E TRATAMENTO DE DADOS


Obtendo intervalo de tempo entre as chegadas
Nmero de segundos em 24 horas

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 1: Coleta de dados de chegadas
Tempo entre as chegadas (100 primeiros valores)
11

13

19

18

27

11

12

10

12

17

18

17

12

13

14

13

28

15

728

COLETA E TRATAMENTO DE DADOS


Exemplo 1: Coleta de dados de chegadas
Tempo entre as chegadas (100 ltimos valores)
9

19

20

28

20

12

10

11

12

12

12

12

22

27

15

18

12

10

20

16

12

11

24

18

13

19

19

10

10

11

43

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 2: Estatsticas sobre os dados
Outlier
Max NO

Eliminar

Mediana

50%

Q3

75%

Q1

25%

Min NO

COLETA E TRATAMENTO DE DADOS


Exemplo 2: Estatsticas sobre os dados
Q1
1

=QUARTILE(D6:D205,1)

=median(D5:D204)

At 25% dos valores

At 50% dos valores

Mediana
3

=QUARTILE(D6:D205,3)

At 75% dos valores

Q3

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 2: Estatsticas sobre os dados
Min NO
1

=small(D6:D205;COUNTIF(D6:D205;"<"& H13 )+1)

Achar o 1 menor
valor no outlier

=large(D6:D205;COUNTIF(D6:D205;">"& H15 )+1)

Achar o 1 maior valor


no outlier

Max NO

COLETA E TRATAMENTO DE DADOS


Exemplo 2: Estatsticas sobre os dados
Lim inf
2

=H8-1.5*H14

Limite inferior a partir do


qual ocorrem outliers

Q3-Q1

H10

H8

=H10+1.5*H14

Amplitude Inter-quartil

Limite superior a partir do


qual ocorrem outliers

Lim sup

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 2: Estatsticas sobre os dados

2
1
3

COLETA E TRATAMENTO DE DADOS


Exemplo 2: Estatsticas sobre os dados
Outlier
Lim Sup = Q3 + 1,5(Q3-Q1)
Max NO

Q3
Q1

Min NO

Lim inf = Q1 - 1,5(Q3-Q1)

10

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 2: Estatsticas sobre os dados

=average(D6:D205)

Achar a mdia dos


valores com outliers

=var(D6:D205)

Achar varincia dos


valores com outliers

COLETA E TRATAMENTO DE DADOS


Exemplo 3: Eliminando os outliers
1
2

11

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 3: Eliminando os outliers
No devem ser considerados
no clculo da mdia nem para
encontrar a funo de
distribuio de probabilidade !

Identificando
outliers: 728

Sem outlier !

...

Com outlier !

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao
Removido os outliers importante verificar se a amostra
representa uma sequncia de valores independentes e
identicamente distribudos (i.i.d), isto , se no existe correlao
entre os valores. Esta verificao importante para se poder
aplicar os dados no modelos tericos.
Modelo de Fila M/M/1/GD/
/
:
Este modelo supe:

Natureza do processo de chegada. Ex.: M variveis


aleatrias iid como funo de distribuio exponencial.

Natureza do processo de servio. Ex.: M variveis


aleatrias iid como funo de distribuio exponencial.

12

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao
A hiptese de independncia no vlida em situaes em que
existe uma curva de aprendizado. Por exemplo, os tempos de
atendimento de um caixa de supermercado em treinamento iro,
em princpio, apresentar um decrscimo ao longo do tempo at
atingir uma estabilidade em torno de uma funo de distribuio.

Servio = 30s

Servio = 5s

Servio = 1s

Dia 1

Dia 5

Dia 10

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao

13

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao
Com outlier
Sem outlier

1
4
3

Eliminar o valor 728 !

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao
1
3

14

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao

O diagrama de disperso (scatter plot) permite a visualizao


de que no existe correlao dos dados.

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao

Dados com
correlao
linear !

15

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao
possvel, ainda, empregar testes estatsticos para verificar a
correlao dos dados. Mas, neste caso, necessrio saber, a
priori, a funo de distribuio com a qual se quer comparar
os dados como, por exemplo, exponencial, normal, etc.
Esperana ou mdia
de X*Y

X ,Y =

Esperana ou mdia
de Y

E ( XY ) E ( X ) E (Y )
E ( X 2 ) E 2 ( X ) E (Y 2 ) E 2 (Y )
Quadrado da mdia de X
Medida de correlao linear

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao

0.75

X ,Y =

E ( XY ) E ( X ) E (Y )
E ( X ) E 2 ( X ) E (Y 2 ) E 2 (Y )
2

16

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 4: Anlise de correlao
Uma alternativa uso de testes no-paramtricos que, em
geral, no so conclusivos !!

COLETA E TRATAMENTO DE DADOS


Exemplo 5: Inferncia
Para determinar a funo de distribuio associada aos dados
necessrio construir um histograma. Para tanto,
necessrio determinar o nmero de classes. Uma forma a
raiz quadrada do nmero de observaes ou regra de Sturges:
Nmero de classes

Nmero de dados

K = 1+ 3,3 log10 n
O tamanho h de cada classe dado por:
h=

amplitude da amostra
K

17

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 5: Inferncia
Para o caso particular existem 200 chegadas que geraram 199
intervalo de tempo. Desses 199 valores 1 foi considerado
outlier (valor 728) e eliminado, restando, portanto, 198
valores de intervalo de tempo. Assim:
Nmero de classes

Nmero de dados

K = 1 + 3,3 log10 198 = 1 + 3,3 * 2,30 = 8,6 9


O tamanho h de cada classe dado por:
Maior valor
sem outlier

h=

amplitude amostra SO 43
=
= 4,78
K
9

COLETA E TRATAMENTO DE DADOS


Exemplo 5: Inferncia
Classe 1: [0,0-4,8]
1

=if(E6<4.8;1;0)

Classe 3: [9,6-14,3]
2

=if(E6>=9.6;if(E6<14.3;1;0);0)

18

21/09/2013

COLETA E TRATAMENTO DE DADOS


Exemplo 5: Inferncia
1

=sum(H5:H204)

Total na classe 1

COLETA E TRATAMENTO DE DADOS


Intervalo de tempo [h]

Nmero de
Chegadas

[0,0 - 4,8)

96

[4,8 - 9,6)

55

[9,6 14,3)

25

[14,3 19,1)

13

[19,1 23,9)

[23,9 28,7)

[28,7 33,4)

[33,4 38,2)

>38,2

Mdia intervalo entre as chegadas sem


considerar o outlier = 6,83

19

21/09/2013

COLETA E TRATAMENTO DE DADOS


Bimodalidade indica
mltiplas influncias
no fenmeno analisado

COLETA E TRATAMENTO DE DADOS

Melhor trade-off entre


complexidade e R2:
Polinomio de grau 3: R2 = 0,746
Polinomio de grau 4: R2 = 0,791
Polinomio de grau 5: R2 = 0,792

20

21/09/2013

EXPLICAO SOBRE O SIGNIFICADO DE R2


A medida R2 serve para indicar, em percentagem, o
quanto a estimativa realizada pelo modelo proposto
( y i ) consegue explicar os dados observados (yi).
Assim, um valor de R2 = 0,8576 indica que 85,76% da
varivel dependente pode ser explicada pelo modelo.
Polinmio de grau 2

Polinmio de grau 4

R2 = 0,5935

R2 = 0,7925

EXPLICAO SOBRE O SIGNIFICADO DE R2


Sejam y i os valores estimados pelo modelo, yi os
valores observados que so associados a cada uma
das variveis independentes xi. O valor yi corresponde
mdia da observaes, isto , de yi. Trs somas
dos quadrados das diferenas podem ser calculadas,
tal como dado abaixo:
n

S tot = ( yi y ) 2

S esp = ( y i y ) 2

Quadrado da diferena entre


observado e a mdia

Quadrado da diferena entre


estimado e a mdia

i =1

i =1

S res = ( y i yi ) 2
i =1

Quadrado da diferena entre


observado e o esperado

Onde:

y=

y
i =1

21

21/09/2013

EXPLICAO SOBRE O SIGNIFICADO DE R2


Ilustrao grfica:

yi

Valores observados - yi

xi

EXPLICAO SOBRE O SIGNIFICADO DE R2


Ilustrao grfica:

yi
Valores estimados -

y i

Reta Modelo terico

xi

22

21/09/2013

EXPLICAO SOBRE O SIGNIFICADO DE R2


Ilustrao grfica:

yi

Mdia dos valores observados

Valor mdio - y

xi

EXPLICAO SOBRE O SIGNIFICADO DE R2


Ilustrao grfica:

yi

Valores observados - yi
Valores estimados -

y i

S res = ( y i yi ) 2
i =1

xi

23

21/09/2013

EXPLICAO SOBRE O SIGNIFICADO DE R2


Ilustrao grfica:

yi
Valores estimados -

y i
n

S esp = ( y i y ) 2
i =1

Valor mdio - y

xi

EXPLICAO SOBRE O SIGNIFICADO DE R2


Ilustrao grfica:

yi

Valores observados - yi

S tot = ( yi y ) 2
i =1

Valor mdio - y

xi

24

21/09/2013

EXPLICAO SOBRE O SIGNIFICADO DE R2


Ilustrao grfica:

yi

Valores observados - yi
Valores estimados -

y i

S res
S esp

S tot

Valor mdio - y

xi

EXPLICAO SOBRE O SIGNIFICADO DE R2


Dado que:

S tot = S esp + S res

R2 =

S esp
Stot

R2 mede o quanto a curva


terica consegue explicar os
dados fornecidos !

Ento:

R2 =

Stot S res
S
= 1 res
Stot
Stot

Contribuio do que no
pode ser explicado pelo
modelo terico !

Assim:
n

R = 1
2

( y
i =1
n

(y
i =1

yi ) 2
y)

Onde:

y=

y
i =1

25

21/09/2013

COLETA E TRATAMENTO DE DADOS


Pode ser provado que ao invs de se realizar um ajuste de
curvas, a mdia da amostra pode ser empregada com uma
estimativa dos parmetros das funes de distribuio de
probabilidade. Em particular para a funo exponencial isto
provado no seguinte livro (pgina 353):
Tempo entre as
chegadas !

f (t ) = e t

1/mdia

t
i =1

COLETA E TRATAMENTO DE DADOS

f (t ) = e t

O parmetro obtido corresponde ao valor


da taxa de chegada assumido pelos
modelos toricos de fila. O mesmo
procedimento pode ser aplicada na
obteno da taxa de atendimento .

Nmero de clientes
no sistema

26

21/09/2013

COLETA E TRATAMENTO DE DADOS


Observar que sem o outlier, temos:
n =168

t
i =1

= 1359

Logo:

t
i =1

1
= 0,146
6,83

A funo de probabilidade exponencial do intervalo de


tempo entre as chegadas ser dada por:

f (t ) = 0,146e 0,146t

COLETA E TRATAMENTO DE DADOS


Os dados podem ser analisados de acordo com testes
estatsticos tais como a aplicao do testes Chiquadrado e Kolmogorov-Smirnov. Para estes testes devem
ser observados os seguintes critrios:
(i) Nmero mnimo de valores para aplicar o teste.
(ii)Nmero de classes.

27

21/09/2013

OBRIGADO !!!

28

Vous aimerez peut-être aussi