Académique Documents
Professionnel Documents
Culture Documents
AULA 2
Msc. Daniele Carvalho Oliveira Doutoranda em Cincia da Computao - UFU Mestre em Cincia da Computao UFU Bacharel em Cincia da Computao - UFJF
Observvel x Parcialmente Observvel Determinstico x Estocstico Episdico x Sequencial Esttico x Dinmico Discreto x Contnuo Agente nico x Multiagente
Ambiente completamente observvel: ocorre quando os sensores do agente permitem acesso completo do ambiente em cada instante, ou seja, todos os aspectos relevantes para a tomada de escolha da ao so considerados. O agente no precisa manter qualquer estado interno para controlar o mundo se o ambiente for completamente observvel. Exemplos:
Aspirador de p com sensor de sujeira local; Txi automatizado no pode saber o que outros motoristas esto pensando.
DETERMINSTICO X ESTOCSTICO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Se o prximo estado do ambiente determinado pelo estado atual e pela ao executada pelo agente, dizemos que o ambiente determinstico; caso contrrio, ele estocstico.
Ambientes parcialmente observveis podero parecer estocstico. difcil controlar todos os aspectos noobservados. melhor considerar um ambiente determinstico ou estocstico do ponto de ponto de vista do agente.
Exemplos:
Motorista de txi: comportamento dos outros motoristas imprevisvel. Se o ambiente determinstico exceto pela ao de outros agentes, diz-se que o ambiente estratgico.
EPISDICO X SEQUENCIAL
Inteligncia Artificial: Msc. Daniele C. Oliveira
Ambientes Episdicos: Cada episdio consiste na percepo do agente, e depois na execuo de uma nica ao. Em ambientes episdicos, a escolha em cada episdio s depende do prprio episdio. Exemplo: Agente que localiza peas defeituosas.
Ambientes Sequenciais: a deciso atual poderia afetar todas as decises futuras. O agente precisa pensar frente. Exemplo: Jogo de xadrez e motorista de txi.
ESTTICO X DINMICO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Se um ambiente puder se alterar enquanto um agente est atuando, diz-se que o ambiente dinmico para esse agente; caso contrrio, ele esttico.
Ambientes estticos: o agente no precisa continuar a observar o mundo enquanto est decidindo sobre as aes e nem se preocupar com a passagem do tempo
DISCRETO X CONTNUO
Inteligncia Artificial: Msc. Daniele C. Oliveira
A distino entre discreto e contnuo pode-se aplicar ao estado do ambiente, como o tempo tratado ou as percepes e aes do agente.
Exemplos de estados discretos: jogo de damas. Exemplos de estados contnuos: velocidade e posio do txi, ngulos de rotao do volante, etc.
Multiagente:
Caso mais difcil: parcialmente observvel, estocstico, sequencial, dinmico, contnuo e multiagente.
Observvel / Determinstico / Sequencial / Esttico / Discreto / nico Observvel / Estratgico / Sequencial / Semi / Discreto / Multi Parcialmente / Estratgico / Sequencial / Esttico / Discreto / Multi Observvel / Estocstico / Sequencial / Esttico / Discreto / Multi Parcialmente / Estocstico / Sequencial / Dinmico / Contnuo / Multi
APRENDIZADO
10
11
INTRODUO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Computadores realmente so capazes de aprender? Infelizmente ainda no sabemos como fazer computadores aprender de uma maneira similar a maneira como os humanos aprendem. Entretanto, foram desenvolvidos algoritmos que so eficientes em certos tipos de tarefas de aprendizagem.
12
Aprender significa mudar para fazer melhor (de acordo com um dado critrio) quando uma situao similar acontecer. Aprendizagem, no memorizar. Qualquer computador pode memorizar, a dificuldade est em generalizar um comportamento para uma nova situao.
13
IMPORTNCIA DO APRENDIZADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Exemplo: Um rob programado para andar em um nico labirinto pode no saber andar em outros.
Os programadores no podem antecipar todas as mudanas que podem acontecer com o passar do tempo.
Exemplo: Agente programado para prever as melhores opo de bolsa para investir precisa se adapta quando o ambiente muda.
14
Exemplos:
Considerando um agente treinando para ser se tornar um motorista de txi. Toda vez que o instrutor gritar "freio!" o agente pode aprender uma condio de quando ele deve frear. Ao ver vrias imagens que contem nibus, o agente pode aprender a reconhec-los. Ao tentar aes e observar os resultados. Por exemplo, ao frear forte em uma estrada molhada pode aprender que isso no tem um efeito bom.
15
FORMAS DE APRENDIZADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Aprendizado Supervisionado
Aprendizado No Supervisionado Aprendizado Por Reforo
16
APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Observa-se alguns pares de exemplos de entrada e sada, de forma a aprender uma funo que mapeia a entrada para a sada. Damos ao sistema a resposta correta durante o processo de treinamento. eficiente pois o sistema pode trabalhar diretamente com informaes corretas. til para classificao, regresso, estimao de probabilidade condicional (qual a probabilidade de um cliente com um determinado perfil comprar um determinado produto?)
17
APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Exemplo:
Considerando um agente treinando para ser se tornar um motorista de txi. Toda vez que o instrutor gritar "freio!" o agente pode aprender uma condio de quando ele deve frear.
A entrada formada pelos dados percebidos pelo agente atravs de sensores. A sada dada pelo instrutor que diz quando se deve frear, virar a direita, virar a esquerda, etc.
18
APRENDIZADO NO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
O agente reconhece padres nos dados de entrada, mesmo sem nenhum feedback de sada. Por exemplo, um agente aprendendo a dirigir pode gradualmente desenvolver um conceito de dias de bom trafego e dias de trafego congestionado mesmo sem nunca ter recebido exemplos rotulados por um professor.
19
O agente fica sabendo de uma srie de reforos, recompensas ou punies. Por exemplo, a falta de uma gorjeta no final do percurso da ao agente de taxista uma indicao de que ele fez algo errado. Cabe ao agente reconhecer qual das aes antes do reforo foram as maiores responsveis por isso. No damos a resposta correta para o sistema. O sistema faz uma hiptese e determina se essa hiptese foi boa ou ruim.
20
FASES DA APRENDIZAGEM
Inteligncia Artificial: Msc. Daniele C. Oliveira
Treinamento (supervisionado)
Apresenta-se exemplos ao sistema. O sistema aprende a partir dos exemplos. O sistema modifica gradualmente os seus parmetros para que a sada se aproxime da sada desejada.
Utilizao
Novos exemplos jamais visto so apresentados ao sistema. O sistema deve generalizar e reconhec-los.
21
Atributos
Exemplo X1 X2 X3 X4 X5 Atrib1
0.24829 0.24816 0.24884 0.24802 0.24775
Atrib2
0.49713 0.49729 0.49924 0.50013 0.49343
Atrib3
0.00692 0.00672 0.01047 0.01172 0.01729
Atrib4
-0.020360 0.0065762 -0.002901 0.001992 -0.014341
Atrib5
0.429731 0.431444 0.423145 0.422416 0.420937
Atrib6
-0.2935 -0.29384 -0.28956 -0.29092 -0.29244
Classe
1 1 3 2 2
22
Atributos
Exemplo X1 X2 Atrib1
0.22829 0.21816
Atrib2
0.48713 0.48729
Atrib3
0.00592 0.00572
Atrib4
-0.010360 0.0045762
Atrib5
0.419731 0.421444
Atrib6
-0.2845 -0.28484
Classe
? ?
X3
X4 X5
0.23884
0.23002 0.24575
0.49824
0.49013 0.49243
0.01447
0.02172 0.01029
-0.003901
0.002992 -0.015341
0.433145
0.412416 0.430937
-0.24956
-0.28092 -0.28244
?
? ?
23
TIPOS DE PROBLEMAS
Inteligncia Artificial: Msc. Daniele C. Oliveira
Classificao:
Responde se uma determinada entrada pertence a uma certa classe. Dada a imagem de uma face: de quem esta face (dentre um nmero finito).
Regresso:
Faz uma predio a partir de um exemplo. Predizer o valor da bolsa amanh, dados os valores de dias e meses anteriores.
Estimao de Densidade:
APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.
25
APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.
26
APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.
27
APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.
28
APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira
Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.
29
GENERALIZAR DIFCIL
Inteligncia Artificial: Msc. Daniele C. Oliveira
Boa resposta sobre os exemplos de treinamento somente. Fcil para um computador. Difcil para os humanos.
30
EXEMPLO
Inteligncia Artificial: Msc. Daniele C. Oliveira
31
EXEMPLO - OVERFITTING
Inteligncia Artificial: Msc. Daniele C. Oliveira
32
EXEMPLO - UNDERFITTING
Inteligncia Artificial: Msc. Daniele C. Oliveira
33
O modelo suficientemente flexvel para capturar a forma curva da funo f mais no suficiente para ser exatamente igual a funo f.
34
Como sabemos se a hiptese h est prxima da funo-alvo f, se no conhecemos o que f? Este um aspecto de uma questo mais abrangente: como saber se um algoritmo de aprendizado produziu uma teoria que prever corretamente o futuro?
Qualquer hiptese que consistente com um conjunto suficientemente grande de exemplos pouco provvel de estar seriamente errada.
35
REFERNCIA
Inteligncia Artificial: Msc. Daniele C. Oliveira
Russel, Stuart e Norvig, Peter. Inteligncia Artificial. Campus-Elsevier. 2004. Traduo da 2a. Ed. Americana
36