Ia 3

INTELIGNCIA ARTIFICIAL
AULA 2
Msc. Daniele Carvalho Oliveira Doutoranda em Cincia da Computao - UFU Mestre em Cincia da Computao UFU Bacharel em Cincia da Computao - UFJF
PROPRIEDADES DOS AMBIENTES DE TAREFA

Inteligncia Artificial: Msc. Daniele C. Oliveira
Observvel x Parcialmente Observvel Determinstico x Estocstico Episdico x Sequencial Esttico x Dinmico Discreto x Contnuo Agente nico x Multiagente
OBSERVVEL X PARCIALMENTE OBSERVVEL

Ambiente completamente observvel: ocorre quando os sensores do agente permitem acesso completo do ambiente em cada instante, ou seja, todos os aspectos relevantes para a tomada de escolha da ao so considerados. O agente no precisa manter qualquer estado interno para controlar o mundo se o ambiente for completamente observvel. Exemplos:
Aspirador de p com sensor de sujeira local; Txi automatizado no pode saber o que outros motoristas esto pensando.
DETERMINSTICO X ESTOCSTICO
Se o prximo estado do ambiente determinado pelo estado atual e pela ao executada pelo agente, dizemos que o ambiente determinstico; caso contrrio, ele estocstico.
Ambientes parcialmente observveis podero parecer estocstico. difcil controlar todos os aspectos noobservados. melhor considerar um ambiente determinstico ou estocstico do ponto de ponto de vista do agente.
Exemplos:
Motorista de txi: comportamento dos outros motoristas imprevisvel. Se o ambiente determinstico exceto pela ao de outros agentes, diz-se que o ambiente estratgico.
EPISDICO X SEQUENCIAL
Ambientes Episdicos: Cada episdio consiste na percepo do agente, e depois na execuo de uma nica ao. Em ambientes episdicos, a escolha em cada episdio s depende do prprio episdio. Exemplo: Agente que localiza peas defeituosas.
Ambientes Sequenciais: a deciso atual poderia afetar todas as decises futuras. O agente precisa pensar frente. Exemplo: Jogo de xadrez e motorista de txi.
ESTTICO X DINMICO
Se um ambiente puder se alterar enquanto um agente est atuando, diz-se que o ambiente dinmico para esse agente; caso contrrio, ele esttico.
Ambientes estticos: o agente no precisa continuar a observar o mundo enquanto est decidindo sobre as aes e nem se preocupar com a passagem do tempo
DISCRETO X CONTNUO
A distino entre discreto e contnuo pode-se aplicar ao estado do ambiente, como o tempo tratado ou as percepes e aes do agente.
Exemplos de estados discretos: jogo de damas. Exemplos de estados contnuos: velocidade e posio do txi, ngulos de rotao do volante, etc.
AGENTE NICO X MULTIAGENTES

Multiagente:
Competitivo (damas); Parcialmente cooperativo (motorista).
Caso mais difcil: parcialmente observvel, estocstico, sequencial, dinmico, contnuo e multiagente.
ALGUNS EXEMPLOS DE AMBIENTES DE TAREFAS

Palavras Cruzadas Xadrez Pquer Gamo Taxi
Observvel / Determinstico / Sequencial / Esttico / Discreto / nico Observvel / Estratgico / Sequencial / Semi / Discreto / Multi Parcialmente / Estratgico / Sequencial / Esttico / Discreto / Multi Observvel / Estocstico / Sequencial / Esttico / Discreto / Multi Parcialmente / Estocstico / Sequencial / Dinmico / Contnuo / Multi
APRENDIZADO
10
11
INTRODUO
Computadores realmente so capazes de aprender? Infelizmente ainda no sabemos como fazer computadores aprender de uma maneira similar a maneira como os humanos aprendem. Entretanto, foram desenvolvidos algoritmos que so eficientes em certos tipos de tarefas de aprendizagem.
12
O QUE APRENDIZAGEM DE MQUINA?

Aprender significa mudar para fazer melhor (de acordo com um dado critrio) quando uma situao similar acontecer. Aprendizagem, no memorizar. Qualquer computador pode memorizar, a dificuldade est em generalizar um comportamento para uma nova situao.
13
IMPORTNCIA DO APRENDIZADO
Por que importante para um agente aprender?
Os programadores no podem antecipar todas as situaes que o agente pode encontrar.
Exemplo: Um rob programado para andar em um nico labirinto pode no saber andar em outros.
Os programadores no podem antecipar todas as mudanas que podem acontecer com o passar do tempo.
Exemplo: Agente programado para prever as melhores opo de bolsa para investir precisa se adapta quando o ambiente muda.
Os programadores nem sempre sabem encontrar a soluo dos problemas diretamente.
Exemplo: Programar um sistema para reconhecer faces no algo trivial.
14
COMO APRENDER ALGO?

Exemplos:
Considerando um agente treinando para ser se tornar um motorista de txi. Toda vez que o instrutor gritar "freio!" o agente pode aprender uma condio de quando ele deve frear. Ao ver vrias imagens que contem nibus, o agente pode aprender a reconhec-los. Ao tentar aes e observar os resultados. Por exemplo, ao frear forte em uma estrada molhada pode aprender que isso no tem um efeito bom.
15
FORMAS DE APRENDIZADO
Aprendizado Supervisionado
Aprendizado No Supervisionado Aprendizado Por Reforo
16
APRENDIZADO SUPERVISIONADO
Observa-se alguns pares de exemplos de entrada e sada, de forma a aprender uma funo que mapeia a entrada para a sada. Damos ao sistema a resposta correta durante o processo de treinamento. eficiente pois o sistema pode trabalhar diretamente com informaes corretas. til para classificao, regresso, estimao de probabilidade condicional (qual a probabilidade de um cliente com um determinado perfil comprar um determinado produto?)
17
Exemplo:
Considerando um agente treinando para ser se tornar um motorista de txi. Toda vez que o instrutor gritar "freio!" o agente pode aprender uma condio de quando ele deve frear.
A entrada formada pelos dados percebidos pelo agente atravs de sensores. A sada dada pelo instrutor que diz quando se deve frear, virar a direita, virar a esquerda, etc.
18
APRENDIZADO NO SUPERVISIONADO
O agente reconhece padres nos dados de entrada, mesmo sem nenhum feedback de sada. Por exemplo, um agente aprendendo a dirigir pode gradualmente desenvolver um conceito de dias de bom trafego e dias de trafego congestionado mesmo sem nunca ter recebido exemplos rotulados por um professor.
19
APRENDIZADO POR REFORO

O agente fica sabendo de uma srie de reforos, recompensas ou punies. Por exemplo, a falta de uma gorjeta no final do percurso da ao agente de taxista uma indicao de que ele fez algo errado. Cabe ao agente reconhecer qual das aes antes do reforo foram as maiores responsveis por isso. No damos a resposta correta para o sistema. O sistema faz uma hiptese e determina se essa hiptese foi boa ou ruim.
20
FASES DA APRENDIZAGEM
Treinamento (supervisionado)
Apresenta-se exemplos ao sistema. O sistema aprende a partir dos exemplos. O sistema modifica gradualmente os seus parmetros para que a sada se aproxime da sada desejada.
Utilizao
Novos exemplos jamais visto so apresentados ao sistema. O sistema deve generalizar e reconhec-los.
21
EXEMPLOS DE TREINAMENTO (APRENDIZADO SUPERVISIONADO)

Atributos
Exemplo X1 X2 X3 X4 X5 Atrib1
0.24829 0.24816 0.24884 0.24802 0.24775
Atrib2
0.49713 0.49729 0.49924 0.50013 0.49343
Atrib3
0.00692 0.00672 0.01047 0.01172 0.01729
Atrib4
-0.020360 0.0065762 -0.002901 0.001992 -0.014341
Atrib5
0.429731 0.431444 0.423145 0.422416 0.420937
Atrib6
-0.2935 -0.29384 -0.28956 -0.29092 -0.29244
Classe
1 1 3 2 2
22
CLASSIFICAO DE EXEMPLOS DESCONHECIDOS

Atributos
Exemplo X1 X2 Atrib1
0.22829 0.21816
Atrib2
0.48713 0.48729
Atrib3
0.00592 0.00572
Atrib4
-0.010360 0.0045762
Atrib5
0.419731 0.421444
Atrib6
-0.2845 -0.28484
Classe
? ?
X3
X4 X5
0.23884
0.23002 0.24575
0.49824
0.49013 0.49243
0.01447
0.02172 0.01029
-0.003901
0.002992 -0.015341
0.433145
0.412416 0.430937
-0.24956
-0.28092 -0.28244
?
? ?
23
TIPOS DE PROBLEMAS
Classificao:
Responde se uma determinada entrada pertence a uma certa classe. Dada a imagem de uma face: de quem esta face (dentre um nmero finito).
Regresso:
Faz uma predio a partir de um exemplo. Predizer o valor da bolsa amanh, dados os valores de dias e meses anteriores.
Estimao de Densidade:
Estima quais so as N categorias presente nos dados.

24
Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.
25
26
27
28
29
GENERALIZAR DIFCIL
No queremos aprender por memorizao
Boa resposta sobre os exemplos de treinamento somente. Fcil para um computador. Difcil para os humanos.
Aprender visando generalizar

Mais interessante. Fundamentalmente mais difcil: diversas maneiras de generalizar. Devemos extrair a essncia, a estrutura dos dados e no somente aprender a boa resposta para alguns casos.
30
EXEMPLO
Funo-alvo f (melhor resposta possvel).
31
EXEMPLO - OVERFITTING
Erro baixo sobre os exemplos de aprendizagem. Mais elevado para os de teste.
32
EXEMPLO - UNDERFITTING
Escolhemos um modelo muito simples (linear): erro elevado na aprendizagem.
33
EXEMPLO UM BOM MODELO

O modelo suficientemente flexvel para capturar a forma curva da funo f mais no suficiente para ser exatamente igual a funo f.
34
TEORIA DE APRENDIZADO COMPUTACIONAL

Como sabemos se a hiptese h est prxima da funo-alvo f, se no conhecemos o que f? Este um aspecto de uma questo mais abrangente: como saber se um algoritmo de aprendizado produziu uma teoria que prever corretamente o futuro?
Qualquer hiptese que consistente com um conjunto suficientemente grande de exemplos pouco provvel de estar seriamente errada.
35
REFERNCIA
Russel, Stuart e Norvig, Peter. Inteligncia Artificial. Campus-Elsevier. 2004. Traduo da 2a. Ed. Americana
36

Ia 3

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Ia 3

Transféré par

Droits d'auteur :

Formats disponibles

INTELIGNCIA ARTIFICIAL

PROPRIEDADES DOS AMBIENTES DE TAREFA

OBSERVVEL X PARCIALMENTE OBSERVVEL

AGENTE NICO X MULTIAGENTES

Competitivo (damas); Parcialmente cooperativo (motorista).

ALGUNS EXEMPLOS DE AMBIENTES DE TAREFAS

Palavras Cruzadas Xadrez Pquer Gamo Taxi

Inteligncia Artificial: Msc. Daniele C. Oliveira

Inteligncia Artificial: Msc. Daniele C. Oliveira

O QUE APRENDIZAGEM DE MQUINA?

Por que importante para um agente aprender?

Os programadores no podem antecipar todas as situaes que o agente pode encontrar.

Os programadores nem sempre sabem encontrar a soluo dos problemas diretamente.

Exemplo: Programar um sistema para reconhecer faces no algo trivial.

COMO APRENDER ALGO?

APRENDIZADO POR REFORO

EXEMPLOS DE TREINAMENTO (APRENDIZADO SUPERVISIONADO)

CLASSIFICAO DE EXEMPLOS DESCONHECIDOS

Estima quais so as N categorias presente nos dados.

No queremos aprender por memorizao

Aprender visando generalizar

Funo-alvo f (melhor resposta possvel).

Erro baixo sobre os exemplos de aprendizagem. Mais elevado para os de teste.

Escolhemos um modelo muito simples (linear): erro elevado na aprendizagem.

EXEMPLO UM BOM MODELO

TEORIA DE APRENDIZADO COMPUTACIONAL

Vous aimerez peut-être aussi