Vous êtes sur la page 1sur 36

INTELIGNCIA ARTIFICIAL

AULA 2
Msc. Daniele Carvalho Oliveira Doutoranda em Cincia da Computao - UFU Mestre em Cincia da Computao UFU Bacharel em Cincia da Computao - UFJF

PROPRIEDADES DOS AMBIENTES DE TAREFA


Inteligncia Artificial: Msc. Daniele C. Oliveira

Observvel x Parcialmente Observvel Determinstico x Estocstico Episdico x Sequencial Esttico x Dinmico Discreto x Contnuo Agente nico x Multiagente

OBSERVVEL X PARCIALMENTE OBSERVVEL


Inteligncia Artificial: Msc. Daniele C. Oliveira

Ambiente completamente observvel: ocorre quando os sensores do agente permitem acesso completo do ambiente em cada instante, ou seja, todos os aspectos relevantes para a tomada de escolha da ao so considerados. O agente no precisa manter qualquer estado interno para controlar o mundo se o ambiente for completamente observvel. Exemplos:

Aspirador de p com sensor de sujeira local; Txi automatizado no pode saber o que outros motoristas esto pensando.

DETERMINSTICO X ESTOCSTICO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Se o prximo estado do ambiente determinado pelo estado atual e pela ao executada pelo agente, dizemos que o ambiente determinstico; caso contrrio, ele estocstico.

Ambientes parcialmente observveis podero parecer estocstico. difcil controlar todos os aspectos noobservados. melhor considerar um ambiente determinstico ou estocstico do ponto de ponto de vista do agente.

Exemplos:
Motorista de txi: comportamento dos outros motoristas imprevisvel. Se o ambiente determinstico exceto pela ao de outros agentes, diz-se que o ambiente estratgico.

EPISDICO X SEQUENCIAL
Inteligncia Artificial: Msc. Daniele C. Oliveira

Ambientes Episdicos: Cada episdio consiste na percepo do agente, e depois na execuo de uma nica ao. Em ambientes episdicos, a escolha em cada episdio s depende do prprio episdio. Exemplo: Agente que localiza peas defeituosas.

Ambientes Sequenciais: a deciso atual poderia afetar todas as decises futuras. O agente precisa pensar frente. Exemplo: Jogo de xadrez e motorista de txi.

ESTTICO X DINMICO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Se um ambiente puder se alterar enquanto um agente est atuando, diz-se que o ambiente dinmico para esse agente; caso contrrio, ele esttico.

Ambientes estticos: o agente no precisa continuar a observar o mundo enquanto est decidindo sobre as aes e nem se preocupar com a passagem do tempo

DISCRETO X CONTNUO
Inteligncia Artificial: Msc. Daniele C. Oliveira

A distino entre discreto e contnuo pode-se aplicar ao estado do ambiente, como o tempo tratado ou as percepes e aes do agente.

Exemplos de estados discretos: jogo de damas. Exemplos de estados contnuos: velocidade e posio do txi, ngulos de rotao do volante, etc.

AGENTE NICO X MULTIAGENTES


Inteligncia Artificial: Msc. Daniele C. Oliveira

Multiagente:

Competitivo (damas); Parcialmente cooperativo (motorista).

Caso mais difcil: parcialmente observvel, estocstico, sequencial, dinmico, contnuo e multiagente.

ALGUNS EXEMPLOS DE AMBIENTES DE TAREFAS


Inteligncia Artificial: Msc. Daniele C. Oliveira

Palavras Cruzadas Xadrez Pquer Gamo Taxi

Observvel / Determinstico / Sequencial / Esttico / Discreto / nico Observvel / Estratgico / Sequencial / Semi / Discreto / Multi Parcialmente / Estratgico / Sequencial / Esttico / Discreto / Multi Observvel / Estocstico / Sequencial / Esttico / Discreto / Multi Parcialmente / Estocstico / Sequencial / Dinmico / Contnuo / Multi

Inteligncia Artificial: Msc. Daniele C. Oliveira

APRENDIZADO
10

11

Inteligncia Artificial: Msc. Daniele C. Oliveira

INTRODUO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Computadores realmente so capazes de aprender? Infelizmente ainda no sabemos como fazer computadores aprender de uma maneira similar a maneira como os humanos aprendem. Entretanto, foram desenvolvidos algoritmos que so eficientes em certos tipos de tarefas de aprendizagem.

12

O QUE APRENDIZAGEM DE MQUINA?


Inteligncia Artificial: Msc. Daniele C. Oliveira

Aprender significa mudar para fazer melhor (de acordo com um dado critrio) quando uma situao similar acontecer. Aprendizagem, no memorizar. Qualquer computador pode memorizar, a dificuldade est em generalizar um comportamento para uma nova situao.

13

IMPORTNCIA DO APRENDIZADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Por que importante para um agente aprender?

Os programadores no podem antecipar todas as situaes que o agente pode encontrar.

Exemplo: Um rob programado para andar em um nico labirinto pode no saber andar em outros.

Os programadores no podem antecipar todas as mudanas que podem acontecer com o passar do tempo.

Exemplo: Agente programado para prever as melhores opo de bolsa para investir precisa se adapta quando o ambiente muda.

Os programadores nem sempre sabem encontrar a soluo dos problemas diretamente.

Exemplo: Programar um sistema para reconhecer faces no algo trivial.

14

COMO APRENDER ALGO?


Inteligncia Artificial: Msc. Daniele C. Oliveira

Exemplos:

Considerando um agente treinando para ser se tornar um motorista de txi. Toda vez que o instrutor gritar "freio!" o agente pode aprender uma condio de quando ele deve frear. Ao ver vrias imagens que contem nibus, o agente pode aprender a reconhec-los. Ao tentar aes e observar os resultados. Por exemplo, ao frear forte em uma estrada molhada pode aprender que isso no tem um efeito bom.

15

FORMAS DE APRENDIZADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Aprendizado Supervisionado
Aprendizado No Supervisionado Aprendizado Por Reforo

16

APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Observa-se alguns pares de exemplos de entrada e sada, de forma a aprender uma funo que mapeia a entrada para a sada. Damos ao sistema a resposta correta durante o processo de treinamento. eficiente pois o sistema pode trabalhar diretamente com informaes corretas. til para classificao, regresso, estimao de probabilidade condicional (qual a probabilidade de um cliente com um determinado perfil comprar um determinado produto?)

17

APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Exemplo:

Considerando um agente treinando para ser se tornar um motorista de txi. Toda vez que o instrutor gritar "freio!" o agente pode aprender uma condio de quando ele deve frear.
A entrada formada pelos dados percebidos pelo agente atravs de sensores. A sada dada pelo instrutor que diz quando se deve frear, virar a direita, virar a esquerda, etc.

18

APRENDIZADO NO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

O agente reconhece padres nos dados de entrada, mesmo sem nenhum feedback de sada. Por exemplo, um agente aprendendo a dirigir pode gradualmente desenvolver um conceito de dias de bom trafego e dias de trafego congestionado mesmo sem nunca ter recebido exemplos rotulados por um professor.

19

APRENDIZADO POR REFORO


Inteligncia Artificial: Msc. Daniele C. Oliveira

O agente fica sabendo de uma srie de reforos, recompensas ou punies. Por exemplo, a falta de uma gorjeta no final do percurso da ao agente de taxista uma indicao de que ele fez algo errado. Cabe ao agente reconhecer qual das aes antes do reforo foram as maiores responsveis por isso. No damos a resposta correta para o sistema. O sistema faz uma hiptese e determina se essa hiptese foi boa ou ruim.

20

FASES DA APRENDIZAGEM
Inteligncia Artificial: Msc. Daniele C. Oliveira

Treinamento (supervisionado)

Apresenta-se exemplos ao sistema. O sistema aprende a partir dos exemplos. O sistema modifica gradualmente os seus parmetros para que a sada se aproxime da sada desejada.

Utilizao
Novos exemplos jamais visto so apresentados ao sistema. O sistema deve generalizar e reconhec-los.

21

EXEMPLOS DE TREINAMENTO (APRENDIZADO SUPERVISIONADO)


Inteligncia Artificial: Msc. Daniele C. Oliveira

Atributos
Exemplo X1 X2 X3 X4 X5 Atrib1
0.24829 0.24816 0.24884 0.24802 0.24775

Atrib2
0.49713 0.49729 0.49924 0.50013 0.49343

Atrib3
0.00692 0.00672 0.01047 0.01172 0.01729

Atrib4
-0.020360 0.0065762 -0.002901 0.001992 -0.014341

Atrib5
0.429731 0.431444 0.423145 0.422416 0.420937

Atrib6
-0.2935 -0.29384 -0.28956 -0.29092 -0.29244

Classe
1 1 3 2 2

22

CLASSIFICAO DE EXEMPLOS DESCONHECIDOS


Inteligncia Artificial: Msc. Daniele C. Oliveira

Atributos
Exemplo X1 X2 Atrib1
0.22829 0.21816

Atrib2
0.48713 0.48729

Atrib3
0.00592 0.00572

Atrib4
-0.010360 0.0045762

Atrib5
0.419731 0.421444

Atrib6
-0.2845 -0.28484

Classe
? ?

X3
X4 X5

0.23884
0.23002 0.24575

0.49824
0.49013 0.49243

0.01447
0.02172 0.01029

-0.003901
0.002992 -0.015341

0.433145
0.412416 0.430937

-0.24956
-0.28092 -0.28244

?
? ?

23

TIPOS DE PROBLEMAS
Inteligncia Artificial: Msc. Daniele C. Oliveira

Classificao:

Responde se uma determinada entrada pertence a uma certa classe. Dada a imagem de uma face: de quem esta face (dentre um nmero finito).

Regresso:
Faz uma predio a partir de um exemplo. Predizer o valor da bolsa amanh, dados os valores de dias e meses anteriores.

Estimao de Densidade:

Estima quais so as N categorias presente nos dados.


24

APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.

25

APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.

26

APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.

27

APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.

28

APRENDIZADO SUPERVISIONADO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Dado uma quantidade finita de dados para o treinamento, temos que derivar uma funo h que se aproxime da verdadeira funo f(x) (a qual gerou os dados e desconhecida). Existe um nmero infinito de funes h.

29

GENERALIZAR DIFCIL
Inteligncia Artificial: Msc. Daniele C. Oliveira

No queremos aprender por memorizao

Boa resposta sobre os exemplos de treinamento somente. Fcil para um computador. Difcil para os humanos.

Aprender visando generalizar


Mais interessante. Fundamentalmente mais difcil: diversas maneiras de generalizar. Devemos extrair a essncia, a estrutura dos dados e no somente aprender a boa resposta para alguns casos.

30

EXEMPLO
Inteligncia Artificial: Msc. Daniele C. Oliveira

Funo-alvo f (melhor resposta possvel).

31

EXEMPLO - OVERFITTING
Inteligncia Artificial: Msc. Daniele C. Oliveira

Erro baixo sobre os exemplos de aprendizagem. Mais elevado para os de teste.

32

EXEMPLO - UNDERFITTING
Inteligncia Artificial: Msc. Daniele C. Oliveira

Escolhemos um modelo muito simples (linear): erro elevado na aprendizagem.

33

EXEMPLO UM BOM MODELO


Inteligncia Artificial: Msc. Daniele C. Oliveira

O modelo suficientemente flexvel para capturar a forma curva da funo f mais no suficiente para ser exatamente igual a funo f.

34

TEORIA DE APRENDIZADO COMPUTACIONAL


Inteligncia Artificial: Msc. Daniele C. Oliveira

Como sabemos se a hiptese h est prxima da funo-alvo f, se no conhecemos o que f? Este um aspecto de uma questo mais abrangente: como saber se um algoritmo de aprendizado produziu uma teoria que prever corretamente o futuro?

Qualquer hiptese que consistente com um conjunto suficientemente grande de exemplos pouco provvel de estar seriamente errada.

35

REFERNCIA
Inteligncia Artificial: Msc. Daniele C. Oliveira

Russel, Stuart e Norvig, Peter. Inteligncia Artificial. Campus-Elsevier. 2004. Traduo da 2a. Ed. Americana

36

Vous aimerez peut-être aussi