Vous êtes sur la page 1sur 36

Inteligncia Artificial

Aula 2 - Agentes Inteligentes


Prof. Gustavo Jardim Portella

Roteiro

Conceito de Agente
Exemplo: mundo do aspirador de p
Caractersticas dos Agentes
Propriedades dos Ambientes
Tipos de Agentes
Exerccios
Bibliografia

Conceito de Agente
Um agente qualquer coisa que pode perceber seu
ambiente atravs de sensores e agir nesse ambiente
por meio de atuadores.
Agente
Sensores

Percepes

Ambiente

?
Atuadores

Aes

Conceito de Agente
Exemplos de Agentes:
Agente Humano: tem olhos, orelhas e outros rgos
como sensores, e mos, pernas, boca e outras partes
do corpo como atuadores.
Agente Rob: tem cmeras e localizadores
infravermelho como sensores e vrios motores como
atuadores.
Agente de Software: recebe entradas do teclado,
contedo de arquivos e pacotes de rede como
sensores de entrada e age no ambiente mostrando
resultados na tela, gravando em arquivos e enviando
pacotes pela rede.

Conceito de Agente
Agentes so diferentes de algoritmos convencionais,
pois operam sob controle autnomo, percebem seu
ambiente, adaptam-se a mudanas e so capazes de
assumir metas.
O comportamento de um agente dado abstratamente
pela funo do agente:
f=PA
Onde:
P uma sequncia de percepes
A uma ao.

Sequncia de percepes: o histrico completo de


tudo que o agente percebeu.

Exemplo: mundo do aspirador de p


Ambiente: apenas dois locais, quadrado A e
quadrado B.
Percepo: h sujeira ou no.
Aes: mover para direita ou esquerda, aspirar a
sujeira ou no fazer nada.

Exemplo: mundo do aspirador de p


Funo agente: se o quadrado atual est sujo, aspire
a sujeira, seno, v para o outro quadrado.
Sequncia de Percepes

Ao

[A, Limpo]

Direita

[A, Sujo]

Aspirar

[B, Limpo]

Esquerda

[B, Sujo]

Aspirar

[A, Limpo], [A, Limpo]

Direita

[A, Limpo], [A, Sujo]

Aspirar

...

[A, Limpo], [A, Limpo], [A, Limpo]

Direita

[A, Limpo], [A, Limpo], [A, Sujo]

Aspirar

...

Caractersticas dos Agentes


Medida de performance: incorpora o critrio
de sucesso do comportamento de um agente.
Exemplos: quantidade de sujeira aspirada, gasto
de energia, gasto de tempo, quantidade de
barulho gerado.

A medida de performance deve refletir o


resultado realmente desejado em um perodo
de tempo determinado.

Caractersticas dos Agentes


Racionalidade: bom comportamento.
Racionalidade X Oniscincia (impossvel na
prtica).
O que racional em um dado intervalo depende
de 4 coisas:
A medida de performance que define os critrios de
sucesso;
O conhecimento prvio do agente sobre o ambiente;
As aes que o agente pode realizar;
A sequncia de percepes do agente at o momento
atual.

Caractersticas dos Agentes


Os agentes podem executar aes para coleta de
informaes.
Um tipo importante de coleta de informao a
explorao de um ambiente desconhecido.

Os agentes tambm podem aprender, ou seja,


modificar seu comportamento dependendo do
que ele percebe ao longo do tempo.
Nesse caso o agente chamado de autnomo.
Um agente que aprende pode ter sucesso em uma
ampla variedade de ambientes.

Caractersticas dos Agentes


O processo de modelagem de um agente
envolve a definio de:
Medida de Performance
Ambiente (environment)
Atuadores (actuators)
Sensores (sensors)

PEAS (Performance, Environment, Actuators,


Sensors)

Caractersticas dos Agentes


Tipo de
Agente

Medidas de
Performance

Ambiente

Atuadores

Sensores

Sistema de
diagnstico mdico

Sade do paciente,
minimizar custos,
causas

Paciente, hospital,
equipe mdica

Mostrar questes,
testes, diagnsticos,
tratamentos,
orientao

Entrada dos
sintomas por
teclado, respostas
do paciente,
pesquisa

Sistema de anlise
de imagem de
satlite

Categorizao
correta da imagem

Downlink a partir
do satlite em
rbita

Mostrar
categorizao da
cena

Arrays de pixels de
cores

Rob coletor de
partes

Percentual de
partes na caixa
correta

Esteira rolante com


partes caixas

Brao articulado e
mo

Cmera, sensores
de ngulo
articulado

Controlador de
refinaria

Maximizar pureza,
produo,
segurana

Refinaria,
operadores

Vlvulas, bombas
de gua,
aquecedores, telas

Temperatura,
presso, sensores
qumicos

Tutor de ingls
interativo

Maximizar a
pontuao de
estudantes em
testes

Conjunto de
estudantes, agncia
de testes

Mostrar exerccios,
sugestes,
correes

Entrada pelo
teclado

Propriedades dos Ambientes


Totalmente observvel x parcialmente observvel
(acessvel x inacessvel):
se o sensor do agente tem acesso completo ao estado do
ambiente o tempo todo, conseguindo observar todos os
aspectos relevantes para escolher uma ao a executar,
assim, o ambiente completamente observvel, sendo
que relevncia depende das medidas de performance.
Um ambiente pode ser parcialmente observvel devido a
rudo ou sensores no acurados ou parte do estado do
ambiente que estejam faltando - por exemplo, o agente
aspirador de p com apenas um sensor de sujeira local no
pode dizer se h sujeira em outros quadrados, e um txi
automatizado no pode saber o que outros motoristas
esto pensando.

Propriedades dos Ambientes


Determinstico x estocstico (determinstico x no determinstico):
Se o prximo estado do ambiente completamente determinado pelo
estado atual e aes executadas pelo agente, ento podemos dizer
que o ambiente determinstico, ou seja, previsvel; seno,
estocstico.
Em princpio, um agente no precisa se preocupar sobre incertezas em
um ambiente determinstico e completamente observvel. Se o
ambiente parcialmente observvel, todavia, ele pode parecer ser
estocstico.
Motorista de txi claramente estocstico, porque ele no pode
predizer o comportamento do trfego, alm do mais, um pneu pode
estourar. O mundo do aspirador de p, como descrevemos,
determinstico, mas variaes podem incluir elementos estocsticos
como aparecimento randmico de sujeira e um mecanismo de suco
no confivel. Se o ambiente determinstico, exceto pelas aes de
outros agentes, dizemos que o ambiente estratgico.

Propriedades dos Ambientes


Episdico x sequencial (episdico x no episdico):
Em um ambiente episdico, a experincia do agente dividida em
episdios atmicos. Cada episdio consiste da percepo do agente e
realizao de uma nica ao. Crucialmente, o prximo episdio no
depende de aes realizadas em episdios anteriores.
Em um ambiente episdico, a escolha de uma ao depende somente
do prprio episdio. Um agente para apontar peas defeituosas em
uma linha de montagem baseia cada deciso somente na pea atual,
sem se preocupar com decises anteriores, e a deciso atual no afeta
decises futuras.
Em ambientes sequenciais, a deciso atual pode afetar todas as
decises futuras. Xadrez e um motorista de txi so sequenciais: em
ambos os casos, aes de curto prazo podem ter consequncias de
longo prazo.
Ambientes episdicos so mais simples porque o agente no tem que
pensar a frente, ou seja, no tem que pensar nas consequncias
futuras de suas aes, apenas nas consequncias da ao atual.

Propriedades dos Ambientes


Esttico x dinmico:
Se o ambiente pode mudar enquanto o agente est deliberando,
podemos dizer que ele dinmico, seno, esttico.
Ambientes estticos so mais fceis de lidar pois o agente no precisa
ficar observando o mundo enquanto est decidindo uma ao a
executar, nem precisa se preocupar com a passagem do tempo.
Ambientes dinmicos, por outro lado, esto continuamente
perguntando ao agente o que ele quer fazer; se ele no decidiu ainda,
isto conta como se tivesse decidido por fazer nada. Se o ambiente no
muda com a passagem do tempo mas a performance do agente sim,
ento dizemos que ele semi-dinmico.
Dirigir um txi claramente dinmico. Xadrez, quando jogado com um
relgio, semi-dinmico. Jogos de palavras cruzadas so estticos.

Propriedades dos Ambientes


Discreto x continuo:
Um ambiente discreto, como o jogo de xadrez,
tem um conjunto finito de estados, alm de um
discreto(finito) conjunto de percepes e aes.
Dirigir um txi um problema de estados, aes e
tempo contnuos.

Propriedades dos Ambientes


Agente nico x multi agente:
Um jogo de palavras cruzadas claramente de apenas
um agente, j o xadrez um ambiente de 2 agentes.
Xadrez um ambiente multi agente competitivo.
No ambiente do txi, evitar colises maximiza a
performance de todos os agentes, logo ele um
ambiente multi agente parcialmente cooperativo,
alm de parcialmente competitivo, por exemplo,
competindo por vagas de estacionamento e
passageiros.

Propriedades dos Ambientes

Tipos de Agentes
Agentes reflexivos simples:
So o tipo mais simples de agente, que
selecionam aes com base na percepo atual,
ignorando o resto do histrico de percepes.
Por exemplo, o agente aspirador de p, pois suas
decises so baseadas somente na localizao
atual e se l h sujeira ou no.

Tipos de Agentes
Agentes reflexivos simples: exemplo aspirador de p.
Funo AGENTE-ASPIRADOR ([posio, estado])
retorna ao
Inicio
se estado = sujo ento
retorna aspirar
seno se posio = A ento
retorna direita
seno se posio = B ento
retorna esquerda
Fim

Tipos de Agentes
De forma genrica, um agente reflexivo simples pode ser
definido pelo seguinte algoritmo:
function SIMPLE-REFLEX-AGENT(percept) returns action
static:rules, a set of condition action rules
state INTERPRET-INPUT(percept)
rule RULE-MATCH(state, rules)
action RULE-ACTION(rule)

return action

Tipos de Agentes
O funcionamento do agente reflexivo simples
baseado em regras de condio-ao:
if condio then ao.

So simples, porm limitados:


Funcionar somente se a deciso correta puder ser
tomada com base apenas na percepo atual.
A tabela de regras condio-ao pode se tornar
muito grande em problemas complexos.
O ambiente deve ser completamente observvel.

Tipos de Agentes
Agentes reflexivos baseados em modelo:
Um agente reflexico baseado em modelo pode lidar
com ambientes parcialmente observveis. O agente
deve controlar as partes do mundo que ele no pode
ver.
O agente deve manter um estado interno que
dependa do histrico de percepes e reflita os
aspectos no observados no estado atual.
Agente baseado em modelo um agente que usa um
modelo de mundo.
Como o ambiente evolu independente do agente?
Como as aes do prprio agente afetam o mundo?

Tipos de Agentes

De uma forma mais genrica, podemos definir o comportamento de um


agente reflexivo baseado em modelo da seguinte forma:

function REFLEX-AGENT-WITH-STATE(percept) returns an action


static: state, a description of the current world state
action, the most recent action, initially none
rules, a set of condition-action rules

state UPDATE_INPUT(state, action, percept)


rule RULE_MATCH(state, rules)
action RULE_ACTION(rule)
return action

Tipos de Agentes

Esquema de um agente reflexivo baseado em modelo:

Tipos de Agentes
Conhecer um modelo do mundo nem sempre
suficiente para tomar uma boa deciso.
Exemplo:
Um agente Motorista de Txi chega a um cruzamento com
trs caminhos, qual direo tomar?
Simplesmente reagir? mas existem trs reaes possveis.
Examinar o modelo de mundo? no ajuda a decidir qual o
caminho.
A deciso depende de onde o txi est tentando chegar
(objetivo).

Tipos de Agentes
Agentes baseados em objetivos:
Expandem as capacidades dos agentes baseados
em modelos atravs de um objetivo.
O objetivos descreve situaes desejveis.
Exemplo: estar no destino

A seleo da ao baseada em objetivo pode ser:


Direta: quando o resultado de uma nica ao atinge o
objetivo.
Mais complexa: quando ser necessrio longas
sequncias de aes para atingir o objetivo.

Tipos de Agentes
Para encontrar sequncias de aes que alcanam os
objetivos so utilizados algoritmos de Busca e
Planejamento.
A tomada de deciso envolve a considerao do futuro, o
que no acontece com o uso de regras de condio-ao.
O que acontecer se eu fizer isso ou aquilo?
O quanto isso me ajudar a atingir o objetivo?

O agente que funciona orientado a objetivos mais flexvel


do que um agente reflexivo.
Entretanto, o objetivo no garante o melhor comportamento
para o agente, apenas a distino entre estados objetivos e no
objetivos.

Tipos de Agentes

Esquema de um agente baseado em objetivo:

Tipos de Agentes
Agentes baseados na utilidade:
buscam definir um grau de satisfao com os
estados. O quanto bom para o agente um
determinado estado.
Se um estado do mundo mais desejvel que
outro, ento ele ter maior utilidade para o
agente.
Utilidade uma funo que mapeia um estado
para um nmero real que representa o grau de
satisfao com este estado.

Tipos de Agentes

Esquema de um agente baseado na utilidade:

Tipos de Agentes
Agentes com aprendizado:
podem atuar em ambientes totalmente
desconhecidos e se tornar mais eficientes do que
o seu conhecimento inicial poderia permitir.
Em agentes sem aprendizagem, tudo o que o
agente sabe foi colocado nele pelo projetista.

33

Tipos de Agentes

Esquema de um agente com aprendizado:

34

Exerccios
1. Defina uma medida de desempenho, o ambiente, os
atuadores e os sensores para os seguintes casos:
Rob jogador de futebol.
Agente para uma livraria online.
Assistente matemtico para prova de teoremas.

2. Ambas as funes de medida de desempenho e


utilidade em agentes baseados na utilidade servem
para mensurar o quo bem o agente est atuando.
Qual a diferena entre essas duas funes?

Bibliografia
RUSSELL, Stuart J. NORVIG, Peter. Inteligncia
Artificial. Editora Campus, 2004.
LIMA, Edirlei. Agentes Inteligentes - Aula 2. PUC-RIO,
2014.
SOUTO, Marclio. Agentes Inteligentes. UFRN, 2001.

Vous aimerez peut-être aussi