Agentes Inteligentes

Inteligncia Artificial
Aula 2 - Agentes Inteligentes

Prof. Gustavo Jardim Portella
Roteiro
Conceito de Agente
Exemplo: mundo do aspirador de p
Caractersticas dos Agentes
Propriedades dos Ambientes
Tipos de Agentes
Exerccios
Bibliografia
Conceito de Agente
Um agente qualquer coisa que pode perceber seu
ambiente atravs de sensores e agir nesse ambiente
por meio de atuadores.
Agente
Sensores
Percepes
Ambiente
?
Atuadores
Aes
Conceito de Agente
Exemplos de Agentes:
Agente Humano: tem olhos, orelhas e outros rgos
como sensores, e mos, pernas, boca e outras partes
do corpo como atuadores.
Agente Rob: tem cmeras e localizadores
infravermelho como sensores e vrios motores como
atuadores.
Agente de Software: recebe entradas do teclado,
contedo de arquivos e pacotes de rede como
sensores de entrada e age no ambiente mostrando
resultados na tela, gravando em arquivos e enviando
pacotes pela rede.
Conceito de Agente
Agentes so diferentes de algoritmos convencionais,
pois operam sob controle autnomo, percebem seu
ambiente, adaptam-se a mudanas e so capazes de
assumir metas.
O comportamento de um agente dado abstratamente
pela funo do agente:
f=PA
Onde:
P uma sequncia de percepes
A uma ao.
Sequncia de percepes: o histrico completo de

tudo que o agente percebeu.

Ambiente: apenas dois locais, quadrado A e
quadrado B.
Percepo: h sujeira ou no.
Aes: mover para direita ou esquerda, aspirar a
sujeira ou no fazer nada.

Funo agente: se o quadrado atual est sujo, aspire
a sujeira, seno, v para o outro quadrado.
Sequncia de Percepes
Ao
[A, Limpo]
Direita
[A, Sujo]
Aspirar
[B, Limpo]
Esquerda
[B, Sujo]
Aspirar
[A, Limpo], [A, Limpo]
Direita
[A, Limpo], [A, Sujo]
Aspirar
...
[A, Limpo], [A, Limpo], [A, Limpo]
Direita
[A, Limpo], [A, Limpo], [A, Sujo]
Aspirar
...

Medida de performance: incorpora o critrio
de sucesso do comportamento de um agente.
Exemplos: quantidade de sujeira aspirada, gasto
de energia, gasto de tempo, quantidade de
barulho gerado.
A medida de performance deve refletir o

resultado realmente desejado em um perodo
de tempo determinado.

Racionalidade: bom comportamento.
Racionalidade X Oniscincia (impossvel na
prtica).
O que racional em um dado intervalo depende
de 4 coisas:
A medida de performance que define os critrios de
sucesso;
O conhecimento prvio do agente sobre o ambiente;
As aes que o agente pode realizar;
A sequncia de percepes do agente at o momento
atual.

Os agentes podem executar aes para coleta de
informaes.
Um tipo importante de coleta de informao a
explorao de um ambiente desconhecido.
Os agentes tambm podem aprender, ou seja,

modificar seu comportamento dependendo do
que ele percebe ao longo do tempo.
Nesse caso o agente chamado de autnomo.
Um agente que aprende pode ter sucesso em uma
ampla variedade de ambientes.

O processo de modelagem de um agente
envolve a definio de:
Medida de Performance
Ambiente (environment)
Atuadores (actuators)
Sensores (sensors)
PEAS (Performance, Environment, Actuators,

Sensors)

Tipo de
Agente
Medidas de
Performance
Ambiente
Atuadores
Sensores
Sistema de
diagnstico mdico
Sade do paciente,
minimizar custos,
causas
Paciente, hospital,
equipe mdica
Mostrar questes,
testes, diagnsticos,
tratamentos,
orientao
Entrada dos
sintomas por
teclado, respostas
do paciente,
pesquisa
Sistema de anlise
de imagem de
satlite
Categorizao
correta da imagem
Downlink a partir
do satlite em
rbita
Mostrar
categorizao da
cena
Arrays de pixels de
cores
Rob coletor de
partes
Percentual de
partes na caixa
correta
Esteira rolante com

partes caixas
Brao articulado e
mo
Cmera, sensores
de ngulo
articulado
Controlador de
refinaria
Maximizar pureza,
produo,
segurana
Refinaria,
operadores
Vlvulas, bombas
de gua,
aquecedores, telas
Temperatura,
presso, sensores
qumicos
Tutor de ingls
interativo
Maximizar a
pontuao de
estudantes em
testes
Conjunto de
estudantes, agncia
de testes
Mostrar exerccios,
sugestes,
correes
Entrada pelo
teclado

Totalmente observvel x parcialmente observvel
(acessvel x inacessvel):
se o sensor do agente tem acesso completo ao estado do
ambiente o tempo todo, conseguindo observar todos os
aspectos relevantes para escolher uma ao a executar,
assim, o ambiente completamente observvel, sendo
que relevncia depende das medidas de performance.
Um ambiente pode ser parcialmente observvel devido a
rudo ou sensores no acurados ou parte do estado do
ambiente que estejam faltando - por exemplo, o agente
aspirador de p com apenas um sensor de sujeira local no
pode dizer se h sujeira em outros quadrados, e um txi
automatizado no pode saber o que outros motoristas
esto pensando.

Determinstico x estocstico (determinstico x no determinstico):
Se o prximo estado do ambiente completamente determinado pelo
estado atual e aes executadas pelo agente, ento podemos dizer
que o ambiente determinstico, ou seja, previsvel; seno,
estocstico.
Em princpio, um agente no precisa se preocupar sobre incertezas em
um ambiente determinstico e completamente observvel. Se o
ambiente parcialmente observvel, todavia, ele pode parecer ser
estocstico.
Motorista de txi claramente estocstico, porque ele no pode
predizer o comportamento do trfego, alm do mais, um pneu pode
estourar. O mundo do aspirador de p, como descrevemos,
determinstico, mas variaes podem incluir elementos estocsticos
como aparecimento randmico de sujeira e um mecanismo de suco
no confivel. Se o ambiente determinstico, exceto pelas aes de
outros agentes, dizemos que o ambiente estratgico.

Episdico x sequencial (episdico x no episdico):
Em um ambiente episdico, a experincia do agente dividida em
episdios atmicos. Cada episdio consiste da percepo do agente e
realizao de uma nica ao. Crucialmente, o prximo episdio no
depende de aes realizadas em episdios anteriores.
Em um ambiente episdico, a escolha de uma ao depende somente
do prprio episdio. Um agente para apontar peas defeituosas em
uma linha de montagem baseia cada deciso somente na pea atual,
sem se preocupar com decises anteriores, e a deciso atual no afeta
decises futuras.
Em ambientes sequenciais, a deciso atual pode afetar todas as
decises futuras. Xadrez e um motorista de txi so sequenciais: em
ambos os casos, aes de curto prazo podem ter consequncias de
longo prazo.
Ambientes episdicos so mais simples porque o agente no tem que
pensar a frente, ou seja, no tem que pensar nas consequncias
futuras de suas aes, apenas nas consequncias da ao atual.

Esttico x dinmico:
Se o ambiente pode mudar enquanto o agente est deliberando,
podemos dizer que ele dinmico, seno, esttico.
Ambientes estticos so mais fceis de lidar pois o agente no precisa
ficar observando o mundo enquanto est decidindo uma ao a
executar, nem precisa se preocupar com a passagem do tempo.
Ambientes dinmicos, por outro lado, esto continuamente
perguntando ao agente o que ele quer fazer; se ele no decidiu ainda,
isto conta como se tivesse decidido por fazer nada. Se o ambiente no
muda com a passagem do tempo mas a performance do agente sim,
ento dizemos que ele semi-dinmico.
Dirigir um txi claramente dinmico. Xadrez, quando jogado com um
relgio, semi-dinmico. Jogos de palavras cruzadas so estticos.

Discreto x continuo:
Um ambiente discreto, como o jogo de xadrez,
tem um conjunto finito de estados, alm de um
discreto(finito) conjunto de percepes e aes.
Dirigir um txi um problema de estados, aes e
tempo contnuos.

Agente nico x multi agente:
Um jogo de palavras cruzadas claramente de apenas
um agente, j o xadrez um ambiente de 2 agentes.
Xadrez um ambiente multi agente competitivo.
No ambiente do txi, evitar colises maximiza a
performance de todos os agentes, logo ele um
ambiente multi agente parcialmente cooperativo,
alm de parcialmente competitivo, por exemplo,
competindo por vagas de estacionamento e
passageiros.
Tipos de Agentes
Agentes reflexivos simples:
So o tipo mais simples de agente, que
selecionam aes com base na percepo atual,
ignorando o resto do histrico de percepes.
Por exemplo, o agente aspirador de p, pois suas
decises so baseadas somente na localizao
atual e se l h sujeira ou no.
Tipos de Agentes
Agentes reflexivos simples: exemplo aspirador de p.
Funo AGENTE-ASPIRADOR ([posio, estado])
retorna ao
Inicio
se estado = sujo ento
retorna aspirar
seno se posio = A ento
retorna direita
seno se posio = B ento
retorna esquerda
Fim
Tipos de Agentes
De forma genrica, um agente reflexivo simples pode ser
definido pelo seguinte algoritmo:
function SIMPLE-REFLEX-AGENT(percept) returns action
static:rules, a set of condition action rules
state INTERPRET-INPUT(percept)
rule RULE-MATCH(state, rules)
action RULE-ACTION(rule)
return action
Tipos de Agentes
O funcionamento do agente reflexivo simples
baseado em regras de condio-ao:
if condio then ao.
So simples, porm limitados:

Funcionar somente se a deciso correta puder ser
tomada com base apenas na percepo atual.
A tabela de regras condio-ao pode se tornar
muito grande em problemas complexos.
O ambiente deve ser completamente observvel.
Tipos de Agentes
Agentes reflexivos baseados em modelo:
Um agente reflexico baseado em modelo pode lidar
com ambientes parcialmente observveis. O agente
deve controlar as partes do mundo que ele no pode
ver.
O agente deve manter um estado interno que
dependa do histrico de percepes e reflita os
aspectos no observados no estado atual.
Agente baseado em modelo um agente que usa um
modelo de mundo.
Como o ambiente evolu independente do agente?
Como as aes do prprio agente afetam o mundo?
Tipos de Agentes
De uma forma mais genrica, podemos definir o comportamento de um

agente reflexivo baseado em modelo da seguinte forma:
function REFLEX-AGENT-WITH-STATE(percept) returns an action

static: state, a description of the current world state
action, the most recent action, initially none
rules, a set of condition-action rules
state UPDATE_INPUT(state, action, percept)

rule RULE_MATCH(state, rules)
action RULE_ACTION(rule)
return action
Tipos de Agentes
Esquema de um agente reflexivo baseado em modelo:
Tipos de Agentes
Conhecer um modelo do mundo nem sempre
suficiente para tomar uma boa deciso.
Exemplo:
Um agente Motorista de Txi chega a um cruzamento com
trs caminhos, qual direo tomar?
Simplesmente reagir? mas existem trs reaes possveis.
Examinar o modelo de mundo? no ajuda a decidir qual o
caminho.
A deciso depende de onde o txi est tentando chegar
(objetivo).
Tipos de Agentes
Agentes baseados em objetivos:
Expandem as capacidades dos agentes baseados
em modelos atravs de um objetivo.
O objetivos descreve situaes desejveis.
Exemplo: estar no destino
A seleo da ao baseada em objetivo pode ser:

Direta: quando o resultado de uma nica ao atinge o
objetivo.
Mais complexa: quando ser necessrio longas
sequncias de aes para atingir o objetivo.
Tipos de Agentes
Para encontrar sequncias de aes que alcanam os
objetivos so utilizados algoritmos de Busca e
Planejamento.
A tomada de deciso envolve a considerao do futuro, o
que no acontece com o uso de regras de condio-ao.
O que acontecer se eu fizer isso ou aquilo?
O quanto isso me ajudar a atingir o objetivo?
O agente que funciona orientado a objetivos mais flexvel

do que um agente reflexivo.
Entretanto, o objetivo no garante o melhor comportamento
para o agente, apenas a distino entre estados objetivos e no
objetivos.
Tipos de Agentes
Esquema de um agente baseado em objetivo:
Tipos de Agentes
Agentes baseados na utilidade:
buscam definir um grau de satisfao com os
estados. O quanto bom para o agente um
determinado estado.
Se um estado do mundo mais desejvel que
outro, ento ele ter maior utilidade para o
agente.
Utilidade uma funo que mapeia um estado
para um nmero real que representa o grau de
satisfao com este estado.
Tipos de Agentes
Esquema de um agente baseado na utilidade:
Tipos de Agentes
Agentes com aprendizado:
podem atuar em ambientes totalmente
desconhecidos e se tornar mais eficientes do que
o seu conhecimento inicial poderia permitir.
Em agentes sem aprendizagem, tudo o que o
agente sabe foi colocado nele pelo projetista.
33
Tipos de Agentes
Esquema de um agente com aprendizado:
34
Exerccios
1. Defina uma medida de desempenho, o ambiente, os
atuadores e os sensores para os seguintes casos:
Rob jogador de futebol.
Agente para uma livraria online.
Assistente matemtico para prova de teoremas.
2. Ambas as funes de medida de desempenho e

utilidade em agentes baseados na utilidade servem
para mensurar o quo bem o agente est atuando.
Qual a diferena entre essas duas funes?
Bibliografia
RUSSELL, Stuart J. NORVIG, Peter. Inteligncia
Artificial. Editora Campus, 2004.
LIMA, Edirlei. Agentes Inteligentes - Aula 2. PUC-RIO,
2014.
SOUTO, Marclio. Agentes Inteligentes. UFRN, 2001.

Agentes Inteligentes

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Agentes Inteligentes

Transféré par

Droits d'auteur :

Formats disponibles

Inteligncia Artificial

Aula 2 - Agentes Inteligentes

Sequncia de percepes: o histrico completo de

Exemplo: mundo do aspirador de p

Exemplo: mundo do aspirador de p

[A, Limpo], [A, Limpo]

[A, Limpo], [A, Sujo]

[A, Limpo], [A, Limpo], [A, Limpo]

[A, Limpo], [A, Limpo], [A, Sujo]

Caractersticas dos Agentes

A medida de performance deve refletir o

Caractersticas dos Agentes

Caractersticas dos Agentes

Os agentes tambm podem aprender, ou seja,

Caractersticas dos Agentes

PEAS (Performance, Environment, Actuators,

Caractersticas dos Agentes

Esteira rolante com

Propriedades dos Ambientes

Propriedades dos Ambientes

Propriedades dos Ambientes

Propriedades dos Ambientes

Propriedades dos Ambientes

Propriedades dos Ambientes

Propriedades dos Ambientes

So simples, porm limitados:

De uma forma mais genrica, podemos definir o comportamento de um

function REFLEX-AGENT-WITH-STATE(percept) returns an action

state UPDATE_INPUT(state, action, percept)

Esquema de um agente reflexivo baseado em modelo:

A seleo da ao baseada em objetivo pode ser:

O agente que funciona orientado a objetivos mais flexvel

Esquema de um agente baseado em objetivo:

Esquema de um agente baseado na utilidade:

Esquema de um agente com aprendizado:

2. Ambas as funes de medida de desempenho e

Vous aimerez peut-être aussi