Académique Documents
Professionnel Documents
Culture Documents
e
Grupo Witty
–2–
–3–
Sumário
Sobre o conhecimento
Durante a história da humanidade, ela tem mostrado sucessivos avanços, recuos e mudanças de
paradigma, resultantes do impacto de diversas causas, como guerras e catástrofes naturais. Porém, não
menos importante, o desenvolvimento de tecnologias que, para o bem ou para o mal, moldaram o meio
ambiente para tornar a vida mais confortável. Mesmo antes da invenção da escrita, a experiência dos mais
velhos era transmitida pela tradição oral, com o que se dominou o fogo, se construíram ferramentas, se
inventou a roda e se implantou a agricultura, provocando profundas modificações no modo de vida. Se
antes viviam nômades, perseguindo caça e coletando frutas e raízes, os homens passaram a ter vida mais
sedentária, mantendo maior controle sobre as fontes de alimentação.
Os papiros egípcios e as placas da Mesopotâmia tornaram o saber mais perene, relatando informações
entre pessoas que às vezes nem se conheciam, ainda que soluções de problemas quotidianos viessem
entremeados de evocação aos deuses, feitos reais exagerados ou profunda superstição. No entanto, isto não
impediu que se construíssem magníficos templos e palácios, pontes, túneis, diques, estradas e cidades. No
séc. IV a.C., Aristósteles coligiu e organizou boa parte do conhecimento da época. Ainda então era possível
esta tarefa ser encetada por um único indivíduo – mesmo que excepcional. Outras pessoas de gênio na
Antigüidade produziram manuais que atravessaram os séculos e foram utilizados até o Renascimento. Para
ficar em apenas um gênero, podemos citar os trabalhos médicos de Galeno e Avicena.
A biblioteca de Alexandria conseguiu reunir a imensa quantidade de 700 mil documentos. Em sua
história, sofreu diversos incêndios e perdas, sendo o último no séc. VII fatal, não sem antes que parte dos
manuscritos fossem transferidos e mantidos a salvo dispersos em vários mosteiros.
No século XII, Isidoro de Sevilha possuia a maior biblioteca da época. Conseguiu reunir – novamente
num esforço individual – conhecimentos salvos de uma estrutura política que ruíra sob o peso das invasões
germânicas, preservando-os para a nova era de estados soberanos europeus que se delineava. Por isto, é
considerado o primeiro enciclopedista e, pela mesma razão, o padroeiro da Internet.
O Renascimento nos apresentou artistas multivalentes, que faziam de tudo um pouco. Dominavam
técnicas diversas com maestria, executando arrojadas criações. A síntese da época geralmente é apontada na
figura de Leonardo da Vinci – escritor, pintor, inventor, conselheiro militar – que nos legou anotações de
idéias inovadoras, muito adiante de sua época e que não teve condições de concretizar.
A invenção da imprensa com tipos móveis por Guttemberg no século XV multiplicou a quantidade de
livros existentes, antes penosamente copiados à mão. Com isto, a difusão de novas idéias e conhecimento
passou a ser feita de maneira mais rápida e abrangente. A palavra escrita fugia ao controle do erudito e
encontrava lugar no quotidiano das pessoas comuns.
Durante o Iluminismo no século XVIII, houve outro esforço de reunião de todo saber existente, mas
que então precisou do trabalho agregado de muitas pessoas, chamadas enciclopedistas. Agora a experiência
acumulada não cabia apenas em um único indivíduo. Fracionaram-nas em especializações, processo que só
se aprofundou no futuro.
Se houve época quando o conhecimento era escasso, hoje vivenciamos o processo inverso. A Internet
é um incrível repositório de dados, gigantescamente maior que possam ter sonhado antigos bibliotecários. À
distância de um clique do mouse estão disponíveis milhões de informações trazidas por mecanismos de
busca com eficentes algoritmos para a procura. Todas interessam? Certamente que não. Nem todas são
confiáveis, tampouco. Ficamos assim submersos em uma avalanche de dados muito maior que poderíamos
interpretar em um tempo razoável.
É para este quadro que propomos uma ferramenta que permita tornar esta tarefa exeqüível. O
Idealize possibilita a pesquisa, o registro e a organização de informações; a aquisição automática de
conhecimento, assim como o interrelacionamento de dados existentes ou mesmo a dedução de novas
informações a partir das armazenadas. Com os conceitos de peso e confiabilidade, qualifica as informações
numa escala de credibilidade – que pode partir de simples rumor, passando por diversos níveis de certeza,
até chegar a fato consumado.
Sem dúvida uma ferramenta útil. Assim, este texto é sobre conhecimento, enfocado numa maneira
prática e fácil de organizá-lo de forma que se possa emitir pareceres ou responder questões sobre qualquer
área de saber. Baseia-se em teoria sobre o conhecimento, a epistemologia, embora não a discutamos com
detalhes, apenas os conceitos sobre percepção necessários para perfeito entendimento dos recursos
disponibilizados pelo produto.
Com este objetivo, a obra está dividida em vários capítulos relacionados mas que podem ser
abordadas independentemente, conforme o interesse do leitor. O primeiro, Geometria do conhecimento, fornece
–5–
1. Geometria do Conhecimento
“O mundo é a minha representação. – Esta proposição é uma verdade para todo ser vivo e pensante, embora só no
homem chegue a transformar-se em conhecimento abstrato e refletido.1 (...) O mundo é, portanto, representação.”
Arthur Schopenhauer (1788-1860)
Neste capítulo não prolongaremos a discussão do conhecimento científico, pois acreditamos que existe
uma literatura bastante satisfatória sobre o assunto. O leitor pode consultar, por exemplo, Bunge [Bung67].
No entanto, achamos que o desenvolvimento de metodologias automatizadas para a aquisição de
conhecimento poderá ser utilizada na pesquisa científica.
1 “A partir do momento em que é capaz de o levar a este estado, pode dizer-se que nasceu nele o espírito filosófico. Possui então a
inteira certeza de não conhecer nem um sol nem uma terra, mas apenas olhos que vêem este sol, mãos que tocam esta terra; em uma
palavra, ele sabe que o mundo que o cerca existe apenas como representação, na sua relação com um ser que percebe, que é o próprio
homem.” Se existe uma verdade que se possa afirmar a priori é esta, pois ela exprime o modo de toda experiência possível e imaginável,
conceito muito mais geral que os de tempo, espaço e causalidade que o implicam. Com efeito, cada um destes conceitos, nos quais
reconhecemos formas diversas do princípio da razão, apenas é aplicável a uma ordem determinada de representações; a distinção entre
sujeito e objeto é, pelo contrário, o modo comum a todas, o único sob o qual se pode conceber uma representação qualquer, abstrata ou
intuitiva, racional ou empírica. Nenhuma verdade é, portanto, mais certa, mais absoluta, mais evidente do que esta: tudo o que existe,
existe para o pensamento, isto é, o universo inteiro apenas é objeto em relação a um sujeito, percepção apenas, em relação a um espírito
que percebe. Em uma palavra, é pura representação. Esta lei aplica-se naturalmente a todo o presente, a todo o passado e a todo o
futuro, aquilo que está longe, tal como aquilo que está perto de nós, visto que ela é verdadeira para o próprio tempo e o próprio espaço,
graças aos quais as representações particulares se distinguem umas das outras. Tudo o que o mundo encerra ou pode encerrar está
nesta dependência necessária perante o sujeito, e apenas existe para o sujeito.”
Em “O mundo como vontade e representação - Editora Contraponto - 2004
–7–
1.1 – Introdução
A observação da realidade, através dos órgãos dos sentidos, nos leva a adquirir um entendimento
das coisas que possibilita elaborar dados do mundo exterior. O conhecimento assim constituído, é resultante
de um processo de aculturação. Além de observações sensoriais, outros tipos de percepção e,
principalmente, os processos dedutivos da mente humana, contribuem para a formação de conceitos. O
conhecimento é, portanto, a apropriação mental das percepções sensitivas e extra-sensitivas, que podem ser
aprofundadas pelo exercício do pensamento. Todo este processo é suficientemente complicado e ainda
pouco compreendido. O entendimento das coisas é a capacidade de avaliar fatos percebidos a partir de um
sistema de critérios.
Douglas Hoffstadter introduziu o conceito de Implicosfera, como sendo uma certa nuvem de
impressões que se tem à respeito de um objeto, uma classe de objetos, uma relação entre objetos ou um
fenômeno. Esta nuvem torna-se mais densa e complexa à medida que vivenciamos um maior contato com
tais entidades. Na implicosfera de um conceito estão implícitas todas as suas ligações com outras
implicosferas.
A implicosfera contém o que sabemos a respeito de um objeto ou fenômeno. Podemos dizer que ela
é uma teoria do objeto (fenômeno), relacionando-se, também às implicosferas de outros objetos.
é, em grande parte, uma conseqüência de todo um processo de aculturação, sendo portanto fortemente
induzida pelo conhecimento ou entendimento que possuímos no momento da observação. Para simplificar
podemos representar, no plano conceitual, os conceitos abstraídos a partir da implicosfera.
simbólico que pode ser obtido é o que conhecemos como conseqüências lógicas.
A esta coleção de modelos costumamos chamar sistema de crenças de um indivíduo com respeito a um
determinado mundo. Neste texto, seguindo a terminologia vigente, também nos referiremos a esta coleção
como o mundo possível. A família M de modelos, sendo de natureza conceitual, fica situada no vértice C do
triângulo.
Em relação a um determinado estado de coisas, podemos perceber ou até mesmo conceber diferentes
configurações. Cada uma delas possui uma valoração com respeito ao mundo possível, de acordo com um
conjunto de valores e um processo de avaliação. A avaliação, por sua vez, é o julgamento atribuído a alguma
configuração (percebida, comunicada ou concebida) relativa ao nosso mundo possível M. Podemos imaginar
que uma nova configuração é comparada a cada uma das configurações que já adquiriram o status de
modelo ou configuração do mundo possível.
O conjunto de valores abstratos que usamos para medir varia de acordo com a natureza do
conhecimento relacionado ao estado de coisas em julgamento. Assim, podemos ter um conjunto bem
determinado de valores, tais como:
{ justo, injusto }
{ deficiente, insuficiente, regular, bom, ótimo, excelente }
e o mais usual:
{ verdadeiro, falso }
\
O processo de avaliação situa-se no vértice C. Muito embora, mais freqüentemente, tal processo seja
um objeto de natureza abstrata, equivalente a uma função, pode também ter uma representação simbólica
que, em vez de uma conotação descritiva intensional ou extensional, tenha uma conotação operacional ou
algorítmica.
Pessoas experientes em julgar ocorrências de um mesmo tipo de atividade, ou um certo tipo de
fenômeno, possuem um conjunto de modelos melhor delineados, com limites e fronteiras mais precisas. Tais
pessoas, que chamaremos de especialistas, processam suas avaliações de modo quase imediato, pois sentem
que o resultado de suas percepções do real se encaixam ou não com configurações que já lhe são familiares,
percebidas e apreendidas anteriormente.
– 13 –
A questão, que talvez surja na mente do leitor, é como mecanizar os sistemas de avaliação,
principalmente nos casos em que o processo ou função de avaliação é pouco compreendido. Responder a
esta questão, ainda que de forma aproximada, é o objetivo deste capítulo.
Utilizaremos a palavra linguagem como referência à parte simbólica dos sistemas de significado.
Embora de natureza simbólica, uma linguagem pode ser algo nebuloso, sem fronteiras muito claras, porém
coerente para o grupo social que dela faz uso. As comunicações, muitas vezes de natureza ambígua, quando
interpretadas geram configurações, do mesmo modo que as percepções diretas da realidade. As linguagens
situam-se no vértice S do triângulo e formam um todo estruturado composto de:
átomos – sinais sonoros ou gráficos identificáveis individualmente (fonemas ou letras);
palavras – certas seqüências temporais ou espaciais de átomos;
sentenças – seqüências temporais ou espaciais de palavras.
Se considerarmos a sentença:
Maria passeia na praia
Interpretamos, se conhecemos a língua portuguesa:
Maria como sendo uma mulher e, caso seja alguém conhecida, formamos uma imagem, que será
tanto mais precisa quanto maior for o nosso conhecimento;
Passeia como sendo uma atividade de locomoção;
Praia como sendo uma região à beira-mar.
1.3.1 – Modelos
Para fixar o nosso entendimento do que discutimos acima, vamos considerar o problema de pintar
objetos com cores, e discutir as componentes linguagem, modelos, valores abstratos e função de avaliação do
sistema semântico correspondente.
Muito embora os modelos sejam de natureza conceitual, para comunicá-los ou mesmo estudá-los é
comum utilizar algum tipo de linguagem (na realidade uma metalinguagem, pois a apresentação da família
de modelos de um sistema semântico se passa fora do sistema). Por exemplo, apresentamos modelos, com o
objetivo de esclarecer o conceito de sistema semântico, e usaremos a língua portuguesa enriquecida com a
linguagem matemática e desenhos. Particularizando o problema de colorir objetos para o caso de três objetos
– 14 –
e duas cores podemos imaginar a representação dos modelos por meio de figuras coloridas.
Estes relacionamentos são fatos atômicos, e cada modelo é uma coleção de fatos atômicos. Isto, nos sugere
uma representação por letras com índices pij , interpretados como: o objeto i está colorido pela cor j. Assim p12
significa que o objeto 1 está colorido pela cor 2.
Observe que a representaçã o matricial de modelos, diferentemente dos grafos bipartites e das letras
p{ij}, é inadequada para a representação de fatos atômicos, pois descreve indivisivelmente um mundo
possível.
Sempre é possível estabelecer vínculos entre as diferentes formas de representação, por exemplo:
– 15 –
1.3.2 – Linguagem
No item anterior, fizemos uso de linguagens para descrever modelos, fora do sistema semântico que
pretendemos apresentar, porém dentro de um sistema semântico tacitamente admitido, mas não explicitado.
Assim, as linguagens utilizadas, embora não precisamente definidas, foram suficientemente poderosas para
transmitir ao leitor um entendimento dos modelos.
Podemos construir, ou definir um sistema semântico que tem como linguagem exatamente uma das
usadas para definir os modelos, e tomar uma outra para representação dos modelos pois, mesmo num
sistema semântico, o uso de uma meta-linguagem de representação dos modelos é importante para a
definição, ou explicação da função de avaliação. Assim se tomarmos como linguagem L a linguagem
matricial e como modelos os conjuntos de letras p ij, teríamos que a sentença
No entanto a linguagem matricial é mais adequada para modelar do que para sentenciar, por sua
incapacidade de expressar fatos atômicos. Se adotarmos como linguagem as letras pij , podemos expressar o
fato atômico p 21 usando, alternativamente, os grafos “bipartites” como linguagem de modelagem.
Vemos assim que podemos escolher linguagens para:
Representar modelos;
Expressar propriedades de modelos;
A representação de modelos, possui exigências diferentes da representação de suas propriedades: a
primeira pode ser menos precisa, mais compacta, porém deve ser adequada para que se possa avaliar,
através de correspondências, se as propriedades dos modelos expressas pela segunda linguagem (a oficial do
sistema semântico) satisfizerem os modelos.
Apenas para exemplificar, vamos adotar uma linguagem construída a partir das letras p ij pelo uso do
conectivo e, e como metalinguagem para descrição dos modelos a própria linguagem das letras pij . Assim a
sentença “p 12 e p21 ” é satisfeita pelos modelos
ilustramos o fato de que, inicialmente, de modo espontâneo o grupo social gera um certo sistema semântico,
digamos
As diferenças entre sistemas semânticos individuais é que, em última análise são responsáveis pelas
dificuldades de comunicação, gerando ambigüidades, etc...
impreciso e pouco metódico. No entanto algumas vezes os conceitos são representados pela utilização de
sistemas semânticos mais simples ou mais primitivos o que pode viabilizar a obtenção de uma formalização
sistemática e mesmo computável. De qualquer maneira consideraremos, inicialmente, que já temos uma
formalização A de algum fenômeno. A fase de interpretação é apresentada pela figura abaixo.
por observação. Nesta estrutura, há coisas que não podemos conhecer diretamente, necessitando de uma
cadeia lógica para chegar ao observável. A cadeia lógica vai até o nível do real. Podem haver coisas com
dependência pendente, necessitando de mais investigações, de uma hipótese ou teoria até chegar ao ponto
de uma dependência ou algo observável. Esta é a visão que temos do trabalho de um analista de
conhecimento. Estas hipóteses podem ser representadas através de regras introduzidas. O processo de
aquisição do conhecimento parte de um alvo desconhecido e, através de um diálogo, são listados as
dependências essenciais que fazem parte ou explicam aquele outro aspecto. Isto geraria as regras resultando
uma estrutura semelhante àquela. A questão fato1 depende dos fatos fato2, fato3 e fato4, isto pode ser
representado como uma regra:
Se fato2 e fato3 e fato4 então fato1
o fato 2 depende dos fatos fato5 e fato6 , portanto a regra:
Se fato5 e fato6 então fato2
e assim se constrói a hierarquia dada pelas regras, que também terá dependências. Os conceitos aqui
marcados são pendentes, os outros dependem deles. A aquisição de conhecimento é o processo de se obter
estas estruturas até chegar ao nível do observável.
Nesta seção estudaremos o próprio conhecimento, o que há em comum entre os diversos ramos
científicos em termos do saber por eles utilizados. Seguindo-se Mário Bunge (Bunge, 1967-1), é possível
classificá-lo em conhecimento formal (Lógica e Matemática) e conhecimento factual (específico de um domínio).
O primeiro é comum a todos os ramos científicos, apenas ajustando-se às interpretações dadas aos símbolos,
fórmulas e conceitos. O conhecimento factual é de natureza específica, geralmente particular, isto é, apenas
os especialistas em cada domínio de conhecimento podem ter acesso a esse tipo de saber.
Existem diversos ramos do perícia humana especializada que ainda não se revestem de um caráter
plenamente científico (não existem as correspondentes teorias) mas que estão sujeitos a métodos ou critérios
adotados pelos respectivos profissionais. Nestes ramos é possível pressupor a existência de algum tipo de
organização intrínseca do conhecimento nele envolvido, embora não se tenha fácil acesso a esta organização.
Em domínios de conhecimento factual especializado, há alguma forma intrínseca de organização do
conhecimento. Há evidências que apoiam este pressuposto como ponto de partida. Embora, tipicamente,
haja discordância de avaliações entre especialistas, observa-se que estas surgem muitas vezes em níveis de
detalhes específicos, indicando a existência de um conjunto básico de conceitos, uma espécie de núcleo da
área de saber.
Diante disto, surgem duas conseqüências importantes. A primeira é a possibilidade de adotar-se
uma abordagem epistemológica em relação à organização do conhecimento, que independe deste ou
daquele especialista. O mérito do especialista está em desenvolver uma aguçada capacidade de observação
em relação a uma área específica, de modo a estabelecer relações entre observações e conceitos de forma
adequada a obter conclusões corretas (ou quase sempre corretas) sobre esta mesma área. Deve ser ressaltado
que esta abordagem em nada diminui a importância dos especialistas, propondo apenas uma mudança de
enfoque: é possível a existência de especialistas porque o conhecimento é intrinsecamente organizável, o que
corresponde à noção de mundo intersubjetivo (Carnap, 1967), explorada na construção do sistema Episteme
(Braga, 1990), visto a seguir.
A segunda conseqüência é a possibilidade de adotar um tratamento sistemático para a construção de
um corpo de conhecimento, sendo possível construí-lo de forma gradativa e estruturada, podendo vir a
contribuir inclusive para melhorar a compreensão dos próprios conceitos envolvidos.
Em (Braga, 1990) é apresentado o sistema Episteme para aquisição e estruturação automáticas de
conhecimento, onde a estruturação do conhecimento é feita através de uma hierarquia de planos construída
por um processo de análise de classes e relações declaradas por um usuário.
Resumidamente, parte de um domínio de conhecimento formado por objetos em estudo ou
observação, obtendo classes que representem propriedades particulares destes objetos e relações que
estabeleçam propriedades comuns entre eles. Algumas classes e relações são básicas, não podendo ser
– 22 –
decompostas, enquanto outras são derivadas das básicas. A estrutura será então uma hierarquia de planos
de conhecimento correspondentes aos níveis de derivação das classes e relações, isto é, as básicas formam o
plano mais baixo da hierarquia, o plano imediatamente acima deste será formado por classes e relações que
podem ser derivadas diretamente das básicas e, genericamente, o plano de nível n será formado pelas classes
e relações diretamente deriváveis daquelas que formam o plano de nível n-1.
São três as bases teóricas utilizadas no sistema Episteme, sendo a principal a Teoria de estruturação do
conhecimento científico sobre o mundo proposta pelo filósofo positivista lógico Rudolf Carnap em (Carnap,
1969). Utiliza ainda a Teoria dos planos de conhecimento que é uma parte da teoria dos Sistemas semânticos
abstratos e a noção de Nível de conhecimento proposta por Allan Newell em (Newell, 1982).
Para que seja possível seguir uma abordagem sistemática é necessário a capacidade de identificar a
existência de conceitos cuja definição esteja incompleta. Por conceito está sendo chamado, de forma genérica,
um predicado ou atributo qualquer que se refira a algum objeto do domínio cujo conhecimento esteja sendo
adquirido. A determinação de que a definição de um conceito está incompleta pode ser feita a partir da
Teoria dos Planos de Conhecimento e de uma classificação dos conceitos, como visto a seguir. Para
completar a definição de um conceito, será utilizado um oráculo associado a um provador automático de
teoremas, visando permitir que se pergunte ao especialista quais são as partes que estão faltando na
estrutura do domínio de conhecimento correspondente.
São três horas da manhã. O plantonista de um hospital de médio porte está sozinho. Repentinamente a calma
rotina da madrugada é quebrada com a chegada estridente de uma ambulância trazendo uma emergência que
não foi sanada em um hospital com menos recursos. O plantonista recebe o paciente, cujo estado clínico se
agrava minuto a minuto; pelos testes já realizados, deteta que o caso é de uma especialidade que não domina.
Então dirige-se ao terminal de computador e aciona um programa médico que interage com ele utilizando tão
somente o jargão da medicina. O plantonista alimenta o programa com as informações fornecidas pelos testes e
observações dos médicos do outro hospital; o programa faz um diagnóstico e recomenda um tratamento; o
plantonista interroga-o a respeito das conclusões até estar satisfeito com as análises do programa. Assim, com
esta ferramenta – construida com a técnica de sistemas baseado em conhecimentos – o plantonista teve em
tempo hábil o conselho de uma junta de especialistas armazenado em um programa de computador.
Sistemas baseado em conhecimentos são frutos da aplicação de engenharia do conhecimento, uma das
três subespecialidades do domínio da Inteligência Artificial. As outras duas incluem robótica e consulta em
linguagem natural. Tais sistemas aplicam técnicas de Inteligência Artificial e conhecimento em problemas
específicos de um domínio determinado para simular a atuação de peritos humanos. A eficácia destes
sistemas depende diretamente de sua quantidade de conhecimento. Nenhum método genérico poderoso foi
encontrado para criar ambiente inteligente sem o suficiente conhecimento para raciocinar sobre ele. Todavia,
alguns métodos simples de inferência têm alcançado resultados impressionantes quando aplicados a uma
adequada base de conhecimento.
Sistemas baseado em conhecimentos são empregados como um auxiliar inteligente ou consultor para
usuários humanos. Podem ter usos na resolução de problemas de rotina, liberando os peritos para
problemas mais complexos. Podem também levar conhecimento especializado a localizações onde os peritos
não estejam disponíveis ou torná-las acessíveis quando os serviços especializados sejam muito dispendiosos.
Algumas organizações vêem sistemas baseado em conhecimentos como uma maneira de coletar e preservar
a “memória institucional” garantindo-a contra a rotatividade dos baseado em conhecimentos humanos que
podem se retirar das organizações, adoecer ou mesmo falecer.
Diferente dos programas convencionais, os sistemas baseado em conhecimentos podem resolver
problemas que exigem julgamentos do mesmo tipo que as pessoas se utilizam em seus trabalhos diários.
Alguns destes sistemas – aliás como alguns sistemas tradicionais – fornecem respostas em termos de
porcentagem de certeza, propagando dentro do programa graus de confiança associados a diversas
informações. Alguns sistemas têm capacidade de dar explicações, que dizem como as respostas foram
encontradas, sem o que em muito seria diminuída a credibilidade que os usuários neles depositam.
Em suas capacidades, projetos e forma de operação, sistemas baseado em conhecimentos diferem
profundamente dos sistemas convencionais. Provavelmente, as maiores diferenças residam na habilidade
dos primeiros simularem raciocínio humano, inferirem e fazerem julgamentos, freqüentemente com
informações incompletas; enquanto que os últimos efetuam tarefas puramente mecânicas e processam
dados, ainda que em alta velocidade. Outra diferença é que aqueles sistemas derivam suas conclusões e
soluções de heurísticas, baseadas em um domínio especifico de conhecimento, enquanto que os
convencionais geram seus resultados através de algoritmos. Também estes trabalham exclusivamente com
números e caracteres; enquanto que sistemas baseado em conhecimentos, com símbolos e conceitos.
Assim, os programas convencionais são, basicamente, constituídos de algoritmos, onde o
programador define todos os passos que os programas devem executar, e de uma grande massa de dados,
especialmente numéricos. Por sua vez, os sistemas baseado em conhecimentos introduziram uma importante
mudança no que diz respeito a filosofia de programação, sendo constituídos, basicamente, de uma grande
massa de conhecimento e de processos de inferências (Teive, 1995), assim, temos:
Dado + Algoritmo = Programa Computacional Convencional
Conhecimento + Inferência = Sistema Baseado em Conhecimento
Para funcionamento de um sistema baseado em conhecimento, é necessário representar
simbolicamente o conhecimento e transportá-lo para um computador que eletronicamente repetirá análises
peritas e estratégias de solução de problemas. Estes conhecimentos podem incorporar fontes e tópicos de
assuntos que não requerem aptidão ou educação especiais, como aqueles encontrados em livros ou manuais.
O conhecimento do domínio do problema referente a um sistema baseado em conhecimento é
organizado separadamente de outros tipos de conhecimento do sistema, como os procedimentos de
resolução de problemas ou de interação com o usuário. Esta coleção de conhecimento especializado é
– 28 –
Os fatos representam os conhecimentos que são sabidos a priori e que podem ser considerados como
ponto de partida para a resolução problema. São caracterizados também como os conhecimentos de domínio
público, de fácil acesso e que podem ser extraídos através de textos, manuais, normas, livros, postulados e
definições, constatação de fatos e resultados de experimentos.
As regras representam os conhecimentos inerentes ao assunto sendo estudado, expressando a forma
de pensar desenvolvida pelos especialistas (heurística), tendo por base os fatos já conhecidos e as deduções a
partir deles. Aqui, o termo heurística ou rules of thumb significa a habilidade, ou a simplificação utilizada pelo
perito no sentido de otimizar a busca da solução de um problema. Desta forma, novos conhecimentos
podem ser acrescidos à base de conhecimentos, habilitando o sistema a uma tomada de decisão sobre o
problema.
Nos anos 50, os pesquisadores já haviam estabelecido as fundações da Inteligência Artificial, incluindo
lógica matemática e teoria das funções recursivas, guiando a formulação de processamento de listas e da
linguagem Lisp que fornece um interpretador para desenvolver expressões simbólicas recursivas. Tais
capacidades suportaram o surgimento de sistemas práticos de computação simbólica. Ao mesmo tempo,
emergiram computadores interativos tornando possíveis ambientes computacionais para desenvolvimento e
depuração de programas incrementais. Nesta mesma ocasião, psicólogos cognitivos – estudantes da forma
de pensar humana – criaram caminhos, padrão do processo de investigação do raciocínio, modelando o
aparente processo de tomada de decisão em termos de regras de produção condicionais.
Já nos anos 60, os pesquisadores de Inteligência Artificial tentaram simular o complexo processo de
pensamento procurando métodos gerais para resolver uma ampla classe de problemas. No entanto, a
despeito de alguns progressos interessantes, as dificuldades eram enormes e não frutificaram. Então,
durante a década de 70 concentram-se esforços em técnicas como representação – isto é, modo de formular o
problema de maneira a tornar sua solução mais fácil, como controlá-la inteligentemente dentro da
capacidade de memória do computador. Esta estratégia produziu algum sucesso mas ainda não foi decisiva.
Somente no final da década fizeram a descoberta mais importante: o poder de resolver problemas do programa
depende mais do conhecimento que possui do que o formalismo ou esquema de inferência empregado, o que levou ao
desenvolvimento de programas de computador de propósito particular, sistemas que são peritos em alguma
área limitada surgindo os sistemas baseado em conhecimentos, e um novo campo se iniciou.
Os sistemas baseado em conhecimentos começaram a aparecer comercialmente nos primeiros anos da
década de 1980. Após terem se desenvolvido por quinze anos como mera curiosidade de Inteligência
Artificial aplicada em laboratórios de pesquisa, tornaram-se alvo de significativos esforços de
desenvolvimento tanto técnicos como comerciais. Estes sistemas empregam computador de maneira diversa
que o processamento de dados convencional, abrindo novas e importantes veredas.
O funcionamento de um sistema destes e a atuação de um especialista humano que pretende replicar
não são idênticas. Um ou outro podem em alguns casos desempenhar tarefas idênticas, contudo as
características de ambos são criticamente diversas. Mesmo havendo algumas vantagens evidentes destes
sistemas, eles não poderão substituir os peritos em todas as situações devido às suas limitações inerentes. A
experiência de técnicos humanos pode ser diminuída ou perdida quando não for exercitada por longo
– 29 –
tempo, risco inexistente com o conhecimento artificial que uma vez adquirido torna-se permanente – exceto
um acidente envolvendo sua memória armazenada. Também sua transferência resume-se a uma trivial cópia
de arquivos, enquanto a transmissão de conhecimento de um baseado em conhecimento a outro envolve um
demorado e custoso processo de educação.
A documentação da experiência humana é difícil e demorada, mas para o conhecimento especializado
artificial é relativamente simples, se resumindo ao mapeamento entre a maneira de representação do
conhecimento e sua descrição em linguagem natural. Conhecimento artificial produz resultados mais
consistentes e reprodutíveis que peritos reais. Estes podem tomar diferentes decisões em situações idênticas,
devido a fatores emocionais, como por exemplo, esquecendo-se de aplicar uma regra importante devido à
pressão de uma situa ção de crise; falha a que um sistema baseado em conhecimento não está suscetível.
A vantagem final de conhecimento artificial é seu baixo custo de utilização e reprodução, como
compensação ao seu alto custo de implantação, que pode levar vários anos. Os especialistas humanos,
especialmente os melhores, têm altos salários, enquanto que sistemas baseado em conhecimentos têm o custo
nominal do computador rodar o programa.
Os especialistas não podem ser simplesmente trocados por programas, pois o conhecimento artificial
tem algumas limitações. Uma delas é falta de criatividade. Um perito pode reorganizar informações e usá-las
para sintetizar novo conhecimento; pode manusear eventos inesperados usando imaginação ou novas
abordagens, inclusive raciocinando por analogia de um outro domínio completamente diferente. Sistemas
baseado em conhecimentos trabalham de maneira sem inspiração, rotineira.
No aprendizado, também há nítida vantagem do perito, que se adapta a mudanças de condições,
ajustando suas estratégias, tarefa muito difícil para um sistema baseado em conhecimento, embora isto já
esteja ocorrendo em domínios extremamente simples, não funcionando bem, quando confrontado com a
complexidade e detalhes de problemas reais.
Peritos humanos podem usar entradas complexas do sistema sensorial, disponíveis pelos cinco
sentidos. Sistemas baseado em conhecimentos manipulam símbolos que representam idéias e conceitos;
assim, dados sensoriais devem ser transformados em símbolos para serem compreendidos pelo sistema e
parte da informação pode ser perdida nesta transformação. Peritos humanos vêem o problema de maneira
ampla, examinando todos os seus aspectos, selecionando os relevantes; por outro lado, sistemas baseado em
conhecimentos focalizam-se no problema em si, ignorando informações isoladas que poderiam ser
importantes.
Finalmente, os seres humanos – peritos ou não – possuem o conhecimento advindo do senso comum,
que se constitui num largo espectro de conhecimento sobre o mundo, acumulado durante toda sua vida e
que permeia todas as suas decisões. Devido à enorme quantidade de conhecimento de senso comum, fatos
de domínio público que todos sabem, torna-se difícil construir um programa inteligente, particularmente um
sistema baseado em conhecimento.
Como um exemplo deste tipo de conhecimento, suponha que se examine um registro médico de um
paciente que pese 7 quilos e tenha idade de 25 anos. Imediatamente, haverá a suspeita de erro nos dados,
não porque isoladamente sejam impossíveis, mas sua combinação virtualmente o será; de fato, desconfiará
que os dados foram acidentalmente invertidos. Um sistema baseado em conhecimento médico não detectará
este tipo de erro, a menos que disponha de uma tabela idade-peso (e seus limites de tolerância) para conferí-
lo.
Senso comum inclui conhecimento sobre o que não se sabe assim como o que se conhece. Por exemplo,
se você for perguntado como a televisão noticiou um fato ocorrido no ano passado, puxará pela memória
para recuperar a informação. Se a pergunta fosse como a TV soviética noticiou outro fato, imediatamente
responderá que não sabe. Da mesma forma, se lhe perguntarem como a televisão brasileira informou a
Proclamação da República, você dirá que tal não ocorreu pois não havia televisão naquela época. Quando
um sistema baseado em conhecimento é questionado sobre informações que não disponha ou não existam,
ele não detecta esta situação por não possuir senso comum. Então, iniciará exaustiva pesquisa nos seus fatos
e regras para procurar a solução. Daí, quando esta não for encontrada, pode julgar que é porque seu
conhecimento está incompleto e solicitará informação adicional para completar sua base de conhecimento.
Por estas razões, sistemas baseado em conhecimentos são freqüentemente utilizados no
aconselhamento, como consultor ou ajuda para outro perito ou iniciante usar em algum problema que
necessite resolver.
Em contraste com sistemas avançados de processamento de dados, que automatizam
algoritmicamente extensos volumes de dados, sistemas baseado em conhecimentos ordinariamente
trabalham com pequenas tarefas, tipicamente desempenhadas por profissionais: interpretando,
diagnosticando, planejando, escalonando e assim por diante. Para acompanhamento destas tarefas, os
sistemas baseado em conhecimentos utilizam judiciosamente os dados e raciocinam com eles. Ao contrário
– 30 –
elucidação de estruturas químicas, matemática simbólica, jogo de xadrez, terapia e diagnóstico médico e
análise eletrônica.
A terceira razão para focar no conhecimento reconhece seu valor intrínseco: conhecimento é recurso
escasso cujos refinamento e reprodução geram riquezas. Tradicionalmente, a transmissão de conhecimento
requer educação e treinamento por longos anos. A extração deste conhecimento de peritos e a colocação em
forma computável podem reduzir grandemente seu custo de reprodução e utilização. Ao mesmo tempo, este
processo pode ser acelerado pela colocação do conhecimento heurístico disponível para emprego público. Já
na “Intemational Joint Conference on AI”, Feigenbaum atinou com o fator-chave de sistemas baseado em
conhecimentos: “A potência de um sistema baseado em conhecimento deriva do conhecimento que possui e
não de particular formalismo ou esquema de inferência que empregue.”
O primeiro período da pesquisa foi dominado pela crença ingênua em que poucas leis de raciocínio
acopladas com a potência de computadores alcançariam desempenhos em problemas especializados
superior ao dos peritos. Quando a experiência aumentou, o alcance severamente limitado de estratégias de
solução em problemas de propósito geral indicou que não era esta a direção a seguir. Em reação a esta
limitação percebida nas estratégias gerais, muitos pesquisadores começaram a trabalhar em problemas de
aplicação em escopo mais restrito.
No meio da década de 70, vários sistemas baseado em conhecimentos começaram a emergir. Algumas
investigações que tiveram sucesso em reconhecer a regra central do conhecimento nestes sistemas iniciaram
esforços para desenvolver teorias compreensíveis de representação do conhecimento em sistemas de
propósito geral. Em poucos anos, ficou claro que estes esforços alcançaram fracos resultados por razões
semelhantes àquelas que condenaram o resolvedor geral de problemas, tentado no inicio.
O conhecimento como um alvo de estudo é também largo e diverso; assim, esforços para resolver
problemas baseados no conhecimento em geral são prematuros. Por outro lado, várias abordagens diferentes
de representação do conhecimento provaram ser suficientes para os sistemas baseado em conhecimentos que
as empregaram. Assim, a pesquisa para aumentar a potência de representações gerais de conhecimento, a
despeito de intuitivamente ser aparentemente desejável, não apresenta justificativa empírica.
solução. Por outro lado, trabalha com aproximações factíveis, na inexistência ou impraticabilidade de um
processo algoritmo exato.
Quando codificada em sistemas baseado em conhecimentos, estas regras dirigem o processamento
através da massa de informações. Heurísticas tornam o processo de solução mais eficiente que pesquisas
exaustivas através do campo de possíveis soluções.
A representação do conhecimento é a estrutura formalizada e o conjunto de operações que envolve a
descrição, relacionamento e procedimento de um determinado domínio. O conhecimento representado em
um programa particular chama-se base de conhecimento. Exemplos de representações incluem regras de
produção do tipo “Se... então...”, quadros (frames) e redes semânticas. Diversos tipos de conhecimento
podem seguir representações diferentes. Regras de produção são mais adequadas para representação de
conhecimento dedutivo, como situação-ação, premissa-conclusão, antecedente-conseqüente e causa-efeito.
Quadros são mais indicados para representar conhecimento descritivo e relacional que reúne ou se ajusta a
algum protótipo tal como a descrição de um ambiente selvagem ou processo de contabilização. Redes
semânticas são úteis para modelagens de estruturas físicas ou ligações causais, como o inter-relacionamento
de elementos de um modelo econômico. De todas estas formas, a primeira é a mais largamente utilizada em
aplicações comerciais atualmente.
O formalismo de representação do conhecimento pode incluir formas flexíveis de descrição de
taxiomias conceituais e regras heurísticas condicionais. A primeira envolve relações entre tipos de objetos,
classes e individuais, determinando quais propriedades de um se aplicam a outros. Como exemplo, muitos
resolvedores de problemas podem acomodar e explorar fatos do tipo a seguir, que explicitam as regras de
acentuação em português:
onde as primeiras fórmulas são regras e as últimas fatos. Utilizamos também o asterisco (*) para identificar
variável, ao modo Witty, discutido no cap. 7.
A tarefa da máquina de inferência é selecionar e então aplicar a regra mais apropriada em cada passo
da execução do sistema baseado em conhecimento, o que contrasta com técnicas de programação
convencional, onde o programador seleciona a ordem na qual o programa deverá executar os passos, ainda
em tempo de programação.
Há sistemas que operam a inferência por caminhamento para a frente, outros se utilizam de
caminhamento retrospectivo e ainda outros empregam ambas as direções.
No caminhamento retrospectivo, o sistema parte da meta (como a identificação de uma espécie de
planta) e pesquisa a cadeia de premissas de todos os fatos envolvidos (como características botânicas) que
permite chegar a uma conclusão com o nome da espécie). No outro tipo de caminhamento, trabalha com
peças elementares de informação (como a lista dos componentes de um sistema de computador) e tenta
– 33 –
seguir para o objetivo combinando estes elementos (como a configuração impressa de componentes que
representem completamente um sistema de computador funcional).
Muitos sistemas que empregam caminhamento retrospectivo são usados para propósitos de
diagnóstico; eles iniciam com algum objetivo (uma lista de sintomas, por exemplo) e tentam descobrir quais
premissas podem ocasionar tais sintomas. Muitos sistemas que utilizam caminhamento para a frente são
usados para propósitos de construção; eles partem de uma série de premissas e as combinam para produzir
algum resultado final. Em muitos casos, a escolha de qual direção o sistema deverá executar é feita
reproduzindo a maneira utilizada por uma pessoa ao resolver o problema.
Conquanto seja possível escrever sistemas de regras de produção em qualquer linguagem de
programação, ambientes especialmente desenhados para o desenvolvimento destes sistemas podem agilizar
sobremaneira a sua construção. Um exemplo de um ambiente deste tipo, que tem viabilizado algumas
aplicações somente pelo fato de existir, é um projeto brasileiro resultado de duas décadas de pesquisa,
enriquecido por dissertações e teses – o Witty (Cap. 7).
Para examinar como seria o funcionamento de uma máquina de inferência, vamos considerar o
conhecimento de zoologia expresso pelas seguintes informações:
[F1] canta(canário)
[F2] é_ovíparo(serpente)
[F3] é_ovíparo(marreco)
[F4] é_ovíparo(pardal)
[F5] voa(morcego)
[F6] voa(marreco)
[F7] voa(pardal)
[R1] SE é_ave(*x) ENTÃO tem_penas(*x)
[R2] SE canta(*x) ENTÃO é_ave(*x)
[R3] SE é_ovíparo(*x) e voa(*x) ENTÃO é_ave(*x)
onde as três últimas representam regras gerais a respeito de qualquer animal (*x) e as primeiras são fatos
específicos de alguns animais.
Introduzindo ao sistema a pergunta O pardal tem penas?, ou, nesta representação
tem_penas(pardal)?, a máquina de inferência partirá da pergunta e examinará os fatos para ver se existe
algum que a responda trivialmente. Como neste caso tal não ocorre, passará a pesquisar os conseqüentes das
regras, à procura do predicado tem-penas, o que ocorre logo na R1.
Como nossa pergunta é sobre pardal e não sobre animais em geral, esta regra será instanciada para
um particular valor de *x (pardal). Este procedimento é permitido porque uma regra geral continuará a valer
em casos particulares e se trata de uma das mais poderosas ferramentas da inferência. Assim, a regra
instanciada resultará em
SE é_ave(pardal) ENTÃO tem_penas(pardal)
Percorrendo de novo a base de conhecimento, veremos que é_ave(pardal) não faz parte dos fatos;
– 34 –
então voltamos a percorrer os conseqüentes das demais regras, encontrando este predicado na R2 que,
particularizada para este valor de *x ficará:
SE canta(pardal) ENTÃO é_ave(pardal)
Agora a nossa submeta é canta(pardal) que, se conseguirmos provar, então será verdade o
antecendente desta regra é_ave(pardal) o que permitirá caminhar para trás até responder a pergunta
original. Infelizmente, este predicado não aparece em nenhum outro fato ou regra da base; quer dizer que
esta caminho falha, precisa ser abandonado e retornar ao passo anterior.
Novamente varrermos a base na procura do predicado ave, encontrando-o no conseqüente da R3, que
instanciada resulta
SE é_ovíparo(pardal) E voa(pardal) ENTÃO é_ave(pardal)
Então nosso objetivo se converteu em duas sub-metas, ambas devendo ser provadas. Felizmente, elas
são fatos (F3 e F7), prosseguindo, é_ave(pardal) é verdadeiro, logo pela R1 tem_penas(pardal) também é
verdade; assim a resposta à pergunta é “SIM”. Este raciocínio está resumido na tabela a seguir e
graficamente, na Fig. 2.2 a seguir.
Inferência
Passo Regra Resultado
1 R1 SE ave(pardal) ENTÃO tem_penas(pardal)
2 R2 SE canta(pardal ENTÃO ave(pardal)
>>> FALHA <<<
3 R3 SE ovíparo(pardal) E voa(pardal)
ENTÃO ave(pardal)
4 F3 ovíparo(pardal)
5 F7 voa(pardal)
6 3 ave(pardal)
7 1 tem_penas(pardal)
tem_penas(pardal)
BASE DE CONHECIMENTO
Se é_ave(pardal)
[F1] canta(canário)
então tem_penas(pardal)
[F2] é_ ovíparo(serpente)
[F3] é_ovíparo(pato)
[F4] é_ovíparo(pardal) 2
[F5] voa(morcego) Se canta(pardal)
[R3] SE é_ovíparo(*x)
E voa(*x)
ENTÃO é_ave(*x) é_ave(pardal) 3
Redes Semânticas. Podem ser definidas, basicamente, como a representação de conhecimentos de vários
objetos, como se fosse um conjunto de triplas O-A-V, ou a forma de representar vários objetos e diversos
atributos desses objetos. Esquematicamente, as redes semânticas são representadas como um conjunto de
nós ou nodos que são ligados por meio de arcos, onde cada nodo representa um objeto, uma entidade
conceitual ou um evento e cada arco representa o relacionamento existente entre cada par de nodos, sendo
que cada par de nodos representa um determinado fato. A medida que novos fatos vão sendo associados,
cada nodo pode ser ligado a outros nodos, proporcionando o desenvolvendo da rede. A Fig. 1.3 mostra a
representação de rede semântica, onde o nodo “Lote ARE” especifica um determinado tipo de terreno que
herda todos os atributos concernentes ao nodo/objeto “Terreno” e, também, possui os seus próprios
atributos. A propriedade de “herança” proporciona uma considerável redução na memória de
armazenamento de conhecimentos.
dependendo do tipo de conexão existente, uma quantidade significativa de nodos, ou até mesmo todos,
podem ser pesquisados.
Lógica Proposicional. A lógica é uma das mais primitivas formas de representação do raciocínio ou
conhecimento humano. No campo da IA, é uma das primeiras formas de representação do conhecimento.
Segundo (Nolt, 1991), a lógica é o estudo de argumentos, onde um argumento é uma seqüência de
enunciados na qual um dos enunciados é a conclusão e os outros são premissas, as quais servem para provar
ou evidenciar a conclusão. As premissas e a conclusão são os enunciados ou proposições.
A lógica proposicional é considerada a forma mais comum da lógica. Baseia-se em que uma
proposição só pode ter um dos seguintes valores: verdadeira ou falsa. As proposições podem ser ligadas
através de conectores ou operadores lógicos formando, assim, as proposições compostas. A Tabela 2.1
mostra os operadores utilizados pela lógica proposicional.
Lógica de Predicados. A lógica de predicados é considerada como uma extensão da lógica proposicional.
Naquela, a validade das proposições (sentenças simples e completas), verdadeiras ou falsas, não leva em
consideração os predicados, ou conceitos, ou atributos, ou relações que um determinado objeto possui, não
conseguindo, assim, caracterizar um objeto ou uma determinada classe de objeto. Em outras palavras, a
lógica proposicional não leva em consideração a estrutura interna das sentenças
Na lógica de predicados os elementos fundamentais são, além do objeto, os seus predicados. Os
predicados são então utilizados para representar os conhecimentos sobre um determinado objeto, levando
em consideração a estrutura interna das sentenças. Os predicados podem estar relacionados com mais de um
objeto e, também, podem ser conectados através dos operadores lógicos. O exemplo a seguir mostra a
insuficiência da lógica proposicional. Assumindo a veracidade dos seguintes fatos:
1. Se for inverno em Paris será verão em Brasília.
2. Se for verão em Brasília, então estará chovendo.
3. Agora é inverno em Paris.
A questão é: Agora está chovendo em Brasília?
Os fatos 1 a 3 acima estão expressos em linguagem corrente e precisaremos utilizar símbolos para
representá-los. Desta forma, seja P, Q e R respectivamente “inverno em Paris”, “verão em Brasília” e “está
chovendo em Brasília”. Introduzindo o símbolo lógico ‘ ‘ (implica), chegaremos a
1. P Q
2. Q R
3. P
que é a tradução daquelas sentenças para fórmulas lógicas. Como conseqüência da validade das fórmulas de
1 a 3, pode-se deduzir que a fórmula
4. R
é igualmente válida, ou seja, é conseqüência lógica das precedentes. Quer dizer, estará chovendo em Brasília.
Vamos agora considerar outro exemplo, expresso pelos seguintes fatos clássicos:
5. Sócrates é um homem.
6. Todo homem é mortal.
Para representar estes fatos precisamos de um novo conceito chamado predicado. Teremos é_homem(*x)
representando “*x é um homem” e é_mortal(*x) para “*x é mortal”. Também necessitaremos do símbolo ‘‘
para significar “para todo”. Assim, os fatos referidos poderão ser escritos como:
– 37 –
1. é_homem(Sócrates)
2. x é_homem(x) é_mortal(x)
a partir de onde pode-se deduzir logicamente que
3. é_mortal(Sócrates)
significa que Sócrates é mortal.
A lógica de predicados utiliza palavras ou símbolos especiais, chamadas de quantificadores que
tornam as proposições mais exatas ou definidas (Tabela 2.3), além daqueles utilizados na lógica
proposicional.
Símbolo Significado
x “para todo”- Quantificador Universal
x “existe”- Quantificador Existencial
Frames. O uso de frames na representação do conhecimento, significa estruturar através de um quadro (ou
armação, ou moldura), o conhecimento sobre um determinado objeto, ou conceito ou situação. A idéia do
uso de frames, no campo da IA, tem origem a partir de Minsky (Minsky, 1975), para justificar e representar o
reconhecimento de um objeto através da “observação visual”. Segundo esta idéia, o reconhecimento de um
objeto é realizado através da “comparação” de algumas de suas principais propriedades, aquelas que
estamos observando visualmente, com aquelas propriedades já definidas e conhecidas de um objeto
estereotipado e que estão armazenadas na nossa memória. Então, podemos construir uma estrutura, frame,
para um objeto_tipo, contendo suas principais características (slots), cada qual com os seus respectivos
valores e, através desta representação (similar a uma tripla O-A-V), definirmos o objeto à ser reconhecido. A
vantagem do uso de frames com relação as redes semânticas é a facilidade de podermos estruturar uma
maior quantidade de características pertinentes ao objeto.
Segundo (Jackson, 1986), a representação do conhecimento baseada em frame é, devido a sua
organização, mais fácil de ser compreendida do que a representação através da lógica ou através de sistemas
de produção com um significativo número de regras, levando-nos a uma “tendência” em adotá-la.
Entretanto, (Brachmar, 1985), cita que o maior problema no uso dos sistemas baseados em frames reside,
ironicamente, na livre possibilidade de alteração ou cancelamento de slots, o que pode levar-nos à
impossibilidade de expressar certas verdades universais, tal como, definir, de forma absoluta, o frame
elefante, pois, pode ocorrer a existência de um elefante com três pernas. (LUGER, 1989) caracteriza este
problema como o “problema do frame”, isto é, a impossibilidade da formação de uma base de conhecimento
que possa ser considerada absoluta, ou perfeitamente suficiente, ou completa, para a maioria dos domínios
do mundo real.
implícito, por pares A-V. As regras de produção podem ser constituídas de várias proposições, tanto na
parte If (premissa) como na parte Then (conclusão), por exemplo:
parte If: O lote é do tipo área_1 ou área_2 and tem área superior a 450,00 m2,
parte Then: Só poderá ter uso residencial and
a taxa de ocupação do lote deverá ser de no máximo 40%.
Na parte If as proposições podem ser ligadas pelos conectores and e or, enquanto que na parte Then
as proposições só podem ser ligadas pelo conector and, pois tratam-se de constatações (conclusões) que
devem ser sempre verdadeiras.
Quando a parte If (condição) é verificada, o sistema baseado em conhecimento através de sua
máquina de inferência, executa o seu “disparo” (inferenciação), isto é, realiza a parte Then (ação). Este
procedimento pode determinar o acréscimo, modificação, ou remoção de fatos dentro da base de
conhecimento. Existem dois tipos de inferenciações ou encadeamentos: o encadeamento para frente ou
forward-chaining e o encadeamento para trás ou backward-chaining, cujo funcionamento é análogo ao
explicadao atrás.
Uma vez adotado um especial instrumento de solução de problemas, deve-se preencher a base de
conhecimento antes de iniciar a aplicação. Estas bases de conhecimento consistem primordialmente de fatos
e regras.
Programas convencionais devem seguir um conjunto prefixado de instruções, não possuindo recursos
para se adaptar à mudanças das circunstâncias: sistemas baseado em conhecimentos, por outro lado,
incorporam conhecimento que adquirem de peritos humanos, aplicando-os de novas maneiras em diferentes
circunstâncias.
Em programas convencionais, o conhecimento não é representado explicitamente. Ainda que afete
cada instrução escrita, o conhecimento nunca será separado dos procedimentos que detalham a entrada, o
processamento e a sadia. Nestes programas, o conhecimento sobre a aplicação está espalhado através do
código, e a mudança de um simples fato pode requerer a correção de centenas de linhas em vários
programas. Se uma cadeia de lojas tiver, por exemplo, nove depósitos, cada um representado por um único
dígito em seus programas de inventário e contabilidade, quando for criado o décimo depósito, o custo de
reescrever os programas que permitam o segundo dígito pode-se tornar extremamente elevado.
– 39 –
Desta forma, o problema em sistemas convencionais está em que cada novo fato requer adaptações no
programa: quando um campo de um arquivo necessita ser redimensionado, todos os programas que o
utilizem precisam ser modificados. Cada alteração em impostos, política comercial e formas de relatórios,
requer remendos nos correspondentes programas. Para simplificar modificações, um sistema de
gerenciamento de banco de dados pode remover a descrição de formatos dos procedimentos descritos nos
programas e os colocar em tabelas não procedimentais. Assim, ao invés de ler e gravar independentemente
os arquivos, os programas que o acessem chamam o gerenciador de banco de dados (SGBD) para fazer as
alterações. Desta forma, dados e formatos são controlados pelo SGBD sob a direção de uma tabela de
descritores separada. Sempre que formatos e unidades sejam alterados, somente os descritores mudarão; os
procedimentos permanecerão inalterados.
Se um problema for tão difícil que nenhum humano saiba como iniciar, nenhum sistema de
computador poderá igualmente resolvê-lo. Se o problema requerer julgamentos intuitivos sobre situações
novas – como calcular o potencial de mercado para uma nova invenção ou um roteiro de novela – então a
intuição não poderá ser formalizada num sistema baseado em conhecimento. As aplicações ótimas para tais
sistemas são aquelas que requerem grande volume de conhecimento bem definido e formalizável.
Sistemas baseado em conhecimentos podem servir como filtro para distinção da situação critica em
dezenas de casos rotineiros. Um especialista humano é melhor qualificado que um programa de computador
para julgar o potencial de petróleo ou depósito mineral em uma dada localização. No entanto, a quantidade
de locais a observar e de dados torna-se muito grande, de forma que o sistema acaba sendo necessário para
efetuar a triagem dos mais promissores para a visita do geólogo.
Do vasto acervo de sistemas baseado em conhecimentos existentes, à guisa de um rápido painel sobre
o assunto, destacaremos uma área representativa – a médica – e descreveremos algumas experiências
brasileiras.
O DXplain está em uso em vários hospitais e escolas médicas, para consultas médicas, mas
principalmente para educação clínica. Também assume o papel de um livro-texto eletrônico em medicina, ao
correlacionar manifestações e doenças, fornecendo inclusive referências bibliográficas relevantes.
O sistema HELP é mais um bom exemplo. Foi desenvolvido em 1980 na Universidade de Utah. Ele
não apenas apoia as aplicações de rotina de um sistema de informação hospitalar, incluindo o gerenciamento
das admissões e altas, e das prescrições médicas, mas também inclui uma função de apoio à decisão,
emitindo alertas e lembretes aos clínicos, interpretação de dados e diagnóstico de doenças, sugestão de
manejo de pacientes e protocolos clínicos.
O Quick Medical Reference System (QMR) realiza o diagnóstico diferencial em muitas áreas da Medicina
Interna, sendo também útil para ensino. Contudo, tem um grau de profundidade limitado em várias áreas,
como nas doenças cardiovasculares. Seu desempenho foi testado com 31 casos não solucionados dos serviços
médicos de dois hospitais universitários. O diagnóstico obtido foi comparado com a melhor hipótese
diagnóstica fornecida pelo médico que atendia os casos. O diagnóstico definitivo foi o encontrado para os 20
casos que foram resolvidos depois de um seguimento de seis meses. O médico acertou 80% destes casos e
QMR 85%, uma diferença não significativa. Porém, os médicos que não cuidavam do caso (residentes, por
exemplo), acertaram apenas 60% dos diagnósticos. O trabalho de avaliação foi publicado em Annals of
Internal Medicine. 1989; 110(10):824-832). O programa QMR está comercialmente disponível através da
Camdat Corp., Tel. 1-800/875-8355.
A despeito destas histórias de sucesso, os sistemas baseado em conhecimentos não estão sendo usados
rotineiramente. As razões citadas por (Coieira, 1998) são as seguintes:
1. exigência de um sistema de registro médico computadorizado para fornecer os dados (muitas
instituições ainda não têm seus dados disponíveis eletronicamente);
2. projeto de interface pobre desencorajando o emprego, embora mostrem benefícios;
3. pouca adaptação ao processo de assistência médica, exigindo esforço adicional dos profissionais
médicos, já sobrecarregados; e
4. “tecnofobia” dos trabalhadores de saúde com respeito ao uso de computadores. Este autor, no entanto,
acredita que se os usuários de um sistema sentirem que oferece benefício, o utilizarão. Se não,
independentemente de seu valor, provavelmente será rejeitado. Já existem atualmente muitos sistemas
que conseguiram ser aceitos na prática clínica.
– 43 –
(Widman, 1998) acrescenta que embora a área de computação médica tenha contribu ído
significativamente para a melhoria da atenção à saúde, um estudo feito por Shortliffe lança uma sombra
sobre este otimismo. Levantamento de 168 visitas sucessivas em uma clínica de Medicina Interna revelou
que, apesar dela ter toda as histórias clínicas de seus pacientes, com resultados de laboratório e de
radiologia, em 81% das visitas alguma informação julgada importante pelo médico não estava disponível.
Informa ainda que achados semelhantes foram relatados pelo Workgroup for Electronic Data Interchange, de
que 50% dos registros médicos baseados em papel hoje, ou estão perdidos completamente ou contêm dados
incompletos. Outro estudo feito em 1996, encomendado pelo Institute of Medicine dos EUA, descobriu que
cerca de 30% das prescrições de tratamento médico nunca são documentadas.
Este autor conclui dizendo que o campo de informática médica não é novo, contudo parece estar em
sua infância no que se refere a incrementar a prática médica. A informática médica tem o potencial de
beneficiar o atendimento ao paciente, de uma maneira tão efetiva quanto a descoberta de um novo
medicamento ou terapia. Os seus benefícios diretos serão derivados do fato de podermos aumentar a
capacitação e a ação dos médicos e de outros profissionais de saúde , através do melhor acesso ao
conhecimento médico e informação. Esta é a promessa de informática médica e estará à frente evidentemente
do processo de forjar uma nova prática médica na era da informação.
Formas de representação do conhecimento. A mais comum é como sistema de produção baseados em
regras. Estas são formas de representação baseadas em associações entre conceitos, como por exemplo:
“ondas de Osborne são associadas à hipotermia”. Normalmente as regras não definem relações causa-efeito, mas
apenas “receitas” de decisão, usadas no dia-a-dia do profissional. O mecanismo de inferência verifica a
veracidade das regras para cada caso, podendo combinar várias delas até chegar a uma decisão com alto
grau de probabilidade. Um exemplo de uma regra de produção é:
Se as seguintes condições forem verdadeiras:
1) o paciente apresenta estridor respiratório;
2) há história prévia de insuficiência respiratória congestiva
então são prováveis os seguintes diagnósticos:
1) edema pulmonar, com uma probabilidade de 80%;
2) asma, com uma probabilidade de 50%
3) embolismo pulmonar com uma probabilidade de 20%.
Por outro lado, os fatores que favorecem uma disseminação crescente de tecnologias de sistema baseado em
conhecimentos são:
1. Avaliação do custo versus eficácia de atendimento médico pagos per capita;
2. Aumento da qualidade na assistência ao paciente;
3. Diminuição das barreiras técnicas (acesso disseminado à Internet, aumento no conhecimento básico de
informática pelos usuários médicos, disponibilidade de computadores mais poderosos e mais baratos).
Um exemplo nacional. O Hospital Virtual Brasileiro, desenvolvido e gerenciado pelo Núcleo de Informática
Biomédica da Unicamp, usa o potencial da Internet para tornar disponíveis informações da qualidade de um
centro de referência. O seu conteúdo é composto por dados estruturados médicos e da área da saúde
humana. Sua arquitetura segue a metáfora de um hospital real, com a informação organizada em
departamentos e setores virtuais.
Aplicações agrícolas. Trabalhos apresentados nos simpósios da Agrosoft, Congresso de Informática Aplicada
à Agropecuária e Agroindústria .
Diagnose Virtual: Um Sistema para Diagnóstico de Doenças do Milho via Web. Relata aspectos de um sistema para
Diagnóstico de Doenças do Milho que foi implementado no subprojeto de Diagnóstico Remoto em
desenvolvimento na Embrapa Informática Agropecuária em parceria com a Embrapa Milho e Sorgo. Este
subprojeto objetiva a implantação de um ambiente na área de sanidade que possilite o diagnóstico de
doenças remotamente e permita também que os produtores e extensionistas tenham um maior acesso aos
veterinários e fitopatologistas da Embrapa através de consultas virtuais. Este subprojeto integra três facetas
tecnológicas: Sistemas Especialistas, Internet e Sistemas de Multimídia.
[www.agrosoft.org.br/trabalhos/ag99/artigo18.htm]
AGROFLO: Sistema Baseado em conhecimento para Planejamento de Sistemas Agroflorestais. Demonstrando a
viabilidade e a aplicabilidade dos sistemas baseado em conhecimentos no processo de planejamento e
projeto de sistemas agroflorestais, foi desenvolvido um protótipo denominado AGROFLO, especificamente
para o caso de sistema “Taungya”, uma forma particular de estabelecimento de culturas florestais em
associação com culturas agrícolas temporárias. Também, devido a grande amplitude do Estado de Minas
Gerais, o sistema teve suas recomendações restritas a duas áreas geográficas do Estado - as Macrorregiões de
Planejamento I - Metalúrgica e Campo das Vertentes e II - Zona da Mata Mineira.
O sistema está dividido em quatro módulos. O primeiro seleciona os componentes do sistema agroflorestal;
o segundo e o terceiro determinam o espaçamento e a necessidade de adubação das culturas,
respectivamente, e o quarto módulo agrega as informações anteriores e as apresentam ao usuário na forma
de um relatório conclusivo. O resultado do teste de validação do AGROFLO, mostrou que o sistema
– 45 –
incorporou, com sucesso, o conhecimento dos peritos consultados. Este fato, aliado ao baixo tempo de
execução apresentado, pode torná-lo um instrumento útil para demonstrar a potencialidade da utilização da
técnica de sistemas baseado em conhecimentos na área de agrossilvicultura, associadas a programas de
fomento florestal.
[http://agrosoft.com/ag95/papers/doc35.htm]
Sistema Baseado em conhecimento no Controle de Gado de Leite. No contexto de agropecuária e agronegócios, os
Sistemas Baseados em Conhecimento podem se revelar importantes instrumentos de auxílio à tomada de
decisões, fornecendo interpretações de resultados técnicos e econômicos e recomendando ações a serem
implantadas. Assim, este sistema controla um rebanho leiteiro ao interagir com o usuário através de
perguntas sobre o manejo do rebanho e apresenta, ao final de cada sessão, um diagnóstico contendo os
problemas encontrados no gado em questão, bem como as soluções viáveis. Além disso, fornece um roteiro
organizado de análise do problema, ao elaborar um instrumento de auxílio à difusão de tecnologia pela
extensão rural, contando com esclarecimentos, sugestões e recomenda ções técnicas.
[http://agrosoft.com/ag95/papers/doc42.htm]
Aplicações médicas
Diagnóstico de Cardiopatias Isquêmicas, desenvolvido pela Fundação Bahiana de Cardiologia e COPPE/UFRJ.
Esta é uma das doenças de maior incidência no Brasil e no mundo. Pode apresentar -se com agina estável,
instável ou infarto agudo do miocárdio. Um sistema baseado em conhecimento pode ser de extrema
validade, pois, a partir de um grupo de informações básicas iniciais, o sistema pode conduzir um diálogo
com o usuário-médico, a fim de levá-lo ao diagnóstico mais provável. Apoiando na formulação diagnóstica
do problema do paciente e na determinação do tipo e forma de atendimento que lhe deverá ser dado, em
função da gravidade de seu quadro clínico, poderá ser utilizado em unidades de atendimento periféricas
urbanas, de natureza primária da rede pública de saúde, visando auxiliar o médico não especialista, no
encaminhamento de pacientes que requeiram atendimento em uma unidade de referência especializada. Em
sua primeira versão, o sistema obteve para 88 casos de teste, um desempenho conforme o esperado em 80%
dos casos.
[www.informaticamedica.org.br/informed/isquem.htm].
infantil, diarréia infecciosa em neonatos, e doenças exantemáticas. A montagem dessas bases, usando o
NIACIN, é relativamente simples e rápida. Assim, o mecanismo de inferência utilizado no NIACIN, que é
semelhante ao usado no programa TROPICAL, foi testado com sucesso em 40 casos clínicos e
anatomoclinicos obticos junto ao Hospital Universitário da UFRJ.
[www.informaticamedica.org.br/informed/niacin.htm].
Aplicações jurídicas.
CENAJUD - Central Nacional de Decisões Judiciais sobre Drogas. Profissionais como juízes, promotores,
advogados, procuradores, agentes públicos, etc., dispõe de muitos bancos de dados legislativo e de
jurisprudência, através da Internet ou de sistemas do mercado. São centenas de Tribunais, gerando mais de 6
milhões de documentos. Esta recuperação em muitos sistemas ainda requer uma sintaxe para a consulta. Isso
dificulta o acesso ao usuário final, que utiliza na maioria das buscas nestas bases, auxílio de profissionais
intermediários, que conhecem o funcionamento da base de dados, suaa linguagem controlada e a indexação
praticada nele. Esta ferramenta, emprega recuperação de decisões Judiciais com técnicas de Inteligência
Artificial; permite a consulta em linguagem natural, o refinamento da pesquisa através de filtros e a
indexação automática de novas decisões judiciais.
[http://www.ijuris.org/projetos/projetos.htm]
Engenharia Naval
O departamento de Engenharia Naval e Oceânica da Coppe/Ufrj desenvolveu o sistema Diagnóstico de
Motores Diesel, uma aplicação de sistemas baseado em conhecimento utilizando monitoração de variáveis
operacionais ou análise química do ó1eo lubrificante.
[www.oceanica.ufrj.br/]
Monitoração da fotossíntese
O Laboratório de Automação Agrícola da Escola Politécnica da USP propôs a modelagem de fotossíntese por
redes neurais artificiais, uma oportuna aplicação que pretende analisar a absorção do CO2 da atmosfera. É de
domínio público que o efeito estufa, agente do aquecimento global, promove sérias conseqüências à vida
através de alterações climáticas, como secas e enchentes catastróficas, ameaçando a biodiversidade. A
queima de combustíveis fósseis libera na atmosfera enormes quantidades de dióxido de carbono, principal
gás de efeito estufa. Em resposta a essas constatações, sentiu-se a necessidade de controlar a concentração
deste gas. As implicações à existência humana apontam para a a grande importância de se conhecer e
mensurar a fotossíntese, definidora de sumidouros de CO2. Alguns pesquisadores avaliam o potencial da
floresta para atuar como um sumidouro de dióxido de carbono atmosférico. Fala-se da fertilização por este
gás, que é a intensificação da produtividade da vegetação terrestre, com um maior crescimento das plantas,
produzida por efeito de uma concentração elevada de CO 2. Avaliar a troca deste gás nas plantas em seu
ambiente natural, revela-se de importância fundamental. Este trabalho modelou a fotossíntese, transpiração
e condutância estomática com redes neurais artificiais, no nível da folha em Hymenaea courbaril L. (jatobá),
utilizando os dados coletados no projeto de Fitomonitoração.
[www.pcs.usp.br/~laa/Grupos/CLIMA_modelagem_de_fotossintese.php]
O símbolo do livro aberto no canto superior esquerdo dos objetos indica a existência de arquivo
associado, ilustrados pela Fig. 3.2 da página seguinte.
– 48 –
Reunindo os demais assuntos que houver (neste exemplo mais três) de maneira semelhante aquela
mostrada atrás, precisaremos criar uma porta de entrada para acessar os assuntos, como esta da Fig. 3.3 a
seguir. As setas apontando para a direita no canto superior esquerdo identificam que estes objetos estão
expandidos numa página de continuação, página esta onde este mesmo objeto aparece com a seta apontado
para a esquerda (ver Fig. 3.1), indicando que se originou de outra.
No sentido mais estrito – não levado em conta na montagem anterior – estas setas indicam
dependência lógica, onde os elementos descendentes são argumentos usados para justificar o ascendemte,
formando uma cadeia de dedução que pode ser analisada para comprovar ou negar uma tese sendo
avaliada. Para isso, considere um evento sobre «Lúcio Apuleio, escritor latino (c. 125 - c. 180). Casado com
uma viúva rica, foi acusado pelos parentes de sua esposa de haver utilizado magia para obter seu amor.
Defendeu-se através de uma célebre Apologia , que se conservou até nossos dias» [Wikipedia].
A partir de fragmentos de texto retirado de «Apuleio acusado de magia» (História Viva, n°
43, maio/2007, p. 45 a 47), vamos estruturar o texto em objetos para responder à questão:
Apuleio utilizou-se de encantos mágicos
Colocaremos um a um os argumentos e sua representação no Idealize ao lado:
– 49 –
Há mais dois argumentos que omitiremos porque os três discutidos são suficientes para a
demonstração que pretendemos. As cores diferentes para os argumentos da acusação (verde) e da defesa
(vermelho), agregam mais informação ao gráfico. Como veremos, o uso de cores é padronizado no Idealize
permitindo uma identificação imediata de seu significado, podendo ser adaptado pelo usuário.
O gráfico completo encontra-se na Fig. 3.4 a seguir.
Para esta demonstração, vamos focalizar nossa atenção na ação do terror em Madri, que ocorreu em
11 de março de 2004, tentando responder à pergunta
As declarações do governo espanhol que aquele atentado era da ETA,
influiram no resultado das eleições?
Para estruturar este levantamento, precisamos tomar umas decisões prévias sobre onde iremos buscar
informações e avaliar estes meios. As notícias que vemos na imprensa não devem ser encaradas como
verdades absolutas, mas sim como versões, mais ou menos fiéis aos acontecimentos, cujas imprecisões
podem advir de erros de avaliação intencionais ou não. Assim, fidelidade das fontes de notícias é um
aspecto que sempre devemos levar em conta. Nem sempre são isentas e podem defender algum interesse.
Para exemplificar, durante o segundo governo de Vargas, a Última Hora sempre o apoiava, enquanto as
publicações vinculadas à UDN o denegriam sistematicamente, com uma paixão que transcendia à verdade.
Na atualidade, a grande imprensa brasileira tenta ser menos sectária. Ainda assim, o primeiro cuidado que
se deve tomar é com a fonte da notícia, qual é sua orientação editorial, quais os interesses dos proprietários
ou dos anunciantes, a ótica ou opinião do jornalista e assim por diante.
– 50 –
Desta forma, para melhorar nossa aproximação aos fatos, devemos sempre buscar informações em
diversas fontes. Entre aquelas disponíveis com acesso pela Internet, estão os portais de notícias, as revistas e
os jornais. Preferimos estes últimos, para poder acompanhar a evolução das notícias diariamente. Vale a
pena lembrar que, em geral, exigem algum tipo de assinatura para acessar seus sites. Para simplificar este
exercício, dispensamos os jornais internacionais – como Times, Le Monde, El País ou NY Times – e nos
fixaremos em dois veículos nacionais, a Folha de S. Paulo e o Jornal do Brasil que, para este assunto
específico podem ser considerados isentos.
Nossa intenção é acompanhar os acontecimentos até que tenhamos dados suficientes para responder
à questão, o que pode significar muitos dias. Manteremos também as notícias das duas publicações em
conjuntos separados para uma melhor análise de insenção, levando em conta as considerações acima.