Vous êtes sur la page 1sur 22

Revista de Estudos Politcnicos Polytechnical Studies Review 2008, Vol VI, n 10, 199-220

ISSN: 1645-9911

Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial


Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez
jpereira@ipca.pt, fdiaz@infor.uva.es, marod@udc.es

(recebido em 9 de Maio de 2008; aceite em 3 de Novembro de 2008)

Resumo: A previso do fracasso empresarial um tema actual que interessa cada vez mais aos diversos agentes econmicos, em particular aos investidores, credores, entidades financeiras, mas tambm aos governos. Na literatura da especialidade existem inmeros trabalhos que aplicam uma ampla variedade de tcnicas para analisar este problema. Neste trabalho apresentamos um mtodo relativamente recente de avaliao do risco de fracasso empresarial com base da teoria dos Rough Sets. Esta teoria permite obter um conjunto de atributos de condio que asseguram um nvel aceitvel de classificao das empresas analisadas, permitindo com isso obter regras para elaborar um sistema de suporte tomada de decises. Para a seleco do subconjunto dos atributos relevantes foi utilizado o princpio de comprimento mnimo de descrio aplicado a uma amostra de empresas portuguesas de diversas indstrias. A percentagem global de acertos do modelo estimado para um, dois e trs anos antes da ocorrncia do fracasso foi de 97,43%, 93,15% e 91,69%, respectivamente. Palavras-chave: Previso de Insolvncia, Fracasso Empresarial; Rough Sets, Rcios Financeiros Abstract. Prediction of corporate bankruptcy is a phenomenon of increasing interest to investors, creditors, borrowing firms, and governments alike. In the literature of the specialty we can found a lot of works that apply a wide variety of techniques to analyze this problem. In this work we present a method relatively recent of evaluation of the risk of business failure with base of Rough Sets theory. This theory allows obtaining a group of condition attributes that assure an acceptable level of classification of the analyzed companies, allowing with that to obtain rules to elaborate a decision making process system. For the selection of the subset of the relevant attributes was used the minimum description length principle. For the empiric application we have used a sample 199

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

of Portuguese companies of mixed industries. The overall predictive accuracy of the model for one, two, and three years before bankruptcy was 97,43%, 93,15% and 91,69%, respectively. Keywords: Bankruptcy Prediction; Financial Distress; Rough Sets; Financial ratios

1 Introduo
O problema do fracasso empresarial tem sido, e seguramente continuar a ser, um tema de especial interesse para um amplo conjunto de agentes econmicos. O fracasso das empresas pode resultar de um conjunto de causas diversas e complexas, de natureza interna e externa, podendo ser imputado, por exemplo, a uma deficiente estrutura organizativa, prpria estratgia da empresa, modificaes tecnolgicas ou evoluo da conjuntura econmica. A elaborao de modelos de previso do fracasso empresarial um campo de investigao que foi impulsionado pelos trabalhos pioneiros de (Beaver, 1966) e (Altman, 1968) sendo crescente o nmero de investigadores que se interessam por esta temtica. Na literatura da especialidade existem inmeros trabalhos que aplicam uma ampla variedade de tcnicas para analisar este problema. Fazendo apenas referncia s tcnicas multivariantes, podemos destacar como mais utilizadas neste campo de investigao a anlise discriminante linear, o logit ou as redes neuronais artificiais. Embora estas tcnicas demonstrassem em diversos estudos uma elevada capacidade predictiva, tm como desvantagens o incumprimento de alguns pressupostos metodolgicos ou a dificuldade de interpretao das redes neuronais artificiais, que se podem considerar como "caixas negras" que os utilizadores tendem a renunciar pela falta de transparncia com que se obtm os resultados. Por seu lado, a metodologia dos Rough Sets pode proporcionar um conjunto de regras de deciso de fcil interpretabilidade que se obtm de um conjunto de casos reais do problema objecto de estudo. Cada regra de deciso obtm-se de um conjunto de casos reais, no se requer informao adicional nem necessrio assumir pressupostos sobre os dados. Esta teoria foi proposta originalmente por Zdzislaw Pawlak nos primeiros anos da dcada dos 80 (Pawlak, 1982), surgindo da necessidade de dispor de um marco formal para tratar conhecimentos imprecisos, incertos e incompletos expressos na forma de dados adquiridos experimentalmente. Segundo Daz (2002) as fontes de incerteza so mltiplas salientando-se a impreciso do conhecimento disponvel, os dados incompletos ou a presena de rudo nos mesmos.

200

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

De seguida apresentaremos de forma resumida os principais conceitos e a metodologia de aquisio de conhecimento desta teoria. Terminaremos este trabalho com uma aplicao emprica da referida teoria a uma amostra de empresas portuguesas de vrios sectores de actividade.

2. Conceitos fundamentais da Teoria dos Rough Sets


Neste ponto descrevemos os principais conceitos desta teoria, que se podero ver de forma mais pormenorizada, junto com outras definies, proposies e teoremas em Pawlak (1991). 2.1. Sistema de Informao e tabela de deciso

O formalismo utilizado por esta teoria para a representao de dados a analisar reside nos sistemas de informao que se podem representar mediante tabelas atributo-valor (Tabela 1). Formalmente, define-se um sistema de informao como um par S = U , A , onde U representa um conjunto finito e no vazio denominado universo, sendo A o conjunto de atributos ou caractersticas. Cada atributo a A considera-se como uma funo total a : U Va , donde Va o conjunto de valores possveis que pode tomar o atributo de a .

a , denominado domnio

Tabela 1: Tabela atributo-valor

Empresa

Atributos = Variveis independentes Situao Empresa Equipa de Financeira Familiar Gesto


Frgil Frgil Frgil Estvel Estvel Estvel Sim Sim Sim Sim No Sim Competente Incompetente Muito Incompetente Competente Incompetente Muito Incompetente

e1 e2 e3 e4 e5 e6

Fonte: Adaptado de Pawlak et al. (1995: 90)

201

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

Uma tabela de deciso 1 (Tabela 2)2 corresponde a uma classe especfica de sistemas de informao e formalmente pode-se representar por T = U , A, d , onde

d A o atributo de deciso.
Tabela 2: Tabela de Deciso

Atributos = Variveis independentes Empresa Situacin Financiera


Frgil Frgil Frgil Estvel Estvel Estvel

Empresa Familiar
Sim Sim Sim Sim No Sim

Equipa de Gesto
Competente Incompetente Muito Incompetente Competente Incompetente Muito Incompetente

Deciso = Varivel Dependente Concesso de Crdito


Sim No No Sim Sim No

e1 e2 e3 e4 e5 e6

Fonte: Adaptado de Pawlak et al. (1995: 90)

2.2. Relao de indiscernibilidade Um dos principais conceitos na teoria de conjuntos aproximados a relao de indiscernibilidade (indiscernibility relation), a qual normalmente est associada a um conjunto de atributos. Esta relao de indiscernibilidade uma relao de equivalncia. Por exemplo, as empresas e1 e e2 apresentam os mesmos valores para os atributos Situao Financeira e Empresa Familiar. Podemos tambm verificar que a empresa e3 indiscernvel das empresas e1 e e2 e as empresas e4 e e6 so tambm indiscernveis entre si. Pawlak (1991) definiu formalmente a indiscernibilidade da seguinte maneira:

I D( B ) = ( x, y ) U 2 : a B, a ( x) = a ( y )

Os conjuntos indiscernveis designam-se de conjuntos elementares. Desta forma, os atributos Situao Financeira e Empresa Familiar da tabela anterior, definem os seguintes conjuntos elementares: - {e1 , e2 , e3} (Situao Financeira=Frgil e Empresa Familiar=Sim)
1 Tambm designada de tabela de informao. 2 Exemplo acadmico. As informaes e decises podem no ter necessariamente correspondncia com a realidade.

202

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

- {e4 , e6} (Situao Financeira=Estvel e Empresa Familiar=Sim) - {e5} (Situao Financeira=Estvel e Empresa Familiar= o) O conjunto {e1 , e2 , e3 , e5} definvel atravs dos atributos Situao Financeira e Empresa Familiar, pois possvel definir tal conjunto dizendo que qualquer elemento do mesmo caracterizado pelos atributos Situao Financeira=Frgil e Empresa Familiar=Sim ou pelos atributos Situao Financeira=Estvel e Empresa Familiar= o. Esta unio de conjuntos elementares designada como conjunto definvel. 2.3. Redutos e ncleo de conhecimento Se um conjunto de atributos e o conjunto global definem a mesma relao de indiscernibilidade (quer dizer, os conjuntos elementares das duas relaes so idnticos) ento, qualquer atributo que pertence ao conjunto global e no pertence ao conjunto de atributos redundante ou dispensvel. No nosso exemplo, o atributo Empresa Familiar redundante. A noo de reduto (reduct) define-se como o mnimo subconjunto de atributos suficientes para manter o mesmo poder de classificao que o conjunto inicial de atributos. Um conjunto de atributos P que no contm atributos redundantes designa-se como conjunto independente. Um conjunto R de atributos um reduto de um outro conjunto P de atributos, se R independente e as relaes de indiscernibilidade definidas por R y P so as mesmas, isto , I D( R ) = I D ( P) . Define-se ncleo (core) de um conjunto de atributos ao conjunto daqueles atributos que so necessrios para manter o mesmo poder de classificao. Formalmente diz se que um atributo a P indispensvel se I D ( P ) I D ( P {a}) e ao conjunto de todas as caractersticas indispensveis em P denomina-se ncleo do P . Em referncia Tabela 2, o conjunto de atributos {Situao Financeira, Equipa de Gesto} um reduto do conjunto global ou original de atributos { Situao Financeira, Empresa Familiar, Equipa de Gesto}. Eliminando o atributo redundante, temos uma nova tabela de informao (Tabela 3).

203

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

Tabela 3: Tabela de Deciso reduzida

Atributos = Variveis independentes Empres a Situao Financeira


Frgil Frgil Frgil Estvel Estvel Estvel

Equipa de Gesto
Competente Incompetente Muito Incompetente Competente Incompetente Muito Incompetente

Deciso = Varivel Dependente Concesso de Crdito


Sim No No Sim Sim No

e1 e2 e3 e4 e5 e6

Fonte: Adaptado de Pawlak et al. (1995: 91)

semelhana dos conjuntos elementares associados aos atributos, tambm podemos definir conjuntos elementares associados deciso, que correspondem aos subconjuntos de todos os exemplos que possuem a mesma deciso. Estes subconjuntos so denominados de conceitos. Com base na Tabela 3 podemos dizer que um dos conceitos corresponde ao conjunto de empresas a quem foi concedido o crdito (Concesso de crdito = Sim) { e1 , e4 , e5} e o outro corresponde s empresas a quem foi recusado o crdito (Concesso de crdito = No) { e2 , e3 , e6}. Para exemplificar como tratada a inconsistncia atravs desta teoria, consideremos a Tabela 4, que resulta da adio das empresas e7 e e8 Tabela 3.

204

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

Tabela 4: Tabela de deciso inconsistente

Atributos = Variveis independentes Empres a Situao Financeira


Frgil Frgil Frgil Estvel Estvel Estvel Estvel Estvel

Equipa de Gesto
Competente Incompetente Muito Incompetente Competente Incompetente Muito Incompetente Incompetente Muito Incompetente

Deciso = Varivel Dependente Concesso de Crdito


Sim No No Sim Sim No No Sim

e1 e2 e3 e4 e5 e6 e7 e8

Fonte: Adaptado de Pawlak et al. (1995: 91)

Podemos verificar que os conjuntos elementares da relao de indiscernibilidade definida pelos atributos Situao Financeira e Equipa de Gesto so {e1}, {e2}, {e3}, { e4}, {e5 , e7} e {e6 , e8}, enquanto que os conceitos definidos pela deciso Concesso de Crdito so os conjuntos { e1 , e4 , e5 , e8} e { e2 , e3 , e6 , e7}. Alm disso, a deciso Concesso de Crdito no depende dos atributos Situao Financeira e Equipa de Gesto, dado que { e5 , e7} e { e6 , e8} no so subconjuntos de qualquer conceito. Neste caso a Tabela 4 contm informao inconsistente, uma vez que existem empresas com os mesmos valores para os atributos, mas o valor da deciso diferente. 2.4. Aproximao de conjuntos Para dirigir a inconsistncia, esta teoria recorre ao conceito de aproximao. Para cada conceito X calcula-se o maior conjunto definvel contido em X e o menor conjunto definvel que contm X , designando o primeiro conjunto de aproximao superior de X , enquanto que o segundo denominado de aproximao inferior de X. Pawlak (1991) definiu a aproximao inferior, chamada R X como o conjunto de todos os elementos de U que podem classificar-se, com total certeza, como elementos do conceito de interesse X , empregando a informao contribuda pelo conjunto de atributos R y se define formalmente como: 205

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

R X = U{Y U / R : Y X }
A aproximao superior, denominada por R X o conjunto de todos os elementos de U que, possivelmente, podem classificar-se como elementos do conceito de interesse X. Formalmente:

R X = U {Y U / R : Y X 0}
Com base na Tabela 4, para o conceito que assume a concesso de um crdito representado pelo conjunto {e1 , e4 , e5 , e8} a aproximao inferior definida pelo conjunto {e1 , e4} e a aproximao superior pelo conjunto {e1 , e4 , e5 , e6 , e7 ,e8} como podemos visualizar a travs da Figura 1, elaborada a partir da Tabela 53.
Tabela 5: Tabela de Informao agrupada de tripla entrada

Equipa de Gesto o MI I C Frgil

Concesso de crdito Sim o

e3 e2 e1

e8 e5 e4
Estvel

e6 e7

Situao Financeira
Fonte: Elaborao prpria.

3 Esta tabela de tripla entrada contm a mesma informao que a Tabela 4.

206

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

Figura 1: Aproximacin superior e inferior de X

Aproximao Superior de X

e3 e2 e1
Aproximao Inferior de X

e8 e5 e4

e6 e7

Fonte: Elaborao prpria.

Conjunto X

Como j referimos, em Pawlak (1991) pode-se ver de forma mais pormenorizada todo o desenvolvimento da referida teoria.

3. A Teoria dos Rough Sets na Previso do Fracasso


A teoria dos Rough Sets s recentemente se aplicou previso da insolvncia ou fracasso empresarial. Os primeiros modelos foram todos desenvolvidos na Grcia nos anos noventa (Slowinski & Zopounidis, 1995; Greco et al., 19984 e Dimitras et al.; 1999). Posteriormente apareceram outros trabalhos, como por exemplo, McKee (2000) ou Rodrguez & Daz (2005), de que faremos referncia a seguir 5.

4 Citado por McKee (2000). 5 McKee & Lensberg (2002) desenvolveram um modelo hbrido utilizando esta teoria e os algoritmos genticos. Em Tay & Shen (2002) pode-se ver una sntese de diversos trabalhos que recorreram a esta metodologia.

207

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

McKee (2000) utilizou uma amostra com 200 empresas de diferentes sectores (100 fracassadas e 100 no fracassadas) seleccionadas entre os anos 1986 e 1988. No grupo das empresas no fracassadas incluam-se aquelas que tinham um cashflow positivo nos ltimos 5 anos. As empresas fracassadas foram definidas como aquelas que tinham solicitado a insolvncia ou tinham uma filial importante que o tinha feito. Exigia-se que todas as companhias tivessem um mnimo de 5 anos de actividade. Para o desenvolvimento do modelo o autor utilizou os ratios Activo circulante/Passivo circulante y Resultado neto/Activo total, obtendo 27 regras, com uma preciso de 93% na amostra de prova e de 88% na amostra de validao. Rodrguez & Daz (2005) apresentaram em seu estudo o desenho de um conjunto de modelos de predio do fracasso empresarial utilizando esta metodologia. Para a estimativa dos modelos se utilizou uma amostra constituda por 120 empresas, 60 no fracassadas e 60 fracassadas. Os dados utilizados foram de carcter econmicofinanceiro (59 ratios) correspondentes a 4 exerccios econmicos consecutivos, obtendo um modelo para cada um dos anos prvios ao fracasso. Os resultados obtiveram uma preciso de 91,96% para um ano antes do fracasso, descendendo a preciso medida que o horizonte temporrio aumentava, chegando a 72,14% para o perodo de 4 anos antes de produzir o fracasso. Em funo dos resultados alcanados, os autores concluem que a teoria de conjuntos aproximados um mtodo de estimativa que permite obter resultados satisfatrios e modelos facilmente interpretveis no contexto da previso do fracasso empresarial.

4. Vantagens e limitaes desta teoria


Segn Pawlak et al. (1995) uma das principais vantagens dos Rough Sets que no necessitam de informao preliminar ou adicional sobre os dados, como , por exemplo, a distribuio de probabilidade estatstica, j que, como indica Daz (2002) esta tcnica utiliza nica e exclusivamente a estrutura interna dos dados analisados para modelar o conhecimento. McKee (2000) faz referncia tambm, a que as regras de classificao so de fcil interpretao e que cada regra de deciso se obtm de um conjunto de casos reais. Bose (2006) salienta que atravs das regras descobertas possvel obter uma explicao da deciso. Para Santos & Azevedo (2005) o fato de esta teoria se fundamentar num rigoroso formalismo matemtico tambm uma vantagem. Como limitaes estes autores

208

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

mencionam a dificuldade de execuo e tambm a documentao ainda pobre e complexa.

5. Aplicao emprica
5.1. Definio de fracasso utilizada Nos estudos sobre a previso do fracasso empresarial geralmente as empresas dividem-se em duas categorias: fracassadas e no fracassadas. No nosso estudo identificamos uma empresa como fracassada se tiver ocorrido alguma das seguintes situaes: - processo de insolvncia ou a mesma tenha sido declarada pelos tribunais; - processo de reestruturao; - tenha pendente processos judiciais por reclamao de dvidas. A referida informao foi obtida atravs da III Srie do Dirio da Repblica, do Instituto Informador Comercial e junto de Gestores Judiciais. 5.2. Seleco das variveis A falta de uma base terica que explique o fracasso empresarial e sirva de orientao no processo de seleco das variveis explicativas permitiu que se utilizassem mltiplos critrios na seleco das mesmas. semelhana do que sucedeu com diversos estudos a seleco das variveis independentes no presente estudo, rcios econmico-financeiros teve por base a sua maior utilizao e nvel de significncia obtido em diversos estudos publicados na literatura sobre o tema. A lista dos 60 rcios seleccionados que se elaboraram com a informao do Balano e da Demonstrao dos Resultados das empresas que compem a amostra encontra-se no Anexo 1. 5.3. Procedimento de seleco da amostra A informao para elaborar a amostra de empresas obteve-se da base de dados SABE da empresa Informa, S.A (dados disponveis na Biblioteca da Universidade de Vigo at 31 de Dezembro de 2003), da Dun & Bradstreet, do Instituto Informador Comercial e de Gestores Judiciais. Para fazerem parte da amostra as empresas tinham que apresentar dados para 3 exerccios econmicos consecutivos, compreendidos entre o perodo de 2000 e 2002. Seleccionou-se uma amostra composta por empresas pertencentes a diversos sectores de actividade, com sede em Portugal continental, incluindo indstrias do 209

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

sector txtil, vesturio, confeco, madeira, cortia, calado, couro, plsticos, moldes, vidro, cutelaria e cermicas. A amostra era constituda por 818 empresas, sendo 742 consideradas saudveis ou no fracassadas e 76 fracassadas. 5.4 Anlise e Resultados Para procedermos anlise emprica aplicando a teoria dos Rough Sets utilizamos um software desenvolvido por Daz (2000). Uma das operaes mais importantes na fase de pr-processamento efectuar a discretizao dos valores dos atributos (rcios). Estes foram discretizados em 5 categorias com igual frequncia (equal frequency binning), cujo resultado para os valores dos ratios das empresas que compem a amostra se pode ver na Tabela 66.

6 Por uma questo de economia de espao fazemos apenas referncia aos intervalos de discretizao para os 10 primeiros atributos. Os dados completos sero disponibilizados quando solicitados aos autores.

210

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

Tabela 6: Discretizao dos atributos

Atribu to X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

0
]*, 1.18144 [ ]*, 0.47699[ ]*, 0.09372[ ]*, 0.05754[ ]*, 0.41664[ ]*, 0.86883[ ]*, 0.58187[ ]*, 0.20818[ ]*, 0.02052[ ]*, 0.15333[

1
[1.18144, 1.36419 [ [0.47699, 0.69996[ [0.09372, 0.10827[ [0.05754, 0.05315[ [0.41664, 0.57106[ [0.86883, 1.14998[ [0.58187, 0.80674[ [0.20818, 0.46092[ [0.02052, 0.03634[ [0.15333, 0.26622[

2
[1.36419, 1.53683 [ [0.69996, 0.92569[ [0.10827, 0.29041[ [0.05315, 0.13964[ [0.57106, 0.68506[ [1.14998, 1.42226[ [0.80674, 1.01154[ [0.46092, 0.75194[ [0.03634, 0.05882[ [0.26622, 0.34814[

3
[1.53683, 1.85887[ [0.92569, 1.34922[ [0.29041, 0.57611[ [0.13964, 0.30047[ [0.68506, 0.82800[ [1.42226, 1.99607[ [1.01154, 1.28636[ [0.75194, 1.40584[ [0.05882, 0.10230[ [0.34814, 0.46188[

4
[1.85887, *[ [1.34922, *[ [0.57611, *[ [0.30047, *[ [0.82800, *[ [1.99607, *[ [1.28636, *[ [1.40584, *[ [0.10230, *[ [0.46188, *[

Fonte: Elaborao prpria

O algoritmo de seleco dos atributos baseia-se no princpio MDL (Minimum Description Length). Com este princpio, em cada passo do algoritmo elimina-se aquela varivel que, simultaneamente, maximiza o ganho verificado pela diminuio da complexidade do modelo resultante e minimiza a perda de preciso que sofre o mesmo. (Daz, 2001). Na fase do processamento a amostra foi dividida em duas, uma de treino e outra de validao. A amostra de treino estava constituda por 546 empresas (495 no fracassadas e 51 fracassadas) correspondendo a dois teros das empresas, tendo como referncia o ano prvio ao fracasso, sendo a amostra de validao constituda pelas restantes empresas (247 no fracassadas e 25 fracassadas). O modelo foi tambm validado com os dados de todas as empresas referentes a dois e trs anos antes da ocorrncia do fracasso. O mtodo de inferncia utilizado tinha como critrio escolher a regra satisfeita por uma nova observao, com o objectivo de ter o maior nmero de observaes dentro do conjunto de treino, suportando-a, isto , que a satisfaa. 211

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

Na fase de treino o erro mximo admitido era de 2,5% (beta = 0.025), tendo-se obtido 121 redutos com base no seguinte conjunto P de atributos: P= { X4, X5, X8, X20, X31, X35, X39, X44, X47, X51, X55 } O reduto nmero 23 foi o que apresentou melhor comportamento global, sendo obtidas 14 regras geradas a partir de { 20,47,51 }7, cujas primeiras trs descrevemos a seguir8. r_0: [ (X20 = 4) ] => [ (Deciso = 1) ] CoverP={0,2,3,5,10,13,15,27,28,32,34,35,37,44,48,56,57,59,66,67,69,70,71,81,8 2,90,91,93,98,101,104,105,110,112,128,134,135,139,147,148,149,151,152,158,159 ,161,173,175,176,177,179,180,183,184,187,189,190,191,195,196,206,207,212,214, 217,218,219,223,230,231,234,235,236,242,246,247,253,255,256,263,266,267,272, 276,279,283,284,286,291,293,295,298,302,303,306,332,336,338,352,360,364,365, 368,369,370,372,375,378,380,381,387,388,390,391,394,401,410,412,427,432,447, 448,451,455,464,468,471,476,479,481,490,494,515,524 } Erro= 0.0149 r_1: [ (X51 = 4) ] => [ (Deciso = 1) ] CoverP={1,5,10,16,25,28,29,30,32,34,35,37,38,41,44,45,51,56,59,64,65,66,68,6 9,70,71,74,81,84,88,91,92,93,101,103,104,105,109,110,111,116,123,135,144,146,1 47,148,152,153,154,156,158,159,161,163,168,170,177,179,183,185,187,191,192,1 93,197,200,203,206,207,216,217,222,223,224,225,229,230,233,234,247,248,251,2 56,267,268,271,272,273,275,282,286,288,291,292,298,300,302,303,309,317,318,3 26,331,334,338,340,341,349,350,351,352,354,358,362,364,365,370,373,378,380,3 82,385,387,388,390,391,394,397,399,401,410,412,418,419,421,422,423,426,427,4 29,430,441,451,452,457,462,464,468,469,470,476,482,493,494 } Erro= 0.0000 r_2: [ (X51 = 3) ] => [ (Deciso = 1) ] CoverP={2,6,17,22,36,40,48,50,55,60,73,83,85,94,98,99,102,106,108,112,113,1 14,117,118,120,121,124,126,127,129,131,132,136,137,143,145,149,151,155,162,1 65,166,169,176,178,182,184,186,189,194,195,202,204,205,209,210,212,215,227,2 31,235,236,245,260,261,263,264,266,269,270,278,279,280,283,290,293,294,295,2 97,301,304,311,314,315,319,322,324,332,335,345,346,348,357,359,361,363,368,3 69,371,372,374,375,376,379,383,389,395,402,404,405,407,431,432,433,436,437,4 38,440,442,445,446,447,448,454,458,459,465,466,467,472,473,475,487,488,491 } Erro= 0.0000
7 X20, X47 e X51 correspondem aos seguintes indicadores: (Disponibilidades + Crditos a

Curto Prazo) / Passivo a Curto Prazo, Resultado liquido/Capital Prprio e Resultados Operacionais/Activo Total, respectivamente.
8 As restantes encontram-se no Anexo 2.

212

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

Para exemplificar a interpretao de cada uma das regras, recorreremos primeira, que tem o cdigo r_0:

r_0: [ (X20 = 4) ] => [ (Deciso = 1) ]

Antecedente

Consequncia ou deciso

CoverP={0,2,3,5,10,13,15,27,28,32,34,35,37,44,48,56,57,59,66,67,69,70,71, 81,82,90,91,93,98,101,104,105,110,. }
Erro= 0.0149 Conjunto de empresas que satisfazem o antecedente da regra

Percentagem de erro sobre o conjunto de empresas que cumprem o antecedente da regra

Os resultados obtidos pelo modelo aplicado a todas as amostras de empresas encontram-se nas tabelas seguintes, estando as empresas no fracassadas representadas por 1 e as fracassadas por 0. Como j havamos referido a amostra de treino estava formada por 2/3 dos dados disponveis referentes a um ano antes de ocorrer o fracasso. Com a referida amostra o modelo obteve 540 decises correctas de um total de 546, com um erro global de 1,10% (Tabela 7).

213

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

Tabela 7: Tabela de contingncia (amostra de treino)

Valor Esperado 0 1

Valor Inferido 0 45 0 1 6 495

A amostra de validao referente a um ano antes do fracasso era composta por 272 empresas, 25 fracassadas e 247 no fracassadas. Das 272 empresas o modelo acertou em 265, registando um erro global de 2,57%.
Tabela 8: Tabela de contingncia (amostra de validao)

Valor Esperado 0 1

Valor Inferido 0 20 2 1 5 245

Para os dados referentes a 2 anos antes do fracasso o modelo manteve uma percentagem global de acertos elevada (6,85%), decidindo acertadamente para 762 empresas das 818 que faziam parte da amostra. No entanto, o erro tipo I, (que corresponde ao facto de classificar uma empresa fracassada como saudvel) relativamente elevado, superior a 60%.
Tabela 9: Tabela de contingncia (amostra de validao para 2 anos prvios)

Valor Esperado 0 1

Valor Inferido 0 29 9 1 47 733

214

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

O comportamento do modelo quando aplicado amostra referente aos dados para 3 anos antes da ocorrncia do fracasso foi semelhante ao registado pela amostra anterior. Podemos verificar que em termos globais o modelo regista resultados muito satisfatrios, classificando correctamente 750 das 818 empresas, a que corresponde uma percentagem de acertos de 91,69%. O erro tipo II (que corresponde ao facto de classificar uma empresa no fracassada como fracassada) manteve-se inferior a 2%, continuando o erro tipo I muito elevado, como se pode comprovar na Tabela 10.
Tabela 10: Tabela de contingncia (amostra de validao para 3 anos prvios)

Valor Esperado 0 1

Valor Inferido 0 20 12 1 56 730

Concluso
Neste trabalho elaboramos um modelo de previso do fracasso empresarial utilizando a teoria dos Rough Sets, recorrendo a uma amostra de empresas portuguesas de diferentes indstrias. As regras do reduto que apresentou melhor comportamento global foram geradas a partir dos seguintes indicadores: (Disponibilidades + Crditos a Curto Prazo) / Passivo a Curto Prazo, Resultado liquido/Capital Prprio e Resultados Operacionais/Activo Total. A capacidade predictiva do modelo com as amostras de treino e validao referentes a um ano antes do fracasso foi de 98,9% e 97,4%, respectivamente, diminuindo a sua preciso medida que nos distanciamos no horizonte temporal, registando uma percentagem de acertos de 91,69% com os dados referentes a trs anos antes. Dos resultados obtidos podemos tambm concluir que o erro tipo I (que corresponde ao facto de classificar uma empresa fracassada como saudvel) elevado, principalmente nas amostras referentes a dois e trs anos antes do fracasso. Pensamos que o facto de mais de 80% das empresas da amostra no terem as suas contas auditadas, (no estavam a isso obrigadas) as suas contas podem no reflectir a real situao financeira e econmica, nomeadamente nas empresas fracassadas, a estimao do modelo com amostras relativamente desequilibradas no que se refere 215

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

ao nmero de empresas em cada um dos grupos bem como a utilizao de empresas de diferentes industrias pode ter influenciado no comportamento do modelo, principalmente no segundo e terceiro ano antes do fracasso. Com base nas percentagens de acerto globais podemos concluir que a teoria dos Rough Sets pode proporcionar modelos de previso do fracasso empresarial com resultados muito satisfatrios baseados em regras facilmente interpretveis. Como extenso deste trabalho pretendemos realizar uma anlise comparativa desta metodologia com outras tcnicas e modelos estatsticos e de inteligncia artificial que tm sido utilizados neste campo de investigao, utilizando uma amostra de empresa de um nico sector de actividade.

Bibliografia
Altman, E. I. (1968). Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy. The Journal of Finance, 23(4), 589-609. Beaver, W. H. (1966). Financial Ratios as Predictors of Failure. Journal of Accounting Research,4, 71111. Bose, I. (2006). Deciding the financial health of dot-coms using rough sets. Information & Management, 43(7), October, 835-846. Daz Gmez, F. (2001). Aprendizaje y Generacin Automtica de Conocimiento: Construccin de Redes Bayesianas mediante Rough Sets. Revista Iberoamericana de Inteligencia Artificial, 20, 81-84. Daz Gmez, F. (2002). Aprendizaje y Generacin Automtica de Conocimiento: Construccin de Redes Bayesianas mediante Rough Sets. Tesis Doctoral, Universidad de Vigo, Vigo. Dimitras, A. I.; Slowinski, R.; Susmaga, R. & Zopounidis, C. (1999). Business Failure Prediction Using Rough Sets. European Journal of Operational Research, 114(2), April, 263-280. Greco, S.; Matarazzo, B. & Slowinski, R. (1998). A New Rough Set Approach to Evaluation of Bankruptcy Risk. In Zopounidis (Ed.), Operacional Tools in the Management of Financial Risk,(pp. 121-136). Kluwer: Dordrecht. McKee, T. E. (2000). Developing a Bankruptcy Prediction Model via Rough Sets Theory. Internacional Journal of Intelligent Systems in Accounting, Finance & Management, 9(3) September, 159-173. McKee, T.E. & LENSBERG, T. (2002). Genetic programming and rough sets: A hybrid approach to bankruptcy classification. European Journal of Operational Research, 138 ( 2), April, 436-451. Pawlak, Z. (1982). Rough Sets. International Journal of Computer and Information Sciences, 11, 341356. Pawlak, Z. (1991). Rough Sets: Theoretical Aspects of Reasoning about Data,. Kluwer Academic Publishers, Dordrecht. PawlaK, Z.; Grzymala-Busse, J.; Slowinski, R. & Ziarco, W. (1995). Rough Sets. Communications of the ACM, 38 (11), 89-95. Rodrguez Lpez, M. & Daz Gmez, F. (2005). La Teora de los Rough Sets y la Prediccin del Fracaso Empresarial. Diseo de un Modelo para las PYMES. XIII Congreso AECA, septiembre, Oviedo. Santos, M. F. & Azevedo, C. (2005). Data Mining Descoberta de Conhecimento em Base de Dados. FCA: Lisboa. Slowinski, R. & Zopounidis, C. (1995). Application of the Rough Set Approach to Evaluation of Bankruptcy Risk. Intelligent Systems in Accounting, Finance and Management, 4(1), March, 2741. Tay, F. E. H. & Shen, L. (2002). Economic and financial prediction using rough sets model. European Journal of Operational Research, 141(3), September, 641-659.

216

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

Anexo 1: Rcios Seleccionados


X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16 X17 X18 X19 X20 X21 X22 X23 X24 X25 X26 X27 X28 X29 X30 X31 Activo Total / Passivo Total (Activo Circulante - Existncias) / Passivo Circulante (Activo Circulante - Passivo Circulante) / Passivo total (Activo Circulante - Passivo Circulante) / Vendas Activo Circulante / Activo Total Activo Circulante / Passivo a Curto Prazo Activo Circulante / Passivo Total Activo Fixo / Activo Circulante Amortizaes / Proveitos Operacionais Capital Prprio / Activo Total Capital Prprio / Imobilizado Liquido Capital Prprio / Passivo Total Cash-flow / Passivo a Curto Prazo Cash-flow / Passivo Total Custos Financeiros / Proveitos Operacionais Custos Financeiros / Resultados Operacionais Custos Financeiros / Total Dividas a Instituies de Crdito Disponibilidades / Activo Total Disponibilidades / Passivo a Curto Prazo (Disponibilidades + Crditos a Curto Prazo) / Passivo a Curto Prazo Dvidas a terceiros / Activo Total Existncias / Activo Total Existncias / Vendas Capital circulante / Activo Total Custos com Pessoal / Activo Fixo Custos com Pessoal / Proveitos Operacionais Imobilizado Fixo/ Activo Circulante Imobilizado Fixo / Activo Total Imobilizado Intangvel / Activo Total Imobilizado Liquido/ Activo Total Imobilizado Total / Dividas a Longo Prazo

217

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

X32 X33 X34 X35 X36 X37 X38 X39 X40 X41 X42 X43 X44 X45 X46 X47 X48 X49 X50 X51 X52 X53 X54 X55 X56 X57 X58 X59 X60

(Investimentos Fin. M/L Prazo + Aplicaes Fin. C/P) /Activo Total (Aplicaes Fin. C/P + Disponibilidades) /Activo Total Passivo a Curto Prazo / Passivo Total Passivo a Mdio e Longo Prazo / Passivo a Curto Prazo Passivo a Mdio e Longo Prazo / Passivo Total Passivo Total / Capital Prprio Proveitos Operacionais / Activo Circulante Proveitos Operacionais / Activo Total Proveitos Operacionais / Custos Operacionais Proveitos Operacionais / Imobilizado (RAI + Amort. + Provises)/ Custos Financeiros Reservas / Activo Total (Reservas + Resultados Exerc. Anteriores) / Passivo Total Resultados Extraordinrios / Resultado liquido Resultado liquido / Activo Total Resultado liquido / Capital Prprio Resultado liquido / Passivo Total Resultado liquido / Proveitos Operacionais Resultado liquido / Vendas Resultados Operacionais / Activo Total Resultados Operacionais / Custos Financeiros Resultados Operacionais / Proveitos Operacionais Resultados Operacionais / Vendas Vendas / Activo Total Vendas / Capital Circulante Vendas / Disponibilidades Vendas / Existncias (RAI + Custos Financeiros) / Vendas RAI/(RAI +Custos Financeiros)

218

Tkhne, 2008, Vol VI, n10 Aplicao da Teoria dos Rough Sets na Previso do Fracasso Empresarial

Anexo 2: Restantes Regras do Reduto Seleccionado


r_3: [ (X51 = 2) ] => [ (Deciso = 1) ] CoverP={3,4,13,19,20,21,24,26,31,43,46,49,52,53,57,61,62,67,72,75,76,77,79,8 0,86,90,95,97,100,107,122,130,138,139,140,141,142,150,160,167,174,180,181,190 ,196,199,201,211,214,218,220,226,228,232,240,242,244,246,250,254,259,262,265, 276,284,287,299,305,306,310,312,316,320,330,333,336,337,339,343,344,347,353, 356,360,366,367,381,392,398,400,403,406,408,409,413,414,415,416,417,420,424, 428,434,435,439,443,444,455,460,461,471,474,477,478,479,480,484,486,489,490 } Erro= 0.0000 r_4: [ (X47 = 3) ] => [ (Deciso = 1) ] CoverP={6,13,21,22,26,32,34,37,43,45,50,51,52,58,59,60,61,64,65,66,68,70,71,74, 77,80,85,92,93,102,104,106,110,111,112,114,116,118,119,121,131,135,142,144,15 0,151,155,162,163,168,169,176,178,180,185,191,192,195,196,200,205,212,216,21 8,225,230,231,232,234,235,240,241,247,251,256,261,266,267,275,278,279,280,28 1,291,296,298,315,320,324,325,327,331,341,345,346,349,350,354,356,357,363,36 6,368,369,370,372,375,378,379,380,381,383,385,390,394,397,398,404,407,411,41 6,419,421,422,423,425,427,430,433,436,440,441,443,444,445,446,447,451,454,45 7,460,464,466,467,472,477,479,480,482,485,488 } Erro= 0.0000 r_5: [ (X47 = 1) ] => [ (Deciso = 1) ] CoverP={7,9,11,15,18,23,27,33,42,47,49,53,54,57,63,72,75,76,82,87,89,96,97,115, 120,127,128,140,141,143,154,157,164,165,166,167,171,174,181,190,197,198,199, 202,209,213,219,226,228,237,239,243,249,250,252,254,257,262,264,265,269,270, 274,276,277,295,305,307,310,319,329,330,335,336,337,343,358,359,367,371,377, 386,393,400,403,408,409,413,415,424,432,434,435,449,450,458,461,463,471,473, 481,484,489 } Erro= 0.0000 r_6: [ (X51 = 1) ] => [ (Deciso = 1) ] CoverP={0,7,8,9,11,12,14,15,18,23,27,33,39,47,54,58,63,78,82,87,89,96,115,11 9,125,128,133,134,157,164,171,172,173,175,188,198,208,213,219,221,237,238,23 9,241,243,249,252,253,255,257,258,274,277,281,285,289,296,307,308,313,321,32 5,327,329,342,355,377,384,386,393,396,411,425,450,453,463,481,483,485,492,49 7} Erro= 0.0123

219

Tkhne, 2008, Vol VI, n10 Jos Manuel Pereira, Fernando Daz Gmez, Manuel Rodrguez Lpez

r_7: [ (X20 = 3) ] => [ (Deciso = 1) ] CoverP={6,14,16,17,21,24,25,29,30,38,42,43,45,51,55,60,61,63,65,75,78,79,84, 86,88,89,100,102,103,109,113,115,118,121,123,129,130,132,133,142,145,146,150, 153,155,156,157,164,169,171,182,186,193,197,200,201,202,205,209,213,224,225, 226,227,229,232,233,239,243,248,249,252,261,265,271,273,274,275,277,278,280, 281,282,289,290,292,294,305,309,312,313,316,318,326,342,343,347,349,350,351, 357,359,361,363,374,376,377,379,383,395,396,397,398,402,406,407,411,422,426, 430,431,433,442,443,445,446,453,456,457,460,462,467,469,474,475,486,487,488, 492,493,511,526,534 } Erro= 0.0210 r_8: [ (X47 = 2) ] => [ (Deciso = 1) ] CoverP={0,3,4,14,19,24,31,36,46,67,73,78,79,90,94,95,98,100,105,108,113,117, 122,125,126,130,133,134,136,137,138,139,146,152,159,161,172,173,175,177,182, 184,186,194,201,204,208,210,211,214,215,220,222,227,236,242,244,246,259,260, 263,283,284,287,289,290,294,297,299,301,304,306,311,312,313,316,322,323,328, 332,333,334,339,340,344,347,348,353,355,360,361,362,364,376,389,392,396,402, 405,406,414,417,428,431,437,438,439,442,448,453,455,459,465,474,478,486,487, 490,492 } Erro= 0.0000 r_9: [ (X20 = 0), (X47 = 0), (X51 = 0) ] => [ (Deciso = 0) ] CoverP={495,496,504,505,509,510,521,525,529,530,535,540,542,543} Erro= 0.0000 r_10: [ (X47 = 4), (X51 = 0) ] => [ (Deciso = 0) ] CoverP={498,499,500,503,508,511,512,514,516,518,519,522,523,527,532,536,5 38,539,544,545 } Erro= 0.0000 r_11: [ (X20 = 1), (X47 = 0), (X51 = 0) ] => [ (Deciso = 0) ] CoverP={ 501,502,506,507,513,517,528,531,533,537 } Erro= 0.0000 r_12: [ (X20 = 4), (X51 = 0) ] => [ (Deciso = 0) ] CoverP={ 515,524 } Erro= 0.0000 r_13: [ (X20 = 2), (X51 = 0) ] => [ (Deciso = 0) ] CoverP={ 520,522,541 } Erro= 0.0000

220

Vous aimerez peut-être aussi