Vous êtes sur la page 1sur 68

MODELOS HETEROGNEOS DE SOBREVIVNCIA: Uma Aplicao ao Risco de Crdito

Bruno Cardoso Alves

Tese de Mestrado em Prospeco e Anlise de Dados

Orientador: Prof. Doutor Jos Gonalves Dias, Prof. Auxiliar, ISCTE Business School, Departamento de Mtodos Quantitativos

Abril 2010

Dedicado Mnica, ao Salvador e Beatriz.

Agradecimentos
Gostaria de agradecer ao Professor Doutor Jos Gonalves Dias pela sua orientao, crticas, ensinamentos e por me manter no rumo certo durante estes meses de tese. Um muito obrigado tambm ao meu Director, Adriano Assuno, que para alm do contributo para a minha evoluo profissional, sempre demonstrou o seu apoio sem o qual esta tese teria sido muito mais difcil de concluir. Este agradecimento estende-se tambm administrao da instituio financeira que me ofereceu esta oportunidade, apoiando-me financeiramente e cedendo os dados utilizados nesta tese. Ainda um agradecimento aos meus colegas de mestrado, Leonor Pereira da Costa, Marcos Henriques e Tiago Salgado Pereira pela sua cumplicidade nos dias e noites de estudo no ISCTE, durante a parte acadmica deste mestrado. Um agradecimento muito especial Mnica, pelo carinho e apoio durante este mestrado em que estive menos presente, ao Salvador e Beatriz, por serem sempre um factor de inspirao.

Resumo
Para criar modelos de apoio gesto de cobranas de clientes numa instituio financeira de crdito, foram estimados modelos de sobrevivncia heterogneos, para prever a durao at dois acontecimentos: (i) registo do primeiro atraso no pagamento das mensalidades do contrato de crdito; e (ii) registo de atrasos superiores a 90 dias default. Seguiu-se uma abordagem condicional tipo II, utilizando todos os clientes da amostra para estimar a durao at ao primeiro atraso e uma sub-amostra, com os clientes que registaram esse primeiro atraso, para estimar a durao at default. Para cada acontecimento foram testadas as distribuies exponencial, Weibull, log-normal e log-logstica, em modelos agregados e de mistura. A durao at ao primeiro incidente (i) foi estimada atravs de um modelo de sobrevivncia com proporo de imunes. Esta proporo resulta de um modelo logstico utilizando o scoring interno como varivel concomitante. Para os no imunes considerou-se que a durao t segue uma distribuio log-normal, com variveis explicativas para os parmetros e . A durao entre o primeiro incidente e uma situao de default (ii) estimou-se atravs de um modelo de sobrevivncia de mistura com 3 segmentos, com uma funo de ligao logit multinomial e assumindo tambm que t segue uma distribuio log-normal. Neste segundo modelo apenas foram modelados os pesos do modelo logit, considerando e constantes. Os modelos de sobrevivncia apresentados incluem maioritariamente informao recolhida na altura da originao, aplicveis igualmente como modelos de profit scoring, estimando o envolvimento na data de default, dado um cash-flow futuro. Palavras chave: Anlise de sobrevivncia; Risco de crdito; Modelos de mistura; Scoring comportamental.

Abstract
To create models that support the receivables management in a financial institution, heterogeneous survival models were estimated to predict time until two events: (i) having at least one payment overdue; and (ii) 90 days overdue - default. A conditional 2 approach was followed, using all customers of the sample to estimate time until a first payment overdue. A second model was developed, considering only the sub-sample of clients who experienced the first overdue. The exponential, Weibull, log-normal and log-logistic distributions were tested in estimating the time to each event, in aggregate and mixture models. Time to the first overdue (i) was predicted through a survival analysis with immunes, with a logistic model to estimate probability of immunity, using internal credit scoring as covariate. For the non-immunes, a log-normal function, with covariates for both parameters, and , was estimated to predict time to first overdue. The time between the first overdue and default (ii) was estimated by survival mixture model with 3 segments, with a multinomial logit link function and assuming that time to default also follows a log-normal distribution. Covariates on the second model were considered on the proportions of the mixture model, setting the parameters and as constants in each group. The survival models presented in this thesis are estimated with data collected at the beginning of the loan, allowing its application in a profit scoring model, by predicting the exposure at the time the customer enters into a situation of default, given an expected cash-flow.

Keywords: Survival analysis; Credit risk; Mixture models; Behavioural scoring.

Sumrio executivo
O risco de crdito ocorre quando um cliente falha em honrar os seus compromissos. Um dos pilares para uma instituio financeira ser bem sucedida assenta no modo como avaliado o risco dos seus clientes, pelo que possuir modelos que minimizem a incerteza na tomada de decises, um factor crtico de sucesso neste tipo de negcio. No mbito da gesto do risco de crdito, uma instituio necessita de tomar dois tipos de decises. Numa fase inicial do processo ter de decidir se aprova o crdito e numa segunda fase, depois de eliminar crdito com potencial de risco mais elevado, necessrio definir que tipo de relacionamento adoptar com os clientes em carteira. Do mesmo modo, podemos classificar os modelos utilizados na avaliao do risco de crdito em 2 grupos: (i) modelos estticos scoring aplicacional utilizados para avaliar o risco de crdito no momento da concesso; (ii) modelos dinmicos scoring comportamental para avaliar o comportamento do cliente ao longo do contrato. Num modelo de scoring aplicacional feita a ligao entre duas fotografias, uma com informao relativa ao momento da concesso de crdito e outra com a situao do cliente, por exemplo, 12 meses aps o incio do contrato. Por seu lado, num modelo de scoring comportamental, o comportamento futuro de um cliente o resultado, no s da fotografia inicial em que o crdito concedido, mas tambm de informao recente sobre o seu comportamento. Atravs da anlise de sobrevivncia possvel substituir a segunda fotografia relativa situao do cliente, por um filme do comportamento futuro do cliente, permitindo estimar, no s a probabilidade de um cliente se encontrar em situao de default 12 meses aps, mas tambm estimar a probabilidade associada para um determinado momento futuro, o que resulta num timing mais eficiente em tomadas de decises por parte de instituio de crdito. Nesta tese de mestrado so apresentados modelos de sobrevivncia com mistura, que estimam a durao at ao momento do cliente entrar em incumprimento, com o objectivo de apoiar a gesto de cobranas de clientes numa instituio financeira de crdito. Foram considerados dois acontecimentos, associados a uma situao de incumprimento ligeiro e incumprimento avanado, respectivamente: (i) registo do primeiro atraso no pagamento das mensalidades do contrato de crdito, que resulta na transio do cliente para gesto de cobranas; (ii) registo de atrasos superiores a 90 dias default. Seguiu-se uma abordagem condicional tipo II, utilizando todos os clientes da amostra para estimar a durao entre o incio do contrato e o registo do primeiro atraso e

criado um segundo modelo, considerando apenas uma sub-amostra com os clientes que registaram o primeiro atraso. Neste segundo modelo, a varivel t representa a durao entre o registo do primeiro atraso e a transio para uma situao de default. Foram testadas as distribuies exponencial, Weibull, log-normal e log-logstica, para durao at cada acontecimento, em modelos agregados e de mistura. Os modelos eleitos foram seleccionados com base nos critrios de informao, AIC e BIC, concluindo-se que a distribuio log-normal aquela que melhor se ajusta durao para ambos os acontecimentos. Concluiu-se tambm que existe heterogeneidade tanto na anlise ao primeiro acontecimento, com uma proporo de clientes imunes ao risco de crdito, como na anlise transio para uma situao de default, onde foram identificados trs grupos de clientes com padres comportamentais distintos. Assim, a durao at ao primeiro incidente (i) foi estimada atravs de um modelo de sobrevivncia com proporo de imunes, em que esta proporo resulta de um modelo logstico utilizando o nvel de scoring interno como covarivel. Para o grupo dos no imunes foram consideradas covariveis para modelar os parmetros da log-normal, e

. Como seria de esperar, a nveis mais elevados de scoring est associada uma maior
probabilidade de pertencer ao grupo dos imunes. Para o grupo dos no imunes, a durao influenciada por informao relacionada com a estabilidade do cliente, com as garantias apresentadas e com as caractersticas da operao. A durao entre o primeiro incidente e uma situao de default (ii) foi estimada atravs de um modelo de sobrevivncia de mistura com 3 segmentos, utilizando uma funo de ligao logit multinomial e assumindo tambm que a durao t segue uma distribuio log-normal. Assim, foram identificados 3 padres de comportamento na transio para uma situao de default: (1) clientes com uma durao mais longa; (2) clientes com uma durao intermdia; e (3) clientes com durao mais curta, ou seja, com uma transio muito rpida, no pagando consecutivamente as mensalidades aps registarem um primeiro atraso, transitando para uma situao de default, 3 meses aps o primeiro acontecimento. Neste segundo modelo apenas foram modeladas as propores da mistura, considerando os parmetros, e , da log-normal como constantes. Assim, a probabilidade de um cliente pertencer ao grupo com uma durao mais longa aumenta nos casos em que o cliente apresente sinais de estabilidade e melhores garantias. A este grupo de clientes esto ainda associadas condies de crdito mais competitivas. Porm, ao contrrio do que seria de esperar, clientes pertencentes a um escalo etrio mais

elevado tm uma menor probabilidade de pertencerem ao grupo com durao mais longa. Para o grupo com durao mais curta, 3 meses aps o primeiro incidente, a probabilidade associada aumenta em contratos de crdito com taxas mais elevadas e maior prazo remanescente no momento em que o cliente regista o primeiro incidente. A anlise de sobrevivncia como tcnica aplicada em modelos de scoring comportamental, ao projectar um filme do desempenho futuro de um cliente de crdito, permite a sua utilizao em outros tipos de modelos, como em profit scoring. Os modelos de sobrevivncia apresentados neste estudo, incluem na sua grande maioria informao recolhida no momento da originao, possibilitando tambm a sua aplicao nesse tipo de modelos, estimando o envolvimento no momento em que o cliente entra em situao de default, calculando desta forma uma perda esperada que deve ser considerada na avaliao da rendibilidade de uma operao.

Lista de Figuras
Figura 2.1. Scoring aplicacional ....................................................................................... 4 Figura 2.2. Scoring comportamental tradicional .............................................................. 5 Figura 2.3. Desempenho histrico e comportamento futuro ............................................ 5 Figura 3.1. Dados censurados direita ............................................................................. 9 Figura 3.2. Taxas de risco para uma distribuio Weibull (=0.5) ................................ 16 Figura 3.3. Taxas de risco para uma distribuio log-normal ........................................ 17 Figura 3.4. Taxas de risco para uma distribuio log-logstica (=1) ............................ 18 Figura 3.5. Exemplo de anlise grfica dos pseudo-resduos ......................................... 26 Figura 4.1. Abordagem condicional tipo II .................................................................... 30 Figura 4.2. Funo sobrevivncia KM (1 Incidente) .................................................... 33 Figura 4.3. Taxa de risco (1 Incidente) ......................................................................... 33 Figura 4.4. Funo sobrevivncia KM (default)............................................................. 34 Figura 4.5. Taxa de risco (default) ................................................................................. 34 Figura 4.6. Exemplo: durao at default ....................................................................... 34 Figura 4.7. Taxa de risco por nvel de scoring. .............................................................. 36 Figura 4.8. Taxa de risco por nmero de intervenientes. ............................................... 37 Figura 4.9. Taxa de risco por nmero de dependentes. .................................................. 37 Figura 4.10. Taxa de risco por tipo de 2 interveniente. ................................................. 38 Figura 5.1. Pseudo-resduos Modelo com imunidade ................................................. 43 Figura 5.2. Pseudo-resduos MA[K1(X) K2(.)] (default) .............................................. 46 Figura 5.3. Pseudo-resduos Agregado vs Mistura (default) ....................................... 48 Figura 5.4. Funes sobrevivncia para cada grupo ....................................................... 50

Lista de Tabelas
Tabela 3.1. Sntese de modelos de anlise de sobrevivncia com distribuio log-normal ........................................................................................................................................ 27 Tabela 3.2. Modelo log-normal gerado .......................................................................... 28 Tabela 3.3. Coeficiente dos modelos ensaiados ............................................................. 29 Tabela 4.1. Estrutura de dados utilizada para o modelo de durao .............................. 31 Tabela 4.2. Descrio de variveis candidatas a covariveis ......................................... 32 Tabela 4.3. Distribuio de clientes por tipo de acontecimento ..................................... 33 Tabela 4.4. Resultados do teste de igualdade Log-Rank e Wilcoxon-Breslow-Gehan (1 incidente) ........................................................................................................................ 35 Tabela 4.5. Resultados do teste de igualdade Log-Rank e Wilcoxon-Breslow-Gehan (default) .......................................................................................................................... 36 Tabela 4.6. Regresso de Cox univariada LR 2(1) .................................................... 39 Tabela 5.1. Parmetros a modelar para o modelo de imunidade .................................... 40 Tabela 5.2. Critrios de informao Modelos agregados ............................................ 41 Tabela 5.3. Critrios de informao Modelos de Imunidade ...................................... 42 Tabela 5.4. Modelo de imunidade Distribuio log-normal........................................ 43 Tabela 5.5. Critrios de informao Modelos agregados e com imunidade................ 45 Tabela 5.6. Coeficientes para - Modelo agregado (default) vs Modelo com imunes (1 incidente) ........................................................................................................................ 47 Tabela 5.7. Avaliao dos modelos de durao com mistura......................................... 48 Tabela 5.8. Coeficientes do Modelo com mistura vs Modelo agregado ........................ 49

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

ndice
Lista de Figuras ............................................................................................................. viii Lista de Tabelas ............................................................................................................... ix 1. 2. 3. Introduo ................................................................................................................. 1 Scoring comportamental ........................................................................................... 4 Anlise de sobrevivncia........................................................................................... 9 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 4. 5. Introduo .......................................................................................................... 9 Modelos agregados .......................................................................................... 11 Modelos no paramtricos ............................................................................... 11 Modelos semi-paramtricos ............................................................................. 12 Modelos paramtricos ...................................................................................... 14 Modelos com heterogeneidade ........................................................................ 18 Modelos de mistura .......................................................................................... 19 Modelos com proporo de imunes ................................................................. 20 Modelos de fragilidade .................................................................................... 22 Estimao ......................................................................................................... 22 Diagnstico do modelo .................................................................................... 24 Ensaio com dados simulados ........................................................................... 28

Dados....................................................................................................................... 30 Modelos estimados .................................................................................................. 40 5.1. 5.2. Durao at ao 1 incidente.............................................................................. 40 Durao at default .......................................................................................... 44

6.

Concluso ................................................................................................................ 52

Bibliografia ..................................................................................................................... 55

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

1. Introduo
Em qualquer rea de negcio estar sempre presente um factor de incerteza, seja ele de ordem poltica ou econmica. Nos ltimos 500 anos, por exemplo, o plano econmico e poltico tem sido assumido por diferentes protagonistas como Portugal, Espanha, Holanda, Frana, Inglaterra e EUA e, segundo alguns analistas, ser assumido nos prximos tempos pela China e pela ndia (Keidel, 2008; Khanna, 2007). O risco de crdito apenas uma componente de um leque mais vasto de risco, mas que assume uma enorme importncia no negcio do crdito, e ocorre quando um cliente falha em honrar os seus compromissos. Um dos pilares para uma instituio financeira ser bem sucedida assenta no modo como avalia o risco dos seus clientes, sendo muitas vezes referido que o risco o principal negcio de uma instituio financeira. Assim, possuir modelos que apoiem na tomada de decises, de forma a minimizar a incerteza, um factor crtico de sucesso neste tipo de negcio. No mbito da gesto do risco de crdito, uma instituio necessita de tomar dois tipos de decises. Numa fase inicial do processo ter de decidir se concede o crdito e numa segunda fase, depois de eliminar crdito com potencial de risco mais elevado, necessrio definir que tipo de relacionamento adoptar com os clientes em carteira. Do mesmo modo, podemos classificar os modelos utilizados na avaliao do risco de crdito em 2 grupos: (i) modelos estticos scoring aplicacional utilizados para avaliar o risco de crdito no momento da concesso; (ii) modelos dinmicos scoring comportamental para avaliar o comportamento do cliente ao longo do contrato, identificando, por exemplo, padres que caracterizam clientes com maior potencial de incumprir (Thomas, 2009). Consoante o objectivo seja explicar ou prever, a probabilidade de um cliente incumprir, diferentes abordagens podem ser adoptadas na criao de um modelo de Credit Scoring, entre as mais utilizadas esto: Anlise Discriminante, Regresso Logstica, Redes Neuronais e rvores de Deciso (Thomas, 2009). Nesta primeira fase, os modelos estatsticos utilizados tornam-se teis no s na aprovao, ou recusa de uma operao, mas tambm na definio do preo, na medida em que a taxa mnima a que uma instituio financeira est disposta a conceder o crdito maior em operaes com perfil de risco mais elevado. A informao utilizada neste tipo de modelos contm variveis que espelham caractersticas da operao e do cliente no momento da proposta 1

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

de crdito e a sua situao em termos de cumprimento numa data posterior, ou seja, faz a ligao entre o incio da operao e uma data futura. Porm, essa apenas a fase inicial na relao da instituio financeira com o cliente. O modo como a operao gerida, o tipo de alteraes efectuadas na operao, que medidas so tomadas pela instituio quando o cliente falha um pagamento, se o cliente amortiza o emprstimo antecipadamente, todos estes factores tambm eles afectam a rendibilidade de uma operao. Num modelo esttico assume-se que a probabilidade de um cliente incumprir se mantm inalterada ao longo do tempo, ao passo que num dinmico essa probabilidade resulta da sua prpria dinmica pelo que pode variar ao longo do tempo. Num modelo de scoring comportamental, o comportamento futuro de um cliente o resultado, no s da fotografia inicial em que o crdito concedido, mas tambm de informao recente sobre o seu comportamento. Deste modo, ao contrrio do que sucede nos modelos estticos, a probabilidade do cliente incumprir assume um comportamento dinmico fruto da evoluo do seu prprio comportamento. Duas das possveis abordagens neste tipo de modelos so a Anlise de Sobrevivncia e as Cadeias de Markov (Thomas, 2009). Outra possibilidade seria a utilizao de modelos como, por exemplo, uma mistura de regresses de distribuies Poisson ou gama em que o objectivo passa por modelar a contagem de meses at ao momento de um cliente entrar em incumprimento. Porm, estes modelos, ao contrrio do que sucede com os modelos de durao, alm de ignorarem o factor tempo, no consideram a censura de dados. Ao mesmo tempo que contribui para uma maior eficcia na concesso de crdito, com uma melhoria da qualidade da carteira de crdito, a utilizao de modelos estatsticos na gesto de risco de crdito contribui tambm para uma maior eficincia, permitindo uma maior automatizao de processos, traduzindo-se numa vantagem competitiva, tornando as tomadas de deciso mais rpidas e libertando os analistas de crdito da anlise de propostas com perfis de risco mais definidos, ou seja, propostas com muito bom ou muito mau perfil de risco sero, respectivamente, aprovadas ou recusadas automaticamente 1, ficando apenas uma parcela das propostas de crdito sujeita deciso do analista.

Ficando pendentes apenas questes relacionadas com a validao dos dados dos clientes.

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

O objectivo deste estudo criar um modelo preditivo que auxilie a tomada de decises no seio da gesto de cobranas de uma instituio de crdito, tentando antecipar o comportamento de clientes numa carteira de crdito. Ao assumir que o comportamento de um cliente dinmico torna-se necessrio incluir o factor tempo na anlise e em vez de estimar a probabilidade de um cliente entrar em situao de incumprimento, o objectivo passa por estimar o momento, por exemplo, em que o cliente transita do estado de bom para mau cliente. Um cliente entra em incumprimento no momento em que falha o pagamento de uma prestao, altura em que fica sob vigilncia da gesto de cobranas. Porm, considerar apenas este acontecimento, pode ser bastante escasso, na medida em que se ignora uma fase posterior em que o cliente transita, ou no, para uma situao de incumprimento mais avanado, com atrasos superiores a 90 dias, mais prximo de uma situao de incumprimento definitivo, denominado default. Assim, com o objectivo de avaliar a dinmica do cliente ao logo do prazo do contrato de crdito, optou-se por considerar estes dois acontecimentos, registo do primeiro incidente e default, possibilitando assim antecipar a entrada de um cliente numa situao de gesto de cobranas e ao mesmo tempo avaliar o seu comportamento futuro, a partir do momento em que est sob gesto de cobranas. Nesta tese de mestrado so apresentados modelos de sobrevivncia de mistura, que estimam a durao at ao momento do cliente transitar para um estado de default, dado um conjunto informao sobre ao momento do cliente e a operao de crdito. Assim, este documento est organizado em 4 Captulos para alm desta Introduo e da Concluso. No Captulo 2 feita uma descrio do scoring comportamental, explicando as vantagens que advm da aplicao da anlise de sobrevivncia a este tipo de modelos de scoring. O Captulo 3 comea com uma breve introduo anlise de sobrevivncia e apresenta os conceitos e os tipos de modelos de anlise de sobrevivncia, desde os mais simples (agregados) aos mais complexos (heterogneos). A estrutura dos dados e as variveis utilizadas so apresentados no Captulo 4, bem como uma pr-seleco das variveis consideradas como covariveis nos modelos de sobrevivncia. No Captulo 5 so estimados modelos relativos a cada acontecimento, sendo apresentado um modelo de imunidade para a durao at ao primeiro incidente e um modelo de sobrevivncia de mistura, com 3 segmentos, para a durao entre o primeiro incidente e a transio para uma situao de default.

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

2. Scoring comportamental
Inicialmente, o principal objectivo dos modelos de scoring era apenas prever a probabilidade de um cliente entrar numa situao de default (PD), dado um conjunto de caractersticas do cliente e da operao, funcionando como modelo de classificao de possveis clientes em bons ou maus clientes, auxiliando deste modo a deciso de conceder, ou no, crdito a um novo proponente. Num modelo de scoring comportamental, a definio da situao do cliente normalmente compatvel com a definio utilizada num modelo de scoring aplicacional, sendo uma das mais comuns para classificar os clientes como maus clientes o facto de no ter pago trs prestaes mensais durante, por exemplo, os 12 a 18 meses seguintes. Porm, nos modelos comportamentais a instituio j conhece o cliente, sendo possvel modelar o seu comportamento futuro com base, no s na informao utilizada para construir um modelo de scoring aplicacional, mas tambm em informao adicional sobre o seu comportamento recente, auxiliando na tomada de decises relacionadas com os clientes que compem a sua carteira de crdito. Por exemplo, num produto de cartes de crdito, ou conta corrente, os limites de crdito podem ser fixados em funo de um modelo comportamental. Numa ptica de gesto de cobranas/crdito, este modelo pode ser til ao identificar grupos de clientes com diferentes PD associadas, para os quais se podem definir diferentes estratgias de cobranas. Numa empresa de servios (ex: comunicaes), este tipo de modelos pode ajudar a minimizar perdas provenientes da transferncia de clientes para empresas concorrentes, antecipando uma eventual fuga atravs de campanhas promocionais. Thomas (2009) define o scoring aplicacional como um modo de ligar duas fotografias do cliente, a primeira relacionada com as suas caractersticas no momento de avaliao da proposta de crdito (ponto de observao) e a segunda do seu estado de incumprimento, por exemplo, 12 meses aps a primeira fotografia, como demonstrado na Figura 2.1.

Ponto de observao

Situao 12 meses aps

Figura 2.1. Scoring aplicacional 4

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Num modelo comportamental, com a introduo de informao relativa ao desempenho recente do cliente, essa primeira fotografia substituda por um filme do comportamento do cliente, durante um perodo de 6 a 12 meses at ao ponto de observao. Assim, o padro de comportamento vai sofrendo alteraes medida que o contrato vai decorrendo. Essa informao pode ser fornecida por variveis como, por exemplo, o envolvimento mdio, mximo ou mnimo, o valor do crdito vencido, o nmero de rendas no pagas, entre outras, permitindo deste modo que a PD de um cliente sofra alteraes ao longo do tempo (Thomas, 2009). Porm, como apresentado na Figura 2.2, a segunda fotografia mantm-se num modelo de scoring comportamental tradicional.
Histrico recente Ponto de observao Situao 12 meses aps

Figura 2.2. Scoring comportamental tradicional A principal diferena entre os modelos representados nas Figuras 2.1 e 2.2 reside apenas na informao utilizada, na medida em que um modelo comportamental tradicional segue a mesma abordagem que um modelo aplicacional ao transformar informao sobre o comportamento recente do cliente num conjunto de medidas do seu comportamento. Atravs de um modelo adequado possvel substituir a segunda fotografia por um filme do comportamento futuro do cliente. Este pode ser modelado tanto por modelos de sobrevivncia como por modelos de cadeias de Markov (Thomas et al., 2001). Assim, possvel estimar, no s a probabilidade de um cliente se encontrar em situao de default 12 meses aps, mas tambm estimar a PD associada para um determinado momento futuro (3, 6 ou 9 meses aps o ponto de observao, ver Figura 2.3), permitindo a tomada de decises por parte da instituio com um timing mais eficiente.
Histrico recente Comportamento futuro Ponto de observao

Figura 2.3. Desempenho histrico e comportamento futuro

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

A incluso do factor tempo, em vez de uma varivel binria que classifica o cliente em bom ou mau, atravs de um modelo de sobrevivncia traduz-se tambm numa vantagem ao analisar a rendibilidade de uma operao de crdito. Por exemplo, considerando dois clientes com a mesma PD associada segundo um modelo aplicacional, em que o primeiro entra em default passados apenas 6 meses e o outro aps 3 anos, apesar de um modelo de scoring aplicacional lhes atribuir a mesma PD, estas duas operaes podem reflectir perdas e, consequentemente, rendibilidades muito diferentes. Bancos e outras instituies financeiras esto cada vez mais interessados um analisar a rendibilidade esperada de uma operao, em vez de estimarem apenas uma PD, pelo que o factor temporal no deve ser descurado na atribuio de novos limites de crdito e na definio do pricing. Assim, surge um outro tipo de modelos, profit scoring, que em vez de classificarem os clientes de crdito, em bons ou maus clientes, com base na sua PD, classificam os clientes/operaes de crdito em funo da sua rendibilidade (Thomas et al., 2002). Tratar a informao do modo apresentado nas Figuras 2.2 e 2.3, implica ignorar clientes que ainda no possuam suficiente informao histrica para modelar a PD, por exemplo nos 12 meses seguintes. Thomas et al. (2001) referem que uma das desvantagens dos modelos de scoring comportamental necessitarem de informao histrica de cerca de 2 anos, o que implica que o tipo de clientes utilizados para estimar o modelo seja diferente daqueles a que o modelo ser aplicado. Um modelo de anlise de sobrevivncia, alm de permitir modelar a durao at ao momento em que o cliente entra numa situao de incumprimento, com base apenas em informao utilizada em modelos aplicacionais, permite ainda considerar a censura de informao devido a numa determinada janela de observao o contrato de crdito no ter transitado ainda para uma situao de default, ou seja, sabe-se apenas que esse contrato no entrou em incumprimento at um determinado ponto temporal t, podendo ser considerado na estimativa da taxa de risco associada a um qualquer T t. Deste modo, possvel incluir clientes em que o ponto de observao, apresentado na Figura 2.1, seja mais recente. Stepanova e Thomas (2000) e Noh et al. (2005) comparam os resultados obtidos atravs do modelo de sobrevivncia com outros mtodos mais tradicionais, como a regresso logstica e redes neuronais, e concluram que os modelos de sobrevivncia

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

apresentavam desempenhos muito semelhantes. Porm, ao contrrio destes dois, como o modelo de sobrevivncia no possui uma varivel dependente binria, mas antes a durao t, permite calcular a taxa de risco acumulada para qualquer valor de T, semelhante probabilidade de default do modelo de redes neuronais e da regresso logstica. Neste estudo, os autores utilizaram variveis explicativas demogrficas e variveis relacionadas com o comportamento passado do cliente (6 meses). Em 2001 Stepanova e Thomas, num estudo sobre clientes de uma instituio financeira do Reino Unido, realaram ainda outra vantagem dos modelos de sobrevivncia: a possibilidade de calcular a rendibilidade esperada de uma operao, uma vez que permite estimar, atravs da funo sobrevivncia, a probabilidade do cliente incumprir em determinado ms. Thomas (2000) refere a importncia de acrescentar nos modelos de scoring informao relacionada com a envolvente econmica. Malik e Thomas (2010) e Bellotti e Crook (2007) utilizaram um modelo de anlise de sobrevivncia (regresso de Cox com proporcionalidade), com introduo de variveis macroeconmicas, como a taxa de juro e o nvel de desemprego, para estimar a durao at ao momento em que um cliente entra numa situao de default. Em particular, Malik e Thomas acrescentaram tambm no modelo de proporcionalidade um score comportamental interno como varivel explicativa. Cao et al. (2009), seguindo as indicaes do Basel II, utilizaram uma regresso de Cox com risco proporcional para modelar a probabilidade de default para um horizonte temporal de 12 meses, introduzindo o scoring como varivel explicativa. Andreeva et al. (2006) modelaram a durao entre a primeira compra por carto de crdito e a segunda compra ou a entrada em situao de default, atravs de um modelo de anlise de sobrevivncia paramtrico com base numa distribuio exponencial. Os autores utilizaram variveis explicativas relacionadas com as caractersticas do cliente (telefone fixo, tipo de habitao, estado civil, nmero de dependentes, profisso, idade do cliente, idade do cnjuge, antiguidade na morada e antiguidade no emprego) e da primeira compra (valor, tipo de produto, entre outros). Nesse estudo, os autores demonstraram que existe uma relao entre a rendibilidade e a durao at uma segunda compra/default e concluram que possvel optimizar a rendibilidade de uma operao atravs da funo de sobrevivncia, em vez de considerar uma PD esttica estimada por meio de uma regresso logstica.

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Porm, uma das desvantagens de modelos de anlise de sobrevivncia simples, em que a durao segue a mesma distribuio para todos os clientes, como os apresentados por Bellotti e Crook (2007) e Andreeva et al. (2006), aplicados gesto de risco, est relacionada com o facto de considerarem que todos os clientes, mais tarde ou mais cedo, transitam para uma situao de default. Porm, uma carteira de crdito contm tipicamente uma proporo muito reduzida de clientes em situao de default, pelo que o pressuposto de modelos simples de sobrevivncia no mnimo questionvel. Assim, Yildirim (2008) props um modelo de mistura multinvel para incorporar o efeito de sobrevivncia a longo prazo, em que cada cliente agrupado, com base no tipo de propriedade e zona geogrfica. Assim, o grupo de imunes ao risco (Z=1) e o grupo de clientes expostos ao risco (Z=0) definido pela varivel latente Z. Esta proporo de clientes imunes ao risco foi considerada por Beran e Djadja (2006), que estimou um modelo de sobrevivncia com proporo de imunes, aplicado a um conjunto de clientes de um banco suo. Neste modelo, os autores utilizaram uma funo logstica para definir a proporo de imunes e uma funo exponencial para modelar a durao at ao momento em que o cliente entra em default, sendo o parmetro da funo exponencial modelado pelo montante do crdito e pelo scoring interno do banco, atribudo no passado a cada cliente. A existncia de um grupo de clientes que no esto expostos ao risco de crdito, um pressuposto que, apesar de permitir incorporar no modelo de sobrevivncia um padro de comportamento que se traduz no cumprimento do crdito, pode mesmo assim ser escasso dada a heterogeneidade entre os clientes de crdito, podendo ser necessrio estimar modelos de mistura com um nmero mais elevado de segmentos.

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

3. Anlise de sobrevivncia
3.1. Introduo
A anlise de sobrevivncia, ou modelos de durao, foi concebida inicialmente como uma forma de tratar informao relativa mortalidade e tem como objectivo modelar a durao at ocorrncia de um determinado acontecimento, que implica a transio de um estado inicial para outro estado final 2. Uma vantagem deste tipo de modelos permitir a incluso de observaes em que a durao at ao acontecimento se encontra censurada. Esta censura ocorre quando temos apenas alguma informao sobre a durao, desconhecendo-se o momento exacto em que se regista o acontecimento. Ou seja, sabe-se apenas que, durante o perodo analisado, [0, ], no tinha transitado de estado, o que significa que o perodo de sobrevivncia superior ao perodo de observao - dados censurados direita. A Figura 3.1 mostra exemplos de episdios censurados resultantes do intervalo de tempo analisado.

A B C
0
Durao at acontecimento

Figura 3.1. Dados censurados direita

O episdio A censurado direita porque a janela temporal analisada limitou a sua observao para alm de , sabendo-se apenas que at ao momento no ocorreu o acontecimento em estudo. O episdio B est completo, no existindo qualquer tipo de censura. O episdio C censurado direita porque terminou sem que tenha ocorrido o acontecimento. Se o acontecimento em estudo for a entrada em incumprimento de um cliente de um contrato de crdito, esta situao pode dever-se resciso antecipada do

Para uma introduo anlise de sobrevivncia, vide Kleinbaum e Klein (2005).

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

contrato de crdito ou ento ter-se atingido o fim do prazo inicialmente acordado para o contrato de crdito, sem que o cliente transitasse de estado. Existem ainda outros dois tipos de censura: esquerda e intervalar. Dados censurados esquerda ocorrem quando o perodo de sobrevivncia inferior ao perodo de observao. Por exemplo, num estudo sobre a durao at ao momento em que um indivduo infectado por um vrus, o perodo de observao decorre at uma resultado positivo de uma anlise a esse vrus. Porm, no se sabe ao certo quando o indivduo foi infectado, sabe-se apenas que ele foi infectado antes do resultado da anlise. O outro tipo de censura, intervalar, est normalmente associada periodicidade de recolha dos algures entre o momento 3 1 t e . dados (Hosmer e Lemeshow, 1999), sabe-se apenas que o indivduo transitou de estado

( > ), que indica a probabilidade do acontecimento ocorrer aps o tempo t.

at esse acontecimento, T, pode ser representada pela funo de sobrevivncia, () =

Num modelo de anlise de sobrevivncia, a distribuio do perodo de tempo decorrido

A informao recolhida para modelar a funo de sobrevivncia condicional, (|), representada pelo vectores T, X e , em que Ti a durao (tempo) observada para o indivduo i, Xi o vector das variveis explicativas para o indivduo i e i indica se o

indivduo transitou de estado no momento definido por Ti. Deste modo, a funo de sobrevivncia condicional apresenta a seguinte frmula: (|) = ( > | = ) = (|),

pela taxa de risco (hazard rate) (|) e pela funo de risco acumulada (cumulative Alm da funo de sobrevivncia, a distribuio de T pode tambm ser caracterizada hazard function) (|) do seguinte modo: (|) = lim0
(<+|,=)

em que (|) representa a funo densidade de probabilidade.

(3.1)

(|) (|)

(3.2)

No mbito do risco de crdito, os dados apresentam-se normalmente numa base mensal pelo que T (varivel discreta) representa o nmero de meses decorridos at ao momento em que o cliente transita para um estado de incumprimento, ignorando-se em que dia exactamente um cliente entrou em incumprimento.

10

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Assim, a funo de sobrevivncia e probabilidade acumulada podem ser representadas da seguinte forma:
(|) = (|)

(|) = 0 (|) = 0

(|) (|)

(3.3)

Neste estudo foram definidos dois tipos de modelos de sobrevivncia: agregados e com heterogeneidade. Os primeiros podem ainda ser classificados como no paramtricos, semi-paramtricos e paramtricos. Os modelos com heterogeneidade caracterizam-se por considerarem uma mistura de distribuies, admitindo a presena de heterogeneidade, permitindo assim a criao de grupos. Dependendo do acontecimento em estudo, estes ltimos modelos tornam-se teis tambm por permitirem a incluso de uma proporo de indivduos imunes ao risco, ou seja, embora esta proporo possa no fazer muito sentido se o objecto de estudo for a mortalidade, no mbito do risco de crdito perfeitamente natural considerar uma proporo de imunes.

(|) = 1 (|).

(3.4) (3.5)

3.2. Modelos agregados


Modelos no paramtricos

Com o objectivo de evitar perda de informao proveniente de dados censurados de sobrevivncia, (), considerando simultaneamente dados censurados e no direita, Kaplan e Meier (1958) introduziram um estimador que permite estimar a funo at ao perodo t a seguinte: censurados. A frmula de Kaplan-Meier (KM) para a probabilidade de sobrevivncia = 1 ( > | ), 1 = =1 ( > | )
1

em que a probabilidade de sobrevivncia, ( 1 ), pode ser definida como o produto das parcelas que estimam a probabilidade para 1 t e perodos anteriores: ( > | ) = 1

(3.6)

(3.7) (3.8)

11

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Este estimador (KM) enquadra-se num tipo de anlise de sobrevivncia no paramtrica. Este tipo de modelos no assumem nenhum pressuposto sobre a distribuio da taxa de risco, nem sobre o modo como as covariveis a afectam. uma abordagem que normalmente se enquadra numa fase de anlise descritiva da funo sobrevivncia, em que o efeito das covariveis analisado estratificando os dados em grupos, de modo a representar diferentes curvas de sobrevivncia e de risco para cada grupo. Uma forma de avaliar se as curvas de sobrevivncia diferem significativamente entre cada grupo analisando os respectivos intervalos de confiana e verificar se eles se sobrepem ou no. Tambm com recurso a testes estatsticos possvel avaliar diferenas entre as curvas de sobrevivncia, nomeadamente o teste log-rank, que testa a hiptese nula da curva de sobrevivncia ser a mesma para todos os g grupos. A estatstica do teste segue uma distribuio 2 com g-1 graus de liberdade. Tal como outras estatsticas, noutros tipos de teste do 2 recorrem-se s frequncias observadas e frequncias esperadas para cada categoria da varivel analisada (Kleinbaum e Klein, 2005). Outros testes alternativos para testar a igualdade da curva de sobrevivncia podem ser utilizados como os testes de Wilcoxon, Tarone-Ware e Peto (Lee e Wang, 2003) Outro modelo no paramtrico de anlise de sobrevivncia tambm utilizada como tcnica descritiva so as Tbuas de Mortalidade (Life Tables). Uma limitao deste tipo de abordagem no permitir comparar um nmero muito elevado de grupos, que tornaria a anlise muito confusa. Alm disso, para analisar o efeito de variveis contnuas seria necessrio proceder sua transformao numa varivel categorial. Modelos semi-paramtricos

semelhana do que sucede com os modelos de sobrevivncia no paramtricos, os modelos semi-paramtricos tambm no assumem qualquer pressuposto sobre a distribuio da taxa de risco, porm, assumem alguns pressupostos sobre o efeito das covariveis sobre a taxa de risco, nomeadamente, que as taxas de risco so proporcionais entre os grupos para todo o espao temporal. Este conceito de proporcionalidade na funo de risco foi introduzido por Cox (1972) - proportional hazard (PH) function - e permitiu relacionar caractersticas individuais com a taxa de

12

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

risco de um acontecimento para determinado perodo atravs de um modelo de regresso de Cox semelhana do que sucede num modelo de credit scoring. Assim, sendo x o vector das variveis explicativas, pode definir-se a taxa de risco (hazard rate) do seguinte modo: (|) = () 0 ().

(3.9)

sobre uma taxa de risco base, 0 (), calculada para o perodo t. Uma vez que a taxa de risco no pode assumir valores negativos, () definida como uma funo exponencial das variveis explicativas: (|) = 0 (),

Isto significa que as caractersticas de um cliente/operao tm um efeito multiplicador

(3.10)

e a probabilidade de sobrevivncia alm do perodo t resulta da seguinte frmula: em que 0 () representa a funo de sobrevivncia base para o perodo t. (|) = [0 ()] , (3.11)

Enquanto que 0 () depende do perodo de tempo, os coeficientes associados s magnitude da funo ao longo do tempo, ou seja, assume-se que as variveis explicativas so independentes do factor tempo. Para aferir sobre o pressuposto de proporcionalidade acima referido possvel recorrer tanto a abordagens grficas como a testes estatsticos relacionados com o ajustamento. Uma das abordagens grficas mais comuns atravs das curvas de sobrevivncia -ln-ln, variveis explicativas, , mantm-se constantes ao longo do tempo, definindo apenas a

que consiste em comparar -ln(-ln) das curvas de sobrevivncia para cada grupo definido por uma varivel categorial e verificar se essas curvas so paralelas. Aplicando esta transformao em (3.11) temos: [ (|)]= [ 0 ()] .

(3.12)

Outra forma de avaliar graficamente este pressuposto comparando a curva de sobrevivncia observada (KM) com a estimada atravs de uma regresso de Cox com proporcionalidade de risco. Uma aproximao dessas duas curvas de sobrevivncia,

13

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

para uma

categoria da varivel analisada, sugere que o

pressuposto de

proporcionalidade razovel. Porm, a abordagem grfica para avaliar do pressuposto de proporcionalidade um pouco subjectiva, pelo que conveniente recorrer a testes estatsticos. Assim, uma forma mais objectiva de avaliar o pressuposto da proporcionalidade atravs da anlise dos resduos, ou seja, se os resduos no estiverem correlacionados com a durao ento o pressuposto de proporcionalidade no violado. Atravs dos resduos Schoenfeld, definidos para cada varivel explicativa no modelo estimado, possvel concluir sobre a proporcionalidade de cada uma das variveis (Hosmer e Lemeshow, 1999). Caso no se verifique o pressuposto de proporcionalidade relativamente a uma varivel dando origem a k taxas de risco base (baseline hazards), mantendo-se porm os pesos categorial com k categorias, esta pode ser utilizada como uma varivel de estratificao, Modelos paramtricos

constantes em todos os k nveis de estratificao.

Num modelo de sobrevivncia paramtrico pressupe-se que a durao segue uma

frmula em (3.1) para calcular a funo de sobrevivncia e a frmula definida em (3.2)

determinada distribuio com funo densidade de probabilidade (), aplicando-se a

para calcular a taxa de risco. Relativamente ao modo como as covariveis afectam a taxa de risco pode assumir-se dois tipos de efeitos: (i) que a covariveis tm um efeito multiplicador sobre uma taxa de risco (PH); (ii) ou que as covariveis tm um efeito multiplicador sobre o factor tempo (accelerated failure time models - AFT). Um modelo de risco proporcional (PH) assume uma funo da taxa de risco base comum a todos os indivduos, que se desloca para cima, ou para baixo, como resultado do efeito das covariveis, semelhante regresso de Cox, com a diferena da taxa de risco seguir uma distribuio conhecida. A funo da taxa de risco e funo de sobrevivncia so semelhantes s definidas para a regresso de Cox em (3.10) e (3.11), respectivamente. Por seu turno, num modelo AFT as variveis tm um feito multiplicador sobre o factor tempo, aumentando ou reduzindo a durao at ocorrncia do acontecimento. A taxa de risco resulta da seguinte frmula: (|) = 0 , (3.13)

14

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

e a probabilidade de sobrevivncia alm do perodo t resulta da seguinte frmula: (|) = 0 . (3.14)

Algumas das distribuies normalmente consideradas num modelo paramtrico de anlise de sobrevivncia so: a exponencial, a Weibull, a log-logstica e a log-normal. Distribuio exponencial A distribuio mais simples utilizada em anlise de sobrevivncia a distribuio exponencial, conhecida pela ausncia de memria. Se a durao t segue uma distribuio exponencial com parmetro , ento a funo densidade de probabilidade definida do seguinte modo: () = , (3.15)

com a funo de sobrevivncia e funo de risco definidas respectivamente por: () = . () = (3.16) (3.17)

A taxa de risco quando t segue uma distribuio exponencial constante e o so: [] = 1 e [] = 12 . Distribuio Weibull acontecimento em causa aleatrio e independente de t. O valor esperado e a varincia

A distribuio Weibull uma generalizao da distribuio exponencial. Se a durao t segue uma distribuio Weibull, com parmetros e p, ento a funo densidade de probabilidade, funo de

sobrevivncia

funo

de

risco

so

definidas,

respectivamente, do seguinte modo: () = () () = 1 ()

(3.18) (3.19) (3.20)

() = 1 .

15

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

[] = 2 (1 + 21 ) 2 (1 + 1 ). e diferentes valores para p.


3.0 2.5 2.0 h(t) 1.5

e valor esperado e a varincia so dados, respectivamente por: [] = 1 (1 + p1 ) e

A Figura 3.2 apresenta taxas de risco associadas a uma distribuio Weibull com =0.5

p=2.5

p=2

p=1.5 1.0 0.5 0.0 0 1 durao - t 2 p=1 p=0.75 p=0.25 3

Figura 3.2. Taxas de risco para uma distribuio Weibull (=0.5) Ao contrrio do modelo exponencial, o modelo Weibull no assume uma taxa de risco a taxa de risco representada por uma funo montona decrescente e quando > 1 a Distribuio log-normal Um modelo log-normal assume que o logaritmo da durao (t) segue uma distribuio normal com parmetros e . Deste modo, a funo densidade de probabilidade, funo de sobrevivncia e funo de risco so definidas, respectivamente, da seguinte forma: () = () =
1

em que = 1, os modelos Weibull e exponencial so equivalentes. Se 0 < < 1 ento constante, tornando-se deste modo numa distribuio mais flexvel. No caso especfico

taxa de risco representada por uma funo montona crescente.

() = 1
1

ln ()

ln () ln () 1

ln ()

(3.21) (3.22)

(3.23)

16

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

onde e representam, respectivamente, a funo densidade de probabilidade e a funo distribuio de uma normal-padro: () =
2 1

O valor esperado e a varincia so dados, respectivamente por: [] = exp( + 2 2) associadas a uma distribuio log-normal com diferentes valores para os parmetros e .
2.0 1.8 1.6 1.4 1.2 h(t) 1.0 0.8 0.6 0.4 0.2 0.0 0 1 2 3 durao - t 4 5 6 =0;=1.5 =1;=0.5 =0;=0.5

e [] = (exp( 2 ) 1) exp(2 + 2 ). A Figura 3.3 apresenta taxas de risco

() = () .

(3.24) (3.25)

Figura 3.3. Taxas de risco para uma distribuio log-normal Um modelo log-normal caracteriza-se por uma relao no montona entre a taxa de risco e a durao, em que a taxa de risco cresce inicialmente at um mximo e decresce posteriormente. Distribuio log-logstica Um modelo baseado numa distribuio log-logstica assume que a durao (t) segue uma distribuio log-logstica com parmetros e . A funo densidade de probabilidade, funo de sobrevivncia e funo de risco associadas a este tipo de modelos so, respectivamente 4:
4

No manual do Stata 10 referido 1/ em vez de .

17

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito
1
1

() = [1+( ) ]2 () = () =
1
1+( ) 1+( )

(3.26) (3.27)

O valor esperado e a varincia so dados, respectivamente por: [] = [] = 2


sin (2/) 2/

(3.28)
sin (/)

distribuio log-logstica para = 1 e diferentes valores para o parmetro .


2.0 1.8 1.6 1.4 1.2 h(t) 1.0 0.8 0.6 0.4 0.2 0.0 0 1 durao - t 2 3 =2 =1.5 =1 =0.5

(/)2 . sin 2 (/)

A Figura 3.4 apresenta as taxas de risco para uma

Figura 3.4. Taxas de risco para uma distribuio log-logstica (=1) Figura 3.4, para 1 obtm-se uma relao montona decrescente entre a taxa de Os modelos baseados nesta distribuio so bastante flexveis. Como se mostra na

semelhante ao do modelo log-normal.

risco e a durao e para > 1 uma relao no montona, com um comportamento

3.3. Modelos com heterogeneidade


Os modelos de sobrevivncia agregados assumem que a funo de risco se encontra completamente especificada dada uma funo de risco base e um conjunto de variveis explicativas e que na sua essncia os indivduos formam uma populao homognea. Lee e Timmermans (2007) referem num estudo sobre deslocaes que introduzir uma classe latente benfico, por representar as diferenas de comportamentos nos 18

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

indivduos. Os modelos de anlise de sobrevivncia apresentados nesta seco assumem que no existe apenas uma funo de risco base comum para todos os indivduos, mas antes, consideram a presena de grupos heterogneos com diferentes funes de risco associadas. Essa heterogeneidade pode ser contnua ou discreta, consoante o nmero de segmentos associados seja infinito ou finito, respectivamente. O mesmo dizer que a latente Z segue uma distribuio contnua ou discreta. Modelos de mistura

Um modelo de sobrevivncia de mistura permite considerar vrios grupos de indivduos, em que a durao t at ao acontecimento segue uma distribuio com diferentes parmetros. Vakratsas e Bass (2002) estimaram um modelo de sobrevivncia de mistura com o objectivo de identificar e caracterizar diferentes segmentos de agregados familiares em termos da sua taxa de compra (risco), e a sua propenso para reduzir a durao entre compras peridicas em funo de campanhas de marketing promocionais. Se considerarmos um modelo de mistura com S componentes (grupos), ento a funo densidade de probabilidade e funo de sobrevivncia so definidas do seguinte modo:
(|) = (| )
=1 =1

(3.29)

em que representa todos os parmetros do modelo (, ), representa os parmetros de um indivduo pertencer ao grupo s, ou a sua proporo, e satisfazem as seguintes condies: i) ii) > 0;

(|) = (| ),

(3.30)

da funo densidade de probabilidade associado ao grupo s e a probabilidade a priori

significa que todos os indivduos tm a mesma probabilidade de pertencer a cada grupo. O modelo concomitante permite que as propores de mistura sejam uma funo de covariveis (Dias, 2004), ou seja, = ( , ), em que representa o conjunto de 19

No modelo apresentado em (3.29) assume-se que constante para cada grupo, o que

= 1. =1

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

parmetros para a componente s. Assim, as propores de mistura podem ser estimadas considerando uma funo de ligao logit multinomial: = =1

(3.31)

probabilidade do indivduo pertencer ao grupo s, com S = 0 para que o modelo esteja identificado. Considerar a existncia de vrios grupos, com diferentes parmetros para uma determinada distribuio, permite por exemplo criar uma funo de risco global muito

em que representa os coeficientes associados s variveis explicativas , para a

mais flexvel, mesmo quando considerada uma funo montona para cada grupo. Jiang e Murthy (1998) mostram como modelar, por exemplo, a taxa de risco atravs de uma mistura de duas Weibull e identificaram oito tipos de curvas para a funo de risco: duas montonas e seis do tipo montanha russa. Uma funo de risco com um comportamento no montono sugere a existncia de heterogeneidade dos indivduos (Vakratsas, 1998). Modelos com proporo de imunes

Os tipos de modelos de anlise de sobrevivncia anteriormente apresentados no permitem considerar a existncia de um grupo de indivduos imunes ao risco, ou seja, para os quais no se regista o acontecimento em estudo. Esses modelos assumem que se um indivduo for observado por um perodo suficientemente longo ele ir registar um incidente: lim (|) = 0.

(3.32)

(i) - proporo dos imunes (cured); e (ii) (1 ) proporo dos indivduos expostos Um modelo de imunidade, ou cura, permite considerar duas propores de indivduos:

ao risco (uncured). Abreu e Rocha (2006) referem que a existncia de um elevado

nmero de observaes censurada, pode sustentar uma proporo de indivduos imunes ao risco. As autoras criaram um modelo de cura, considerando a distribuio de Chen, aplicado a pacientes com leucemia mielgena aguda avanada, aos quais foi feito um transplante de medula ssea. De Angelis et al. (1999) estimaram um modelo de

20

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

sobrevivncia relativa com mistura, utilizando dados de pacientes com cancro do clon. Este tipo de modelos tem tambm sido aplicado a outras reas, nomeadamente na rea do risco de crdito, como referido no Captulo 2 o estudo de Beran e Djadja (2006). dos imunes (|) e a dos no imunes (|): = + (1 ) (|). Assim, a funo de sobrevivncia neste tipo de modelos composta por duas parcelas, a (|) = (|) + (1 ) (|)

(3.33)

acontecimento, ento lim (|) = 1. A funo de sobrevivncia relativa ao grupo Uma vez que os indivduos pertencentes ao grupo dos imunes nunca iro registar o agregados. Sendo uma varivel latente binria, em que = 1 representa um indivduo dos no imunes pode ser modelada considerando uma das distribuies dos modelos atravs de uma regresso logstica: ( ) =
1+ 1

imune e = 0 um indivduo em risco (no imune), possvel modelar = ( = 1)


, (3.34)

probabilidade do indivduo pertencer ao grupo dos imunes. Kuk e Chen (1992) utilizaram um modelo de imunidade, combinando uma funo logstica para estimar a proporo de imunes com um modelo de risco proporcional semi-paramtrico. Ortega et al. (2009) estimaram um modelo de imunidade, analisando o efeito de covariveis simultaneamente na durao e na proporo de imunes, num estudo com pacientes com melanoma de pele, sujeitos a um tratamento ps-operatrio. Introduzindo o modelo logstico (3.34) em (3.33), a funo sobrevivncia total surge da seguinte forma: Considerando (|) como a funo densidade de probabilidade associada ao grupo dos no imunes, tem-se as seguintes funes densidade de probabilidade e risco global: (|, ) = [1 ()] (|) (|, ) = (3.36) [1 ()] (|) . () + [1 ()] (|) 21 (|, ) = () + [ 1 ()] (|). (3.35)

em que representa os coeficientes associados s variveis explicativas da

(3.37)

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Modelos de fragilidade

Nos modelos de fragilidade introduzido um efeito aleatrio no observado () na funo de risco de modo a considerar a heterogeneidade dos indivduos. Para este tipo de modelos, a taxa de risco e a funo de sobrevivncia, considerando o pressuposto de proporcionalidade, so apresentadas da seguinte forma, para o indivduo i: ( | ) = ( ) . ( | ) = ( ) (3.38) (3.39)

indivduo est mais exposto ao risco por motivos que no esto directamente relacionados com as covariveis includas no modelo. Se a componente de fragilidade for comum dentro de um grupo de indivduos (shared frailty) ento a taxa de risco, para o modelo multinvel, para o indivduo i pertencente ao grupo j apresentada da seguinte forma: = .

- ( | ) e (| ) - e um nvel populacional - ( ) e ( ). Se > 1, ento o Especificar o modelo deste modo permite distinguir na anlise entre um nvel individual

Por questes de identificao, assume-se que > 0 segue uma determinada distribuio (), com = [] = 1 e 2 = () = (Gutierrez, 2002), sendo este ltimo o populao dada por:

(3.40)

parmetro usualmente estimado. A funo no condicional de sobrevivncia para a () = [()] () 0

(3.41)

em que reala que o modelo depende da varincia do coeficiente de fragilidade.

3.4. Estimao
O mtodo de mxima verosimilhana (MLE - maximum likelihood estimation) permite estimar um modelo para um tipo de distribuio, que resulta numa funo de verosimilhana especfica. De um modo geral, a funo de verosimilhana simplesmente o produto das funes densidade de cada indivduo. No caso concreto da anlise de sobrevivncia, normalmente caracterizada pela censura de dados, a funo de verosimilhana inclui tambm informao relativa a essa censura. Para uma sub22

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

amostra de indivduos com censura, sabe-se apenas que no registaram o acontecimento binria em que = 1 indica que no houve censura e = 0 indica que a observao foi censurada, a funo de verosimilhana surge da seguinte forma: (|, ) = ( | ) ( | )1 . =1 (3.42) o tempo t dada pela funo de sobrevivncia (|). Considerando uma varivel durante o perodo de observao t, em que probabilidade do acontecimento ocorrer aps

O logaritmo da funo de verosimilhana dado por:

ou de forma equivalente por:

ln (|, ) = { ln ( | ) + (1 ) ln ( | )} =1 ln (|, ) = { ln ( | ) + ln ( | )}. =1

(3.43)

(3.44)

As funes apresentadas em (3.42) e (3.43) consideram apenas a censura de dados parmetros = (, ), a contribuio do indivduo i para o valor do logaritmo da funo de verosimilhana, assumindo apenas a censura de dados direita, resulta na seguinte frmula 5: (ln )2 + ln = ln + + ln 2 + 2 2 + (1 ) 1
ln t i e

direita. Por exemplo, considerando que t segue uma distribuio log-normal com

em que = () por forma a garantir > 0.

(3.45)

Considerando o logaritmo da funo de verosimilhana definida em (3.43), um modelo de anlise de sobrevivncia com mistura de S componentes estimado considerando a seguinte funo log-verosimilhana:
ln = { ln ( | ) + (1 ) ln ( | )}. =1

(3.46)

Substituindo em (3.42), a funo densidade de probabilidade e funo de sobrevivncia definidas em (3.20) e (3.21), respectivamente.

23

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Substituindo em (3.42) as funes densidade de probabilidade e sobrevivncia por forma a incorporar uma proporo de imunes, , obtm-se a seguinte funo de verosimilhana para um modelo de durao de mistura:
= [(1 ) ( | )] [ + (1 ) ( | )](1 ) ,
=1

(3.47)

e logaritmo da funo de verosimilhana dado por:


() = ln = { ln[(1 ) ( | )]
=1

Ao incluir uma proporo de imunes em (3.45), a contribuio individual para o valor do logaritmo da funo de verosimilhana para a distribuio log-normal resulta na seguinte frmula: ln = ln(1 ) ln + + ln 2 + +(1 ) + (1 ) 1
(ln )2

+ (1 ) ln[ + (1 ) ( | )]}.

(3.48)

2 2 ln t i e

em que pode ser modelado, por exemplo, atravs de uma funo de ligao do tipo logit, como apresentado em (3.34).

(3.49)

3.5. Diagnstico do modelo


Os vrios modelos podem ser comparados atravs da anlise do pseudo-R2, normalmente utilizado em modelos no lineares, calculado da seguinte forma: em que (0 ) o valor da log-verosimilhana do modelo composto apenas por candidatos atravs dos critrios de informao, AIC e BIC, que penalizam o acrscimo de parmetros a estimar, ) = 2( + 2 24 2 = 1
) ( , (0 )

(3.50)

) constantes e ( o valor da log-verosimilhana do modelo avaliado com parmetros .

Outro modo de seleccionar o modelo mais apropriado de entre um conjunto de modelos

(3.51)

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

com k parmetros estimados e n observaes. Estes critrios podem ser teis no s para avaliar a incluso de novas variveis, mas tambm para decidir sobre qual a distribuio a utilizar na modelao da durao (t), uma vez que o nmero de parmetros a estimar varia consoante a distribuio. Porm, escolher o melhor modelo com base nos critrios acima apresentados no garante por si s que o modelo seleccionado seja o mais adequado, existindo a possibilidade de no serem respeitados os pressupostos do modelo especfico. Uma abordagem grfica para avaliar se os pressupostos do modelo so respeitados, consiste em representar a funo de sobrevivncia obtida por um modelo no-paramtrico (KM) e a funo de sobrevivncia obtida pelo modelo que se pretende avaliar. Atravs de uma transformao adequada da funo de sobrevivncia obtida pelo modelo paramtrico que se pretende avaliar, de modo a que o resultado seja uma funo linear que possa ser avaliada visualmente. Por exemplo, considerando a funo de sobrevivncia de um modelo baseado numa distribuio log-normal, definida em (3.22) possvel obter a seguinte transformao linear:

) = 2( + ln()

(3.52)

em que -1 representa a inversa da funo de distribuio de uma normal-padro. 1 (1 ()) e ln() deve ser aproximadamente linear. Se o modelo baseado numa distribuio log-normal for adequado, ento a relao entre

1 (1 ()) = + ln()
1

(3.53)

Outro modo de avaliar se os pressupostos do modelo estimado so respeitados atravs da anlise de resduos, permitindo analisar desvios do modelo estimado e perceber de que forma o modelo pode ser melhorado. Blossfeld et al. (2007) referem uma anlise de resduos com base nos resduos generalizados de Cox e Snell (1968) definidos da seguinte forma para o indivduo i:
= (| ),

(3.54)

equivalente a 6:

Ver (3.3) e (3.4).

25

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Assim, os resduos generalizados, ou pseudo-resduos, so definidos como uma taxa de risco acumulada. Se o modelo especificado for adequado, os resduos devem seguir aproximadamente uma distribuio exponencial, qual est associada uma taxa de risco ln[ ()] com como apresentado na Figura 3.5. Se o modelo se ajustar aos dados, estimar a funo de sobrevivncia dos resduos () e comparar graficamente constante, independente da durao t. Recorrendo ao estimador Kaplan-Meier possvel

= ln ( | ).

(3.55)

ento o grfico dever apresentar uma linha recta com declive = 1.

Figura 3.5. Exemplo de anlise grfica dos pseudo-resduos (Blossfeld et al., 2007, p.222) A Tabela 3.1 resume os principais modelos anteriormente apresentados, bem como outros modelos estimados no Captulo 5, para o caso especfico de uma distribuio lognormal. Estes modelos foram estimados recorrendo ao software Stata 10. A terminologia apresentada na Tabela 3.1, que ser utilizada neste estudo para que MA = modelo agregado, MI = modelo com imunidade e MS = modelo de mistura com S segmentos. O parmetro K1 parmetro de localizao e K2 o parmetro de disperso da distribuio. A varivel Z indica as variveis usadas na funo de ligao logit. K1(.) identifica o parmetro K1 como sendo uma constante e K1(X) como sendo modelado. O mesmo se aplica para K2 e Z. Por exemplo, MI[(.) (.) Z(X)], respeita a um modelo identificar o tipo de modelo e os parmetros modelados, M(.)[K1(.) K2(.) Z(.)], em

26

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

com imunidade com modelao da proporo de imunes em que a durao dos no imunes segue uma distribuio log-normal. Tabela 3.1. Sntese de modelos de anlise de sobrevivncia com distribuio log-normal
MA - Agregado = 1 Tipo de Modelo MI - Com MS - Com Mistura imunes 2 = 2 =0 =0 =0

Modelao

(.) ln(.) [Z(.)]*

(.) ln(.) Z(X)

=0 N.A.

=0

1 = 1 + =0 =0 =0 =0 =0

=0, , s = 1, , S =0, , s = 1, , S =0, , s=1,...,S =0, , s=1,...,S =0, , s=1,...,S-1 =0, , s=1,...,S-1 =0, , s=1,...,S =0, , s=1,...,S-1

, = 0 1 + 1 =1

(X) ln(.) [Z(.)]*

(X) ln(X) [Z(.)]*

(X) ln() [Z(X)]*

= N.A. N.A. streg

=0

= =

= = = = = = =0 =

= , s=1,, S-1

= , s = 1, , S = , s = 1, , S = , s = 1, , S = , s = 1, , S = , s=1,, S-1 N.d. = , s=1,, S-1 =0, , s=1,...,S

= , s = 1, , S

(X) ln(X) [Z(X)]*

= cureregr / strsmix

= , s = 1, , S

Comandos STATA
* No aplicvel nos modelos agregados.

Os modelos agregados, MA[K1(X) K2(X)], podem ser estimados com o comando streg do Stata. Este comando alm da distribuio log-normal, permite considerar outras funes na distribuio da durao , exponencial, Gompertz, log-logstica, Weibull e a 27

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

gama generalizada, com a introduo de covariveis para cada parmetro da funo considerada. Porm, o streg no permite considerar mistura de distribuies. No Stata os modelos de sobrevivncia com imunes, dependendo da distribuio desejada, podem ser estimados utilizando os comandos cureregr (Buxton, 2007) e strsmix (Lambert, 2007) 7. O comando cureregr tem como opes para a distribuio de T as funes Weibull, log-normal, logstica, gama e exponencial. O comando strsmix permite considerar as funes Weibull, log-normal, gama, mistura de uma Weibull com uma exponencial e mistura de duas Weibull, para a distribuio de T. Em ambos os comandos, a proporo de imunes pode ser modelada atravs de uma funo de ligao tipo logit. Nenhum dos modelos descritos na coluna da direita da Tabela 3.1 pode ser estimado atravs dos comandos disponveis no Stata, pelo que foi necessrio programar o funo de log-verosimilhana via o modelo, (. ), a distribuio da varivel dependente respectivo estimador de mxima verosimilhana no Stata. necessrio especificar a e as variveis explicativas.

3.6. Ensaio com dados simulados


Para melhor compreender e validar os procedimentos nos modelos estimados na aplicao emprica, foi efectuado um ensaio com base em dados simulados, com 5 covariveis (1 5), como especificado na Tabela 3.2.
Parmetro Coeficiente

considerando um modelo base em que a durao t segue uma distribuio log-normal,

Tabela 3.2. Modelo log-normal gerado

x1 x2 x3 x4 x5 _cons 0.00 -0.75 1.25 -0.50 -0.50 1.00 1.00

_cons

Estes comandos podem ser encontrados atravs do comando findit.

28

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

A amostra utilizada nos ensaios tem dimenso n=10000 pelo que as estimativas so muito prximas dos valores dos parmetros reais. Assim, foram feitos 4 ensaios, considerando 4 bases de dados diferentes: i) MA [(X) ln(.)] sem dados censurados. Foi utilizada uma amostra retirada de uma populao gerada de acordo com o modelo especificado na Tabela 3.2; ii) MA [(X) ln(.)]. Foram acrescentados dados censurados amostra utilizada para o modelo i); iii) MI [(X) ln(.) Z(.)]. Com censura e proporo de imunes . Foi acrescentada uma proporo (20%) 8 de dados imunes base de dados utilizada para estimar o modelo ii); iv) MI [(X) ln(.) Z(X)]. Com censura e proporo de imunes =f(w). Semelhante ao modelo iii), mas funo logit de uma covarivel (w) e de uma constante. Na Tabela 3.3 apresentam-se os coeficientes dos modelos estimados, mostrando que as estimativas esto prximas dos verdadeiros valores dos parmetros. Comparando as estimativas dos modelos i) e ii) possvel concluir que o efeito da censura sobre os coeficientes das covariveis mnimo. Os coeficientes apresentados pelos modelos iii) e iv) mostram que mesmo adicionando uma proporo de imunes, os coeficientes associados aos no imunes esto prximos dos reais. Tabela 3.3. Coeficiente dos modelos ensaiados
Parmetros [/(1 )] w _cons x1 x2 x3 x4 x5 _cons Modelo verdadeiro -1.00 0.10 0.50 -0.75 1.25 -0.50 -0.50 1.00 1.00 Modelo i) n.a. n.a. 0.4976 -0.7454 1.2375 -0.5008 -0.4972 0.9946 1.0006 Modelo ii) n.a. n.a. 0.4975 -0.7342 1.2512 -0.5151 -0.4983 1.1319 1.0166 Modelo iii) n.a. -1.2319 0.4840 -0.7713 1.2604 -0.4791 -0.4987 1.0221 0.9945 Modelo iv) -0.9755 0.0942 0.4999 -0.7437 1.2289 -0.5029 -0.4822 1.0011 1.0020

_cons

= ln

1.3863

29

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

4.

Dados

Os dados consistem num conjunto de 8680 clientes de uma instituio financeira de crdito aos quais foi concedido crdito entre Janeiro de 2007 e Julho de 2009. Os dados recolhidos fornecem informao, no s sobre as condies inicialmente acordadas e segundo as quais o contrato ir decorrer, nomeadamente o prazo da operao, o valor da prestao e a taxa, mas tambm informao de carcter demogrfico relativa aos intervenientes (cliente e avalistas), nomeadamente idade, estado civil, tipo de habitao, rendimento, entre outros. Alm de dados relativos ao momento da concesso do crdito foi tambm recolhida informao mensal sobre o desempenho do cliente, como a data em que o cliente registou o primeiro atraso no pagamento da prestao e a data em que o cliente entrou em situao de default. A ltima fotografia recolhida respeita a Agosto de 2009. Os dados utilizados na construo do modelo de sobrevivncia so apurados com base neste ltimo conjunto de dados longitudinais tendo sido definidos dois acontecimentos. O primeiro acontecimento est relacionado com a transio de um estado em que o cliente no regista qualquer atraso para um estado em que regista um primeiro incidente. O segundo acontecimento regista-se quando o cliente transita de um estado de atraso at 90 dias para um atraso superior a 90 dias, i.e., entra em default. Outras situaes podem ser tambm classificadas em default sem que a antiguidade da dvida ultrapasse os 90 dias, por exemplo casos em que haja uma manifesta incapacidade por parte do cliente. Por questes de confidencialidade, a amostra foi seleccionada de forma a distorcer os ndices de incumprimento associados carteira de crdito da instituio financeira. Optou-se, assim, por construir uma amostra composta por uma proporo idntica de clientes que entram ou no em situao de default. Este procedimento de emparelhamento comum por exemplo nos estudos das causas de falncias de empresas (Hensher e Jones, 2004).

Figura 4.1. Abordagem condicional tipo II

30

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Uma vez que para atingir uma situao de default o cliente teve obrigatoriamente de passar por uma situao de registo de incidente, est implcita uma ordem entre acontecimentos, impondo-se assim uma abordagem que permita a introduo de eventos recorrentes, nomeadamente, uma abordagem condicional do tipo II (Prentice et al., 1981) que se centra na anlise da durao entre os dois acontecimento, outra alternativa seria uma abordagem marginal (Wei et al., 1989) que se centra na durao total entre o incio do perodo de observao e o acontecimento, mas que ignora a caracterstica primeiro incidente e 2 a durao entre o registo do primeiro incidente e a transio para uma situao de default. Deste modo, a estrutura dos dados utilizada no modelo de durao encontra-se apresentada na Tabela 4.1. Tabela 4.1. Estrutura de dados utilizada para o modelo de durao
ID 1 1 2 2 3 n Intervalo 1 2 1 2 1 1 Durao t11 t21 t12 t22 t13 t1n Acontecimento 1 1 1 0 0 0 X1 x11 x11 x12 x12 x13 x1n X2 x21 x21 x22 x22 x23 x2n Xj xj1 xj1 xj2 xj2 xj3 xjn

abordagem condicional tipo II, para o cliente i, em que 1 representa a durao at o recorrente destes acontecimentos. A Figura 4.1 mostra a dinmica inerente a uma

Em que X representa as variveis explicativas utilizadas para modelar o tempo at ao acontecimento ou momento de censura dos dados. A Tabela 4.2 descreve as variveis consideradas como candidatas a entrar no modelo como variveis explicativas. A seleco de variveis teve por base estudos anteriores que consideram a idade do cliente, o montante financiado, o prazo da operao, o tipo de produto, o nmero de dependentes, um nmero de telefone fixo, profisso, existncia de avalistas, rendimento anual, estado civil e tipo de habitao (Stepanova e Thomas, 2000; Andreeva et al., 2006; Sarlija et al., 2009; Till e Hand, 2003). Outros autores introduziram, entre outras variveis, um scoring interno como varivel explicativa da durao at o cliente entrar em default (Beran e Djadja, 2006; Malik e Thomas, 2010; Cao et al., 2009). Alm das utilizadas em estudos anteriores foram recolhidas outras variveis, com base na experincia do autor, que alm de poderem melhorar a capacidade explicativa dos modelos, podem tambm servir de indicao para estudos futuros. Estas variveis so (vide Tabela 4.2): Idadebem, eurotax, loantovalue, taxa, prestacao e taxaesforco.

31

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

De notar que as variveis loantovalue 9, taxaesforo 10 e prazoremincidente 11 so calculadas com base em variveis apresentadas na Tabela 4.2, pelo que estamos na presena de colinearidade perfeita. Porm, optou-se por incluir para j estas variveis no estudo, deixando para depois de uma anlise univarida, atravs de uma regresso de Cox, a deciso sobre as variveis a excluir. Tabela 4.2. Descrio de variveis candidatas a covariveis
Varivel Idadebem eurotax vf loantovalue taxa prazo prestacao produto scoring numinterv Idadecliente dependentescli telefempregofixo telefcontactofixo habitacao estadocivil rendimensal tipo2interv taxaesforco tincidente Tipo Mtrica Mtrica Mtrica Mtrica Mtrica Mtrica Mtrica Ordinal Ordinal Mtrica Ordinal Descrio Antiguidade (anos) do bem financiado no incio do contrato Valor (u.m.) do bem no incio do contrato Valor (u.m.) do crdito concedido Relao entre o valor do crdito concedido e o valor do colateral Taxa nominal acordada no incio do contrato de crdito Durao do contrato em meses acordada no incio do crdito Valor (u.m.) da prestao mensal do contrato de crdito Nvel de scoring (applicant scoring) global atribudo operao Nmero de intervenientes no contrato (cliente, cotitular e avalistas) Idade do cliente no incio do contrato de crdito

Nominal Tipo de produto (1=A, 2=B, 3=C)

Nmero de dependentes do cliente no incio do contrato de crdito Nominal Indica se o cliente comunicou telefone fixo da entidade patronal (1=Telefone fixo da entidade patronal) Nominal Indica se o cliente possui telefone fixo (1=Possui telefone fixo) Nominal Tipo de habitao do cliente (1=Arrendada, 2=Outra, 3=Prpria com hipoteca, 4= Prpria sem hipoteca) Nominal Estado civil do cliente (1=Casado, 2=Divorciado, 3=Solteiro, 4=Vivo) Mtrica Rendimento mensal do cliente (u.m.) Nominal Tipo de segundo interveniente (1=Avalista, 2=Cotitular, 3=nico titular) Mtrica Taxa de esforo (prestacao / rendimensal) Mtrica Nmero de meses decorridos at o cliente registar o 1 incidente. Prazo remanescente quando o cliente registou o 1 incidente.

prazoremincidente Mtrica

As variveis numinterv e dependentescli foram recodificadas de modo a agregar na mesma categoria observaes com valores mais elevados. Assim, a varivel numinterv
= = 11 =
9 10

32

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

assume valor 3 em operaes de crdito com 3 ou mais intervenientes e a varivel dependentescli assume valor 2 para clientes com 2 ou mais dependentes (e passando a varivel ordinal). A Tabela 4.3 resume a distribuio de clientes por intervalo (1: incidente; 2: default) e que registaram o acontecimento. Tabela 4.3. Distribuio de clientes por tipo de acontecimento
Intervalo 1 Incidente 2 - Default Acontecimento 0 1 3278 5402 1749 3653 Total 8680 5402

Durante o perodo analisado, 38% dos clientes no registaram qualquer incumprimento e 58% dos clientes no registaram atrasos superiores a 90 dias. De notar que as observaes do intervalo 2 default dizem respeito a clientes que registaram o acontecimento no intervalo 1 Incidente. As Figuras 4.2 e 4.4 mostram a funo de sobrevivncia segundo o estimador de Kaplan-Meier para cada um dos acontecimentos em estudo e as Figuras 4.3 e 4.5 a respectiva taxa de risco.
1.00 0.20

0.75 0.15

0.50 0.10

0.25 0.05

0.00 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 Meses aps incio do contrato 0.00


1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31

Meses aps incio do contrato

Figura 4.2. Funo sobrevivncia KM (1 Incidente)

Figura 4.3. Taxa de risco (1 Incidente)

As Figuras 4.3 e 4.5 mostram uma clara diferena no comportamento da taxa de risco associada a cada um dos acontecimentos. A taxa de risco associada ao primeiro atraso mais elevada nos meses iniciais do contrato de crdito diminuindo progressivamente com o decorrer do contrato atingindo valores muito prximos de 0, que resulta num decrscimo cada vez menos acentuado da funo de sobrevivncia. Na Figura 4.2 33

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

possvel observar que a funo sobrevivncia associada ao primeiro acontecimento parece estabilizar ligeiramente acima de 0.25, o que sugere a existncia de um grupo de clientes que cumpre o contrato sem registar qualquer atraso no pagamento das prestaes, ou seja, um grupo de imunes ao risco de crdito.
1.00

0.16 0.14

0.75

0.12 0.10
0.50

0.08 0.06
0.25

0.04 0.02
0.00 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Meses aps registo do primeiro incidente

0.00
1 3 5 7 9 11 13 15 17 19 21 23 25 27

Meses aps registo do primeiro incidente

Figura 4.4. Funo sobrevivncia KM (default)

Figura 4.5. Taxa de risco (default)

Contrariamente, a taxa de risco associada ao segundo acontecimento apresenta um comportamento ligeiramente crescente ao longo da vida do contrato. De notar que, a taxa de risco para os primeiros 2 meses aps o registo do primeiro incidente muito prxima de zero, registando um forte acrscimo para 3 meses. Este comportamento da taxa de risco sugere a existncia de um grupo de clientes que com uma transio muito rpida para um situao de default, deixando de pagar as prestaes precedentes aps um primeiro incumprimento, entrando em default em apenas 3 meses aps o registo do primeiro incidente, como exemplificado na Figura 4.6.
incio do contrato 1 incidente default

5 atraso at 30 dias

meses

atraso atraso default: atraso at at mais 60 dias 90 dias 90 dias 3 meses

Figura 4.6. Exemplo: durao at default

34

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

De qualquer modo, em termos globais a transio para um estado em que o cliente j registou atrasos mais rpida, comparativamente com uma transio posterior para uma situao de default, como se pode concluir atravs da anlise da mediana do tempo at ao acontecimento (linha vermelha nos grficos das Figuras 4.2 e 4.4), em 50% dos clientes da amostra regista um primeiro incidente durante os primeiros 8 meses do contrato e 50% dos clientes que registam incidentes entram em default 11 meses aps o registo do primeiro incidente. Dado o conjunto de variveis candidatas apresentadas na Tabela 4.2 e para avaliar a capacidade explicativa de cada uma nos modelos de sobrevivncia, para ambos os acontecimentos comeou-se por analisar as variveis no mtricas, sendo

posteriormente analisadas as variveis mtricas aplicando uma regresso univariada de Cox. Assim, para avaliar se existem diferenas significativas nas funes de sobrevivncia associadas a cada uma das categorias das variveis no mtricas apresentadas na Tabela 4.2 recorreu-se ao teste de igualdade Log-Rank e Wilcoxon, cuja hiptese nula estabelece que a funo de sobrevivncia comum a todas as categorias da varivel. Os resultados dos testes so apresentados nas Tabela 4.4 e 4.5 para o 1 e 2 acontecimento, respectivamente. Tabela 4.4. Resultados do teste de igualdade Log-Rank e Wilcoxon-Breslow-Gehan (1 incidente)
Varivel Log-Rank (no mtrica) 2 scoring (6)= 1110.65 *** numinterv 134.66 *** 2(2)= 2 dependentescli 7.04 * (2)= 2 telefempregofixo 68.59 *** (1)= 2 telefcontactofixo 81.84 *** (1)= 2 habitacao 41.33 *** (3)= 2 estadocivil 110.08 *** (3)= 2 tipo2interv 160.46 *** (2)= 2 produto 172.08 *** (2)= * p < 0.05; ** p < 0.01; *** p < 0.001. Wilcoxon-BreslowGehan 2(6)= 1024.08 *** 150.91 *** 2(2)= 14.83 *** 2(2)= 54.40 *** 2(1)= 83.54 *** 2(1)= 47.22 *** 2(3)= 118.32 *** 2(3)= 179.99 *** 2(2)= 179.08 *** 2(2)=

35

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Tabela 4.5. Resultados do teste de igualdade Log-Rank e Wilcoxon-Breslow-Gehan (default)


Varivel Log-Rank (no mtrica) scoring 2(6)= 317.03 *** numinterv 2(2)= 168.59 *** dependentescli 2(2)= 19.99 *** telefempregofixo 2(1)= 25.43 *** telefcontactofixo 2(1)= 39.91 *** habitacao 2(3)= 46.46 *** estadocivil 2(3)= 64.64 *** tipo2interv 2(2)= 162.47 *** produto 2(2)= 35.22 *** * p < 0.05; ** p < 0.01; *** p < 0.001. Wilcoxon-BreslowGehan 2(6)= 290.25 *** 2(2)= 172.71 *** 2(2)= 26.99 *** 2(1)= 19.76 *** 2(1)= 40.94 *** 2(3)= 60.30 *** 2(3)= 64.68 *** 2(2)= 170.33 *** 2(2)= 33.05 ***

Os valores dos testes so significativos para todas as variveis no mtricas, pelo que nesta fase nenhuma varivel descartada, continuando como possveis variveis explicativas ou de estratificao na anlise aqui apresentada. Ainda relativamente s variveis no mtricas, mais concretamente s ordinais, interessa tambm analisar se o comportamento da taxa de risco para cada categoria coerente com a ordem implcita nas categorias. Nas Figuras 4.7 a 4.9 so apresentadas as taxas de risco associadas a ambos os acontecimentos para as variveis scoring, numinterv e dependentescli.
Taxa de risco - scoring
.15
.15

Taxa de risco - scoring


Acontecimento: default

Acontecimento: 1 Incidente

.1

.05

0
0

.05

.1

0
scoring = 1

10 Durao (meses)
scoring = 2

20
scoring = 3

30
scoring = 4

10 Durao (meses) i 1 scoring = 6

20 i 2 scoring = 7

30

scoring = 5

Figura 4.7. Taxa de risco por nvel de scoring.


As taxas de risco associadas a cada nvel de scoring so globalmente coerentes com a ordem implcita nos nveis de scoring, ou seja, taxas de risco mais elevadas esto associadas a nveis de scoring mais baixos, verificam-se apenas algumas incoerncias para duraes mais prolongadas, provavelmente devido a um nmero reduzido de observaes.

36

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito
Taxa de risco - numinterv
Acontecimento: 1 Incidente
.08
.12

Taxa de risco - numinterv


Acontecimento: default

.06

.04

.02

.02

.04

.06

.08

.1

10 Durao (meses)

20
numinterv = 1

30

10 Durao (meses)

20

30

numinterv = 2

numinterv = 3

Figura 4.8. Taxa de risco por nmero de intervenientes.


Taxa de risco - dependentescli
Acontecimento: 1 Incidente
.08

Taxa de risco - dependentescli


Acontecimento: default
.1

.06

.04

.02

10 Durao (meses)

20

30

.02
0

.04

.06

.08

10 Durao (meses)

20

30

dependentescli = 0

dependentescli = 1

dependentescli = 2

Figura 4.9. Taxa de risco por nmero de dependentes. Relativamente varivel ordinal numinterv, parece no haver grande diferena nas taxas de risco entre operaes com 2 ou mais intervenientes para o primeiro acontecimento, o que sugere que o principal factor de diferenciao para este acontecimento o facto de o cliente ser ou no o nico interveniente. Esta proximidade das taxas de risco para 2 ou mais intervenientes deixa de ser evidente para o segundo acontecimento default. Na Figura 4.10 so apresentadas as taxas de risco por tipo de segundo interveniente, para cada acontecimento. No que respeita ao primeiro acontecimento, as taxas associadas a cada categoria de tipo2interv apresentam-se mais destacadas, quando comparadas com as categorias de numinterv, pelo que esta varivel no ser considerada nos modelos relativos ao primeiro acontecimento. De notar que tambm a varivel tipo2interv 12 fornece informao sobre se o cliente ou no o nico interveniente e ao mesmo tempo, caso no seja, fornece informao se o segundo interveniente um mero avalista ou cotitular do contrato de crdito. Optar entre estas duas variveis, no caso do segundo acontecimento, equivale a optar entre a quantidade de intervenientes (numinterv) na proposta e a qualidade dos segundos intervenientes (tipo2interv).

12

Tipo de segundo interveniente (1=Avalista, 2=Cotitular, 3=nico titular).

37

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito
Taxa de risco - tipo2interv
Acontecimento: 1 Incidente
.08
.12

Taxa de risco - tipo2interv


Acontecimento: default

.06

.04

.02

.02

.04

.06

.08

.1

10 Durao (meses)

20

30

10 Durao (meses)

20

30

Avalista

Cotitular

nico Titular

Figura 4.10. Taxa de risco por tipo de 2 interveniente. As taxas de risco associadas s categorias de dependentescli apresentam uma maior proximidade comparativamente com as apresentadas para scoring e numinterv. Alm disso, no apresentam um comportamento coerente com a ordem das categorias para o primeiro acontecimento. Apesar de clientes com 2 ou mais dependentes apresentarem taxas de risco globalmente mais elevadas para o primeiro acontecimento, esta situao altera-se para a taxa de risco relativa ao default, em que clientes sem dependentes apresentam globalmente uma taxa de risco mais elevada. Relativamente s variveis mtricas, recorreu-se ao teste de rcio de verosimilhana (LRT - Likelihood Ratio Test) 13 para testar se a sua incluso num modelo de regresso univariada (Cox proportional hazard) resultaria numa melhoria significativa relativamente ao modelo nulo. A Tabela 4.6 mostra os resultados do teste aplicando uma regresso univariada de Cox para cada um dos acontecimentos: o tempo at ao primeiro incidente e o tempo at situao de default. As variveis vf e prestacao no so estatisticamente significativas na explicao de ambos os acontecimentos, pelo que no sero utilizadas como explicativas nos modelos estimados no Captulo 5. Deste modo, evita-se tambm o problema de colinearidade perfeita com as variveis loantovalue e taxaesforco, como atrs referido. Por outro lado, as variveis prazo, rendimensal e taxa de esforo surgem como possveis variveis explicativas apenas para um modelo relativo ao primeiro acontecimento, registo do primeiro atraso. A varivel tincidente, que representa o tempo
2 O valor do teste (G) segue uma distribuio do tipo , considerando ( ) o mximo da funo de log-verosimilhana do modelo geral e ( ) o mximo da funo de log-verosimilhana do modelo restrito:
13

= 2 ln

( )

( )

, em que g e r so o nmero de parmetros dos modelos respectivos.

38

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

em meses at ao momento em que o cliente registar um primeiro atraso e a varivel prazoremincidente que representa o prazo remanescente at ao final do contrato quando o cliente regista o primeiro incidente. Assim, ambas as variveis so potenciais variveis explicativas da durao at situao de default. Tambm aqui evitado o problema de colinearidade perfeita, uma vez que a varivel prazo no ser considerada no modelo relativo ao 2 acontecimento. Salienta-se porm que o facto de tincidente ser um varivel endgena, uma vez que esta a varivel que se pretende modelar no modelo relativo ao primeiro acontecimento, apesar de significativa numa regresso univariada, deixa de fazer sentido a sua incluso numa modelo multivariado. Tabela 4.6. Regresso de Cox univariada LR 2(1)
Tempo at: 1 Incidente Default idadebem 228.86*** 56.58*** eurotax 67.67*** 9.79* loantovalue 245.52*** 27.41*** 0.40 vf 2.40 taxa 345.33*** 105.05*** 1.38 prazo 94.58*** idadecliente 29.11*** 17.73*** 0.45 prestacao 0.95 0.45 rendimensal 19.21*** 1.41 taxaesforco 4.64* 30.25*** tincidente n.a. 5.31* prazoremincidente n.a. * p < 0.05; ** p < 0.01; *** p < 0.001. Varivel

Assim, as variveis explicativas candidatas para os modelos associados a cada acontecimento so: Primeiro incidente: scoring, tetelefcontactofixo, telefempregofixo, habitacao, estadocivil, tipo2interv, produto, idadebem, eurotax, loantovalue, taxa, prazo, idadecliente, rendimensal e taxaesforco; Situao de default: scoring, numinterv, tetelefcontactofixo, telefempregofixo, habitacao, estadocivil, tipo2interv, produto, idadebem, eurotax, loantovalue, taxa, idadecliente tincidente e prazoremincidente.

39

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

5. Modelos estimados
Como referido no Captulo 4, neste estudo foram considerados dois acontecimentos. Assim, a primeira parte deste Captulo pretende estimar a durao at ao registo de um primeiro atraso primeiro incidente e ao mesmo tempo avaliar a existncia de uma proporo de clientes imunes ao risco de crdito atravs de um modelo de imunidade. Na segunda parte sero ensaiados modelos com o objectivo de estimar a durao entre o primeiro incidente e uma situao com atraso superior a 90 dias default. Ser analisada a heterogeneidade de comportamentos na transio do primeiro para o segundo acontecimento, investigando a existncia de um grupo de clientes com uma transio muito rpida, apenas 3 meses, entre estes dois acontecimentos.

5.1. Durao at ao 1 incidente


Os modelos de imunidade so um tipo de modelos de anlise de sobrevivncia que assumem a presena de uma proporo de indivduos para os quais o acontecimento em estudo nunca ir ocorrer. Como referido anteriormente, a taxa de risco associada ocorrncia do primeiro incidente tende a aproximar-se de 0 medida que o contrato avana no tempo, resultando numa funo de sobrevivncia quase paralela ao eixo das abcissas. Neste estudo foram testados modelos admitindo que t segue uma distribuio exponencial, Weibull, log-normal e log-logstica. A Tabela 5.1 resume os parmetros estimados em cada uma das distribuies analisadas. Considerou-se a funo de ligao logit 14. Tabela 5.1. Parmetros a modelar para o modelo de imunidade
Distribuio Exponencial Weibull Log-normal Log- logstica Parmetros K1 K2

Comeou-se por estimar um conjunto de modelos agregados considerando as distribuies da Tabela 5.1, para posteriormente estimar modelos com imunes, avaliando se estes so mais adequados comparativamente com os modelos agregados. As covariveis para K1 foram seleccionadas por stepwise 15, disponvel no comando
14 15

= (1 + exp())1 .

Com recurso ao streg do Stata: stepwise, pe(0.05) pr(0.1) forward:streg lista_cov, dist(distrition)

40

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

streg, de entre as variveis identificadas no captulo anterior, no sendo para j considerada a varivel scoring uma vez que praticamente todas as outras variveis so consideradas no seu clculo. Para K2, e como o stepwise no streg, analisa apenas o parmetro de localizao K1, foram adicionadas todas as variveis, sendo ( = 0.05). posteriormente retiradas uma a uma, caso no apresentassem coeficientes significativos

A Tabela 5.2 resume os modelos agregados estimados. Destes modelos, o modelo logparmetros da distribuio, MA[(X) ln(X)].
Modelo MA[K1(.) K2(.)] () Exponential LL df AIC BIC LL df AIC BIC LL df AIC BIC

normal apresenta melhores resultados (AIC e BIC), com modelao de ambos os

Tabela 5.2. Critrios de informao Modelos agregados


Weibull -19658.35 2 39320.7 39334.84 -18975.16 14 37978.33 38077.29 -18965.61 17 37965.22 38085.39 Log-normal -19054.76 2 38113.53 38127.66 -18452.44 15 36934.89 37040.92 -18372.2 20 36784.4 36925.78 Loglogstica -19250.03 2 38504.06 38518.19 -18597.29 14 37222.59 37321.55 -18534.4 20 37108.81 37250.18

MA[K1(X) K2(.)]

MA[K1(X) K2(X)]

-19896.97 1 39795.95 39803.02 -19101.8 14 38231.6 38330.56 -

Uma vez que nenhum dos comandos disponibilizados no Stata para estimar modelos de imunidade suporta o mtodo stepwise, a seleco das covariveis para os modelos de imunidade foi efectuada de modo idntico ao parmetro K2 nos modelos agregados, ou no apresentassem coeficientes significativos ( = 0.05). A proporo de mistura foi seja, foram adicionadas todas as variveis e posteriormente retiradas uma a uma, caso prazo do contrato. Para cada uma das distribuies foram testados 5 tipos de modelos, excepto para a exponencial que foram testados apenas 4, como apresentado na Tabela 5.3.

modelada apenas pela varivel scoring, uma vez que esta varivel pretende precisamente estimar a probabilidade de um cliente entrar em incumprimento durante o

41

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Tabela 5.3. Critrios de informao Modelos de Imunidade


Tipo de modelo MI[K1(.) K2(.) Z(.)] Weibull -19178.78 3 38363.57 38384.77 -18752.29 13 37530.57 37622.47 -18740.08 16 37512.15 37625.26 -18732.02 9 37482.04 37545.66 -18521.35 22 37086.71 37242.22 Lognormal -18766.93 3 37539.86 37561.06 -18369.79 15 36769.58 36875.61 -18257.31 19 36552.63 36686.93 -18313.95 9 36645.9 36709.52 -18090.47 24 36228.94 36398.59 Loglogstica -18932.43 3 37870.85 37892.06 -18502.59 14 37033.18 37132.14 -18414.71 18 36865.42 36992.66 -18476.77 9 36971.55 37035.17 -18240.82 23 36527.64 36690.23

() Exponential LL df AIC BIC LL df AIC BIC LL df AIC BIC LL df AIC BIC LL df AIC BIC

MI[K1(X) K2(.) Z(.)]

MI[K1(X) K2(X) Z(.)]

MI[K1(.) K2(.) Z(X)]

MI[K1(X) K2(X) Z(X)]

-19200.13 2 38404.26 38418.4 -18754.15 12 37532.29 37617.12 -18753.7 8 37523.41 37579.96 -18551.73 18 37139.46 37266.7

O modelo escolhido, de entre os modelos agregados e de imunidade, de acordo com os critrios de informao (AIC e BIC) o modelo com imunidade em que o tempo at ao acontecimento segue uma distribuio log-normal, modelando tanto a proporo de imunes () como ambos os parmetros da distribuio ( e ). A Figura 5.1 permite comparar os pseudo-resduos 16 das 4 distribuies consideradas, modelo log-normal escolhido respeitado, uma vez que o grfico com [ ( )] vs para os modelos tipo MI[K1(X) K2(X) Z(X)]. A anlise sugere que o pressuposto do

se aproxima bastante de uma recta com declive igual a um, ou seja, os resduos seguem aproximadamente uma distribuio exponencial, qual est associada uma taxa de risco constante, independente da durao t. Comparativamente com o modelo com distribuio log-logstica essa diferena menos evidente, uma vez que a distribuio dos resduos do modelo com distribuio loglogstica seguem tambm aproximadamente uma distribuio exponencial.

16

Seco 3.5 - Diagnstico do modelo.

42

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito
Exponencial
3
3

Weibull

-ln(Kaplan-Meier) 1 2

-ln(Kaplan-Meier) 1 2

.5

1.5 1 Pseudo-resduos

2.5

.5

1 1.5 Pseudo-resduos

2.5

Log-Normal
4
4

Log-Logistica

-ln(Kaplan-Meier) 2

-ln(Kaplan-Meier) 2

.5

1.5 1 Pseudo-resduos

2.5

.5

1.5 Pseudo-resduos

2.5

Figura 5.1. Pseudo-resduos Modelo com imunidade A Tabela 5.4 apresenta o modelo seleccionado com uma distribuio log-normal. Tabela 5.4. Modelo de imunidade Distribuio log-normal
Covarivel score7 score6 score5 score4 score3 score2 taxa prazo idadebem idadecliente telefempregofixo prodCNS telefcontactofixo unicoInterv loantovalue cotitular _cons z coef. 2.431 2.145 1.922 1.378 1.084 0.819 *** *** *** *** *** *** S.E. 0.1576 0.1505 0.1461 0.1508 0.1574 0.1531 coef. S.E. ln () coef. S.E.

-2.542 ***

0.125

-0.041 -0.014 -0.037 0.005 0.181 0.213 0.067 -0.159 -0.001 0.107 2.996

*** *** *** *** *** *** * *** ** * ***

0.005 0.001 0.010 0.002 0.036 0.050 0.033 0.040 0.0004 0.041 0.151

-0.016 -0.005 -0.013 0.002 0.081

*** *** * * **

0.003 0.001 0.006 0.001 0.026

0.556 ***

0.093

* p < 0.05; ** p < 0.01; *** p < 0.001.

43

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Analisando os coeficientes das covariveis utilizadas para modelar o parmetro de localizao () da log-normal possvel perceber se uma determinada caracterstica do cliente/operao se traduz numa diminuio ou aumento da durao t, ou seja, se a taxa de risco apresenta um mximo para valores de t mais prximos ou mais afastados do incio do contrato. Assim, incrementos na taxa, no prazo, na antiguidade do bem e no rcio (valor financiado / valor do colateral) tm um impacto na funo estimada, lognormal, deslocando o intervalo de tempo at ao acontecimento onde a taxa de risco mais elevada para a esquerda, ou seja, um incremento na taxa de risco mais prximo do incio do contrato. O mesmo sucede quando o cliente no apresente avalistas. As restantes variveis esto positivamente relacionadas com a durao t. O parmetro fornece-nos informao, tal como numa distribuio normal, sobre a disperso. Na prtica, um incremento em resulta num decrscimo menos acentuado da taxa de risco ao longo da vida do contrato. No modelo apresentado, as variveis idadecliente e telefempregofixo esto positivamente relacionadas com , ao passo que a taxa, o prazo e a antiguidade do bem esto inversamente relacionadas com , o que implica maior concentrao de valores em torno do momentos mais prximos da originao, tanto pelo efeito em como pelo efeito sobre , apresentando a funo de risco uma cauda mais curta.

5.2. Durao at default


Para modelar o tempo entre o registo do primeiro incidente e a entrada de um cliente em situao de default foram ensaiados, primeiro, modelos de sobrevivncia agregados e com proporo de imunes, testando as distribuies: exponencial, Weibull, log-normal e log-logstica, semelhana do ponto anterior. Posteriormente foram estimados modelos de sobrevivncia com mistura. A Tabela 5.5 resume o primeiro conjunto de modelos estimados. A seleco de variveis para cada parmetro seguiu o mesmo processo dos modelos agregados para o 1 acontecimento, ou seja, as covariveis para K1 foram seleccionadas varivel, sendo retirados aqueles que no fossem significativos ( = 0.05). por stepwise, com o comando streg, e para K2 analisaram-se os coeficientes de cada

44

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

() Exponential K1 K2 MA[K1(.) K2(.)] LL -13568.97 df 1 AIC 27139.93 BIC 27146.53 MA[K1(X) K2(.)] LL -13388.43 df 12 AIC 26800.86 BIC 26879.99 MA[K1(X) K2(X)] LL df AIC BIC MI[K1(X) K2(X) 0.000000 Z(.)] LL -13388.43 df 13 AIC 26802.86 BIC 26888.59 Modelo

Tabela 5.5. Critrios de informao Modelos agregados e com imunidade

Weibull Log-normal Log-logstica -13178.44 -12987.9 -13080.55 2 2 2 26360.87 25979.8 26165.1 26374.06 25992.99 26178.29 -12943.19 -12764.21 -12843.59 13 13 13 25912.39 25554.41 25713.17 25998.12 25640.14 25798.9 -12939.11 -12749.67 -12837.69 15 19 16 25908.23 25537.34 25707.37 26007.15 25662.64 25812.89 0.041091 0.000000 0.000000 -12923.77 -12764.21 -12843.59 14 14 14 25875.55 25556.41 25715.17 25967.87 25648.73 25807.5

De acordo com os critrios de informao AIC e BIC, o modelo seleccionado inclui uma distribuio log-normal, tal como no modelo estimado no ponto anterior. Este modelo, MA[(X) ln(.)], que se apresenta por enquanto como o modelo mais adequado

para estimar a durao t desde o registo do primeiro incidente at entrada do cliente

em situao de default, inclui covariveis apenas para o clculo do parmetro da lognormal, no se verificando vantagem, segundo o AIC e o BIC, em modelar . De salientar ainda o facto do modelo estimado com proporo de imunes, apresentar uma estimativa de muito prxima de zero para praticamente todas as distribuies consideradas, como tinha alis sido sugerido no Captulo 4. Os grficos na Figura 5.2 dizem respeito aos modelos tipo MA[K1(X)K2(.)]

apresentados na Tabela 5.5 Tal como no modelo com imunes para estimar a durao t at ao primeiro acontecimento, apresentado na Seco 5.1, os modelos com funo lognormal e log-logstica so aqueles que apresentam resduos mais bem comportados, mais prximos de uma recta com declive igual a um (diagonal).

45

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito
Exponencial
4 6

Weibull

-ln(Kaplan-Meier)

-ln(Kaplan-Meier)
0 1 2 3 4

0 0 2 4 6

Pseudo-resduos

Pseudo-resduos

Log-Normal
4 4

Log-logistica

-ln(Kaplan-Meier)

-ln(Kaplan-Meier)
0 1 2 3 4

0 0 1 2 3

Pseudo-resduos

Pseudo-resduos

Figura 5.2. Pseudo-resduos MA[K1(X) K2(.)] (default) normal, MA[(X) ln(.)]. Nesta, a coluna da direita recorda os coeficientes de variveis que tambm foram utilizadas no modelo com imunes do ponto anterior para o parmetro da log-normal. Tal como no modelo relativo durao at ao primeiro acontecimento, o rcio (valor financiado / valor do colateral), a antiguidade do bem, o prazo remanescente do contrato, a taxa e o facto de o cliente ser o nico interveniente no contrato tm um impacto negativo na durao t (primeiro incidente at entrada em default). O mesmo se verificando para a idade do cliente, o que sugere que clientes de um escalo etrio mais avanado tendem a transitar mais depressa para uma situao de default aps terem registado um primeiro incidente. Este comportamento da varivel idade do cliente pode significar uma de duas situaes: (i) situaes em que indivduos pertencentes a um escalo etrio mais avanado se predispem a assumir a titularidade do contrato de crdito apesar de ser um terceiro a usufruir do crdito, que num cenrio em que este deixe de pagar ao titular do contrato, este automaticamente deixa de cumprir com o A Tabela 5.6 apresenta as estimativas dos parmetros do modelo com distribuio log-

46

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

contrato de crdito; ou (ii) situao em que um acontecimento inesperado o coloca em dificuldades financeiras (e.g., desemprego) difceis de ultrapassar. Tabela 5.6. Coeficientes para - Modelo agregado (default) vs Modelo com imunes (1 incidente)
Covarivel Modelo agregado Default Parmetro do Modelo de imunidade 1 incidente coef. 17 -0.001 n.a. 0.107 -0.037 n.a. 0.005 n.a. 0.181 -0.014 -0.041 -0.159 ** * *** *** *** *** *** ***

coef

S.E. ** 0.0003 ** 0.000002 ** 0.034 ** 0.007 *** 0.026 *** 0.001 *** 0.030 *** 0.027 *** 0.001 *** 0.004 *** 0.031 *** 0.099 0.012

loantovalue eurotax cotitular idadebem telefcontatofixo idadecliente habPropHipotec telefempregofixo prazoRemIncidente 18 taxa unicoInterv _cons -0.001 -0.002 0.087 -0.017 0.095 -0.006 0.135 0.126 -0.006 -0.028 -0.233 3.502

ln _cons -0.237 *** * p < 0.05; ** p < 0.01; *** p < 0.001.

As variveis telefcontactofixo e habPropHipotec, apesar de no serem significativas para prever a durao at ao 1 acontecimento, apresentam coeficientes significativos no modelo ATF aqui apresentado, com impacto positivo sobre a durao do 1 at ao 2 acontecimento, ou seja, um cliente que possua habitao prpria com hipoteca ou apresente um nmero de contacto de rede fixa tende a transitar mais tarde para o estado de default. modelo com mistura de log-normais - MS[(.) ln(.) Z(.)], ou seja, pressupor que na Uma abordagem alternativa ao modelo agregado apresentado, passaria por estimar um

entre estados, representada por grupos ( = 1,2, , ).


17 18

populao de clientes que registaram o 1 incidente existe heterogeneidade na transio

Os erros-padro (S.E.) encontram-se na Tabela 5.4.

O coeficiente apresentado para o modelo com imunes respeita varivel prazo que representa tambm o prazo remanescente do contrato no incio do episdio.

47

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

A Tabela 5.7 resume os modelos com mistura estimados. Nestes modelos, tal como nos Nos modelos com modelao de e/ou de , foi considerado o conjunto de variveis Tabela 5.7. Avaliao dos modelos de durao com mistura
Modelo MS[(.)ln(.) Z(.)] f(t) Log-normal S=2 LL -3631.13 df 5 AIC 7272.261 BIC 7305.233 LL -3565.98 df 16 AIC 7163.964 BIC 7269.477 LL -3466.35 df 21 AIC 6974.692 BIC 7113.177 LL -3484.18 df 18 AIC 7004.351 BIC 7123.053 Log-normal Log-normal S=3 S=4 -3614.36 -3611.19 8 11 7244.71 7244.38 7297.466 7316.92 -3405.33 -3351.00 30 44 6870.653 6790.01 7068.489 7080.16 -3423.3 35 6916.597 7147.405 -3421.94 -3393.99 32 46 6907.87 6879.982 7118.895 7183.331

anteriores (com imunes) a proporo de mistura resulta de uma funo de ligao logit.

includas no modelo agregado, apresentado na Tabela 5.6.

MS[(.)ln(.) Z(X)]

MS[(X)ln(.) Z(.)]

MS[(X)ln(.) Z(X)]

Z(X)], ou seja, com 3 segmentos e apenas com modelao dos pesos de cada grupo.

Com base nos critrios apresentados na Tabela 5.7, o modelo eleito M3[(.) ln(.)

Apesar do maior nmero de parmetros estimados, o modelo com mistura apresenta AIC e BIC mais favorveis. Tambm atravs da anlise de resduos se conclui que o modelo de mistura apresenta um melhor ajustamento (Figura 5.3).
Mix Log-Normal - M3[(.) ln(.) Z(X)]
4 4

Log-Normal - MA[(X) ln(.)]

-ln(Kaplan-Meier)
0 1 2 3 4

-ln(Kaplan-Meier)

0 0 1 2 3 4

Pseudo-resduos

Pseudo-resduos

Figura 5.3. Pseudo-resduos Agregado vs Mistura (default)

48

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

As estimativas do modelo escolhido encontram-se na Tabela 5.8, que apresenta tambm os coeficientes estimados no modelo agregado com base numa distribuio log-normal, apresentado na Tabela 5.6. Tabela 5.8. Coeficientes do Modelo com mistura vs Modelo agregado
Parmetro / Covariveis zs loantovalue 0.000 0.001 eurotax 0.000 0.00001 cotitular -0.144 0.145 idadebem -0.013 0.027 telefcontatofixo -0.057 0.107 idadecliente 0.004 0.004 habPropHipotec -0.341 * 0.137 telefempregofixo -0.050 0.108 prazoRemIncidente 0.008 * 0.003 taxa 0.045 * 0.015 unicoInterv 0.209 0.126 _cons -2.918 *** 0.442 fs(t) s 2.194 *** 0.037 1.099 *** 0.00001 ln_s -0.514 *** 0.027 -53.165 26285.5 s 0.598 0.000 * p < 0.05; ** p < 0.01; *** p < 0.001. -0.006 * -0.000 * 0.231 -0.047 0.431 *** -0.028 *** 0.345 * 0.503 * -0.019 *** -0.124 *** -0.921 *** 3.810 *** 0.003 0.00001 0.146 0.029 0.117 0.006 0.132 0.145 0.003 0.026 0.175 0.537 -0.000 * -0.002 * 0.087 * -0.017 * 0.095 *** -0.006 *** 0.135 *** 0.126 *** -0.006 *** -0.028 *** -0.233 *** 3.502 *** Modelo Mistura M3[(.) ln(.) Z(X)] s=2 coef S.E. Modelo Agregado MA[(X)ln(.)] S.E. coef

s=1 coef

s=3 coef

S.E.

3.120 *** 0.034 -0.991 *** 0.097 0.371

Alm dos aspectos positivos relacionados com a avaliao dos modelos, este modelo com mistura permite uma interpretao mais objectiva. No modelo agregado, com modelao do parmetro de posicionamento (), a interpretao dos coeficientes algo limitada uma vez que, de uma forma directa, pouco mais se pode concluir para alm do sentido do impacto de uma determinada caracterstica do cliente/operao na durao t. Este modelo com mistura permite apresentar uma funo sobrevivncia para cada grupo e posteriormente quantificar o impacto no odds ratio, atravs do modelo logit, de cada covarivel. A Figura 5.4 apresenta a funo sobrevivncia para cada grupo.

49

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito Funo Sobrevivncia Mix log-normal M3[(.)ln(.) Z(X)]
1 .8 .6 St .4 .2 0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Durao (meses) Segmento 1 Segmento 2 Segmento 3

Figura 5.4. Funes sobrevivncia para cada grupo Em termos de durao at ao momento do cliente entrar numa situao de default, o grupo 3 representa aqueles que demoram mais tempo a transitar de uma situao registo de incidente para uma situao de default, o grupo 2 por seu lado representa aqueles que transitam mais rapidamente para situao de default e o grupo 1 representa aqueles clientes com um comportamento intermdio. Atravs da anlise do parmetro de concluso, com um valor mais elevado para o grupo 3, 3 =3.12 e um valor mais posicionamento da log-normal em cada grupo tambm possvel tirar a mesma reduzido para o grupo 2, 2 =1.09. O grupo 2 caracteriza-se por uma variabilidade praticamente nula 2 0, com os clientes pertencentes a este grupo a entrarem em situao de default 3 meses aps o registo do primeiro incidente 19, confirmando-se assim a existncia de um grupo de indivduos com uma transio muito rpida para uma situao de default, no pagando quaisquer das mensalidades aps registarem o 1 atraso, como sugerido no Captulo 4. Comparativamente com o modelo agregado, os coeficientes associados probabilidade de um cliente pertencer ao grupo 3, i.e., com uma transio mais lenta para uma situao de default, apresentam o mesmo sentido dos coeficientes do modelo AFT agregado. No modelo agregado, as covariveis com coeficientes negativos associados tinham um impacto negativo sobre a durao t, ou seja, a transio mais rpida entre estados. No modelo de mistura, essas covariveis tm um impacto negativo sobre a
19

1.09861 3 meses

50

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

probabilidade do cliente pertencer ao grupo 3. Por exemplo, um cliente que se apresente numa operao como sendo o nico interveniente (unicointerv) ter uma diminuio de 60.19% 20 no odds ratio, ao contrrio de um cliente que possui habitao prpria com hipoteca que ter associado um aumento de 41.17% 21 no odds ratio. As covariveis cotitular e idadebem que apresentaram capacidade explicativa no modelo agregado, deixam de ter um efeito significativo na probabilidade de pertena a cada grupo do modelo de mistura. A probabilidade de pertena ao grupo 2, que representa os clientes com uma transio mais rpida para uma situao de default, explicada pelas covariveis habPropHipotec, prazoRemIncidente e taxa. Para um cliente que possua habitao prpria hipotecada, o odds ratio para o grupo 2 sofre uma reduo de 28.9%. Uma taxa mais elevada e um perodo mais longo para o final do contrato no momento em que o cliente regista o primeiro incidente tm um impacto positivo na probabilidade de pertena ao grupo 2, mais concretamente, um impacto de 4.62% e 0.77% no odds ratio, por cada 100 p.b. ou por cada ms, respectivamente.

20 21

0.92117 1 0.6019 0.34480 1 0.4117

51

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

6. Concluso
Com o objectivo de criar modelos que apoiem a gesto de cobranas de clientes numa instituio financeira de crdito, foram estimados modelos de sobrevivncia heterogneos, para prever a durao at dois acontecimentos: (i) registo do primeiro atraso no pagamento das mensalidade do contrato de crdito, que resulta na transio do cliente para gesto de cobranas; (ii) registo de atrasos superiores a 90 dias default, situao muito prxima de um incumprimento definitivo, que resulta normalmente na transferncia do processo de cobranas para uma departamento de contencioso. Seguiuse uma abordagem condicional tipo II, utilizando todos os clientes da amostra para estimar a durao entre o incio do contrato e o registo do primeiro atraso. Foi criado um segundo modelo, considerando apenas os clientes da amostra que registaram o primeiro atraso, para estimar a durao entre o registo do primeiro incidente e a transio para uma situao de default. Os modelos heterogneos de sobrevivncia apresentados neste estudo, para ambos os acontecimentos, apresentam-se como sendo mais parcimoniosos (AIC e BIC) quando comparados com os modelos agregados, reflexo da heterogeneidade de comportamentos verificada para clientes de crdito. Talvez a principal desvantagem deste tipo de modelos seja a sua complexidade, no sendo possvel, por vezes, estim-los atravs dos comandos mais usuais de um software estatstico. Neste estudo, por exemplo, foi necessrio programar o estimador de mxima verosimilhana no Stata. crena geral que o nvel de rendimentos e a taxa de esforo do cliente esto relacionados com o seu desempenho num contrato de crdito, porm, para os dados utilizados neste estudo conclui-se que o rendimento, a taxa de esforo no tm capacidade explicativa da durao em ambos os acontecimentos. De notar que a varivel taxaesforco, utilizada neste estudo, representa apenas o impacto na taxa de esforo global de um cliente, na medida em que, por falta de informao, calculada apenas com base nos encargos provenientes do crdito com a instituio financeira, ignorando outras responsabilidades que o cliente j tenha assumido. Outras variveis como o nmero de dependentes a cargo do cliente e o montante de crdito, tambm no apresentaram capacidade explicativa. Se por um lado um maior nmero de dependentes pode significar maiores gastos fixos mensais, por outro pode ser tambm um factor de estabilidade. Verificou-se tambm que, para ambos os acontecimentos, solicitar um terceiro interveniente no tem impacto significativo sobre a durao.

52

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Foram ensaiados modelos com base nas funes exponencial, Weibull, log-normal e log-logstica, concluindo-se que a log-normal funo que melhor se ajusta para representar a distribuio da durao para ambos os acontecimentos. O primeiro modelo estimado para a durao at ao momento do primeiro incidente foi um modelo com imunidade, existindo um grupo de clientes que cumprem sem registarem atrasos no pagamento das mensalidades do contrato de crdito, utilizando o scoring aplicacional interno para estimar a probabilidade do cliente pertencer ao grupo dos imunes. Relativamente ao grupo dos no imunes, foi utilizada uma distribuio lognormal, com modelao de ambos os parmetros, e , tendo sido consideradas covariveis relacionadas com a estabilidade do cliente (idade e o facto de possuir um nmero de telefone de rede fixa em casa e no emprego), com as garantias apresentadas (como outros intervenientes, idade do bem financiado e o rcio entre o montante do crdito e o valor do colateral) e caractersticas da operao (tipo de produto, prazo e taxa). Na anlise ao segundo acontecimento, verificou-se que os clientes que registam um primeiro incidente transitam para uma situao de default, no se verificando por isso uma proporo de imunes. No entanto, atravs de um modelo de sobrevivncia de mistura com modelao da probabilidade de pertena a cada grupo, foram identificados 3 padres de comportamento na transio para uma situao de default: (i) clientes com uma durao mais longa; (ii) clientes com uma durao intermdia; e (iii) clientes com durao mais curta, ou seja, com uma transio muito rpida, no pagando consecutivamente as mensalidades aps registarem o 1 atraso, transitando para uma situao de default, 3 meses aps o primeiro acontecimento. A probabilidade de um cliente pertencer ao grupo com durao mais longa aumenta nos casos em que este apresente sinais de estabilidade (um contacto telefnico fixo e habitao prpria), melhores garantias (relao montante financiado e valor do colateral mais favorvel/reduzido e um segundo interveniente). A este grupo de clientes esto ainda associadas condies de crdito mais competitivas, i.e., taxas mais reduzidas, na medida que a probabilidade de pertencer ao grupo diminui com incrementos na taxa. Ao contrrio do que seria de esperar, clientes pertencentes a um escalo etrio mais elevado tm uma menor probabilidade de pertencerem ao grupo com durao mais longa. Para o grupo com durao mais curta, a probabilidade associada aumenta nos casos com

53

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

contratos com taxas mais elevadas e maior prazo remanescente no momento em que o cliente regista o primeiro incidente. A anlise de sobrevivncia como tcnica aplicada em modelos de scoring comportamental permite projectar um filme do desempenho futuro de um cliente de crdito, que permite a sua utilizao em outros tipos de modelos, com o profit scoring. Os modelos de sobrevivncia apresentados neste estudo ao incluir na sua grande maioria informao recolhida no momento da originao, permitem tambm a sua aplicao em modelos de profit scoring, estimando o envolvimento no momento em que o cliente entra em situao de default, calculando desta forma uma perda esperada que deve ser considerada na avaliao da rendibilidade de uma operao. Outra tcnica que tambm permite projectar um filme do desempenho futuro de um cliente de crdito so as Cadeias de Markov. Alm desta sugesto para investigao futura aplicada aos dados da instituio financeira, a introduo de outras variveis relativas ao histrico do cliente, como o nmero de atrasos, exposio mxima ou montantes vencido, pode resultar num melhor desempenho dos modelos para estimar o momento em que um cliente transita para uma situao de default no sendo possvel porm, a sua aplicao em modelos de profit scoring em novos clientes.

54

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Bibliografia
Abreu, A.M. e C.S Rocha (2006), Um novo modelo de cura paramtrico, Cincia Estatstica, Edies SPE, 151-162. Andreeva, G., J. Ansel e J. Crook (2006), Modelling profitability using survival combination scores, European Journal of Operational Research, 183(3), 15371549. Bellotit, T. e J. Crook (2007), Credit scoring with macroeconomic variables using survival analysis, Journal of the Operational Research Society, 60, 1699-1707. Beran, J. e A.K. Djadja (2006), Credit risk modeling based on survival analysis with immunes, Statistical Methodology, 4(3), 251-276. Blossfeld, H., Golsh, K. e G. Rohwer. (2007), Event History Analysis with Stata, Lawrence Earlbaum Associates, New York / London. Buxton, A. (2007), CUREREGR: Stata module to estimate parametric cure regression, Statistical Software Components S446901, Boston College Department of Economics, revised 25 Sep 2007. Cao, R., J.M. Vilar e A. Devia (2009), Modelling consumer credit risk via survival analysis, Sort: Statistics and Operations Research Transactions, 33(1), 3-30. Cox, D.R. (1972), Regression models and life tables, Journal of the Royal Statistical Society Series B-Statistical Methodology, 34(2) 187-220. Cox, D.R. e E.J. Snell (1968), A general definition of residuals, Journal of the Royal Statistical Society Series B-Statistical Methodology, 30(2), 248-275. De Angelis, R., R. Capocaccia, T. Hakulinen, B. Soderman, e A. Verdecchia (1999), Mixture models for cancer survival analysis: application to population-based data with covariates, Statistics in Medicine,18(4), 441-454. Dias, J.G. (2004), Finite Mixture Models Review, Applications, and Computerintensive Methods, SOM, Groningen, Holanda. Gutierrez, R.G. (2002), Parametric frailty and shared frailty survival models, The Stata Journal, 2(1), 22-44. Hensher, D. e S. Jones (2004), Predicting firm financial distress: A mixed logit model, The Accounting Review, 79(4), 1011-1038. Hosmer, D.W. e S. Lemeshow (1999), Applied Survival Analysis Regression modeling of time to event data, John Wiley & Sons, New York.

55

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Jiang, R e D.N.P. Murthy (1998), Mixture of Weibull distributions - parametric characterization of failure rate function, Applied Stochastic Models and Data Analysis, 14, 47-65. Kaplan E.L e P. Meier (1958), Nonparametric-estimation from incomplete observations, Journal of the American Statistical Association, 53(282), 457-481. Keidel, A. (2008), Chinas Economic Rise Fact and Fiction, Carnegie Endowment for International Peace, Policy Brief 61. Khanna, T. (2007), China + India: the power of two, Harvard Business Review, http://hbr.org/product/china-india-the-power-of-two/an/R0712D-PDF-ENG. Kleinbaum, D.G. e M. Klein (2005), Survival Analysis: A self-learning text, Second Edition, Springer, New York. Kuk, A.Y.C e C.H. Chen (1992), A mixture model combining logistic-regression with proportional hazards regression, Biometrika, 79(3), 531-541. Lambert, P.C. (2007), Modeling of the cure fraction in survival studies, The Stata Journal, 7(3), 351-375. Lee, B. e H.J.P. Timmermans (2007), A latent class accelerated hazard model of activity episode durations, Transportation Research Part B-Methodological, 41(4), 426447. Lee, E.T. e J.W. Wang (2003), Statistical Methods for Survival Data Anlysis, Third edition, John Wiley & Sons, New Jersey. Malik, M. e L.C. Thomas (2010), Modeling credit risk of portfolio of consumer loans, Journal of the Operational Research Society, 61(3), 411-420. Noh, H.J., T.H. Roh e I. Han (2005), Prognostic personal credit risk model considering censored information, Expert Systems with Applications, 28(4), 753-762. Ortega, E.M.M., V.G. Cancho e G.A. Paula (2009), Generalized log-gamma regression models with cure fraction, Lifetime Data Analysis, 15(1), 79-106. Prentice, R.L., B.J. Williams e A.V. Peterson (1981), On the regression analysis of multivariate failure data, Biometrika, 68(2), 373-379. Sarlija, N., M. Bensic e M. Zekic-Susac (2009), Comparison procedure of predicting the time to default in behavioural scoring, Expert Systems with Applications, 36(5), 8778-8788. Stepanova M. e L.C Thomas (2000), Survival analysis methods for personal loan data, Operations Research, 50(2), 277-289.

56

Modelos Heterogneos de Sobrevivncia


Uma Aplicao ao Risco de Crdito

Stepanova, M. e L.C. Thomas (2001), PHAB scores: Proportional hazard analysis behavioural scores, Journal of the Operational Research Society, 52(9), 10071016. Thomas, L.C. (2000), A survey of credit and behavioural scoring: forecasting financial risk of lending to consumers, International Journal of Forecasting, 16(2), 149172. Thomas, L.C. (2009), Consumer Credit Models: Pricing, Profit, and Portfolios, Oxford University Press, New York. Thomas, L.C., D.B. Eldman e J.N. Crook (2002), Credit Scoring and Its Applications, Society for Industrial and Applied Mathematics, Philadelphia. Thomas, L.C., J. Ho e W.T. Scherer (2001), Time will tell: behavioural scoring and the dynamics of consumer credit assessment, Institute of Mathematics and its Applications, 12(1), 89-103. Till, R.J. e D.J. Hand (2003), Behavioural models of credit card usage, Journal of Applied Statistics, 30(10), 1201-1220. Vakratsas, D. (1998), Consumer heterogeneity and the shape of purchase rate functions, Applied Stochastic Models and Data Analysis, 14, 85-44. Vakratsas, D. e F.M. Bass (2002), A segment-level hazard approach to studying household purchase timing decisions, Journal of Applied Econometrics, 17(1), 4959. Wei, L.J., D.Y. Lin e L. Weissfeld (1989), Regression-analysis of multivariate incomplete failure time data by modeling marginal distributions, Journal of American Statistical Association, 84, 1065-1073. Yildirim, Y. (2008), Estimating default probabilities of CMBS loans with clustering and heavy censoring, Journal of Real Estate Finance and Economics, 37(2), 93-111.

57

Vous aimerez peut-être aussi