Vous êtes sur la page 1sur 36

ANLISE LXICA E ANLISE DE CONTEDO: Tcnicas complementares, sequenciais e recorrentes para explorao de dados qualitativos

Henrique Freitas & Raquel Janissek

Distribuio: Sphinx

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.3

Superviso grfica: terceirizada Capa: Fernando K. Andriotti, Maurcio G. Testa e Andr Panisson Edio: Fernando K. Andriotti Impresso: Grfica La Salle.

Dados internacionais de Catalogao na Publicao (CIP) (Cmara Brasileira do Livro, SP, Brasil)
FREITAS, Henrique Mello Rodrigues de. Anlise lxica e anlise de contedo: tcnicas complementares, sequenciais e recorrentes para explorao de dados qualitativos / Henrique Mello Rodrigues de Freitas e Raquel Janissek. Porto Alegre: Sphinx: Editora Sagra Luzzatto, 2000. 176 p.: il. Bibliografia: 85-241-0637-9 1. Metodologia da Pesquisa. 2. Tcnicas de pesquisa. 3. Anlise de Dados: pesquisa. I. Janissek, Raquel . II. Ttulo

ndice para catlogo sistemtico: 1. Pesquisa e mtodos 001.4 2. Cincias sociais 306.3 3. Anlise de dados 001.642 Henrique Freitas & Raquel Janissek Todos os direitos esto reservados Sphinx Impresso em Junho 2000. Tambm disponvel via Internet (http://www.sphinxbr.com.br e http://www.adm.ufrgs.br/professores/hfreitas).

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.4

Sumrio

Apresentao .............................................................................................................. 7 Prefcio dos Autores................................................................................................... 8 Dados dos Autores.................................................................................................... 10 Prefcio..................................................................................................................... 11 1. Explorando dados textuais para identificar oportunidades e antecipar problemas12 2. Dados qualitativos: problemas e questes inerentes sua coleta e anlise.......... 15 3. Anlise quali ou quantitativa de dados textuais? .................................................. 21 3.1. A Anlise Lxica .......................................................................................... 31 3.2. A Anlise de Contedo ................................................................................. 37 4. Aplicaes de anlise qualitativa em gesto e em sistemas de informao .......... 63 5. Ferramentas para Anlises Lxica e de Contedo ................................................ 69 6. Aplicao de anlise de dados qualitativos: pesquisa sobre internet e negcios . 77 6.1. As questes abertas da pesquisa.................................................................... 79 6.2. Como analisar os dados qualitativos? ........................................................... 83 6.3. Anlise lxica dos dados abertos da pesquisa: palavras e expresses.......... 87 6.4. Anlise de Contedo das questes abertas.................................................. 108 6.5. Aprofundando a anlise de dados atravs da Anlise de Correspondncia. 133 7. Consideraes Finais .......................................................................................... 139 8. Referncias bibliogrficas .................................................................................. 143 ndice Remissivo .................................................................................................... 148 ndice de Autores.................................................................................................... 154 Apndice - Sistema Sphinx para pesquisas e anlises de dados ........................... 156

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.6

Apresentao O diferencial proporcionado pelos mtodos, bem como a iseno conferida pelo pesquisador que respeita estes mtodos, retratam as diferenas das competncias e das intenes em uma pesquisa. Todo profissional deve desenvolver habilidades e dominar sistemas, tcnicas e mtodos inerentes necessidade por construo de conhecimento a partir de dados disponveis de uma ou outra forma dentro do seu contexto de atuao. Mostra-se que vivel, com o auxlio de instrumental adequado, explorar dados quanti-qualitativos e produzir informaes consistentes que possam trazer respostas geis a muitos questionamentos que surgem no dia-a-dia de uma organizao e mesmo no trabalho do profissional de pesquisa. Com o uso de dados qualitativos, seja de que natureza for, pode-se ter a chance de identificar oportunidades ou antecipar problemas de forma bem mais pontual, precisa e com um custo operacional bem menor. Existem vrias tcnicas de coleta e de anlise de dados que permitem capturar automtica e quase gratuitamente dados qualitativos. Alm disso, esse tipo de dado pode ser explorado mais de uma vez, constituindo-se numa fonte diferenciada para a gerao de novos, diferentes e curiosos dados, os quais podem ser produzidos diretamente pelo pesquisador. Este livro demonstra algumas tcnicas para realizar anlise de dados textuais, em especial as anlises lxica e de contedo, buscando repassar ao leitor condies para uma investigao prtica e eficaz. Estas tcnicas so apresentadas enfatizando o seu uso em conjunto. O pesquisador ou analista tem, nelas, diferentes recursos que permitem a explorao adequada dos dados, atravs de procedimentos sistematizados.
Freitas & Janissek Anlise lxica e Anlise de contedo p.7

3.1. A Anlise Lxica Toda a anlise de textos comea pela organizao completa do vocabulrio utilizado. Mais do que palavras, fala-se de formas grficas ou simplesmente de formas breves em razo de uma certa ambigidade da palavra. A organizao consiste em isolar cada forma grfica supostamente delimitada por dois caracteres separadores que na maioria das vezes so os prprios espaos, mas tambm podem ser sinais de pontuao. Cada apario de uma forma de dado chamada ocorrncia, as quais so evidentemente contabilizadas para formar o lxico. O lxico ento, por definio, a lista de todas as formas grficas utilizadas, cada qual estando munida de um nmero de ordem ou frequncia (LAGARDE, 1995, p.144-145), ou ainda o conjunto das palavras diferentes usadas nesse texto, com a sua frequncia de apario (FREITAS, 2000). J a Anlise Lxica consiste em averiguar ou medir a dimenso das respostas: as pessoas responderam de forma extensa ou concisa? Cria-se uma hiptese de que aqueles que deram respostas extensas tm um interesse maior do que os demais. Uma hiptese discutvel que dar, porm, uma indicao (FREITAS, 2000). Nesse tipo de tcnica so feitas anlises de palavras, e no de respondentes. Por exemplo, caso uma dada palavra aparea n vezes aps realizada uma contagem, isso no significa que aquela palavra, ou aquela idia, possa ser generalizada para grande parte dos respondentes ou representar uma idia que tenha aparecido em vrias opinies: pode muito bem ocorrer que determinado respondente, ou um pequeno grupo destes, tenham enfaticamente apontado para aquela idia, repetidamente (por que no?), diferentemente de uma Anlise de Contedo, onde so identificadas idias por respondentes, independentemente deste ter citado a palavra 1, 2 ou mais vezes.
Freitas & Janissek Anlise lxica e Anlise de contedo p.31

Ento pode-se dizer que a anlise lxica o estudo cientfico do vocabulrio, com aplicaes de mtodos estatsticos para a descrio do vocabulrio: ela permite identificar com maior detalhe as citaes dos participantes, utilizando indicadores que relacionam aspectos relativos s citaes e s palavras (BARDIN, 1996). A evoluo se d da viso geral do texto para os dados na sua essncia, sejam eles palavras ou expresses (LEBART e SALEM, 1994, p.5869), onde posteriormente sero novamente analisados com vistas ao universo total de informaes. Pode-se ainda colocar que, atravs de processos automticos que associam a matemtica e a estatstica, o uso da Anlise Lxica permite rapidamente interpretar e fazer uma leitura adequada e dinmica das questes abertas das enqutes. Esse procedimento no mais rigoroso do que a Anlise de Contedo clssica. Seu tratamento dos dados objetivo, mas a leitura subjetiva tambm realizada: temse, assim, acesso a um processo de leitura mais rpido, automatizado e que, por outro lado, encontra um certo nmero de justificativas (FREITAS, 2000). A partir do corpo do texto, ou seja, o contedo das respostas abertas, evolui-se para analisar palavras e expresses, o lxico. Ao fazer isso, parte-se de um nvel que se pode chamar de macroestatstico, iniciando com as entrevistas que foram realizadas e elencando as palavras produzidas nas respostas (GRAWITZ, 1993). Um esquema geral (Figura 3) para Anlise Lxica proposto por FREITAS, MOSCAROLA e JENKINS (1998). Uma Anlise Lxica inicia sempre pela contagem das palavras, avanando sistematicamente na direo de identificao da dimenso das respostas. Nos casos de respostas abertas, normalmente so feitas aproximaes ou agrupamentos que permitam apresentar critrios mais frequentemente citados, agrupando palavras afins, deletando palavras que no interessam, at resultar num conjunto tal de palavras
Freitas & Janissek Anlise lxica e Anlise de contedo p.32

que representem na essncia as principais descries citadas nos textos. Tudo depende do quo sutil feita a anlise pelo pesquisador e da qualidade dos dados (amostra). Uma anlise rpida em uma pequena amostra normalmente apresentar problemas de disperso de um mesmo tema, de uma mesma idia, at mesmo problemas de sinnimos. O tratamento para tal seria o correto agrupamento de palavras em critrios semelhantes. Nestes casos, as frequncias permitem consolidar a aplicao de um tema ou locuo, possibilitando uma anlise de contexto onde as categorias identificadas representem a essncia das idias apresentadas (LEBART e SALEM, 1994, p.135-142).

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.33

Corpo do Texto Lematizador Corpo do texto lematizado Variveis De Contexto Dicionrio Reduzindo e Estruturando o Lxico Medidas Lexicais: Intensidade banalidade Estrutura Estatstica Navegao Lxica Verbatim

Variveis fechadas do lxico

Figura 3 - Esquema para Anlise Lxica Fonte: FREITAS, MOSCAROLA e JENKINS (1998)

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.34

Como ilustra a Figura 3, a realizao de uma anlise lxica se d da seguinte forma: faz-se inicialmente o tratamento deste do contedo de um texto ou respostas abertas, atravs da identificao de nmero total de ocorrncias de cada palavra, nmero total de palavras, nmero total de palavras diferentes ou vocbulos e a riqueza de vocabulrio para produzir uma resposta (LEBART e SALEM, 1994, p.247). Alm disso, classificam-se tais unidades de vocabulrio em palavras ricas com algum significado, como verbos, substantivos e adjetivos, alm de palavras instrumentais como artigos, preposies, etc. tambm possvel identificar o tempo aplicado a cada resposta, se isso, claro, for aplicvel naquela situao. A organizao da frase, e certos aspectos sintticos, so suscetveis de revelar certas caractersticas de um discurso ou apontar confirmaes de certas hipteses formuladas, alm das comparaes entre estas. Para isso, deve-se ir alm da Anlise Lxica, iniciando a Anlise de Contedo (BARDIN, 1996, p.82-92). H recursos e tcnicas que podem ser aplicados para ter um corpo do texto lematizado, ou seja, transformar as palavras que ainda constituiro o lxico na sua forma infinitiva ou na sua forma original (fala-se aqui no que diz respeito a verbos, substantivos e adjetivos). Pode-se assim reduzir significativamente o lxico, e, a partir da, criar novos dados, objetivos (fechados sobre palavras do lxico), bem como gerar novos dados com medidas lexicais (intensidade lexical, banalidade ou trivialidade e ainda originalidade) (SPHINX, 1997). Tal anlise, representada na Figura 3, inicia pela aproximao lexical sumria, que consiste em reduzir o texto apresentando as palavras mais frequentes que permitem uma idia do seu contedo. Em seguida realizada a aproximao lexical controlada, que reduz o texto ao seu lxico e controla, via navegao lexical, a validade e o fundamento das interpretaes elaboradas a partir do lxico. Aps isso, realizada a aproximao lexical seletiva, eliminando palavrasFreitas & Janissek Anlise lxica e Anlise de contedo p.35

ferramentas e concentrando a ateno no exame de substantivos, verbos e adjetivos via utilizao de dicionrios e de um lematizador. Em seguida, realizada a pesquisa das especificidades lexicais, que estabelece uma estatstica das palavras do texto, segundo uma varivel externa no textual (por exemplo pas, regio, departamento). A descrio do texto atravs de variveis nominais e o clculo das intensidades lexicais permitem que cada resposta seja descrita pela intensidade segundo a qual se manifestam os diferentes campos estudados. O aprofundamento da anlise pode se dar com a anlise bi ou multivariada dos dados textuais em funo de outros dados, integrando-a desta forma com a anlise de dados clssica (FREITAS, CUNHA e MOSCAROLA, 1997). Com a Anlise Lxica, possvel apresentar opes (palavras, agrupamentos, expresses) para desvendar caminhos e descobrir opinies, identificar necessidades, obsesses, seja qual for a inteno da pesquisa ali aplicada. Descobrir as razes de tal objeto de estudo significa passar da indeciso para a riqueza da leitura, e isso pode ser feito com o uso combinado das tcnicas apresentadas neste livro. Desta forma, no somente pode-se contar com uma leitura das respostas, o que por si s j nos diz muita coisa, mas tambm com a identificao das opinies expressas nas entrelinhas destes mesmos textos. Se em uma leitura espontnea j se pode identificar idias, o que se poderia dizer de uma leitura e categorizao mais atenta no sentido de observar e descobrir contedos ali ditos de forma indireta ou at mesmo obscura, permitindo descobrir significados e elementos suscetveis no identificados a priori. De fato, a aplicao sequencial e recorrente destas tcnicas permite assim avanar.

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.36

3.2. A Anlise de Contedo Quando os dados a analisar se apresentam sob a forma de um texto ou de um conjunto de textos ao invs de uma tabela com valores, a anlise correspondente assume o nome de Anlise de Contedo neste texto AC (LAGARDE, 1995, p.143). A AC uma tcnica de pesquisa para tornar replicveis e validar inferncias de dados de um contexto que envolve procedimentos especializados para processamentos de dados de forma cientfica. Seu propsito prover conhecimento, novos insights obtidos a partir destes dados (KRIPPENDORFF, 1980). Uma parte importante do comportamento, opinio ou idias de pessoas se exprime sob a forma verbal ou escrita. A Anlise de Contedo destas informaes deve normalmente permitir a obteno destas informaes resumidas, organizadas. A AC pode ser usada para analisar em profundidade cada expresso especfica de uma pessoa ou grupo envolvido num debate. WEBER (1990, p.9) apresenta alguns propsitos para uso de AC. Permite tambm observar motivos de satisfao, insatisfao ou opinies subentendidas, natureza de problemas, etc, estudando as vrias formas de comunicao. um mtodo de observao indireto, j que a expresso verbal ou escrita do respondente que ser observada. No existiria dentro desse mtodo uma riqueza e uma diversidade de modos de expresso? A AC torna possvel analisar as entrelinhas das opinies das pessoas, no se restringindo unicamente s palavras expressas diretamente, mas tambm quelas que esto subentendidas no discurso, fala ou resposta de um respondente (PERRIEN, CHRON e ZINS, 1984, p.27).

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.37

O objetivo da AC a inferncia2 de conhecimentos relativos s condies de produo com a ajuda de indicadores. A AC como um trabalho de um arquelogo: ele trabalha sobre os traos dos documentos que ele pode encontrar ou suscitar, traos estes que so a manifestao de estados, dados, caractersticas ou fenmenos. Existe alguma coisa a descobrir sobre eles, e o analista pode manipular esses dados por inferncia de conhecimentos sobre o emissor da mensagem ou pelo conhecimento do assunto estudado de forma a obter resultados significativos a partir dos dados (Figura 4). Ele trabalha explorando os dados, como um detetive (BARDIN, 1996, p.43-44). Nesse sentido, a descrio do contedo a primeira etapa a ser cumprida, a qual passa pela j citada Anlise Lxica pela possibilidade de leitura rpida do contedo das respostas atravs de resultados tabulados das frequncias das mesmas. Parte-se de dados qualitativos - fazendo um agrupamento quantitativo - para anlise qualitativa novamente.

2 Inferncia: operao lgica, pela qual se aprova uma proposio em verdade de sua ligao com outras proposies j tnues por verdades (BARDIN, 1996, p.43). Este tema desenvolvido por BARDIN (1996, p.169-177).

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.38

Leitura Normal

Variveis Inferidas / Anlise de Contedo

Figura 4 Anlise de Contedo BARDIN (1996, p.46)

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.39

Fazer o processo dedutivo ou inferencial a partir de ndices (palavras) ou indicadores no raro dentro da prtica cientfica. O mdico faz suas dedues sobre a sade de seu paciente graas aos seus sintomas, o meteorologista faz a previso do tempo inferindo sobre estados ou posies da natureza. Ocorre o mesmo dentro da Anlise de Contedo, pela deduo atravs da leitura e compreenso das mensagens. Os fatos, deduzidos logicamente a partir de indicadores, permitem tirar concluses, obter novas informaes ou completar conhecimentos atravs do exame detalhado dos dados. Ser objetivo, visto que a anlise deve proceder segundo as regras prestabelecidas, obedecendo a diretrizes suficientemente claras e precisas de forma a propiciar que diferentes analistas, trabalhando sobre o mesmo contedo, obtenham os mesmos resultados. Ser tambm sistemtico, pois todo o contedo deve ser ordenado e integrado nas categorias escolhidas, em funo do objetivo perseguido, e elementos de informao associados ou relativos ao objetivo no devem ser deixados de lado. Ser ainda quantitativo, pela possibilidade de evidenciar os elementos significativos, calcular a sua frequncia, etc., esta condio no sendo indispensvel visto que certas anlises de cunho qualitativo buscam mais os temas do que a sua exata medida ou importncia. Segundo GRAWITZ (1993, p.534), tais caractersticas formam os atributos da Anlise de Contedo, o que reforado por PERRIEN, CHRON e ZINS (1984) e FREITAS, MOSCAROLA e JENKINS (1998). Pode-se, ainda, classificar a AC de acordo com o propsito de investigao, que pode ser a descrio de caractersticas de comunicao - perguntando o qu, como e de quem algum disse tal coisa, a inferncia dos antecedentes da comunicao - que envolve perguntar porque algum disse alguma coisa - ou ainda fazer inferncias sobre os efeitos da comunicao - perguntando com que

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.40

inteno algum disse tal coisa (HOLSTI, 1969 e JANIS, 1965 apud KRIPPENDORFF, 1980, p.34). De fato, a Anlise de Contedo uma tcnica de pesquisa utilizada para tornar replicveis e validar inferncias de dados para seu contexto, segundo seus componentes, relaes ou transformaes entre estes (KRIPPENDORFF, 1980, p.35). Para BARDIN (1996, p.47), AC um conjunto de tcnicas de anlise das comunicaes que, atravs de procedimentos sistemticos e objetivos de descrio do contedo das mensagens, visa obter indicadores (quantitativos ou no) que permitam a inferncia de conhecimentos relativos s condies de produo e de recepo (variveis inferidas) destas mensagens. A seguir, abordam-se alguns tpicos inerentes, como: os tipos de Anlise de Contedo, as suas etapas, o seu valor como instrumento ou tcnica de pesquisa, bem como seu uso e aplicao.

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.41

3.2.1. Tipos de Anlise de Contedo Uma vez que diferentes fontes de dados esto normalmente disponveis, pode-se usar vrios modelos para explorar, processar e analisar dados. GRAWITZ (1993) desenvolve 3 diferentes enfoques (valorizados por FREITAS, MOSCAROLA e JENKINS, 1998): Verificao ou Explorao? Deve-se fazer distino entre a anlise de documentos tendo como objetivo a hiptese de verificao (sabendo-se o que se busca e podendo-se quantificar os resultados - neste caso o objeto preciso), e aquela anlise cujo objetivo seja explorao ou definio de hipteses, onde a anlise menos rigorosa e sistemtica, seguindo papis e tcnicas que no podem ser padronizadas, visto que faz apelo intuio e experincia. Anlise quantitativa ou anlise qualitativa? A anlise quantitativa tenta acumular a frequncia de temas, palavras ou smbolos, enquanto anlise qualitativa baseada na presena ou ausncia de dadas caractersticas. Outra dicotomia quali-quanti impresses versus sistematizaes, hipteses ao invs de verificaes, e flexibilidade como oposto rigidez. O que importante deve estar claro em cada um dos tipos de anlise. O nmero de vezes que um dado elemento ocorre o que conta para a anlise quantitativa, enquanto a novidade, interesse, tema ou atributo subjetivo o objeto da anlise quali. Sempre se tem um dilema: adotar categorias representativas, ou reagrupar deliberadamente os dados em um pequeno nmero de categorias, sacrificando informaes. BERELSON (1971, apud FRANKFORT-NACHMIAS e NACHMIAS, 1996, p.328)
Freitas & Janissek Anlise lxica e Anlise de contedo p.42

define que a Anlise de Contedo se sustenta ou se destri pelas suas categorias. FRANKFORT-NACHMIAS e NACHMIAS apontam, baseados na literatura, uma srie de categorias mais frequentemente empregadas, do tipo o que dito (tema, sentido, padro, valores, mtodos, caractersticas, origem, tempo, conflito, etc) e como dito (forma ou tipo de comunicao, mtodo ou tcnica utilizada, forma de definio). Anlise direta ou indireta? A anlise quantitativa direta, medida mais comumente utilizada, consiste em contabilizar as respostas tal qual elas aparecem; j a anlise quantitativa indireta pode, por vezes, alm do que se tem como resultado claro e manifesto, obter por inferncia, at mesmo aquilo que o autor deixou subentendido. Este tipo de informao (escolha das palavras, ritmo do discurso, etc) pode ser muito reveladora. Pode-se, ento, a partir de uma anlise quantitativa, buscar uma interpretao mais sutil, ou o que latente sob a linguagem explcita utilizada no texto. A interpretao indireta, que vai alm do que dito, no algo amparado apenas no qualitativo, ela pode perfeitamente se apoiar num contedo quantificado (e que possa ser destacado como exemplo).

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.43

3.2.2. Etapas da Anlise de Contedo Toda a anlise de contedo deve seguir uma srie de etapas precisas, que se iniciam pela definio do universo estudado, delimitando e definindo claramente, desta forma, o que estar e o que no estar envolvido. Uma vez estando o universo corretamente definido, inicia-se sua categorizao, que significa determinar as dimenses que sero analisadas, dimenses estas que definem a teia da grade de anlise. Estas categorias sero determinadas em funo da necessidade de informao a testar: elas constituiro o corao da Anlise de Contedo. A categorizao uma etapa delicada, no sendo evidente determinar a priori suas principais categorias: na verdade, a categorizao (processo de reduo do texto no qual as muitas palavras e expresses do texto so transformadas em poucas categorias) o problema central da AC (WEBER, 1990, p.15). Em certos casos, sua origem ser emprica: a partir de um estudo de um certo nmero de casos, as categorias sero formadas a posteriori. Na definio das categorias, importante utilizar-se dos critrios ou palavras identificadas na Anlise Lxica. Tais critrios muito provavelmente sero agrupados ou reagrupados, formando ento as categorias. o que ilustra a Figura 5 (PERRIEN, CHRON e ZINS, (1984, p.275-277).

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.44

Figura 5 Anlise de Contedo em etapas

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.45

As categorias so as rubricas significativas em funo das quais o contedo ser classificado e eventualmente quantificado. WEBER (1990, p.56-57) aborda a questo da contagem de categorias. No caso de uma enqute, pode-se prever categorias j em forma de cdigo. A Anlise de Contedo deve normalmente permitir o aparecimento de variveis e fatores de influncia que se ignorava no incio dos trabalhos. As categorias, quando no se tem uma idia precisa, devem surgir com base no prprio contedo. Na enqute de explorao, as categorias constituem elas prprias o quadro, objeto ou contexto de anlise, enquanto que, na busca de verificao de uma hiptese, pode-se ter categorias prdefinidas. De fato, um mesmo dado aberto pode servir de base aos dois exerccios ou lgicas ou estratgias de anlise recm evocados. Pode-se explorar um dado para saber o que dele pode emergir como categorias (a lista de reclamaes dos clientes, por exemplo), assim como se pode utilizar esse mesmo dado para julgar se a clientela est ou no satisfeita (classificao j pronta para se categorizar cada respondente em satisfeito ou insatisfeito). As categorias devem se originar seja do documento objeto da anlise, seja de um certo conhecimento geral da rea ou atividade na qual ele se insere. Das respostas, caso se trate de uma entrevista; dos objetivos, intenes, crenas do emissor, no caso de um texto; no sem considerar elementos ausentes que podem ser significativos. A escolha das categorias o procedimento essencial da Anlise de Contedo; visto que elas fazem a ligao entre os objetivos de pesquisa e seus resultados. O valor da anlise fica sujeito ao valor ou legitimidade das categorias de anlise. o objetivo perseguido que deve pautar a escolha ou definio do que deve ser quantificado. Segundo WEBER (1990) e BARDIN (1996), as categorias devem ser exaustivas (percorrer todo o conjunto do texto), exclusivas (os mesmos elementos no podem pertencem a diversas categorias),
Freitas & Janissek Anlise lxica e Anlise de contedo p.46

objetivas (caractersticas claras de modo a permitir seu uso por diferentes analistas em um mesmo texto) e pertinentes (em relao com os objetivos perseguidos e com o contedo tratado). A escolha das unidades de anlise a etapa seguinte: o contedo de um texto pode ser analisado de diferentes maneiras, conforme as unidades de anlise que sero definidas. Vrios autores tratam das unidades de anlises, apresentando-as com alguns enfoques ou rtulos diferentes. Alm de LEBART e SALEM (1994, p.46-50) e de WEBER (1990, p.21-24), destacam-se: Para PERRIEN, CHRON e ZINS (1984), as unidades classificam-se em (1) palavras, que so as unidades de anlise mais desagregadas, pois muitas vezes expressam situaes momentneas, medidas por estmulos situacionais; (2) em tema, que pode ser definido como a unidade mais manipulvel, uma vez que compreende proposies ou afirmaes de um sujeito a presena ou ausncia de um tema pode ser rica em informaes; (3) em personagens, que representam um outro sujeito de interesse, sobre os quais pode-se manipular determinadas caractersticas e tom-las como foco de anlise e ainda (4) as caractersticas espaciais ou temporais, que implicam em relacionar e medir um certo nmero de especificidades dos textos, evidenciando o conjunto total das idias apresentadas.

Segundo KRIPPENDORFF (1980, p.57), as unidades de anlise classificam-se em (1) unidades amostrais, que so aquelas partes da observao real, registradas independentemente das outras que a acompanham; (2) unidades de registro, que so segmentos especficos do contedo,
Freitas & Janissek Anlise lxica e Anlise de contedo p.47

caracterizados por situarem-se dentro de uma dada categoria e descritas separadamente, podendo ento serem registradas como partes analisveis separadamente das unidades amostrais, e (3) unidades de contexto, que fixam limites de informaes contextuais que podem apresentar a descrio de uma unidade de registro. Elas delineiam aquela parte do material necessrio para ser examinado para que uma unidade de registro seja caracterizada. A quantificao a ltima etapa da Anlise de Contedo, cujo objetivo permitir o relacionamento das caractersticas dos textos combinadas ao universo estudado. A presena ou ausncia de uma unidade igual ao nome das unidades, representa uma quantificao ao nvel nominal (PERRIEN, CHRON e ZINS, 1984, p.274-277).

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.48

3.2.3. O valor da Anlise de Contedo A Anlise de Contedo uma tcnica refinada, delicada, e requer muita dedicao, pacincia e tempo para satisfazer a curiosidade do investigador. Alm disso, so necessrias intuio, imaginao e observao do que importante, alm de criatividade para escolha das categorias j citadas. Ao mesmo tempo, o analista deve ter disciplina, perseverana, e ainda rigidez na decomposio do contedo ou na contagem dos resultados das anlises. Existem alguns aspectos que GRAWITZ (1993, p.553-558) resgata com relao AC, os quais so abordados e reforados por FREITAS, MOSCAROLA e JENKINS (1998): Confiabilidade: A Anlise de Contedo deve ser objetiva, e os resultados devem ser independentes do instrumento utilizado para medio, sendo conveniente minimizar as diferenas dos pontos de vista entre os analistas. Mas isso um velho problema das cincias sociais, a confiabilidade no deve ser encarada da mesma forma quando se trata de anlises quantitativas de um contedo claro e bvio, como quando se trata de uma anlise mais qualitativa, onde se procura identificar intenes ocultas, onde preciso identificar presena ou ausncia de um elemento e no a sua frequncia. Segundo KRIPPENDORFF (1980, p.146), a verificao da confiabilidade visa prover uma base para inferncias, recomendaes, suporte deciso ou mesmo a aceitao de um fato.

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.49

Validade lgica: o instrumento realmente mede o que ele se prope a medir? Uma anlise vlida quando a descrio quantificada que ela oferece a respeito de contedo significativa para o problema original e reproduz fielmente a realidade dos fatos que ele representa. claro, isso condio essencial da representatividade da amostra e supe que certas condies tcnicas inerentes a cada estgio sejam observadas satisfatoriamente. A inferncia: este ponto merece especial ateno porque algumas das expresses tm mais de uma interpretao, at mesmo interpretaes positivas ou negativas, dependendo do contexto. Validade emprica: a predio inerente justa ou precisa? Uma difcil questo para responder. Em lugar de convices, prudncia e humildade so recomendadas ao traar as concluses. Contudo, GRAWITZ (1993) acredita que a experincia e o treinamento do analista assinam a validade de sua anlise. O valor da Anlise de Contedo depende da qualidade da elaborao conceitual feita a priori pelo pesquisador, e da exatido com a qual ele ir traduzi-la em variveis, esboo de pesquisa ou categorias. Segundo WEBER (1990, p.15), uma varivel baseada na classificao de um contedo vlida na medida em que de fato mede o construto que o pesquisador tenciona medir. Os assuntos guiados pelas categorias podem suscitar hipteses interessantes (FREITAS, MOSCAROLA e JENKINS, 1998). Qualquer esforo nessa direo
Freitas & Janissek Anlise lxica e Anlise de contedo p.50

deve passar pela confiabilidade e validade dos resultados gerados (KIRK e MILLER, 1986, p.21-24 e p.41-42). Para os resultados de pesquisa serem vlidos, os dados nos quais eles sero baseados, bem como os indivduos envolvidos na sua anlise e ainda o processo que vai gerar os resultados devem ser, todos eles, confiveis. A confiabilidade necessria, ainda que no seja uma condio suficiente por si s para a validade. A importncia da confiabilidade est baseada na sua garantia de que os dados so obtidos independentemente do evento de medio, instrumento ou pessoa (KRIPPENDORFF, 1980). Dados confiveis, por definio, so dados que permanecem constantes atravs das variaes do processo de medida (KAPLAN e GOLDSEN, apud KRIPPENDORFF, 1980, p.129). A confiabilidade vista como um problema no contexto de pesquisa qualitativa, em relao sua estrutura de codificao, que poderia ser vista por ela mesma como confivel se, em qualquer recodificao subsequente, os mesmos cdigos fossem repetidos por um diferente codificador com uma margem aceitvel de erro. KRIPPENDORFF (1980, p.130-154) aborda em detalhe esta questo da concordncia, observando (p.146-147) que adotou em sua equipe a diretriz de reter variveis cuja concordncia nesse sentido fosse de pelo menos 80% entre os dois codificadores (necessariamente independentes, somente discutindo, como ltimo recurso, sobre efetivas dvidas, e no buscando influenciar um no protocolo do outro), mas que seriam igualmente retidas ou consideradas variveis cuja concordncia fosse entre 67 e 80% (muito embora se deva ser sempre cauteloso ao concluir sobre estes resultados)3. Ele observa ainda que o custo de no ser zeloso nesse sentido o de se chegar a
3

OLIVEIRA (1999, p.176-178) evoca referencial sobre o grau aceitvel de concordncia, inclusive identificando na literatura que as chances de concordncia entre os classificadores maior medida que o nmero de opes ou categorias menor.

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.51

concluses equivocadas nas pesquisas. O autor observa (p.147) que se as implicaes de uma AC forem consideradas drsticas, deve-se ser rigoroso na considerao de nveis de concordncia; porm, em se tratando de estudos exploratrios sem srias consequncias, o nvel da concordncia "pode ser consideravelmente relaxado, contudo, no to baixo que no permita levar a srio as descobertas". Para alcanar um bom nvel de concordncia, deve-se ter cuidado e construir categorias codificadas que sejam mutuamente exclusivas e no ambguas. No se deve confundir os requisitos que surgem na pesquisa hipottico-dedutiva com as demandas da pesquisa qualitativa exploratria. Numa abordagem hipottico-dedutiva para anlise de textos, categorias (pr-definidas) serviriam para condensar informaes relevantes contidas nos dados, as quais seriam representadas atravs de frequncias. J durante um estudo exploratrio, a codificao deve ser construda atravs do prprio processo de anlise de dados. Deve-se entender que cada abordagem requer um enfoque diferente de confiabilidade: um estgio dito exploratrio, onde o ambiente (categorias e propriedades) desenvolvido e hipteses so geradas, e um estgio de construo de teoria baseada em dados, onde as hipteses so refinadas com maior detalhe (KELLE, 1995, p.25). SILVERMAN (1993, p.149) discute validade como sendo verdade, ou seja, ele recorre a HAMMERSLEY, para quem validade interpretada como a extenso ou medida pela qual uma apurao, contagem ou codificao representa efetivamente o fenmeno social ao qual se refere. SILVERMAN (1993, p.156-157) descreve duas formas de validao na pesquisa qualitativa: a triangulao (comparar diferentes tipos de dados, quanti e qualitativos, obtidos pelo uso de diferentes mtodos, como observao e entrevistas, de forma a ver se um corrobora o outro) e a validao pelo respondente (agregando as descobertas de um aos temas sendo estudados pelos
Freitas & Janissek Anlise lxica e Anlise de contedo p.52

outros, e mesmo avaliando sua reao). Contudo, ele prefere outras tcnicas a estas. Ele sugere (p.160-166) que sejam utilizados mtodos que permitam generalizar para uma populao mais ampla (mas no numa lgica puramente estatstica, e sim obtendo informaes sobre aspectos relevantes da populao de casos e comparando o caso em anlise com esses dados, usando mtodo survey numa amostra aleatria de casos, ou ainda realizando diversos estudos etnogrficos), mtodos de teste de hipteses (induo analtica na busca de associaes, com constante uso de mtodos comparativos e a busca por casos de exceo), e mesmo que se use simples procedimentos de contagem (uso de alguma quantificao). Um procedimento confivel deve render os mesmos resultados a partir de um mesmo conjunto de fenmenos, indiferentemente das circunstncias de aplicao (KRIPPENDORFF, 1980; KIRK e MILLER, 1986). Um codificador ou analista, por exemplo, pode duplicar o que ele tenha tido feito antes e, no encontrando maiores divergncias entre as duas, concluir que tais dados so confiveis. Agora, imagine o mesmo codificador confrontando sua codificao de categorias com codificaes feitas por outra pessoa. Neste caso, a ausncia de desvios um indicativo de confiana dos dados, mas maior ainda porque est livre de erros ou inconsistncias de um nico codificador. Ou ainda, pode ser interessante o fato de estes dados serem testados por duas pessoas e ainda serem confrontados com normas sistematizadas de verificao. Portanto, para testar a confiabilidade dos dados, alguns esforos duplicados so essenciais, seja do codificador por si mesmo, seja a partir da exigncia de codificao por mais de um envolvido, em ambas situaes confrontando os resultados. Toda comunicao entre codificadores tender a melhorar o grau de concordncia, contudo esse mesmo grau ter embutido um vis da prpria comunicao. Esta confiabilidade da Anlise de Contedo pode ser
Freitas & Janissek Anlise lxica e Anlise de contedo p.53

obtida, segundo KRIPPENDORFF (1980, p.130-131), atravs de 3 maneiras, que so a estabilidade, a reprodutibilidade e a exatido, as quais exprimem, nessa ordem, o menor e o maior grau de confiabilidade. A Figura 6 apresenta caractersticas destes 3 tipos de confiabilidade. Estes aspectos so reforados e revisados por WEBER (1990, p.17).

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.54

Estabilidade

TIPO

ESFOROS
Teste - reteste

Reprodutibilidade

Teste - teste

Exatido

Teste - padro

o grau ou intensidade no qual o processo invarivel ou imutvel com o passar do tempo o grau ou intensidade no qual o processo pode ser recriado em variadas circunstancias, em diferentes locais, usando diferentes codificadores. o grau ou intensidade no qual o processo funciona conforme um padro conhecido.

DEFINIO

1) Intra-observador / Inconsistncias 1) Intra-observador / Inconsistncias 2) Inter-observador / Discordncias

RELAES

1) Intra-observador / Inconsistncias 2) Inter-observador / Discordncias 3) Divergncias sistemticas, de acordo com as regras ou normas

Figura 6 A confiabilidade na Anlise de Contedo: tipos, caractersticas e tcnicas (KRIPPENDORFF, 1980, p.131)

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.55

A verificao da estabilidade, dependendo do tipo de anlise, por exemplo sendo mais exploratria, j pode ser uma razovel argumentao para legitimar o valor dos dados ou categorias apresentados, bem como o perfil do analista. No caso de pesquisas de verificao de hipteses, claro, seria fundamental a verificao quanto reprodutibilidade e exatido (KELLE, 1995, p.18-28). SILVERMAN (1993, p.144-148) discute detalhadamente sobre a confiabilidade, contudo fortemente baseado em KIRK e MILLER. Estes resgatam uma definio de HAMMERSLEY para a confiabilidade: refere-se ao grau de consistncia com o qual as categorias so definidas por diferentes observadores ou pelo mesmo observador em diferentes ocasies. A confiabilidade de dados requer, portanto, que no mnimo dois codificadores independentes descrevam um mesmo conjunto de unidades, ou ento um mesmo em duas ocasies com certa distncia de tempo. A confiabilidade expressa como uma funo de concordncia entre os codificadores (ou as duas codificaes do mesmo analista no tempo 1 e no tempo 2) em razo de um mesmo conjunto de dados. Uma vez de posse dos resultados de cada codificador (ou do teste e reteste de um mesmo codificador), existem vrios clculos que podem ser aplicados para verificar o grau de concordncia obtido entre os codificadores. Tais clculos so apresentados por KRIPPENDORFF (1980, p.133-154). Segundo KRIPPENDORFF (1980, p.134), a forma mais convincente de expressar a confiabilidade dos dados pode ser obtida com base no mximo possvel de concordncia entre os dois avaliadores, isto combinado com uma contagem de desacordos observados em funo de desacordos esperados, que ele define num clculo chamado chance de concordncia.

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.56

EVRARD (1997, p.118-119) revisa diferentes autores a este propsito, bem como KRIPPENDORFF (1980, p.138-154). Destacam-se duas proposies: um o ndice de convergncia - o Kappa de Cohen, que compara o percentual de acordo entre os analistas em funo do que seria obtido ao acaso, numa formulao matemtica que envolve o nmero total de julgamentos feitos por cada analista, o nmero de julgamentos sobre os quais os analistas esto de acordo e o nmero de julgamentos em acordo obtidos ao acaso. Outro a medida de percentual de acordo (ou a definio de matrizes de contingncia entre analistas), onde as categorias de codificao dos analistas so relacionadas em uma tabela de duplas entradas, com as frequncias das classificaes que foram identificadas pelos dois analistas e a possibilidade de medir o percentual de acordo em relao ao percentual de desacordo. Numa posio contrria ao excesso de "formulismos", nossa idia de que - nas pesquisas em SI - estas verificaes devem ser passveis de serem realizadas de forma descomplicada e bastante honesta, isto qualquer que seja o conhecimento do analista. De fato, o que interessa saber o real grau de concordncia entre os dois codificadores em questo (normalmente o pesquisador em si e algum que serve de referncia). No se deseja sobretudo induzir o pesquisador a realizar manipulaes dos resultados observados (ele ficar tentado a tal para provar um supostamente improvvel - alto grau de concordncia), nem desviar sua ateno do objeto investigado em si com procedimentos de verificao e clculos complicados e que exigem tempo nobre e muita pacincia, alm do envolvimento e doao de um terceiro. O leitor quem deve julgar o uso adequado e a efetiva cientificidade das verificaes da confiabilidade; este texto mostra posio a respeito, mas tambm o referencial necessrio e suficiente para adoo de outra soluo.

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.57

Assim sendo, note-se primeiro que os procedimentos matemticos ou de confrontao com outro analista (indicados na literatura j referenciada) so mais pertinentes quando a varivel envolvida do tipo assumida ou definida a priori, ou seja, aquelas cuja classificao ou categorizao foi realizada por ambos com base em protocolo comum e bem entendido, oriundo seja de literatura, seja de idias que eles mutuamente compartilham. Neste caso, pode-se esperar um certo grau de concordncia. Isto no to verdade para o caso das variveis ditas inferidas, nas quais o pesquisador vai utilizar seu referencial e todo seu domnio por estar envolvido na pesquisa para criar categorias de forma gradativa medida que avana de dado em dado. Esperar que o segundo analista, o qual realiza a categorizao de confrontao, possa ter um alto grau de concordncia, seria partir do pressuposto que ele tem um entendimento da questo e mesmo do seu contedo muito prximo do pesquisador principal. Ora, isto muito difcil. Logo, deve-se esperar, nestes casos, um no to alto grau de concordncia nas confrontaes cujo objeto seja este tipo de varivel. WEBER (1990, p.18) chama a ateno sobre quo potencialmente confusa pode ser a questo de verificao da validade. Mesmo KRIPPENDORFF (1980, p.135) observa que a AC pode conter mtricas e escalas complexas e distintas. Nossa proposta que o pesquisador realize contagens de acordos e desacordos e, a partir disso, possa ter formas simplificadas que permitam dar uma noo do grau de concordncia entre os dois avaliadores, entre as quais as seguintes, baseadas seja nas categorias, seja nas observaes (pessoas, entrevistas ou fichas): Concordncia exata com base no total de itens avaliados em relao ao total de categorias da questo sendo avaliada multiplicado pelo nmero de entrevistas ou pessoas ou fichas, quantas categorias foram comuns aos dois avaliadores, independentemente de
Freitas & Janissek Anlise lxica e Anlise de contedo p.58

terem sido marcadas ou no (marcaram as mesmas e deixaram em branco as mesmas) 4. Concordncia parcial com base no total de itens efetivamente marcados pelo pesquisador (ou pelos avaliadores) em relao ao total de categorias marcadas pelo pesquisador, quantas destas foram tambm marcadas pelo segundo avaliador, desconsiderando as desigualdades. Ou ainda, tambm a quantidade de categorias que o pesquisador deixou em branco e tambm foram deixadas em branco pelo segundo avaliador. A sofisticao (ou ponderao ou mesmo relativizao) deste indicador seria tambm verificada pela quantidade de categorias que o pesquisador marcou e no foram marcadas de forma correspondente pelo segundo avaliador (o que se obtm diretamente, descontando do nmero total de categorias marcadas pelo pesquisador o nmero de categorias coincidentes marcadas pelos dois, ou seja, o nmero de categorias que o segundo avaliador marcou e que coincidem com as categorizaes de fato do pesquisador). Alm disso, tambm poderia ser indicada a quantidade de categorias que o segundo avaliador marcou e que no foram marcadas de forma correspondente pelo pesquisador (o que se obtm diretamente, descontando do nmero total de categorias efetivamente marcadas pelo segundo avaliador o nmero de categorias coincidentes marcadas pelos dois, este ltimo tendo sido gerado a partir da comparao caso a caso ou categorizao entre o pesquisador e o segundo avaliador). Estes dois ltimos valores serviriam para mostrar que o principal indicador (a quantidade de categorias de fato igualmente marcadas) tem sua fora de argumento amenizada. Este

4 OLIVEIRA (1999, p.357) em sua pesquisa de doutorado, aplicou um clculo de confiabilidade da codificao de uma questo aberta texto da seguinte forma: o coeficiente de concordncia foi calculado dividindo o nmero total de citaes com codificao igual pelo nmero total de citaes e multiplicado por 100.

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.59

um indicador simples que mostra honestamente o grau efetivo de concordncia. Concordncia exata com base no total de respondentes forma mais rgida de avaliao da concordncia qual o nmero de entrevistas ou pessoas ou fichas nas quais a marcao ou categorizao realizada pelos dois avaliadores exatamente coincidente? Concordncia parcial com base no total de respondentes flexibilizao do critrio de avaliao da concordncia com margem de mais ou menos um, mais ou menos dois, etc, ou seja, qual o nmero de entrevistas ou pessoas ou fichas nas quais a marcao ou categorizao realizada pelos dois avaliadores quase coincidente (quase todos coincidem, exceto um ou dois, ou mesmo uma quantidade razovel a ser definida pelo pesquisador, de acordo com o nmero de categorias envolvidas na questo)? No item 6.4 deste livro, so aplicadas estas idias numa confrontao envolvendo uma varivel cujas categorias foram inferidas a partir do contedo de cada entrevista, e tambm numa outra cujas categorias foram definidas a priori pelo pesquisador com base na literatura e na prtica gerencial.

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.60

3.2.4. Aplicao da Anlise de Contedo Os recursos oferecidos pelas cincias sociais para nossa reflexo so essencialmente compostos de comunicaes orais ou escritas, que incluem textos de entrevistas, falas, discursos e conversas. Qualquer que seja o nvel que se deseje atingir e o objeto de nossas pesquisas, os dados a reunir para compreender, explicar opinies, condutas, aes, enfim, estes dados so quase sempre de origem verbal. A ao, quando ns a apreendemos, apresenta-se em um contexto de palavras: sempre se encontram falas ou discursos e escritos ou textos, ou seja, documentao em palavras. A Anlise de Contedo pode ser uma boa tcnica para ser usada em todos os tipos de pesquisa que possam ser documentadas em textos escritos (documentos oficiais, livros, jornais, documentos pessoais), em gravaes de voz ou imagem (rdio, televiso, etc), ou em outras atividades que possam ser decompostas como uma entrevista, por exemplo. muito importante que pesquisadores sociais estejam aptos a analisar esse tipo de dados de uma forma cientfica, no se contentando apenas com impresses casuais. A novidade em procedimentos modernos de Anlise de Contedo est em substituir as impresses por procedimentos padronizados, quantitativos, atravs da transformao de dados iniciais (provenientes de pesquisas qualitativas) em dados possveis de serem analisados digamos mais cientificamente. Para isso, utiliza-se da decomposio do texto, que ser estudado como uma funo das palavras que ele contm ou idias que ele representa, este ltimo sendo escolhido em funo das relaes com os objetivos da nossa pesquisa aqui descrita (FREITAS, MOSCAROLA e JENKINS, 1998). Qualquer que seja a comunicao, est-se na presena de um emissor que lana uma mensagem possuindo contedo e forma, visando atingir um objetivo, e endereada a um ou vrios receptores.
Freitas & Janissek Anlise lxica e Anlise de contedo p.61

Quem fala? Para dizer o qu? A quem? Como? Com que resultado? De acordo com BERELSON (in GRAWITZ, 1976, p. 623), a Anlise Lxica e a Anlise de Contedo podem ser aplicadas nos casos que requerem maior preciso ou objetividade. Pode-se aplicar este tipo de tcnica de anlise de dados de vrias formas, envolvendo diferentes fontes de dados. As comparaes e evolues formam o principal campo da Anlise de Contedo, onde se aplica portanto a utilidade da Anlise Lxica para basear toda uma evoluo. Quando suficientemente definidas, detalhadas e analisadas em conjunto, permitem-nos passar de uma simples descrio e alcanar o objetivo de toda pesquisa cientfica: a descoberta de explicaes e relaes causais (FREITAS, MOSCAROLA e JENKINS, 1998).

Freitas & Janissek

Anlise lxica e Anlise de contedo

p.62

Centres d'intérêt liés