Vous êtes sur la page 1sur 31

Banco de dados Acredito que todos ns tenhamos uma desconfiana do que seja um banco de dados.

Entretanto, a definio correta de banco de dados gira em torno de duas ideias chave: relacionamento e finalidade. Um banco de dados um conjunto de dados relacionados com uma finalidade especfica. Via de regra, esta finalidade a produo de informao, para determinado pblico alvo (uma empresa, ou um rgo pblico, por exemplo) Um esquema do bancos de dados uma coleo de objetos de um banco de dados que esto disponveis para um determinado usurio ou grupo. Os objetos de um esquema so estruturas lgicas que se referem diretamente aos dados do banco de dados. Eles incluem estruturas, tais como tabelas, vises, seqncias, procedimentos armazenados, sinnimos, ndices, agrupamentos e links de banco de dados. (No h nenhum relacionamento entre um tablespace e um esquema; os objetos do mesmo esquema podem estar em tablespaces diferentes, e um tablespace pode conter objetos de esquemas diferentes).

Entretanto, voltemos a falar dos atributos, e suas classificaes. Atributos Compostos versus Simples (Atmicos). Os atributos compostos podem ser divididos em subpartes menores, que representam a maioria dos atributos bsicos com significados

independentes. Por exemplo, um atributo Endereo, em uma tabela hipottica, pode ser subdividido em EnderecoRua, Cidade, Estado e CEP, com os valores 'Av. Rangel Pestana, 300', 'So Paulo', 'SP' e '01017-911'. Os atributos que no so divisveis so chamados simples ou atributos atmicos. E os atributos compostos podem formar uma hierarquia; por exemplo, EnderecoRua pode ser subdividido, ainda, em trs atributos simples: Rua, Nmero e Apartamento. O valor de um atributo composto a concatenao dos valores componentes dos seus atributos simples. Atributos Monovalorados versus Multivalorados. A maioria dos atributos tem um valor nico para uma dada tabela; esses atributos so chamados monovalorados. Por exemplo, Idade um atributo monovalorado de uma pessoa. Em alguns casos, um atributo pode ter um conjunto de valores para a mesma entidade por exemplo, um atributo Cor para um carro ou um atributo Titulao para uma pessoa. Os carros com uma cor tm um valor nico, enquanto aqueles com dois tons contm dois valores para Cor. Da mesma forma, uma pessoa pode no ter um ttulo acadmico, outra pessoa pode ter um e, uma terceira pessoa, dois ou mais ttulos, portanto, pessoas diferentes podem ter nmeros de valores diferentes para o atributo Titulao. Esses atributos so chamados multivalorados. Um atributo multivalorado deve ter limite inferior e superior para restringir o nmero de valores permitidos a cada entidade individual. Por exemplo, o atributo Cor de um carro pode ter entre um e trs valores, se presumirmos que um carro possa ter, no mximo, trs cores. Atributos Armazenados versus Derivados. Em alguns casos, dois (ou mais) valores de atributos esto relacionados por exemplo, os atributos Idade e DataNascimento de uma pessoa. Para uma tabela pessoa em particular, o valor de Idade pode ser determinado pela data corrente (hoje) e o valor de DataNascimento da pessoa. Portanto, o atributo Idade chamado atributo derivado, e dito derivado do atributo DataNascimento, que, por sua vez, chamado atributo armazenado. Alguns valores de atributos podem ser derivados de entidades relacionadas; por exemplo, um atributo NumerodeEmpregados, de uma entidade departamento, pode ser derivado da contagem do nmero de empregados relacionados (que trabalham) nesse departamento. Valores nulls (Nulos). Em alguns casos, determinada tabela pode no ter um valor aplicvel a um atributo. Por exemplo, o atributo Apartamento de um endereo se aplica apenas a endereos que esto em edifcios de apartamentos, e no a outros tipos de residncia, como as casas. Por analogia, um atributo Titulao s se aplica a pessoas com titulao acadmica. Para essas situaes criado um valor especial chamado null (nulo). Um endereo de uma casa teria valor null para seu atributo Apartamento, e uma pessoa sem titulao acadmica teria valor null para Titulao. O valor null pode ser usado tambm quando no conhecemos o valor de um atributo para uma entidade em particular; por exemplo, se no soubermos o telefone residencial de 'Joao Paulo'. O sentido do primeiro tipo de null corresponde a no aplicvel, ao passo que o sentido do ltimo se refere a desconhecido. A categoria 'desconhecido' de null pode ser, ainda,

classificada em dois casos. O primeiro aparece quando se sabe que o valor do atributo existe mas est faltando por exemplo, se o atributo Altura de uma pessoa dado como null. O segundo caso surge quando no se sabe se o valor do atributo existe por exemplo, se o atributo FoneResidencial de uma pessoa null. Atributos Complexos. Observa-se que os atributos compostos e multivalorados podem ser aninhados de uma maneira arbitrria. Podemos representar essa organizao arbitrria agrupando os componentes de um atributo composto entre parnteses (), separando os componentes por meio de vrgulas e mostrando os atributos multivalorados entre chaves {}. Esses atributos so chamados atributos complexos. Por exemplo, se uma pessoa pode ter mais de uma residncia e cada uma delas pode ter mltiplos telefones, um atributo EnderecoFone para uma pessoa pode ser especificado contendo mais de um atributo, como por exempo contendo os atributos Endereco e Telefone. Ex: {EnderecoFone({Fone(CodigoArea,NumeroFone)},Endereco(EnderecoRua(N umero, Rua, Apartamento),Cidade, Estado, CEP))}. Ateno! No confunda multivalorado com complexo! Uma coisa o Atributo Endereco conter mais de um endereo, outra coisa o atributo EnderecoFone conter um endereo e um telefone! Existem vrios modelos de dados diferentes. Vejamos alguns: Modelo hierrquico: O modelo hierrquico foi o primeiro a ser reconhecido como um modelo de dados. Nele, os registros so conectados em uma estrutura de dados em rvore, similar a uma rvore invertida (ou s razes de uma rvore). Neste modelo, uma ligao uma associao entre dois registros. O relacionamento entre um registro-pai e vrios registros-filhos possui cardinalidade 1:N, ou 1:1, sendo N =1. Os dados organizados segundo este modelo podem ser acessados segundo uma sequncia hierrquica com uma navegao do topo para as folhas e da esquerda para direita. Um registro pode at estar associado a vrios registros diferentes, desde que seja replicado. Neste exemplo, perceba que os registros da tabela empregado possuem hierarquia direta em relao aos registros da tabela departamento. O modelo hierrquico possui muitas limitaes. Ele pode ser til para modelar esquemas fortemente hierrquicos (como classificaes para espcies dos reinos animal e vegetal, corporaes, hierarquias governamentais, etc.), mas apresenta limitaes quando representa modelos no-hierrquicos. Isto provocou o surgimento do modelo em rede. Modelo em rede: o modelo em rede acabou eliminando a hierarquia, pois passou a permitir que, em tese, cada registro filho pudesse ser ligado a mais de um registro pai.

Nesse caso, a estrutura em rvore se desfaz, e passa a se assemelhar a uma estrutura em grafo. Relacionamentos N:M tambm passam a ser permitidos (lembrando que o relacionamento estabelecido entre registros). Perceba que, neste modelo, possvel colocar um empregado vinculado a mais de um departamento, o que no era possvel no modelo hierrquico. Os modelos de dados em rede e hierrquicos precederam o modelo de dados relacional, que o mais utilizado atualmente. So muito pouco utilizados nos dias de hoje, a no ser em bancos de dados antigos que ainda estejam em vigor. Modelo relacional: O modelo relacional usa uma coleo de tabelas para representar os dados e as relaes entre eles. Foi o modelo que eu utilizei para explicar os conceitos bsicos de banco de dados, e o modelo mais utilizado (e cobrado em provas). Cada tabela possui diversas colunas, e cada coluna possui um nome nico. Tabelas tambm so chamadas de relaes.(Deixei isso pra depois de propsito: no confunda relao com os relacionamentos entre as tabelas). Cada tabela contm tuplas. Cada tupla possui um nmero fixo de campos, ou atributos. As colunas das tabelas correspondem aos atributos do tipo de registro. Este modelo o mais utilizado na fase de projeto lgico do BD. Modelo Entidade/Relacionamento: O modelo de EntidadeRelacionamento (E-R) baseado na percepo de um mundo real que consiste em uma coleo de objetos bsicos, chamados entidades, e os relacionamentos entre esses objetos (existem autores que falam em relao para descrever relacionamentos. Preste ateno em uma eventual questo de prova, para saber o que a banca quer). Uma entidade uma coisa ou objeto no mundo real que distinguvel dos outros objetos (como pessoa, ou carro). um modelo mais alto nvel, empregado na fase do projeto conceitual, que anterior fase do projeto lgico, no qual se utiliza o modelo relacional. Tambm cai em provas. A bibliografia cita 3 atores no processo de criao de um SGBD. A saber: Projetista do Banco de Dados os idealizadores do banco. Conversam com os usurios para especificar requisitos e modelam conceitualmente o banco; Administrador do Banco de Dados implementam o banco e cuidam dele durante seu ciclo de vida; Usurio do Banco de Dados (ou Usurio Final) especificam suas necessidades, antes do BD, e o utilizam aps sua criao Esta pergunta se responde utilizando o famoso acrnimo ACID. Idealmente, toda transao em um banco de dados dever ser: Atmica: ou a transao feita ou no feita. Parece bvio, mas transaes complexas em um banco, envolvendo vrias tabelas, podem

sofrem interrupes inesperadas, ou no conseguirem terminar por entrar em conflito com outra que ocorra ao mesmo tempo. Nesse caso, o SGBD dever ser capaz de reverter o que parcialmente foi modificado (realizar o rollback); Consistente: os dados devero permanecer ntegros e obedientes s regras do banco de dados (metadados); Isolada: o resultado de uma transao executada concorrentemente a outra deve ser o mesmo que o de sua execuo de forma isolada. Operaes exteriores a uma dada transao jamais vero esta transao em estados intermedirios. Durvel: os efeitos de uma transao em caso de sucesso (commit) devem persistir no banco de dados mesmo em presena de falhas. os dados modificados devem estar disponveis em definitivo. Em primeiro lugar, antes de explicar as formas normais, vejamos o conceito de dependncia funcional. Em linhas gerais, uma dependncia funcional entre dois atributos X e Y uma restrio nos possveis valores de Y, dado um valor X. Por exemplo, o valor na coluna CPF de uma tabela certamente restringir o valor NOMECOMPLETO, nesta mesma tabela. Entendendo dependncia funcional, vejamos as formas normais: 1 Forma Normal uma tabela est na primeira forma normal se no possuir atributos multivalorados. Lembro que um domnio atmico se os seus elementos forem considerados como indivisveis. Por consequncia, um atributo multivalorado no atmico, por permitir que este atributo seja dividido em tantas tuplas quanto forem os itens do conjunto multivalorado. Vimos os vrios tipos de atributos algumas questes atrs, e sei que voc se lembra. uma definio bem tranquila de assimilar. Veja abaixo uma tabela que no est na primeira forma normal, e outra que est: Nome Paulo Marta Rita Telefone (11) 99999-8888 (11) 99999-7777 (11) 3030-3131 (11) 5678-9012 (11) 99988-9876 (11) 98765-4321

A tabela acima no est na primeira forma normal (1FN). O atributo telefone est multivalorado em alguns registros.

Nome Paulo Paulo Paulo Marta Marta Rita

Telefone (11) 99999-8888 (11) 99999-7777 (11) 3030-3131 (11) 5678-9012 (11) 99988-9876 (11) 98765-4321

Agora a tabela encontra-se na 1FN. O atributo multivalorado foi atomizado por meio da criao de tuplas adicionais. 2 Forma Normal uma tabela estar na segunda forma normal se, alm de estar na 1FN, todos os seus atributos no-chave forem depender funcionalmente da chave inteira. Se algum atributo da tabela depender funcionalmente apenas de parte da chave primria, ento este atributo dever migrar para outra tabela. Veja este exemplo:
Projetos(codp, tipo, descrio) EmpregadosProjetos(code,codp, nome, categ, salrio, data_incio_projeto, tempo_aloc_projeto)

Neste exemplo, os atributos nome, categ e salrio da tabela EMPREGADOSPROJETOS se relacionam apenas com code, ou seja, no ocorre a dependncia funcional total da chave primria. A soluo, na segunda forma normal, seria:
Projetos(codp, tipo, descrio) Empregados(code, nome, categ, salrio) ProjEmp(codp, code, data_incio, tempo_aloc)

3 Forma Normal envolve o conceito de dependncia transitiva. Para isso, a tabela dever estar na 2FN e cada atributo no-chave no pode possuir dependncia transitiva, para cada chave candidata da relao. Na prtica, se Z depende de Y e Y depende de X, sendo que apenas X chave da relao, esta tabela no estar na terceira forma normal. Perceba que, na soluo para a segunda forma normal apresentada anteriormente, salrio possui dependncia funcional de categoria. Assim sendo, uma soluo na terceira forma normal seria:
Projetos(codp, tipo, descrio) Empregados(code, nome, categ) Categorias(categ, salrio) ProjEmp(codp, code, data_incio, tempo_aloc)

Forma Normal de Boyce-Codd(BCNF) alm da 3FN, todo atributo nochave deve depender funcionalmente diretamente da chave primria, ou seja, no pode haver dependncias entre atributos no-chave. uma afirmao um pouco mais forte que a 3FN. 4 Forma Normal alm da 3FN, no podem existir dependncias multivaloradas.

Veja este exemplo:


Livros(nrol, ttulo, editora, ano_public) Editoras(editora, cid-edit) AutAssLiv(nrol, autor, assunto)

Perceba que um mesmo livro que possua vrios autores receber mltiplas entradas na tabela AutAssLiv com a repetio do atributo assunto. Uma eventual busca nesta tabela, filtrando por assunto, retornaria vrias vezes o mesmo livro, com autores distintos. Seria necessria a aplicao de alguma lgica para que fosse mostrado um nico resultado de livro, com seus diferentes autores. Isto pode ser contornado com a aplicao da 4FN, a seguir:
Livros(nrol, ttulo, editora, ano_public) Editoras(editora, cid-edit) AutLiv(nrol, autor) AssLiv(nrol, assunto)

5 Forma Normal Envolve a noo dependncia de juno. Existem tabelas na 4FN que no podem ser divididas em duas relaes sem perda de informao. Por exemplo:
ProjetoRecurso(CodEmp, CodPrj, Papel) R1(CodEmp, Papel) R2(CodPrj, CodEmp)

Sejam as relaes R1 e R2 a decomposio da relao ProjetoRecurso. A tabela ProjetoRecurso indica o empregado envolvido em um projeto e qual o seu papel. R2 seria uma tabela com o empregado e os possveis papis que ele pode exercer, ao mesmo tempo que R1 seria uma tabela que relaciona os empregados e seus projetos. Decompor ProjetoRecurso em R2 e R1 implica em perda de informao, uma vez que no ser mais possvel saber qual o papel que o empregado desempenhou em um projeto especfico. Realizar esta decomposio seria aplicar a quinta forma normal. Um banco de dados orientado a objetos um banco de dados em que cada informao armazenada na forma de objetos, ou seja, utiliza a Estrutura de dados denominada Orientao a objetos, a qual permeia as linguagens mais modernas. O gerenciador do banco de dados para um orientado a objeto referenciado por vrios como ODBMS ou OODBMS. Num banco de dados orientado a objetos puro, os dados so armazenados como objetos onde s podem ser manipulados pelos mtodos definidos pela classe de que estes objetos pertencem. Os objetos so organizados numa hierarquia de tipos e subtipos que recebem as caractersticas de seus supertipos. Os objetos podem conter referncias para outros objetos, e as aplicaes podem consequentemente acessar os dados requeridos usando um estilo de navegao de programao. DDL (Data Definition Language) serve para a definio de estruturas de dados, incluindo linhas, colunas, tabelas, ndices e localizaes de arquivos.Ex: CREATE (cria tabelas), ALTER(modifica a tabela, como para incluir um atributo) e DROP(elimina a tabela).

DML (Data Manipulation Language) voltada para a manipulao dos dados, como o prprio nome diz. Ex: INSERT(inserir), SELECT(consultar), UPDATE(atualizar, modificando alguns atributos), DELETE(autoexplicativo).... SDL (Storage Definition Language) utilizada para especificar o esquema interno de armazenamento. Pertencia s verses antigas do SQL, mas foi absorvida pela DDL. Alguns autores nem citam mais esta modalidade. DTL (Data Transaction Language) para a transao no banco de dados. Ex: BEGIN WORK(iniciar uma transao), COMMIT(gravar a transao do buffer para o disco rgido), ROLLBACK(desfazer transao). DCL (Data Control Language) controla aspectos de autorizao de dados e licenas de usurios para controlar quem tem acesso dentro do banco. Ex: GRANT(dar acesso), REVOKE(retirar acesso). VDL (View Definition Language) voltada para especificar as vises dos usurios e seus mapeamentos para o esquema conceitual.Ex: CREATE VIEW, DROP VIEW.

Banco de dados distribudo (BDD) uma coleo de vrias Bases de Dados logicamente inter-relacionadas, distribudas por uma rede de computadores. Existem dois tipos de banco de dados distribudos, os homogneos e os heterogneos. Os homogneos so compostos pelos mesmos bancos de dados, j os Heterogneos so aqueles que so compostos por mais de um tipo de banco de dados. Outra caracterstica importante dos BDD que eles normalmente esto separados geograficamente, so administrados separadamente e possuem interconexo lenta. Num banco de dados distribudos os arquivos podem estar replicados ou fragmentados, esses dois tipos podem ser encontrados ao longo dos ns do sistema de BDD's. Quando os dados se encontram replicados, existe uma cpia de cada um dos dados em cada n, tornando as bases iguais (ex: tabela de produtos de uma grande loja). J na fragmentao, os dados se encontram divididos ao longo do sistema, ou seja a cada n existe uma base de dados diferente se olharmos de uma forma local, mas se analisarmos de uma forma global os dados so vistos de uma forma nica, pois cada n possui um catlogo que contm cada informao dos dados dos bancos adjacentes. A replicao dos dados pode se dar de maneira sncrona ou assncrona. No caso de replicao sncrona, cada transao dada como concluda quando todos os ns confirmam que a transao local foi bem sucedida. Na replicao assncrona, o n principal executa a transao enviando confirmao ao solicitante e ento encaminha a transao aos demais ns. A fragmentao, por sua vez, pode ser vertical ou horizontal. A fragmentao horizontal distribui conjuntos de tuplas entre os bancos. A

vertical, por sua vez, distribui uma relao em sub-relaes, nas quais cada sub-relao definida por um conjunto das colunas da relao original. Vantagens de bancos de dados distribudos Reflete a estrutura organizacional fragmentos do banco de dados esto localizados nos departamentos que se relacionam com os dados que estes persistem. Autonomia Local um departamento pode controlar seus dados (j que o mais familiarizado com estes). Maior disponibilidade uma falha em um banco de dados afetar somente um fragmento, ao invs do banco de dados inteiro. Melhor performance os dados esto localizados prximo do local de maior demanda e os sistemas de banco de dados por si s so paralelizveis, permitindo carregar no banco de dados para o balanceamento entre servidores (a elevada carga em um mdulo do banco de dados no ir afetar os outros mdulos de banco de dados em um banco de dados distribudo). Econmico custa menos criar uma rede de pequenos computadores com o mesmo poder que um nico computador maior. Modularidade sistemas podem ser modificados, adicionados ou removidos do banco de dados distribudo sem afetar os outros mdulos (sistemas). Desvantagens de banco de dados distribudos Complexidade trabalho extra deve ser feito pelos DBAs para garantir que a natureza da distribuio do sistema seja transparente. Trabalho extra deve ser feito para manter sistemas mltiplos diferentes, ao invs de um nico grande. Design de banco de dados extra deve tambm ser feito para levar em conta a natureza desconectada do banco de dados - por exemplo, JOINs tornam-se proibitivamente caros quando so rodados entre mltiplas plataformas. Implantao mais cara o aumento da complexidade e uma infraestrura mais extensa significa custo extra de trabalho. Segurana fragmentos de banco de dados remotos devem ser seguros e, como eles no so centralizados ento os lugares remotos tambm devem ser seguros. A infraestrutura tambm deve ser segura (por exemplo, pela encriptao dos links de rede entre os lugares remotos). Difcil de manter a integridade em sistemas distribudos, reforar a integridade ao longo de uma rede pode exigir demais dos recursos da rede para ser vivel. Design do banco de dados mais complexo alm das dificuldades normais, o design de um banco de dados distribudos tem que considerar a fragmentao dos dados, alocao dos fragmentos em lugares especficos e a replicao de dados. Business Intelligence (BI) pode ser traduzido como inteligncia de negcios, ou inteligncia empresarial. Isto significa que um mtodo que visa ajudar as empresas a tomar decises inteligentes, por meio de dados e informaes recolhidas por diversos sistemas de informao, incluindo DataWarehouses/Data Marts).

Sendo assim, BI uma tecnologia que permite s empresas transformar dados guardados nos seus sistemas em Informao qualitativa e importante para a tomada de deciso. H uma forte tendncia de que os produtos que compem o sistema de BI de uma empresa passem provenham funes extras que auxiliem na tomada de decises, como, por exemplo, ferramentas de Data Mining. Ou seja, BI um conjunto de tcnicas, mtodos e ferramentas que subsidiam o processo de deciso de uma empresa. Perceba que BI um conceito abstrato, enquanto um SAD (sistema de apoio deciso) uma ferramenta, utilizada para o BI. Data Mining, como o nome indica, se refere minerao ou a descoberta de informaes em funo de padres ou regras em grande quantidade de dados. Destaco que tal processo pode ocorrer de maneira automtica ou semiautomtica, envolvendo ou no participao humana no processo de anlise.

Esta minerao pode utilizar vrias tcnicas para a descoberta de conhecimento. Vejamos algumas, de forma bem resumida: Associao: Explicando de forma bem simples, enxergar alguma forma de relao entre variveis (do tipo X influencia Y); Descrio de classes: prov um resumo conciso e sucinto de uma coleo de dados e a distingue de outras. O resumo de uma coleo de dados chamado de caracterizao de classe; enquanto a comparao entre duas ou mais colees de dados chamada comparao ou discriminao de classe. A descrio de classe no s deveria cobrir suas propriedades de resumo tal como a contagem, somas, e clculos de mdias, mas tambm suas propriedades sobre a disperso dos dados, tais como a varincia, desvio padro, quartis, dentre outros; Classificao: o processo de encontrar um modelo que descreve classes diferentes de dados (por exemplo, ensinar ao sistema quais clientes bancrios so de risco alto, mdio e baixo, por meio de alguns registros, e, a partir deste ponto, a minerao por si s ser capaz de classificar o restante da base de dados). Agrupamento(clustering): Similar classificao, porm sem superviso (o sistema por si s sendo capaz de criar grupos). Descoberta de padres sequenciais: Exemplo, o sistema descobrir que se o cliente compra po, provvel que compre po e leite; Descoberta de padres em sries temporais: Exemplo, o sistema descobrir que as vendas de guarda-chuva caem na poca da seca;

Regresso: a anlise de diversas variveis para prever uma prxima (exemplo, ver os exames de um paciente e calcular a probabilidade de sobrevivncia a uma cirurgia, com base no histrico de pacientes operados); Redes neurais: uma extenso da regresso (regresso generalizada), utilizando princpios da inteligncia artificial; Algoritmos genticos: so tcnicas de busca utilizadas na cincia da computao para achar solues aproximadas em problemas de otimizao e busca, sendo uma classe particular de algoritmos evolutivos que usam tcnicas inspiradas pela biologia evolutiva como hereditariedade, mutao, seleo natural e recombinao. Anlise de outliers Funcionalidade cujo objetivo encontrar conjuntos de dados que no obedecem ao comportamento ou modelo dos dados. Uma vez encontrados, podem ser tratados ou descartados para utilizao em mining. Um Data Warehouse, ou armazm de dados, ou ainda depsito de dados, um sistema de computao utilizado para armazenar informaes relativas s atividades de uma organizao em bancos de dados, de forma consolidada. O desenho da base de dados favorece os relatrios, a anlise de grandes volumes de dados e a obteno de informaes estratgicas que podem facilitar a tomada de deciso. O data warehouse possibilita a anlise de grandes volumes de dados, coletados dos sistemas transacionais (OLTP). So as chamadas sries histricas que possibilitam uma melhor anlise de eventos passados, oferecendo suporte s tomadas de decises presentes e a previso de eventos futuros. Por definio, os dados em um data warehouse no so volteis, ou seja, eles no mudam, salvo quando necessrio fazer correes de dados previamente carregados. Os dados esto disponveis somente para leitura e no podem ser alterados. A ferramenta mais popular para explorao de um data warehouse a Online Analytical Processing OLAP ou Processo Analtico em Tempo Real, mas muitas outras podem ser usadas. O Datawarehouse possui 4 caractersticas marcantes, que repetidamente so questes de concursos. Ento nos cabe discutir estas caractersticas: No-voltil: o Datawarehouse apenas recebe informaes. Excluses ou alteraes ocorrem apenas para a correo de dados inseridos com erro. Integrado: Um Datawarehouse deve ser integrado, ou seja, trabalha de forma a globalizar e aproveitar os termos e as estruturas tcnicas que so utilizados nos sistemas de informaes tradicionais. Por exemplo, na representao de sexo, um Datawarehouse utiliza todas as formas seguintes: m ou f, 0 ou 1, x ou y, macho ou fmea, homem ou mulher, dama ou cavalheiro.

Orientado por assuntos: Um Datawarehouse deve ser orientado aos principais assuntos ou negcios da empresa como, por exemplo, clientes, vendas e produtos. J os sistemas de informaes tradicionais so orientados a processos como, por exemplo, estoques, entradas e sadas de materiais. Variante no tempo: A variao em relao ao tempo consiste na manuteno de um histrico de dados em relao ao perodo de tempo maior que dos sistemas comuns, isto significa que as tcnicas de minerao de dados no so aplicadas em tempo real, de forma a no comprometer o desempenho dos bancos transacionais OLTP. Ao analisarmos um dado de um DW, o mesmo sempre estar relacionado a um perodo determinado de tempo, pois ter uma chave de tempo que ir indicar o dia no qual esses dados foram extrados. OLAP um software cuja tecnologia de construo permite aos analistas de negcios, gerentes e executivos analisar e visualizar dados corporativos de forma rpida, consistente e principalmente interativa. A funcionalidade OLAP inicialmente caracterizada pela anlise dinmica e multidimensional dos dados consolidados de uma organizao permitindo que as atividades do usurio final sejam tanto analticas quanto navegacionais. Esta tecnologia geralmente implementada em ambiente multiusurio e cliente/servidor, oferecendo assim respostas rpidas s consultas adhoc (construo de listagens, interligando a informao disponvel na base de dados conforme as necessidades especificas da empresa, assim como a sua exportao, possibilitando vrias simulaes), no importando o tamanho do banco de dados nem sua complexidade. Essa tecnologia auxilia o usurio a sintetizar informaes corporativas por meio de vises comparativas e personalizadas, anlises histricas, projees e elaboraes de cenrios. Drill Across: O Drill Across ocorre quando o usurio pula um nvel intermedirio dentro de uma mesma dimenso. Por exemplo: a dimenso tempo composta por ano, semestre, trimestre, ms e dia. O usurio estar executando um Drill Across quando ele passar de ano direto para trimestre ou ms, sem passar por semestre. Drill Down: O Drill Down ocorre quando o usurio aumenta o nvel de detalhe da informao, diminuindo o grau de granularidade, como passar de semestre para trimestre. Drill Up: O Drill Up o contrrio do Drill Down, ele ocorre quando o usurio aumenta o grau de granularidade, diminuindo o nvel de detalhamento da informao, como passar de ms para trimestre. Drill Throught: O Drill Throught ocorre quando o usurio passa de uma informao contida em uma dimenso para uma outra. Por exemplo: Estou na dimenso de tempo e no prximo passo comeo a analisar a informao por regio. Slice And Dice: O Slice and Dice uma das principais caractersticas de uma ferramenta OLAP. Como a ferramenta OLAP recupera o microcubo, surgiu a necessidade de criar um mdulo que se convencionou de Slice and Dice para ficar responsvel por trabalhar esta informao. Ele serve para modificar a posio de uma informao, alterar linhas por colunas de

maneira a facilitar a compreenso dos usurios e girar o cubo sempre que tiver necessidade. Cross-join: O Cross-join um recurso no qual dados so unidos e colunas e linhas so invertidas, permitindo uma melhor visualizao sob a tica do negcio. Por exemplo:

Pivot: O Pivot somente a rotao do cubo, sem a juno dos dados. No exemplo das bicicletas imagine que pode-se girar o cubo para visualizar as vendas por trimeste, ou por quantidades. semelhante ao Drill Throught, mas ocorre a rotao do cubo. Alertas: Os Alertas so utilizados para indicar situaes de destaque em elementos dos relatrios, baseados em condies envolvendo objetos e variveis. Servem para indicar valores mediante condies mas no para isolar dados pelas mesmas. Ranking: A opo de ranking permite agrupar resultados por ordem de maiores / menores, baseado em objetos numricos (Measures). Esta opo impacta somente uma tabela direcionada (relatrio) no afetando a pesquisa (Query). Filtros: Os dados selecionados por uma Query podem ser submetidos a condies para a leitura na fonte de dados. Os dados j recuperados pelo usurio podem ser novamente filtrados para facilitar anlises diretamente no documento. Sorts: Os sorts servem para ordenar uma informao. Esta ordenao pode ser customizada, crescente ou decrescente. Breaks: Os Breaks servem para separar o relatrio em grupos de informaes (blocos). Por exemplo: O usurio tem a necessidade de visualizar a informao por cidades, ento ele deve solicitar um Break. Aps esta ao ter sido executada, automaticamente o relatrio ser agrupado por cidades, somando os valores mensurveis por cidades.

Consultas Ad-Hoc: So consultas com acesso casual nico e tratamento dos dados segundo parmetros nunca antes utilizados, geralmente executado de forma iterativa e heurstica. Arquiteturas OLAP - A anlise multidimensional uma das grandes utilidades da tecnologia OLAP, consistindo em ver determinados cubos de informaes de diferentes ngulos e de vrios nveis de agregao. Os cubos so massas de dados que retornam das consultas feitas ao banco de dados e podem ser manipulados e visualizados por inmeros ngulos e diferentes nveis de agregao. Conforme o mtodo de armazenamento de dados utilizado para uma aplicao OLAP, ser elaborada a arquitetura da aplicao. Os mtodos de armazenamento de dados, so MOLAP, ROLAP, DOLAP e HOLAP. Cada um deles tem uma funo especfica e deve ser utilizada quando melhor atender s necessidades de anlise pela ferramenta de OLAP. No MOLAP (Multidimensional On-Line Analytical Processing) os dados so armazenados de forma multidimensional, sua implementao varia de acordo com a sua ferramenta de OLAP, mas frequentemente implementado em um banco de dados relacional, porm no na terceira forma normal. Alm disto o acesso aos dados ocorre diretamente no banco de dados do servidor multidimensional. Os gerenciadores de banco de dados tm um limite prtico quanto ao tamanho fsico de dados que eles podem manipular. As restries de armazenamento e desempenho limitaro o tamanho do banco de dados, no esquecendo o limite das dimenses que tambm restringem sua manipulao. A complexidade que existe no processo de carga de um banco de dados multidimensional, pode acarretar a demora no processo. O processo de carga complexo devido a srie de clculos que devem ser realizados para agregar os dados s dimenses e preencher as estruturas do banco. Depois do processo concludo, ainda realizado uma srie de mecanismos para melhorar a capacidade de pesquisa. J no ROLAP (Relational On-Line Analytical Processing) os dados so armazenados no modelo relacional como tambm suas consultas so processadas pelo gerenciador do banco relacional. Por outro lado, o DOLAP (Desktop On-Line Analytical Processing) uma variao que existe para fornecer portabilidade dos dados. A vantagem que oferece esta arquitetura a reduo do trfico na rede. A arquitetura mais recente a HOLAP (Hybrid On-Line Analytical Processing), na qual ocorre uma combinao entre ROLAP e MOLAP. A vantagem que com a mistura de tecnologias pode-se extrair o que h de melhor de cada uma, a alta performance do MOLAP e a escalabilidade do ROLAP.

Aproveitemos para falarmos um pouco sobre dois tipos de modelagem multidimensional: os modelos estrela e snowflake. O Modelo Estrela (Star Schema) No modelo estrela todas as tabelas relacionam-se diretamente com a tabela de fatos. Sendo assim, as tabelas dimensionais devem conter todas as descries que so necessrias para definir uma classe como Produto, Tempo ou Loja nela mesma (veja exemplo na figura abaixo). Em suma, as tabelas de dimenses so desnormalizadas no modelo estrela. Por consequncia, deteminados campos como Categoria, Departamento, Marca contero suas descries repetidas em cada registro, assim, aumentando o tamanho das tabelas de dimenso por repetirem estas descries de forma textual em todos os registros.

O Modelo Floco de Neve (Snow Flake) No modelo Floco as tabelas dimensionais relacionam-se com a tabela de fatos, mas algumas dimenses relacionam-se apenas entre elas. Isto ocorre para fins de normalizao das tabelas dimensionais, visando diminuir o espao ocupado por estas tabelas. Informaes como Categoria, Departamento e Marca tornar-se-o, no exemplo, tabelas de dimenses auxiliares.

No modelo Floco existem tabelas de dimenses auxiliares que normalizam as tabelas de dimenses principais. Na figura anterior, Ano, Ms e Dia so tabelas que normalizam a Dimenso Tempo, ao passo que Categoria, Departamento e Marca normalizam a Dimenso Produto e a tabela Meio normaliza a Dimenso Promoo. Construindo a base de dados desta forma, passamos a utilizar mais tabelas para representar as mesmas dimenses, mas ocupando um espao em disco menor do que o modelo estrela. Este modelo chama-se floco de neve, pois cada dimenso se divide em vaias outras tabelas, onde organizadas de certa forma lembra um floco de neve.
rof. Victor Dalton www.estrategiaconcursos.com.br 70 de 98

para fins de normalizao das tabelas dimensionais, visando diminuir o espao ocupado por estas tabelas. Informaes como Categoria, Departamento e Marca tornar-se-o, no exemplo, tabelas de dimenses auxiliares. No modelo Floco existem tabelas de dimenses auxiliares que normalizam as tabelas de dimenses principais. Na figura anterior, Ano, Ms e Dia so tabelas que normalizam a Dimenso Tempo, ao passo que Categoria, Departamento e Marca normalizam a Dimenso Produto e a tabela Meio normaliza a Dimenso Promoo. Construindo a base de dados desta forma, passamos a utilizar mais tabelas para representar as mesmas dimenses, mas ocupando um espao em disco menor do que o modelo estrela. Este modelo chama-se floco de neve, pois cada dimenso se divide em vaias outras tabelas, onde organizadas de certa forma lembra um floco de neve. Consideraes O Modelo Floco (Snow Flake) reduz o espao de armazenamento dos dados dimensionais mas acrescenta vrias tabelas ao modelo, deixando-o mais complexo, tornando mais difcil a navegao pelos softwares que utilizaro o banco de dados. Um outro fator que mais tabelas sero utilizadas para executar uma consulta, ento mais JOINS de instruo SQL sero feitos, tornando o acesso aos dados mais lento do que no modelo estrela. O Modelo Estrela (Star Schema) mais simples e mais fcil de navegao pelos softwares, porm desperdia espao repetindo as mesmas descries ao longo de toda a tabela. Porm, anlises mostram que o ganho de espao normalizando este esquema resulta em um ganho inferior a 1% do espao total no banco de dados. Isto posto, cabe analisar outros fatores mais importantes para serem avaliados para reduo do espao em disco, como a adio de agregados e alterao na granularidade dos dados, por exemplo.

ETL (extrao, transformao e carga dos dados)

O Departamento de Informtica do BACEN realiza muito ETL. Na prtica, so ferramentas de software cuja funo a extrao de dados de diversos sistemas, transformao desses dados conforme regras de negcios e por fim a carga dos dados em um Data Mart ou um Data Warehouse. A extrao e carga so obrigatrias para o processo, sendo a transformao/limpeza opcional. considerada uma das fases mais crticas do Data Warehouse e/ou Data Mart. Os projetos de data warehouse consolidam dados de diferentes fontes. A maioria dessas fontes tendem a ser bancos de dados relacionais ou arquivo de texto (texto plano), mas podem existir outras fontes. Um sistema ETL tem que ser capaz de se comunicar com as bases de dados e ler diversos formatos de arquivos utilizados por toda a organizao. Essa pode ser uma tarefa no trivial, e muitas fontes de dados podem no ser acessadas com facilidade.

Extrao A primeira parte do processo de ETL a extrao de dados dos sistemas de origem. Esses sistemas de origem podem ser: sistemas legados, bancos de daods em diferentes formatos (Oracle, DB2, Sql Server), outros sistemas corporativos, informaes pblicas disponveis em sites web, dentre outros. Cada sistema pode tambm utilizar um formato ou organizao de dados diferente. Formatos de dados comuns so bases de dados relacionais e flat files (tambm conhecidos como arquivos planos), mas podem incluir estruturas de bases de dados no relacionais, como o IMS ou outras estruturas de dados, como VSAM ou ISAM. A extrao converte para um determinado formato para a entrada no processamento da transformao. Transformao O estgio de transformao aplica uma srie de regras ou funes aos dados extrados para derivar os dados a serem carregados. Algumas fontes de dados necessitaro de muito pouca manipulao de dados. Em outros casos, podem ser necessrios um ou mais de um dos seguintes tipos de transformao: seleo de nenhuma coluna para no carregar); 1 para sexo masculino e 2 para feminino, mas o data warehouse armazena M para masculino e F para feminino, por exemplo), o que conhecido como limpeza de dados; Sr. para M, por exemplo);


Derivao de um novo valor calculado (montante_vendas = qtde * preo_unitrio, por exemplo);

e para cada regio, por exemplo); o de valores de chaves substitutas (surrogate keys); mltiplas linhas ou vice-versa); colocando uma lista separada por vrgulas e especificada como uma cadeia em uma coluna com valores individuais em diferentes colunas). Carga A fase de carga carrega os dados no Data Warehouse. Dependendo das necessidades da organizao, este processo varia amplamente. Alguns data warehouses podem substituir as informaes existentes semanalmente, com dados cumulativos e atualizados, ao passo que outro DW (ou at mesmo outras partes do mesmo DW, conhecidos como Data Marts) podem adicionar dados a cada hora. A temporizao e o alcance de reposio ou acrscimo constituem opes de projeto estratgicas que dependem do tempo disponvel e das necessidades de negcios. Sistemas mais complexos podem manter um histrico e uma pista de auditoria de todas as mudanas sofridas pelos dados. Repetidores Como o nome diz, apenas repetem o sinal que recebem, servindo para leva-los a locais que o sinal no chegaria sem a utilizao deste tipo de equipamento. Operam na camada 1 do modelo OSI. Hubs antes dos roteadores domsticos, eram utilizados hubs. O hub um repetidor local, sem amplificao do sinal (camada 1 do OSI). Cabia s camadas superiores filtrar os dados recebidos para identificar a qual mquina conectada ao hub a informao pertencia. Tpica utilizao em redes do tipo estrela. Pontes as bridges operam na camada 2 do modelo OSI. Basicamente, elas poderiam conectar duas ou mais LANs, e serem configuradas para deixar ou no o sinal passar ao outro lado da ponte, analisando o endereo de destino do quadro (frame). Switches tambm operante no nvel 2 do modelo OSI. Entretanto, enquanto as pontes separam duas redes, o switch pode ser utilizado para redes estrela, direcionando ativamente o quadro para o endereo de destino(o que requer um buffer para evitar perda de informao). Roteador opera no nvel 3 do modelo OSI. capaz de analisar o cabealho do pacote, e, segundo seus algoritmos, escolhe a rota mais adequada para encaminh-lo.

O modelo do Fibre Channel tambm possui possui sua arquitetura dividida em camadas. Isto permite o desenvolvimento de uma camada de forma independente das camadas adjacentes. A estrutura das camadas pode ser observada na figura abaixo:

As camadas do Fibre Channel podem ser categorizadas em dois grupos: Camadas fsicas e de rede e Camadas superiores. Fsicas e de Rede Estas camadas incluem as trs camadas mais baixas: FC-0, FC-1, e FC-2. FC-0 - Camada Fsica Esta a camada mais baixa. Sua funo definir a conexo fsica do sistema para a transferncia de dados, incluindo cabos, conectores e parmetros pticos e eltricos para o sistema em uma alta taxa. Este nvel projetado para oferecer flexibilidade e permitir um grande nmero de tecnologias de acordo com as necessidades de configurao. Uma rota de comunicao entre dois ns pode estabelecer conexes com diferentes tecnologias. FC-1 Protocolo de Transmisso nesta camada que se d a codificao e decodificao dos dados e o controle de erros. Esta camada tambm utilizada para integrar os dados com o clock do sistema, fundamental a tecnologias seriais. FC-2 Camada de Rede Esta camada define como os blocos de dados enviados dos aplicativos de nvel superior sero segmentados em uma seqncia de quadros para serem repassados para a camada de transporte, independentemente das camadas superiores. A camada FC-2 tem capacidade de auto-configurao e suporta ambientes ponto-a-ponto, de lao arbitrado e switched.

A Camada de Rede tambm responsvel por fornecer os mtodos que iro determinar: fabrics fabrics e pelos ns fabric geral

Os dados so transmitidos em ordered sets de quatro bytes, contendo os caracteres de controle e os dados. Atravs dos ordered sets de dados possvel realizar a sincronizao, que tambm estabelece a fronteira do alinhamento. Camadas Superiores As camadas superiores incluem as camadas: FC-3 e FC-4. FC-3 Servios Comuns Esta camada define funes auxiliares, que podem afetar mltiplas portas em um nico n ou em um fabric. As funes suportadas geralmente incluem: Hunt Groups: Esta funo tem por objetivo diminuir a latncia do sistema. Para isso, a cada n atribudo um hunt group. Um hunt group um conjunto de N_Portas conectadas a um nico n. A este conjunto atribudo um identificador, cujo propsito permitir que frames que contenham o identificador sejam redirecionados para qualquer N_Porta disponvel do conjunto. Striping: Utiliza N_Portas em paralelo para transmitir uma informao atravs de diversas conexes, aumentando, consequentemente, a largura de banda. Multicast: Realiza a transmisso para vrias portas de destino. Tambm inclui a habilidade de transmitir em broadcast para todos os ns ou subconjunto de ns. FC-4 Camada Superior (Mapeamento ULP) A camada mais alta, a FC-4, tem por objetivo implementar protocolos especficos para a aplicao. Atravs de regras de mapeamento, esta camada especifica como processos ULP (Upper Layer Protocol) da mesma camada operam entre si. O Fibre Channel permite tanto o transporte de protocolos de rede quanto de canal atravs da mesma interface. Um exemplo de protocolo de canal o Fibre Channel Protocol (FCP). Ele utilizado para transferncia de dados SCSI por meio do Fibre Channel. Um exemplo de protocolo de rede o envio de pacotes IP (Internet Protocol) atravs dos ns.

Perceba, ainda, que existe um mapeamento entre o modelo Fibre Channel e o modelo OSI, a saber:

O modelo ATM uma tipologia de rede orientada a conexes, baseada em circuitos virtuais.

O ATM pode ser considerado como sendo uma integrao das tcnicas de comutao por pacotes e por circuitos. Como o ATM utiliza clulas como unidade bsica de transmisso, ele possui uma estreita ligao com os modos de transmisso por pacotes, porm com uma diferena muito importante: a transmisso por pacotes foi criada basicamente para dar suporte a servios de taxas variveis em tempo no-real, enquanto o ATM pode suportar servios em tempo real e de taxa constante.

Em uma transmisso ATM, a informao do usurio mapeada nas clulas, que so assincronamente multiplexadas e transmitidas. Essas clulas so transmitidas atravs de canais virtuais estabelecidos na rede. Quando um canal virtual estabelecido, criado um identificador de canal virtual, que aps a desconexo do canal removido. A ordem das clulas dentro dos canais mantida pela camada ATM e os mais diversos tipos de servios possuem o mesmo tipo de clula, estando a diferena apenas na quantidade destas. Quanto aos servio em tempo real, eles so garantidos devido transmisso das clulas atravs dos canais virtuais. Este modelo composto por trs planos: plano do usurio, plano de controle e plano de gerenciamento, conforme a figura acima. O plano do usurio responsvel pela transferncia de informaes do usurio e do controle associado a esta transferncia, tais como controle de fluxo e recuperao de erros. O plano de controle responsvel pelo controle da chamada e pelas funes de controle das conexes. Ele cuida de toda a sinalizao referente ao estabelecimento, superviso e liberao de chamadas e conexes. O plano de gerenciamento possui funes de dois tipos: gerenciamento de planos e gerenciamento de camadas. O gerenciamento de planos utilizado para o gerenciamento e coordenao dos planos do usurio, de controle e do prprio plano de gerenciamento, como um todo. Quanto s camadas, temos que: A camada fsica trata do meio fsico: voltagens, sincronizao de bits, etc.. A camada ATM lida com clulas e o transporte de clulas, definindo o layout de uma clula e revelando os campos do cabealho. E a camada de adaptao ATM possui como finalidade permitir aos usurios enviarem pacotes maiores do que uma clula, segmentando esses pacotes, transmitindo as clulas individualmente e as remontando em outra extremidade. UDP - User Datagram Protocol

Pertence camada de transporte (mesma do TCP);

adequado para streaming (envio de udio e vdeo em tempo real). Youtube, Skype, j reparou que os vdeos possuem pequenas imperfeies e, quando a rede lenta, a imagem pula e o som corta? UDP! Network Address Translation, ou NAT, uma tcnica que consiste em reescrever os endereos IP de origem de um pacote que passam por um roteador ou firewall de maneira que um computador de uma rede interna tenha acesso externo rede, com um endereo IP distinto do endereo

utilizado dentro da rede (normalmente, o endereo IP do gateway o endereo de todas as mquinas internas rede). Quem utiliza uma rede domstica com roteador, ou utiliza uma mquina no trabalho com acesso web, j deve ter notado que o endereo IP d mquina da rede diferente do endereo IP aos olhos da Internet. Para as redes classe A, o intervalo reservado o 10.0.0.0/8. Na B, 172.16.0.0/12. Nas redes classe C (tpico das redes domsticas), temos o intervalo 192.168.0.0/16. O DNS (Domain Name System - Sistema de Nomes de Domnios) um sistema de gerenciamento de nomes hierrquico e distribudo operando segundo duas definies:

O servidor DNS traduz nomes para os endereos IP e endereos IP para nomes respectivos, e permitindo a localizao de hosts em um domnio determinado.Este tipo de servidor usa como porta padro a 53. O servidor DNS secundrio uma espcie de cpia de segurana do servidor DNS primrio. Na prtica, ao digitar www.globo.com, por exemplo, o servidor DNS transforma a sua consulta semntica em um endereo IP, e redireciona seu navegador para uma mquina nesse endereo IP. Sem o DNS, voc teria que sair por a decorando os endereos IP dos sites que gosta de visitar, e o pior, quando seus provedores modificassem seus IPs, teriam que dar um jeito de sair avisando pela Internet. Invivel, n? Uma mensagem DNS (12 bytes) possui o seguinte formato: Identificao: numera a mensagem DNS. Parmetro: identifica o tipo de mensagem, especificando a operao solicitada e um cdigo de resposta. Perguntas: contm as consultas para as quais so desejadas respostas (converses de nomes em endereos IP). Respostas: contm as respostas (converses). Autoridade: registros de recursos da autoridade da mensagem DNS. Informaes Adicionais: informaes adicionais da mensagem DNS.

Vejamos alguns protocolos para envio e recebimento de emails. Simple Mail Transfer Protocol (SMTP) um protocolo para envio de e-mails por meio de redes IP. Utiliza a porta TCP 25. Post Office Protocol (POP3) um protocolo utilizado no acesso remoto a uma caixa de correio eletrnico. Permite que todas as mensagens contidas numa caixa de correio eletrnico possam ser transferidas sequencialmente para um computador local. Dessa maneira, o utilizador pode ler as mensagens recebidas, apaglas, responder-lhes, armazen-las, etc. Utiliza a porta TCP 110. O funcionamento do protocolo POP3 diz-se off-line, uma vez que o processo suportado se baseia nas seguintes etapas: icao cliente de e-mail (User Agent - UA) e o servidor onde est a caixa de correio (Message Transfer Agent - MTA) -se; sequencialmente para o computador local;

protocolo pode ser configurado para que as mensagens no sejam apagadas da caixa de correio; se esta opo no for utilizada, deve-se utilizar sempre o mesmo computador para ler o correio eletrnico, para poder manter um arquivo das mensagens); -line). A caracterstica off-line do protocolo POP3 era particularmente til para utilizadores que se ligam Internet atravs de redes pblicas comutadas, em que o custo da ligao proporcional ao tempo de ligao (ex: a rede telefnica convencional ou a rede RDIS). Com o POP3, a ligao apenas precisa de estar ativa durante a transferncia das mensagens, e a leitura e processamento das mensagens pode depois ser efetuada com a ligao inativa. Com o advento do IMAP, o POP3 vem perdendo espao. Internet Message Access Protocol (IMAP) - um protocolo de gerenciamento de correio eletrnico superior em recursos ao POP3 protocolo que a maioria dos provedores oferece aos seus assinantes. A ltima verso o IMAP4. O mais interessante que as mensagens ficam armazenadas no servidor e o utilizador pode ter acesso a suas pastas e mensagens em qualquer computador, tanto por webmail como por cliente de correio eletrnico (como o Mozilla Thunderbird, Outlook Express ou o Evolution). Outra vantagem deste protocolo o compartilhamento de caixas postais entre usurios membros de um grupo de trabalho. Alm disso, possvel efetuar pesquisas por mensagens diretamente no servidor, utilizando palavras-chaves. Utiliza a porta TCP 143. Tem, no entanto, alguns inconvenientes: limite que nos atribudo para a caixa de correio; no numa rede local LAN, necessrio estar ligado Internet todo o tempo que quisermos consultar ou enviar mensagens. No entanto, a maioria dos clientes de e-mail (e.g. Outlook Express, Thunderbird, Novell Evolution, etc.) oferecem a possibilidade de criar uma cpia local (offline) das mensagens contidas em uma ou vrias pastas. Sendo assim, toda vez que voc dispuser de uma conexo (estiver online) sua cpia local ser sincronizada com o servidor de e-mail. Existem tambm algumas outras vantagens, como por exemplo: Ativar e desativar "flags" (marcaes que indicam caractersticas de uma mensagem), que podem, inclusive, ser definidas pelo usurio. Com o POP3, estas marcaes so registradas pelo cliente, de forma que, se a mensagem for aberta por um segundo cliente, as mesmas podem no ter seu "status" indicado corretamente. O IMAP permite a gravao das "flags" junto s caixas-postais, assegurando que, independente de qual cliente se acesse, as mensagens tero as mesmas corretamente atribudas. Capacidade de reconhecer os padres de mensagens eletrnicas [RFC 822] e MIME-IMB [RFC 2045] em mensagens eletrnicas, de modo que os clientes de e-mail no o necessitem fazer. O servidor IMAP cumpre a tarefa de interpretar estes padres, tornando os clientes mais fceis de implementar e o acesso mais "universal"; Pesquisa de texto em mensagens de forma remota. Este

modo de trabalho feito localmente s caixas-postais; A seleo para recebimento dos atributos de uma mensagem, ou seu texto ou anexos e outras partes ("attachments") podem ser feitos de forma independente. Ento, o usurio pode pedir para receber de uma mensagem com um grande "attachment", apenas a parte do texto que lhe interessa, o que vantajoso no caso de um acesso discado de baixa qualidade e a reduo do trfego em geral.

H.323
O padro H.323 parte da famlia de recomendaes ITU-T (International Telecommunication Union Telecommunication Standardization sector) H.32x, que pertence a srie H da ITU-T, e que trata de "Sistemas Audiovisuais e Multimdia". A recomendao H.323 tem o objetivo de especificar sistemas de comunicao multimdia em redes baseadas em pacotes e que no proveem uma Qualidade de Servio (QoS) garantida. Alm disso, estabelece padres para codificao e decodificao de fluxos de dados de udio e vdeo, garantindo que produtos baseados no padro H.323 de um fabricante interopere com produtos H.323 de outros fabricantes. Redes baseadas em pacotes incluem as redes IP (Internet Protocol) como a Internet, redes IPX (Internet Packet Exchange), as redes metropolitanas, as redes de longa distncia (WAN) e ainda conexes discadas usando PPP. O padro H.323 completamente independente dos aspectos relacionados rede. Dessa forma, podem ser utilizadas quaisquer tecnologias de enlace, podendo-se escolher livremente entre as que dominam o mercado atual como Ethernet, Fast Ethernet, FDDI, ou Token Ring. Tambm no h restries quanto topologia da rede, que pode consistir tanto de uma nica ligao ponto a ponto, ou de um nico segmento de rede, ou ainda serem complexas, incorporando vrios segmentos de redes interconectados.

O padro H.323 especifica o uso de udio, vdeo e dados em comunicaes multimdia, sendo que apenas o suporte mdia de udio obrigatrio. Mesmo sendo somente o udio obrigatrio, cada mdia (udio, vdeo e/ou dados), quando utilizada, deve seguir as especificaes do padro. Pode-se ter uma variedade de formas de comunicao, envolvendo udio apenas

(telefonia IP, VoIP), udio e vdeo (videoconferncia), udio e dados e, por fim, udio, vdeo e dados. Benefcios da adoo do padro H.323 A adoo do padro H.323 para aplicaes multimdia em redes traz uma srie de benefcios, entre os quais podemos citar: Independncia da rede O padro H.323 projetado para utilizao em redes baseada em pacotes, como as redes IP. Na atualidade, a maioria das redes utilizadas hoje possui uma infraestrutura com protocolo de transporte baseado em pacotes, assim, a adoo do padro H.323 permite a utilizao de aplicaes multimdia sem requerer mudanas na estrutura de redes. Por outro lado, medida que as tecnologias de enlace de redes evoluem e proporcionam maiores limites de velocidade e largura de banda, seus benefcios sero imediatamente incorporados e usufrudos pelas aplicaes H.323. Interoperabilidade de equipamentos e aplicaes O H.323 permite interoperabilidade entre dispositivos e aplicaes de fabricantes. Por isso, vrios fornecedores de porte como Intel, Microsoft, Cisco e IBM investem em linhas de produtos H.323. Independncia de plataforma O H.323 no determina o hardware ou sistema operacional a ser usado. Desse modo, as aplicaes H.323 podem ser de naturezas diversas voltadas para mercados especficos, que vo desde software de videoconferncia executado em PCs, a telefones IP, adaptadores para TV a cabo, sistemas dedicados, etc. Representao padronizada de mdia O H.323 estabelece codificadores para compresso e descompresso de sinais de udio e vdeo. Ele tambm prev mecanismos de negociao dos codificadores a serem utilizados numa conferncia a fim de que os seus participantes encontrem um subconjunto comum entre si. Flexibilidade nas aplicaes clientes Uma conferncia H.323 pode envolver aplicaes clientes com capacitaes multimdia diferentes. possvel que um terminal com suporte apenas para udio participe de uma conferncia com terminais que tenham suporte adicional de vdeo e/ou dados. Interoperabilidade entre redes possvel estabelecer conferncias entre participantes localizados numa LAN e em outras redes completamente diferentes, como a rede telefnica pblica ou ISDN. O H.323 prev o uso de codificadores que so comuns a

vrios tipos de redes. Isto possvel atravs da utilizao do componente gateway. Suporte a gerenciamento de largura de banda O trfego dos fluxos de vdeo e udio caracteristicamente consumidor de largura de banda em uma rede. O padro prov mecanismos de gerenciamento que permitem delimitar a quantidade de conferncias simultneas e a quantidade de largura de banda destinada s aplicaes H.323. Alm do mais, o H.323 tambm prev facilidade de contabilidade de uso dos recursos da rede que podem ser usadas para fins de cobrana. Isto possvel atravs da utilizao do componente gatekeeper. Suporte a conferncias multiponto O H.323 suporta conferncias com trs ou mais participantes simultneos. Suporte a multicast O H.323 suporta tcnicas de multicast nas conferncias multiponto. Uma mensagem multicast envia um nico pacote a todo um subconjunto de destinatrios na rede sem replicao. Esse tipo de transmisso usa a largura de banda de uma forma muito mais eficiente que as transmisses unicast. Componentes H.323 O padro H.323 especifica quatro tipos de componentes que, juntos, possibilitam a comunicao multimdia. So eles: Terminais So os computadores pessoais utilizados na rede, a qual prov comunicao em tempo real. Todos os terminais devem suportar voz. O suporte vdeo e dados opcional. Gateways So elementos opcionais em conferncias H.323, que tm como funo prover a comunicao de terminais H.323 com outros terminais de padres diferentes (H.310, H.321, H.322). Gatekeepers Componentes mais importantes. Atuam como ponto central para todas as chamadas dentro de sua zona (Zona oconjunto de todos terminais, gateways e MCUs gerenciados por um nico gatekeeper. Uma zona deve incluir, pelo menos, um terminal e pode incluir segmentos de LAN conectados usando roteadores) e provem servios de controle de chamada para registrar participantes. Dentre outras coisas, so tambm responsveis pelo gerenciamento da largura de banda em conferncias H.323.

Multipoint Control Units (MCUs) Suporta conferncias entre trs ou mais participantes. Sob H.323, um MCU consiste de um Multipoint Controller (MC) e zero ou mais Multipoint Processors (MP). O MC manipula as negociaes entre todos os terminais para determinar capacidades comuns para processamento de udio e vdeo. J o MP o responsvel por mesclar, chavear e processar os bits de udio, vdeo e/ou dados. Um sistema que utiliza o padro H.323 e as recomendaes ITU-T associadas prov uma forma til e flexvel para comunicao multimdia, e o fato de ser executado sobre diversas plataformas o torna escalvel. As recomendaes relacionadas ao padro H.323 continuam a evoluir e a serem adaptadas a novas situaes atravs de um esforo contnuo do grupo de estudo da ITU-T [6]. Muitas dificuldades que surgem na utilizao do H.323 so decorrentes de outros problemas relacionados, como por exemplo, a garantia de qualidade de servio durante toda a sesso.

Vous aimerez peut-être aussi