Vous êtes sur la page 1sur 4

Conjunto de Caracteres e Tipo de Conteúdo

Marcos Vinicius Balsamo


Universidade Tecnológica Federal do Paraná –
Medianeira (UTFPR-MD)

Avenida Brasil, nº 4232 - CEP 85.884-000 - CP 271–Medianeira – PR – Brasil

marcosbalsamo@msn.com

Resumo. Este artigo apresenta tipo de conteúdo e conjunto de caracteres


representados em documentos HTML com foco para aplicações WEB.

1. Introdução

O HTML possui elementos que ajudam na interação entre o usuário e o website no


que diz respeito a apresentação e interação seguindo um modelo padrão de
representação definido pelo W3C.
O W3C desenvolve especificações técnicas e orientações através de um processo
projetado para maximizar a consenso sobre as recomendações, garantindo qualidades
técnicas e editoriais, além de transparentemente alcançar apoio da comunidade de
desenvolvedores, do consórcio e do público em geral (Consórcio World Wide Web).
O objetivo principal deste artigo é apresentar o contexto da codificação de caracteres
e o tipo de conteúdo.

2. Conjunto de Caracteres

Um conjunto de caracteres é um conjunto de simbolos e códigos.Existe diversos


tipos, por exemplo o ISO-8859-1 é a codificação de caracteres do alfabeto latino o
ASCII abrange letras e símbolos para texto no idioma inglês e o UTF-8 pode representar
qualquer caractere universal padrão do Unicode este responsável por permitir que aos
computadores representar e manipular, de forma consistente, textos de qualquer sistema
de existente, sendo também compatível com o ASCII. Por esta razão, está lentamente a
ser adotado como tipo de codificação padrão para email, páginas web, e outros locais
onde os caracteres são armazenados.
Os caracteres em um conjunto são armazenados como um ou mais bytes em um
computador onde cada byte ou seqüência de bytes representa um determinado caractere.
Existe muitas codificações de caracteres diferentes. Se a codificação errada for aplicada
aos bytes na memória, o resultado será um texto ilegível.
Os atributos e os parâmetros referentes à codificação dos caracteres partilham entre
si o mesmo nome denominado charset este identifica o tipo de codificação usado no
documento, a qual consiste na conversão da seqüência de bytes numa seqüência de
caracteres.
Os nomes atribuídos à codificação dos caracteres não são um caso sensível não se
faz distinção entre maiúsculas e minúsculas.Esta especificação não impõe o tipo de
codificação de caracteres a ser aplicado e suportado pelo agente ou meio usado pelo
usuário.
3. Tipo de Conteúdo

A forma que alguns servidores identificam a codificação de caracteres aplicado num


documento é o exame dos primeiros “bytes” do documento ou comparam à base de
dados e aos outros ficheiros e codificações já existentes.
A forma mais direita para informar a identificação da codificação de caracteres e
através do parâmetro charset situado no cabeçalho Content-Type na zona de protocolo
HTTP demonstrado na Tabela 1.

Tabela 1

Content-Type:text/html; charset=ISO-8859-1

Sempre que o parâmetro charset não esteja definido na zona do cabeçalho referente
ao Content-Type (tipo de conteúdo) lembrando que alguns servidores não permitem que
o parâmetro charset seja enviado e outros ainda não podem ser configurados para esse
fim. Por isso mesmo, os meios ou agentes utilizados pelos usuários não terão
obrigatoriamente de assumir um valor padrão para o parâmetro charset.
A fim de referenciar as limitações verificadas no servidor ou relacionadas com a
configuração, os documentos HTML poderão incluir informação explícita, referente ao
tipo de codificação dos caracteres, o elemento META poderá ser usado para fornecer as
referidas informações aos meios ou agentes utilizados pelos usuários.
Por Exemplo para especificar que a codificação dos caracteres no atual documento é
do tipo ISO-8859-1, o documento deverá incluir a seguinte declaração demonstrada na
Tabela 2 .

Tabela 2

<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">

A declaração META deverá ser apenas utilizada, quando a codificação dos


caracteres estiver de tal forma organizada que os bytes com um valor ASCII
representem caracteres ASCII no mínimo até que o elemento META seja processado. As
declarações do elemento deverão aparecer definidas proximo possível do elemento
HEAD como demonstrado Tabela 3.

Tabela 3

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">

Nas situações que nem o protocolo HTTP nem o elemento META forneçam a
informação necessária acerca do tipo de codificação dos caracteres utilizado no referido
documento, o HTML fornece ainda o atributo charset através de vários elementos.
Através da combinação desses mecanismos, o desenvolvedor poderá aumentar a
probabilidade de sempre que o usuário recuperar um recurso, o agente ou meio por ele
utilizado reconhecer o tipo de codificação que foi aplicada aos caracteres.
Para que os meios ou agentes usados pelos usuário estejam em conformidade
deverão obedecer às seguintes prioridades, ao determinar-se o tipo de codificação dos
caracteres utilizados no documento,demonstrado em ordem decrescente a seguir Tabela
4.

Tabela 4

1. Um parâmetro charset HTTP contido no campo Content-Type


2. Uma declaração do elemento META com http-equiv a indicar Content-Type e
com um valor atribuído para charset.

3. O atributo charset aplicado a um elemento que defina um recurso externo.

Além disso, esses meios ou agentes utilizados pelos usuários dispõem


geralmente de configurações personalizadas para a codificação de caracteres, a qual
poderá ser aplicada no caso de haver uma ausência de outros isso no próprio agente e
totalmente customizavel.
Referencias Bibliográficas

O Protocolo HTTP Disponível em:


<http://www.oficinadanet.com.br/artigo/459/o_protocolo_http > Acesso em 31/05/2011.

Codificação de Caracteres. Disponível em: <http://www.w3.org/International/O-


charset> Acesso em 31/05/2011.

Introdução a Conjuntos de Caracteres e Codificações. Disponível em:


<http://www.w3.org/International/getting-started/characters> Acesso em 31/05/2011.

Codificação de Caracteres para iniciantes. Disponível em:


<http://www.w3.org/International/questions/qa-what-is-encoding> Acesso em
31/05/2011.

Capítulo 9. Conjunto de Caracteres Nacionais e Unicode Disponível em:


<http://gmedeiros.net/refman-4.1-pt.html-chapter/charset.html> Acesso em 31/05/2011.

WIPEDIA, ISO 8859-1 Disponível em: < http://pt.wikipedia.org/wiki/ISO_8859-1>


Acesso em 31/05/2011

WIPEDIA, Unicode Disponível em: http://pt.wikipedia.org/wiki/Unicode> Acesso em


31/05/2011

Vous aimerez peut-être aussi