Académique Documents
Professionnel Documents
Culture Documents
ASCII (acrnimo ingls de American Standard Code for Information Interchange Cdigo Estndar Estadounidense para el Intercambio de Informacin), pronunciado generalmente [ski] o [sci] , es un cdigo de caracteres basado en el alfabeto latino, tal como se usa en ingls moderno y en otras lenguas occidentales. Fue creado en 1963 por el Comit Estadounidense de Estndares (ASA, conocido desde 1969 como el Instituto Estadounidense de Estndares Nacionales, o ANSI) como una refundicin o evolucin de los conjuntos de cdigos utilizados entonces en telegrafa. Ms tarde, en 1967, se incluyeron las minsculas, y se redefinieron algunos cdigos de control para formar el cdigo conocido como US-ASCII. El cdigo ASCII utiliza 7 bits para representar los caracteres, aunque inicialmente empleaba un bit adicional (bit de paridad) que se usaba para detectar errores en la transmisin. A menudo se llama incorrectamente ASCII a otros cdigos de caracteres de 8 bits, como el estndar ISO-8859-1 que es una extensin que utiliza 8 bits para proporcionar caracteres adicionales usados en idiomas distintos al ingls, como el espaol. ASCII fue publicado como estndar por primera vez en 1967 y fue actualizado por ltima vez en 1986. En la actualidad define cdigos para 33 caracteres no imprimibles, de los cuales la mayora son caracteres de control obsoletos que tienen efecto sobre cmo se procesa el texto, ms otros 95 caracteres imprimibles que les siguen en la numeracin (empezando por el carcter espacio). Casi todos los sistemas informticos actuales utilizan el cdigo ASCII o una extensin compatible para representar textos y para el control de dispositivos que manejan texto como el teclado. No deben confundirse los cdigos ALT+nmero de teclado con los cdigos ASCII.
Vista general
Las computadoras solamente entienden nmeros. El cdigo ASCII es una representacin numrica de un carcter como a o @.
1
Como otros cdigos de formato de representacin de caracteres, el ASCII es un mtodo para una correspondencia entre cadenas de bits y una serie de smbolos (alfanumricos y otros), permitiendo de esta forma la comunicacin entre dispositivos digitales as como su procesado y almacenamiento. El cdigo de caracteres ASCII o una extensin compatible (ver ms abajo) se usa casi en todos los ordenadores, especialmente con ordenadores personales y estaciones de trabajo. El nombre ms apropiado para este cdigo de caracteres es "US-ASCII".
3 2
ASCII es, en sentido estricto, un cdigo de siete bits, lo que significa que usa cadenas de bits
`abcdefghijklmnopqrstuvwxyz{|}~
representables con siete dgitos binarios (que van de 0 a 127 en base decimal) para representar informacin de caracteres. En el momento en el que se introdujo el cdigo ASCII muchos ordenadores trabajaban con grupos de ocho bits (bytes u octetos), como la unidad mnima de informacin; donde el octavo bit se usaba habitualmente como bit de paridad con funciones de control de errores en lneas de comunicacin u otras funciones especficas del dispositivo. Las mquinas que no usaban la comprobacin de paridad asignaban al octavo bit el valor cero en la mayora de los casos, aunque otros sistemas como las computadorasPrime, que ejecutaban PRIMOS ponan el octavo bit del cdigo ASCII a uno. El cdigo ASCII define una relacin entre caracteres especficos y secuencias de bits; adems de reservar unos cuantos cdigos de control para el procesador de textos, y no define ningn mecanismo para describir la estructura o la apariencia del texto en un documento; estos asuntos estn especificados por otros lenguajes como los lenguajes de etiquetas.
[editar]Historia
La carta de Cdigo ASCII 1968 de los E.E.U.U. fue estructurada con dos columnas de caracteres de control, una columna con caracteres especiales, una columna con nmeros, y cuatro columnas de letras
El cdigo ASCII se desarroll en el mbito de la telegrafa y se us por primera vez comercialmente como un cdigo de teleimpresin impulsado por los servicios de datos de Bell. Bell haba planeado usar un cdigo de seis bits, derivado de Fieldata, que aada puntuacin y letras minsculas al ms antiguo cdigo de teleimpresin Baudot, pero se les convenci para que se unieran al subcomit de la Agencia de Estndares Estadounidense (ASA), que haban empezado a desarrollar el cdigo ASCII. Baudot ayud en la automatizacin del envo y recepcin de mensajes telegrficos, y tom muchas caractersticas del cdigo Morse; sin embargo, a diferencia del cdigo Morse, Baudot us cdigos de longitud constante. Comparado con los primeros cdigos telegrficos, el cdigo propuesto por Bell y ASA result en una reorganizacin ms conveniente para ordenar listas (especialmente porque estaba ordenado alfabticamente) y aadi caractersticas como la 'secuencia de escape'. La Agencia de Estndares Estadounidense (ASA), que se convertira ms tarde en el Instituto Nacional Estadounidense de Estndares (ANSI), public por primera vez el cdigo ASCII en 1963. El ASCII publicado en 1963 tena una flecha apuntando hacia arriba () en lugar del circunflejo (^) y una flecha apuntando hacia la izquierda en lugar del guion bajo (_). La versin de 1967 aadi las letras minsculas, cambi los nombres de algunos cdigos de control y cambi de lugar los dos cdigos de control ACK y ESC de la zona de letras minsculas a la zona de cdigos de control. ASCII fue actualizado en consecuencia y publicado como ANSI X3.4-1968, ANSI X3.4-1977, y finalmente ANSI X3.4-1986.
Otros rganos de estandarizacin han publicado cdigos de caracteres que son idnticos a ASCII. Estos cdigos de caracteres reciben a menudo el nombre de ASCII, a pesar de que ASCII se define estrictamente solamente por los estndares ASA/ANSI: La Asociacin Europea de Fabricantes de Ordenadores (ECMA) public ediciones de su clon de ASCII, ECMA-6 en 1965, 1967, 1970, 1973, 1983, y 1991. La edicin de 1991 es idntica a ANSI X3.4-1986.
4
La Organizacin Internacional de Estandarizacin (ISO) public su versin, ISO 646 (ms tarde ISO/IEC 646) en 1967, 1972, 1983 y 1991. En particular, ISO 646:1972 estableci un conjunto de versiones especficas para cada pas donde los caracteres de puntuacin fueron reemplazados con caracteres no ingleses. ISO/IEC 646:1991 La International Reference Version es la misma que en el ANSI X3.4-1986.
La Unin Internacional de Telecomunicaciones (ITU) public su versin de ANSI X3.4-1986, Recomendacin ITU T.50, en 1992. A principios de la dcada de 1970 public una versin como Recomendacin CCITT V.3.
DIN public una versin de ASCII como el estndar DIN 66003 en 1974. El Grupo de Trabajo en Ingeniera de Internet (IETF) public una versin en 1969 como RFC 20, y estableci la versin estndar para Internet, basada en ANSI X3.4-1986, con la publicacin deRFC 1345 en 1992.
La versin de IBM de ANSI X3.4-1986 se public en la literatura tcnica de IBM como pgina de cdigos 367.
El cdigo ASCII tambin est incluido en su probable relevo, Unicode, constituyendo los primeros 128 caracteres (o los 'ms bajos'). [editar]Los
El cdigo ASCII reserva los primeros 32 cdigos (numerados del 0 al 31 en decimal) para caracteres de control: cdigos no pensados originalmente para representar informacin imprimible, sino para controlar dispositivos (como impresoras) que usaban ASCII. Por ejemplo, el carcter 10 representa la funcin "nueva lnea" (line feed), que hace que una impresora avance el papel, y el carcter 27 representa la tecla "escape" que a menudo se encuentra en la esquina superior izquierda de los teclados comunes. El cdigo 127 (los siete bits a uno), otro carcter especial, equivale a "suprimir" ("delete"). Aunque esta funcin se asemeja a otros caracteres de control, los diseadores de ASCII idearon este cdigo para poder "borrar" una seccin de papel perforado (un medio de almacenamiento popular hasta la dcada de 1980) mediante la perforacin de todos los agujeros posibles de una posicin
de carcter concreta, reemplazando cualquier informacin previa. Dado que el cdigo 0 era ignorado, fue posible dejar huecos (regiones de agujeros) y ms tarde hacer correcciones. Muchos de los caracteres de control ASCII servan para marcar paquetes de datos, o para controlar protocolos de transmisin de datos (por ejemplo ENQuiry, con el significado: hay alguna estacin por ah?, ACKnowledge: recibido o ", Start Of Header: inicio de cabecera, Start of TeXt: inicio de texto, End of TeXt: final de texto, etc.). ESCape y SUBstitute permitan a un protocolo de comunicaciones, por ejemplo, marcar datos binarios para que contuviesen cdigos con el mismo cdigo que el carcter de protocolo, y que el receptor pudiese interpretarlos como datos en lugar de como caracteres propios del protocolo. Los diseadores del cdigo ASCII idearon los caracteres de separacin para su uso en sistemas de cintas magnticas. Dos de los caracteres de control de dispositivos, comnmente llamados XON y XOFF generalmente ejercan funciones de caracteres de control de flujo para controlar el flujo a hacia un dispositivo lento (como una impresora) desde un dispositivo rpido (como un ordenador), de forma que los datos no saturasen la capacidad de recepcin del dispositivo lento y se perdiesen. Los primeros usuarios de ASCII adoptaron algunos de los cdigos de control para representar "metainformacin" como final-de-lnea, principio/final de un elemento de datos, etc. Estas asignaciones a menudo entraban en conflicto, as que parte del esfuerzo de convertir datos de un formato a otro comporta hacer las conversiones correctas de metainformacin. Por ejemplo, el carcter que representa el final-de-lnea en ficheros de texto vara con el sistema operativo. Cuando se copian archivos de un sistema a otro, el sistema de conversin debe reconocer estos caracteres como marcas de final-de-lnea y actuar en consecuencia. Actualmente los usuarios de ASCII usan menos los caracteres de control, (con algunas excepciones como "retorno de carro" o "nueva lnea"). Los lenguajes modernos de etiquetas, los protocolos modernos de comunicacin, el paso de dispositivos basados en texto a basados en grficos, el declive de las teleimpresoras, las tarjetas perforadas y los papeles continuos han dejado obsoleta la mayora de caracteres de control.
El ASCII de siete bits proporciona siete caracteres "nacionales" y, si la combinacin concreta de hardware y software lo permite, puede utilizar combinaciones de teclas para simular otros caracteres internacionales: en estos casos un backspace puede preceder a un acento abierto o grave (en los estndares britnico y estadounidense, pero slo en estos estndares, se llama tambin "opening single quotation mark"), una tilde o una "marca de respiracin".
Binari o
D ec
H ex
Represent acin
Binari o
D ec
H ex
Represent acin
Binari o
D ec
H ex
Represent acin
0010 0 000
32
20
espacio ( )
0100 0 000
64
40
0110 0 000
96
60
0010 0 001
33
21
0100 0 001
65
41
0110 0 001
97
61
0010 0 010
34
22
"
0100 0 010
66
42
0110 0 010
98
62
0010 0 011
35
23
0100 0 011
67
43
0110 0 011
99
63
0010 0 100
36
24
0100 0 100
68
44
0110 0 100
10 0
64
0010 0 101
37
25
0100 0 101
69
45
0110 0 101
10 1
65
0010 0 110
38
26
&
0100 0 110
70
46
0110 0 110
10 2
66
0010 0 111
39
27
'
0100 0 111
71
47
0110 0 111
10 3
67
0010 1 000
40
28
0100 1 000
72
48
0110 1 000
10 4
68
0010 1 001
41
29
0100 1 001
73
49
0110 1 001
10 5
69
0010 1 010
42
2A
0100 1 010
74
4A
0110 1 010
10 6
6A
0010 1 011
43
2B
0100 1 011
75
4B
0110 1 011
10 7
6B
0010 1 100
44
2C
0100 1 100
76
4C
0110 1 100
10 8
6C
0010 1 101
45
2 D
0100 1 101
77
4 D
0110 1 101
10 9
6 D
0010 1 110
46
2E
0100 1 110
78
4E
0110 1 110
11 0
6E
0010 1 111
47
2F
0100 1 111
79
4F
0110 1 111
11 1
6F
0011 0 000
48
30
0101 0 000
80
50
0111 0 000
11 2
70
0011 0 001
49
31
0101 0 001
81
51
0111 0 001
11 3
71
0011 0 010
50
32
0101 0 010
82
52
0111 0 010
11 4
72
0011 0 011
51
33
0101 0 011
83
53
0111 0 011
11 5
73
0011 0 100
52
34
0101 0 100
84
54
0111 0 100
11 6
74
0011 0
53
35
0101 0
85
55
0111 0
11
75
101
101
101
0011 0 110
54
36
0101 0 110
86
56
0111 0 110
11 8
76
0011 0 111
55
37
0101 0 111
87
57
0111 0 111
11 9
77
0011 1 000
56
38
0101 1 000
88
58
0111 1 000
12 0
78
0011 1 001
57
39
0101 1 001
89
59
0111 1 001
12 1
79
0011 1 010
58
3A
0101 1 010
90
5A
0111 1 010
12 2
7A
0011 1 011
59
3B
0101 1 011
91
5B
0111 1 011
12 3
7B
0011 1 100
60
3C
<
0101 1 100
92
5C
0111 1 100
12 4
7C
0011 1 101
61
3 D
0101 1 101
93
5 D
0111 1 101
12 5
7 D
0011 1 110
62
3E
>
0101 1 110
94
5E
0111 1 110
12 6
7E
0011 1 111
63
3F
0101 1 111
95
5F
[editar]Rasgos
estructurales
Los dgitos del 0 al 9 se representan con sus valores prefijados con el valor 0011 en binario (esto significa que la conversin BCD-ASCII es una simple cuestin de tomar cada unidad bcd y prefijarla con 0011).
Las cadenas de bits de las letras minsculas y maysculas slo difieren en un bit, simplificando de esta forma la conversin de uno a otro grupo.
[editar]Otros
La RFC 1345 (publicada en junio de 1992) y el registro IANA de cdigos de caracteres, reconocen los siguientes nombres alternativos para ASCII para su uso en Internet. ANSI_X3.4-1968 (nombre cannico) ANSI_X3.4-1986 ASCII US-ASCII (nombre MIME recomendado) us ISO646-US ISO_646.irv:1991 iso-ir-6 IBM367 cp367 csASCII
De estos, slo los nombres "US-ASCII" y "ASCII" se usan ampliamente. A menudo se encuentran en el parmetro de "cdigo de caracteres" opcional en la cabecera Content-Type de algunos mensajes MIME, en el elemento equivalente "meta" de algunos documentos HTML, y en la parte de declaracin de codificacin de carcter de la cabecera de algunos documentos XML. [editar]Variantes
de ASCII
A medida que la tecnologa informtica se difundi a lo largo del mundo, se desarrollaron diferentes estndares y las empresas desarrollaron muchas variaciones del cdigo ASCII para facilitar la escritura de lenguas diferentes al ingls que usaran alfabetos latinos. Se pueden encontrar algunas de esas variaciones clasificadas como "ASCII Extendido", aunque en ocasiones el trmino se aplica errneamente para cubrir todas las variantes, incluso las que no preservan el conjunto de cdigos de caracteres original ASCII de siete bits. La ISO 646 (1972), el primer intento de remediar el sesgo pro-ingls de la codificacin de caracteres, cre problemas de compatibilidad, pues tambin era un cdigo de caracteres de 7 bits. No especific cdigos adicionales, as que reasign algunos especficamente para los nuevos lenguajes. De esta forma se volvi imposible saber en qu variante se encontraba codificado el texto, y, consecuentemente, los procesadores de texto podan tratar una sola variante.
La tecnologa mejor y aport medios para representar la informacin codificada en el octavo bit de cada byte, liberando este bit, lo que aadi otros 128 cdigos de carcter adicionales que quedaron disponibles para nuevas asignaciones. Por ejemplo, IBM desarroll pginas de cdigo de 8 bits, como la pgina de cdigos 437, que reemplazaba los caracteres de control con smbolos grficos como sonrisas, y asign otros caracteres grficos adicionales a los 128 bytes superiores de la pgina de cdigos. Algunos sistemas operativos como DOS, podan trabajar con esas pginas de cdigo, y los fabricantes de ordenadores personales incluyeron soporte para dichas pginas en su hardware. Los estndares de ocho bits como ISO 8859 y Mac OS Roman fueron desarrollados como verdaderas extensiones de ASCII, dejando los primeros 127 caracteres intactos y aadiendo nicamente valores adicionales por encima de los 7-bits. Esto permiti la representacin de un abanico mayor de lenguajes, pero estos estndares continuaron sufriendo incompatibilidades y limitaciones. Todava hoy, ISO-8859-1 y su variante Windows-1252 (a veces llamada errneamente ISO-8859-1) y el cdigo ASCII original de 7 bits son los cdigos de carcter ms comnmente utilizados. Unicode y Conjunto de Caracteres Universal (UCS) ISO/IEC 10646 definen un conjunto de caracteres mucho mayor, y sus diferentes formas de codificacin han empezado a reemplazar ISO 8859 y ASCII rpidamente en muchos entornos. Mientras que ASCII bsicamente usa cdigos de 7-bits, Unicode y UCS usan "code points" o apuntadores relativamente abstractos: nmeros positivos (incluyendo el cero) que asignan secuencias de 8 o ms bits a caracteres. Para permitir la compatibilidad, Unicode y UCS asignan los primeros 128 apuntadores a los mismos caracteres que el cdigo ASCII. De esta forma se puede pensar en ASCII como un subconjunto muy pequeo de Unicode y UCS. La popular codificacin UTF-8 recomienda el uso de uno a cuatro valores de 8 bits para cada apuntador, donde los primeros 128 valores apuntan a los mismos caracteres que ASCII. Otras codificaciones de caracteres como UTF-16 se parece a ASCII en cmo representan los primeros 128 caracteres de Unicode, pero tienden a usar 16 a 32 bits por carcter, as que requieren de una conversin adecuada para que haya compatibilidad entre ambos cdigos de carcter. La palabra ASCIIbtico (o, ms habitualmente, la palabra "inglesa" ASCIIbetical) describe la ordenacin segn el orden de los cdigos ASCII en lugar del orden alfabtico.
5
La abreviatura ASCIIZ o ASCIZ se refiere a una cadena de caracteres terminada en cero (del ingls "zero").
Es muy normal que el cdigo ASCII sea embebido en otros sistemas de codificacin ms sofisticados y por esto debe tenerse claro cual es papel del cdigo ASCII en la tabla o mapa de caracteres de un ordenador. [editar]Arte
ASCII
_ _ ____ ___/ /_\ ____ ____ ___ ___ | | | |
El cdigo de caracteres ASCII es el soporte de una disciplina artstica minoritaria, el arte ASCII, que consiste en la composicin imgenes mediante caracteres imprimibles ASCII. El efecto resultante ha sido comparado con el puntillismo, pues las imgenes producidas con esta tcnica generalmente se aprecian con ms detalle al ser vistas a distancia. El arte ASCII empez siendo un arte experimental, pero pronto se populariz como recurso para representar imgenes en soportes incapaces de procesar grficos, como teletipos, terminales,correos electrnicos o algunas impresoras. Aunque se puede componer arte ASCII manualmente mediante un editor de textos, tambin se pueden convertir automticamente imgenes y vdeos en ASCII mediante software, como la librera Aalib (de licencia libre), que ha alcanzado cierta popularidad. Aalib est soportada por algunos programas de diseo grfico, juegos y reproductores de vdeo.