Académique Documents
Professionnel Documents
Culture Documents
ASCII
ASCII (acrnimo ingls de American Standard Code for Information Interchange Cdigo Estndar Estadounidense para el Intercambio de Informacin), pronunciado generalmente [ski] o [sci] , es un cdigo de caracteres basado en el alfabeto latino, tal como se usa en ingls moderno y en otras lenguas occidentales. Fue creado en 1963 por el Comit Estadounidense de Estndares (ASA, conocido desde 1969 como el Instituto Estadounidense de Estndares Nacionales, o ANSI) como una refundicin o evolucin de los conjuntos de cdigos utilizados entonces en telegrafa. Ms tarde, en 1967, se incluyeron las minsculas, y se redefinieron algunos cdigos de control para formar el cdigo conocido como US-ASCII.
El cdigo ASCII utiliza 7 bits para representar los caracteres, aunque inicialmente empleaba un bit adicional (bit de paridad) que se usaba para detectar errores en la transmisin. A menudo se llama incorrectamente ASCII a otros cdigos de caracteres de 8 bits, como el estndar ISO-8859-1 que es una extensin que utiliza 8 bits para proporcionar caracteres adicionales usados en idiomas distintos al ingls, como el espaol. ASCII fue publicado como estndar por primera vez en 1967 y fue actualizado por ltima vez en 1986. En la actualidad define cdigos para 32 caracteres no imprimibles, de los cuales la mayora son caracteres de control obsoletos que tienen efecto sobre cmo se procesa el texto, ms otros 95 caracteres imprimibles que les siguen en la numeracin (empezando por el carcter espacio). Casi todos los sistemas informticos actuales utilizan el cdigo ASCII o una extensin compatible para representar textos y para el control de dispositivos que manejan texto como el teclado. No deben confundirse los cdigos ALT+nmero de teclado con los cdigos ASCII.
Vista general
Las computadoras solamente entienden nmeros. El cdigo ASCII es una representacin numrica de un carcter como a o @.[1] Como otros cdigos de formato de representacin de caracteres, el ASCII es un mtodo para una correspondencia entre cadenas de bits y una serie de smbolos (alfanumricos y otros), permitiendo de esta forma la comunicacin entre dispositivos digitales as como su procesado y almacenamiento. El cdigo de caracteres ASCII[2] o una extensin compatible (ver ms abajo) se usa casi en todos los ordenadores, especialmente con ordenadores personales y estaciones de trabajo. El nombre ms apropiado para este cdigo de caracteres es "US-ASCII".[3] ! " # $ % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ] ^ _ ` a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ ASCII es, en sentido estricto, un cdigo de siete bits, lo que significa que usa cadenas de bits representables con siete dgitos binarios (que van de 0 a 127 en base decimal) para representar informacin de caracteres. En el momento en el que se introdujo el cdigo ASCII muchos ordenadores trabajaban con grupos de ocho bits (bytes u octetos), como la unidad mnima de informacin; donde el octavo bit se usaba habitualmente como bit de paridad con funciones de control de errores en lneas de comunicacin u otras funciones especficas del dispositivo. Las mquinas que no usaban la comprobacin de paridad asignaban al octavo bit el valor cero en la mayora de los casos, aunque otros sistemas como las computadoras Prime, que ejecutaban PRIMOS ponan el octavo bit del cdigo ASCII a uno.
ASCII El cdigo ASCII define una relacin entre caracteres especficos y secuencias de bits; adems de reservar unos cuantos cdigos de control para el procesador de textos, y no define ningn mecanismo para describir la estructura o la apariencia del texto en un documento; estos asuntos estn especificados por otros lenguajes como los lenguajes de etiquetas.
Historia
El cdigo ASCII se desarroll en el mbito de la telegrafa y se us por primera vez comercialmente como un cdigo de teleimpresin impulsado por los servicios de datos de Bell. Bell haba planeado usar un cdigo de seis bits, derivado de Fieldata, que aada puntuacin y letras minsculas al ms antiguo cdigo de teleimpresin Baudot, pero se les convenci para que se unieran al subcomit de la Agencia de Estndares Estadounidense (ASA), que haban empezado a desarrollar el cdigo ASCII. Baudot ayud en la La carta de Cdigo ASCII 1968 de los E.E.U.U. fue estructurada con dos columnas de caracteres de control, una columna con caracteres especiales, una columna con nmeros, automatizacin del envo y recepcin y cuatro columnas de letras de mensajes telegrficos, y tom muchas caractersticas del cdigo Morse; sin embargo, a diferencia del cdigo Morse, Baudot us cdigos de longitud constante. Comparado con los primeros cdigos telegrficos, el cdigo propuesto por Bell y ASA result en una reorganizacin ms conveniente para ordenar listas (especialmente porque estaba ordenado alfabticamente) y aadi caractersticas como la 'secuencia de escape'. La Agencia de Estndares Estadounidense (ASA), que se convertira ms tarde en el Instituto Nacional Estadounidense de Estndares (ANSI), public por primera vez el cdigo ASCII en 1963. El ASCII publicado en 1963 tena una flecha apuntando hacia arriba () en lugar del circunflejo (^) y una flecha apuntando hacia la izquierda en lugar del guion bajo (_). La versin de 1967 aadi las letras minsculas, cambi los nombres de algunos cdigos de control y cambi de lugar los dos cdigos de control ACK y ESC de la zona de letras minsculas a la zona de cdigos de control. ASCII fue actualizado en consecuencia y publicado como ANSI X3.4-1968, ANSI X3.4-1977, y finalmente ANSI X3.4-1986. Otros rganos de estandarizacin han publicado cdigos de caracteres que son idnticos a ASCII. Estos cdigos de caracteres reciben a menudo el nombre de ASCII, a pesar de que ASCII se define estrictamente solamente por los estndares ASA/ANSI: La Asociacin Europea de Fabricantes de Ordenadores (ECMA) public ediciones de su clon de ASCII, ECMA-6 en 1965, 1967, 1970, 1973, 1983, y 1991. La edicin de 1991 es idntica a ANSI X3.4-1986.[4] La Organizacin Internacional de Estandarizacin (ISO) public su versin, ISO 646 (ms tarde ISO/IEC 646) en 1967, 1972, 1983 y 1991. En particular, ISO 646:1972 estableci un conjunto de versiones especficas para cada pas donde los caracteres de puntuacin fueron reemplazados con caracteres no ingleses. ISO/IEC 646:1991 La International Reference Version es la misma que en el ANSI X3.4-1986.
ASCII La Unin Internacional de Telecomunicaciones (ITU) public su versin de ANSI X3.4-1986, Recomendacin ITU T.50, en 1992. A principios de la dcada de 1970 public una versin como Recomendacin CCITT V.3. DIN public una versin de ASCII como el estndar DIN 66003 en 1974. El Grupo de Trabajo en Ingeniera de Internet (IETF) public una versin en 1969 como RFC 20 [5], y estableci la versin estndar para Internet, basada en ANSI X3.4-1986, con la publicacin de RFC 1345 en 1992. La versin de IBM de ANSI X3.4-1986 se public en la literatura tcnica de IBM como pgina de cdigos 367. El cdigo ASCII tambin est incluido en su probable relevo, Unicode, constituyendo los primeros 128 caracteres (o los 'ms bajos').
ASCII
Binario 00000000 00000001 00000010 00000011 00000100 00000101 00000110 00000111 00001000 00001001 00001010 00001011 00001100 00001101 00001110 00001111 00010000 00010001 00010010 00010011 00010100 00010101 00010110 00010111 00011000 00011001 00011010 00011011 00011100 00011101 00011110 00011111 01111111
Decimal Hex Abreviatura Repr 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 127 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F 10 11 12 13 14 15 16 17 18 19 1A 1B 1C 1D 1E 1F 7F NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US DEL ^@ ^A ^B ^C ^D ^E ^F ^G ^H ^I ^J ^K ^L ^M ^N ^O ^P ^Q ^R ^S ^T ^U ^V ^W ^X ^Y ^Z
AT
Nombre/Significado Carcter Nulo Inicio de Encabezado Inicio de Texto Fin de Texto Fin de Transmisin Consulta Acuse de recibo Timbre Retroceso Tabulacin horizontal Salto de lnea Tabulacin Vertical De avance Retorno de carro Maysculas fuera En maysculas Enlace de datos / Escape Dispositivo de control 1 oft. XON Dispositivo de control 2 Dispositivo de control 3 oft. XOFF Dispositivo de control 4 Confirmacin negativa Sncrono en espera Fin de Transmisin del Bloque Cancelar Finalizacin del Medio Substituto Escape Separador de fichero Separador de grupo Separador de registro Separador de unidad
^[ or ESC ^\ ^] ^^ ^_
ASCII
ASCII
6
00111110 00111111 62 63 3E 3F > ?
Binario 01000000 01000001 01000010 01000011 01000100 01000101 01000110 01000111 01001000 01001001 01001010 01001011 01001100 01001101 01001110 01001111 01010000 01010001 01010010 01010011 01010100 01010101 01010110 01010111 01011000 01011001 01011010 01011011 01011100 01011101 01011110 01011111
ASCII
01100100 100 01100101 101 01100110 102 01100111 103 01101000 104 01101001 105 01101010 106 01101011 107 01101100 108 01101101 109 01101110 110 01101111 111 01110000 112 01110001 113 01110010 114 01110011 115 01110100 116 01110101 117 01110110 118 01110111 119 01111000 120 01111001 121 01111010 122 01111011 123 01111100 124 01111101 125 01111110 126
ASCII
Rasgos estructurales
Los dgitos del 0 al 9 se representan con sus valores prefijados con el valor 0011 en binario (esto significa que la conversin BCD-ASCII es una simple cuestin de tomar cada unidad bcd y prefijarla con 0011). Las cadenas de bits de las letras minsculas y maysculas slo difieren en un bit, simplificando de esta forma la conversin de uno a otro grupo.
De estos, slo los nombres "US-ASCII" y "ASCII" se usan ampliamente. A menudo se encuentran en el parmetro de "cdigo de caracteres" opcional en la cabecera Content-Type de algunos mensajes MIME, en el elemento equivalente "meta" de algunos documentos HTML, y en la parte de declaracin de codificacin de carcter de la cabecera de algunos documentos XML.
Variantes de ASCII
A medida que la tecnologa informtica se difundi a lo largo del mundo, se desarrollaron diferentes estndares y las empresas desarrollaron muchas variaciones del cdigo ASCII para facilitar la escritura de lenguas diferentes al ingls que usaran alfabetos latinos. Se pueden encontrar algunas de esas variaciones clasificadas como "ASCII Extendido", aunque en ocasiones el trmino se aplica errneamente para cubrir todas las variantes, incluso las que no preservan el conjunto de cdigos de caracteres original ASCII de siete bits. La ISO 646 (1972), el primer intento de remediar el sesgo pro-ingls de la codificacin de caracteres, cre problemas de compatibilidad, pues tambin era un cdigo de caracteres de 7 bits. No especific cdigos adicionales, as que reasign algunos especficamente para los nuevos lenguajes. De esta forma se volvi imposible saber en qu variante se encontraba codificado el texto, y, consecuentemente, los procesadores de texto podan tratar una sola variante. La tecnologa mejor y aport medios para representar la informacin codificada en el octavo bit de cada byte, liberando este bit, lo que aadi otros 128 cdigos de carcter adicionales que quedaron disponibles para nuevas asignaciones. Por ejemplo, IBM desarroll pginas de cdigo de 8 bits, como la pgina de cdigos 437, que reemplazaba los caracteres de control con smbolos grficos como sonrisas, y asign otros caracteres grficos adicionales a los 128 bytes superiores de la pgina de cdigos. Algunos sistemas operativos como DOS, podan trabajar con esas pginas de cdigo, y los fabricantes de ordenadores personales incluyeron soporte para dichas pginas en su hardware. Los estndares de ocho bits como ISO 8859 y Mac OS Roman fueron desarrollados como verdaderas extensiones de ASCII, dejando los primeros 127 caracteres intactos y aadiendo nicamente valores adicionales por encima de los 7-bits. Esto permiti la representacin de un abanico mayor de lenguajes, pero estos estndares continuaron
ASCII sufriendo incompatibilidades y limitaciones. Todava hoy, ISO-8859-1 y su variante Windows-1252 (a veces llamada errneamente ISO-8859-1) y el cdigo ASCII original de 7 bits son los cdigos de carcter ms comnmente utilizados. Unicode y Conjunto de Caracteres Universal (UCS) ISO/IEC 10646 definen un conjunto de caracteres mucho mayor, y sus diferentes formas de codificacin han empezado a reemplazar ISO 8859 y ASCII rpidamente en muchos entornos. Mientras que ASCII bsicamente usa cdigos de 7-bits, Unicode y UCS usan "code points" o apuntadores relativamente abstractos: nmeros positivos (incluyendo el cero) que asignan secuencias de 8 o ms bits a caracteres. Para permitir la compatibilidad, Unicode y UCS asignan los primeros 128 apuntadores a los mismos caracteres que el cdigo ASCII. De esta forma se puede pensar en ASCII como un subconjunto muy pequeo de Unicode y UCS. La popular codificacin UTF-8 recomienda el uso de uno a cuatro valores de 8 bits para cada apuntador, donde los primeros 128 valores apuntan a los mismos caracteres que ASCII. Otras codificaciones de caracteres como UTF-16 se parece a ASCII en cmo representan los primeros 128 caracteres de Unicode, pero tienden a usar 16 a 32 bits por carcter, as que requieren de una conversin adecuada para que haya compatibilidad entre ambos cdigos de carcter. La palabra ASCIIbtico (o, ms habitualmente, la palabra "inglesa" ASCIIbetical) describe la ordenacin segn el orden de los cdigos ASCII en lugar del orden alfabtico.[7] La abreviatura ASCIIZ o ASCIZ se refiere a una cadena de caracteres terminada en cero (del ingls "zero"). Es muy normal que el cdigo ASCII sea embebido en otros sistemas de codificacin ms sofisticados y por esto debe tenerse claro cual es papel del cdigo ASCII en la tabla o mapa de caracteres de un ordenador.
Arte ASCII
_ ____ ____ ___ ___ /_\ / ___| / ___|_ _|_ _| //_\\ \___ \| | | | | | / ___ \ ___) | |___ | | | | /_/ \_\____/ \____|___|___|
El cdigo de caracteres ASCII es el soporte de una disciplina artstica minoritaria, el arte ASCII, que consiste en la composicin de imgenes mediante caracteres imprimibles ASCII. El efecto resultante ha sido comparado con el puntillismo, pues las imgenes producidas con esta tcnica generalmente se aprecian con ms detalle al ser vistas a distancia. El arte ASCII empez siendo un arte experimental, pero pronto se populariz como recurso para representar imgenes en soportes incapaces de procesar grficos, como teletipos, terminales, correos electrnicos o algunas impresoras. Aunque se puede componer arte ASCII manualmente mediante un editor de textos, tambin se pueden convertir automticamente imgenes y vdeos en ASCII mediante software, como la librera Aalib (de licencia libre), que ha
ASCII alcanzado cierta popularidad. Aalib est soportada por algunos programas de diseo grfico, juegos y reproductores de vdeo.
10
Referencias
Generales
Unicode.org Cuadro Unicode de la zona ASCII [8] Tom Jennings (29 de octubre de 2004). Historia anotada de los cdigos de caracteres [9] Accedido 17 de diciembre de 2005.
Al pie
[1] Nombres de Dominio Internacionalizados - Glosario (http:/ / www. icann. org/ en/ topics/ idn/ idn-glossary_es-MX. htm), Internet Corporation for Assigned Names and Numbers (ICANN). Consultado el 19-11-2008. [2] Organizacin Internacional para la Estandarizacin (1 de diciembre de 1975). " El conjunto de caracteres de ISO 646 (http:/ / www. itscj. ipsj. or. jp/ ISO-IR/ 001. pdf)". Internet Assigned Numbers Authority Registry. Versin estadounidense: (http:/ / www. itscj. ipsj. or. jp/ ISO-IR/ 006. pdf). Accedido el 7 de agosto de 2005. [3] Internet Assigned Numbers Authority (28 de enero de 2005). " Cdigos de caracteres (http:/ / www. iana. org/ assignments/ character-sets)". Accedido el 7 de agosto de 2005. [4] ECMA International (diciembre de 1991). Standard ECMA-6: 7-bit Coded Character Set, 6th edition (http:/ / www. ecma-international. org/ publications/ files/ ECMA-ST/ Ecma-006. pdf) Accedido el 17 de diciembre de 2005. [5] http:/ / tools. ietf. org/ html/ rfc20 [6] http:/ / www. iana. org/ assignments/ character-sets [7] Jargon File. ASCIIbetical (http:/ / www. catb. org/ ~esr/ jargon/ html/ A/ ASCIIbetical-order. html). Accedido el 17 de diciembre de 2005. [8] http:/ / www. unicode. org/ charts/ PDF/ U0000. pdf [9] http:/ / www. wps. com/ projects/ codes/ index. html
Enlaces externos
Herramienta online (http://electronicadesarrollo.blogspot.com/2010/02/los-caracteres-y-el-codigo-ascii.html) que muestra los caracteres ASCII y sus conversiones a otros sistemas numricos.
11
Licencia
Creative Commons Attribution-Share Alike 3.0 Unported //creativecommons.org/licenses/by-sa/3.0/