Hay
95 caracteres ASCII imprimibles, numerados del 32 al 126. Estándares
(ASA, conocido desde 1969 como el Instituto Estadounidense de
Estándares Nacionales, o ANSI) como una refundición o evolución de
los conjuntos de códigos utilizados entonces en telegrafía. Más
tarde, en 1967, se incluyeron las minúsculas, y se redefinieron
algunos códigos de control para formar el código conocido como
US-ASCII.
El
código ASCII utiliza 7 bits para representar los caracteres, aunque
inicialmente empleaba un bit adicional (bit de paridad) que se usaba
para detectar errores en la transmisión. A menudo se llama
incorrectamente ASCII a otros códigos de caracteres de 8 bits, como
el estándar ISO-8859-1 que es una extensión que utiliza 8 bits para
proporcionar caracteres adicionales usados en idiomas distintos al
inglés, como el español.
ASCII
fue publicado como estándar por primera vez en 1967 y fue
actualizado por última vez en 1986. En la actualidad define códigos
para 32 caracteres no imprimibles, de los cuales la mayoría son
caracteres de control obsoletos que tienen efecto sobre cómo se
procesa el texto, más otros 95 caracteres imprimibles que les siguen
en la numeración (empezando por el carácter espacio).
Casi todos los sistemas informáticos actuales utilizan el código ASCII o una extensión compatible para representar textos y para el control de dispositivos que manejan texto como el teclado. No deben confundirse los códigos ALT+número de teclado con los códigos ASCII.
Casi todos los sistemas informáticos actuales utilizan el código ASCII o una extensión compatible para representar textos y para el control de dispositivos que manejan texto como el teclado. No deben confundirse los códigos ALT+número de teclado con los códigos ASCII.
La
carta de Código ASCII 1968 de los E.E.U.U. fue estructurada con dos
columnas de caracteres de control, una columna con caracteres
especiales, una columna con números, y cuatro columnas de letras. El
código ASCII se desarrolló en el ámbito de la telegrafía y se usó
por primera vez comercialmente como un código de teleimpresión
impulsado por los servicios de datos de Bell. Bell había planeado
usar un código de seis bits, derivado de Fieldata, que añadía
puntuación y letras minúsculas al más antiguo código de
teleimpresiónBaudot, pero se les convenció para que se unieran al
subcomité de la Agencia de Estándares Estadounidense (ASA), que
habían empezado a desarrollar el código ASCII. Baudot ayudó en la
automatización del envío y recepción de mensajes telegráficos, y
tomó muchas.
La
Agencia de Estándares Estadounidense (ASA), que se convertiría más
tarde en el Instituto Nacional Estadounidense de Estándares (ANSI),
publicó por primera vez el código ASCII en 1963. El ASCII publicado
en 1963 tenía una flecha apuntando hacia arriba (↑) en lugar del
circunflejo (^) y una flecha apuntando hacia la izquierda en lugar
del guion bajo (_). La versión de 1967 añadió las letras
minúsculas, cambió los nombres de algunos códigos de control y
cambió de lugar los dos códigos de control ACK y ESC de la zona de
letras minúsculas a la zona de códigos de control.
El código 127 (los siete bits a uno), otro carácter especial, equivale a "suprimir" ("delete"). Aunque esta función se asemeja a otros caracteres de control, los diseñadores de ASCII idearon este código para poder "borrar" una sección de papel perforado (un medio de almacenamiento popular hasta la década de 1980) mediante la perforación de todos los agujeros posibles de una posición de carácter concreta, reemplazando cualquier información previa. Dado que el código 0 era ignorado, fue posible dejar huecos (regiones de agujeros) y más tarde hacer correcciones.
Dos de los caracteres de control de dispositivos, comúnmente llamados XON y XOFF generalmente ejercían funciones de caracteres de control de flujo para controlar el flujo a hacia un dispositivo lento (como una impresora) desde un dispositivo rápido (como un ordenador), de forma que los datos no saturasen la capacidad de recepción del dispositivo lento y se perdiesen.
Los primeros usuarios de ASCII adoptaron algunos de los códigos de control para representar "metainformación" como final-de-línea, principio/final de un elemento de datos, etc. Estas asignaciones a menudo entraban en conflicto, así que parte del esfuerzo de convertir datos de un formato a otro comporta hacer las conversiones correctas de metainformación. Por ejemplo, el carácter que representa el final-de-línea en ficheros de texto varía con el sistema operativo. Cuando se copian archivos de un sistema a otro, el sistema de conversión debe reconocer estos caracteres como marcas de final-de-línea y actuar en consecuencia.
El código 127 (los siete bits a uno), otro carácter especial, equivale a "suprimir" ("delete"). Aunque esta función se asemeja a otros caracteres de control, los diseñadores de ASCII idearon este código para poder "borrar" una sección de papel perforado (un medio de almacenamiento popular hasta la década de 1980) mediante la perforación de todos los agujeros posibles de una posición de carácter concreta, reemplazando cualquier información previa. Dado que el código 0 era ignorado, fue posible dejar huecos (regiones de agujeros) y más tarde hacer correcciones.
Dos de los caracteres de control de dispositivos, comúnmente llamados XON y XOFF generalmente ejercían funciones de caracteres de control de flujo para controlar el flujo a hacia un dispositivo lento (como una impresora) desde un dispositivo rápido (como un ordenador), de forma que los datos no saturasen la capacidad de recepción del dispositivo lento y se perdiesen.
Los primeros usuarios de ASCII adoptaron algunos de los códigos de control para representar "metainformación" como final-de-línea, principio/final de un elemento de datos, etc. Estas asignaciones a menudo entraban en conflicto, así que parte del esfuerzo de convertir datos de un formato a otro comporta hacer las conversiones correctas de metainformación. Por ejemplo, el carácter que representa el final-de-línea en ficheros de texto varía con el sistema operativo. Cuando se copian archivos de un sistema a otro, el sistema de conversión debe reconocer estos caracteres como marcas de final-de-línea y actuar en consecuencia.
Actualmente
los usuarios de ASCII usan menos los caracteres de control, (con
algunas excepciones como "retorno de carro" o "nueva
línea"). Los lenguajes modernos de etiquetas, los protocolos
modernos de comunicación, el paso de dispositivos basados en texto a
basados en gráficos, el declive de las teleimpresoras, las tarjetas
perforadas y los papeles continuos han dejado obsoleta la mayoría de
caracteres de control.
El
código del carácter espacio, designa al espacio entre palabras, y
se produce normalmente por la barra espaciadora de un teclado. Los
códigos del 33 al 126 se conocen como caracteres imprimibles, y
representan letras, dígitos, signos de puntuación y varios
símbolos.
El
ASCII de siete bits proporciona siete caracteres "nacionales"
y, si la combinación concreta de hardware y software lo permite,
puede utilizar combinaciones de teclas para simular otros caracteres
internacionales: en estos casos un backspace puede preceder a un
acento abierto o grave (en los estándares británico y
estadounidense, pero sólo en estos estándares, se llama también
"opening single quotationmark"), una tilde o una "marca
de respiración".
Variantes
de ASCII. A medida que la tecnología informática se difundió a lo
largo del mundo, se desarrollaron diferentes estándares y las
empresas desarrollaron muchas variaciones del código ASCII para
facilitar la escritura de lenguas diferentes al inglés que usaran
alfabetos latinos. Se pueden encontrar algunas de esas variaciones
clasificadas como "ASCII Extendido", aunque en ocasiones el
término se aplica erróneamente para cubrir todas las variantes,
incluso las que no preservan el conjunto de códigos de caracteres
original ASCII de siete bits.
La ISO 646 (1972), el primer intento de remediar el sesgo pro-inglés de la codificación de caracteres, creó problemas de compatibilidad, pues también era un código de caracteres de 7 bits. No especificó códigos adicionales, así que reasignó algunos específicamente para los nuevos lenguajes. De esta forma se volvió imposible saber en qué variante se encontraba codificado el texto, y, consecuentemente, los procesadores de texto podían tratar una sola variante.
La tecnología mejoró y aportó medios para representar la información codificada en el octavo bit de cada byte, liberando este bit, lo que añadió otros 128 códigos de carácter adicionales que quedaron disponibles para nuevas asignaciones. Por ejemplo, IBM desarrolló páginas de código de 8 bits, como la página de códigos 437, que reemplazaba los caracteres de control con símbolos gráficos como sonrisas, y asignó otros caracteres gráficos adicionales a los 128 bytes superiores de la página de códigos. Algunos sistemas operativos como DOS, podían trabajar con esas páginas de código, y los fabricantes de ordenadores personales incluyeron soporte para dichas páginas en su hardware.
La palabra ASCIIbético (o, más habitualmente, la palabra "inglesa" ASCIIbetical) describe la ordenación según el orden de los códigos ASCII en lugar del orden alfabético.5
La abreviatura ASCIIZ o ASCIZ se refiere a una cadena de caracteres terminada en cero (del inglés "zero").
La ISO 646 (1972), el primer intento de remediar el sesgo pro-inglés de la codificación de caracteres, creó problemas de compatibilidad, pues también era un código de caracteres de 7 bits. No especificó códigos adicionales, así que reasignó algunos específicamente para los nuevos lenguajes. De esta forma se volvió imposible saber en qué variante se encontraba codificado el texto, y, consecuentemente, los procesadores de texto podían tratar una sola variante.
La tecnología mejoró y aportó medios para representar la información codificada en el octavo bit de cada byte, liberando este bit, lo que añadió otros 128 códigos de carácter adicionales que quedaron disponibles para nuevas asignaciones. Por ejemplo, IBM desarrolló páginas de código de 8 bits, como la página de códigos 437, que reemplazaba los caracteres de control con símbolos gráficos como sonrisas, y asignó otros caracteres gráficos adicionales a los 128 bytes superiores de la página de códigos. Algunos sistemas operativos como DOS, podían trabajar con esas páginas de código, y los fabricantes de ordenadores personales incluyeron soporte para dichas páginas en su hardware.
La palabra ASCIIbético (o, más habitualmente, la palabra "inglesa" ASCIIbetical) describe la ordenación según el orden de los códigos ASCII en lugar del orden alfabético.5
La abreviatura ASCIIZ o ASCIZ se refiere a una cadena de caracteres terminada en cero (del inglés "zero").
Es
muy normal que el código ASCII sea embebido en otros sistemas de
codificación más sofisticados y por esto debe tenerse claro cual es
papel del código ASCII en la tabla o mapa de caracteres de un
ordenador.
Arte
ASCI
No hay comentarios:
Publicar un comentario