O ASCII Standard é uma norma para a codificação de caracteres por meio de números binários que utiliza 7 bits (ou 0 + 7 bits para o byte) gerando 128 códigos de caracteres entre 0 e 127 (00H até 7FH). Os 32 primeiros valores estão reservados para códigos de controle de combinações e da impressora, enquanto os 96 códigos restantes estão associados aos sinais de pontuação convencionais, aos dígitos 0 a 9, e às letras maiúsculas e minúsculas do alfabeto romano. Os bytes são frequentemente usados para armazenar caracteres individuais num documento de texto. Os computadores armazenam os documentos de texto, tanto em disco e em memória, usando esses códigos. Por exemplo, se usarmos o bloco de notas no Windows para criar um ficheiro de texto em que contenham as palavras: “Cento e vinte e sete”, o bloco de notas usaria um byte de memória por cada caracter (incluindo 1 byte para cada caracter de espaço entre as palavras – caracteres ASCII 32). Quando o bloco de notas armazena a frase num ficheiro no disco, o ficheiro também irá conter um byte por cada caracter e por cada espaço.
Tente esta experiência: Abra o bloco de notas e insira a frase, “Cento e vinte e sete”. Salve o ficheiro no disco com o nome getty.txt. Em seguida, veja as propriedades do ficheiro e veja o tamanho do ficheiro. Irá verificar que o ficheiro tem o tamanho de 20 bytes no disco: 1 byte para cada caracter. Se adicionar outra palavra no final da frase e salva-lo novamente, o tamanho do ficheiro irá aumentar para o número apropriado de bytes. Cada caracter consome um byte. Se olharmos para um ficheiro como um computador olha para ele, verificaríamos que cada byte não contém uma letra, mas um número – o número é o código ASCII correspondente ao caracter (veja abaixo). Então, no disco, os números para o ficheiro criado anteriormente será parecido com este:
C | e | n | t | o | e | v | i | n | t | e | e | s | e | t | e | ||||
67 | 101 | 110 | 116 | 111 | 32 | 101 | 32 | 118 | 105 | 110 | 116 | 101 | 32 | 101 | 32 | 115 | 101 | 116 | 101 |
Ao olhar a tabela ASCII, podemos ver uma correspondência de um para um entre cada caracter e o código ASCII utilizado. Note-se a utilização de um espaço 32 em que 32 é o código ASCII para um espaço. Poderíamos expandir esses números decimais para números binários (assim 32 = 00100000), se quiséssemos ser tecnicamente corretos – que é a forma como o computador realmente trabalha.