URL (Uniform Resource Locator) ou em português, localizador uniforme de recursos, é uma sigla que se refere ao endereço de rede – Internet ou Intranet – no qual se encontra algum recurso informático.
Um endereço URL é, em suma, um endereço virtual com um caminho que indica onde está aquilo que o utilizador procura: seja um arquivo, uma página, uma pasta, um equipamento periférico como uma impressora, etc. Endereço URL também se pode referir a um link ou endereço de um site.
Protocolo URL
O endereço URL identifica um determinado elemento que se obtém na Internet com a finalidade de ser referido e dar acesso aos utilizadores. As páginas web, por exemplo, devem ser identificadas com o nome de domínio do servidor e o caminho de um arquivo e, nesse caso, o URL precisa também do protocolo utilizado para fazer uso desse elemento. Ora, o protocolo URL tanto pode ser HTTP, que é um protocolo de comunicação, como FTP que é uma forma rápida de transferir arquivos na Internet.
Composição URL
A primeira parte de um endereço URL chama-se esquema e determina que tipo de protocolo é utilizado e a que tipo de recurso se refere. O mais conhecido dá pelo nome de HTTP, que neste caso se refere a um documento, como por exemplo, uma página na web. Além do HTTP, existem outras possibilidades, tais como: FTP (protocolo de transferência de arquivos), Telnet (protocolo de rede que permite gerir a distância de outra máquina), Mailto (protocolo que se refere aos endereços eletrónicos), News (ou grupo de noticias Usenet), Idap (protocolo de acesso rápido aos diretórios) e HTTPS ou protocolo HTTP em SSL.
A segunda parte de um URL, após a expressão “://” refere-se ao endereço do computador e ao caminho para o arquivo em questão. Por exemplo, um endereço URL como “http://site.com/conteudo/index.html” ou www.site.com é o endereço ou nome de domínio do computador que hospeda os documentos, enquanto que “/conteúdo/índex.html” é o caminho do arquivo. Caso o endereço não aponte para um arquivo em particular e termine numa barra, o servidor aponta automaticamente para um arquivo neste documento denominado “index.html”, “índex.htm” ou “índex.php”.
Claro que este padrão está sempre a ser revisto e pode adicionar ou eliminar novos elementos a qualquer hora. Na verdade, já foram efetuadas várias correções desde o surgimento da web.
Formato URL
O formato URL é definido pela norma RFC 1738 (Request for Comments), que é um documento que descreve os padrões de componentes que fazem parte de qualquer rede, seja Internet ou Intranet.
Codificação URL
Um endereço URL é uma cadeia de caracteres ASCII (American Standard Code for Information Interchange), adotada como código padrão, pois permite a codificação de caracteres.
A saber, a memória dos computadores conserva todos os dados sob a forma digital e não existe um método para armazenar diretamente os caracteres, pelo que cada um deles possui um equivalente em código numérico, ou ASCII.
O código ASCII básico representava os caracteres em 7 bits (128 caracteres possíveis de 0 a 127).
– Os códigos 0 a 31 são chamados caracteres de controle porque permitem fazer ações como CR (Carriage Return) e BEL (bip sonoro).
– Os códigos 65 a 90 representam as maiúsculas.
– Os códigos 97 a 122, as minúsculas.
Basta alterar o 6° bit para passar das maiúsculas para as minúsculas, por exemplo, isto é, acrescentar 32 ao código ASCII em base decimal.
Porém, como o código ASCII foi concebido para a língua inglesa, não contém caracteres acentuados nem caracteres específicos de outro idioma. Por isso, foi necessário recorrer a outro código para estender o código ASCII para 8 bits (um byte) de modo a codificar mais caracteres (código ASCII Extended). Este código atribui os valores de 0 a 255 às letras maiúsculas e minúsculas, aos números, à pontuação e a outros símbolos.
Partes do código de um URL
Resumidamente, num endereço URL o código é dividido em 5 partes:
Nome do protocolo – Linguagem utilizada para se comunicar na rede. O protocolo mais usado é o HTTP e permite passar as páginas web para o formato HTML, mas também se podem usar outras linguagens (FTP, News, Mailto, etc.).
Identificador e senha – Elementos que permitem especificar os parâmetros de acesso a um servidor protegido.
Nome do servidor – Nome de domínio do computador que aloja o recurso pedido.
Quantidade de portas – Número associado a um serviço permitindo ao servidor saber qual o tipo de recurso solicitado, sendo que a porta associada por padrão ao protocolo é a porta número 80.
Caminho para aceder ao recurso – Indicação que permite ao servidor conhecer o local onde o recurso está alojado, ou seja, o diretório e o nome do arquivo solicitado.