Em informática, o termo cluster designa o menor tamanho de arquivo que é possível gravar num disco de armazenamento. Ou seja, se os clusters medem, por exemplo, 32 KB (a capacidade dos clusters variam), qualquer arquivo menor que esse número ocupa, obrigatoriamente, um espaço de 32 KB.
Um cluster pode referir-se a duas coisas diferentes: 1) um grupo de setores de um dispositivo de armazenamento
2) um grupo de computadores ligados.
1) Um grupo de sectores
Um setor é a menor unidade que pode ser acedida num dispositivo de armazenamento como um HDD ou SSD. Um cluster, ou unidade de alocação, é um grupo de setores que compõem a menor unidade de alocação do disco para um ficheiro dentro de um sistema de ficheiros. Noutras palavras, o tamanho do cluster de um sistema de ficheiros é a menor quantidade de espaço que um ficheiro pode ocupar num computador.
A dimensão comum de um setor é de 512 bytes. Um tamanho comum de um cluster é de 8 setores. Portanto, muitos sistemas de ficheiros têm um tamanho mínimo de cluster de 4 kilobytes (8 x 512 bytes).
A maioria dos ficheiros exigem um grande número de clusters, o que significa que o conteúdo do ficheiro está distribuído em vários clusters na unidade. Muitas vezes, os dados podem ser escritos em blocos contíguos de modo que o conteúdo do ficheiro seja armazenado num local físico. No entanto, quando um disco rígido começa a ficar cheio, os clusters contíguos disponíveis podem não ser suficientes para salvar ficheiros grandes numa única área. Em vez disso, eles devem ser escritos em vários locais no disco. Isso é chamado de fragmentação e pode abrandar as velocidades de leitura e escrita do disco rígido.
Quando o utilizador lê um ficheiro, o ficheiro inteiro é obtido por ele e ele não está ciente do número de clusters que estão a ser utilizados.
Uma vez que um cluster é lógico, em vez de fazer parte de uma unidade física (não está integrado no disco rígido em si), o tamanho de um cluster pode ser variado. O número máximo de clusters num disco rígido depende do tamanho de uma tabela de entrada FAT (File Allocation Table). No DOS 4.0, as entradas FAT tinham um tamanho de 16 bits, o que permitia um máximo de 65536 clusters. Com o Windows 95, foi suportado uma entrada FAT de 32 bits, permitindo assim, uma entrada que suporta clusters suficientes para suportar até dois terabytes de dados.
A desvantagem no tamanho do cluster é que mesmo o menor ficheiro (e até mesmo um diretório em si) ocupa todo o cluster. Assim, um ficheiro de 10 bytes vai ocupar 2048 bytes se o cluster tiver esse tamanho. Na verdade, muitos sistemas operativos definem o tamanho padrão do cluster em 4096 ou 8192 bytes.
2) Um grupo de computadores ligados
Um cluster pode também referir-se a um grupo de máquinas que funcionam juntas e que desempenham uma função semelhante. Um cluster é controlado por um único programa de software que gere todos os computadores ou “nós” dentro do cluster. Os nós trabalham juntos para completar uma única tarefa. Este processo é chamado de “computação paralela” uma vez que os nós executam operações em conjunto.
Os clusters podem variar de duas máquinas para centenas de computadores conectados. Os pequenos clusters são muitas vezes utilizados para melhorar o desempenho dos serviços da internet e jogos online por terem várias solicitações de entrada em paralelo. Uma web farm, por exemplo, é um tipo de cluster que fornece baixa latência de acesso a sites. Os clusters de grandes dimensões podem ser usados para realizarem os cálculos científicos ou para executarem um grande número de algoritmos complexos. Por exemplo, um cluster grande pode ser usado para aplicar texturas e efeitos de iluminação para modelos 3D em cada frame de um filme de animação.
Muitas empresas utilizam clusters de computadores para maximizar o tempo de processamento, aumentar o armazenamento da base de dados e implementar técnicas de armazenamento e recuperação de dados mais rápidos.