Motores de pesquisa ou motores de busca são programas desenhados para procurar palavras-chave fornecidas pelo utilizador, em documentos alojados na Internet.
Os motores de pesquisa (português europeu) ou motores de busca (português do Brasil) surgiram em força logo após o aparecimento da Internet, com o objetivo de prestar um serviço bastante importante: a pesquisa de informações na rede, apresentando os resultados de uma forma organizada, rápida e eficiente aos utilizadores.
Mas essa pesquisa de palavras-chave ou keywords em vários sites implica que esses sites tenham uma indexação acessível aos motores de pesquisa, ou seja, enviem regularmente uma lista de palavras-chave para os motores, não obstante os últimos terem a possibilidade de explorá-los, mesmo que não enviem lista alguma. De ressalvar ainda que há uma grande variação entre os motores de busca no que respeita aos métodos de indexação e ao número de páginas que indexam, total ou parcialmente.
Entre as maiores empresas com motores de pesquisa, conta-se a Google, Yahoo, Bing, Altavista, Lycos, etc. É um facto que, hoje em dia as pessoas associem a expressão motor de busca ao Google, mas existem muitos outros, não só na Internet, mas também em programas que um utilizador comum usa no seu dia-a-dia, como o Word.
Estrutura dos motores de pesquisa
Os avanços mais significativos a nível de motores de pesquisa foram registados nos seus algoritmos: velocidade e quantidade de informação com que são alimentados. Assim, o seu aspeto geral não mudou muito ao longo do tempo, mantendo a seguinte estrutura:
- Caixa de texto para escrever as palavras.
- Botão para iniciar a pesquisa.
- Secção para mostrar os resultados.
História dos motores de pesquisa
A maior parte dos métodos de pesquisa usados pelos motores de pesquisa atuais teve origem nos desenvolvimentos dos anos 70 e 80 na área da informática, nomeadamente Recuperação de Informação (RI). Com o uso generalizado da Internet, os motores foram-se desenvolvendo e com eles a indexação, ou seja, a tabulação dos conteúdos dos documentos, e também a recolha e a pesquisa nessas tabelas.
A primeira ferramenta que surgiu para pesquisar na Internet foi o motor de pesquisa Archie, em 1990. Nessa data ainda não tinha sido inventada a WWW, pelo que este motor de pesquisa se limitava a indexar o nome dos ficheiros disponíveis nos servidores FTP (File Transfer Protocol) de acesso livre. A sua popularidade, porém, levou ao desenvolvimento de um novo protocolo em 1991, o Ghoper. No mesmo ano surge a WWW e o primeiro browser, mas só em 1993 é lançado o Mosaic, o browser que viria a popularizar o uso da WWW (uma espécie de catálogo) e o primeiro motor de pesquisa efetivo, o Wanderer (um webrobot desenvolvido na linguagem de programação PERL que navegava pela web criando um índice das páginas encontradas). Ainda em 1993 surge o Aliweb e o JumpStation, aquele que foi o primeiro motor a usar as três principais funcionalidades de um motor de pesquisa moderno: rastreamento, indexação e pesquisa. Em 1994 começam a surgir motores de busca que indexavam todo o conteúdo das páginas (como o Webcrawler, o Lycos e o Infoseek) e em 1995 surge o Altavista que se mantém na posição de líder até ao surgimento do Google em 1998 (entretanto, em 1995, nasce o Sapo, em Portugal). Em 2000, o Google já era o motor de pesquisa mais usado, fruto da inovação conseguida através do seu algoritmo de ranking dos resultados, PageRank.
Funcionamento dos motores de pesquisa
As três fases fundamentais no funcionamento de um motor de pesquisa são:
- Rastreamento (crawling)
- Indexação (indexing)
- Pesquisa (searching)
Rastreamento
Antes da pesquisa em si, é necessário que o motor de busca preencha o seu índice com os documentos sobre o qual efetuará a pesquisa. Essa tarefa fica a cargo de um software chamado web crawler (spider ou bot) que recebe uma lista de endereços URL a partir dos quais começa a seguir todos as hiperligações encontradas nessas páginas e nas páginas seguintes e assim sucessivamente até ter visitado e copiado todas as páginas pretendidas. Existem milhares de bots a percorrer a web constantemente, é com estas cópias das páginas que os motores de pesquisa constroem os seus índices.
Indexação
A fase de indexação corresponde ao processo pelo qual o motor de busca extrai a informação necessária dos documentos e a armazena na sua base de dados para que as pesquisas sejam rápidas e precisas em vez de demorarem horas ou mesmo dias. O índice em causa tem normalmente a forma de um índice invertido e mantém um vocabulário com todos os termos encontrados nos documentos com a indicação do local onde existem.
Pesquisa
Embora seja uma questão de segundos entre pesquisar determinadas palavras e receber milhares de resultados em resposta a essa pesquisa, o funcionamento dos motores de busca como o Google ou o Bing é algo verdadeiramente complexo. A fase de pesquisa começa quando o utilizador escreve uma expressão no motor de busca e este inicia a procura de todos os documentos que correspondem à ou às palavra-chave(s) usada(s) na consulta. Como o número de resultados pode ser gigantesco, é importante que se use alguma ordenação, pelo que os resultados encontrados são devolvidos numa lista ordenada por ordem de relevância (a determinação da ordem da relevância também obedece a um algoritmo). Alguns fatores que ajudam os motores a decidir se a página X ou Y é importante, estão ainda por descobrir, mas o certo é que são eles que decidem quais as páginas que são mais relevantes para a pesquisa de um utilizador. Percorrendo e analisando todo o texto do site, concluem qual a correspondência entre o conteúdo existente e a pesquisa, e quantas vezes os termos pesquisados ou os seus sinónimos aparecem ao longo do site, determinando assim a sua relevância. Valorizam, claro está, que as palavras-chave apareçam no título da página, no endereço do site ou num parágrafo no meio do texto. Além disso, os motores de busca também dão muita importância às ligações que existem entre diferentes sites, nomeadamente à quantidade de links externos, sendo que cada link é normalmente visto como um sinal de conteúdo de qualidade. Dai que muitas empresas estejam hoje a apostar em Marketing Digital, otimizando os conteúdos dos seus sites regularmente com Content Marketing e estratégias SEO (Search Engine Optimization).
Tipos de motores de pesquisa
- Motores verticais. Realizam pesquisas “especializadas” em bases de dados próprias de acordo com as suas propensões. Geralmente a inclusão num motor vertical está relacionada com o pagamento de uma mensalidade ou de um valor por clique.
- Motores locais. Realizam pesquisas locais ou regionais que têm como objetivo apresentar informações referentes a empresas e prestadores de serviços da zona em causa.
- Guias de pesquisas locais. Realizam pesquisas de abrangência nacional que listam as empresas e prestadores de serviços próximas da posição geográfica do internauta, a partir de um texto digitado e usando o código postal ou GPS.
- Diretórios de sites. Realizam pesquisas por índices de sites organizados por categorias e subcategorias.