Como os mecanismos de busca chegam aos sites

google bot

Compreender como funcionam os mecanismos de busca é parte essencial do trabalho de quem procura se posicionar bem na WEB. Este trabalho tem um nome, SEO ou Search Engine Optmization. Em português bem claro significa otimização para mecanismos de busca. Os mecanismos de busca, ou buscadores, por sua vez, têm uma tarefa árdua de processar trilhões de páginas disponíveis na internet¹. O Google, por exemplo, recebe cerca de 100 bilhões de pedidos de busca por mês.

É muita informação disputando a audiência do usuário. Estar entre os resultados principais das chamadas SERPs (search engine result pages) é um trabalho que exige conhecimento, disciplina e um pouco de sorte também. Afinal, os softwares por trás desse processo são ainda softwares, por mais inteligentes que seja. Isto é, compreendem apenas aquilo que os algoritmos utilizados para implementá-los dispõem. Nada como a inteligência adaptável dos seres humanos.

print-screen de uma SERP do Google

Mecanismos de busca

Vamos primeiramente entender quais são os objetivos dos mecanismos de busca. Adianto que são vários, mas os dois mais importantes são:

  • Rastejar e indexar os trilhões de páginas e arquivos disponíveis na web;
  • Atender às consultas dos usuários oferecendo listas de páginas de conteúdo relevante*.

*  Entenda aqui conteúdo relevante como algo que leva em consideração não só a pergunta do usuário, mas o seu histórico de buscas, sua idade, hábitos, região e contexto. Também são atribuídas ao conteúdo algumas características para determinar se é relevante ou não. Por exemplo, idade da página, taxas de rejeição, credibilidade, autoria do conteúdo. Entre vários outros fatores que vale aprofundamento no estudo para entender.

Como funcionam os mecanismos de busca afinal?

Os crawlers ou spiders são os robozinhos (robots) programados com algoritmos que determinam como indexar os conteúdos disponíveis na internet. Eles também são chamados de rastejadores ou rastreadores web. O do Google, por exemplo, se chama Googlebot. É ele quem, em algum momento, passou pelo seu site e disponibilizou uma página para determinado tema em uma SERP do Google. Estes bots (contração para robot) partem de listas de URLs iniciais, chamadas de seeds (sementes). Dentro das seeds, os bots identificam hiperlinks e os adicionam à lista de URLs para visitar posteriormente. Isto é parte da indexação.

Rastreamento na Web - Como funcionam os mecanismos de busca
Metrô de New York como analogia para o rastreamento na Web | Como funcionam os mecanismos de busca.

Os links entre as páginas web são os caminhos encontrados pelos mecanismos de busca para encontrar o melhor trajeto disponível. A estrutura formada pelos links interligando as páginas na web, são como uma cidade. Quanto mais hiperlinks houver levando a determinado ponto, mais rápido se chegará a ele. Os robots caminham por essa estrutura recolhendo dos hiperlinks as urls contidas ali.

A partir daí vem uma parte significativa do trabalho dos mecanismos de busca. Após encontrar estas páginas, a próxima tarefa é “analisar sintaticamente² o código a partir delas e armazenar pedaços selecionados das páginas em grandes arranjos de unidades rígidas, a serem reacessados quando necessários em uma consulta”³ (Enge, Spencer, Fishkin, Stricchiola, 2010, p.39).

Conceitos importantes para entender como funcionam os mecanismos de busca e a importância do trabalho de SEO

Relevância: o grau de compatibilidade que determinado conteúdo tem em relação a intenção e os termos de consulta do usuário;

Importância ou popularidade: é determinada pela quantidade de vezes que aquela página web foi citada em outras páginas. Quanto maior a importância da página que está fazendo a citação, melhor para a página citada.

Mapa semântico: quando o mecanismo de busca analisa a sua página, ele avalia a ligação semântica entre as palavras, criando um mapa. Este mapa procura definir a relação entre os conceitos para retornar opções corretas às consultas de busca pelo usuário.

Análise de links: os mecanismos de busca também verificam quem está se ligando a quem, qual a autoridade de uma página sobre determinado tema. Quem é digno de ser confiado com base na autoridade dos sites que se ligam a essa pessoa, etc.

Vale assistir:

__

Referências:

¹Dados do Google disponíveis em Google Blog: We knew web was big.

² É analisar a página de forma a compreender os níveis daquela estrutura de dados.

³ ENGE, Eric. SPENCER, Stephan. FISHKIN, Rand. STRICCHIOLA, Jessie C. A Arte de SEO – Dominando a Otimização dos Mecanismos de Busca. Novatec. São Paulo, 2010.

 

Jéssica Macedo

Jornalista, especialista em brigadeiro de panela e mídias sociais. WordPress Fan.

Deixe uma resposta

© 2017 Jornalista Digital | ScrollMe by AccessPress Themes