Como os mecanismos de busca (buscadores) indexam e classificam os sites?

Agosto 9th, 2008

Obviamente que, ao fazer uma busca no Google, Yahoo, Live, etc., não podemos achar que, na velocidade com a qual os resultados são exibidos, a busca seja realizada naquele exato instante. Os buscadores (prefiro usar esse termo porque é mais rápido pra digitar - apesar desse parêntese) “enviam” periodicamente pela web o que conhecemos como robô de busca, crawler ou spider. Esses caras nada mais são do que programas que rastreiam a web seguindo links e armazenam em um banco de dados o conteúdo dos sites que encontraram.

Ok, então os resultados que temos ao fazermos uma busca qualquer, nada mais são do que as informações que os buscadores previamente armazenaram em seus bancos de dados a cada trabalho dos robôs.

Agora entendemos o porque da velocidade do resultado. Precisamos saber agora porque alguns sites estão tão bem classificados (de preferência aparecendo entre os 10 primeiros) e outros estão tão mal classificados ou simplesmente não aparecem nos buscadores.

Observem a imagem abaixo para uma busca que fiz no Google para buffet de pizza.

resultado da busca

Vejam como nos resultados da busca o Google destaca com negrito os termos pesquisados. A primeira linha em azul é o título do site sobre o qual já escrevi aqui anteriormente.

O texto imediatamente abaixo pode vir de três origens. São elas e nessa ordem:

  • O Meta Description;
  • A descrição usada no diretório DMOZ (calma que eu já explico) ou;
  • Um fragmento de texto no corpo (body) do documento.

Bom, se você não conhece o DMOZ, faça uma visita por lá e, de preferência, aproveite para cadastrar o seu site.

O objetivo do artigo não é falar dos diretórios, mas, se você está curioso em saber porque eu falei do DMOZ, viste os dois sites abaixo, brinque de ficar clicando nos botões e de entender como buscadores e diretórios se relacionam. Acho que você vai gostar. Seguem os dois links:

Voltando à nossa busca, já sabemos agora que os sites listados nos resultados apresentam em seu conteúdo as mesmas palavras usadas nas buscas, ou seja, os buscadores procuram em seus bancos de dados os sites cujo conteúdo são coincidentes ao da palavra, expressão ou frase-chave usada na busca. Simples isso… concorda?

O problema é saber como o buscador estabelece quem fica na frente de quem e o pior… por quê?

Bem, se eu soubesse isso, garanto que esse blog estaria com muito mais artigos porque eu estaria muito rico e com tempo livre para escrever mais por aqui. Como não sei exatamente como funcionam os creitérios para uma classificação, vou relacionar abaixo alguns lugares importantes para você colocar as palavras, expressões ou frases-chave e tentar algum sucesso com isso. Além desses lugares, apontarei também alguns fatores que ajudam na relevância do site.

Vamos lá. Palavras, expressões ou frases-chave no:

  • título das páginas
  • meta description
  • meta keywords (os buscadores mais importantes quase não dão importância a esse item)
  • nome do arquivo
  • URL
  • número de vezes no conteúdo do site (densidade de palavras-chave)
  • cabeçalhos (H1, H2, etc.)
  • links em textos no documento
  • links em textos em sites que apontam para o seu
  • atributo ALT das imagens
  • nomes dos arquivos de imagens
  • atributo TITLE nos links ou imagens que sejam links
  • popularidade do site em outros buscadores
  • outros sites com boa reputação com link para o seu site
  • vários outros fatores desconhecidos

Os itens acima são “os caras do bem”. Abaixo segue uma lista de itens que podem prejudicar a classificação:

  • todas as técnicas de spam (escreverei sobre isso em outra oportunidade)
  • URLs muito longas
  • query string nas URLs (são muito usadas em sites dinâmicos e começam geralmente a partir do caracter ?)
  • uso de stop symbols (o robô geralmente cancela o rastreamento quando encontra símbolos desse tipo) como: #, $ e %
  • uso de IDs de sessão (&id)
  • uso de JavaScript
  • Uso da porcaria do Flash
  • páginas localizadas em profundidades de diretórios com mais de 3 diretórios como: site.com.br/dir1/dir2/dir3/dir4/arquivo.htm
  • uso de frames
  • uso de menus feitos com imagens
  • redirecionamento de URLs
  • vários outros fatores desconhecidos

É isso. Espero ter ajudado. Antes de finalizar, quero chamar atenção para alguns poucos detalhes.

Os itens acima são importantes, mas, além deles, o mais importante de tudo é o conteúdo para o site. Coloque no seu site ou no site do seu cliente o conteúdo que os visitantes procurarão nos buscadores. Isso mesmo, na hora de criar o conteúdo, pense com a cabeça de quem vai buscar um produto ou serviço que está no site.

Não pense apenas que fazer um site usado os padrões da web (mais conhecido entre nós como tableless), colocar títulos decentes, meta description, meta keywords e sair injetando palavras-chave de qualquer jeito vai fazer com que o site tenha um bom posicionamento. Pode tirar o seu cavalinho da chuva porque o tiro pode sair pela culátra.

Já ia me esquecendo, o segundo (que também é terceiro) e o sexto colocados na busca acima são meus clientes. São eles:

Ricardo’s Pizza e Izael Pizza Buffet.
Valeu e até o próximo.

Categoria(s): XHTML

Technorati icon

9 Comentários Insira o seu...

  • 1. Leo Baiano  |  Agosto 9th, 2008 at 3:15 pm

    Gostei bastante do texto, de forma pratica e simples explica o funcionamento básico dos mecanismos de busca de forma geral.

  • 2. Cledson  |  Agosto 11th, 2008 at 10:48 am

    Boa dica valeu!!

  • 3. Paulo Roberto  |  Agosto 11th, 2008 at 3:53 pm

    Belo texto. Só falta eu convencer os cliente q site em flash não ajuda em nada… hihehahahahahah

  • 4. Guilherme Mattos  |  Agosto 12th, 2008 at 5:45 pm

    Nessa você me pegou, parece que eu vou ter que tirar meu cavalinho da chuva antes do que eu pensava.
    Acredito eu que o maior critério usado pelos buscadores seja o de URL. E também concordo com o Paulo Roberto. Convencer os clientes a não fazer um site em flash, é muito difícil.

    Belo texto mestre! Ressurgindo das cinzas como uma fênix, hein?

  • 5. Web Designer Demétrios  |  Agosto 13th, 2008 at 12:16 am

    Excelentes dicas….parabéns !!!

    Agora eu tenho uma dúvida cruel….
    QUAL O SEGREDO PARA INDEXAR UM SITE NO DIRETÓRIO DMOZ ???

    Já cadastrei diversos sites, uns já fazem 4 meses e até agora nada…não recebi nenhuma mensagem de reporvação. Já busquei no DMOZ pelo nome do site e não encontra nem ferrando! Tem haver pq utilizo no cadastro meu emial do gmail?

  • 6. Fish  |  Agosto 13th, 2008 at 4:15 pm

    Cara, muito bom o artigo. Estes são mesmos elementos fundamentais para a otimização de um site.
    Bom trabalho Mestre!!

    Abração

  • 7. Wender da Silva Souza  |  Agosto 21st, 2008 at 4:13 pm

    Muito bom o artigo grande mestre, sugiro criar um artigo sobre como criar um checklist de SEO para auxiliar no desenvolvimento de quem tem dúvidas a respeito e não esquecer os passos principais.

    Acredito que a dúvida do Demétrios acima também será esclarecida com um pequeno checklist sobre o que ele deve fazer para aparecer nos buscadores.

    Obrigado,

    um abraço,

    Wender

  • 8. Luiz Araujo  |  Setembro 8th, 2008 at 1:38 pm

    Belo artigo. Essas práticas são sempre bem-vindas na nossa empresa, que aliás, já viraram um padrão de trabalho nos nossos projetos. Quanto ao Flash, amigos, eu sempre uso alguns argumentos para convencer o cliente de que devemos fazer um uso “moderado” do Flash, são eles:

    Indexação
    “Peso” dos arquivos
    Tempo de desenvolvimento
    Preço (esse é ótimo)
    E por último, vou no popular e digo que o uso do Flash vai atrapalhar a colocação do site dele nos sites de buscas.

    Por enquanto está dando certo, e o que preferiu ter o site em nFlash, pagou o que nós pedimos, achei ótimo!

  • 9. home loan  |  Janeiro 30th, 2009 at 6:29 am

    Lovely. Great site.

Deixe seu Comentário

Requerido

Requerido, não exibido

XHTML:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>




Posts mais recentes