Definição de desindexação

A desdexação é uma prática de SEO que permite ao senhor indicar aos motores de busca a remoção ou a reparação de certas páginas. Pode ser conteúdo considerado de baixa qualidade (devido à falta de texto) ou conteúdo considerado privado e que não deve aparecer nos resultados dos mecanismos de busca. Em termos simples, ele remove do Google todas as páginas que não são úteis ao usuário. A implementação desse processo torna as páginas de seu site confiáveis e qualitativas aos olhos do Google

Mais de 10 milhões de peças de conteúdo são publicadas todos os dias na rede, e esse número cresce a cada dia

Para se destacar dessa massa, é importante rever sua estratégia de SEO, que inclui vários tipos de técnicas, inclusive a desindexação. Então :

  • Desindexação: O que é isso?
  • Quais são os diferentes métodos de desindexação?
  • Como e quando o Google desindexa as páginas web?

Estas são algumas das perguntas que vou responder neste guia.

Capítulo 1: O que é desindexação?

Para criar, às vezes é preciso destruir, dizem eles! O desejo de ver a própria página no topo dos resultados do mecanismo de busca pressiona os SEOs a fazer ajustes valiosos.

Mas antes de entrarmos no conceito de desindexação, é importante que o senhor tenha uma idéia do que é indexação.

1.1 O que é a indexação SEO?

Historicamente referido como “a “fase de registro de um website, l’indexação A indexação do Google é o conjunto de processos pelos quais um robô Google (aranhas) elabora, processa e depois classifica o conteúdo e páginas de um website, a fim de para apresentá-los em uma página de resultados.

Sem essa intervenção, os sites pesquisados pelos usuários da Internet não serão exibidos

De fato, a indexação é uma parte do referenciamento natural com o objetivo de colocar no índice de um motor de busca as páginas de um website. É um dos pré-requisitos para o posicionamento justo de um site nas páginas de resultados de um mecanismo de busca

1.2. O tempo que pode levar para o Google indexar uma página

Um website não é imediatamente indexado pelo Google uma vez que esteja online. De fato, pode acontecer que o robôs encarregados de explorar de sites e páginas ainda não estão no nível de seu site, o que muitas vezes leva tempo

Le gaspillage de votre budget d exploration

Assim, para acelerar as coisas, o senhor pode facilitar a indexação das aranhas dos motores de busca por

  • Corrigindo fatores que bloqueiam a indexação pelo Google;
  • Solicitando solicitação de inspeção de um URL pelo Console de Busca do Google ;
  • Verificação diária dos relatórios de rastreamento existentes no Search Console para identificar e corrigir quaisquer problemas;
  • A criação de novos conteúdos que mostram que seu site está crescendo;
  • Estruturar cada página de maneira que seja mais fácil para os robôs navegarem.

Portanto, o senhor precisa implementar certas estratégias para assegurar que seu website seja indexado eficientemente pelos bots

Isso começa com a remoção de páginas que não estão de acordo com as regras do Google de seu website.

1.3. O que significa De-indexing?

Desde o aparecimento do Panda que é um filtro algorítmico que castiga os websites por oferecer qualidade de baixa qualidade baixo conteúdo de qualidade, tornouse muito importante apresentar aos motores de busca somente aquelas páginas que são de valor para os usuários da Internet

Embora a desindexação já estivesse em uso, será a regulamentação penalizadora do Google sobre conteúdo de qualidade que levará muitos a descobrir um novo compartimento do mundo de SEO: O desindexação de conteúdo de baixa qualidade

Esta expressão, criada como uma contrapartida à palavra ” indexação essa expressão, criada como uma contrapartida à palavra “indexação”, representa todos os procedimentos implementados para remover certas páginas da rede do índice do motor de busca, a fim de apresentar aquelas de melhor qualidade

A fim de satisfazer adequadamente seus usuários, o Google pressiona os SEOs a produzir apenas conteúdo que proporcione um real valor agregado. Isso às vezes envolve a remoção de conteúdo inconclusivo. Entre estes últimos, podemos distinguir :

1.3.1. Páginas de resultados de motores internos

É normal que um mecanismo de busca interna se torne necessário quando um website começa a crescer em termos do número de páginas com conteúdo de valor muito baixo

Estas páginas devem ser desvinculadas, não porque elas conter spammas porque é provável que desperdicem o orçamento de rastejamento. Como resultado, o Google pode passar seu tempo rastejando as páginas internas de resultados e pode negligenciar as páginas de conteúdo do site.

Na verdade, as páginas de resultados do motor interno são as páginas de baixa qualidade em termos de conteúdo. Para mais esclarecimentos, siga este vídeo YouTube sobre o assunto: https://youtu.be/k-MmQS98bCE

1.3.2. Duplicação das páginas de conteúdo

O conteúdo duplicado refere-se a páginas que são duplicadas dentro ou fora de um website. Na verdade, podem ser páginas com conteúdo muito semelhante ou idêntico.

O motor de busca então filtra seus resultados a fim de selecionar a versão que considera ser aoriginal

As outras páginas não são necessariamente de-indexadas e ainda podem reter seu PageRank e seu índice nos motores de busca. Embora geralmente sejam ignoradas pelos motores de busca, estas são páginas que são rastejadas por robôs

Se o senhor tem muitas dessas páginas, elas podem consumir boa parte do seu orçamento de rastejamento. Observe que há três tipos de conteúdo duplicado:

  • Páginas totalmente idênticas

Este é o exemplo dos sites espelho. Aqui, o motor de busca do Google seleciona de acordo com o PageRank. O site espelho é o fato de reproduzindo outro website textualmente

É uma cópia exata de outro site, de modo que as páginas que saem do site espelho são cópias perfeitas das páginas de outro site

Seu papel é permitir que as mesmas informações sejam divulgadas em vários lugares e depois distribuir melhor o tráfego gerado no site original

  • Páginas semelhantes, mas com etiquetas de TÍTULO e DESCRIÇÃO DE META diferentes

Neste caso de conteúdo duplicado, todas as páginas originais serão indexadas e bem posicionadas, às custas das que não o forem. Aqueles que não são originais terão um desempenho muito pior nas páginas de resultados (SERP)

  • Páginas que são diferentes, mas têm etiquetas semelhantes TÍTULO e META DESCRIÇÃO

São as etiquetas idênticas nessas páginas que as tornam semelhantes. No pior dos casos, é até possível que o conteúdo não seja indexado pelo Google

A fim de evitar essa situação, é necessário que todas as páginas de seu website sejam compostas de etiquetas de título e meta descrição tags tags.

Aqui estão algumas dicas para ajudar o senhor a identificar conteúdos duplicados:

  • Fazer uma pesquisa no Google com a sintaxe “…”: este é um método muito simples, pois consiste em verificar se as sentenças são repetidas em várias páginas de seu site ou na Internet. Para obter um retorno satisfatório, seja específico em suas buscas. Ver meu artigo sobre o 26 Operadores do Google.
  • Uso de ferramentas especializadas: Estas ferramentas são sites cujo a especificidade é detectar conteúdos duplicados. Nós temos Copyscape, Quetext, Sapo gritante, Duplichecker, Siteliner. Eles são rápidos e fáceis de usar, o senhor só precisa entrar no URL da página e a ferramenta detectará conteúdo duplicado.

1.3.3. Formulários não conformes

O conteúdo de baixa qualidade também pode dizer respeito a certas formas. Há, em primeiro lugar :

  • Formulários que levam a um conteúdo que já está disponível em outra página indexada.
  • Formulários que levam a páginas que não necessariamente exibem conteúdo. Exemplos disso são o formulário de compra em um site de comércio eletrônico e o formulário de login para uma área de membros.

1.3.4. Páginas que oferecem conteúdo fiado (repetidas)

O conteúdo girando é uma técnica que permite que o conteúdo seja reescrito várias vezes a fim de obter diferentes textos semelhantes que falam sobre o mesmo assunto

Esse processo, que foi desenvolvido por especialistas, permite ao escritor criar um texto original e obter várias outras versões de formulações diferentes, mas todas com o mesmo significado.

Além do trabalho do escritor, também deveria ser incluído o uso de software de fiação para a produção automática de textos.

No entanto, quando o conteúdo da fiação é mal desenvolvido pelo escritor, pode se deteriorar em texto fiado ou um texto fiado de má qualidade.

Isso se torna uma desorientação para os motores de busca e uma experiência decepcionante para os leitores. É por isso que esses tipos de conteúdo deveriam ser desvinculados.

1.3.5. Páginas da importação de um tema de demonstração

Estas são páginas criadas automaticamente durante a importação de um tema de demonstração. Páginas desnecessárias que deveriam ser desdexadas.

1.3.6. Outras páginas a serem desindexadas

Além dos 05 tipos de conteúdo listados até agora, que devem ser desindexados o mais rápido possível, podemos acrescentar :

  • O PDF que oferecem conteúdo semelhante a uma página HTML;
  • O conteúdo sazonal, páginas obsoletasserviços antigos que não são mais oferecidos;
  • Tudo o que representa pré-prod bem como informações confidenciais.

Ao todo, o conteúdo que não oferece valor agregado efetivo deve ser desvinculado

Capítulo 2: Métodos e técnicas de desdexação

A desdexação pode ser feita por meio de várias técnicas. Essas variações variam conforme o senhor queira ou não manter disponível o conteúdo que deseja tornar acessível aos leitores

Se o senhor quiser remover ou apagar páginas do índice do Google, precisará tomar medidas específicas

Para evitar confusões, é importante entender a distinção entre a proibição de rastejar para o Google e a desindexação.

De fato, acrescentando um “não autorizar” em robot.txt não tem a intenção de desindexar as páginas, mas sim de evitar que o Google rasteje as páginas. Essa opção em robôs.txt não é usada para desindexar páginas

As técnicas de desindexação que vou apresentar ao senhor são todas eficazes. No entanto, não faz sentido tentar usar todas as técnicas ao mesmo tempo:

2.1. Usando a meta tag dos robôs

O meta-robôs tag a etiqueta está localizada entre as etiquetas . Ele é usado para indicar as diretrizes de indexação do conteúdo de um site. Para a desindexação, o senhor tem duas opções:

  • Desindexar o conteúdo, mantendo os links nele contidos acessíveis. Isso é recomendado quando o senhor deseja desindexar um conteúdo sem remover seus links.

>html> (…) (…)

  • Desindex, impedindo ao mesmo tempo que os links sejam seguidos:

O próximo passo é criar um mapa do site de-indexing sitemap, submetê-lo ao Google via robots.txt seguindo a diretiva “sitemap”, além da URL inteira acessando o site graças ao SEARCH CONSOLE.

2.2. Usando o comando X-Robots-Tag: Noindex

Esse método é usado para desindexar arquivos ou páginas sem alterar seu código fonte:

  • Desindexação dos PDFs:

Conjunto de cabeçalhos X-Robots-Tag “noindex, nofollow”

  • Desindexação de imagens e arquivos:

Header set X-Robots-Tag “noindex” ū

É importante lembrar, em todos os casos, que o senhor não deve usar dois métodos ao mesmo tempo. Isso tornará ineficaz sua desindexação. Para mais informações, ver : o que é robots.txt e como usá-lo?

2.3. Desindexação de páginas desnecessárias

Para desindexar rapidamente um monte de páginas inúteis, o senhor deveria :

  • Fornecer um código HTTP 410 código ou HTTP 404 código nas páginas suprimidas. Depois disso, o senhor deve esperar que o Google leve em conta a supressão da página.
  • Gerar um mapa do site de desindexação no qual encontramos os antigos URLs eliminados que se referem a um 404 ou a um 410.

2.4. Deindex páginas antigas às custas de páginas novas, que são mais informativas

Se o senhor está pensando em desindexar as páginas porque outras são mais relevantes, eis como fazer isso

  • Criado 301 das páginas que o senhor considera menos relevantes para as novas. O 301 redirecionamento é recomendado especialmente no caso em que as páginas consideradas menos relevantes estejam sujeitas a backlinks. Isso promove a otimização das páginas e reduz a perda do linkjuice.
  • Para que o Google leve esses 301s em conta mais rapidamente, é recomendável criar um mapa do site no qual os URLs redirecionando para as novas páginas sejam encontrados e enviá-lo via robots.txt ou uma conta do console SEARCH.

Além de querer ser você mesmo a desindexar as páginas, pode acontecer que suas páginas sejam desindexadas pelo Google sem qualquer ordem.

Capítulo 3: Como o Google desindexa?

O senhor se esforçou muito para colocar seu website no topo das páginas de resultados do mecanismo de busca. No entanto, depois de todas as tentativas de busca, o senhor não consegue encontrar seu website nos resultados da busca

Isto é confuso! O senhor terá que descobrir o que teria causado tal inconveniente em primeiro lugar. De fato, a missão para a qual o Google opera é declarada como segue “Organização de informações de todo o mundo para torná-las disponíveis e úteis“.

A firma tem como objetivo oferecer a seus usuários o máximo informações confiáveis

Para conseguir isso, o Google esforça-se por :

  • Constantemente ajustar sua busca algoritmo de busca ;
  • Assegurando constantemente que os resultados da pesquisa sejam de melhor qualidade através dos dados de avaliação coletados em vários níveis, inclusive por seus avaliadores.

É fácil, portanto, entender por que o gigante não hesita em sancionar certas práticas que considera prejudicial a seus usuários

Aqui estão as práticas que são em sua maioria de chapéu preto e que podem fazer com que seu site seja desindexado pelo Google.

3.1. A técnica de camuflagem

A camuflagem é um método do Black Hat para otimizar as posições dos sites nos motores de busca

Este a prática consiste em apresentar ao mecanismo de busca um conteúdo diferente daquele apresentado aos usuários da Internet. Um verdadeiro sistema de camuflagem.

Por exemplo, faça com que seu site apareça como um site que compartilha as revisões de celebridades, mas discreta e secretamente links para conteúdos eróticos (pornográficos) extensos.

A camuflagem é executada através da publicação conteúdo de um agente do usuário ou mesmo um endereço IP. Ao fazer isso, se um rastejador escaneia o sistema, a versão limpa do do site é exibido.

Por outro lado, se for um buscador humano que tenha sido detectado, é a versão falsa do site é exibida.

Além disso, o mascaramento também pode substituir o

  • Imagens que são camufladas por outras imagens, e que são diferente das que foram transmitidass ;
  • Sites que mostram algum conteúdo para o Google, mas que limita o acesso ao usuário da Internet ;

Esses não incluem websites que requerem registro ou login para acessar o conteúdo. O Google aplica dois tipos de penalização por camuflagem :

  • A penalidade que afeta apenas parcialmente seu site;
  • A penalidade que afeta todo o website do senhor.

3.2. Spamming

Também conhecido como conteúdo não desejadoeste é um conteúdo inútil que é exibido com o propósito de publicidade

Na verdade, o Google anunciou a desindexação forçada do conteúdo spammy, incluindo

  • Envio de consultas automáticas ao Google ;
  • Desenhos de páginas com conteúdo malicioso tais como: vírus, phishing, ou malware;
  • O uso de filiação sem valor agregado suficiente;
  • Ligações ocultas;
  • Participação em esquemas de vinculação.

Há também outros tipos de spam:

3.2.1. Spam gerado pelo usuário

O Spam também é criado pelos usuários ou bots que colocam comentários contendo informações de contato ou links para websites ou perfis de usuários:

Fonte: Pipdig

Se o senhor gostaria de distinguir entre os comentários de spam, pode levar em conta

  • Nomes de usuários ;
  • O e-mails que parecem irrelevantes ou estranhos ou que simplesmente não são dignos de confiança

Para evitar ser penalizado pelo Google, o senhor precisa agir rapidamente eliminação de todos os comentários de spam e revisando o conteúdo de seu site. Para evitar spam, considere também este ponto :

3.2.2. Hospedagem gratuita

É comum encontrar serviços de hospedagem gratuitos. Aconselhamos o senhor a ter cuidado com esses serviços, porque eles realmente não são confiáveis

Em troca do que lhe foi prometido, o senhor só verá anúncios de spam e maus serviços. O Google está tomando medidas para sancionar esta prática

Para evitar ser penalizado, o senhor deve escolher um alojamento útil e confiável. O pagamento pela hospedagem é uma das melhores soluções que permitem ao senhor ter controle total sobre seu website. Eis uma solução que pode ajudar o senhor: 27 critérios para a escolha de seu web host?

3.3. Recheio de palavras-chave

Recheio de palavras-chave palavras-chave é uma técnica SEO de chapéu preto que consiste em carregamento de páginas da web com palavras-chave em uma tentativa de influenciar a classificação dos motores de busca de um website.

Estas páginas da web podem incluir meta tags e meta descrição. O escopo deste método pode ser ampliado para incluir :

3.3.1. Acréscimo de palavras-chave irrelevantes

Essas são palavras-chave que não têm nenhuma relação com o assunto. Por exemplo, seu website tem conteúdo sobre móveis, mas o senhor acrescenta palavras-chave sobre jardinagem apenas para atrair mais tráfego. O Google não hesitará em sancionar esse tipo de página.

3.3.2. Repetição excessiva de palavras-chave

O gigante dos motores de busca é totalmente contra a repetição desnecessária desnecessariamente repetido. Isso pode incluir o uso de todos os tipos de palavras-chave disponíveis.

Por exemplo, se as palavras-chave são “móveis da Etiópia”, evite isso: << O "..móveis etíopes“é o melhor do mercado. Você pode encontrar “Ethiopian móveis da Etiópiao senhor pode encontrar “móveis etíopes” em lojas, tanto on-line quanto pessoalmente. “Etíope móveis da Etiópia“é confortável e macio. >>

Para saber se seu conteúdo é denso, dê uma olhada neste pequeno guia Definição Densidade da palavra-chave l Twaino.

3.3.3. Texto oculto

Outro método de referenciamento mais ou menos menos antigo é o uso de palavras-chave em um website cuja fonte é :

  • Similar ao pano de fundo do site;
  • Muito pequeno, impossível de ler a olho nu.

Em todo caso, o Google penalizará quando perceber o engano.

3.4. Conteúdo leve

Os especialistas dizem o tempo todo, escrevam a conteúdo de qualidade não é tarefa fácil. Mesmo que esse critério possa ser satisfeito se o senhor for um excelente escritor, o problema continuará sendo a freqüência da publicação

De fato, o senhor precisa publicar um conteúdo de qualidade, mas com regularidade. Se o senhor só publica um artigo uma vez por mês, é menos provável que tenha um bom desempenho do que alguém que publica várias vezes por mês

Para colher os benefícios da publicação regular, algumas pessoas não hesitam em publicar qualquer tipo de conteúdo que lhes surja no caminho.

Outras pessoas usam o atalho de cópia total ou parcial do conteúdo (conteúdo duplicado, como visto acima). Esse conteúdo é visto pelo Google como não sendo original e oferecendo pouco valor agregado a seus usuários

Ao dar-lhes muito pouco interesse nos SERPs, o mecanismo de busca pode facilmente desindexar esses conteúdos ou todo o site.

Capítulo 4: Outras perguntas feitas sobre a desindexação

4.1. O que significa indexar uma página?

Em termos simples, a indexação é o processo de adição de páginas da web à base de dados de busca do Google. Dependendo da Meta tag que o senhor tenha usado (índice ou NO-index), o Google irá ou não rastrear e indexar suas páginas. Uma etiqueta de não indexação significa que essa página não será acrescentada ao índice de busca da web.

4.2. O que significa “de-indexed”?

Em poucas palavras, desvinculado significa: Removido de um índice ou de todo o sistema de indexação

4.3. Como o senhor desindexa uma página?

Em primeiro lugar, o senhor pode usar uma etiqueta de meta robôs sem acesso. Em segundo lugar, o senhor pode fazer um pedido imediato noferramenta de remoção de URL no Console de Busca do Google

No final, não se esqueça de verificar se as páginas estão indexadas.

4.como posso impedir o Google de indexar meu site?

A maneira mais eficaz e mais fácil de impedir que o Google indexe certas páginas da web é a meta tag “noindex”. Basicamente, esta é uma diretriz que diz aos rastreadores do Google para não indexar uma página da web e, portanto, para não mostrá-la posteriormente nos SERPs.

4.5. O que é um noindex tag?

Uma etiqueta “noindex” diz aos motores de busca para não incluir a página em seu índice e, portanto, os resultados da busca. O método mais comum de não indexar uma página é acrescentar uma etiqueta na seção do cabeçalho do HTML ou nos cabeçalhos de resposta

Em resumo

A otimização de um site nos motores de busca depende de um ou mais fatores. A indexação é uma fase de otimização dos motores de busca que permite aos motores de busca exibir o conteúdo dos websites em seus resultados

A desdexação, por outro lado, mobiliza várias técnicas que consistem em retirar do índice certos conteúdos considerados de baixa qualidade ou privados, a fim de tornar o site mais qualitativo

Há muitas técnicas de desindexação, mas algumas foram citadas e detalhadas neste artigo. Espero que o tenha ajudado ou dado mais algumas dicas. Até breve!

Categorias D

Deixe um comentário