Definição de conteúdo duplicado ou conteúdo duplicado

Conteúdo duplicado refere-se a blocos de texto que são completamente idênticos entre si (duplicatas exatas) ou similares com pequenas diferenças, também conhecidas como quase duplicatas. Na SEO, o conteúdo duplicado ocorre quando esse tipo de conteúdo aparece em múltiplas URLs ou páginas da Web no mesmo website ou em websites diferentes.

De acordo com Matt Cutts do Google, 25 a 30 por cento de conteúdo é duplicado na Internet. Para continuar com esta lógica, um estudo recente da Raven Tools, baseado em dados de sua ferramenta de auditoria, nos dá um valor aproximado de 29 % para o mesmo problema

Embora esse fenômeno seja freqüentemente não intencional, o Google e outros mecanismos de busca penalizam indiretamente os sites com conteúdo duplicado

Para compreender melhor esse conceito, os seguintes pontos-chave deveriam ser discutidos:

  • Uma breve visão geral do significado de “conteúdo duplicado” e seus diferentes tipos;
  • As causas e as maneiras de identificá-las;
  • Boas práticas para lidar com elas.

Estas são algumas das muitas perguntas chave que vou responder com clareza e precisão ao longo deste guia.

Saiba mais!

Table des matières

Capítulo 1: O que precisamos entender sobre “conteúdo duplicado”?

Neste capítulo, explicarei os pontos essenciais sobre o conteúdo duplicado, tais como

  • Um breve lembrete de sua definição;
  • Os diferentes tipos que existem;
  • Seu impacto no referenciamento

1.1. Conteúdo duplicado: O que é isso?

O conteúdo duplicado é um bloco de texto que aparece várias vezes na rede. Quando um texto está presente em uma única URL, é chamado de conteúdo único. Caso contrário, é considerado duplicado.

Para ser mais claro, este é o ato de copiar a produção de outros e publicá-la em seu site. Em geral, essa duplicação é feita sem a autorização prévia do autor.

Isso não só levanta dúvidas sobre sua capacidade de produzir textos atraentes e originais, como também o Google pode penalizar sua SEO.

1.2) Quais são os diferentes tipos de conteúdo duplicado?

O conteúdo duplicado não é apenas o resultado de uma cópia deliberada de textos ou partes deles, mas muitas vezes também :

  • Causas técnicas ligadas ao funcionamento do CMS;
  • Razões ligadas à administração do catálogo de produtos, no caso do comércio eletrônico;
  • Etc.

Desses casos que levam à geração de duplicatas, dois tipos de conteúdo duplicado podem ser deduzidos:

1.2.1. Conteúdo duplicado interno (no mesmo site)

Conteúdo duplicado interno ocorre quando há uma repetição de texto ou partes de texto em duas ou mais páginas do mesmo website

Contenu duplique interne sur un meme site

O conteúdo duplicado interno é geralmente de boa fé, pois vem principalmente de

  • Erros técnicos;
  • Configurações de URL;
  • Etc.

Deve-se observar que não se trata de roubo de conteúdo, mas de erros que levam à multiplicação do conteúdo em diferentes URLs.

1.2.2. Conteúdo externo em duplicata

Estas são páginas onde o texto é o mesmo que se encontra em outros sites. Esse tipo de conteúdo duplicado é o que causa conflitos reais.

Esse caso é encontrado em particular nas fichas de produtos de comércio eletrônico, que contêm informações técnicas sobre os produtos e suas funções de uso.

Não é raro no comércio eletrônico ver algumas pessoas usando as descrições de seus fornecedores para seus produtos. Isso faz com que o mesmo conteúdo textual esteja presente em vários websites.

1.3. Que impacto pode ter a duplicação de conteúdo na SEO e na classificação de um website?

Devido à confusão que a duplicação de conteúdo causa para os spiders dos mecanismos de busca, qualquer classificação e consciência pode acabar sendo dividida entre as URLs duplicadas

Isso acontece porque as aranhas dos motores de busca têm que escolher qual página da web eles acham que deve ser classificada para uma determinada palavra-chave.

Assim, cada variante de URL recebe pontuação de autoridade de página e poder de classificação diferentes.

Mas, com o tempo, o Google chegou a compreender que a maioria dos conteúdos duplicados não é criada intencionalmente

Uma análise mostra que 50% de websites enfrentam problemas de conteúdo duplicado.

O objetivo do Google é mostrar uma diversidade de sites nos resultados da pesquisa. Sendo esse o caso, os pesquisadores são obrigados a escolher a versão do conteúdo a ser classificada

Nesse caso, suas produções textuais que o senhor considere mais apropriadas para um determinado assunto podem não ser classificadas, devido à semelhança entre elas e outros conteúdos existentes.

Em resumo, podemos resumir em 3 pontos os problemas que os websites enfrentam com conteúdo duplicado:

  • Dificuldade na classificação dos resultados da pesquisa;
  • Mostrando uma má experiência de usuário;
  • E diminuiu o tráfego orgânico.

Obviamente, esses não são os únicos problemas relacionados com a duplicação de conteúdo, mas são os mais dolorosos para um site.

Capítulo 2: Quais são as causas e como detectar conteúdos duplicados?

Como o título deste capítulo já sugere, depois de explicar as causas das duplicidades de conteúdo, mostraremos a V. Excia. como pode detectá-las.

2.1. Quais são as causas da duplicação do conteúdo?

Há muitas razões pelas quais é possível criar conteúdos duplicados, mas mencionaremos algumas delas:

2.1.1. “HTTP” vs “HTTPS” e “WWW” vs sem “WWW”

Acrescentando certificados SSL certificados ao seu website é a melhor (ou única) maneira de obtê-los. Ele permite que o senhor transponha seu site da Internet de HTTP para HTTPS

No entanto, é uma ação que resulta em páginas duplicadas em seu website, se o senhor não redirecionar.

Além disso, como o conteúdo de seu website é acessível a partir de URLs com “WWW” e sem “WWW”, a duplicação se torna inevitável.

As seguintes URLs levam todas à mesma página, mas seriam consideradas URLs completamente diferentes pelos motores de busca spiders:

Deve-se notar, portanto, que essa situação é a causa mais comum do problema da duplicação.

2.1.2. Conteúdo raspado ou copiado

Quando outros websites “roubam” conteúdo de outro website, isso é chamado raspagem do conteúdo. Se o Google ou outros mecanismos de busca não conseguirem identificar a versão original, eles podem acabar classificando a página que foi copiada de seu site.

Esse tipo de duplicação ocorre freqüentemente para sites que têm produtos listados com descrições de fabricantes

Se o mesmo produto é vendido em vários sites e todos esses sites usam as descrições do fabricante, o conteúdo duplicado pode ser encontrado em várias páginas em sites diferentes.

2.1.3. Variações de URL

Variações nos URLs podem ocorrer de

  • IDs das sessões
  • Parâmetros de consulta e capitalização

Quando uma URL usa parâmetros que não mudam o conteúdo da página, ela pode acabar criando uma página duplicada.

As identificações das sessões funcionam da mesma maneira. A fim de manter o controle dos visitantes de seu site, o senhor pode usar os documentos de identificação da sessão para acompanhar o que o usuário fez enquanto esteve no site e para onde eles foram

Para fazer isso, a identificação da sessão é acrescentada ao URL de cada página em que clicam

Fonte Polepositionmarketing

Portanto, a identificação da sessão acrescentada neste caso cria uma nova URL para a mesma página e é, portanto, considerada como conteúdo duplicado.

As letras maiúsculas muitas vezes não são acrescentadas intencionalmente, mas é importante assegurar que seus URLs sejam consistentes e usem letras minúsculas

Por exemplo, twaino.com/blog e twaino.com/Blog seriam consideradas páginas duplicadas.

Agora que o senhor tem uma boa compreensão de algumas das causas de conteúdo duplicado, passemos à detecção das mesmas.

2.2 Como detectar conteúdo duplicado

Nesta seção, procuraremos primeiro formas livres de encontrar conteúdos duplicados, e depois ferramentas de detecção.

2.2.1. Formas livres de encontrar conteúdos duplicados

Eis aqui algumas formas livres que lhe permitirão fazê-lo:

  • Encontrar conteúdo duplicado;
  • Rastreie quais páginas têm múltiplas URLs;
  • E descubra que problemas estão causando a duplicação de conteúdo em seu site.
2.2.1.1. Console de Busca do Google

O Google Search Console é uma poderosa ferramenta gratuita à sua disposição. A instalação de seu console lhe ajudará a ganhar visibilidade sobre o desempenho de suas páginas da Internet nos resultados das buscas

Usando o Cobertura (em Índice, o senhor pode encontrar URLs que podem estar causando problemas de conteúdo duplicado.

Procure as questões mais comuns como, por exemplo

  • Versões HTTP e HTTPS da mesma URL;
  • Www e versões não www da mesma URL;
  • URLs com e sem uma barra “/” ;
  • URL com e sem parâmetros de consulta;
  • URL com e sem letras maiúsculas;
  • Consultas de cauda longa com classificação de várias páginas.

Fique atento aos URLs que o senhor descobre com problemas de duplicação, para que possa revisá-los

2.2.2.2. Checador de Conteúdo Duplicado

As Ferramentas de Revisão da SEO criaram este verificador de conteúdo duplicado para ajudar os websites a combater o roubo de conteúdo. Ao inserir sua URL na ferramenta de verificação deles, o senhor pode obter uma visão geral das URLs externas e internas que duplicam a URL inserida.

Aqui está o que foi encontrado quando liguei “https://www.twaino.com/” no verificador:

Encontrar conteúdo externo duplicado é muito importante. Como lembrete, o conteúdo duplicado externo ocorre quando outra pessoa rouba conteúdo de seu site.

Uma vez descoberto, o senhor pode apresentar um pedido de remoção ao Google e remover a página duplicada.

2.2.2. Ferramentas para encontrar conteúdo duplicado

Aqui está uma visão geral dos principais instrumentos, tanto gratuitos como pagos, para detectar conteúdos duplicados internos e externos.

2.2.2.1 Copyscape

Lançado em 2004, o Copyscape é a ferramenta mais conhecida para combater o plágio e o roubo de conteúdo. Essa ferramenta oferece um serviço gratuito e pago.

Não há necessidade de registro para usar a versão gratuita, basta entrar o URL da página a ser verificada e clicar em “Go”.

Mas a falha dessa ferramenta em sua versão gratuita é que ela não pode reconhecer os usuários, já que não há nenhuma exigência de registro antes do uso

Portanto, o senhor não obterá nenhum resultado se alguém já tiver feito a mesma busca.

A versão paga desse instrumento permite que o senhor o faça:

  • Digite o texto a ser verificado;
  • Pesquisar mais de 10.000 páginas;
  • Excluir certas áreas da busca

O custo é de USD 0,05 por busca.

2.2.2.2 Dupli Checker

O Dupli Checker permite ao senhor verificar o texto inserido manualmente ou carregado de um arquivo. É então possível fazer uma comparação com os resultados detectados, descobrindo a porcentagem do mesmo texto.

2.2.2.3 Plagiarisma

Plagiarisma permite ao senhor verificar apenas o Bing na versão gratuita. Basta colar o texto a ser verificado ou o URL da página para iniciar a verificação

Há uma versão paga que dá acesso a funções adicionais a um custo de US$0,05 por busca.

2.2.2.4 Plágio

O Plagium tem duas versões: livre e paga. A primeira oferece um número limitado de buscas e só funciona com a digitação do texto que o senhor deseja verificar

A segunda custa US$0,07 por busca e permite um número maior de resultados, já que é feita uma busca mais profunda. Com a versão paga, o senhor também pode verificar os documentos em formato Word ou PDF.

2.2.2.5 PlagScan

PlagScan é um serviço muito abrangente, mas pago, com pacotes a partir de US$ 4,99 para pesquisas de 5000 palavras

Além de identificar páginas com texto duplicado, o senhor também pode ver onde ele se encontra e comparar páginas diferentes.

2.2.2.6 Quetext

Seria quase impossível fazer uma lista de instrumentos de detecção de plágio sem mencionar o Quetext, que tem uma popularidade significativa.

É uma ferramenta bem desenvolvida e eficaz para detectar páginas da Internet com conteúdo semelhante ao seu.

O senhor também pode selecionar a opção “calculate similarity score” para obter resultados mais precisos.

Uma vez que as duplicatas em seu site forem detectadas, será fácil removê-las.

Capítulo 3: Como remover ou evitar a duplicação de conteúdo

A remoção de conteúdo duplicado ajudará a assegurar que a página correta seja acessível e indexada por aranhas de motores de busca

No entanto, o senhor talvez não queira remover todo o conteúdo duplicado, mas diga aos motores de busca qual é a versão original a ser indexada

É assim que o senhor pode fazer:

3.1. rel = “canônico” tag

Isto é graças ao atributo Rel = etiqueta canônica atribuem que os spiders dos motores de busca reconhecem a versão duplicada da URL de uma página

Os motores de busca enviarão então todos os links e poder de ranking para a URL especificada, pois eles a considerarão como sendo a versão original.

O uso do rel = canônico a etiqueta não removerá a página duplicada dos resultados das buscas. Ela simplesmente permite que os motores de busca saibam qual página original deve se beneficiar em tempo real de qualquer equidade de link

Essas rel = tags canônicas são úteis quando a versão duplicada não precisa ser removida, como por exemplo, URLs com parâmetros ou cortes de trailing slashes.

3.2. 301 redirecionamentos

O uso de um 301 redirecionar o redirecionamento é a melhor opção, se o senhor não quiser que a página duplicada seja acessível

Quando o senhor estabelece um 301 redirecionamento, ele diz ao motor de busca qual página está recebendo todo o tráfego e os valores de SEO.

Ao decidir qual página manter e quais páginas redirecionar, procure a página com melhor desempenho e a mais otimizada

Quando o senhor combinar várias páginas que estão competindo por posições de classificação em um único conteúdo, criará uma página mais forte e mais relevante que tanto os motores de busca quanto os usuários preferirão.

3.3. Robôs Meta Noindex

O noindex tag a tag é um trecho de código que o senhor acrescenta ao cabeçalho HTML da página que deseja excluir dos índices dos motores de busca

Quando o senhor acrescenta o código “conteúdo = noindex, siga”, está dizendo aos motores de busca que rastejem os links da página, mas isso os impede de acrescentar esse conteúdo a seus índices.

A etiqueta noindex também é útil na gestão de conteúdo duplicado em paginação. A paginação ocorre quando o conteúdo se estende por várias páginas, resultando em múltiplas URLs

3.4. Etiqueta canônica auto-referencial

Para evitar raspagem de conteúdo, o senhor pode acrescentar a meta tag rel = canônica que aponta para a URL onde a página já está localizada, isto cria uma página autocanônica.

Acrescentar essa etiqueta dirá aos motores de busca que a página atual é a original.

Quando um site é copiado, o código HTML é extraído do conteúdo original e adicionado a uma URL diferente

Se a tag canônica estiver incluída no código HTML, provavelmente também será copiada para o site duplicado, preservando assim a página original como a versão canônica

É importante notar que essa é uma proteção adicional que só funcionará se os raspadores de texto copiarem essa parte do código HTML.

Capítulo 4: Outras perguntas feitas sobre o conteúdo duplicado

4.1. O que é conteúdo duplicado?

Conteúdo duplicado é quando há dois ou mais conteúdos idênticos ou similares dentro ou fora de um website.

4.2. Quão ruim é o conteúdo duplicado para a SEO?

O conteúdo duplicado é ruim por duas razões principais:

Quando há múltiplas versões de conteúdo disponíveis, isso reduz o desempenho de todas as versões do conteúdo, já que elas competem entre si.

Isso também torna difícil para os motores de busca determinar qual versão indexar e depois exibir em seus resultados de busca

4.3. Quais são os diferentes tipos de conteúdo duplicado?

Há dois tipos de conteúdo em duplicata:

  • Conteúdo duplicado interno ocorre quando um domínio cria conteúdo duplicado através de múltiplas URLs internas (no mesmo website).
  • Conteúdo duplicado externo, também conhecido como duplicação entre domínios, ocorre quando dois ou mais domínios diferentes têm a mesma cópia de página indexada por motores de busca.

A duplicação externa e interna pode ocorrer como duplicatas exatas ou quase duplicatas.

4.4. Quais são os riscos da SEO de conteúdo duplicado?

Tecnicamente, o conteúdo duplicado ainda pode ter um impacto na classificação dos motores de busca. Quando há mais de uma peça de conteúdo muito semelhante, os motores de busca têm dificuldade de decifrar a melhor versão.

Alguns dos problemas que os websites podem experimentar com conteúdo duplicado incluem Dificuldade na classificação dos resultados das buscas, diminuição do tráfego orgânico, etc.

4.5. Como evitar a duplicação de conteúdo em seu site?

Para evitar duplicidade de conteúdo, o senhor tem duas possibilidades:

  • Use o GSC para ver URLs com conteúdo duplicado em seu site;
  • Usar um instrumento de detecção de plágio pago.

4.6. O que é copiar e colar na web?

Copiar e colar é a prática de copiar o texto completo de uma página interna ou externa de um site para produzir novo conteúdo. Essa prática é também conhecida como plágio e é uma grande ameaça para o proprietário do site.

4.7. O Google penaliza o conteúdo duplicado?

SIM! Copiar o trabalho de outra pessoa sem tomar precauções pode não só afetar o ranking de SEO de seu site, mas também fazer com que ele seja desvinculado do índice do Google.

Em resumo

Embora o conteúdo duplicado muitas vezes não seja criado intencionalmente, pode prejudicar indiretamente o valor e o potencial de classificação de sua SEO se não for acompanhado.

Quando o senhor souber como lidar com conteúdos duplicados em seu website, as aranhas dos motores de busca acharão mais fácil desempenhar seu papel na indexação e classificação de seu website.

É por isso que tomamos tempo para detalhar cada um dos pontos mencionados na introdução a este artigo

Cabe ao senhor ver até que ponto essas diferentes noções permitirão ao senhor otimizar eficazmente seu website.

E se o senhor tem outras dicas para lutar contra a duplicação de conteúdo, não hesite em compartilhá-las conosco nos comentários.

Até breve!

Deixe um comentário