Isenção de responsabilidade: Este artigo foi gerado usando tradução automática.

Detecção de conteúdo duplicado

Prev Next

Plans supporting this feature:Enterprise

Manter um conteúdo consistente e único em uma base de conhecimento crescente pode ser desafiador. Com o tempo, conteúdos semelhantes ou idênticos frequentemente aparecem em múltiplos artigos, tornando as atualizações demoradas e potencialmente levando a informações inconsistentes.

Para simplificar esse processo, o Document360 introduz o recurso de detecção de conteúdo duplicado , um sistema inteligente que identifica e reporta conteúdos duplicados em todo o seu projeto. Isso ajuda a detectar, revisar e gerenciar informações repetidas de forma eficiente.

Quando um usuário inicia uma varredura, a Eddy AI analisa todos os artigos dentro do projeto, comparando o conteúdo um a um em vez de quebrar frases no meio do processo. Após a varredura, um relatório detalhado destaca o conteúdo duplicado e sugere criar trechos para reutilização, garantindo consistência e atualizações futuras fáciles.

NOTA

  • Atualmente, a detecção de conteúdo duplicado suporta apenas conteúdo em inglês .

  • Os usuários podem realizar até quatro escaneamentos manuais por mês. Uma vez atingido esse limite, a opção de escaneamento será desativada até o próximo mês.

Ativando a detecção de conteúdo duplicado

Para habilitar o recurso:

  1. No Portal da base de conhecimento, navegue até Configurações () > Configurações de IA > Eddy AI.

  2. Desça até o acordeão da suíte AI Premium .

  3. Ative a opção de detecção de conteúdo duplicado .

Eddy AI Assistant features duplicate content detection for optimizing documentation efficiently.

Uma vez ativado, você pode iniciar varreduras e visualizar relatórios através da página de Snippets ou Knowledge Puls .

Acessando o relatório de conteúdo duplicado

Você pode acessar o relatório de Conteúdo Duplicado de duas maneiras:

Método 1: Da Trechos página

Método 2: Da página do pulso do conhecimento

  1. Navegue até Documentação () > Ferramentas de conteúdo > Trechos.

  2. Na Trechos página, localize o banner de detecção de conteúdo duplicado no topo.

Document360 interface showing snippets management and content optimization features.

  1. Clique em Encontrar duplicatas para iniciar o processo de detecção (no primeiro uso).
    Uma vez escaneados, o número total de instâncias de conteúdo duplicado aparecerá.
    Se existir uma varredura anterior, clique em Escanear novamente para escanear novamente o projeto.

  2. Clique em Sugestão de Revisão para abrir o relatório de conteúdo duplicado.

Document management interface showing duplicate content instances and snippet creation options.

  1. No portal da base de conhecimento, clique no ícone Pulso de Conhecimento (Knowledge pulse icon) na barra de navegação à esquerda.

  2. Na seção Detecção de Conteúdo Duplicado , clique em Escanear agora para iniciar a varredura.

    Dashboard displaying duplicate content detection with a prominent 'Scan now' button highlighted.

    Uma vez concluído, você pode ver:

    • Número de artigos analisados

    • Número de artigos impactados

    • Número de blocos de texto duplicados identificados

    • Número de sugestões de trechos geradas

    • Data do último escaneamento

    • Próxima data agendada do exame

  3. Clique em Escanear novamente para reabrir a detecção ou Ver relatório para abrir os resultados detalhados.

Dashboard displaying duplicate content detection statistics and scan options for articles.

Trabalhando com o relatório de detecção de conteúdo duplicado

O relatório de detecção de conteúdo duplicado inclui duas abas:

  • Duplicados identificados: Exibe a lista de parágrafos duplicados detectados.

  • Duplicados ignorados: Exibe os duplicados que você escolheu ignorar manualmente.

Duplicatas identificadas Tab

Document360 interface showing duplicate content detection and suggested articles for replacement.

  1. O painel à esquerda lista todas as duplicadas sugeridas pelo Eddy AI.

  2. Use o menu suspenso do filtro para ordenar por sugestões de snippets Todos, Novos ou Existentes .

  3. Cada duplicata exibe o número de ocorrências em todo o seu projeto (por exemplo, "Este conteúdo aparece 16 vezes em 10 artigos").

A versão mais recente do artigo é sempre usada para comparação.

Clique em qualquer duplicado sugerido para ver os detalhes no painel direito. Aqui pode,

  1. Edite o nome sugerido do trecho.

  2. Visualize ou confirme o idioma (definido para inglês por padrão).

  3. Clique em Ignorar para mover o conteúdo duplicado para a aba Ignorados duplicados.

  4. Clique em Adicionar trecho e atualizar artigos para substituir o conteúdo duplicado em todos os artigos listados.

  5. Veja a porcentagem de correspondência para cada conteúdo duplicado.

NOTA

  • Um trecho é recomendado apenas se sua pontuação de correspondência for 80% ou mais.

  • Pontuação de Peso = [(Pontuação Vetorial × 70%) + (Pontuação ROUGE × 30%)] ÷ 100

  • Sugestões de trechos são listadas em ordem decrescente com base no número de vezes que o duplicado aparece.

Edição de conteúdo gerado

  1. Clique no ícone Editar () ao lado do conteúdo gerado desejado.

  2. No diálogo de sugestões de Editar trechos , edite o trecho sugerido e aplique a formatação usando as ferramentas disponíveis.

  3. Clique em Atualizar para salvar as alterações.

Quando você edita o conteúdo sugerido, a porcentagem de correspondência duplicada é recalculada automaticamente com base nas edições. Mesmo que a pontuação caia abaixo de 80%,a porcentagem atualizada permanece visível para comparação. A própria lista de sugestões não se atualiza com base na nova porcentagem; Ele continua refletindo as partidas originais identificadas antes da edição.

Visualização de versões dos artigos e comparação

  1. Navegue até a página de Detecção de Conteúdo Duplicado , onde você pode localizar os Artigos identificados com a seção de conteúdo duplicado.

  2. Passe o mouse sobre um artigo e clique no ícone para ver os detalhes do artigo.

  3. Clique em Pré-visualização para comparar o conteúdo original e gerado.
    A prévia utiliza uma visualização dividida unificada para todos os tipos de editores. O lado esquerdo mostra o conteúdo original do artigo, e o lado direito mostra a versão atualizada com o trecho aplicado. O texto excluído é destacado em vermelho, o texto adicionado em verde e a formatação muda em azul. No lado direito, o trecho inserido também é delineado com um retângulo pontilhado para que você possa ver claramente o conteúdo que substituirá o texto duplicado.

Document360 interface showing duplicate content detection and OpenAI privacy policies section.

  1. Use Próximo e Anterior para navegar entre as prévias de sugestões de artigos. Se você não quiser que o conteúdo sugerido seja substituído por um trecho de um artigo específico, desmarque a caixa de seleção Artigo selecionada para atualização .

Instructions for integrating Document360 with highlighted steps and navigation details.

NOTA

Se um artigo ou trecho foi modificado desde a última digitalização, a prévia mostrará: "Parece que o trecho/artigo foi atualizado desde a última digitalização. Por favor, reescaneie para obter os resultados mais recentes."


Adicionando o trecho

  1. Verifique o conteúdo e selecione os artigos aos quais deseja aplicar o trecho.

  2. Clique em Adicionar trecho e atualizar artigos.

  3. Clique em Prosseguir no diálogo Adicionar trechos e atualizar artigos.

  4. Uma mensagem de torradeira aparece: "Trecho adicionado e artigos atualizados com sucesso."

Aba Duplicados Ignorados

A aba Ignorados duplicados lista conteúdos duplicados para os quais você selecionou a opção Ignorar .

A aba Duplicatas identificadas e Duplicatas Ignoradas é semelhante. A aba Duplicados Ignorados tem duas diferenças:

  • Sugestões ignoradas não podem ser editadas.

  • Cada entrada inclui uma opção de Mover para abrir a lista para restaurar a sugestão para revisão.

Sugestões ignoradas persistem mesmo após um novo exame. Se a lista de artigos impactados mudar em uma varredura futura, a entrada na aba Duplicados Ignorados é atualizada para refletir a lista de novos artigos.

Document360 interface showing duplicate content detection and translation status options.


Perguntas Freqüentes

Na detecção de conteúdo duplicado, que tipo de conteúdo o sistema analisa?

O sistema analisa apenas parágrafos em texto simples de artigos. Parágrafos devem ser blocos de texto simples para serem qualificados para detecção de duplicados.

Os seguintes tipos de conteúdo são ignorados:

  • Listas

  • Elementos de mídia (imagens, vídeos, GIFs)

  • Tabelas

  • Chamadas

  • Conteúdo que contém hiperlinks

  • Acordeões

  • Perguntas frequentes

  • Guias

  • Conteúdo condicional

  • Parágrafos que contêm variáveis

  • Parágrafos com mais de 4000 caracteres

  • Parágrafos contendo menos de 50 caracteres/3 frases

Esses elementos são excluídos para garantir que a detecção de duplicados foque apenas em conteúdo comparável baseado em texto. Além disso, guias passo a passo, árvores de decisão e páginas personalizadas são excluídos da varredura de detecção de conteúdo duplicado.

O que acontece se um parágrafo contiver variáveis?

Parágrafos contendo variáveis são excluídos do detecti de duplicaçãoem.

Quem pode executar a varredura de detecção de duplicados?

Somente usuários com acesso de atualização ao módulo de reutilização de conteúdo podem iniciar varreduras.

E se eu não tiver acesso a certos artigos?

Artigos aos quais você não tem acesso não aparecerão na lista duplicada.

O que acontece se o conteúdo detectado já existir como um trecho?

A Eddy AI ainda identificará como conteúdo duplicado.

  • O conteúdo de trechos existente torna-se o conteúdo principal.

  • Uma tag de trecho existente é adicionada contra as sugestões.

  • A porcentagem de correspondência é recalculada em relação a esse trecho.

  • Conteúdo duplicado em outros artigos é substituído pelo trecho existente.

  • A edição do trecho deve ser feita no módulo Snippets, não no relatório de detecção de conteúdo duplicado.

Se o trecho mudou desde aúltima varredura, a mensagem "Parece que o trecho foi atualizado desde a última varredura. Por favor, reescaneie para obter os resultados mais recentes." aparecerá na prévia.

O que acontece se um trecho ou artigo for excluído após a varredura?

Se o trecho for excluído, tentar atualizar qualquer artigo usando esse trecho falha. A mensagem "Atualização falhou" aparece, e a sugestão é removida da lista.

Se um artigo incluído na varredura for posteriormente deletado, ele não aparece mais na lista de artigos impactados. No entanto, a contagem de ocorrências (por exemplo, "Este conteúdo aparece 6 vezes em 3 artigos") ainda reflete os resultados originais da varredura. O número de artigos selecionáveis é reduzido porque o artigo deletado não pode ser atualizado.

Como o sistema lida com o conteúdo editado após a última varredura?

Se um artigo for atualizado após a digitalização:

  • O sistema mostra a mensagem: "Parece que o artigo foi atualizado desde a última digitalização. O conteúdo duplicado sugerido não é mais encontrado. Por favor, reescaneie para obter os resultados mais recentes."

  • O artigo é desselecionado e desativado por padrão durante a prévia.

  • Se você tentar atualizar conteúdo sem pré-visualizar, verá o seguinte: "Snippet adicionado: X artigos atualizados, Y falhou."

Qual é o limite máximo e mínimo de palavras para escanear conteúdo duplicado?

Osyste m pode escanear no máximo 4000 caracteres e no mínimo 50 caracteres por parágrafo durante o processo de detecção de conteúdo duplicado.

O que acontece com comentários inline quando conteúdo duplicado é convertido em um trecho?

Quando um conteúdo duplicado é identificado e convertido em um trecho, quaisquer comentários inline presentes nesse conteúdo serão deletados. No entanto, esses comentários deletados ainda estarão disponíveis na seção resolvida do painel de comentários inline para fins de referência.

O que acontece com as definições do glossário quando um conteúdo duplicado é convertido em um trecho?

Se o conteúdo duplicado contiver um termo do glossário, a definição do glossário associada a esse termo é removida durante a substituição do trecho. O termo permanece no artigo, mas sua definição não aparecerá mais. Você será informado sobre isso durante a confirmação da atualização.

Qual editor será aberto ao editar conteúdo sugerido na página de Detecção de Conteúdo Duplicado?

O editor utilizado depende dos tipos de editores dos artigos impactados e do trecho sugerido:

  • Se todos os artigos impactados, o trecho sugerido e o editor padrão do projeto estiverem no Markdown, o trecho abre no editor do Markdown, e o trecho criado também estará no Markdown.

  • Se algum deles usar um editor WYSIWYG/Advanced WYSIWYG, o trecho abre no editor Advanced WYSIWYG, e o trecho criado estará no Advanced WYSIWYG.

Como a detecção de conteúdo duplicado afeta o status do artigo?

Quando um trecho é criado e adicionado, o conteúdo duplicado em todos os artigos selecionados é substituído por esse trecho. A formatação foi mantida do artigo onde esse conteúdo duplicado apareceu pela primeira vez.

  • Para artigos preliminares, as alterações são aplicadas dentro da mesma versão (a menos que o rascunho esteja bloqueado).

  • Para artigos publicados, o conteúdo é atualizado e o artigo é automaticamente republicado.

Uma nota intitulada "Publicado através de Snippets" é adicionada ao histórico de versões. A auditoria em equipe também registra a adição de trechos e a lista de artigos atualizados por meio deste módulo.

Artigos clonados aparecem na varredura de conteúdo duplicado?

Sim. A varredura roda no nível do projeto, então artigos clonados, sejam criados dentro do mesmo ambiente de trabalho ou entre diferentes ambientes de trabalho, são tratados como artigos separados. Qualquer conteúdo duplicado na versão clonada aparecerá como uma entrada separada nos resultados da varredura.