Haftungsausschluss: Dieser Artikel wurde durch maschinelle Übersetzung erstellt.

Erkennung von doppelten Inhalten

Prev Next

Plans supporting this feature:Enterprise

Die Aufrechterhaltung konsistenter und einzigartiger Inhalte über eine wachsende Wissensdatenbank hinweg kann eine Herausforderung sein. Im Laufe der Zeit erscheinen oft ähnliche oder identische Inhalte in mehreren Artikeln, was Aktualisierungen zeitaufwendig macht und potenziell zu inkonsistenten Informationen führt.

Um diesen Prozess zu vereinfachen, führt Document360 die Funktion zur Erkennung doppelter Inhalte ein, ein intelligentes System, das doppelte Inhalte im gesamten Projekt identifiziert und meldet. Das hilft Ihnen, wiederholte Informationen effizient zu erkennen, zu überprüfen und zu verwalten.

Wenn ein Nutzer einen Scan startet, analysiert Eddy AI alle Artikel im Projekt und vergleicht die Inhalte einzeln, anstatt Sätze mittendrin zu brechen. Nach Abschluss des Scans hebt ein detaillierter Bericht doppelte Inhalte hervor und schlägt vor, Ausschnitte für die Wiederverwendung zu erstellen, um Konsistenz und einfache zukünftige Updates zu gewährleisten.

ANMERKUNG

  • Die Erkennung von doppelten Inhalten unterstützt derzeit ausschließlich englische Inhalte.

  • Nutzer können bis zu vier manuelle Scans pro Monat durchführen. Sobald dieses Limit erreicht ist, wird die Scan-Option bis zum nächsten Monat deaktiviert.

Aktivieren der Erkennung von doppelten Inhalten

Um die Funktion zu aktivieren:

  1. In der Knowledge base portal, navigiere zu () > KI-Einstellungen > Eddy AI.

  2. Scrollen Sie nach unten zur Akkordeon der AI Premium Suite .

  3. Schalte den Schalter für die Erkennung doppelter Inhalte ein.

Eddy AI Assistant features duplicate content detection for optimizing documentation efficiently.

Sobald aktiviert, können Sie Scans starten und Berichte über die Seite Snippets oder Knowledge Pulse ansehen.

Zugriff auf den Bericht über doppelte Inhalte

Sie können auf den Bericht über doppelte Inhalte auf zwei Arten zugreifen:

Methode 1: Von der Snippets Seite

Methode 2: Von der Knowledge Pulse-Seite

  1. Navigiere zu Documentation () > Content tools > Snippets.

  2. Auf der Snippets Seite finden Sie oben das Banner zur Erkennung doppelter Inhalte .

Document360 interface showing snippets management and content optimization features.

  1. Klicken Sie auf Duplikate finden , um den Erkennungsprozess (bei der ersten Benutzung) zu starten.
    Nach dem Scannen wird die Gesamtzahl der doppelten Inhaltsinstanzen angezeigt.
    Wenn ein vorheriger Scan vorhanden ist, klicken Sie erneut auf Scannen , um das Projekt erneut zu scannen.

  2. Klicken Sie auf Review-Vorschlag, um den Bericht über doppelte Inhalte zu öffnen.

Document management interface showing duplicate content instances and snippet creation options.

  1. Im Knowledge Base-Portal klicken Sie auf das Knowledge Pulse (Knowledge pulse icon)- Symbol in der linken Navigationsleiste.

  2. Im Bereich Erkennung doppelter Inhalte klicken Sie auf Jetzt scannen , um den Scan zu starten.

    Dashboard displaying duplicate content detection with a prominent 'Scan now' button highlighted.

    Nach Abschluss können Sie:

    • Anzahl der analysierten Artikel

    • Anzahl der betroffenen Artikel

    • Anzahl der identifizierten doppelten Textblöcke

    • Anzahl der generierten Snippet-Vorschläge

    • Letztes Scan-Datum

    • Nächster geplanter Scantermin

  3. Klicken Sie erneut auf Scannen , um die Erkennung erneut durchzuführen, oder auf Bericht anzeigen , um die detaillierten Ergebnisse zu öffnen.

Dashboard displaying duplicate content detection statistics and scan options for articles.

Arbeit mit dem Bericht zur Erkennung doppelter Inhalte

Der Bericht zur Erkennung doppelter Inhalte enthält zwei Tabs:

  • Identifizierte Duplikate: Zeigt die Liste der erkannten doppelten Absätze an.

  • Ignorierte Duplikate: Zeigt die Duplikate an, die du manuell ignoriert hast.

Duplikate identifiziert Tab

Document360 interface showing duplicate content detection and suggested articles for replacement.

  1. Das linke Panel listet alle von Eddy AI vorgeschlagenen Duplikate auf.

  2. Verwenden Sie das Filter-Dropdown-Menü, um nach Vorschlägen für alle, neue oder bestehende Ausschnitte zu sortieren.

  3. Jedes Duplikat zeigt die Anzahl der Vorkommnisse in Ihrem Projekt an (zum Beispiel: "Dieser Inhalt erscheint 16 Mal in 10 Artikeln").

Die neueste Version des Artikels wird immer zum Vergleich verwendet.

Klicken Sie auf ein beliebiges vorgeschlagenes Duplikat, um Details im rechten Feld anzuzeigen. Hier kannst du,

  1. Bearbeiten Sie den vorgeschlagenen Snippet-Namen.

  2. Sehen Sie sich die Sprache an oder bestätigen Sie sie (standardmäßig auf Englisch eingestellt).

  3. Klicken Sie auf Ignorieren , um den doppelten Inhalt in den Reiter "Ignorierte Duplikate" zu verschieben.

  4. Klicken Sie auf Artikel hinzufügen und Artikel aktualisieren , um den doppelten Inhalt in allen aufgeführten Artikeln zu ersetzen.

  5. Sieh dir die prozentuale Übereinstimmung für jeden doppelten Inhalt an.

ANMERKUNG

  • Ein Snippet wird nur empfohlen, wenn sein Match-Wert 80 % oder höher beträgt.

  • Gewichtungswert = [(Vektorwert × 70 %) + (ROUGE-Wert × 30 %)] ÷ 100

  • Snippet-Vorschläge werden in absteigender Reihenfolge aufgelistet, basierend darauf, wie oft das Duplikat erscheint.

Bearbeitung generierter Inhalte

  1. Klicken Sie auf das Bearbeiten ()-Symbol neben dem gewünschten generierten Inhalt.

  2. Im Dialog "Ausschnitt bearbeiten " bearbeiten Sie den vorgeschlagenen Ausschnitt und wenden Sie das Format mit den verfügbaren Werkzeugen an.

  3. Klicken Sie auf Aktualisieren , um Änderungen zu speichern.

Wenn du die vorgeschlagenen Inhalte bearbeitest, wird der Prozentsatz der doppelten Übereinstimmungen automatisch basierend auf den Änderungen neu berechnet. Selbst wenn der Wert unter 80 % fällt,bleibt der aktualisierte Prozentsatz zum Vergleich sichtbar. Die Liste der Vorschläge selbst wird nicht basierend auf dem neuen Prozentsatz aktualisiert; es spiegelt weiterhin die vor der Bearbeitung identifizierten ursprünglichen Übereinstimmungen wider.

Artikelversionen und Vergleich ansehen

  1. Navigieren Sie zur Seite zur Erkennung doppelter Inhalte , wo Sie die mit doppelten Inhalten identifizierten Artikel finden können.

  2. Fahren Sie mit der Maus über einen Artikel und klicken Sie auf das Symbol, um die Artikeldetails anzusehen.

  3. Klicken Sie auf Vorschau, um den Original- und den generierten Inhalt zu vergleichen.
    Die Vorschau verwendet eine einheitliche geteilte Ansicht für alle Editor-Typen. Die linke Seite zeigt den ursprünglichen Artikelinhalt, die rechte Seite zeigt die aktualisierte Version mit dem verwendeten Ausschnitt. Gelöschter Text ist rot hervorgehoben, hinzugefügter Text grün und Formatierungen in Blau. Auf der rechten Seite ist der eingefügte Ausschnitt ebenfalls mit einem gepunkteten Rechteck umrandet, sodass man den Inhalt deutlich sehen kann, der den doppelten Text ersetzen wird.

Document360 interface showing duplicate content detection and OpenAI privacy policies section.

  1. Nutzen Sie Next und Prev, um zwischen den Vorschauen von Artikelvorschlägen zu navigieren. Wenn Sie nicht möchten, dass der vorgeschlagene Inhalt durch einen Ausschnitt eines bestimmten Artikels ersetzt wird, deaktivieren Sie das Kontrollkästchen für den Artikel .

Instructions for integrating Document360 with highlighted steps and navigation details.

ANMERKUNG

Wenn ein Artikel oder Ausschnitt seit dem letzten Scan geändert wurde, zeigt die Vorschau an: "Sieht so aus, als wäre der Ausschnitt/Artikel seit dem letzten Scan aktualisiert worden. Bitte scannen Sie es erneut, um die neuesten Ergebnisse zu erhalten."


Hinzufügung des Ausschnitts

  1. Überprüfe den Inhalt und wähle die Artikel aus, auf die du den Ausschnitt anwenden möchtest.

  2. Klicken Sie auf Ausschnitt hinzufügen und Artikel aktualisieren.

  3. Klicken Sie im Dialog "Ausschnitt hinzufügen und Artikel aktualisieren" auf "Fortfahren".

  4. Eine Toaster-Nachricht erscheint: "Ausschnitt hinzugefügt und Artikel erfolgreich aktualisiert."

Tab Ignorierte Duplikate

Der Tab "Ignorierte Duplikate" listet doppelte Inhalte auf, für die du die Option "Ignorieren " ausgewählt hast.

Die Reiter "Duplikate identifiziert" und "Ignorierte Duplikate" sind ähnlich. Der Tab "Ignorierte Duplikate" unterscheidet sich zweierweise:

  • Ignorierte Vorschläge können nicht bearbeitet werden.

  • Jeder Eintrag enthält eine Option "Zur Liste öffnen " verschieben, um den Vorschlag zur Überprüfung wiederherzustellen.

Ignorierte Vorschläge bleiben auch nach einem neuen Scan bestehen. Wenn sich die Liste der betroffenen Artikel bei einem zukünftigen Scan ändert, wird der Eintrag im Tab "Ignorierte Duplikate" aktualisiert, um die Liste der neuen Artikel widerzuspiegeln.

Document360 interface showing duplicate content detection and translation status options.


Häufig gestellte Fragen

Welche Art von Inhalt analysiert das System bei der Erkennung von doppelten Inhalten?

Das System analysiert nur Klartextabsätze aus Artikeln. Absätze müssen einfache Textblöcke sein, um für die Duplikaterkennung zu qualifizieren.

Die folgenden Inhaltstypen werden ignoriert:

  • Listet

  • Medienelemente (Bilder, Videos, GIFs)

  • Tabellen

  • Aufrufe

  • Inhalte, die Hyperlinks enthalten

  • Ziehharmonikas

  • FAQs

  • Tabulatoren

  • Bedingter Inhalt

  • Absätze, die Variablen enthalten

  • Absätze länger als 4000 Zeichen

  • Absätze mit weniger als 50 Zeichen/3 Sätzen

Diese Elemente werden ausgeschlossen, um sicherzustellen, dass die Duplikaterkennung sich nur auf vergleichbare textbasierte Inhalte konzentriert. Zusätzlich sind Schritt-für-Schritt-Anleitungen, Entscheidungsbäume und benutzerdefinierte Seiten vom Scan zur Erkennung von doppelten Inhalten ausgeschlossen.

Was passiert, wenn ein Absatz Variablen enthält?

Absätze, die Variablen enthalten, sind von der Duplikationserkennung ausgeschlossen.

Wer kann den Duplikat-Erkennungsscan durchführen?

Nur Benutzer mit Update-Zugriff auf das Content-Reuse-Modul können Scans starten.

Was, wenn ich keinen Zugang zu bestimmten Artikeln habe?

Artikel, auf die du keinen Zugriff hast, erscheinen nicht in der Duplikatliste.

Was passiert, wenn der erkannte Inhalt bereits als Ausschnitt existiert?

Eddy AI identifiziert es weiterhin als doppelten Inhalt.

  • Der bestehende Ausschnitt wird zum Hauptinhalt.

  • Ein bestehendes Snippet-Tag wird gegen die Vorschläge hinzugefügt.

  • Der Match-Prozentsatz wird gegen diesen Ausschnitt neu berechnet.

  • Duplikatinhalte in anderen Artikeln werden durch den bestehenden Ausschnitt ersetzt.

  • Die Bearbeitung des Snippets muss im Snippets-Modul erfolgen, nicht im Bericht zur Erkennung von doppelten Inhalten.

Wenn sich der Ausschnitt seit dem letzten Scan geändert hat, erscheint die Meldung: "Sieht so aus, als wäre der Ausschnitt seit dem letzten Scan aktualisiert worden. Bitte scannen Sie erneut, um die neuesten Ergebnisse zu erhalten." wird in der Vorschau erscheinen.

Was passiert, wenn ein Ausschnitt oder ein Artikel nach dem Scan gelöscht wird?

Wenn der Ausschnitt gelöscht wird, scheitert der Versuch, einen Artikel mit diesem Ausschnitt zu aktualisieren. Die Meldung "Update fehlgeschlagen" erscheint, und der Vorschlag wird aus der Liste entfernt.

Wenn ein im Scan enthaltener Artikel später gelöscht wird, erscheint er nicht mehr in der Liste der betroffenen Artikel. Allerdings spiegelt die Anzahl der Vorkommen (zum Beispiel "Dieser Inhalt taucht in 3 Artikeln 6 Mal auf") weiterhin die ursprünglichen Scanergebnisse wider. Die Anzahl der auswählbaren Artikel wird reduziert, da der gelöschte Artikel nicht aktualisiert werden kann.

Wie geht das System mit bearbeiteten Inhalten nach dem letzten Scan um?

Wenn ein Artikel nach dem Scannen aktualisiert wird:

  • Das System zeigt die Meldung an: "Sieht so aus, als wäre der Artikel seit dem letzten Scan aktualisiert worden. Der vorgeschlagene doppelte Inhalt wird nicht mehr gefunden. Bitte scannen Sie es erneut, um die neuesten Ergebnisse zu erhalten."

  • Der Artikel wird während der Vorschau standardmäßig deaktiviert und deaktiviert.

  • Wenn du versuchst, Inhalte ohne Vorschau zu aktualisieren, siehst du: "Snippet hinzugefügt: X Artikel aktualisiert, Y fehlgeschlagen."

Was ist das maximale und minimale Wortlimit für das Scannen von doppelten Inhalten?

Das System kann während des Erkennungsprozesses von doppelten Inhalten maximal 4000 Zeichen und mindestens 50 Zeichen pro Absatz scannen.

Was passiert mit Inline-Kommentaren , wenn doppelte Inhalte in einen Ausschnitt umgewandelt werden?

Wenn doppelte Inhalte identifiziert und in einen Ausschnitt umgewandelt werden, werden alle darin enthaltenen Inline-Kommentare gelöscht. Diese gelöschten Kommentare sind jedoch weiterhin im gelösten Bereich des Inline-Kommentarpanels zu Referenzzwecken verfügbar.

Was passiert mit Glossardefinitionen, wenn doppelte Inhalte in einen Ausschnitt umgewandelt werden?

Wenn der doppelte Inhalt einen Glossarbegriff enthält, wird die mit diesem Begriff verbundene Glossardefinition beim Ausschnitt entfernt. Der Begriff selbst bleibt im Artikel bestehen, aber seine Definition wird nicht mehr erscheinen. Sie werden während der Bestätigung des Updates darüber informiert.

Welcher Editor öffnet sich, wenn vorgeschlagene Inhalte auf der Seite zur Erkennung von doppelten Inhalten bearbeitet werden?

Der verwendete Editor hängt von den Editorentypen der betroffenen Artikel und dem vorgeschlagenen Ausschnitt ab:

  • Wenn alle betroffenen Artikel, der vorgeschlagene Ausschnitt und der Standard-Editor des Projekts in Markdown sind, öffnet sich der Snippet im Markdown-Editor, und der erstellte Snippet befindet sich ebenfalls in Markdown.

  • Wenn einer dieser Editoren einen WYSIWYG- oder Advanced WYSIWYG-Editor verwendet, öffnet sich der Snippet im Advanced WYSIWYG Editor, und der erstellte Snippet befindet sich im Advanced WYSIWYG.

Wie wirkt sich die Erkennung von doppelten Inhalten auf den Status des Artikels aus?

Wenn ein Ausschnitt erstellt und hinzugefügt wird, wird der doppelte Inhalt in allen ausgewählten Artikeln durch diesen Ausschnitt ersetzt. Die Formatierung wurde aus dem Artikel beibehalten, in dem dieser doppelte Inhalt erstmals erschien.

  • Bei Entwurfsartikeln werden die Änderungen innerhalb derselben Version angewendet (es sei denn, der Entwurf ist gesperrt).

  • Bei veröffentlichten Artikeln wird der Inhalt aktualisiert und der Artikel wird automatisch neu veröffentlicht.

Ein Hinweis mit dem Titel "Veröffentlicht durch Schnipartikel" wird der Versionshistorie hinzugefügt. Team-Auditing erfasst auch die Snippet-Ergänzung und die Liste der Artikel, die in diesem Modul aktualisiert werden.

Erscheinen geklonte Artikel im Duplikatinhalt-Scan?

Ja. Der Scan läuft auf Projektebene, sodass geklonte Artikel, egal ob sie im selben Arbeitsbereich oder über verschiedene Arbeitsbereiche hinweg erstellt wurden, als separate Artikel behandelt werden. Jeder doppelte Inhalt in der geklonten Version erscheint als separater Eintrag in den Scan-Ergebnissen.