Schlagwort-Archive: Plagiate

Plagiate der eigenen Webseite aufspüren

Nachdem ich in letzter Zeit immer fter, mehr oder weniger per Zufall, ber vollstndige Kopien einzelner meiner Beitrge gestolpert bin habe ich mich nun etwas tiefer mit dem Thema beschftigt.

Vorweg, ich und das trifft vermutlich auf viele andere Autoren ebenfalls zu, habe absolut nichts dagegen, wenn jemand auf seiner Webseite einen kurzen Teaser zu einem Beitrag verfasst und dann auf den eigentlichen Artikel verlinkt. Im Gegenteil, das Internet und die Bewertung von Artikeln in den Suchtreffern von Suchmaschinen hngen u. a. von genau solchen Verlinkungen ab und sind daher jederzeit willkommen.

Leider gibt es jedoch auch Mitmenschen die aus Unwissenheit oder aber aus Vorsatz ganze Artikel via Copy & Paste auf Ihre Seite kopieren und z. T. sogar ohne Referenz zum Ursprungsartikel als eigenes Werk ausgeben. Dieses Verhalten hat leider einige Nachteile, insbesondere fr den Autor der den Beitrag mit viel Arbeit erstellt hat:

1. Suchmaschinen haben fr doppelte Webseiten (double content) kein Verstndnis und knnen natrlich auch nicht entscheiden wer der legitime Autor des Inhalts ist. Daher werden in der Regel alle Seiten bei der Anzeige der Suchergebnisse bestraft.

2. Viele Webseiten finanzieren die Kosten fr das Hosting und z. B. der getesteten Soft- und Hardware durch Werbebanner auf der Webseite. Werden diese seltener angezeigt bzw. angeklickt, fliet (noch) weniger Geld und der Autor muss noch mehr aus eigener Tasche zahlen.

Die ganzen moralischen und rechtlichen Aspekte lasse ich jetzt mal aussen vor

Um entsprechende Plagiate meiner Webseite finden zu knnen habe ich mir einige Dienste die es dazu gibt angesehen und habe mich nach einigen Testlufen dazu entschlossen bei PlagSpotter alle meine Artikel (227) fr etwas mehr als 10 prfen zu lassen. Das Ergebnis sieht dabei absolut nicht gut aus. Fr einen groen Teil der Seiten wurden Plagiate im roten Bereich (mehr als 50% des Inhalts) entdeckt:

image

Schaut man jedoch in die Detailansicht, so wird das ganze wieder relativiert:

image

ich kann gut damit leben, dass mein Slogan (ist ein Zitat) auf mehreren Seiten vorkommt und ich kann auch gut damit leben, dass andere WordPress verwenden und daher die entsprechenden Textbausteine wie Dieser Beitrag wurde unter abgelegt und mit verschlagwortet verwenden. Wie der Scanner hier auf einen content match von 45% kommt ist mir nicht wirklich klar. Zudem scheint es Probleme mit der Darstellung von Umlauten zu geben (wohl noch nie was von Unicode gehrt):

image

Da WordPress ein sehr verbreitetes Blogsystem ist, htte ich auch erwartet, dass der Scanner hier etwas differenzierter vorgeht und z. B. den Inhaltsbereich eines Beitrages von den Kommentaren unterscheiden kann. Bei tatschlichen Duplikaten habe ich nmlich in einem mir bekannten Beispiel nur eine Trefferquote von unter 10% die Seite kopiert jedoch tatschlich meinen ganzen Artikel, allerdings ohne die unzhligen Kommentare darunter

Alles in allem hat mich das Tool leider nicht berzeugen knnen. Werde wohl weiterhin von Hand das Web und meine Logs nach Plagiaten durchsuchen mssen. Schade.