April Fools-hoax-Geschichten anbieten könnte, Anhaltspunkte zu identifizieren, die „fake news“

Studium der April Fools hoax-Nachrichten bieten konnten Hinweise zu entdecken „fake news“ – Artikel, neue Forschung zeigt.

Wissenschaftliche Experten in der Verarbeitung Natürlicher Sprache von der Lancaster University, die daran interessiert sind Täuschung gegenüber der Sprache in der SCHRIFTLICHEN April Fools hoaxes und fake-news stories.

Sie haben entdeckt, dass es ähnlichkeiten in der Struktur geschrieben von humorvollen April Fools hoaxes — spoof Artikel veröffentlicht von Medien jeden, der 1. April — und bösartige gefälschte Nachrichten Geschichten.

Die Forscher zusammengestellt haben, einen neuen Datensatz, oder corpus, die von mehr als 500 Aprilscherz-Artikel stammen aus mehr als 370 websites und schriftlich über 14 Jahren.

„April Fools hoaxes sind sehr nützlich, weil Sie uns mit einer nachprüfbaren Körper der trügerischen Texten, die uns die Möglichkeit geben, sich über die sprachlichen Techniken verwendet, wenn ein Autor etwas schreibt fiktive verkleidet als ein Tatsachenbericht“, sagte Edward Dearden von der Lancaster University, und Blei-Autor der Forschung. „Mit Blick auf die Sprache, in der April Fools und vergleicht Sie mit gefälschten Nachrichten, die wir bekommen können ein besseres Bild von der Art der Sprache, die von den Autoren der Desinformation.“

Ein Vergleich des Aprilscherz-Scherz Texte gegen eine echte news-Artikel geschrieben und in dem gleichen Zeitraum-aber nicht veröffentlicht am 1. April — enthüllt stilistische Unterschiede.

Die Forscher konzentrierten sich auf bestimmte Funktionen innerhalb der Texte, wie die Menge der details, die verwendet werden, Unbestimmtheit Formalität der Schreibstil und die Komplexität der Sprache.

Sie verglichen dann die Aprilscherz-Geschichten mit einer „fake-news“ dataset zuvor, zusammengestellt von einer anderen Gruppe von Forschern.

Auch wenn nicht alle features in den April Fools hoaxes wurden gefunden, um nützlich zu sein für das erkennen von gefälschten Nachrichten, gab es eine Reihe von ähnlichen Merkmalen gefunden, in beiden.

Fanden Sie April Fools hoaxes und fake-news-Artikel neigen dazu, enthalten weniger komplexe Sprache, leichter Lesen Schwierigkeiten, und längere Sätze als die echten Nachrichten.

Wichtige details für die news-Geschichten, wie Namen, Orten, Daten und Zeiten, die gefunden wurden, verwendet werden weniger Häufig in April Fools hoaxes und fake-news. Aber Eigennamen wie die Namen von prominenten Politikern ‚Trump‘ oder ‚Hillary‘, sind reichlich vorhanden in fake news als echte news-Artikel oder April Fools, die haben deutlich weniger.

First-person-Pronomen, wie „wir“, sind auch eine wichtige Eigenschaft für beide April Fools und gefälschte Nachrichten. Dieses geht gegen die traditionelle Denkweise in deception detection, was darauf hindeutet, Lügner weniger first-person-Pronomen.

Die Forscher fanden heraus, dass April fools-hoax-Geschichten, wenn im Vergleich zu den echten Nachrichten:

  • Sind in der Regel kürzer in der Länge
  • Verwenden Sie mehr eindeutige Wörter
  • Verwenden Sie längere Sätze
  • Sind einfacher zu Lesen
  • Beziehen sich auf vage Ereignisse in der Zukunft
  • Enthalten weitere Verweise auf die Gegenwart
  • Interessieren sich weniger in der Vergangenheit
  • Weniger Substantive
  • Verwenden Sie mehr first-person-Pronomen

Gefälschte Nachrichten, wenn im Vergleich zu den echten Nachrichten:

  • In der Länge kürzer sind
  • Sind einfacher zu Lesen
  • Verwenden vereinfachende Sprache
  • Weniger Satzzeichen
  • Enthalten weitere Eigennamen
  • Sind in der Regel weniger formal-Einsatz mehr ersten Namen wie „Hillary“ und enthalten mehr vulgäre Ausdrucksweise und Rechtschreibung Fehler
  • Enthalten nur sehr wenige Termine
  • Verwenden Sie mehr first-person-Pronomen

Die Forscher erstellten ein machine-learning ‚classifier‘ zu identifizieren, wenn Artikel April Fools hoaxes, gefälschte Nachrichten oder echte Neuigkeiten. Der Sichter erzielt einen 75 Prozent Genauigkeit bei der Identifizierung April Fools Artikeln und 72 Prozent für die Identifizierung von gefälschten Nachrichten. Wenn der Klassifikator trainiert wurde auf April Fools hoaxes und die Aufgabe der Identifizierung der gefälschten Nachrichten aufgezeichnet mit einer Genauigkeit von mehr als 65 Prozent.

Dr. Alistair Baron, co-Autor des Papiers, sagte: „mit Blick auf details und Komplexität innerhalb eines Textes sind entscheidend, wenn Sie versuchen, um zu bestimmen, wenn ein Artikel ist eine Falschmeldung. Obwohl es viele Unterschiede, unsere Ergebnisse deuten darauf hin, dass April Fools und fake-news-Artikel teilen einige ähnliche Funktionen, die meist mit der strukturellen Komplexität.

„Unsere Ergebnisse deuten darauf hin, dass es gewisse Gemeinsamkeiten zwischen den verschiedenen Formen der Desinformation und der Erforschung dieser ähnlichkeiten können wichtige Erkenntnisse für künftige Forschung in trügerischer news stories“.

Die Forschung wurde dargelegt in dem Papier, ‚Fool‘ s Errand: Suchen auf April Fools Hoaxes als Desinformation durch die Linse der Täuschung und Humor‘, wird präsentiert auf der 20th International Conference on Computational Linguistics and Intelligent Text Processing, in La Rochelle im April.

Das Papier Autoren sind Edward Dearden und Alistair Baron von der Universität Lancaster. Edward Dearden ‚ s PhD-Studien wurden unterstützt von dem Engineering and Physical Sciences Research Council.