Wie FactNinja Bilder analysiert

FactNinja ist ein Tool zur Analyse visueller Inhalte wie Plakate, Memes, Screenshots von Social-Media-Kommunikation, Fotos mit Text, Propagandamaterialien, politische Werbekampagnen oder andere Arten digitaler Visuals. Nach dem Hochladen eines Bildes führt das System eine Reihe spezialisierter Analysen durch, die sich gegenseitig ergänzen und gemeinsam einen umfassenden Blick auf den untersuchten Inhalt bieten.

Jede Analyse konzentriert sich auf einen anderen Aspekt des grafischen Materials. Das System identifiziert beispielsweise den im Bild enthaltenen Text, bewertet, welche Emotionen, Haltungen oder Meinungen das Material beim Publikum hervorrufen möchte, erkennt überprüfbare Aussagen, die für Fact-Checking geeignet sind, beurteilt die Wahrscheinlichkeit der Nutzung generativer künstlicher Intelligenz bei der Erstellung des Inhalts, bewertet die Vertrauenswürdigkeit und den potenziell irreführenden Charakter der Botschaft und erkennt mögliche manipulative oder persuasive Techniken. Teil der Analyse ist auch die Aufdeckung verfügbarer Metadaten, beispielsweise durch EXIF-Analyse, und die Bewertung möglicher Bildmanipulationen, beispielsweise basierend auf Änderungen in der Kompression bei JPG-Dateien.

Diese Mehrschichtigkeit ist beabsichtigt. Ein einfaches Urteil wie „wahr“ oder „falsch“ könnte irreführend sein: Propaganda arbeitet oft mit wahren Aussagen, die in einen manipulativen Rahmen eingebettet sind, während auch ehrliche Kommunikation ungenaue oder ungeschickte Formulierungen enthalten kann. Anstatt eines eindeutigen Schlusses bieten wir daher eine Aufschlüsselung des Inhalts in einzelne Schichten, die der Benutzer selbst zu einem eigenen Urteil zusammensetzen kann.

Dieser Text erklärt, wie unsere Werkzeuge intern funktionieren: auf welchen wissenschaftlichen Prinzipien sie basieren, worin ihre Stärken liegen und wo ihre Grenzen sind.

Was passiert, wenn Sie ein Bild zur Analyse hochladen

In dem Moment, in dem Sie auf Analysieren klicken, startet das System im Hintergrund eine Kaskade von Einzelaufgaben. Jede bearbeitet einen Aspekt des Bildes und läuft unabhängig — das Scheitern einer Schicht beeinflusst die anderen nicht wesentlich. Wenn beispielsweise die Texterkennung bei einem sehr stilisierten Meme technisch scheitert, setzen die Hauptanalyse und die emotionale Auswertung fort. Die gesamte Kaskade dauert typischerweise einige Dutzend Sekunden bis wenige Minuten — abhängig von der Komplexität des Bildes und der Auslastung der KI-Dienste. Während des Wartens sehen Sie Live-Indikatoren, was gerade passiert.

📝

Schritt 1

Hauptanalyse

Zusammenhängender Text vom KI-Assistenten

🔤

Schritt 2

OCR-Transkription

Textextraktion aus dem Bild

🧩

Schritt 3

Erweiterte Daten

Schlüsselthemen, Aussagen, logische Trugschlüsse

🎭

Schritt 4

Visuelle Einblicke

Emotionale Analyse nach wissenschaftlichen Modellen

🤖

Schritt 5

KI-Erkennung

Wurde das Material von künstlicher Intelligenz erstellt?

🌍

Schritt 6

Übersetzungen

Automatisch in sechs Sprachen

Assistenten und Perspektiven der Analyse

Wenn Sie bei der Eingabe der Analyse einen Assistenten auswählen, wählen Sie nicht primär zwischen verschiedenen großen Sprachmodellen (LLM), sondern zwischen verschiedenen analytischen Rollen und Perspektiven. Jeder Assistent ist durch eine unterschiedliche Reihe von Anweisungen definiert, die seine Prioritäten, die Art der Inhaltsinterpretation und die Aspekte bestimmen, auf die er sich bei der Analyse konzentriert. Das Modell stellt den „Motor“ der Analyse dar, während der Assistent bestimmt, wie dieser Motor bei der Bewertung des Bildes eingesetzt wird.

Der Standardassistent von FactNinja bietet einen ausgewogenen Blick und durchläuft die wichtigsten Aspekte der Analyse. Weitere Assistenten haben ihre eigenen Spezialisierungen und Schwerpunkte, die direkt in der Anwendung bei ihrer Auswahl beschrieben sind.

Das gleiche Bild, das von verschiedenen Assistenten analysiert wird, kann daher zu unterschiedlichen Akzenten führen — und das ist beabsichtigt, nicht fehlerhaft. Ein visueller Inhalt kann legitim aus mehreren Blickwinkeln interpretiert werden, und seine Wirkung kann je nach Publikum, kulturellem Kontext oder persönlichen Einstellungen des Empfängers erheblich variieren.

Zum Beispiel kann schwarzer Humor bei einer Gruppe Belustigung, Freude oder ein Gefühl der Zugehörigkeit hervorrufen, während er bei einer anderen Gruppe Wut, Abneigung oder Empörung auslösen kann, insbesondere wenn sie mit der Person oder Gruppe sympathisiert, die das Bild karikiert. Beide Reaktionen können legitim sein und zeigen, wie unterschiedlich Menschen denselben Inhalt wahrnehmen. Solche Unterschiede in den Interpretationen sind ein natürlicher Bestandteil der menschlichen Kommunikation und stellen an sich keinen Fehler in der Analyse dar.

Das Panel Visual Insights fasst die bisherigen Ansichten zum analysierten Material zusammen, aber seine Hauptfunktion besteht darin, zu erklären, welche Emotionen, Haltungen und Reaktionen der Inhalt beim Publikum hervorrufen möchte. Es handelt sich also nicht nur um eine Zusammenfassung vorheriger Analysen, sondern um eine eigenständige Interpretationsschicht, die hilft, die psychologische und kommunikative Wirkung des Visuals zu verstehen.

Dieser Teil basiert auf mehreren wissenschaftlichen Modellen der Arbeit mit Emotionen und Medienwirkung, die wir im weiteren Text näher erläutern. Dadurch kann dasselbe Material nicht nur aus der Sicht der faktischen Richtigkeit betrachtet werden, sondern auch aus der Sicht dessen, wie es auf verschiedene Publikumsgruppen wirkt.

Wie FactNinja grafische Materialien analysiert

FactNinja verwendet bei der Analyse visueller Inhalte mehrere Arten von Werkzeugen der künstlichen Intelligenz. Die Grundlage bilden multimodale Sprachmodelle, die sowohl mit Bild als auch mit Text arbeiten können, derzeit insbesondere die Modelle GPT-5 und GPT-5-nano von OpenAI. Diese Modelle können Text im Bild lesen, visuelle Elemente beschreiben, Beziehungen zwischen ihnen erkennen und Inhalte in natürlicher Sprache interpretieren.

Wenn das System beispielsweise ein Plakat mit Lenin analysiert, geht es nicht nur darum, ein bekanntes Gesicht zu erkennen. Das Modell beobachtet auch den Grafikstil, die Typografie, die Farbgebung, die Komposition, rhetorische Elemente und historische Zusammenhänge. Es kann so Verweise auf den sowjetischen Konstruktivismus, propagandistische Sprache oder visuelle Muster identifizieren, die für bestimmte politische oder ideologische Materialien typisch sind.

Teil der Analyse sind auch spezialisierte Werkzeuge, wie Google Vision AI und Google Fact Check Tools. Diese helfen, die sprachliche Interpretation um technische und kontextuelle Informationen zu ergänzen: Sie können beispielsweise Objekte und Text im Bild erkennen, das Auftreten eines ähnlichen oder identischen Bildes im Internet nachverfolgen, herausfinden, wann und wo das Bild erschienen ist, und überprüfen, ob es bereits in der Vergangenheit als unwahr, irreführend oder mit Fake News in Verbindung stehend bewertet wurde.

Es ist jedoch wichtig zu betonen, dass KI ein Bild nicht so „sieht“ wie ein Mensch. Sie hat keine eigene Erfahrung, Intuition oder kulturelle Sensibilität im menschlichen Sinne. Sie arbeitet mit erlernten Mustern und Zusammenhängen, die sie während des Trainings auf umfangreichen Text- und Bilddatensätzen entwickelt hat. Dadurch kann sie wiederkehrende visuelle, sprachliche und bedeutungsvolle Muster erkennen, ist jedoch nicht unfehlbar.

Manchmal kann das System einem Bild eine Bedeutung zuschreiben, die tatsächlich nicht vorhanden ist. Ein anderes Mal übersieht es einen kleinen Detail, eine kulturelle Anspielung, Ironie oder einen lokalen Kontext, den ein menschlicher Beobachter sofort erfasst. Daher muss das Ergebnis der Analyse als qualifizierte Interpretation verstanden werden, nicht als endgültiges Urteil.

⚠ Schlüsselprinzip: FactNinja ist ein analytischer Helfer, kein Richter. Seine Ergebnisse sollen als Ausgangspunkt für eigenes kritisches Denken dienen. Genau deshalb kombinieren wir mehrere analytische Perspektiven, wissenschaftliche Modelle und eine transparente Methodik: damit der Benutzer genügend Grundlagen hat, um ein eigenes fundiertes Urteil zu bilden.

Neben der Haupttextanalyse liefert FactNinja auch einen strukturierten Output der Schlüsselelemente des analysierten Materials. Dieser ist wichtig, da er ermöglicht, mit den Ergebnissen weiterzuarbeiten: sie in Visualisierungen anzuzeigen, beispielsweise in Diagrammen, Karten oder Übersichtsgrafiken, sie nach Kategorien zu filtern und für weitere analytische Verarbeitung zu nutzen.

Strukturierte Daten erfassen mehrere Schlüsselbereiche der Analyse. Schlüsselthemen stellen eine Liste von Elementen dar, die das System im Bild erkannt hat — von konkreten Objekten und Personen über visuelle Stile bis hin zu abstrakten Konzepten, ideologischen Rahmen oder Kommunikationsmotiven.

Überprüfbare Aussagen sind konkrete Aussagen, die unabhängig mit verfügbaren Quellen überprüft werden können. Jede Aussage kann mit einem Status versehen werden, beispielsweise als wahr, teilweise wahr, unwahr, irreführend oder nicht überprüfbar. Diese Schicht hilft, die faktische Ebene der Botschaft von ihrer emotionalen oder rhetorischen Wirkung zu trennen.

Erkannte logische Trugschlüsse bezeichnen argumentative Fehler oder problematische Überzeugungsmethoden, die im Material auftreten können. Sie sind mit unserem Glossar der logischen Trugschlüsse verknüpft, um die einzelnen Techniken leicht zu erklären, zu vergleichen und in einen breiteren Kontext der Medienkompetenz einzubetten.

Teil des strukturierten Outputs ist auch eine laienhafte Zusammenfassung — eine kurze und verständliche Erklärung für jemanden, der den breiteren Kontext des analysierten Materials nicht kennt. Ihr Ziel ist es, schnell zu verdeutlichen, worum es im Bild geht, welche Botschaft es wahrscheinlich vermittelt und warum es relevant sein könnte.

Visual Insights: Kartierung der emotionalen Wirkung

Visual Insights ist eine der Hauptfunktionen von FactNinja. Sie verdient eine eigene Erklärung, da sie nicht nur auf einer freien Interpretation des Bildes basiert, sondern auf wissenschaftlichen Modellen, die in der Psychologie der Emotionen und der Medienanalyse verwendet werden. Diese Modelle helfen zu beschreiben, welche Emotionen, Haltungen und Reaktionen das visuelle Material beim Publikum hervorrufen möchte.

Auf die Funktion Visual Insights gelangen Sie über jede Analyse durch die Schaltfläche Visual Insights, die eine eigene Seite mit dem emotionalen Profil des analysierten Materials öffnet.

🎯 Schlüsselprinzip: Visual Insights sagt nicht, was Sie persönlich fühlen. Es beschreibt, welchen emotionalen Effekt das Material wahrscheinlich hervorrufen möchte. Dasselbe Plakat kann bei einem Betrachter Stolz und bei einem anderen Abneigung oder Wut hervorrufen. Die Analyse konzentriert sich daher nicht auf die individuelle Reaktion einer bestimmten Person, sondern auf die wahrscheinliche kommunikative Absicht und die emotionale Konstruktion des Materials.

Plutchiks Rad der Emotionen

Eines der Modelle, auf denen Visual Insights basiert, ist Plutchiks Rad der Emotionen. Der amerikanische Psychologe Robert Plutchik stellte 1980 die psychoevolutionäre Theorie der Emotionen vor, nach der Emotionen nicht nur kulturelle Konstrukte sind, sondern tief verwurzelte Reaktionen, die sich als Teil des menschlichen Überlebens entwickelt haben.

Angst warnt uns beispielsweise vor Gefahren, Wut mobilisiert Energie zur Verteidigung oder zum Widerstand, Freude fördert soziale Bindungen und Vertrauen ermöglicht Zusammenarbeit. Plutchik unterschied acht grundlegende Emotionen, aus denen sich laut seinem Modell komplexere emotionale Zustände zusammensetzen, ähnlich wie Farben aus mehreren Grundtönen bestehen.

Diese Emotionen ordnete er in einem Kreis an: Emotionen, die nebeneinander liegen, sind sich bedeutungsmäßig nahe, während Emotionen, die sich gegenüberliegen, Gegensätze bilden. Dieses Modell ermöglicht es, besser zu beschreiben, ob das Material beispielsweise mit Angst, Wut, Abneigung, Vertrauen, Freude oder deren Kombinationen arbeitet.

Beispiel für Plutchiks Rad bei einem Kriegspropagandaposter — starke Angst (85), Abneigung (75) und Wut (90) signalisieren den agitatorischen Charakter des Materials. Die Länge des Blütenblatts entspricht der Intensität der Emotion (0-100).

In der Anwendung geben wir bei jeder der acht Emotionen die Intensität auf einer Skala von 0 bis 100 an, je nachdem, wie stark das Material diese Emotion hervorruft. Im Diagramm von Plutchiks Rad wird dies als „blühende Blume“ dargestellt — je länger das Blütenblatt einer bestimmten Farbe, desto stärker der emotionale Appell dieses Typs. Ein heroisiertes Porträt eines Führers mit einer Flagge zeigt typischerweise hohe Werte von Freude, Vertrauen und Erwartung. Ein Plakat, das vor einem Feind warnt, zeigt wiederum starke Angst, Abneigung und Wut (wie in der obigen Abbildung).

Dyaden — zusammengesetzte Emotionen

Plutchiks Theorie arbeitet auch mit Kombinationen grundlegender Emotionen. Wenn zwei benachbarte Emotionen in seinem Modell verbunden werden, entstehen sogenannte Dyaden — zusammengesetzte emotionale Zustände mit eigener Bedeutung.

Zum Beispiel erzeugt Freude in Verbindung mit Vertrauen Liebe, Angst in Verbindung mit Überraschung kann zu Ehrfurcht führen, Trauer mit Abneigung erzeugt Reue und Wut in Kombination mit Erwartung kann mit Aggressivität zusammenhängen.

Der Abschnitt Dyaden in den Visual Insights zeigt, welche dieser emotionalen Kombinationen im analysierten Material am stärksten sind. Gerade diese zusammengesetzten Emotionen erfassen oft besser die kommunikative Absicht als die grundlegenden Emotionen allein. Das Material arbeitet nämlich in der Regel nicht nur mit einer isolierten Emotion, sondern mit deren Kombination: zum Beispiel mit Angst und Erwartung, Wut und Abneigung oder Freude und Vertrauen.

Russells Modell — Valenz und Aktivierung

Das zweite wissenschaftliche Fundament von Visual Insights ist Russells Modell der Emotionen, das ebenfalls 1980 veröffentlicht wurde. Der amerikanische Psychologe James A. Russell schlug vor, dass Emotionen mit Hilfe von zwei grundlegenden Dimensionen beschrieben werden können: Valenz und Aktivierung.

Valenz drückt aus, ob das emotionale Erleben eher angenehm oder unangenehm ist. Zum Beispiel haben Freude, Vertrauen oder Hoffnung eine positive Valenz, während Angst, Wut oder Abneigung eine negative Valenz haben.

Aktivierung bezeichnet das Maß an innerer Erregung oder Mobilisierung. Einige Emotionen sind ruhiger und gedämpfter, wie Trauer oder Vertrauen. Andere sind hoch aktivierend — wie Wut, Angst, Panik oder Begeisterung. Diese Dimension ist besonders wichtig bei propagandistischen und politischen Materialien, die oft nicht nur darauf abzielen, Informationen zu vermitteln, sondern das Publikum zu einer bestimmten Haltung oder Handlung zu mobilisieren.

Russells Modell hilft so, nicht nur zu unterscheiden, ob das Material positiv oder negativ wirkt, sondern auch, ob es den Betrachter eher beruhigt oder aktiviert. Gerade die Kombination von Valenz und Aktivierung ermöglicht es, die emotionale Strategie des analysierten Visuals besser zu verstehen.

Visual Insights zeigt im Russell-Raum einen Punkt, der den gesamten emotionalen „Schwerpunkt“ des analysierten Materials darstellt. Dadurch lässt sich schneller verstehen, wohin das Material emotional zielt, als wenn man nur eine Liste einzelner Emotionen betrachten würde.

Ein Kriegsplakat zielt beispielsweise oft in den Bereich unangenehmer und gleichzeitig aktivierender Emotionen, also in den Raum der Angst, des Zorns oder der Mobilisierung. Ein Plakat mit einem heroisierten Führer kann hingegen in den Bereich positiver Aktivierung zielen, etwa zu Begeisterung, Stolz oder Freude. Ein Material, das ein zerstörtes Land und hungernde Kinder zeigt, verschiebt sich wahrscheinlich in Richtung Angst, Trauer, Wut oder Hilflosigkeit.

Plutchiks kreisförmige Karte und Russells zweidimensionale Karte ergänzen sich gegenseitig. Das erste Modell hilft, konkrete grundlegende und zusammengesetzte Emotionen zu benennen, das zweite zeigt ihre Gesamtorientierung nach Angenehmheit oder Unangenehmheit und dem Grad der Aktivierung. Gemeinsam bieten sie ein genaueres Bild der emotionalen Strategie des analysierten Visuals.

Manipulationsgrad

Neben der emotionalen Analyse bewertet Visual Insights auch den gesamten Manipulationsgrad. Es handelt sich um eine synthetische Bewertung, die mehrere Analyseebenen kombiniert: die Intensität der hervorgerufenen Emotionen, die Anzahl und Art der verwendeten rhetorischen oder manipulativen Techniken und die gesamte Überzeugungskraft des Materials.

Ein vierstufiger Manipulationsindikator zeigt den gesamten Manipulationsgrad an. Der Pfeil zeigt, wohin die aktuelle Analyse fällt. Ein hoher Wert bedeutet nicht automatisch, dass das Material lügt; er zeigt vor allem die Stärke des Überzeugungsapparats.

Beim Lesen dieser Metrik ist es entscheidend, Manipulation und Unwahrheit zu unterscheiden. Ein Material kann faktisch korrekt sein und dennoch stark manipulativ — zum Beispiel, wenn es wahre Informationen in einen einseitigen Rahmen setzt, mit Angst arbeitet oder absichtlich wichtigen Kontext auslässt. Umgekehrt kann ein Material mit geringem Manipulationsgrad eine unwahre Aussage enthalten, wenn es sachlich, ruhig und ohne starken emotionalen Druck präsentiert wird.

Der Manipulationsgrad misst daher nicht die Wahrheit des Inhalts. Er misst die Intensität der Mittel, mit denen das Material versucht, die Interpretation, Emotionen oder Reaktionen des Publikums zu beeinflussen.

OCR — wie wir Text aus Bildern gewinnen

Viele visuelle Materialien enthalten einen wesentlichen Teil der Botschaft direkt im Text. Daher ist einer der ersten Schritte der Analyse seine automatische Erkennung mit Hilfe der OCR-Technologie (Optical Character Recognition).

FactNinja nutzt für die Texterkennung multimodale Modelle, die gleichzeitig mit Bild und Sprache arbeiten können. Diese Systeme bewältigen nicht nur standardmäßige Druckschrift, sondern auch stilisierte Typografie, handschriftliche Elemente, fotografierten Text, der aus einem Winkel aufgenommen wurde, oder Text, der in niedriger Qualität erfasst wurde, beispielsweise auf mobilen Screenshots.

Wörtliche Extraktion

Das grundlegende Prinzip unseres OCR ist die Treue zur Originalquelle. Wir transkribieren den Text genau so, wie er im Bild vorkommt — ohne Korrekturen von Tippfehlern, ohne Ergänzungen fehlender Wörter und ohne sprachliche Anpassungen.

Wenn auf einem Plakat eine veraltete Rechtschreibung, ungewöhnliche Interpunktion oder sogar ein Druckfehler verwendet wird, bleibt dies auch im OCR-Ergebnis erhalten. Dieser Ansatz ist beabsichtigt. Wir betrachten OCR in erster Linie als eine Möglichkeit zur Dokumentation der Quelle, nicht als redaktionelle Transkription.

Solche Details können wichtig sein, beispielsweise bei der Datierung von Materialien, der Bestimmung ihrer Herkunft oder bei der Überprüfung ihrer Authentizität. Für Historiker, Journalisten, Forscher und Fact-Checker können scheinbar kleine sprachliche Abweichungen wertvolle Hinweise darstellen.

Automatische Übersetzung

Wenn der erkannte Text in einer anderen Sprache vorliegt als der, die Sie in der Benutzeroberfläche verwenden, kann FactNinja sowohl den Originaltext als auch seine Übersetzung anzeigen.

Der Originaltext bleibt immer verfügbar, da er die primäre Informationsquelle darstellt und den forensischen Wert des Materials bewahrt. Die Übersetzung dient als Hilfsmittel zum Verständnis des Inhalts und erleichtert die Arbeit von Benutzern, die die betreffende Sprache nicht beherrschen.

Dank der Kombination aus OCR, Spracherkennung und automatischer Übersetzung können auch Materialien analysiert werden, die aus unterschiedlichen sprachlichen und kulturellen Umgebungen stammen, ohne dass externe Übersetzungswerkzeuge erforderlich sind.

KI-Erkennung — wurde das Bild von künstlicher Intelligenz erstellt?

Mit der zunehmenden Verfügbarkeit generativer künstlicher Intelligenz ist es wichtig zu unterscheiden, ob das analysierte Bild wahrscheinlich eine echte Szene zeigt oder ob es künstlich erstellt wurde. Im Kontext von Propaganda, Desinformation und politischer Kommunikation handelt es sich um eine wesentliche Information: Ein Foto eines realen Ereignisses hat einen anderen Beweiswert als ein von künstlicher Intelligenz generiertes Bild, auch wenn sie auf den ersten Blick ähnlich wirken.

Zur Erkennung von KI-generierten Inhalten nutzen wir den externen Dienst Sightengine, der die Wahrscheinlichkeit zurückgibt, dass das Bild mit Hilfe generativer künstlicher Intelligenz erstellt oder bearbeitet wurde. Das Ergebnis wird in Prozent angegeben und dient als orientierender Indikator, nicht als endgültiger Beweis.

Das System beobachtet bei der Bewertung typische Merkmale generativer Modelle, wie ungewöhnliche Bildartefakte, Unregelmäßigkeiten in der Struktur von Objekten, problematische Details bei Gesichtern, Händen, Text oder Hintergründen und andere visuelle Muster, die bei synthetisch erstellten Bildern häufiger auftreten als bei normalen Fotos.

Es ist wichtig zu betonen, dass die KI-Erkennung nicht unfehlbar ist. Hochwertige generierte Bilder können sehr authentisch wirken, während reale Fotos aufgrund von Kompression, Filtern, Bearbeitungen oder niedriger Qualität Merkmale enthalten können, die AI-Artefakten ähneln. Daher wird das Ergebnis der KI-Erkennung immer als einer der kontextuellen Signale verstanden, der zusammen mit anderen Analyseebenen gelesen werden muss.

KI-Erkennung — Gradient von grün (fast sicher real) zu rot (hohe Übereinstimmung mit KI). Der Wert 12 % bedeutet wahrscheinlich menschliche Erstellung mit kleinen digitalen Anpassungen.

Wichtig ist zu wissen, was die KI-Erkennung nicht kann. Foto-realistische Generationen der neuesten Modelle können manchmal mit niedriger Wahrscheinlichkeit durchkommen. Bearbeitete reale Fotos (Photoshop, Deepfakes basierend auf realen Aufnahmen) muss die Erkennung nicht erfassen. Und insgesamt gilt, dass eine 70%ige KI-Wahrscheinlichkeit nicht „sicher KI“ bedeutet — es bedeutet „KI-Signal ist stark, aber menschliches Urteil ist erforderlich“. Das Score ist ein Werkzeug, um Ihre Aufmerksamkeit zu lenken, kein automatisches Urteil.

Mehrsprachigkeit — Analyse verfügbar in mehreren Sprachen

FactNinja unterstützt sechs Sprachen: Tschechisch, Englisch, Slowakisch, Polnisch, Deutsch und Spanisch. Die Texte der Analysen und Kommentare werden automatisch im Hintergrund zwischen diesen Sprachen übersetzt. Wenn der Autor beispielsweise eine Analyse auf Tschechisch erstellt, stellt das System sie automatisch auch in den anderen unterstützten Sprachen zur Verfügung.

Benutzer können den Inhalt in der Sprache lesen, die ihren Einstellungen oder Vorlieben entspricht. Eine tschechische Analyse eines russischen Propagandaplakats kann so auch für ein englisches, slowakisches, polnisches, deutsches oder spanisches Publikum verständlich werden, ohne dass der Autor mehrere Sprachversionen manuell erstellen muss.

Grenzen des Werkzeugs — was FactNinja nicht tut

Um mit den Ergebnissen richtig arbeiten zu können, ist es wichtig, auch klar zu sagen, was von FactNinja nicht erwartet werden kann. Unkritisches Vertrauen in KI-Werkzeuge kann zu falschen Schlussfolgerungen führen. Richtig eingestellte Erwartungen machen sie hingegen zu nützlichen analytischen Helfern.

Wir bewerten nicht die „Wahrheit“ als Ganzes

FactNinja beendet die Analyse nicht mit einem einfachen Urteil wie „wahr“ oder „falsch“. Ein visuelles Material kann wahre Aussagen enthalten, die in einen manipulativen Rahmen eingebettet sind, falsche Aussagen, die in einem neutralen Ton präsentiert werden, oder symbolische Botschaften, bei denen die Frage der Wahrheit keinen einfachen Sinn ergibt.

Visual Insights beschreiben die emotionale und überzeugende Wirkung des Materials. Erweiterte Daten helfen, konkrete überprüfbare Aussagen zu identifizieren. Das Gesamturteil bleibt jedoch beim Benutzer.

Wir erfassen nicht alles

KI-Systeme können Fehler machen. Manchmal schreiben sie einem Material eine Bedeutung zu, die nicht vorhanden ist, manchmal übersehen sie einen wichtigen Detail, eine kulturelle Anspielung oder einen lokalen Kontext. Daher ist immer eigenes Urteil, der Vergleich mit anderen Quellen und bei wichtigen Fällen auch die Beratung mit Experten erforderlich.

FactNinja hilft, die Analyse zu beschleunigen, zu klären und zu strukturieren. Es ersetzt jedoch nicht das menschliche kritische Denken.

Wir sind kein Ersatz für journalistische oder fachliche Arbeit

Die Analyse eines propagandistischen oder verdächtigen Visuals endet bei FactNinja nicht. Die Rückwärtssuche von Bildern kann helfen, die Herkunft des Materials zu ermitteln. Archivdatenbanken können zeigen, wann das Bild erstmals aufgetaucht ist. Beratungen mit Historikern, regionalen Experten oder Fact-Checkern können den Kontext ergänzen, den die KI selbst möglicherweise nicht kennt.

FactNinja ist ein Ausgangspunkt. Die weitere Arbeit bleibt menschlich.

Wissenschaftliche Grundlagen

FactNinja basiert auf mehreren bewährten Theorien aus den Bereichen Psychologie der Emotionen, Medienwissenschaften, Rhetorik und Propagandaanalyse.

Emotionen und Propaganda

Die Grundlage der emotionalen Analyse ist unter anderem die Arbeit von Robert Plutchik, der 1980 die psychoevolutionäre Theorie der Emotionen und das Modell der acht grundlegenden Emotionen formulierte. Ein wichtiges Fundament ist auch Russells circumplex Modell der Emotionen, das Emotionen mit Hilfe von zwei Dimensionen beschreibt: Valenz und Aktivierung. Auf die breitere Debatte über universelle Emotionen folgt auch die Arbeit von Paul Ekman über grundlegende Emotionen in verschiedenen Kulturen.

Rhetorische und manipulative Techniken

Bei der Beschreibung von Überzeugungsmechanismen knüpfen wir an klassische Arbeiten aus den Bereichen Psychologie der Überzeugung und Argumentation an. Robert B. Cialdini beschrieb die Prinzipien des sozialen Einflusses, wie Autorität, Reziprozität, sozialer Beweis oder Knappheit. Steven A. McCornack formulierte die Theorie der Informationsmanipulation, die zeigt, dass man nicht nur mit Lügen manipulieren kann, sondern auch durch Auslassung, Unklarheit oder Verschiebung der Relevanz. Douglas Walton hat den Bereich der informellen Logik und der argumentativen Trugschlüsse systematisch bearbeitet.

Visuelle Propaganda und Medien

Für die Analyse von Propaganda knüpfen wir auch an klassische und zeitgenössische Arbeiten der Medienwissenschaften an. Jacques Ellul gehört zu den Schlüsselautoren der modernen Propagandatheorie. Ein zeitgemäßerer Rahmen bietet beispielsweise die Arbeit von Jowett und O’Donnell, die Propaganda als systematischen Versuch beschreiben, Einstellungen, Wahrnehmungen und Verhaltensweisen des Publikums zu beeinflussen.

Wie man die Analyse kritisch liest — drei Regeln

1. Visual Insights beschreiben die Absicht, nicht die Wahrheit

Ein hoher Grad an Angst, Wut oder Unruhe kann bedeuten, dass das Material mit einem alarmierenden Appell arbeitet. Ein solcher Appell kann jedoch berechtigt sein, beispielsweise als Warnung vor einer echten Bedrohung, oder missbraucht werden, wenn er künstliche Panik erzeugt. Visual Insights zeigen die emotionale Strategie des Materials; die richtige Interpretation bestimmt erst der breitere Kontext.

2. Manipulation ist nicht dasselbe wie Lüge

Ein hoher Manipulationsgrad bedeutet, dass das Material stark die Interpretation, Emotionen oder Reaktionen des Publikums formt. Das muss jedoch nicht automatisch bedeuten, dass es Unwahrheiten enthält. Eine gut vorbereitete öffentlich nützliche Kampagne kann stark überzeugend sein und dennoch faktisch korrekt. Umgekehrt kann ein ruhig formulierter Text eine unwahre Aussage enthalten.

Manipulation verstehen wir daher als Maß der Überzeugungskraft, nicht als automatische Kennzeichnung von etwas Schlechtem.

3. Mehr Perspektiven führen zu besserem Urteil

Ein visuelles Material kann aus mehreren Perspektiven analysiert werden. Assistentenanalysen, Visual Insights, OCR, Übersetzungen, erweiterte Daten, KI-Inhaltsdetektion oder Rückwärtssuche von Bildern bilden einzelne Schichten eines breiteren Puzzles.

Keine dieser Schichten ist das endgültige Wort. Der Zweck von FactNinja ist es, Werkzeuge bereitzustellen, die Methodik transparent zu beschreiben und wissenschaftlich fundierte Grundlagen anzubieten. Die endgültige Interpretation bleibt beim Benutzer.

— Das FactNinja-Team