🔬

Wie FactNinja Bilder analysiert

Wissenschaftliche Grundlagen und Methodik — von Plutchiks Rad bis zur KI-Erkennung.

help.machine_translated

FactNinja ist ein Tool zur Analyse visueller Inhalte — Poster, Memes, Screenshots aus sozialen Netzwerken, Fotos mit Text, propagandistische Grafiken. Wenn Sie ein Bild hochladen, führen wir nicht eine Analyse durch, sondern eine ganze Kaskade spezialisierter Ansichten, die sich gegenseitig ergänzen. Jede Ansicht beantwortet eine andere Frage — was steht dort geschrieben, was soll es bei Ihnen auslösen, welche Behauptungen enthält es, ob es von künstlicher Intelligenz erstellt wurde.

Diese Mehrschichtigkeit ist beabsichtigt. Ein einfaches Urteil wie „wahr“ oder „falsch“ wäre irreführend — Propaganda ist oft eine Kombination aus wahren Aussagen in einem manipulativen Rahmen oder umgekehrt ehrlicher Kommunikation mit ungeschickten Formulierungen. Anstelle eines Fazits präsentieren wir Ihnen eine Analyse: einzelne Schichten, die Sie selbst zu einem eigenen Urteil zusammenfügen können. Dieser Text zielt darauf ab zu erklären, wie unsere Werkzeuge intern funktionieren — welche Wissenschaft dahintersteht, wo sie Stärken haben und wo ihre Grenzen liegen.

Was passiert, wenn Sie ein Bild hochladen

In dem Moment, in dem Sie auf Analysieren klicken, startet das System im Hintergrund eine Kaskade unabhängiger Aufgaben. Jede behandelt einen Aspekt des Bildes und läuft unabhängig — das Scheitern einer Schicht bringt die anderen nicht zum Absturz. Wenn zum Beispiel die Texterkennung bei einem sehr stilisierten Meme technisch fehlschlägt, laufen die Hauptanalyse und die emotionale Analyse weiter. Die gesamte Kaskade dauert typischerweise einige Dutzend Sekunden bis zu zwei Minuten — abhängig von der Komplexität des Bildes und der Auslastung der KI-Dienste. Während des Wartens sehen Sie Live-Indikatoren, die anzeigen, was gerade passiert.

📝
Schritt 1
Hauptanalyse
Zusammenhängender Text vom KI-Assistenten
🔤
Schritt 2
OCR-Transkription
Text aus dem Bild extrahieren
🧩
Schritt 3
Augmented Data
Strukturierte Felder — Behauptungen, Täuschungen
🎭
Schritt 4
Visuelle Einblicke
Emotionale Analyse basierend auf Wissenschaft
🤖
Schritt 5
KI-Erkennung
Wurde es von künstlicher Intelligenz erstellt?
🌍
Schritt 6
Übersetzungen
Automatisch in sechs Sprachen

Assistenzanalysen — Perspektiven, keine Wahrheiten

Wenn Sie bei der Eingabe der Analyse einen Assistenten auswählen, wählen Sie nicht verschiedene künstliche Intelligenzen — Sie wählen eine unterschiedliche Rolle, die dieselbe KI spielt. Jeder Assistent hat in seinem Kopf eine andere systemische Anweisung, die bestimmt, aus welchem Blickwinkel er das Bild betrachtet. Der Standardassistent von FactNinja ist ausgewogen und geht die wichtigsten Punkte durch. Der Professor für Medienkompetenz hat einen pädagogischen Ton und konzentriert sich darauf, was für die Lehre des kritischen Denkens wichtig ist. Weitere Assistenten haben eigene Spezifika, die Sie in der App bei ihrer Auswahl finden.

Das gleiche Bild, das durch verschiedene Assistenten läuft, kann unterschiedliche Akzente haben — und das ist Absicht, kein Fehler. Ein Poster kann legitim aus mehreren Blickwinkeln betrachtet werden. Manchmal möchten Sie eine pädagogische Analyse, manchmal eine sachliche Bilanz. Die Seitenleiste Visual Insights zeigt alle bisherigen Ansichten zusammen, damit Sie sie vergleichen können. Mehrfache Perspektiven sind in unserer Methodik eine Stärke.

Wie KI ein Bild „sieht“

Unter der Haube verwenden wir visuell fähige Sprachmodelle — multimodale künstliche Intelligenz von OpenAI, aktuell die Modelle GPT-5 und GPT-5-nano. Diese Modelle wurden auf riesigen Datensätzen von Bildern mit Beschreibungen trainiert und können visuelle Inhalte im natürlichen Sprachgebrauch beschreiben, kategorisieren und interpretieren. Wenn die KI ein Poster mit Lenin sieht, geht es nicht nur um die Gesichtserkennung — das Modell versteht die Typografie des sowjetischen Konstruktivismus, identifiziert rhetorische Muster, verbindet das Bild mit dem historischen Kontext.

Wichtig ist, dass die KI nicht sieht wie Sie. Sie zählt keine Pixel, bewertet keine RGB-Werte. Sie arbeitet mit einer gelernten Repräsentation — einem abstrakten Verständnis der visuellen Welt, das sie aus den Trainingsdaten aufgebaut hat. Das bedeutet, dass sie typische Muster erkennt, aber manchmal sieht, was dort nicht ist (Halluzinationen), und manchmal Nuancen übersieht, die ein menschlicher Beobachter auf den ersten Blick erkennt.

⚠ Schlüsselprinzip: FactNinja ist ein Helfer, kein Richter. Die Analyse ist ein Ausgangspunkt für Ihr eigenes Denken — kein Urteil. Mehrfache Perspektiven, wissenschaftliche Grundlagen und eine transparente Methodik existieren genau deshalb, damit Sie sich Ihr endgültiges Urteil selbst bilden können.

Augmented Data — was die KI konkret findet

Neben dem freien Text der Hauptanalyse gibt die KI auch einen strukturierten Output zurück. Diese strukturierten Felder sind entscheidend, da sie Visualisierungen (Donuts, Karten, Diagramme), Filterung und weitere Verarbeitung ermöglichen.

Schlüsselthemen sind eine Liste dessen, was die KI im Bild erfasst hat — von konkreten Objekten über visuelle Stile bis hin zu abstrakten Konzepten. Überprüfbare Behauptungen sind konkrete Aussagen, die unabhängig überprüft werden können. Jede hat einen Status: wahr, teilweise wahr, falsch, irreführend oder nicht überprüfbar. Erkannte logische Trugschlüsse sind argumentatorische Fehler mit Verbindung zu unserem Trugschlüsse-Glossar. Laienhafte Zusammenfassung ist eine kurze, verständliche Erklärung für jemanden ohne Kontext.

Visual Insights — emotionale Röntgenologie

Visual Insights ist unsere Flaggschiff-Funktion — und verdient eine eigene Erklärung, da sie auf zwei wissenschaftlichen Modellen basiert, die fast vierzig Jahre Geschichte haben und in der Psychologie der Emotionen Klassiker sind. Der Zugang zu Visual Insights erfolgt aus jeder Analyse über den cyanfarbenen Button Visual Insights, der eine separate Seite mit dem emotionalen Profil des Materials öffnet.

🎯 Schlüsselregel: Visual Insights misst was das Material auslösen möchte, nicht das, was Sie fühlen. Das gleiche Poster kann bei einem Zuschauer Stolz und bei einem anderen Abneigung hervorrufen — unsere Analyse beschreibt die Absicht des Autors, nicht die Reaktion des Publikums. Das ist ein entscheidender Unterschied für das richtige Lesen der Ergebnisse.

Plutchiks Rad der Emotionen

Robert Plutchik, ein amerikanischer Psychologe mit biologischem Hintergrund, veröffentlichte 1980 eine grundlegende Arbeit A general psychoevolutionary theory of emotion. Er argumentierte, dass Emotionen keine kulturellen Konstrukte sind, sondern evolutionär alte Reaktionen, die dem Überleben dienen. Freude bewegt uns zu dem, was der Fortpflanzung und sozialen Bindungen förderlich ist. Angst führt uns von Gefahren weg. Wut gibt uns die Energie, sich einer Bedrohung zu stellen. Und dass es acht grundlegende Emotionen gibt, aus denen sich alle anderen zusammensetzen, ähnlich wie sich alle Farben aus drei Primärpigmenten zusammensetzen. Diese acht Emotionen ordnete er in einem Kreis an — benachbarte Emotionen sind sich nahe, gegenüberliegende sind Gegensätze.

Plutchiks Rad der Emotionen
Beispiel für Plutchiks Rad bei einem Kriegspropagandaposter — starke Angst (85), Ekel (75) und Wut (90) signalisieren den agitatorischen Charakter des Materials. Die Länge der Blütenblätter entspricht der Intensität der Emotion (0-100).

In der Anwendung geben wir bei jeder der acht Emotionen die Intensität auf einer Skala von 0 bis 100 an, je nachdem, wie stark das Material diese Emotion hervorruft. Im Diagramm des Plutchik-Rades wird dies als „blühende Blume“ dargestellt — je länger das Blütenblatt einer bestimmten Farbe, desto stärker der emotionale Appell dieses Typs. Ein heroisiertes Porträt eines Führers mit einer Flagge zeigt typischerweise hohe Werte für Freude, Vertrauen und Erwartung. Ein Poster, das vor einem Feind warnt, zeigt starke Angst, Ekel und Wut (wie in der obigen Illustration).

Dyaden — zusammengesetzte Emotionen

Plutchiks Theorie geht weiter — die Kombination von zwei benachbarten grundlegenden Emotionen bildet Dyaden, zusammengesetzte Emotionen mit eigenen Namen. Freude zusammen mit Vertrauen bildet Liebe. Angst mit Überraschung erzeugt Staunen. Trauer mit Ekel ergibt Bedauern. Wut mit Erwartung produziert Aggressivität. Der Abschnitt Dyaden in Visual Insights zeigt, welche dieser Kombinationen im jeweiligen Material am stärksten sind — und das sagt oft mehr über die Absicht des Autors aus als die einzelnen grundlegenden Emotionen.

Russells Modell — Valenz und Aktivierung

Die zweite wissenschaftliche Grundlage ist die Arbeit von James A. Russell, ebenfalls 1980 veröffentlicht. Russell argumentierte, dass Emotionen in zwei orthogonale Dimensionen zerlegt werden können. Die erste Dimension ist die Valenz — wie angenehm oder unangenehm das Erleben der Emotion ist. Die zweite ist die Aktivierung — wie ruhig oder aufgeregt der innere Zustand ist, den sie hervorruft.

Russells 2D-Modell der Emotionen (Valenz × Aktivierung)
Russells 2D-Modell der Emotionen — der Punkt markiert das emotionale „Schwerpunkt“ des Materials. Ein Kriegsplakat landet typischerweise im Quadranten Angst/Wut (unangenehm + aktivierend).

Visual Insights zeigt im Russell-Raum einen Punkt — das gesamte emotionale „Schwerpunkt“ des Materials. Dies hilft, schneller zu sehen, wohin das Material zieht, als eine Aufzählung einzelner Emotionen. Ein Poster mit einem heroisierten Führer landet typischerweise im Quadranten „Aufregung, Freude“. Ein Poster mit einem zerstörten Land und hungrigen Kindern landet in „Angst, Wut“. Beide Modelle (Plutchiks Kreisdiagramm und Russells 2D-Diagramm) ergänzen und verifizieren sich gegenseitig.

Manipulationsgrad

Neben der emotionalen Analyse bewertet Visual Insights auch den Gesamtmanipulationsgrad — eine synthetische Bewertung, die die Stärke der Emotionen, die Anzahl und den Typ der verwendeten rhetorischen Tricks und die gesamte Intensität des Überzeugungsapparats des Materials kombiniert.

Manipulationsgrad — Anzeige
Manipulationsanzeige — vierstufige Bewertung. Der Pfeil markiert die Position der aktuellen Analyse. Ein hoher Grad bedeutet nicht automatisch eine Lüge — er misst die Stärke des Überzeugungsapparats.

Wichtig beim Lesen des Manipulationsgrads ist: Manipulation ist nicht dasselbe wie Lüge. Ein Material kann sachlich wahr sein und dennoch sehr manipulativ. Andererseits kann ein Material wenig manipulativ sein und Desinformation enthalten. Der Manipulationsgrad misst die Stärke des Überzeugungsapparats, nicht den Wahrheitsgehalt des Inhalts.

OCR — wir sehen Text im Bild

FactNinja kann aus einem Bild jeden lesbaren Text extrahieren. Zur Erkennung verwenden wir das Modell GPT-4o-mini, das darauf trainiert ist, unter schwierigen Bedingungen zu sehen und zu lesen: handgeschriebener Text, stilisierte Typografie, fotografierter Text aus einem Winkel, Low-Resolution-Mobile-Screenshots. Es funktioniert überraschend gut, selbst dort, wo traditionelle OCR-Tools versagen.

Wörtliche Extraktion

Unser OCR hat ein Schlüsselprinzip: Wir transkribieren genau das, was zu sehen ist. Ohne Korrektur von Tippfehlern, ohne Ergänzung fehlenden Kontexts. Wenn auf dem Poster ein Buchstabe fehlt, fehlt er auch in unserem OCR-Output. Dieser Ansatz ist beabsichtigt — für uns ist OCR keine literarische Transkription, sondern eine forensische Spur. Für Journalisten, Historiker und Faktenprüfer ist der Unterschied zwischen „Mobilisierung“ und „Mobilisation“ ein entscheidender datierender Hinweis.

Mehrsprachiges OCR und automatische Übersetzung

Wir unterstützen OCR praktisch in allen Sprachen — wir erkennen lateinische Schrift, kyrillische Schrift, chinesische Zeichen, japanische Hiragana und Katakana, koreanisches Hangul, Arabisch, Hebräisch, Devanagari, Griechisch, Thailändisch und andere. Die Erkennung der tatsächlichen Quellsprache basiert auf Unicode-Bereichen, sodass sie auch bei gemischten Texten zuverlässig funktioniert.

Wenn der Text in einer anderen Sprache als Ihrer Benutzeroberfläche ist, zeigen wir beides an: Original links, Übersetzung rechts. Das Original behalten wir für den forensischen Wert, die Übersetzung bietet ein Verständnis des Inhalts.

KI-Erkennung — wurde es von künstlicher Intelligenz erstellt?

Mit der zunehmenden Verfügbarkeit generativer künstlicher Intelligenz ist die Erkennung von KI-generierten Inhalten ein wichtiger Kontext. Für die Analyse von Propaganda ist dies entscheidend — ein Foto eines echten Ereignisses hat einen anderen Beweiswert als eine von KI generierte Szene, selbst wenn beide identisch aussehen.

Zur Erkennung von KI-Inhalten verwenden wir den externen Dienst Sightengine, der die Wahrscheinlichkeit der KI-Generierung in Prozent zurückgibt. Sightengine ist auf Millionen von KI-generierten und authentischen Bildern trainiert und erkennt typische Artefakte generativer Modelle.

KI-Erkennung — Farbverlauf
KI-Erkennung — Farbverlauf von grün (fast sicher real) zu rot (hohe Übereinstimmung mit KI). Ein Wert von 12 % bedeutet wahrscheinlich menschliche Erstellung mit geringfügigen digitalen Anpassungen.

Wichtig zu wissen ist, was die KI-Erkennung nicht kann. Fotorealistische Generationen der neuesten Modelle können manchmal mit niedriger Wahrscheinlichkeit durchkommen. Bearbeitete reale Fotos (Photoshop, Deepfakes basierend auf realen Aufnahmen) kann die Erkennung möglicherweise nicht erfassen. Und insgesamt gilt, dass 70 % KI-Wahrscheinlichkeit nicht „sicher KI“ bedeutet — es bedeutet „KI-Signal ist stark, aber menschliches Urteil ist notwendig“. Das Score ist ein Werkzeug, um Ihre Aufmerksamkeit zu lenken, kein automatisches Urteil.

Mehrsprachigkeit — Analyse lebt in allen Sprachen

FactNinja unterstützt sechs Sprachen: Tschechisch, Englisch, Slowakisch, Polnisch, Deutsch und Spanisch. Analyse-Texte und Kommentare werden automatisch im Hintergrund zwischen diesen Sprachen übersetzt. Wenn ein Autor eine Analyse auf Tschechisch schreibt, übersetzt das System sie sofort in die übrigen fünf Sprachen. Ein Besucher der Seite sieht die Analyse in der Sprache, die in seinem Browser eingestellt ist.

Diese Mehrsprachigkeit bedeutet, dass eine tschechische Analyse eines russischen Propagandaposters automatisch auch einem englischen, slowakischen, polnischen, deutschen und spanischen Publikum zugänglich ist — ohne Eingriff des Autors. Ihr Text erreicht von selbst ein internationales Publikum.

Grenzen des Helfers — was FactNinja nicht tut

Für faire Erwartungen ist es notwendig, explizit zu sagen, was Sie von FactNinja nicht erwarten können. Blindes Vertrauen in KI-Tools führt zu schlechten Entscheidungen. Im Gegensatz dazu macht kalibriertes Erwartungsmanagement FactNinja zu einem starken Helfer.

Wir bewerten nicht die „Wahrheit“ als Ganzes

Die Analyse endet nicht mit einem Urteil wie „Dieses Poster ist wahr“ oder „Dieses Poster ist eine Lüge“. Denn ein Poster kann wahre Aussagen in manipulativer Rhetorik enthalten, falsche Aussagen mit neutralem Ton oder symbolisch sein, wo die Frage der Wahrheit keinen Sinn ergibt. Visual Insights misst den emotionalen Appell, augmented data identifizieren konkrete Aussagen, aber das Gesamturteil liegt immer bei Ihnen.

Wir erfassen nicht alles

KI macht Fehler. Manchmal sieht sie, was nicht da ist, manchmal übersieht sie, was da ist. Immer ist ein eigener kontextueller Urteil, eine Kreuzüberprüfung mit anderen Quellen und in kritischen Fällen eine Beratung mit Experten notwendig. FactNinja beschleunigt und strukturiert Ihr Denken, ersetzt es aber nicht.

Wir sind kein Ersatz für journalistische Arbeit

Die Analyse eines propagandistischen Bildes endet nicht bei FactNinja. Reverse Image Search (Google Lens, Yandex, Bing, TinEye) findet heraus, woher das Bild stammt. Archivdatenbanken wie das Internet Archive zeigen, wann das Material erstmals erschien. Konsultationen mit Historikern und regionalen Experten ergänzen das, was die KI nicht kann. FactNinja ist der Ausgangspunkt. Der Rest der Arbeit ist menschlich.

Wissenschaftliche Grundlagen

Für ein tieferes Eintauchen in die Theorien, auf denen FactNinja basiert, empfehlen wir die folgende Literatur.

Emotionen und Propaganda

Robert Plutchik veröffentlichte 1980 die Arbeit „A general psychoevolutionary theory of emotion“ im Buch Emotion: Theory, research, and experience. Diese Arbeit ist die Grundlage des gesamten Plutchik-Modells der acht Emotionen, das wir verwenden. James A. Russell veröffentlichte im selben Jahr 1980 die Arbeit „A circumplex model of affect“, auf der unsere 2D-Karte der Valenz und Aktivierung basiert. Paul Ekman veröffentlichte 1992 „An argument for basic emotions“ — ein Argument für die Existenz universeller grundlegender Emotionen über Kulturen hinweg.

Rhetorische und manipulative Techniken

Robert B. Cialdini beschrieb in seinem Buch Influence: The Psychology of Persuasion (1984) sechs Schlüsselprinzipien der Überzeugung — Reziprozität, Verpflichtung, sozialer Beweis, Autorität, Sympathie, Knappheit. Steven A. McCornack veröffentlichte 1992 die Arbeit „Information manipulation theory“ — eine Theorie darüber, wie man mit der Wahrheit durch Auslassung, Mehrdeutigkeit und Relevanz manipulieren kann. Douglas Walton systematisierte in seinem Buch Informal Logic: A Pragmatic Approach (2008) argumentatorische Trugschlüsse.

Visuelle Propaganda und Medien

Das klassische Werk von Jacques Ellul Propaganda: The Formation of Men's Attitudes (1965) legte die modernen Studien der Propaganda fest. Für einen zeitgemäßeren Überblick empfehlen wir Propaganda and Persuasion (2018) von Jowett und O'Donnell.

Wie man die Analyse kritisch liest — drei Regeln

Abschließend drei einfache Regeln, die Ihnen helfen, die Ergebnisse von FactNinja sinnvoll zu interpretieren.

1. Visual Insights beschreiben die Absicht, nicht die Wahrheit

Hohe Angstwerte und geringes Vertrauen im Plutchik-Rad bedeuten, dass das Material ein alarmierender Appell ist. Aber ein solcher Appell kann berechtigt sein (Warnung vor einer echten Bedrohung) oder missbraucht werden (erzeugte Panik). Visual Insights sagen nicht, welcher Fall es ist — das sagt der Kontext, den Sie mitbringen.

2. Manipulation ist nicht dasselbe wie Lüge

Eine Bewertung von VERY HIGH Manipulation bedeutet, dass das Material sehr stark Meinungen formt. Es kann eine Lüge sein, aber ebenso kann es eine sehr gut gemachte Kampagne für eine gute Sache sein. Mit dem Wort „Manipulation“ meinen wir nicht „schlechte Sache“ — wir meinen einen starken Überzeugungsapparat. Eine Werbekampagne für Impfungen kann VERY HIGH manipulativ sein und dennoch gesellschaftlich nützlich.

3. Mehrere Perspektiven sind eine Stärke

Ein Material, mehrere Assistenzanalysen, Visual Insights, OCR-Übersetzung, Reverse Image Search — jede dieser Schichten fügt ein Stück zum Puzzle hinzu. Keine von ihnen ist das letzte Wort. Das letzte Wort sind Sie. Unsere Arbeit besteht darin, Ihnen Werkzeuge bereitzustellen, die Methodik transparent zu beschreiben und wissenschaftlich fundierte Daten bereitzustellen. Ihre Arbeit besteht darin, dem einen Sinn zu geben.

— Das FactNinja-Team