Der 'Sieht-gut-aus'-Bug: So erkennst du stille Fehler in deiner KI-gebauten App

Dein KI-App-Builder hat ein Kontaktformular erstellt. Du hast deinen Namen eingetippt, auf Absenden geklickt, die freundliche Erfolgsmeldung gesehen und weitergemacht. Eine Woche später erwähnst du die Seite gegenüber einer Freundin, die fragt, ob schon jemand etwas ausgefüllt hat. Du gehst nachsehen. Drei Einsendungen hängen in irgendeinem Schwebezustand fest. Keine davon ist je in deinem Posteingang gelandet.

Das ist der häufigste Fehlertyp einer KI-gebauten App, und es ist nicht der, vor dem sich die meisten fürchten. Bugs, die eine rote Fehlermeldung werfen, sind leicht zu finden — dein KI-Builder behebt sie in zwei Minuten. Die gefährlichen Bugs sind die, bei denen der Bildschirm gut aussieht, der/die Nutzer:in denkt, er/sie sei fertig, und du es einen Monat lang nicht merkst.

Dieser Beitrag ist eine Checkliste, um genau die zu fangen. Nicht “wie man wie ein:e QA-Engineer:in testet” — nur die fünf Stellen, an denen echte Nutzer:innen von einer KI-gebauten App, die zu funktionieren scheint, im Stich gelassen werden.

1. Schick etwas ab und prüfe, ob es wirklich irgendwo angekommen ist

Wenn dein KI-Builder ein Formular erstellt, stell eine Frage: Wohin gehen die Daten? Nicht abstrakt — buchstäblich, wo kannst du nach dem Absenden nachsehen?

Eine überraschend große Zahl dieser Formulare schickt die Daten an einen Handler, der “Danke!” zurückgibt, ohne je die E-Mail zu versenden, in einer Datenbank zu speichern oder irgendjemanden zu benachrichtigen. Das Formular ist eine höfliche Fassade. Also:

Schick einen Testeintrag mit einem erfundenen, aber auffälligen Namen wie “ZZZ TEST”.
Öffne das Dashboard, die Datenbank, den Posteingang, die Tabelle — wo auch immer die Einsendungen landen sollen.
Finde dort deinen “ZZZ TEST”-Eintrag, mit dem richtigen Zeitstempel.

Wenn du ihn nicht in unter einer Minute findest, ist dein Formular kaputt, auch wenn es dir zum Absenden gratuliert hat. Ich habe gesehen, wie ein “Kontakt”-Formular auf einer bezahlten Landingpage drei Wochen lang null Leads gesammelt hat, weil der E-Mail-Schritt nie verdrahtet war. Die Seite sah perfekt aus.

2. Probier den Weg, den du nie nehmen würdest

Du weißt, was deine App macht, weil du beim Bauen zugesehen hast. Du klickst die Buttons jedes Mal in derselben Reihenfolge. Echte Nutzer:innen tun das nicht.

Wähl den Weg, der sich am seltsamsten anfühlt:

Klick zweimal schnell hintereinander auf Absenden.
Lade die Seite mitten in einer Aktion neu.
Öffne sie in einem privaten Fenster ohne Login.
Tippe einen Namen mit einem Apostroph (O’Brien ist der Klassiker, der alles sprengt).
Tippe eine Zahl in ein Feld, das eine verlangt, aber mach sie negativ oder null.

Wenn etwas sichtbar kaputtgeht, ist das ein echter Bug — aber wenigstens ist er laut. Die “Sieht-gut-aus”-Variante ist, wenn der zweite Klick einen doppelten Datensatz angelegt hat und man es am Bildschirm nicht erkennen kann. Geh in die Datenbank und such nach zwei “ZZZ TEST”-Zeilen mit Zeitstempeln, die zwei Sekunden auseinanderliegen. Wenn du sie findest, braucht das Formular einen Doppel-Schutz.

3. Warte einen Tag und komm dann zurück

Viel KI-generierter Code nutzt temporären Speicher, der zurückgesetzt wird, wenn die App neu deployt oder neu gestartet wird. Die App hält deine Daten in etwas, das ein:e Entwickler:in “In-Memory-State” nennen würde — okay für eine Demo, fürchterlich für alles Echte.

Der Test ist brutal und einfach: Gib Daten ein, schließ den Tab, warte vierundzwanzig Stunden, komm zurück. Wenn deine Daten weg oder durcheinander sind, ist der Speicher nicht echt. Deinem KI-Builder muss man wahrscheinlich in klaren Worten sagen: “Diese Daten müssen einen Server-Neustart überstehen.” Die meisten Builder wechseln auf eine Datenbank, wenn man sie darum bittet; manche tun es nur, wenn man fragt.

Eine schnellere Version dieses Tests bekommst du, indem du deinen Builder im Chat fragst: “Wo werden die Daten für dieses Formular gespeichert, und überstehen sie ein erneutes Deploy?” Wenn die Antwort “im Speicher”, “Session” oder “für diesen Durchlauf” erwähnt, hast du den Bug gefunden, bevor ein:e Nutzer:in ihn erlebt hat.

4. Zeig sie einer Person, die nicht du bist

Du weißt, was deine App bedeutet. Du hast sie entworfen. Du hast die Buttons benannt. Die Beschriftungen sind für dich offensichtlich, weil du sie geschrieben hast.

Zeig sie einer Freundin, ohne irgendetwas zu erklären. Sag: “Versuch, X zu machen.” Beobachte sie. Hilf nicht. Drei Dinge werden passieren:

Sie klickt irgendwohin, wo du es nicht erwartet hast, und die App tut etwas Überraschendes.
Sie bleibt an einer Beschriftung hängen, die beim Schreiben offensichtlich schien.
Sie macht das, was du wolltest, aber in der Hälfte der Schritte, die du dir vorgestellt hast, und überspringt einen Bildschirm komplett — manchmal einen Bildschirm, dessen Ausfüllen die App von ihr erwartet hat.

Jedes davon ist ein echter Bug. Keiner wirft einen Fehler. Die Freundin wird sagen “Oh, das ist niedlich” und dir den Laptop zurückgeben. Du wirst an ihrem Gesicht erkannt haben, dass sie dreißig Sekunden lang an einer Stelle verloren war, von der du dachtest, sie hätte keine Nahtstellen.

5. Lies die E-Mail, die sie verschickt, auf einem Handy

Wenn deine App E-Mails verschickt — Bestätigungen, Passwort-Resets, Rechnungen —, öffne eine auf deinem Handy und eine in einem anderen E-Mail-Programm als sonst. KI-gebaute Apps neigen dazu, E-Mails zu erzeugen, die in Gmail auf dem Desktop wunderschön aussehen und in Outlook auf Android aussehen wie Bildrauschen.

Dieselbe Logik gilt für PDF-Belege, herunterladbare Exporte und “Diesen Link teilen”-Buttons. Das, was die App verlässt und in die echte Welt hinausgeht, ist der am wenigsten getestete Teil eines KI-Builds. Es ist außerdem der Teil, den deine Nutzer:innen am häufigsten sehen. Ein Gründer, den ich kenne, hat einen wunderschönen Checkout-Flow ausgeliefert, dessen Beleg-PDF auf dem iPhone ein einziges schwarzes Quadrat war. Niemand hat sich beschwert — sie haben einfach aufgehört zu kaufen.

Die unbequeme Wahrheit über “es funktioniert”

Wenn du mit einem KI-App-Builder baust, heißt “es funktioniert” so viel wie “es lief auf meiner Maschine, in meinem Browser, mit meinen genauen Klicks, an dem Tag, an dem ich es gebaut habe”. Das ist eine viel kleinere Behauptung, als es klingt.

Echte Apps funktionieren, wenn:

Eine andere Person sie nutzt.
Die Daten länger bleiben als die Demo.
Der Weg durch die App einer ist, den du nicht vorhergesehen hast.
Die Ausgabe auf einem Gerät gelesen wird, auf dem du nicht getestet hast.

Du musst kein:e Software-Tester:in werden, um etwas Gutes auszuliefern. Du musst nur diese fünf Checks einmal machen, am Tag bevor du irgendjemandem von der App erzählst. Sie dauern etwa zwanzig Minuten. Sie fangen neun von zehn der stillen Bugs, die sonst eine:n zahlende:n Nutzer:in erreichen würden.

Wenn du nur für einen Zeit hast, mach den ersten. Schick etwas ab. Find es auf der anderen Seite. Die meisten KI-gebauten Apps sehen gut aus. Der Trick ist sicherzustellen, dass sie es auch wirklich sind.

Wenn dich das angesprochen hat, ist das Nächste, was sich lohnt, dich mit einem Blatt Papier hinzusetzen und die drei Dinge aufzuschreiben, bei denen deine App niemals still scheitern darf — das Formular, die E-Mail, die Zahlung, was auch immer deins ist — und jedes davon mit den obigen Checks durchzugehen. Zwanzig Minuten jetzt kaufen dir später viele Nächte Schlaf.