Beim A/B-Test bekommt die eine Hälfte der Besucher Version A, die andere Hälfte Version B – identischer Traffic, gleicher Zeitraum, nur ein Unterschied zwischen den Varianten. Welche Version mehr Anfragen, Käufe oder Anmeldungen erzeugt, gewinnt. So einfach das Prinzip klingt, so leicht macht man es falsch. Der Unterschied zwischen einem sauberen Test und einem teuren Irrtum liegt in den Details.
Was sich wirklich zu testen lohnt
Nicht jede Änderung bewegt die Conversion. Die größten Hebel sitzen oben auf der Seite, wo die Entscheidung fällt, ob jemand bleibt oder geht. Konzentriere dich auf die Elemente mit dem stärksten Einfluss:
- Die Headline – sie entscheidet in Sekunden, ob das Versprechen relevant wirkt.
- Der Call-to-Action – Wortlaut, Farbe und Position des Buttons verändern die Klickrate spürbar.
- Der Hero-Bereich – Bild, Aufbau und das erste sichtbare Nutzenversprechen.
- Die Form des Beweises – Kundenstimmen, Zahlen oder Logos an der richtigen Stelle.
Kleinigkeiten wie ein Schatten unter dem Button sind selten den Testaufwand wert. Teste das, was über Bleiben oder Abspringen entscheidet, nicht das, was nur du auf der Seite bemerkst.
Ein Test pro Zeit
Der häufigste Fehler ist Ungeduld: Man ändert Headline, Button und Bild gleichzeitig, sieht ein besseres Ergebnis – und weiß nicht, welche der drei Änderungen es verursacht hat. Damit ist die Erkenntnis wertlos, denn man kann sie nicht auf andere Seiten übertragen. Ein sauberer A/B-Test verändert genau eine Sache. Nur so lässt sich das Ergebnis einer Ursache zuordnen.
Ein Test ohne klare Frage ist kein Test, sondern eine Vermutung mit besserer Optik.
Stichprobe und Signifikanz
Der zweithäufigste Fehler ist, zu früh zu stoppen. Wenn nach zwei Tagen Version B vorn liegt, ist die Versuchung groß, den Sieger auszurufen. Doch kleine Zahlen schwanken stark. Erst wenn jede Variante genug Conversions gesammelt hat, ist das Ergebnis belastbar. Als grobe Orientierung sollte jede Seite mehrere Hundert Conversions erreichen, bevor man entscheidet – bei niedriger Ausgangs-Conversion dauert das entsprechend länger.
Statistische Signifikanz bedeutet nichts anderes, als dass der gemessene Unterschied wahrscheinlich nicht vom Zufall kommt. Gängige Testtools rechnen das automatisch aus und zeigen ein Konfidenzniveau an. Ein Wert von 95 Prozent ist ein verbreiteter Schwellenwert: Erst darüber lohnt es, die Gewinner-Variante dauerhaft auszurollen. Wichtig ist außerdem, einen Test über volle Wochen laufen zu lassen, damit Wochentags-Schwankungen sich ausgleichen.
Werkzeuge und Vorgehen
Für den Einstieg reichen etablierte Testtools, die Varianten ausspielen und die Signifikanz berechnen. Wichtiger als das Werkzeug ist die Disziplin: vorher eine Hypothese formulieren („Eine konkretere Headline erhöht die Anfragen, weil der Nutzen klarer wird"), eine messbare Zielgröße festlegen und erst nach Erreichen der Stichprobe entscheiden. So wird aus Optimierung ein wiederholbarer Prozess statt einer Reihe von Bauchentscheidungen.
Datenbasiertes Testen ist kein einmaliges Projekt, sondern eine Gewohnheit. Jeder saubere Test liefert eine Erkenntnis, die in den nächsten einfließt. Marken, die so arbeiten, verbessern ihre Conversion Schritt für Schritt – während andere bei jedem Relaunch wieder raten.