12.11.2025
14:40 - 16:10
Tutorial
Automation & Tools
Dominic Steinhöfel
InputLab GmbH
Jenseits von Skripten: Moderne Wege zur Erzeugung synthetischer Testdaten
Testdaten sind ein zentraler Baustein der Software-Qualitätssicherung. Doch wie können Sie sicherstellen, dass Ihre Testdaten nicht nur zielgerichtet, sondern auch umfassend, kompakt und datenschutzkonform sind? In diesem Tutorial konzentrieren wir uns auf die Generierung von Eingabe- und Zustandsdaten und beleuchten zwei moderne Ansätze: die spezifikationsbasierte und die KI-basierte Generierung. Sie lernen, wie Sie die Herausforderungen moderner Testprojekte meistern, Ihre Testabdeckung systematisch verbessern und dabei Datenschutzanforderungen von Grund auf erfüllen.
---
Die Bereitstellung geeigneter Testdaten ist eine der größten Herausforderungen in der Qualitätssicherung. Viele Teams greifen auf pseudoanonymisierte Produktionsdaten oder handgeschriebene Generatorskripte zurück. In diesem Tutorial analysieren wir, warum diese Ansätze oft fehleranfällig, schwer wartbar und nicht flexibel genug sind.
Als Alternative stellen wir Ihnen zwei moderne Lösungswege vor:
1. **KI-basierte Generierung:** KI-Modelle versprechen, realistisch wirkende „Fake-Daten“ auf Knopfdruck zu erzeugen. Wir untersuchen, wie bei diesem Ansatz die Spezifikation aussieht (Stichwort: Prompt Engineering), wie sich die Generierung steuern lässt, und inwiefern wir KIs zur Optimierung von Spezifikationen einsetzen können. Dabei beleuchten wir auch kritisch die aktuellen Chancen, Herausforderungen und Grenzen von Large Language Models (LLMs) im Testdatenkontext.
2. **Spezifikationsbasierte Generierung:** Dieser Ansatz nutzt formale Spezifikationen (z. B. XML/JSON-Schemata, Datenbank-Definitionen) als "Blaupause" für Ihre Testdaten. Wir klären praxisnah, was eine Testdatenspezifikation ausmacht, von der Definition der Daten-Grundmenge über fachliche Anforderungen bis hin zu Abdeckungszielen. Das Ergebnis sind präzise, kompakte und datenschutzkonforme Daten mit mathematisch nachweisbarer Abdeckung, die ohne Rückgriff auf Produktionsdaten auskommen.
**Inhalte im Detail:**
* **Grundlagen:** Was genau sind Testdaten (Eingabe-, Zustands-, Ausgabe-, Solldaten)? Was ist das "Orakelproblem", und wie können wir dieses ohne explizite Solldaten angehen?
* **Status Quo unter der Lupe:** Anhand von praktischen Beispielen beleuchten wir die Nachteile von pseudoanonymisierten Produktionsdaten und handgeschriebenen Skripten.
* **KI-basierte Generierung im Detail:** Wie können wir weit verfügbare KI-Modelle zur Datenerzeugung verwenden? Grundlagen des Prompt Engineering als Spezifikationsform. Chancen, Risiken und typische Anwendungsfälle.
* **Spezifikationsbasierte Generierung im Detail:** Was macht eine gute Testdatenspezifikation aus? (Constraints, Formate, Abdeckungsziele). Wie formale Schemata die Basis für präzise Testdaten bilden.
* **Qualität im Fokus:** Wie bewertet man die Güte von Techniken zur Datengenerierung im Hinblick auf Gültigkeit, Geschwindigkeit und Testabdeckung?
* **Praxis-Übung:** In einer interaktiven Einheit entwerfen wir eine Testdatenspezifikation auf Basis eines konkreten Anwendungsfalls. Wir machen dies unabhängig von einem konkreten Tool, indem wir uns auf die Aspekte Struktur, grundlegende Anforderungen, und Testziel-Anforderungen konzentrieren.
**Lernziele:**
Nach diesem Tutorial werden die Teilnehmer:innen:
- Die grundlegenden Arten von Testdaten sowie das Orakelproblem kennen und verstehen.
- Die Stärken und Schwächen verschiedener Ansätze zur Testdatengenerierung verstehen.
- Die Funktionsweisen, Unterschiede und Einsatzgebiete von spezifikationsbasierten und KI-basierten Methoden klar voneinander abgrenzen können.
- In der Lage sein, eine grundlegende Testdatenspezifikation zu definieren und die Qualität generierter Daten zu bewerten.
Zielgruppe:
Dieses Tutorial richtet sich an Software-Tester:innen, Testautomatisierer:innen, Testmanager:innen und Entwickler:innen, die nach innovativen und nachhaltigen Ansätzen für die Testdatengenerierung suchen. Es ist ideal für Einsteiger:innen, die sich mit dem Thema vertraut machen möchten, und für Fortgeschrittene, die ihre bestehenden Prozesse optimieren wollen.
