13.11.2025
11:10 - 11:55
Uhr
Vortrag
Test & AI
Dehla Sokenou
WPS - Workplace Solutions
Harald Störrle
QAware GmbH
Qualität in der Unschärfe: KI-Systeme testen und bewerten
Künstliche Intelligenz beeindruckt – und enttäuscht. Manchmal antworten ChatBots korrekt, manchmal fehlerhaft, aber auch der absurdeste Quatsch (sowie das Gegenteil davon) wird mit scheinbar großer Sicherheit vorgetragen. Und solche Systeme sollen unternehmenskritische Prozesse steuern?
Daher lautet die zentrale Herausforderung: Wie lässt sich die Qualität von KI-Systemen messen und sichern? Wie geht Qualitätssicherung mit Systemen um, die inhärent probabilistisch sind, also auch im Regelbetrieb Falschergebnisse liefern können? Gängige KI-Testframeworks (RAGAS, promptfoo, …) bieten nur einzelne Metriken, keinen umfassenden Qualitätsbegriff, wie z.B. eine ISO 25010. Für die betriebliche Praxis fehlen uns verlässliche Leitplanken.
In unserem Vortrag leuchten wir diese strategische Lücke aus und zeigen Lösungsansätze aus der Praxis. Insbesondere stellen wir ein Qualitätsmodell für KI vor und zeigen, wie der systematische Test von KI unter Berücksichtigung technischer, ethischer und betriebswirtschaftlicher Anforderungen gelingen kann. Aus unserer Sicht ist dies entscheidend für den wirtschaftlichen Erfolg von KI-Anwendungen – denn ohne stringente Qualitätssicherung bleiben KI-Anwendungen stochastische Papageien.

Dehla Sokenou, WPS - Workplace Solutions

Harald Störrle, QAware GmbH
Harald Störrle hat Informatik und Psychologie in Tübingen, Hamburg, Edinburgh und München studiert. Seit 2001 arbeitet er in der IT-Industrie, zwischen 2006 und 2016 hatte er Professuren an den Unis München und Innsbruck, sowie der Technischen Universität Dänemark inne. Seit 2017 arbeitet er bei QAware München als Lead IT Consultant. Seine Arbeitsschwerpunkte sind Methodiken und Prozessen der Softwareentwicklung, sowie Anforderungen und Modelle. Beim Kunden ist er zumeist als Product Owner und Facilitator tätig. Er ist Senior Member der ACM und war bzw. ist Mitglied verschiedener ACM-Gliederungen und Arbeitsgruppen.