Die Anforderungen an KI steigen – und mit ihnen die Ansprüche an ihre Daten.
Welche Kriterien müssen Trainingsdaten künftig erfüllen, um auf dem Markt bestehen zu können?
Das Bundesamt für Sicherheit in der Informationstechnik (BSI) hat jetzt einen detaillierten Katalog veröffentlicht, der definiert, wie gute Trainingsdaten für Künstliche Intelligenz (KI) auszusehen haben. Der sogenannte „Quaidal“-Leitfaden nimmt besonders Hochrisiko-Anwendungen in den Blick und macht deutlich: Ohne nachvollziehbare, vollständige und fehlerfreie Daten läuft nichts – weder technisch noch regulatorisch.
Relevanz und Verantwortung: Warum Datenqualität kein Nebenschauplatz ist
Was früher eher als Good Practice galt, wird durch die KI-Verordnung der EU nun zur Pflicht: Trainings-, Validierungs- und Testdaten müssen bestimmten Standards genügen. Das BSI beschreibt sie als Voraussetzung für zuverlässige, faire und rechtlich einwandfreie KI-Systeme. Vor allem Entscheider und Entwickler bekommen hier klare Leitlinien an die Hand – mit konkreten Handlungsanweisungen.
Autonomes Fahren, Diagnose, Finanzen: Fehlerhafte Daten können gefährlich werden
Besonders deutlich wird das beim Blick auf sensible Bereiche wie autonomes Fahren oder medizinische Diagnostik. Wer hier mit verzerrten oder lückenhaften Daten arbeitet, riskiert mehr als nur schlechte Performance – es geht um Sicherheit, Akzeptanz und Vertrauen. Das BSI betont deshalb: Bereits bei der Datenerhebung muss auf Korrektheit, Vollständigkeit und Angriffsresistenz geachtet werden.
143 Werkzeuge für bessere Trainingsdaten
Mit zehn übergeordneten Qualitätskriterien und 143 konkreten Methoden liefert der Quaidal-Leitfaden einen Werkzeugkasten für Unternehmen und Entwicklungsteams. Ziel ist eine möglichst realitätsnahe, faire und umfassende Abbildung der Zielpopulation. Das BSI stellt die erste Version sogar maschinenlesbar auf GitHub bereit und ruft zur Beteiligung auf.
Fazit: Qualität von Anfang an denken
Gute KI beginnt mit guten Daten – dieser Grundsatz wird jetzt auch formal verankert. Unternehmen sind gut beraten, schon frühzeitig in saubere, faire und gut strukturierte Datenprozesse zu investieren. Der neue BSI-Leitfaden ist dabei ein wichtiger Kompass für die Praxis.