Die 7 Handlungsfelder der Auditierung nach AIC4
Mit Stand Mai 2021 umfasst der AIC4 Kriterienkatalog sieben verschiedene Handlungsfelder, die die Mindestanforderungen für die Auditierung von KI-Anwendungen umfassen. Sie werden um die bereits im letzten Abschnitt beschriebenen Voraussetzungen des Cloud Computing Compliance Criteria Catalogue (C5) ergänzt.
Nachfolgend geben wir einen Überblick über die Bedeutung und Ziele der sieben Handlungsfelder. Eine detaillierte Betrachtung - vor allem hinsichtlich der Implikationen jedes einzelnen Handlungsfeldes für die Kundenservice-Automatisierung, finden Sie in unserem kostenfreien Whitepaper. Dort haben wir auch Use Cases aus der Cognigy-Praxis eingefügt, um Ihnen konkrete Maßnahmen zur Erfüllung des jeweiligen AIC4-Handlungsfeldes näher zu bringen. Das Whitepaper können Sie hier downloaden:
Handlungsfeld: Sicherheit und Robustheit
In diesem Handlungsfeld geht es um den Schutz der KI-Anwendungen vor Manipulationsversuchen. Dabei spielt die Reaktionsfähigkeit auf sich ständig ändernde System- und Umweltbedingungen eine entscheidende Rolle. Zur Erkennung von böswilligen Attacken müssen seitens des Anbieters der KI-Lösung geeignete Tests entwickelt und regelmäßig durchgeführt werden. Außerdem steht die proaktive Implementierung von Maßnahmen gegen gezielte Angriffe im Fokus. Durch Tests und Maßnahmen soll die KI-Anwendung an Robustheit gewinnen, die verarbeiteten Daten geschützt und die sichere Weiterentwicklung der Algorithmen entlang der Trainingsdaten gewährleistet werden.
Die Erfüllung der Kriterien dieses Handlungsfeldes führen im Bereich Conversational AI u.a. zu einer gesteigerten Integrität von virtuellen Agenten (Phone- und Chatbots), zum Schutz von personenbezogenen Daten, zum Abbau von Manipulationsrisiken und zum sicheren Betrieb von KI-Anwendungen in der Cloud.
Handlungsfeld: Funktionalität und Performanz
Hier geht es darum, die Leistungsfähigkeit eines KI-Dienstes für sein jeweiliges Einsatzgebiet zu definieren und zu messen. Dabei wird auf geeignete Verfahren für das Training der Algorithmen, die Validierung und das Testing von KI-Anwendungen zurückgegriffen. Die im AIC4-Katalog vorgeschlagenen Metriken u.a. zu Genauigkeit, Sensibilität oder Fehlerrate des KI-Services dienen zum einen dazu, den mit Vertragspartnern vereinbarten Funktions- und Performance-Umfang zu prüfen und zum anderen als Basis für zukünftige Leistungsverbesserungen.
Die Erfüllung der Kriterien dieses Handlungsfeldes führen im Bereich Conversational AI zu einer Steigerung an Zuverlässigkeit von virtuellen Agenten im Kundeneinsatz (z. B. während Belastungsspitze), zu einer gesteigerten Qualität und Leistungsfähigkeit der Phone- und Chatbots nach jeder Trainingsiteration sowie zum Einsatz modernster und plausibelster Machine Learning-Modelle.
Handlungsfeld: Zuverlässigkeit
Dieses Handlungsfeld soll den zuverlässigen Betrieb des KI-Services in Produktivumgebungen sicherstellen. Darüber hinaus müssen Prozesse etabliert werden, um Fehler und Ausfälle des Dienstes zu untersuchen. Dazu gehören z. B. die Bereitstellung angemessener Ressourcen für die Aufrechterhaltung der KI, Logging-Verfahren, Backups und Prozesse zur Fehlerbehandlung. Hierzu wird teilweise auf die Kriterien des C5-Katalogs zurückgegriffen.
Die Erfüllung der Kriterien dieses Handlungsfeldes führen im Bereich Conversational AI zu einer besseren Erreichbarkeit von virtuellen Agenten (24/7), zur kontinuierlichen Wartung von Conversational AI Plattformen sowie zu einer engmaschigen Überwachung der KI-Dienste.
Handlungsfeld: Datenqualität
Hier geht es darum, dass Daten, die zur Entwicklung der ML-Modelle, dem Intent-Training und zum Betrieb des KI-Dienstes genutzt werden, bestimmte Qualitätsstandards erfüllen müssen. Beispielsweise sollten Trainingsdaten von angemessener Qualität und Quantität sein, um die KI für den entsprechenden Einsatzbereich ausreichend trainieren zu können. Darüber hinaus müssen Trainingsdaten leicht zugänglich und konsistent in ihrer Struktur sein. Das hat maßgeblichen Einfluss auf die Erklärbarkeit von KI-Modellen (“explainable AI”).
Die Erfüllung der Kriterien dieses Handlungsfeldes führen im Bereich Conversational AI zu besseren virtuellen Agenten, da die Qualität der Trainingsdaten für die Qualität der Phone- und Chatbots ausschlaggebend ist. Darüber hinaus werden Prozesse zur Datenbeschaffung, Qualifizierung und Evaluierung eingehalten und mögliche Vorurteile (sog. “KI-Bias”) in den ML-Modellen vermieden.
Handlungsfeld: Datenmanagement
Dieses Handlungsfeld schafft die Rahmenbedingungen für die strukturierte Erfassung von Daten und die Verwendung von Daten aus vertrauenswürdigen Quellen. Der KI-Dienst muss außerdem ein Framework für die Entwicklung und den Betrieb seines Services unter Verwendung von Trainingsdaten etablieren. Dazu gehört z. B. auch der adäquate Schutz der Trainingsdaten vor Zugriff durch nicht autorisierte Personen. Der Einsatz der Trainingsdaten muss außerdem zweckgebunden erfolgen und dokumentiert werden.
Die Erfüllung der Kriterien dieses Handlungsfeldes führen im Bereich Conversational AI zu einer besseren Dokumentation und mehr Transparenz in den Trainingsdaten, zu einer rechtlichen Absicherung, da nur Daten eingesetzt werden dürfen, die auch rechtlichen Vorschriften genügen und zugelassen sind sowie zur Etablierung von granularen Zugriffsrechten im KI-System.
Handlungsfeld: Erklärbarkeit
Die von Algorithmen im Rahmen eines KI-Dienstes getroffenen Entscheidungen müssen, wenn nötig, erklärbar sein. Zur Beurteilung müssen Personen mit entsprechender Expertise herangezogen und geeignete Techniken verwendet werden. Erklärbar muss unter anderem der Zweck und die Funktionsweise des eingesetzten Machine Learning Modells sein. Diese Informationen müssen dokumentiert und so aufbereitet werden, dass eine Bewertung durch externe Parteien, z. B. Fach- und Branchenexperten, aber auch Service-Nutzer möglich ist. Nur wenn diese Maßnahmen erfolgen, wird eine KI zur “explainable AI”.
Die Erfüllung der Kriterien dieses Handlungsfeldes führen im Bereich Conversational AI zu einer besseren Nachvollziehbarkeit der Entscheidungen von virtuellen Agenten. Außerdem wird damit eine Möglichkeit geschaffen, ML-Modelle extern überprüfen zu lassen. Das beschleunigt den Einsatz von Conversational AI Technologien, weil Vorbehalte im Unternehmen schneller abgebaut werden.
Handlungsfeld: Bias
In diesem Handlungsfeld soll die mögliche Voreingenommenheit (engl. “Bias”) des KI-Dienstes identifiziert werden. Dabei geht es z. B. um direkten und indirekten Bias ebenso wie um systemischen und statistischen Bias. Der AIC4 ist nicht explizit darauf ausgelegt, Vorurteile im Code oder in den Trainingsdaten aus ethischer Sicht zu beurteilen. Vielmehr geht es darum, mögliche Schwachstellen durch die Anwendung mathematischer Verfahren (z. B. “Adversarial Debiasing”, “Prejudice Remover” etc.) aufzudecken und damit dem Nutzer des KI-Dienstes transparent zu machen. Eine Beurteilung muss dann durch den Nutzer selbst vorgenommen werden. Der KI-Dienst-Betreiber wird im Rahmen der AIC4-Auditierung außerdem dazu angehalten, festgestellten KI-Bias mithilfe von spezifischen Algorithmen zu reduzieren.
Die Erfüllung der Kriterien dieses Handlungsfeldes führen im Bereich Conversational AI zu einer Reduktion bzw. Eliminierung von Bias (z. B. Diskriminierung), Gleichbehandlung von Usern und Intents - unabhängig von Herkunft oder Dialekt und zu einer faktisch-rationalen Kommunikation zwischen Mensch und virtuellem Agent.
“Der AIC4 basiert auf dem weltweit anerkannten Cloud Computing Compliance Criteria Catalogue (C5) des BSI. Die Verzahnung ermöglicht es, sich in Audits nach dem AIC4 im Wesentlichen auf die KI-spezifischen Aspekte zu fokussieren und an wichtigen Stellen, bspw. des Betriebs der KI Lösung, bestehende Prozesse und Kontrollen aus dem C5 Umfeld in Bezug zu nehmen.”
Hendrik Reese, Director, Artificial Intelligence, PwC Germany