Leitfaden: Künstliche Intelligenz trainieren, Datenschutz wahren

Personenbezogene Daten können zum Fallstrick in KI-Projekten werden.

Ein Leitfaden von Bitkom gibt Hilfe zur Anonymisierung und Pseudonymisierung im Machine Learning. (Foto: Nmedia / Fotolia)
Ein Leitfaden von Bitkom gibt Hilfe zur Anonymisierung und Pseudonymisierung im Machine Learning. (Foto: Nmedia / Fotolia)
Therese Meitinger

Wer im Unternehmen Künstliche Intelligenz entwickeln und einsetzen will, muss diese mit geeigneten Daten trainieren. Nach einer Umfrage unter 503 Unternehmen ab 50 Mitarbeitern im Auftrag des Digitalverbands Bitkom geben zwei Drittel (64 Prozent) derjenigen, die sich mit KI auseinandersetzen, an, dass personenbezogene Daten genutzt werden müssen, damit die KI verwertbare Analyseergebnisse liefert.

„Wer mit personenbezogenen Daten arbeitet, muss die Anforderungen des Datenschutzes erfüllen“, sagt Dr. Nabil Alsabah, Bereichsleiter Künstliche Intelligenz beim Bitkom. „Entwicklern stehen zwei wichtige Werkzeuge zur Verfügung, um den Personenbezug zu verschleiern oder ganz zu entfernen: Sie können die Daten pseudonymisieren oder anonymisieren.“

Der Digitalverband Bitkom hat laut einer Pressemitteilung vom 9. Oktober dazu einen Leitfaden „Anonymisierung und Pseudonymisierung von Daten für Projekte des maschinellen Lernens“ veröffentlicht.

Richtig Anonymisieren und Pseudonymisieren

Nach einer Einführung in die verschiedenen Methoden der Anonymisierung und Pseudonymisierung werden dem Verband zufolge konkrete Anwendungen und Maßnahmen vorgestellt, wie sich personenbezogene Daten datenschutzkonform nutzen lassen und wo mögliche Gefahren lauern. Unter anderem würden Lösungen für den Umgang mit Geo-Bewegungsprofilen vorgestellt und die Methoden, mit denen Google Mobilitätsdaten für die Covid-19-Warnung erhebt, so Bitkom.

Jeweils ein eigenes Kapitel widmet sich laut dem Verband der Anonymisierung und Pseudonymisierung medizinischer Textdaten, dem Verfahren der der semantischen Anonymisierung sowie Datenschutzrisiken bei Medieninhalten. Ausführlich wird demnach zudem das Konzept des föderierten Lernens vorgestellt, bei dem das maschinelle Lernen nur lokal stattfindet und so keine personenbezogenen Daten an Dritte übertragen werden.

Printer Friendly, PDF & Email