Sie verwenden einen veralteten Browser. Um im Internet auch weiterhin sicher unterwegs zu sein, empfehlen wir ein Update.

Nutzen Sie z.B. eine aktuelle Version von Edge, Chrome oder Firefox

22. Januar 2022

Synthetische Daten: Das leisten sie für den Datenschutz

DP+
Um KI-Modelle datenschutzfreundlich zu trainieren, sind KI-gestützte Tools nötig, die die synthetischen Daten erzeugen
Bild: iStock.com / Ryzhi
0,00 (0)
Datenschutz-Technologien
Die Idee hinter „synthetischen Daten“ besteht darin, einen ursprüng­lichen Datensatz zu verwenden und daraus neue, künstliche Daten mit ähnlichen statistischen Eigenschaften zu erstellen. KI-Modelle sollen sich auf diese Weise datenschutzfreundlich trainieren lassen.
Wer im Unternehmen Künstliche Intelligenz (KI) entwickeln und einsetzen will, muss diese mit geeigneten Daten trainieren. Nach einer Bitkom-Umfrage geben zwei Drittel (64 %) derjenigen, die sich mit KI auseinandersetzen, an, dass sie personenbezogene Daten nutzen müssen, damit die KI verwertbare Analyseergebnisse liefert.

Offensichtlich fällt es den Unternehmen aber nicht leicht, dabei die Anforderungen des Datenschutzes zu erfüllen: Bei mehr als jedem zweiten Unternehmen (56 %) sind neue, innovative Projekte aufgrund der Datenschutz-Grundverordnung (DSGVO) gescheitert, entweder wegen direkter Vorgaben oder wegen Unklarheiten in der Auslegung der DSGVO, so Bitkom. Bei drei von zehn (31 %) ließen sich dadurch neue Technologien wie Big Data oder KI nicht einsetzen (https://ogy.de/bitkom-ki).

KI muss aber nicht am Datenschutz scheitern. Vielmehr kann sie den Datenschutz unterstützen, so wie der Datenschutz erfolgreiche KI-Projekte erst möglich macht.

Das Konzept der synthetischen Daten

Unternehmen betreiben einen hohen Aufwand, um die rechtlichen Vorgaben beim Training von Systemen des maschinellen Lernens mit personenbezogenen Daten einzuhalten, berichtet Bitkom. Für 63 % der Unternehmen führt kein Weg an der Anonymisierung der Daten vorbei.

Es gibt aber Alternativen zur Anonymisierung, darunter das Konzept der synthetischen Daten. Synthetische Daten sind Daten, die künstlich generiert und nicht unmittelbar in der echten Welt erhoben wurden. Solange der synthetische Datenbestand keinen Personenbezug aufweist, ist er anonym – un…

Oliver Schonschek
+

Weiterlesen mit DP+

Sie haben noch kein Datenschutz-PRAXIS-Abo und möchten weiterlesen?

Weiterlesen mit DP+
Konzentrieren Sie sich aufs Wesentliche
Profitieren Sie von kurzen, kompakten und verständlichen Beiträgen.
Kein Stress mit Juristen- und Admin-Deutsch
Lesen Sie praxisorientierte Texte ohne Fußnotenapparat und Techniker-Sprech.
Sparen Sie sich langes Suchen
Alle Arbeitshilfen und das komplette Heftarchiv finden Sie online.
Verfasst von
Oliver Schonschek
Oliver Schonschek
Oliver Schonschek ist freiberuflicher News Analyst, Journalist und Kommentator, der sich auf Sicherheit, Datenschutz und Compliance spezialisiert hat. Er schreibt für führende Medien, ist Herausgeber und Autor mehrerer Lehrbücher.
Vielen Dank! Ihr Kommentar muss noch redaktionell geprüft werden, bevor wir ihn veröffentlichen können.