Wie synthetische Daten dem Datenschutz helfen

Originalartikel

Backup

<html> <header class=„article-header“><h1 class=„articleheading“>Wie synthetische Daten dem Datenschutz helfen</h1><div class=„publish-info“> Eva Wolfangel</div></header><figure class=„aufmacherbild“><img src=„https://heise.cloudimg.io/width/700/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg“ srcset=„https://heise.cloudimg.io/width/700/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg 700w, https://heise.cloudimg.io/width/1050/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg 1050w, https://heise.cloudimg.io/width/1500/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg 1500w, https://heise.cloudimg.io/width/2056/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg 2056w“ alt=„“ class=„img-responsive“ referrerpolicy=„no-referrer“ /><figcaption class=„akwa-caption“>(Bild:&#160;rvlsoft/Shutterstock.com)</figcaption></figure><p><strong>Synthetische Daten k&#246;nnten auch eine Rolle dabei spielen, KI datenschutzfreundlicher zu trainieren. Dazu bedienen sich Experten eines Tricks.</strong></p><p>Bekanntlich brauchen maschinelle Lernsysteme sehr viele Daten, um zu lernen. Dabei hat sich aber immer wieder gezeigt, dass sich selbst anonymisierte Datens&#228;tze de-anonymisieren lassen. Das hei&#223;t, es ist m&#246;glich, in anonymisierten Datens&#228;tzen R&#252;ckschl&#252;sse auf Einzelne zu ziehen, denn oft gibt es weitere Zusammenh&#228;nge, die k&#252;nstliche Intelligenz findet.</p><p>„Synthetische Daten helfen uns, die DSGVO umzusetzen“, sagt Alexandra Ebert vom Start-up MostlyAI. Nvidias KI-Gesichter erschienen ihr als Beweis, dass diese Methode helfen k&#246;nnte, Datens&#228;tze zu anonymisieren &#8211; oder eben nicht im klassischen Sinn zu anonymisieren, sondern auf deren Basis neue Datens&#228;tze mit den gleichen Eigenschaften zu konstruieren, die keine R&#252;ckschl&#252;sse auf die urspr&#252;nglichen Daten zulie&#223;en und damit nicht de-anonymisierbar seien.</p><p>„Bei Nvidia ist es nicht vorgekommen, dass von einem Individuum auch nur ein Element &#252;bernommen wurde“, sagt Ebert, „der Algorithmus hat die Regeln verstanden, wie menschliche Gesichter aussehen.“</p><p>Ein Kunde von MostlyAI ist die &#196;rztebank, und f&#252;r Banken sind Daten interessant, die gleichzeitig aus Datenschutzgr&#252;nden sehr heikel sind: Der Zusammenhang zwischen Verm&#246;gen, Lebensstil und Verhalten. Wer mehr &#252;ber diese Zusammenh&#228;nge wei&#223;, kann seine Produkte besser an die Kunden anpassen. „Diese Daten d&#252;rfen aber nicht verwendet werden“, sagt Ebert.</p><p>Als Notl&#246;sung nutzen Entwickler bisher entweder ihre eigenen Daten oder arbeiteten mit sogenannten „Personas“, groben Ann&#228;herungen an verschiedene Typen von Kunden auf der Basis von Hypothesen. Doch diese &#252;bereinfachten Personen halfen nicht wirklich weiter, weil sie viel zu pauschal waren. Damit lie&#223;en sich die Bed&#252;rfnisse einzelner Kunden nicht genau genug abbilden.</p><header class=„a-boxheader“ data-collapse-trigger=„“>TR 6/2021</header><div class=„a-boxtarget a-boxcontent a-inline-textboxcontent a-inline-textboxcontent–horizontal-layout“ data-collapse-target=„“><figure class=„a-inline-textboximage-container“><img alt=„“ src=„https://heise.cloudimg.io/width/2484/q50.png-lossy-50.webp-lossy-50.foil1/_www-heise-de_/imgs/71/3/1/5/3/3/2/4/tr0621-f9e91da1b649c0fe.png“ srcset=„https://heise.cloudimg.io/width/4968/q30.png-lossy-30.webp-lossy-30.foil1/_www-heise-de_/imgs/71/3/1/5/3/3/2/4/tr0621-f9e91da1b649c0fe.png 2x“ class=„c1“ referrerpolicy=„no-referrer“ /></figure><div class=„a-inline-textboxcontent-container“><p class=„a-inline-textboxsynopsis“>Dieser Beitrag stammt aus Ausgabe 6/2021 der Technology Review. Das Heft ist ab dem 19.08.2021 im Handel sowie direkt im heise shop erh&#228;ltlich. Highlights aus dem Heft:</p><ul class=„a-inline-textboxlist“><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120112000690184712“ title=„Hey KI: Wie Forscher K&#252;nstliche Intelligenz gerecht machen wollen“><strong>Hey KI: Wie Forscher K&#252;nstliche Intelligenz gerecht machen wollen [1]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120113115556140178“ title=„Bakterien: Die n&#228;chste Seuche ist schon da“><strong>Bakterien: Die n&#228;chste Seuche ist schon da [2]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2121007094333071493“ title=„Wachmacher: Mehr Daten f&#252;r besseren Kaffee“><strong>Wachmacher: Mehr Daten f&#252;r besseren Kaffee [3]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120112060872995354“ title=„KI-Texterstellung: Zwietracht-Maschine GPT-3“><strong>KI-Texterstellung: Zwietracht-Maschine GPT-3 [4]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120113043197977131“ title=„Mangelware Chips: Flaschenhals des Fortschritts“><strong>Mangelware Chips: Flaschenhals des Fortschritts [5]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120112345330889874“ title=„Fokus: Smart Cities“><strong>Fokus: Smart Cities [6]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://shop.heise.de/technology-review-06-2021/Print?wt_mc=intern.shop.shop.tr_2106.dos.textlink.textlink“ title=„TR bestellen“><strong>TR bestellen [7]</strong></a></li></ul></div></div><p>MostlyAI hat ein System des maschinellen Lernens entwickelt, das aus den Kundendaten der &#196;rztebank lernt, eine eigene Datenbank aus komplett k&#252;nstlichen Daten zu erstellen &#8211; die aber die gleichen Eigenschaften haben. „Sie sind komplett repr&#228;sentativ und granular“, schw&#228;rmt Ebert. Die Software sei direkt bei der Bank installiert und lerne dort aus deren Kundendaten. Das Start-up bekomme die Daten nicht zu sehen. Am Ende st&#252;nde ein komplett separater Datensatz ohne eine zur&#252;ckverfolgbare Beziehung zwischen den echten und den synthetischen Menschen.</p><p>„Bei solchen Behauptungen bin ich sehr skeptisch“, sagt Aaron Roth von der University of Pennsylvania: „Es ist noch nicht m&#246;glich, synthetische Datens&#228;tze mit strikten Datenschutzgarantien zu erstellen.“ So gebe es eine ganze Reihe an Forschungspapieren, die entsprechende Angriffe nachweisen, in denen sehr wohl R&#252;ckschl&#252;sse gezogen werden konnte auf die Personen aus dem urspr&#252;nglichen Datensatz. Sogenannte „privacy attacks“ werden auch dadurch gef&#246;rdert, dass KI-Systeme in manchen F&#228;llen dazu neigen, auswendig zu lernen &#8211; und damit im schlimmsten Fall eine Kopie des Datensatzes erstellen.</p><p>Generell ist Roth aber optimistisch, dass synthetische Daten helfen k&#246;nnten, KI datenschutzfreundlich lernen zu lassen. „Prinzipiell sollte es m&#246;glich sein, synthetische Datens&#228;tze zu erstellen, von denen man die gleiche Antwort bekommt wie von einem realen Datensatz.“ Es gebe vielversprechende Forschungen dazu &#8211; aber eben auch bekannte R&#252;ckschl&#228;ge.</p><figure class=„branding“><a href=„https://www.heise.de/tr/“ name=„meldung.newsticker.inline.branding_tr“ title=„Mehr von MIT Technology Review“><strong> <img alt=„Mehr von MIT Technology Review“ height=„693“ src=„https://static.wallabag.it/7862d1b7aff4c3b00f37212fefade4e0e2c4cf00/64656e6965643a646174613a696d6167652f7376672b786d6c2c253343737667253230786d6c6e733d27687474703a2f2f7777772e77332e6f72672f323030302f7376672725323077696474683d273639367078272532306865696768743d2733393170782725323076696577426f783d2730253230302532303639362532303339312725334525334372656374253230783d273027253230793d27302725323077696474683d27363936272532306865696768743d273339312725323066696c6c3d27253233663266326632272533452533432f726563742533452533432f737667253345/“ class=„c2“ width=„1200“ referrerpolicy=„no-referrer“ /><img alt=„Mehr von MIT Technology Review“ class=„a-u-hide-from-tablet c1“ src=„https://heise.cloudimg.io/width/1200/q50.png-lossy-50.webp-lossy-50.foil1/_www-heise-de_/Magazin-Banner/tr_mobil.jpg“ srcset=„https://heise.cloudimg.io/width/2400/q30.png-lossy-30.webp-lossy-30.foil1/_www-heise-de_/Magazin-Banner/tr_mobil.jpg 2x“ referrerpolicy=„no-referrer“ /> <img alt=„Mehr von MIT Technology Review“ height=„500“ src=„https://static.wallabag.it/7862d1b7aff4c3b00f37212fefade4e0e2c4cf00/64656e6965643a646174613a696d6167652f7376672b786d6c2c253343737667253230786d6c6e733d27687474703a2f2f7777772e77332e6f72672f323030302f7376672725323077696474683d273639367078272532306865696768743d2733393170782725323076696577426f783d2730253230302532303639362532303339312725334525334372656374253230783d273027253230793d27302725323077696474683d27363936272532306865696768743d273339312725323066696c6c3d27253233663266326632272533452533432f726563742533452533432f737667253345/“ class=„c3“ width=„1830“ referrerpolicy=„no-referrer“ /><img alt=„Mehr von MIT Technology Review“ class=„a-u-show-from-tablet c1“ src=„https://heise.cloudimg.io/width/1830/q50.png-lossy-50.webp-lossy-50.foil1/_www-heise-de_/Magazin-Banner/tr_desktop.jpg“ srcset=„https://heise.cloudimg.io/width/3660/q30.png-lossy-30.webp-lossy-30.foil1/_www-heise-de_/Magazin-Banner/tr_desktop.jpg 2x“ referrerpolicy=„no-referrer“ /> [8]</strong></a></figure><p>() </p><hr /><p><strong>URL dieses Artikels:</strong><br /><small>

https://www.heise.de/-6166906

</small></p><p><strong>Links in diesem Artikel:</strong><br /><small>

<strong>[1]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120112000690184712

</small><br /><small>

<strong>[2]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120113115556140178

</small><br /><small>

<strong>[3]</strong>&#160;https://www.heise.de/select/tr/2021/6/2121007094333071493

</small><br /><small>

<strong>[4]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120112060872995354

</small><br /><small>

<strong>[5]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120113043197977131

</small><br /><small>

<strong>[6]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120112345330889874

</small><br /><small>

<strong>[7]</strong>&#160;https://shop.heise.de/technology-review-06-2021/Print?wt_mc=intern.shop.shop.tr_2106.dos.textlink.textlink

</small><br /><small>

<strong>[8]</strong>&#160;https://www.heise.de/tr/

</small><br /><small>

<strong>[9]</strong>&#160;mailto:bsc@heise.de

</small><br /></p><p class=„printversion__copyright“><em>Copyright &#169; 2021 Heise Medien</em></p> </html>