Qgelm

Wie synthetische Daten dem Datenschutz helfen

Originalartikel

Backup

<html> <header class=„article-header“><h1 class=„articleheading“>Wie synthetische Daten dem Datenschutz helfen</h1><div class=„publish-info“> Eva Wolfangel</div></header><figure class=„aufmacherbild“><img src=„https://heise.cloudimg.io/width/700/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg“ srcset=„https://heise.cloudimg.io/width/700/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg 700w, https://heise.cloudimg.io/width/1050/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg 1050w, https://heise.cloudimg.io/width/1500/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg 1500w, https://heise.cloudimg.io/width/2056/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/3/1/5/4/1/2/9/shutterstock_232738360-fd22c3a0c6d8e9c8.jpeg 2056w“ alt=„“ class=„img-responsive“ referrerpolicy=„no-referrer“ /><figcaption class=„akwa-caption“>(Bild:&#160;rvlsoft/Shutterstock.com)</figcaption></figure><p><strong>Synthetische Daten k&#246;nnten auch eine Rolle dabei spielen, KI datenschutzfreundlicher zu trainieren. Dazu bedienen sich Experten eines Tricks.</strong></p><p>Bekanntlich brauchen maschinelle Lernsysteme sehr viele Daten, um zu lernen. Dabei hat sich aber immer wieder gezeigt, dass sich selbst anonymisierte Datens&#228;tze de-anonymisieren lassen. Das hei&#223;t, es ist m&#246;glich, in anonymisierten Datens&#228;tzen R&#252;ckschl&#252;sse auf Einzelne zu ziehen, denn oft gibt es weitere Zusammenh&#228;nge, die k&#252;nstliche Intelligenz findet.</p><p>„Synthetische Daten helfen uns, die DSGVO umzusetzen“, sagt Alexandra Ebert vom Start-up MostlyAI. Nvidias KI-Gesichter erschienen ihr als Beweis, dass diese Methode helfen k&#246;nnte, Datens&#228;tze zu anonymisieren &#8211; oder eben nicht im klassischen Sinn zu anonymisieren, sondern auf deren Basis neue Datens&#228;tze mit den gleichen Eigenschaften zu konstruieren, die keine R&#252;ckschl&#252;sse auf die urspr&#252;nglichen Daten zulie&#223;en und damit nicht de-anonymisierbar seien.</p><p>„Bei Nvidia ist es nicht vorgekommen, dass von einem Individuum auch nur ein Element &#252;bernommen wurde“, sagt Ebert, „der Algorithmus hat die Regeln verstanden, wie menschliche Gesichter aussehen.“</p><p>Ein Kunde von MostlyAI ist die &#196;rztebank, und f&#252;r Banken sind Daten interessant, die gleichzeitig aus Datenschutzgr&#252;nden sehr heikel sind: Der Zusammenhang zwischen Verm&#246;gen, Lebensstil und Verhalten. Wer mehr &#252;ber diese Zusammenh&#228;nge wei&#223;, kann seine Produkte besser an die Kunden anpassen. „Diese Daten d&#252;rfen aber nicht verwendet werden“, sagt Ebert.</p><p>Als Notl&#246;sung nutzen Entwickler bisher entweder ihre eigenen Daten oder arbeiteten mit sogenannten „Personas“, groben Ann&#228;herungen an verschiedene Typen von Kunden auf der Basis von Hypothesen. Doch diese &#252;bereinfachten Personen halfen nicht wirklich weiter, weil sie viel zu pauschal waren. Damit lie&#223;en sich die Bed&#252;rfnisse einzelner Kunden nicht genau genug abbilden.</p><header class=„a-boxheader“ data-collapse-trigger=„“>TR 6/2021</header><div class=„a-boxtarget a-boxcontent a-inline-textboxcontent a-inline-textboxcontent–horizontal-layout“ data-collapse-target=„“><figure class=„a-inline-textboximage-container“><img alt=„“ src=„https://heise.cloudimg.io/width/2484/q50.png-lossy-50.webp-lossy-50.foil1/_www-heise-de_/imgs/71/3/1/5/3/3/2/4/tr0621-f9e91da1b649c0fe.png“ srcset=„https://heise.cloudimg.io/width/4968/q30.png-lossy-30.webp-lossy-30.foil1/_www-heise-de_/imgs/71/3/1/5/3/3/2/4/tr0621-f9e91da1b649c0fe.png 2x“ class=„c1“ referrerpolicy=„no-referrer“ /></figure><div class=„a-inline-textboxcontent-container“><p class=„a-inline-textboxsynopsis“>Dieser Beitrag stammt aus Ausgabe 6/2021 der Technology Review. Das Heft ist ab dem 19.08.2021 im Handel sowie direkt im heise shop erh&#228;ltlich. Highlights aus dem Heft:</p><ul class=„a-inline-textboxlist“><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120112000690184712“ title=„Hey KI: Wie Forscher K&#252;nstliche Intelligenz gerecht machen wollen“><strong>Hey KI: Wie Forscher K&#252;nstliche Intelligenz gerecht machen wollen [1]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120113115556140178“ title=„Bakterien: Die n&#228;chste Seuche ist schon da“><strong>Bakterien: Die n&#228;chste Seuche ist schon da [2]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2121007094333071493“ title=„Wachmacher: Mehr Daten f&#252;r besseren Kaffee“><strong>Wachmacher: Mehr Daten f&#252;r besseren Kaffee [3]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120112060872995354“ title=„KI-Texterstellung: Zwietracht-Maschine GPT-3“><strong>KI-Texterstellung: Zwietracht-Maschine GPT-3 [4]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120113043197977131“ title=„Mangelware Chips: Flaschenhals des Fortschritts“><strong>Mangelware Chips: Flaschenhals des Fortschritts [5]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://www.heise.de/select/tr/2021/6/2120112345330889874“ title=„Fokus: Smart Cities“><strong>Fokus: Smart Cities [6]</strong></a></li><li class=„a-inline-textboxitem“><a class=„a-inline-textboxtext“ href=„https://shop.heise.de/technology-review-06-2021/Print?wt_mc=intern.shop.shop.tr_2106.dos.textlink.textlink“ title=„TR bestellen“><strong>TR bestellen [7]</strong></a></li></ul></div></div><p>MostlyAI hat ein System des maschinellen Lernens entwickelt, das aus den Kundendaten der &#196;rztebank lernt, eine eigene Datenbank aus komplett k&#252;nstlichen Daten zu erstellen &#8211; die aber die gleichen Eigenschaften haben. „Sie sind komplett repr&#228;sentativ und granular“, schw&#228;rmt Ebert. Die Software sei direkt bei der Bank installiert und lerne dort aus deren Kundendaten. Das Start-up bekomme die Daten nicht zu sehen. Am Ende st&#252;nde ein komplett separater Datensatz ohne eine zur&#252;ckverfolgbare Beziehung zwischen den echten und den synthetischen Menschen.</p><p>„Bei solchen Behauptungen bin ich sehr skeptisch“, sagt Aaron Roth von der University of Pennsylvania: „Es ist noch nicht m&#246;glich, synthetische Datens&#228;tze mit strikten Datenschutzgarantien zu erstellen.“ So gebe es eine ganze Reihe an Forschungspapieren, die entsprechende Angriffe nachweisen, in denen sehr wohl R&#252;ckschl&#252;sse gezogen werden konnte auf die Personen aus dem urspr&#252;nglichen Datensatz. Sogenannte „privacy attacks“ werden auch dadurch gef&#246;rdert, dass KI-Systeme in manchen F&#228;llen dazu neigen, auswendig zu lernen &#8211; und damit im schlimmsten Fall eine Kopie des Datensatzes erstellen.</p><p>Generell ist Roth aber optimistisch, dass synthetische Daten helfen k&#246;nnten, KI datenschutzfreundlich lernen zu lassen. „Prinzipiell sollte es m&#246;glich sein, synthetische Datens&#228;tze zu erstellen, von denen man die gleiche Antwort bekommt wie von einem realen Datensatz.“ Es gebe vielversprechende Forschungen dazu &#8211; aber eben auch bekannte R&#252;ckschl&#228;ge.</p><figure class=„branding“><a href=„https://www.heise.de/tr/“ name=„meldung.newsticker.inline.branding_tr“ title=„Mehr von MIT Technology Review“><strong> <img alt=„Mehr von MIT Technology Review“ height=„693“ src=„https://static.wallabag.it/7862d1b7aff4c3b00f37212fefade4e0e2c4cf00/64656e6965643a646174613a696d6167652f7376672b786d6c2c253343737667253230786d6c6e733d27687474703a2f2f7777772e77332e6f72672f323030302f7376672725323077696474683d273639367078272532306865696768743d2733393170782725323076696577426f783d2730253230302532303639362532303339312725334525334372656374253230783d273027253230793d27302725323077696474683d27363936272532306865696768743d273339312725323066696c6c3d27253233663266326632272533452533432f726563742533452533432f737667253345/“ class=„c2“ width=„1200“ referrerpolicy=„no-referrer“ /><img alt=„Mehr von MIT Technology Review“ class=„a-u-hide-from-tablet c1“ src=„https://heise.cloudimg.io/width/1200/q50.png-lossy-50.webp-lossy-50.foil1/_www-heise-de_/Magazin-Banner/tr_mobil.jpg“ srcset=„https://heise.cloudimg.io/width/2400/q30.png-lossy-30.webp-lossy-30.foil1/_www-heise-de_/Magazin-Banner/tr_mobil.jpg 2x“ referrerpolicy=„no-referrer“ /> <img alt=„Mehr von MIT Technology Review“ height=„500“ src=„https://static.wallabag.it/7862d1b7aff4c3b00f37212fefade4e0e2c4cf00/64656e6965643a646174613a696d6167652f7376672b786d6c2c253343737667253230786d6c6e733d27687474703a2f2f7777772e77332e6f72672f323030302f7376672725323077696474683d273639367078272532306865696768743d2733393170782725323076696577426f783d2730253230302532303639362532303339312725334525334372656374253230783d273027253230793d27302725323077696474683d27363936272532306865696768743d273339312725323066696c6c3d27253233663266326632272533452533432f726563742533452533432f737667253345/“ class=„c3“ width=„1830“ referrerpolicy=„no-referrer“ /><img alt=„Mehr von MIT Technology Review“ class=„a-u-show-from-tablet c1“ src=„https://heise.cloudimg.io/width/1830/q50.png-lossy-50.webp-lossy-50.foil1/_www-heise-de_/Magazin-Banner/tr_desktop.jpg“ srcset=„https://heise.cloudimg.io/width/3660/q30.png-lossy-30.webp-lossy-30.foil1/_www-heise-de_/Magazin-Banner/tr_desktop.jpg 2x“ referrerpolicy=„no-referrer“ /> [8]</strong></a></figure><p>() </p><hr /><p><strong>URL dieses Artikels:</strong><br /><small>

https://www.heise.de/-6166906

</small></p><p><strong>Links in diesem Artikel:</strong><br /><small>

<strong>[1]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120112000690184712

</small><br /><small>

<strong>[2]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120113115556140178

</small><br /><small>

<strong>[3]</strong>&#160;https://www.heise.de/select/tr/2021/6/2121007094333071493

</small><br /><small>

<strong>[4]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120112060872995354

</small><br /><small>

<strong>[5]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120113043197977131

</small><br /><small>

<strong>[6]</strong>&#160;https://www.heise.de/select/tr/2021/6/2120112345330889874

</small><br /><small>

<strong>[7]</strong>&#160;https://shop.heise.de/technology-review-06-2021/Print?wt_mc=intern.shop.shop.tr_2106.dos.textlink.textlink

</small><br /><small>

<strong>[8]</strong>&#160;https://www.heise.de/tr/

</small><br /><small>

<strong>[9]</strong>&#160;mailto:bsc@heise.de

</small><br /></p><p class=„printversion__copyright“><em>Copyright &#169; 2021 Heise Medien</em></p> </html>

Cookies helfen bei der Bereitstellung von Inhalten. Diese Website verwendet Cookies. Mit der Nutzung der Website erklären Sie sich damit einverstanden, dass Cookies auf Ihrem Computer gespeichert werden. Außerdem bestätigen Sie, dass Sie unsere Datenschutzerklärung gelesen und verstanden haben. Wenn Sie nicht einverstanden sind, verlassen Sie die Website.Weitere Information