Qgelm

Missing Link: Street View verrät Wahlverhalten oder Datenschutz mit KI aushebeln

Originalartikel

Backup

<html> <time datetime=„2018-01-07T09:00:00+01:00“>vor 42 Minuten</time> Stefan Krempl <figure class=„aufmacherbild“><img src=„https://heise.cloudimg.io/width/1280/tjpg.q50.webp-lossy-50.foil1/_www-heise-de_/imgs/18/2/3/4/7/7/0/8/Screenshot-2018-1-6_Google_Maps-e93223fde87d74e5.jpeg“ alt=„Missing Link: K&#252;nstliche Intelligenz oder Was Google Street View &#252;ber Wahlvorlieben verr&#228;t“/></figure><p class=„lead_text“>Forschern ist es gelungen, mithilfe von Deep Learning aus &#246;ffentlich verf&#252;gbaren Google-Stra&#223;enaufnahmen auf soziale, wirtschaftliche und politische Muster in Stadtvierteln zu schlie&#223;en. Wie bei &#228;hnlichen KI-Verfahren gibt es Datenschutzbedenken.</p><p>Wenn einem beim Durchfahren einer Stadt in den USA mehr viert&#252;rige Stufenhecklimousinen als Pickup-Trucks begegnen, ist die Wahrscheinlichkeit mit 88 Prozent recht gro&#223;, dass dort bei der n&#228;chsten Pr&#228;sidentschaftswahl ein Kandidat der Demokraten das Rennen macht. L&#228;sst sich das gegenteilige Ph&#228;nomen beobachten, d&#252;rfte sich die Kommune eher f&#252;r einen Republikaner aussprechen &#8211; bei einer Treffsicherheit von 82 Prozent.</p> <p><a href=„http://www.heise.de/mediadaten/online/“ target=„_blank“ class=„hinweis_anzeige“>Anzeige</a></p> <p>Was ein US-Forscherteam j&#252;ngst herausgefunden und in einem <a href=„http://www.pnas.org/content/114/50/13108.full.pdf“ rel=„external“ target=„_blank“>Beitrag</a> in den <em>Proceedings of the National Academy of Sciences</em> ver&#246;ffentlicht hat, h&#246;rt sich zun&#228;chst nicht nach h&#246;herer Mathematik an. Marktforscher und Politikanalysten k&#246;nnten durch eigene Recherchen und Umfragen zu &#228;hnlichen Ergebnissen kommen. &#220;berraschender und vermutlich deutlich folgenschwerer ist die Art und Weise, wie die Wissenschaftler unter Einsatz von Methoden K&#252;nstlicher Intelligenz (KI) zu den Resultaten gekommen sind.</p> <p>Die Gruppe, die Timnit Gebru als Doktorandin an der Stanford-Universit&#228;t geleitet hat, analysierte f&#252;r das Vorhaben mit maschineller Hilfe rund 50 Millionen &#246;ffentlich verf&#252;gbare Bilder und Standortdaten von Google Street View. Erstmals schafften es die Wissenschaftler dabei &#252;ber <a href=„https://de.wikipedia.org/wiki/Deep_Learning“ rel=„external“ target=„_blank“>Deep-Learning-Methoden</a>, aus dem Stra&#223;enansichtsdienst weitere Daten abzuleiten, diese zu sortieren, nach Zusammenh&#228;ngen zu durchsch&#252;rfen sowie soziale, wirtschaftliche und politische Muster wie Einkommen, Einkaufsvorlieben oder Interessen f&#252;r einzelne Parteien in Stadtvierteln der gesamten USA auszumachen.</p> <p>Der Ansatz k&#246;nne helfen, schreiben die Forscher, klassische Formen der Demoskopie und die Volksz&#228;hlung zu erg&#228;nzen und zu unterf&#252;ttern. Automatische Systeme d&#252;rften ihnen zufolge imstande sein, demografische Informationen k&#252;nftig effizienter als „arbeitsintensive Ans&#228;tze“ in hoher „Aufl&#246;sung“ und „fast in Echtzeit“ zu messen.</p> <p>F&#252;r den Informatiker Erez Lieberman Aiden, der ein genomisches Forschungszentrum an der Baylor School of Medicine leitet und das von Stanford aus orchestrierte Team beraten hat, geht das Projekt weit dar&#252;ber hinaus: „Auf einmal k&#246;nnen wir Bilder genauso analysieren wie bislang Text“, <a href=„https://www.nytimes.com/2017/12/31/technology/google-images-voters.html“ rel=„external“ target=„_blank“>erkl&#228;rte</a> er der <em>New York Times</em>. Computer d&#252;rften nun auch in diesem Bereich ihre F&#228;higkeiten ausspielen, „ohne eine Hand auf den R&#252;cken gebunden zu haben“.</p> <p>&#196;hnlich wie bei Menschen gibt es bei der KI &#252;ber die Untersuchung von Text, Sprache und Beobachtungen unterschiedliche Wege, um sich die Au&#223;enwelt zu erschlie&#223;en. Die ersten beiden Kategorien waren bei rechnergest&#252;tzten Verst&#228;ndnisversuchen bisher trotz aller semantischer Mehrdeutigkeiten prinzipiell einfacher zu handhaben, da sie zun&#228;chst auf begrenzten Zeichenabfolgen wie dem Alphabet aufbauen. Aber auch die Bilderkennung hat in den vergangenen Jahren Fortschritte gemacht, auch weil Konzerne viel Geld in dieses Gebiet gesteckt und etwa Methoden zur Gesichtserkennung verbessert haben.</p> <figure class=„rteinlinebild akwa-inline-img rtepos_right col-lg-6 col-md-6 col-sm-6 col-xs-12 akwa-inline–right“><a class=„grossbild cbox_gallery akwa-inline-imglink“ data-content-type=„image“ data-grossbildsrc=„/imgs/18/2/3/4/7/7/0/8/auto-KI-basierter-zensus-e84eb963f9606ecf.jpeg“ href=„https://m.heise.de/newsticker/meldung/Missing-Link-Street-View-verraet-Wahlverhalten-oder-Datenschutz-mit-KI-aushebeln-3935313.html?view=zoom;zoom=1“><img alt=„Gebru et.al.“ class=„img-responsive akwa-inline-imgimg“ src=„https://heise.cloudimg.io/width/1280/q50.webp-lossy-50.foil1/_www-heise-de_/imgs/18/2/3/4/7/7/0/8/auto-KI-basierter-zensus-e84eb963f9606ecf.jpeg“/></a> <figcaption class=„rte__inlinebild_source akwa-caption“>(Bild:&#160;Gebru et.al.)</figcaption></figure><p>Das auf Google Street View aufsetzende Projekt weist in diese Richtung. Wichtigster Hinweis ist dabei das liebste Kind der US-Amerikaner und ein Symbol der westlichen Kultur: das Auto. Ein solches findet sich den Forscher zufolge in 90 Prozent der US-Haushalte und die Wahl des motorisierten Fahrzeugs werde beeinflusst durch zahlreiche demografische Faktoren einschlie&#223;lich der Bed&#252;rfnisse, der pers&#246;nlichen Vorlieben und der &#246;konomischen Gesamtsituation der Halter.</p> <p><a href=„http://www.heise.de/mediadaten/online/“ target=„_blank“ class=„hinweis_anzeige“>Anzeige</a></p> <p>Um diese Variablen f&#252;r den Computer zu erschlie&#223;en, entwickelten die Wissenschaftler ein Erkennungssystem, das vor allem auf dem Deep-Learning-Modell der „Convolutional Neural Networks“ (<a href=„https://de.wikipedia.org/wiki/Convolutional_Neural_Network“ rel=„external“ target=„_blank“>CNN</a>) aufbaut. Darunter versteht man ein k&#252;nstliches neuronales Netz, das konzeptionell biologische Prozesse f&#252;r das maschinelle Lernen nachzuahmen versucht, und laut den Autoren den bislang f&#252;r die Objektklassifizierung erfolgreichsten einschl&#228;gigen Algorithmus nutzt. Mit dem System sei es m&#246;glich gewesen, nicht nur insgesamt 22 Millionen Autos in den komplexen Stra&#223;enszenen aus Street View auszumachen, sondern auch eine weite Reihe ihrer Charakteristiken festzustellen. Dazu geh&#246;rten etwa der Fabrikant, das Modell und das Baujahr.</p> <p>Die CNN-Variante ist laut den Insidern mittlerweile f&#228;hig, Autos jeweils binnen 0,2 Sekunden in eine von 2657 Kategorien einzuordnen. Die Treffsicherheit, ein normales zwei- oder viert&#252;riges Fahrzeug zu erkennen, liege bei 95 Prozent anhand der Testdaten. Vans und Minibusse k&#246;nne das System mit einer Trefferquote von 83 beziehungsweise 91 Prozent unterscheiden, Gel&#228;ndefahrzeuge sowie SUVs zu 86 und Pritschenwagen zu 82 Prozent. Die Klassifizierung der 50 Millionen Aufnahmen dauerte so zwei Wochen. Ein menschlicher Experte h&#228;tte daf&#252;r &#252;ber 15 Jahre gebraucht, da ein einzelner entsprechender Vorgang bei ihm rund zehn Sekunden dauert.</p> <p>Vorher war es n&#246;tig, den CNN-Algorithmus entsprechend zu trainieren. Das habe die eigentliche Herkulesaufgabe dargestellt, erz&#228;hlte die derzeit bei Microsoft Research t&#228;tige Gebru der <em>New York Times</em>. Viele KI-Projekte scheiterten genau an diesen Grundlagen in der physikalischen Welt. Maschinenlernen funktioniert in der Regel so, dass eine gro&#223;e Datenmenge in spezielle Kategorien eingeteilt wird, wobei einzelnen Werten unterschiedliche Zusatzinformationen angef&#252;gt werden. Eine von Hand gepflegte Datenbank musste auch in diesem Fall her, um der KI-Software zun&#228;chst zu helfen, die Bilder und die darauf ersichtlichen Objekte zu identifizieren und zu unterscheiden.</p> <p>Die Forscher heuerten daf&#252;r mehrere hundert Leute an, die aus einem Testset von einer Million Aufnahmen die darin sichtbaren Autos herauspickten und klassifizierten. Darunter waren Liebhaber, die der Maschine etwa beibrachten, die subtilen Unterschiede an den R&#252;ckleuchten eines Honda Accord der Baujahre 2007 und 2008 wahrzunehmen.</p> <p>Nachdem das System eingearbeitet war, konnte es unter anderem das durchschnittliche verf&#252;gbare Haushaltsgeld, die haupts&#228;chliche ethnische Herkunft, die Ausbildung und die Wahlmuster auf der Ebene einzelner Viertel mit recht hoher Wahrscheinlichkeit bestimmen. Unter den weiteren Korrelationen war, dass Burlington in Vermont die Stadt mit den Autos mit dem wenigsten Benzinverbrauch war; Casper in Wyoming im Mittleren Westen hatte dagegen fahrzeugtechnisch die schlechteste Kohlendioxidbilanz pro Kopf. Generell sch&#228;tzte der Algorithmus die Oststaaten und den Westen der USA als &#246;kologisch „gr&#252;ner“ ein als die Regionen im Binnenland.</p> <p>Chicago ist laut der Analyse die Stadt mit den h&#246;chsten Unterschieden bei den Eink&#252;nften mit gro&#223;en Clustern teurer und billiger Autos in einzelnen Vierteln. Jacksonville in Florida ist in dieser Hinsicht die homogenste Gemeinde mit einem recht hohen Ausgabeniveau. New York hat das System als die Stadt mit den teuersten Autos identifiziert, in El Paso hat es die meisten Hummer entdeckt, in San Francisco den h&#246;chsten Anteil ausl&#228;ndischer Modelle.</p> <p>Als die zwei Marken, die am st&#228;rksten auf asiatisch gepr&#228;gte Viertel hinweisen, haben die Forscher mithilfe der Maschine Hondas und Toyotas ausgemacht. Autos von Chrysler, Buick und Oldsmobile verwiesen auf Gegenden mit vielen Afroamerikanern. Wo vor allem Pickups, Volkswagen und Aston Martins parkten, galt dies als Anzeichen f&#252;r einen &#252;berwiegend von Wei&#223;en bewohnten Kiez.</p> <p>Selbst das Alter von Kindern in einer Gegend konnten die Wissenschaftler nach eigenen Angaben mit einer noch „moderat akkuraten“ relativen H&#228;ufigkeit von knapp &#252;ber 50 Prozent einsch&#228;tzen. Nicht ableiten lie&#223; sich mit der Methode aber etwa der Anteil von Landwirten, die in einer bestimmten Region wohnen. Traktoren fanden sich auf den Stra&#223;enansichten offenbar selten. Generell sind viele der Verkn&#252;pfungen &#228;hnlich wie bei anderen KI-Projekten mit Vorsicht zu genie&#223;en, schon allein da die Fehlerwahrscheinlichkeiten dabei meist noch hoch sind.</p> <p>Gebru und ihre Kollegen sind sich ihrem Artikel nach bewusst, dass ihr Verfahren nicht nur Marktforschern und Politikern das Leben erleichtern k&#246;nne, sondern auch „wichtige ethische Bedenken“ hervorrufen werde. Es sei klar, dass &#246;ffentliche Daten nicht verwendet werden sollten, um die „angemessenen Erwartungen an die Privatheit individueller B&#252;rger“ zu unterlaufen. Der Datenschutz werde daher bei der Weiterentwicklung des Ansatzes etwa f&#252;r Voraussagen bis zur Ebene einzelner Individuen eine wichtige Stellschraube bilden. Material daf&#252;r d&#252;rfte es genug geben, sobald mehr hochautomatisierte Autos mit ihren Kameras und Sensoren durch die Stra&#223;en fahren. Hierzulande hatte Street View schon vor dem Start des Dienstes 2010 <a data-content-type=„content“ href=„https://m.heise.de/meldung/Google-Kein-endgueltiger-Stopp-von-Street-View-in-Deutschland-1225330.html“>Datensch&#252;tzer auf den Plan gerufen</a>.</p> <div class=„btn-toolbar whatsbroadcast-toolbar“> <p><a class=„btn btn-default stretch“ data-toggle=„.shariff“>Teilen</a> </p> <p><a class=„btn btn-default stretch“ data-toggle=„#whatsbroadcast“>Abonnieren</a> </p> </div> </html>

Cookies helfen bei der Bereitstellung von Inhalten. Diese Website verwendet Cookies. Mit der Nutzung der Website erklären Sie sich damit einverstanden, dass Cookies auf Ihrem Computer gespeichert werden. Außerdem bestätigen Sie, dass Sie unsere Datenschutzerklärung gelesen und verstanden haben. Wenn Sie nicht einverstanden sind, verlassen Sie die Website.Weitere Information