Grundlagen der Statistik: Der Satz von Bayes

Originalartikel

Backup

<html> <a href=„https://wissenschafts-thurm.de/grundlagen-der-statistik-der-satz-von-bayes/“><img width=„150“ height=„150“ src=„https://wissenschafts-thurm.de/wp-content/uploads/2016/09/Stichprobe-150x150.jpg“ class=„attachment-thumbnail size-thumbnail wp-post-image“ alt=„“ srcset=„https://wissenschafts-thurm.de/wp-content/uploads/2016/09/Stichprobe-150x150.jpg 150w, https://wissenschafts-thurm.de/wp-content/uploads/2016/09/Stichprobe-300x300.jpg 300w, https://wissenschafts-thurm.de/wp-content/uploads/2016/09/Stichprobe-768x768.jpg 768w, https://wissenschafts-thurm.de/wp-content/uploads/2016/09/Stichprobe-590x590.jpg 590w, https://wissenschafts-thurm.de/wp-content/uploads/2016/09/Stichprobe.jpg 870w“ sizes=„(max-width: 150px) 100vw, 150px“/></a><p>Angenommen, es existiere ein Test auf das Vorhandensein eines genetischen Merkmals, das im hohen Alter eine bestimmte schwere Erkrankung ausl&#246;st. Dieser Test identifiziert das Merkmal, das bei 5% der Bev&#246;lkerung auftritt, mit einer Sicherheit von 95%. Im Rahmen einer Massenuntersuchung werden 100.000 Personen getestet. Wie gro&#223; ist nun die Wahrscheinlichkeit daf&#252;r, dass eine als Tr&#228;ger des Merkmals identifizierte Person wirklich &#252;ber das Merkmal verf&#252;gt? Die meisten Menschen w&#252;rden diese Frage spontan mit 95% beantworten &#8211; schlie&#223;lich ist ja der Test zu 95% sicher, also wird es auch das Ergebnis sein. Der Irrtum, dem wir dabei kollektiv unterliegen, ist die v&#246;llige Vernachl&#228;ssigung der Wahrscheinlichkeit daf&#252;r, dass das (mit 5% ja eher seltene) Merkmal &#252;berhaupt bei dieser Testperson vorliegt.</p> <p>Die reale Wahrscheinlichkeit f&#252;r einen Treffer erschlie&#223;t man sich am besten durch die Betrachtung der absoluten H&#228;ufigkeiten:</p> <p><img class=„alignnone size-full wp-image-3518“ src=„https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Baumdiagramm.png“ alt=„Baumdiagramm“ width=„1378“ height=„683“ srcset=„https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Baumdiagramm.png 1378w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Baumdiagramm-300x149.png 300w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Baumdiagramm-768x381.png 768w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Baumdiagramm-1024x508.png 1024w“ sizes=„(max-width: 1378px) 100vw, 1378px“/></p> <p>Von 100.000 Testpersonen verf&#252;gen 5% wirklich &#252;ber das Merkmal &#8211; das sind 5.000 Personen. Von diesen 5.000 Personen werden &#8211; da der Test zu 95% sicher ist &#8211; insgesamt 4.750 Personen korrekterweise als Merkmalstr&#228;ger erkannt. Da der Test, wenn er zu 95% sicher ist, auch mit 5% irrt, werden von den 95.000 gesunden Testpersonen allerdings auch 5% &#8211; dies entspricht ebenfalls 4.750 Personen &#8211; f&#228;lschlicherweise als Merkmalstr&#228;ger eingestuft. Alles in allem sind den Testergebnissen zufolge also 4.750 + 4.750 = 9.500 Personen Merkmalstr&#228;ger, von denen allerdings nur 4.750 Personen (50%) wirklich das Merkmal aufweisen. Die Wahrscheinlichkeit daf&#252;r, dass eine Person wirklich das Merkmal aufweist, wenn der Test sie als Merkmalstr&#228;ger identifiziert, liegt somit nur bei 50% &#8211; auch wenn der Test selbst zu 95% sicher ist.</p> <p><ins class=„adsbygoogle c1“ data-ad-format=„fluid“ data-ad-layout-key=„-ek+6d+d-di+nb“ data-ad-client=„ca-pub-5654419668878242“ data-ad-slot=„7673241660“/></p> <p>Die tats&#228;chliche Wahrscheinlichkeit errechnet sich also dadurch, dass man entsprechend der <a href=„http://www.austromath.at/medienvielfalt/materialien/wkeit/lernpfad/033_Laplace.html“ target=„_blank“ rel=„noopener“>klassischen Wahrscheinlichkeitsdefinition nach Laplace</a> die Summe der f&#252;r das betrachtete Ergebnis relevanten F&#228;lle (Testpersonen mit Merkmal, bei denen das Merkmal diagnostiziert wurde) zu allen F&#228;llen (Testpersonen mit oder ohne Merkmal, bei denen das Merkmal diagnostiziert wurde) in Beziehung setzt. Der Ersatz der absoluten Werte durch die Wahrscheinlichkeiten &#8211; unter Ber&#252;cksichtigung von Additions- und Multiplikationssatz &#8211; f&#252;hrt zum gleichen&#160;Ergebnis: (0,05*0,95) / 1) = 0,50.</p> <p><img class=„alignnone wp-image-3554“ src=„https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Bayes-Beispiel.png“ alt=„Beispiel zum Satz von Bayes“ width=„500“ height=„117“ srcset=„https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Bayes-Beispiel.png 873w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Bayes-Beispiel-300x70.png 300w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Bayes-Beispiel-768x180.png 768w“ sizes=„(max-width: 500px) 100vw, 500px“/></p> <p>Aus dieser &#220;berlegung l&#228;sst sich der sowohl f&#252;r das Verst&#228;ndnis der Wahrscheinlichkeitslehre als auch vieler Alltagsprobleme hochgeradig relevante <a href=„https://de.wikipedia.org/wiki/Satz_von_Bayes“ target=„_blank“ rel=„noopener“>Satz von Bayes</a> ableiten:</p> <p><img class=„alignnone size-full wp-image-3505“ src=„https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes.png“ alt=„Formel Satz von Bayes“ width=„1032“ height=„248“ srcset=„https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes.png 1032w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes-300x72.png 300w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes-768x185.png 768w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes-1024x246.png 1024w“ sizes=„(max-width: 1032px) 100vw, 1032px“/></p> <p>Wie aber ist diese Formel richtig zu lesen?</p> <p><img class=„alignnone size-full wp-image-3511“ src=„https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes-1.png“ alt=„Satz von Bayes“ width=„1314“ height=„764“ srcset=„https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes-1.png 1314w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes-1-300x174.png 300w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes-1-768x447.png 768w, https://wissenschafts-thurm.de/wp-content/uploads/2017/01/Satz-von-Bayes-1-1024x595.png 1024w“ sizes=„(max-width: 1314px) 100vw, 1314px“/></p> <p>Eine Darstellung des &#8220;ber&#252;hmtesten&#8221; Beispiels zum Satz von Bayes &#8211; des sogenannten Taxi-Problems des deutschen Mathematikers Arthur Engel &#8211; findet sich &#252;brigens <a href=„http://scienceblogs.de/frischer-wind/2008/12/05/das-taxiproblem/“ target=„_blank“ rel=„noopener“>hier in meinem Blog auf ScienceBlogs.de</a>.</p> <p><strong>Beispielrechnung</strong></p> <p>Eine Hochschule pr&#252;ft s&#228;mtlich eingereichten Bachelor-Arbeiten mit einer eigens entwickelten Software auf Plagiate. Diese werden von der Software mit einer Sicherheit von 95% korrekt erkannt. Jedes Semester reichen 800 Studierende an dieser Hochschule Bachelor-Arbeiten zur Kontrolle ein, wobei leider davon auszugehen ist, dass in 3% der eingereichten Arbeiten Plagiate enthalten sind.</p> <p>Wie gro&#223; ist die Wahrscheinlichkeit daf&#252;r, dass eine durch die Software als plagiatsverd&#228;chtig identifizierte Arbeit auch tats&#228;chlich ein Plagiat enth&#228;lt?</p> <p>Von 800 eingereichten Bachelor-Arbeiten enthalten&#8230;</p> <p>&#8230; 776 keine Plagiate (97%)<br/> &#8230; 24 Plagiate (3%)</p> <p>Von 776 Arbeiten ohne Plagiate&#8230;</p> <p>&#8230; werden 737,2 korrekterweise als sauber klassifiziert (95%)<br/> &#8230; werden 38,8 f&#228;lschlicherweise als unsauber klassifiziert (5%)</p> <p>Von 24 Arbeiten mit Plagiaten&#8230;</p> <p>&#8230; werden 22,8 korrekterweise als unsauber klassifiziert (95%)<br/> &#8230; werden 1,2 f&#228;lschlicherweise als sauber klassifiziert (5%)</p> <p>Insgesamt werden also 38,8 + 22,8 = 61,6 Arbeiten als Plagiate eingestuft. Von diesen 61,6 Arbeiten sind aber nur 22,8 Arbeiten wirklich Plagiate. Die Wahrscheinlichkeit daf&#252;r, dass eine als plagiatsverd&#228;chtig eingestufte Arbeit auch tats&#228;chlich ein Plagiat enth&#228;lt, liegt somit bei lediglich 37,01%.</p> <p><strong>&#220;bungsaufgaben</strong></p> <p>Eine Sicherheitssoftware f&#252;r die Analyse von Videoaufnahmen an einer Flughafen-Sicherheitsschleuse kann das Gesicht von gesuchten Personen mit einer Wahrscheinlichkeit von 92% erkennen. Allerdings identifiziert die Software in 3% aller F&#228;lle eine nicht gesuchte Person irrt&#252;mlich als gesucht. Die Sicherheitsbeh&#246;rden gehen davon aus, dass an einem bestimmten Tag eine Gruppe von 10 gesuchten Personen versuchen wird, die Schleuse zu passieren. Das Personenaufkommen pro Tag liegt bei 10.000 Flugg&#228;sten. Mit der Pr&#228;senz weiterer gesuchter Personen ist am betrachteten Tag nicht zu rechnen.</p> <p>a) Mit wie vielen f&#228;lschlicherweise als &#8220;gesucht&#8221; identifizierten Personen ist zu rechnen?</p> <p>b) Die Software schl&#228;gt Alarm. Wie gro&#223; ist die Wahrscheinlichkeit daf&#252;r, dass tats&#228;chlich eine gesuchte Person entdeckt wurde?</p> <p><ins class=„adsbygoogle c1“ data-ad-client=„ca-pub-5654419668878242“ data-ad-slot=„1901152186“ data-ad-format=„link“/><br/></p> <p>Zur Anzeige der L&#246;sungen bitte <a href=„https://wissenschafts-thurm.de/uebungsaufgaben-mit-musterloesungen-zur-statistik-der-satz-von-bayes/“>hier</a> klicken.<img src=„https://vg06.met.vgwort.de/na/dd53b51644684baba2039cf16f087149“ alt=„“ width=„1“ height=„1“/></p> <hr/><p><small>Die hier vorgestellten Inhalte und Aufgaben sind Teil der Vorlesung &#8220;Grundlagen der Statistik&#8221; im <a href=„https://www.hs-harz.de/weiterbildung/“ target=„_blank“ rel=„noopener“>berufsbegleitenden Bachelor-Studiengang Betriebswirtschaftslehre an der Hochschule Harz</a>. Eine vollst&#228;ndige &#220;bersicht aller Inhalte dieser Vorlesung im Wissenschafts-Thurm findet sich hier: <a href=„https://wissenschafts-thurm.de/grundlagen-der-statistik/“>Grundlagen der Statistik</a>.</small></p> <div class=„shariff shariff-align-flex-start shariff-widget-align-flex-start“> <ul class=„shariff-buttons theme-round orientation-horizontal buttonsize-medium“><li class=„shariff-button twitter shariff-nocustomcolor c3“><a href=„https://twitter.com/share?url=https%3A%2F%2Fwissenschafts-thurm.de%2Fgrundlagen-der-statistik-der-satz-von-bayes%2F&amp;text=Grundlagen%20der%20Statistik%3A%20Der%20Satz%20von%20Bayes“ title=„Bei Twitter teilen“ aria-label=„Bei Twitter teilen“ role=„button“ rel=„noopener nofollow“ class=„shariff-link c2“ target=„_blank“><svg width=„32px“ height=„20px“ xmlns=„http://www.w3.org/2000/svg“ viewbox=„0 0 30 32“><path fill=„#55acee“ d=„M29.7 6.8q-1.2 1.8-3 3.1 0 0.3 0 0.8 0 2.5-0.7 4.9t-2.2 4.7-3.5 4-4.9 2.8-6.1 1q-5.1 0-9.3-2.7 0.6 0.1 1.5 0.1 4.3 0 7.6-2.6-2-0.1-3.5-1.2t-2.2-3q0.6 0.1 1.1 0.1 0.8 0 1.6-0.2-2.1-0.4-3.5-2.1t-1.4-3.9v-0.1q1.3 0.7 2.8 0.8-1.2-0.8-2-2.2t-0.7-2.9q0-1.7 0.8-3.1 2.3 2.8 5.5 4.5t7 1.9q-0.2-0.7-0.2-1.4 0-2.5 1.8-4.3t4.3-1.8q2.7 0 4.5 1.9 2.1-0.4 3.9-1.5-0.7 2.2-2.7 3.4 1.8-0.2 3.5-0.9z“/></svg>twittern&#160;</a></li> <li class=„shariff-button facebook shariff-nocustomcolor c5“><a href=„https://www.facebook.com/sharer/sharer.php?u=https%3A%2F%2Fwissenschafts-thurm.de%2Fgrundlagen-der-statistik-der-satz-von-bayes%2F“ title=„Bei Facebook teilen“ aria-label=„Bei Facebook teilen“ role=„button“ rel=„nofollow“ class=„shariff-link c4“ target=„_blank“><svg width=„32px“ height=„20px“ xmlns=„http://www.w3.org/2000/svg“ viewbox=„0 0 18 32“><path fill=„#3b5998“ d=„M17.1 0.2v4.7h-2.8q-1.5 0-2.1 0.6t-0.5 1.9v3.4h5.2l-0.7 5.3h-4.5v13.6h-5.5v-13.6h-4.5v-5.3h4.5v-3.9q0-3.3 1.9-5.2t5-1.8q2.6 0 4.1 0.2z“/></svg>teilen&#160;</a></li> <li class=„shariff-button googleplus shariff-nocustomcolor c7“><a href=„https://plus.google.com/share?url=https%3A%2F%2Fwissenschafts-thurm.de%2Fgrundlagen-der-statistik-der-satz-von-bayes%2F“ title=„Bei Google+ teilen“ aria-label=„Bei Google+ teilen“ role=„button“ rel=„noopener nofollow“ class=„shariff-link c6“ target=„_blank“><svg width=„32px“ height=„20px“ xmlns=„http://www.w3.org/2000/svg“ viewbox=„0 0 32 32“><path fill=„#d34836“ d=„M31.6 14.7h-3.3v-3.3h-2.6v3.3h-3.3v2.6h3.3v3.3h2.6v-3.3h3.3zM10.8 14v4.1h5.7c-0.4 2.4-2.6 4.2-5.7 4.2-3.4 0-6.2-2.9-6.2-6.3s2.8-6.3 6.2-6.3c1.5 0 2.9 0.5 4 1.6v0l2.9-2.9c-1.8-1.7-4.2-2.7-7-2.7-5.8 0-10.4 4.7-10.4 10.4s4.7 10.4 10.4 10.4c6 0 10-4.2 10-10.2 0-0.8-0.1-1.5-0.2-2.2 0 0-9.8 0-9.8 0z“/></svg>teilen&#160;</a></li> <li class=„shariff-button linkedin shariff-nocustomcolor c9“><a href=„https://www.linkedin.com/shareArticle?mini=true&amp;url=https%3A%2F%2Fwissenschafts-thurm.de%2Fgrundlagen-der-statistik-der-satz-von-bayes%2F&amp;title=Grundlagen%20der%20Statistik%3A%20Der%20Satz%20von%20Bayes“ title=„Bei LinkedIn teilen“ aria-label=„Bei LinkedIn teilen“ role=„button“ rel=„noopener nofollow“ class=„shariff-link c8“ target=„_blank“><svg width=„32px“ height=„20px“ xmlns=„http://www.w3.org/2000/svg“ viewbox=„0 0 27 32“><path fill=„#0077b5“ d=„M6.2 11.2v17.7h-5.9v-17.7h5.9zM6.6 5.7q0 1.3-0.9 2.2t-2.4 0.9h0q-1.5 0-2.4-0.9t-0.9-2.2 0.9-2.2 2.4-0.9 2.4 0.9 0.9 2.2zM27.4 18.7v10.1h-5.9v-9.5q0-1.9-0.7-2.9t-2.3-1.1q-1.1 0-1.9 0.6t-1.2 1.5q-0.2 0.5-0.2 1.4v9.9h-5.9q0-7.1 0-11.6t0-5.3l0-0.9h5.9v2.6h0q0.4-0.6 0.7-1t1-0.9 1.6-0.8 2-0.3q3 0 4.9 2t1.9 6z“/></svg>mitteilen&#160;</a></li> <li class=„shariff-button whatsapp shariff-nocustomcolor shariff-mobile c11“><a href=„whatsapp:send?text=Grundlagen%20der%20Statistik%3A%20Der%20Satz%20von%20Bayes%20https%3A%2F%2Fwissenschafts-thurm.de%2Fgrundlagen-der-statistik-der-satz-von-bayes%2F“ title=„Bei Whatsapp teilen“ aria-label=„Bei Whatsapp teilen“ role=„button“ rel=„noopener nofollow“ class=„shariff-link c10“ target=„_blank“><svg width=„32px“ height=„20px“ xmlns=„http://www.w3.org/2000/svg“ viewbox=„0 0 32 32“><path fill=„#34af23“ d=„M17.6 17.4q0.2 0 1.7 0.8t1.6 0.9q0 0.1 0 0.3 0 0.6-0.3 1.4-0.3 0.7-1.3 1.2t-1.8 0.5q-1 0-3.4-1.1-1.7-0.8-3-2.1t-2.6-3.3q-1.3-1.9-1.3-3.5v-0.1q0.1-1.6 1.3-2.8 0.4-0.4 0.9-0.4 0.1 0 0.3 0t0.3 0q0.3 0 0.5 0.1t0.3 0.5q0.1 0.4 0.6 1.6t0.4 1.3q0 0.4-0.6 1t-0.6 0.8q0 0.1 0.1 0.3 0.6 1.3 1.8 2.4 1 0.9 2.7 1.8 0.2 0.1 0.4 0.1 0.3 0 1-0.9t0.9-0.9zM14 26.9q2.3 0 4.3-0.9t3.6-2.4 2.4-3.6 0.9-4.3-0.9-4.3-2.4-3.6-3.6-2.4-4.3-0.9-4.3 0.9-3.6 2.4-2.4 3.6-0.9 4.3q0 3.6 2.1 6.6l-1.4 4.2 4.3-1.4q2.8 1.9 6.2 1.9zM14 2.2q2.7 0 5.2 1.1t4.3 2.9 2.9 4.3 1.1 5.2-1.1 5.2-2.9 4.3-4.3 2.9-5.2 1.1q-3.5 0-6.5-1.7l-7.4 2.4 2.4-7.2q-1.9-3.2-1.9-6.9 0-2.7 1.1-5.2t2.9-4.3 4.3-2.9 5.2-1.1z“/></svg>teilen&#160;</a></li> <li class=„shariff-button xing shariff-nocustomcolor c13“><a href=„https://www.xing.com/social_plugins/share?url=https%3A%2F%2Fwissenschafts-thurm.de%2Fgrundlagen-der-statistik-der-satz-von-bayes%2F“ title=„Bei XING teilen“ aria-label=„Bei XING teilen“ role=„button“ rel=„noopener nofollow“ class=„shariff-link c12“ target=„_blank“><svg width=„32px“ height=„20px“ xmlns=„http://www.w3.org/2000/svg“ viewbox=„0 0 25 32“><path fill=„#126567“ d=„M10.7 11.9q-0.2 0.3-4.6 8.2-0.5 0.8-1.2 0.8h-4.3q-0.4 0-0.5-0.3t0-0.6l4.5-8q0 0 0 0l-2.9-5q-0.2-0.4 0-0.7 0.2-0.3 0.5-0.3h4.3q0.7 0 1.2 0.8zM25.1 0.4q0.2 0.3 0 0.7l-9.4 16.7 6 11q0.2 0.4 0 0.6-0.2 0.3-0.6 0.3h-4.3q-0.7 0-1.2-0.8l-6-11.1q0.3-0.6 9.5-16.8 0.4-0.8 1.2-0.8h4.3q0.4 0 0.5 0.3z“/></svg>teilen&#160;</a></li> <li class=„shariff-button info shariff-nocustomcolor c15“><a href=„http://ct.de/-2467514“ title=„Weitere Informationen“ aria-label=„Weitere Informationen“ role=„button“ rel=„noopener nofollow“ class=„shariff-link c14“ target=„_blank“><svg width=„32px“ height=„20px“ xmlns=„http://www.w3.org/2000/svg“ viewbox=„0 0 11 32“><path fill=„#999“ d=„M11.4 24v2.3q0 0.5-0.3 0.8t-0.8 0.4h-9.1q-0.5 0-0.8-0.4t-0.4-0.8v-2.3q0-0.5 0.4-0.8t0.8-0.4h1.1v-6.8h-1.1q-0.5 0-0.8-0.4t-0.4-0.8v-2.3q0-0.5 0.4-0.8t0.8-0.4h6.8q0.5 0 0.8 0.4t0.4 0.8v10.3h1.1q0.5 0 0.8 0.4t0.3 0.8zM9.2 3.4v3.4q0 0.5-0.4 0.8t-0.8 0.4h-4.6q-0.4 0-0.8-0.4t-0.4-0.8v-3.4q0-0.4 0.4-0.8t0.8-0.4h4.6q0.5 0 0.8 0.4t0.4 0.8z“/></svg>info&#160;</a></li> </ul></div> </html>

1)
0,05*0,95) + (0,95*0,05