mathematisches Problem

claus · 12 Februar 2015

Ich finds toll, das hier ständig Leute erzählen, dass man beim Ziehen von gesamt 5 Fragen alle 45 Fragen einmal haben kann.

Mojito hat zwar das richtige Ereignis formuliert, aber genau nicht berücksichtigt, dass es beim Ziehen von x Fragen unwahrscheinlicher wird, dass Frage2 dabei ist, wenn bekannt ist, dass Frage1 schon dabei war [kurz P(F2)<P_F1(F2)].
Bitte stochastische Unabhängigkeit nachschlagen und dann würfeln, bis klar ist, das das hier nicht stochastisch unabhängig ist.

Wer zu faul zum Würfeln ist:
Beim Werfen von 2 unterscheidbaren Würfeln (bzw. nacheinander werfen eines Würfels) gibt es insgesamt 36 Möglichkeiten
(1|1)(1|2)...(1|6)
(2|1)(2|2)...(2|6)
...
bis (6|1)(6|2)...(6|6),
die alle gleich wahrscheinlich sind (Laplaceexperiment eben).

Die Wahrscheinlichkeit für "mindestens eine 1" und "mindestens eine 2" ist 2/36, weil 2 von den 36 Möglichkeiten die Bedingung erfüllen [(1|2) und (2|1)]
Die Wahrscheinlichkeit für mindestens eine 1 (bzw. für mindestens eine 2, jeweils getrennt) ist 11/36, weil in 11 der 36 Möglichkeiten mindesten eine 1 bzw. 2 ist (nachzählen, wenn ihr mir nicht glaubt)
Mojitos Ansatz ist nun
P("mindestens eine 1" und "mindestens eine 2") = P("mindestens eine 1") * P("mindestens eine 2"), was für P("mindestens eine 1" und "mindestens eine 2")=(11/36)^2=121/1296 ergibt und nicht 2/36 ist.
Der Fehler ist, dass 2 von den 11 Kombinationen mit 1 eine 2 enthalten, weshalb die bedingte Wahrscheinlichkeit P_"mindestens eine 1"("mindestens eine 2") = 2/11 ist und diese statt P("mindestens eine 2") verwendet werden muss.
Mojito vereinfacht mit P_"mindestens eine 1"("mindestens eine 2") = P("mindestens eine 2"), was bedeutet die Ereignisse "mindestens eine 1" und "mindestens eine 2" sind stochastisch unabhängig, was falsch ist. (Sollte jemand G8 Schulbücher aus Bayern zu Hause haben, die bedingten Wahrscheinlichkeiten findet man im Mathebuch der zehnten Klassen, Laplaceexperimente in dem der achten)

KH183 · 12 Februar 2015

Okay, ich kann dir folgen. Wie wär denn der richtige Rechenweg / das richtige Ergebnis für die genannte Fragestellung?

claus · 12 Februar 2015

Das ist das Problem, bei stochastischer Unabhängigkeit ist das ganze ziemlich einfach, bei Abhängigkeit, kann man nicht (bzw. zumindest nicht ohne Probleme) in die Einzelereignisse aufspalten, weshalb - newnicks wars glaub ich - eine Simulation ins Spiel bringt.

LoGL17 · 13 Februar 2015

claus schrieb:
(Sollte jemand G8 Schulbücher aus Bayern zu Hause haben, die bedingten Wahrscheinlichkeiten findet man im Mathebuch der zehnten Klassen, Laplaceexperimente in dem der achten)

Hatte ich mal, wurden aber alle von Ordnern voller Vorlesungsskripte zu anderen Themen verdrängt..

Ein kurzes Wikipedia-Nachlesen hat aber alte Erinnerungen geweckt. Das mit der stochastischen Unabhängigkeit leuchtet mir jetzt ein, genauso wie die daraus resultierende Behinderung einer einfachen Lösungsfindung.

Zum Thema Simulation: die läuft schon. Allerdings sehr sehr langsam (bin bei 75 5er-Ziehungen) und das überprüfen wäre sehr mühselig. Und aus einem Durchlauf kann man ja auch kein Ergebnis ableiten(?). Theoretisch könnte man ja nach neun 5er-Ziehungen fertig sein.. :ugly:

Was ich sagen kann: meine 75 Versuche haben noch nicht gereicht

.

newnicks · 16 Februar 2015

Wenn wir schon bei aufwändigen Methoden sind, dann habe ich auch eine Idee.
Man könnte ausrechnen lassen wie groß die Wahrscheinlichkeiten für 0-5 neue Fragen sind, natürlich für jede mögliche Anzahl bereits gezogener Fragen.
Damit lässt man, sagen wir mal 50 Versuche, berechnen und in einer Tabelle(Versuch/Anzahl gezogener Fragen) die Wahrscheinlichkeiten darstellen.
Bei beiden Schritten kann man dazwischen die entsprechenden Werte addieren lassen.
Ich vermute mit Excel sollte sowas klappen, kenne mich damit aber kaum aus. Falls man alles eingeben muss, darf man dabei schon mit ein paar Stunden rechnen. :ugly:

(und wer langsam tippt braucht damit erst gar nicht anzufangen)

Labarna · 16 Februar 2015

Hätte derjenige, der die Aufgabe gestellt hat, nicht wenigstenns anstelle von 5 gezogenen Möglichkeiten aus 45 lieber 6 aus 49 nehmen können?

Beim Lotto jedenfalls ist die Chance für sechs Richtige 49*48*47*46*45*44 : 1*2*3*4*5*6 = 10068347520 : 720 = 13.983.816 und für die hier gestellte Frage sollte die Rechnung doch (entsprechend angepasst auf 5 aus 45) ebenfalls gelten.
Nach 45*44*43*42*41 : 1*2*3*4*5 = 146611080 : 120 = 1221759 Versuchen müsste jede Frage einmal gezogen worden sein.
So zumindest meine Einschätzung als Laie und ohne eine Simulation durchgeführt zu haben. Vermutlich wird es von Mathematikern nur ernstgenommen, wenn es durch dem Rest der Menschheit unverständliche Zeichen in eine Formel gebracht wird, die irgendwie so ähnlich aussieht wie [!53(6?+-#!?%;:J%/)] und mit tollen Begriffen aus der Fachsprache garniert wird, aber inhaltlich sollte es stimmen.

claus · 17 Februar 2015

Das ist die Anzahl aller möglichen 5er Kombinationen (ohne Unterscheidung der Reihenfolge), wenn nach so vielen Durchgängen nicht jede Frage etliche Male dran war, dann stimmt ziemlich sicher was mit dem Zufallsgenerator nicht.

Das mit den 0-5 neuen Fragen sollte klappen, bei jedem 5er Durchgang gibt es 45*44*43*42*41 Möglichkeiten (mit Reihenfolge), bei z.B. schon 17 gezogenen Fragen, gibt es für das Ereignis "3 neue Fragen" 28*27*26*17*16*10 [ zu Beginn 28 neue und 17 alte Fragen, der Faktor 10, weil es bei dem Beispiel 10 möglich Positionen für die alten Fragen gibt] Möglichkeiten, also ist die Wahrscheinlichkeit für 3 neue Fragen (28*27*26*17*16*10)/(45*44*43*42*41).

Zum Thema Simulation:
Man programmiert erst eine 5er Ziehung, Zufallszahl zwischen 0 und 44 (falls in der verwendeten Progammiersprache arrays bei 1 anfangen von 1 bis 45), zweite Zufallszahl, falls gleiche wie erste, neue bis eine andere... Ergebnisse würde ich in einen binären array eintragen (0 war nicht dabei, 1 war dabei.
Dann packt man das in eine Schleife (Anzahl der Ziehungen) in der nach jedem Durchgang der Erfolg geprüft wird (falls Produkt aller Einträge 1 ist fertig, sonst weiter), bei Erfolg wird die Zahl der Durchgänge in eine Datei eingetragen (oder irgendwo anders wo man die Ergebnisse sammelt).
Das ganze kommt nochmal in eine Schleife, die so oft es die Zeit her gibt durchlaufen wird (sollte schon möglichst oft sein).
Am Ende schaut man wie oft man nach z.B. 40 oder weniger 5-er Ziehungen fertig war, teilt durch die Anzahl der Durchläufe und hat den Schätzwert für die Wahrscheinlichkeit.

Wenn sich bei dir ein Durchgang schon länger hinzieht, wird das nichts.

UnserenToten · 17 Februar 2015

Labarna schrieb:
...

Das sagt nichts darüber aus, wie oft man ziehen muss um alle Fragen gezogen zu haben. Rein logisch betrachtet gibt es für so etwas keine Garantie, weswegen man unendlich oft ziehen müßte.

Labarna · 17 Februar 2015

UnserenToten schrieb:
Das sagt nichts darüber aus, wie oft man ziehen muss um alle Fragen gezogen zu haben. Rein logisch betrachtet gibt es für so etwas keine Garantie, weswegen man unendlich oft ziehen müßte.

Das ist richtig, lässt sich aber durch eine Simulation auch nicht ändern. Es könnten bei jeder Ziehung aufs neue die ersten 5 Fragen kommen. Die Antwort auf die Ausgangsfrage ("wie oft muss ich 5 Fragen auswählen, um alle 45 Fragen mindestens ein (oder n-fach) mal ausgewählt zu haben?") lautet also: unendlich oft.

Da habe ich mich durch den Lottovergleich selbst verwirrt. Dort hat man mit der entsprechenden Anzahl an unterschiedlich ausgefüllten Tipzetteln eine Gewinngarantie (allerdings wären die Einsätze für so viele Tipzettel wesentlich höher als der Gewinn), weil alle möglichen Ergebnisse einer Ziehung abgedeckt wären. Aber hier wird ja jedes Mal neu gezogen.

mfb · 20 März 2015

Ich weiß der Thread ist alt, aber die Frage ist interessant

.

Mojito schrieb:
Warum kommen eigentlich immer genau dann, wenn es um Stochastik geht, Leute, die meinen alles besser zu wissen?

Weil sie in diesem Fall Recht haben.

Einfaches Beispiel: 2 Fragen (A und B), pro Durchgang wird eine Frage gezogen.
Nach 2 Ziehungen haben sowohl A als auch B eine Chance von 3/4, gezogen worden zu sein. Die Wahrscheinlichkeit, dass beide gezogen wurden, ist aber keineswegs 9/16, sondern 1/2=8/16.

Für 45 Fragen und 5 Fragen pro Durchgang ist deine Methode eine recht gute Näherung (und viel einfacher als eine exakte Rechnung), aber eben nur eine Näherung.

newnicks' Methode dürfte hier die einfachste exakte sein. Geht mit Excel schnell, man muss nur einmal das Codemonster
=C10*KOMBINATIONEN($B10;5)*KOMBINATIONEN(45-$B10;0)/KOMBINATIONEN(45;5)
+C9*KOMBINATIONEN($B9;4)*KOMBINATIONEN(45-$B9;1)/KOMBINATIONEN(45;5)
+C8*KOMBINATIONEN($B8;3)*KOMBINATIONEN(45-$B8;2)/KOMBINATIONEN(45;5)
+C7*KOMBINATIONEN($B7;2)*KOMBINATIONEN(45-$B7;3)/KOMBINATIONEN(45;5)
+C6*KOMBINATIONEN($B6;1)*KOMBINATIONEN(45-$B6;4)/KOMBINATIONEN(45;5)
+C5*KOMBINATIONEN($B5;0)*KOMBINATIONEN(45-$B5;5)/KOMBINATIONEN(45;5)
zusammenkopieren.

Nach 46 Durchgängen hat man 81,67% Chance, dass jede Frage mindestens einmal kam. Mojitos Formel ergäbe 81,87%, ist also nahe dran.

Größere Abweichungen ergeben sich für kleinere Zahlen. Nach 23 Ziehungen ist die Wahrscheinlichkeit 3,06%, während die Näherung 4,50% ergibt.

mathematisches Problem

claus

Mitglied

KH183

Sieger Ladderrace 2 Sc

claus

Mitglied

LoGL17

Ist öfter hier

newnicks

Neues Mitglied

Labarna

Diablo-Veteran

claus

Mitglied

UnserenToten

Ist öfter hier

Labarna

Diablo-Veteran

mfb

Diablo-Veteran