Bedingte Wahrscheinlichkeit < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 14:47 Di 25.09.2012 | Autor: | tanye |
Aufgabe | Es gebe Dokumente in unterschiedlichen Sprachen: 0.2 der Dokumente sind auf Deutsch , 0.5 % auf Englisch und der Rest ist in anderen Sprachen. Wird einer Erkennungs-Software ein deutsches Dokument vorgelegt, erkennt er es zu 0.8 korrekt. Im Fall "Englisch" ebenso. Bei anderen Dokumenten wird zu 0.5 Englisch und zu 0.5 Deutsch ausgegeben. |
Hallo MR,
Als ich die Aufgabenstellung gelesen habe hätte ich die Informationen als:
P(Gibt Deutsch aus | Deutsches Dokument vorgelegt)
P(Gibt Deutsch aus | Englisches Dokument vorgelegt)
P(Gibt Deutsch aus | Anderes Dokument vorgelegt)
interpretiert.
Jetzt hat sich aber herausgestellt dass es garkeine bedingte Wahrscheinlichkeit ist, sondern es über den Schnitt läuft, sprich :
P(Gibt Deutsch aus [mm] \bigcap [/mm] Deutsches Dokument vorgelegt)
P(Gibt Deutsch aus [mm] \bigcap [/mm] Englisches Dokument vorgelegt)
P(Gibt Deutsch aus [mm] \bigcap [/mm] Anderes Dokument vorgelegt)
Ich schaue immer wieder drüber und es ist für mich eindeutig eine bedingte Wahrscheinlichkeit. Wie seht ihr das ?
Danke im Voraus, tanye
|
|
|
|
> 0.2 der Dokumente sind auf Deutsch
Hier liegt keine Bedingung vor
> Wird einer Erkennungs-Software ein deutsches Dokument vorgelegt,
> erkennt er es zu 0.8 korrekt.
Hier liegt eine Bedingung vor.
Die Aufgabe scheint aber wohl nicht vollständig zu sein. Da steht keine Frage drin.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 15:04 Di 25.09.2012 | Autor: | tanye |
Mein Fehler:
Mit welcher Wahrscheinlichkeit ist diese Antwort für das entsprechende Dokument korrekt ?
Die Bedingung ist, dass das Dokument Deutsch ist, unter dieser Bedingung, wie groß ist die Wahrscheinlichkeit, dass das Programm tatsächlich richtig geantwortet hat ? So erscheint es mir logischer als einfach über den Schnitt zu gehen ...
|
|
|
|
|
Alles etwas wuselig!
Es gebe Dokumente in unterschiedlichen Sprachen: 0.2 der Dokumente sind auf Deutsch , 0.5 % wirklich 0,5 % oder 50 %, also 0,5? auf Englisch und der Rest ist in anderen Sprachen. Wird einer Erkennungs-Software ein deutsches Dokument vorgelegt, erkennt er es zu 0.8 korrekt. Im Fall "Englisch" ebenso. Bei anderen Dokumenten wird zu 0.5 Englisch und zu 0.5 Deutsch ausgegeben.
Die Frage:
Mit welcher Wahrscheinlichkeit ist diese Antwort für das
entsprechende Dokument korrekt ?
ist aber etwas ganz anderes als die Zusatzbemerkung:
Die Bedingung ist, dass das Dokument Deutsch ist, unter
dieser Bedingung, wie groß ist die Wahrscheinlichkeit,
dass das Programm tatsächlich richtig geantwortet hat ?
Gehört sie mit zur Aufgabenstellung oder hast du sie dir dazugedacht? Antwort steht doch in der Aufgabe: 80 %.
--------------------------------------------------------------
Ich gehe mal davon aus, dass 50 % also 0,5, der Texte englisch sind. Dann gilt (ohne Durchschnitts- und Vereinigungskram:
Von 100 Texten sind 20 deutsch, davon werden 16 als deutsch gekennzeichnet, die anderen nicht.
Davon sind 50 englisch, 40 werden als englisch gekennzeichnet, die anderen nicht. Alle anderen Texte werden als deutsch oder englisch bezeichnet, obwohl sie es nicht sind. Also werden 56 und damit 56 % oder 0,56 richtig gekennzeichnet.
Das Rechnen mit bedingten W. gibt dann Sinn, wenn man weiß, ob die englischen Texte, die nicht als englisch erkannt werden, als deutsch bezeichnet werden oder z.B. als arabisch. Nirgendwo im Text steht, dass die Ergebnisse nur deutsch oder englisch heißen müssen; es wäre allerdings komisch, wenn z.B. die Texte, die englisch sind und nicht als englisch erkannt werden, als arabisch bezeichnet würden, aber arabische Texte (also nicht deutsche oder englische) zu 50 % als deutsch und zu 50 % als englisch bezeichnet würden, obwohl auch arabisch zur Verfügung stünde. Also gehen wir davon aus, dass nur die Ergebnisse deutsch oder englisch auftauchen. Damit gilt:
Von 100 Texten sind
- 20 deutsch, 16 werden als deutsch bezeichnet, 4 nicht
- 50 englisch, 40 werden als englisch bezeichnet, 10 als deutsch
- 30 anders, 15 werden als deutsch bezeichnet, 15 nicht.
Also werden 41 als deutsch bezeichnet, obwohl es nur bei 16 stimmt. Die W., dass ein als deutsch eingestufter Text wirklich deutsch ist, beträgt nur [mm] 16/41\approx16/40 [/mm] = 40 %.
|
|
|
|