Konfidenzintervalle für µ < Stochastik < Oberstufe < Schule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 04:17 Sa 24.11.2007 | Autor: | oli_k |
Hallo,
habe dazu eine Verständnisfrage, über die ich schon lange mit meinem Lehrer diskutiert habe.
Wir haben eine Stichprobe durchgeführt und dabei ein [mm] \overline{x} [/mm] und ein [mm] \sigma_{n-1} [/mm] erhalten. Nun will ich bestimmen, in welchem Bereich der Erwartungswert der Grundgesamtheit zu 99% liegt.
Fest steht ja, dass [mm] \overline{x} [/mm] hier [mm] N(\overline{x};\bruch{\sigma_{n-1}}{\wurzel{n}})-verteilt [/mm] ist - Logisch: Je größer n, desto näher komme ich mit meinen Stichprobenmitteln an den wahren Mittelwert.
Nach der Rechnung komme ich also auf ein bestimmtes Intervall, in dem µ zu 99% liegt.
Aber was genau sagt mir dieser Bereich jetzt, wenn ich (am Beispiel Größe eines Menschen nach Test von 100 Menschen) irgendeinen beliebigen Menschen befrage? Es wird davon ausgegangen, dass die Stichprobe repräsentativ für die Menschheit war.
Meiner Meinung nach heisst das, dass der Durchschnittswert der Weltbevölkerung zu 99% im Intervall liegt.
Mein Lehrer ist davon überzeugt, dass es auch bedeutet, dass irgendein beliebig befragter Mensch zu 99% in dem Intervall liegt, wenn er befragt wird.
Dies ist in meinen Augen falsch, da ja die einzelnen Menschen ja mit [mm] \sigma_{n-1} [/mm] um µ verteilt sind, und nicht mit [mm] \bruch{\sigma_{n-1}}{\wurzel{n}} [/mm] um [mm] \overline{x}. [/mm]
Richtig wäre meiner Meinung nach aber Folgendes:
Wenn ich nochmals n Leute befrage, ist der Mittelwert der Stichprobe zu 99% im Intervall - Aber eben der Mittelwert der Stichprobe mit n, nicht der der "Stichprobe" mit einem Menschen.
Was sagt ihr dazu?
Ist jeder beliebige Mensch zu 99% in diesem Intervall? Das macht für mich keinen Sinn...
Danke
Oli
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 11:45 Sa 24.11.2007 | Autor: | luis52 |
Moin Oli,
bevor ich auf deine eigentliche Frage eingehe, machen wir wir mal ein
kleines Gedankenexperiment. In einer Urne befinden sich 10 rote und
gruene Kugeln, jedoch kennt man das Mischverhaeltnis nicht. Was liegt
naeher als eine Stichprobe von sagen wir vier Kugeln zu ziehen (mit
Zuruecklegen, damit es eine Stichprobe ist) und den Anteil [mm] $\hat [/mm] p$ der
roten Kugeln als Ersatzwert fuer den unbekannten Anteil $p$ roter Kugeln
in der Urne zu verwenden.
Folgende Ausgaenge sind moeglich (mit dem zugehoerigen [mm] $\hat [/mm] p$):
1) GGGG , [mm] $\hat [/mm] p=0$ 9) GRRG , [mm] $\hat [/mm] p=2/4$
2) RGGG , [mm] $\hat [/mm] p=1/4$ 10) GRGR , [mm] $\hat [/mm] p=2/4$
3) GRGG , [mm] $\hat [/mm] p=1/4$ 11) GGRR , [mm] $\hat [/mm] p=3/4$
4) GGRG , [mm] $\hat [/mm] p=1/4$ 12) GRRR , [mm] $\hat [/mm] p=3/4$
5) GGGR , [mm] $\hat [/mm] p=1/4$ 13) RGRR , [mm] $\hat [/mm] p=3/4$
6) RRGG , [mm] $\hat [/mm] p=2/4$ 14) RRGR , [mm] $\hat [/mm] p=3/4$
7) RGRG , [mm] $\hat [/mm] p=2/4$ 15) RRRG , [mm] $\hat [/mm] p=3/4$
8) RGGR , [mm] $\hat [/mm] p=2/4$ 16) RRRR , [mm] $\hat [/mm] p=1$
Ein Konfidenzintervall ist ein Zufallsintervall, das das unbekannte
Intervall ueberdeckt oder nicht, jedoch kann man angeben, mit welcher Wsk
das geschieht. Nehmen wir an, wir betrachten das Intervall [mm] $[\hat p-1/4,\hat [/mm] p+1/4].
Ist der Anteil in der Urne $p=0.1$ (eine rote und 9
gruene Kugeln), so ueberdecken die Intervalle 1 bis 5 das p, und zwar mit
der Wahrscheinlichkeit [mm] $0.9^4+4\times0.1\times0.9^3=0.944$. [/mm] So kann man
zu jedem p=0,0.1,...,0.9,1 die Ueberdeckungswahrscheinlichkeit berechnen.
Zurueck zu deiner Frage. Die Verteilung in der Urne ist jetzt die
Verteilung der Groessen eines Mannes (wir konzentrieren uns mal auf die
Maenner, weil wir sonst eine Mischung haben, die nicht durch *eine*
Normalverteilung angemessen modelliert wird). Wir nehmen an, dass die
Koerpergroesse $X$ normalverteilt ist mit [mm] $\operatorname{E}[X]=\mu$ [/mm] und
Varianz [mm] $\operatorname{Var}[X]=\sigma^2$. [/mm] Wir nehmen der Einfachheit
halber an, dass [mm] $\sigma=100$ ($cm^2$) [/mm] bekannt ist. Dann ist [mm] $\bar [/mm] X$
normalverteilt mit [mm] $\operatorname{E}[\bar X]=\mu$ [/mm] und Varianz
[mm] $\operatorname{Var}[\bar X]=\sigma^2/n=100/n$ [/mm] (Ich kann mit deiner Mitteilung
Fest steht ja, dass $ [mm] \overline{x} [/mm] $ hier [mm] $N(\overline{x};\bruch{\sigma_{n-1}}{\wurzel{n}})-verteilt [/mm] $ ist
nichts anfangen. Sie ist schlichtweg falsch.)
Dann stellt [mm] $[\bar X-1.96\sigma/\sqrt{n},\bar X+1.96\sigma/\sqrt{n}]$ [/mm] ein
Konfidenzintervall fuer [mm] $\mu$ [/mm] dar, welches mit der Wahrscheinlichkeit
0.95 diesen Wert ueberdeckt. Bedenke, dass [mm] $\mu$ [/mm] der Erwartungswert
aller maennlichen Koerpergroessen ist, ein Wert also, den wir nie real
beobachten werden koennen (im Gegensatz zur Urne oben, wo man die roten
Kugeln auszaehlen kann).
Angenommen, eine Stichprobe von 64 Maennern erbrachte ein [mm] $\bar [/mm] x=178$.
Dann ergibt sich das Konfidenzintervall [mm] $178\pm 1.96\times [/mm] 10/8=[175.55, 180.45]$.
Liegt [mm] $\mu$ [/mm] in dem Intervall? Man weiss es nicht, entweder ja
oder nein. Aber das Verfahren ist so angelegt, dass wir *mit einer
Sicherheitswahrscheinlichkeit von 95%" behaupten koennen,
dass es [mm] $\mu$ [/mm] ueberdeckt.
Das soll erst einmal genuegen.
lg Luis
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 23:59 Sa 24.11.2007 | Autor: | oli_k |
Hallo
und danke für deine Antwort.
Zuerst mal zu meiner Aussage, die "schlichtweg falsch" ist - Du hast doch genau dasselbe in dem Satz davor geschrieben, nur mit einer anderen Schreibweise. Wir wollen doch beide sagen, dass [mm] \overline{x} [/mm] normalverteilt ist mit Erwartungswert [mm] \overline{AB} [/mm] (bzw. µ, aber man geht ja bei der Intervallberechnung von [mm] \overline{x}=µ [/mm] aus) und Varianz [mm] \sigma²/n [/mm] - was doch nichts anderes als eine Standardabweichung von [mm] \bruch{\sigma_{n-1}}{\wurzel{n}} [/mm] bedeutet.
Zum Problem:
Du hast mir das jetzt alles zwar gut noch näher gebracht - Die Frage, ob mein Lehrer Recht hat, steht jedoch immer noch im Raum: Wenn ich jetzt nach deinem Beispiel irgendeinen (einen einzigen!) Mann nach der Größe befrage, ist er dann zu 95% zwischen 175,55 und 180,45 cm groß? Das halte ich für falsch, da ja doch von der Grundgesamtheit ALLER Männer 95% zwischen 158 und 198 cm groß sind [mm] (170\pm1,96*10) [/mm] - und somit auch ein Mann zu 95% in diesem (weiteren!) Bereich liegt.
Der engere Bereich von 175,55 bis 180,45 ist doch in meinen Augen nur die Ws., dass der Erwartungswert der Grundgesamt in diesem Bereich liegt oder auch der Mittelwert einer zweiten Stichprobe mit demselben n.
Zusammengefasst:
Meiner Meinung nach liegt...
...im Intervall 175,55 bis 180,45
- zu 95% der Erwartungswert/Mittelwert der Grundgesamheit
- zu 95% der Mittelwert einer repräsentativen Stichprobe mit n=64
...im Intervall 158 bis 198
- zu 95% EIN beliebig befragter Mann
Ist das richtig so?
Danke
Oli
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 01:19 So 25.11.2007 | Autor: | Blech |
> Hallo
> und danke für deine Antwort.
>
> Zuerst mal zu meiner Aussage, die "schlichtweg falsch" ist
> - Du hast doch genau dasselbe in dem Satz davor
> geschrieben, nur mit einer anderen Schreibweise. Wir wollen
> doch beide sagen, dass [mm]\overline{x}[/mm] normalverteilt ist mit
> Erwartungswert [mm]\overline{AB}[/mm] (bzw. µ, aber man geht ja bei
> der Intervallberechnung von [mm]\overline{x}=µ[/mm] aus)
Das Problem ist, daß es schnell umständlich wird, was nun zufällig ist und was nicht.
[mm] $\mu$ [/mm] ist *nicht* zufällig. Wir wissen den Wert zwar nicht, aber es gibt einen deterministischen Durchschnittswert für die Körpergröße eines Mannes.
[mm] $\overline{X}$ [/mm] *ist* zufällig. Wir wählen zufällig 100 Männer aus, bilden ihren Durchschnittswert und nehmen den als Schätzung für [mm] $\mu$, [/mm] aber [mm] $\overline{X}$ [/mm] selber ist, weil die Stichprobe zufällig ist, zufällig. Wenn wir nun eine repräsentative Stichprobe gezogen haben, dann können wir davon ausgehen, daß [mm] $\overline{X}$ [/mm] um den wahren Wert von [mm] $\mu$ [/mm] normalverteilt ist. Deswegen [mm] $\overline{X} \sim \mathcal{N}(\mu,\sigma^2)$ [/mm] (der Einfachheit halber sei [mm] $\sigma^2$ [/mm] bekannt).
Was sagt nun ein Konfidenzintervall? (n=100, 95%)
Wenn wir eine zufällige Stichprobe ziehen, dann ist zu 95% deren (zufälliges) Mittel nicht weiter vom wahren [mm] $\mu$ [/mm] entfernt, als von den Grenzen des Intervalls vorgegeben.
Der Unterschied zu Deiner Formulierung ist, daß ich nochmal betonen wollte, daß [mm] $\overline{X}$ [/mm] zufällig ist und [mm] $\mu$ [/mm] nicht. Deine Formulierung ist nicht falsch, aber mißverständlich.
Dein Lehrer erzählt aber Schwachsinn. =)
> ...im Intervall 175,55 bis 180,45
> - zu 95% der Erwartungswert/Mittelwert der Grundgesamheit
Ja, aber ais, ich würde es andersrum formulieren, weil klarer wird, was abläuft
> - zu 95% der Mittelwert einer repräsentativen Stichprobe
> mit n=64
Nein. Sagen wir [mm] $\mu$ [/mm] ist 170cm (ich hab meine hellseherischen Fähigkeiten angewendet), und wir haben ein 95% Konfidenzintervall von [mm] $\overline{X}\pm [/mm] 10cm$ (der runden Zahlen wegen, man muß halt n entsprechend anpassen), dann liegen die Mittelwerte von Stichproben zu 95% im Bereich 160-180cm (weil für jedes [mm] $\overline{X}$ [/mm] aus diesem Bereich [mm] $\mu$ [/mm] in dessen Konfidenzintervall liegt), aber die einzelnen [mm] $\overline{X}$ [/mm] können weiter als 10cm voneinander entfernt liegen.
> ...im Intervall 158 bis 198
> - zu 95% EIN beliebig befragter Mann
Nur wenn [mm] $\mu=170cm$. [/mm] Wenn Du nur ein Konfidenzintervall für [mm] $\mu$ [/mm] hast, mußt Du das und das Intervall für den einzelnen Mann zusammenkleben.
z.B. falls [mm] $172\pm [/mm] 10cm$ ein 97.5% Konfidenzintervall für [mm] $\mu$ [/mm] ist (für entsprechendes n) und ein einzelner Mann liegt mit 97.5% im Intervall [mm] $\mu\pm [/mm] 25cm$, dann liegt der nächste zufällig ausgewählte Mann (nach denen in der Stichprobe) mit 95% Wahrscheinlichkeit im Intervall [mm] $\overline{X}\pm [/mm] 35cm$
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 02:15 So 25.11.2007 | Autor: | oli_k |
Ok, das hat mir sehr geholfen, insbesondere bin ich froh, dass ich nicht mehr ganze Tage damit verbringen muss, zu verstehen, was mein Lehrer gesagt hat, da es ja zum Glück doch falsch war ;)
Aber eine Sache noch - Den Punkt, den du mit "Nein" abgelehnt hast nochmal ganz allgemein gerechnet:
Wenn ich mit einer Stichprobe Nr.1 von n bei bekanntem [mm] \sigma [/mm]
ein 95%-Konfidenzintervall für µ bestimme (um [mm] \overline{x_1}), [/mm] dann ist [mm] I_{µ}=[\overline{x_1}-1,96*\bruch{\sigma}{\wurzel{n}};\overline{x_1}+1,96*\bruch{\sigma}{\wurzel{n}}] [/mm] - Stimmt's?
Jetzt rechne ich mal andersrum. Ich kenne mein µ und will ein 95%-Konfidenzintervall für eine zweite Stichprobe Nr.2 berechnen. Die Stichprobenmittel [mm] \overline{x_2} [/mm] sind ja um µ normalverteilt mit Standardabweichung [mm] \bruch{\sigma}{\wurzel{n}}. [/mm] Also ist [mm] I_{\overline{x_2}}=[µ-1,96*\bruch{\sigma}{\wurzel{n}};µ+1,96*\bruch{\sigma}{\wurzel{n}}]
[/mm]
Da bei der Rechnung ja [mm] \overline{x_{1/2}}=µ [/mm] gesetzt werden, sind die beiden Intervalle gleich.
Das heisst: Wenn ich ein Konfidenzintervall für µ um [mm] \overline{x} [/mm] mit einer Stichprobe der Länge n bestimme, so erhalte ich das gleiche Intervall wie für das Konfidenzintervall für [mm] \overline{x} [/mm] um µ einer Stichprobe der gleichen Länge n.
Das ist doch so korrekt, oder nicht?
Danke
Oli
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:29 So 25.11.2007 | Autor: | Blech |
> Ok, das hat mir sehr geholfen, insbesondere bin ich froh,
> dass ich nicht mehr ganze Tage damit verbringen muss, zu
> verstehen, was mein Lehrer gesagt hat, da es ja zum Glück
> doch falsch war ;)
>
> Aber eine Sache noch - Den Punkt, den du mit "Nein"
> abgelehnt hast nochmal ganz allgemein gerechnet:
> Wenn ich mit einer Stichprobe Nr.1 von n bei bekanntem
> [mm]\sigma[/mm]
> ein 95%-Konfidenzintervall für µ bestimme (um
> [mm]\overline{x_1}),[/mm] dann ist
> [mm]I_{µ}=[\overline{x_1}-1,96*\bruch{\sigma}{\wurzel{n}};\overline{x_1}+1,96*\bruch{\sigma}{\wurzel{n}}][/mm]
> - Stimmt's?
Ja.
> Jetzt rechne ich mal andersrum. Ich kenne mein µ und will
> ein 95%-Konfidenzintervall für eine zweite Stichprobe Nr.2
> berechnen. Die Stichprobenmittel [mm]\overline{x_2}[/mm] sind ja um
> µ normalverteilt mit Standardabweichung
> [mm]\bruch{\sigma}{\wurzel{n}}.[/mm] Also ist
Ja.
> [mm]I_{\overline{x_2}}=[µ-1,96*\bruch{\sigma}{\wurzel{n}};µ+1,96*\bruch{\sigma}{\wurzel{n}}][/mm]
> Da bei der Rechnung ja [mm]\overline{x_{1/2}}=µ[/mm] gesetzt
> werden, sind die beiden Intervalle gleich.
Wie sollen die gleich [mm] $\mu$ [/mm] gesetzt werden können? Wir kennen ja [mm] $\mu$ [/mm] nicht und es ist beim Beispiel mit der Körpergröße auch unmöglich, es jemals rauszufinden.
Vielleicht meinst Du [mm] $\hat\mu [/mm] := [mm] \overline{x}_1$? [/mm] Aber das meint nur, daß wir das Stichprobenmittel als unsere *Schätzung* für [mm] $\mu$ [/mm] hernehmen. Das wahre [mm] $\mu$ [/mm] ist unbekannt.
Es gilt nur [mm] $E(\hat\mu)=\mu$. [/mm] D.h. wenn wir nur genug Stichproben nehmen, dann kommen wir beliebig nahe an das wahre [mm] $\mu$ [/mm] (was natürlich klar ist, weil m Stichproben der Länge n effektiv eine Stichprobe der Länge m*n ergeben. D.h. unser Konfidenzintervall wird beliebig klein)
> Das heisst: Wenn ich ein Konfidenzintervall für µ um
> [mm]\overline{x}[/mm] mit einer Stichprobe der Länge n bestimme, so
> erhalte ich das gleiche Intervall wie für das
> Konfidenzintervall für [mm]\overline{x}[/mm] um µ einer Stichprobe
> der gleichen Länge n.
Ja. Wenn Du [mm] $\mu$ [/mm] kennst.
Du nimmst eine Urne und füllst 1000 rote und 1000 blaue Kugeln rein.
Dann weißt Du, daß die Mittel von 95% aller Stichproben von Länge n in Deinem Intervall liegen werden.
Umgekehrt wird jemand, der die Zahl der Kugeln nicht kennt (aber die Varianz) und eine Stichprobe zieht, auf ein gleichgroßes 95% Konfidenzintervall um sein Stichprobenmittel kommen.
Sagen wir Dein Intervall ist [mm] $0.5\pm [/mm] 0.01$ (0=rot, 1=blau). Das heißt dann, daß 95% aller Stichproben zw. 0.49 und 0.51 liegen werden.
Hat jetzt jemand ohne Kenntnis von [mm] $\mu$ [/mm] eine Stichprobe gezogen und kommt auf [mm] $0.51\pm [/mm] 0.01$, dann liegt er in diesen 95%, und sein Konfidenzintervall überdeckt auch tatsächlich das wahre [mm] $\mu$.
[/mm]
Aber es heißt nicht, daß 95% aller anderen Stichproben zwischen 0.5 und 0.52 liegen. Tatsächlich liegen nur etwa 50% aller Stichproben in dem Intervall (weil die Normalverteilung symmetrisch um [mm] $\mu$ [/mm] ist, und wir hier nur in einer der beiden Hälften liegen).
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:48 So 25.11.2007 | Autor: | oli_k |
Ok,
das ist klar geworden!
Vielen Dank nochmal,
Oli
|
|
|
|