Regressionsanalyse < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 16:22 Di 09.02.2010 | Autor: | domerich |
Aufgabe | Ein Reifenhersteller verändert die Zusammensetzung der Gummimischung für seinen
Premium-Reifen und vergleicht in einer Versuchsreihe die Laufleistung (in 1000 km) des
neuen (PR2) und des alten (PR1) Reifens. Nachfolgend finden Sie den Output der zugehörigen
linearen Regression in R.
Call:
lm(formula = Laufleistung ~ Reifenart)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 38.9500 0.8799 44.264 < 2e-16 ***
ReifenartPR2 3.6000 1.2444 ?.??? 0.00495 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.565 on 78 degrees of freedom
Multiple R-squared: 0.0969, Adjusted R-squared: 0.08532
F-statistic: ?.??? on 1 and 78 DF, p-value: 0.004945
Welche mittlere Laufleistung haben die beiden Reifentypen? |
ich verstehe leider nichtmal was diese Aufgabe soll und was eine Regressionsanalyse hier helfen soll.
hat mir trotzdem jemand einen Tipp, wo sich hier im R output informationen verstecken, denen ich ein Mittelwert entnehmen kann?
danke!
|
|
|
|
Hi domerich!
> Ein Reifenhersteller verändert die Zusammensetzung der
> Gummimischung für seinen
> Premium-Reifen und vergleicht in einer Versuchsreihe die
> Laufleistung (in 1000 km) des
> neuen (PR2) und des alten (PR1) Reifens. Nachfolgend
> finden Sie den Output der zugehörigen
> linearen Regression in R.
>
> Call:
> lm(formula = Laufleistung ~ Reifenart)
> Coefficients:
> Estimate Std. Error t value Pr(>|t|)
> (Intercept) 38.9500 0.8799 44.264 < 2e-16 ***
> ReifenartPR2 3.6000 1.2444 ?.??? 0.00495 **
> ---
> Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’
> 0.05 ‘.’ 0.1 ‘ ’ 1
> Residual standard error: 5.565 on 78 degrees of freedom
> Multiple R-squared: 0.0969, Adjusted R-squared: 0.08532
> F-statistic: ?.??? on 1 and 78 DF, p-value: 0.004945
>
> Welche mittlere Laufleistung haben die beiden Reifentypen?
> ich verstehe leider nichtmal was diese Aufgabe soll und
> was eine Regressionsanalyse hier helfen soll.
Vielleicht postet du an dieser Stelle mal, was das generelle Ziel einer Regressionsanalyse ist.
> hat mir trotzdem jemand einen Tipp, wo sich hier im R
> output informationen verstecken, denen ich ein Mittelwert
> entnehmen kann?
>
> danke!
Gruß, Marcel
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 18:00 Di 09.02.2010 | Autor: | domerich |
"Ziel der Varianzanalye ist eine Zerlegung
der Gesamtvarianz der abhängigen Variable in Varianz innerhalb der Gruppen und Varianz
zwischen den Gruppen. " sagt das skript also möchte ich gucken wie groß die Varianz innerhalb einer Gruppe und zwischen Gruppen ist. man kann also irgendwie gucken ob Gruppen ähnlich zueinander sind.
Also denke ich mir dass man hier gucken will wie ähnlich oder auch nicht alte und neue Autoreifen sich verhalten.
also werden hier die laufleistungen alter und neuer reifen verglichen. d.h. jeder einzelne Wert ist eine Laufleistung. Die sind hier ja nicht gegeben sondern nur irgendwelche Summen von Abweichungen oder?
|
|
|
|
|
Hi domerich!
> "Ziel der Varianzanalye ist eine Zerlegung
> der Gesamtvarianz der abhängigen Variable in Varianz
> innerhalb der Gruppen und Varianz
> zwischen den Gruppen. " sagt das skript also möchte ich
> gucken wie groß die Varianz innerhalb einer Gruppe und
> zwischen Gruppen ist. man kann also irgendwie gucken ob
> Gruppen ähnlich zueinander sind.
>
> Also denke ich mir dass man hier gucken will wie ähnlich
> oder auch nicht alte und neue Autoreifen sich verhalten.
>
> also werden hier die laufleistungen alter und neuer reifen
> verglichen. d.h. jeder einzelne Wert ist eine Laufleistung.
> Die sind hier ja nicht gegeben sondern nur irgendwelche
> Summen von Abweichungen oder?
Es sind die Parameter der linearen Regression gegeben und zwar genau die, die die Summe der Quadratischen Residuen (SSR) im Zuge der KQ-Schätzung minimieren.
Kannst du das durch R verwendete, allgemine Regressionsmodell aufstellen, welches die besagten Parameter (zunächst in allgemeiner Form) beinhaltet?
Zusammengefasst:
1.) Wie viele Regressionsparameter gibt es?
2.) Wie lautet die SSR in Abhängigkeit der minimierenden Regressionsparameter?
3.) Wie lautet das allgemeingültige, lineare Regressionsmodell?
Gruß, Marcel
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 20:44 Di 09.02.2010 | Autor: | domerich |
also es gibt eine Konstante (Intercept) und ein [mm] \beta [/mm] das ist reifenart PR2
also 1 regressionsparameter
ich sehe grad ich hab [mm] \wurzel{\sigma^2} [/mm] gegeben, n=80? und p=1
also ist [mm] 5.565^2 [/mm] = [mm] \bruch{1}{80-1-1}*\sum u_i^2
[/mm]
und [mm] \sum u_i^2= [/mm] 2415.59955
bin ich hier auf dem holzweg?
allg. gilt [mm] \alpha_0 [/mm] + [mm] \beta_i
[/mm]
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 21:50 Di 09.02.2010 | Autor: | domerich |
ich habe doch ein Model mit
[mm] y_i= \beta_0=38.95 [/mm] + [mm] \beta_1=3.6 x_i
[/mm]
soweit ich das sehe.
den Begriff SSR kenne ich nur aus der Varianzanlyse. weiß ich nicht wie es weiter geht bzw was ein SSR in der Regressionsanalyse ist :(
|
|
|
|
|
> ich habe doch ein Model mit
> [mm]y_i= \beta_0=38.95[/mm] + [mm]\beta_1=3.6 x_i[/mm]
Das ist falsch. Allgemein gilt für das Regressionsmodell
[mm] y_{i}=\beta_{0}+\beta_{1}x_{i}
[/mm]
Durch Umstellen erhalten wir
[mm] y_{i}-\beta_{0}-\beta_{1}x_{i}
[/mm]
Die Summe der quadrierten Residuen (SSR) liefert dann das Minimierungsproblen zu
[mm] \summe_{i=0}^{n-1}(y_{i}-\beta_{0}-\beta_{1}x_{i})^{2}
[/mm]
Jetzt ist es so, dass die Laufleistung gemäß Aufgabenstellung auf [mm] y_{0},...,y_{n-1} [/mm] Messungen beider Reifenarten zurückzuführen ist, sodass man die Reifenart auch als Dummyvariable, bestehend aus [mm] x_{0},...,x_{n-1} [/mm] Werten interpretieren kann. Dann hätte man quasi 0 für die Reifenart PR2 und 1 für die Reifenart PR1.
Nun kann man diese Summe entsprechend aufzuteilen, sodass man für einen Teil [mm] x_{i}=0 [/mm] und für den anderen Teil für [mm] x_{i}=1 [/mm] hat. Man kann dann schreiben
[mm] \summe_{i=0}^{n-1}(y_{i}-\beta_{0}-\beta_{1}x_{i})^{2}=\summe_{i=1}^{n-1}(y_{i}-\beta_{0})^{2}+\summe_{i=1}^{n-1}(y_{i}-\beta_{0}-\beta_{1})^{2}
[/mm]
Kannst du herausfinden, welche Werte die Regressionsparameter jeweils annehmen müssen, um die beiden Summen entsprechend zu minimieren? Du kannst dabei zunächst [mm] \beta_{0} [/mm] als gegeben betrachten.
> soweit ich das sehe.
>
> den Begriff SSR kenne ich nur aus der Varianzanlyse. weiß
> ich nicht wie es weiter geht bzw was ein SSR in der
> Regressionsanalyse ist :(
Gruß, Marcel
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 00:07 Mi 10.02.2010 | Autor: | domerich |
intuitiv würde ich raten, dass für die erste Teilsumme [mm] \beta_0 [/mm] am besten gleich [mm] \overline{y} [/mm] ist damit die Summe klein wird.
in der zweiten Summe analog [mm] (\beta_0+\beta_1)=\overline{y}
[/mm]
wenn [mm] \beta_0 [/mm] gegeben also
[mm] \beta_1=\overline{y}-\beta_0
[/mm]
|
|
|
|
|
> intuitiv würde ich raten, dass für die erste Teilsumme
> [mm]\beta_0[/mm] am besten gleich [mm]\overline{y}[/mm] ist damit die Summe
> klein wird.
Ja.
> in der zweiten Summe analog [mm](\beta_0+\beta_1)=\overline{y}[/mm]
>
> wenn [mm]\beta_0[/mm] gegeben also
>
> [mm]\beta_1=\overline{y}-\beta_0[/mm]
Ja.
Allerdings empfiehlt es sich hier noch die Mittelwerte der Summen voneinander zu unterscheiden. Dann hätte man für die zweite Summe:
[mm] \hat\beta_{1}=\overline{y}_{1}-\hat\beta_{0}. [/mm]
Zu Beachten ist dabei, dass das arithmetische Mittel der Laufzeiten der Reifenart 2 hier durch [mm] \overline{y}_{1} [/mm] repräsentiert wird.
Ferner erhält man und für die erste Summe
[mm] \hat\beta_{0}=\overline{y}_{0}, [/mm]
wobei [mm] \overline{y}_{0} [/mm] das arithmetische Mittel der Reifenart 1 darstellt.
Abschließend erhält man also die entsprechenen R-Ausgabe zu
[mm] \hat\beta_{0}=\overline{y}_{0}=38.95 [/mm] und
[mm] \hat\beta_{1}=\overline{y}_{1}-\hat\beta_{0}=\overline{y}_{1}-\overline{y}_{0}=3.6
[/mm]
Gruß, Marcel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:15 Mi 10.02.2010 | Autor: | domerich |
danke für diese herleitung!
|
|
|
|