Lösung überbest. Glgsystem < Gleichungssysteme < Lineare Algebra < Hochschule < Mathe < Vorhilfe
|
Aufgabe | [mm]||Ax-b|| = 0 [/mm] |
A hat nicht den vollen Rang!
Um das Minimum der Gütefunktion zu bekommen, muss ich die Funktion nach x ableiten (x ist Vektor), also [mm] \frac{\partial (Ax-b)²}{\partial x} = 0 [/mm] lösen
Laut Skript ist dies [mm]2A^T (Ax-b) = 0 [/mm], wobei die Ableitung für mich im Moment nicht nachvollziehbar ist.
Kann mir jemand auf die Sprünge helfen?
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 21:07 Do 18.09.2008 | Autor: | Marcel |
Hallo,
> [mm]||Ax-b|| = 0[/mm]
> A hat nicht den vollen Rang!
>
> Um das Minimum der Gütefunktion zu bekommen, muss ich die
> Funktion nach x ableiten (x ist Vektor), also
> [mm]\frac{\partial (Ax-b)²}{\partial x} = 0[/mm] lösen
>
> Laut Skript ist dies [mm]2A^T (Ax-b) = 0 [/mm], wobei die Ableitung
> für mich im Moment nicht nachvollziehbar ist.
>
> Kann mir jemand auf die Sprünge helfen?
ja, ich denke schon. Schau mal hier in Satz 19.15.2 (mehrdimensionale Kettenregel) und setze dort schonmal [mm] $\black{f}(x)=Ax-b$ [/mm] ein. Dann mußt Du nur noch überlegen, wie Du [mm] $\black{g}$ [/mm] zu definieren hast, damit [mm] $g(f(x))=(f(x))^2=(Ax-b)^2$ [/mm] ergibt [mm] ($g(x)=g(x_1,...,x_m):=...$). [/mm] Der Rest ergibt sich dann aus dieser Formel mit ein paar Zwischenrechnungen...
Ich habe es jetzt nicht zu Ende gedacht, aber ich denke, das sollte funktionieren. Sollte ich mich irren, kannst Du es aber sicher per Hand nachrechnen. Dann musst Du Dir halt überlegen, wie hier [mm] $(Ax-b)^2$ [/mm] aussieht und davon dann die Jordanmatrix ausrechnen. Falls Du es dann nicht siehst, solltest Du noch [mm] $2A^T(Ax-b)$ [/mm] ausrechnen und mit der zu [mm] $(Ax-b)^2$ [/mm] gehörigen Jordanmatrix vergleichen.
P.S.:
Wenn Du mit der Kettenregel rechnest, kann es sein, dass Du nach obigem Skript [mm] $\frac{\partial (Ax-b)²}{\partial x}=2(Ax-b)^T*A$ [/mm] erhälst. Das ist aber das gleiche wie das von Dir behauptete, was Du erkennst, wenn Du es transponierst (die Transponierte einer $1 [mm] \times [/mm] 1$ - Matrix ist ja wieder die gleiche Matrix, wobei man natürlich eine $1 [mm] \times [/mm] 1$ - Matrix nicht mehr als Matrix schreibt).
Gruß,
Marcel
|
|
|
|
|
Hi,
danke für die prompte Antwort und den Link. Ich habe mich damit beschäftigt und bekomme die Lösung [mm]2(\mathbf{A}\vec{x}-\vec{b}) \cdot \mathbf{A} = 0 [/mm] mit [mm]f(\vec{x}) = \mathbf{A}\vec{x}-\vec{b} [/mm] und [mm] g(u) = u^2 [/mm]
Irgendwo hab ich den Bock drin, könntest du / jemand mich mit der Nase draußstoßen?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:00 Fr 19.09.2008 | Autor: | Marcel |
Hallo,
> Hi,
>
> danke für die prompte Antwort und den Link. Ich habe mich
> damit beschäftigt und bekomme die Lösung
> [mm]2(\mathbf{A}\vec{x}-\vec{b}) \cdot \mathbf{A} = 0[/mm] mit
> [mm]f(\vec{x}) = \mathbf{A}\vec{x}-\vec{b}[/mm] und [mm]g(u) = u^2[/mm]
>
> Irgendwo hab ich den Bock drin, könntest du / jemand mich
> mit der Nase draußstoßen?
ja, das kann schon daran liegen, dass der Gradient (im Skript) als Zeilenvektor, und nicht als Spaltenvektor, definiert ist (vgl. Definition 19.8). Du musst Dich dann natürlich vollkommen ans Skript halten, denn auch die Formulierung der Kettenregel dort stimmt so ja nur mit den dort gegebenen Definitionen (andernfalls müßte man "vielleicht" noch irgendwo ein "transponiert" dranschreiben, je nach Lage der Definitionen...).
Setzt Du also, für [mm] $u=\vektor{u_1\\.\\.\\.\\u_d} \in \IR^d$, [/mm] nun
[mm] $g(u)=u^2=u^T u=(u_1,...,u_d)*\vektor{u_1\\.\\.\\.\\u_d}=\sum_{k=1}^d u_k^2$, [/mm] so ist nach dem Skriptum (mit einer kurzen Zwischenrechnung)
[mm] $\frac{\partial g(u)}{\partial u}=2(u_1,...,u_d)=2u^T$. [/mm]
Dieser Zeilenvektor ist laut dem Skriptum der Gradient von [mm] $\black{g}$ [/mm] an der Stelle [mm] $\black{u}$, [/mm] also:
[mm] $g'(u)=2u^T$.
[/mm]
Demnach ist [mm] $g'(Ax-b)=2(Ax-b)^T$.
[/mm]
$x [mm] \mapsto f(x)=\black{Ax-b}$ [/mm] nach [mm] $\black{x}$ [/mm] abgeleitet ergibt dann einfach [mm] $\black{A}$, [/mm] also $f'(x)=A$.
Nach der Kettenregel (Satz 19.15.2) gilt dann:
$$(g [mm] \circ f)'(x)=g'(f(x))*f'(x)=2(Ax-b)^T*A\,.$$
[/mm]
Nun ist aber [mm] $(2(Ax-b)^T*A) \in \IR$ [/mm] (oder eine $1 [mm] \times [/mm] 1$ - Matrix), also gilt
[mm] $$2(Ax-b)^T*A=(2(Ax-b)^T*A)^T\,.$$ [/mm]
Mit den Rechenregeln [mm] $(S*R)^T=R^T*S^T$ [/mm] (mit passenden Matrizen $R,S$), [mm] $(\lambda *R)^T=\lambda*R^T$ [/mm] (mit einem Skalar [mm] $\lambda$) [/mm] und [mm] $(R^T)^T=R$ [/mm] für das Transponieren gilt aber
[mm] $(2(Ax-b)^T*A)^T=2*((Ax-b)^T*A)^T=2*(A^T*((Ax-b)^T)^T)=2A^T(Ax-b).$
[/mm]
Zusammen liefert das die behauptete Formel. Wie gesagt: Wenn Du Dich an das Skript hältst, musst Du auch alles so benutzen, wie es im Skript steht. Es kann durchaus sein, dass ihr gewisse Sachen anders notiert (den Gradienten z.B. als Spaltenvektor). Dann musst Du halt auch Eure Formulierung der Kettenregel etc. benutzen, wobei dann sicher irgendwo ein "Transponiert" in Eurer Formel an einer Stelle steht, das in obigem Skriptum nicht steht...
Gruß,
Marcel
|
|
|
|