gradient < Matrizen < Lineare Algebra < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 19:03 Mi 15.07.2009 | Autor: | pfarmer |
Aufgabe | Berechnen Sie den Gradienten [mm] \nabla x^{T}Ax
[/mm]
wobei [mm] x\in\IR^n [/mm] und [mm] A^T=A [/mm] |
Nach manuellem rechnen bekomme ich aus [mm] \nabla x^{T}Ax=2Ax
[/mm]
welche Regeln gib es dazu? Das ergebnis sieht so einfach aus, der 'manuelle' Weg dazu so:
[mm] x^{T}Ax=x_1(a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n)+x_2(a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n)+\cdots+x_n(a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n)
[/mm]
[mm] \nabla x^{T}Ax=\vektor{(a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n)+x_1a_{11}+x_2a_{21}+\cdots+x_na_{n1} \\
x_1a_{12}+(a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n)+x_2a_{22}+\cdots+x_na_{n2} \\
\vdots \\
x_1a_{1n}+x_2a_{2n}+\cdots+(a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n)+x_na_{nn}}
[/mm]
[mm] a_{ij}=a_{ji}
[/mm]
[mm] \nabla x^{T}Ax=\vektor{2(a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n) \\
2(a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n) \\
\vdots \\
2(a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n)}=2Ax
[/mm]
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Hallo pfarmer,
> Berechnen Sie den Gradienten [mm]\nabla x^{T}Ax[/mm]
> wobei
> [mm]x\in\IR^n[/mm] und [mm]A^T=A[/mm]
> Nach manuellem rechnen bekomme ich aus [mm]\nabla x^{T}Ax=2Ax[/mm]
>
>
> welche Regeln gib es dazu? Das ergebnis sieht so einfach
> aus, der 'manuelle' Weg dazu so:
>
>
> [mm]x^{T}Ax=x_1(a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n)+x_2(a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n)+\cdots+x_n(a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n)[/mm]
>
> [mm]\nabla x^{T}Ax=\vektor{(a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n)+x_1a_{11}+x_2a_{21}+\cdots+x_na_{n1} \\
x_1a_{12}+(a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n)+x_2a_{22}+\cdots+x_na_{n2} \\
\vdots \\
x_1a_{1n}+x_2a_{2n}+\cdots+(a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n)+x_na_{nn}}[/mm]
>
> [mm]a_{ij}=a_{ji}[/mm]
>
> [mm]\nabla x^{T}Ax=\vektor{2(a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n) \\
2(a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n) \\
\vdots \\
2(a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n)}=2Ax[/mm]
>
Das wird nach der Produktregel differenziert:
[mm]\nabla\left(x^{T}Ax\right)=\nabla\left( \ x^{T} \left(Ax\right) \ \right)=\nabla x^{T} A*x + x^{T}*\nabla\left(A*x\right)=\nabla x^{T} A*x + x^{T}*A*\nabla x[/mm]
Nun gilt
[mm]\left(x^{T}*A*\nabla x\right)^{T}=\left(\nabla x\right)^{T}*A^{T}*\left(x^{T}\right)^{T}=\nabla x^{T}*A*x[/mm]
Da [mm]\nabla x^{T}[/mm] die Einheitsmatrix ist, gilt
[mm]\nabla\left(x^{T}Ax\right)=2*Ax[/mm]
>
> Ich habe diese Frage in keinem Forum auf anderen
> Internetseiten gestellt.
Gruß
MathePower
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 18:23 Do 16.07.2009 | Autor: | pfarmer |
Danke vielmals!!
(so schnelle Antwort, wow)
> Das wird nach der Produktregel differenziert:
>
> [mm]\nabla\left(x^{T}Ax\right)=\nabla\left( \ x^{T} \left(Ax\right) \ \right)=\nabla x^{T} A*x + x^{T}*\nabla\left(A*x\right)=\nabla x^{T} A*x + x^{T}*A*\nabla x[/mm]
der letzte summand [mm] x^{T}*A*\nabla [/mm] x ist doch aber kein vektor, wie kann das funktionieren?
hält die Produkt Regel wirklich dafür?
Das ist die beutze Produkt regel wenn ich richtig liege:
Ich bin verwirrt, was rechtfertigt mir die anwendung diser Regel?
Ist das nicht nur für skalare f und g definiert?
ich hab jetzt noch etwas gefunden (http://en.wikipedia.org/wiki/Del):
Das könnte aber noch komplizierter als der manuelle Weg werden
|
|
|
|
|
Hallo pfarmer,
> Danke vielmals!!
> (so schnelle Antwort, wow)
>
> > Das wird nach der Produktregel differenziert:
> >
> > [mm]\nabla\left(x^{T}Ax\right)=\nabla\left( \ x^{T} \left(Ax\right) \ \right)=\nabla x^{T} A*x + x^{T}*\nabla\left(A*x\right)=\nabla x^{T} A*x + x^{T}*A*\nabla x[/mm]
>
> der letzte summand [mm]x^{T}*A*\nabla[/mm] x ist doch aber kein
> vektor, wie kann das funktionieren?
Es ist ja [mm]x=\pmat{x_{1} \\ ... \\ x_{n}}[/mm] und A eine nXn-Matrix.
Dann ist [mm]x^{T}=\pmat{x_{1} & ... & x_{n}[/mm]
Wird jetzt [mm]x_{T]A*x[/mm] komponentenweise abgeleitet,
dann ergibt sich, beispielsweise für [mm]x_{1}[/mm]:
[mm]\bruch{\partial}{\partial x_{1}}\left(x^{T}*A*x\right)=\bruch{\partial }{\partial x_{1}}\left(x^{T}\right)*A*x+x^{T}*A*\bruch{\partial}{\partial x_{1}}\left(x}\right)[/mm]
[mm]\bruch{\partial }{\partial x_{1}}\left(x^{T}\right)[/mm] ist gerade [mm]e_{1}^{T}[/mm], wobei [mm]e_{1}[/mm] der 1. Einheitsvektor ist.
Und [mm]\bruch{\partial}{\partial x_{1}}\left(x}\right)[/mm] ist [mm]e_{1}[/mm].
Dann steht da:
[mm]\bruch{\partial}{\partial x_{1}}\left(x^{T}*A*x\right)=\bruch{\partial }{\partial x_{1}}\left(x^{T}\right)*A*x+x^{T}*A*\bruch{\partial}{\partial x_{1}}\left(x}\right)[/mm]
[mm]=e_{1}^{T}*A*x+x^{T}*A*e_{1}[/mm]
und dies ist ein Skalar.
Da A symmetrisch ist, gilt [mm]x^{T}*A*e_{1}=e_{1}^{T}*A*x[/mm]
Dann ist
[mm]\bruch{\partial}{\partial x_{1}}\left(x^{T}*A*x\right)=2*e_{1}^{T}*A*x[/mm]
Da das für analog auch für alle anderen abhängigen Variablen
gemacht werden kann, gilt
[mm]\nabla\left(x^{T}*A*x\right)=2*\pmat{e_{1}^{T}*A*x \\ ... \\ e_{n}^{T}*A*x}=2*A*x[/mm]
>
> hält die Produkt Regel wirklich dafür?
> Das ist die beutze Produkt regel wenn ich richtig liege:
>
>
> Ich bin verwirrt, was rechtfertigt mir die anwendung diser
> Regel?
> Ist das nicht nur für skalare f und g definiert?
>
> ich hab jetzt noch etwas gefunden
> (http://en.wikipedia.org/wiki/Del):
>
>
> Das könnte aber noch komplizierter als der manuelle Weg
> werden
>
>
Gruß
MathePower
|
|
|
|