pos. definit Matrix und Konvex < mehrere Veränderl. < reell < Analysis < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Zeigen Sie:
Ist H positiv definit, dann ist die Funktion f(x)= [mm] \bruch{1}{2} x^{T} [/mm] H x + [mm] b^{T}x [/mm] streng konvex. |
Hi,
Also ich soll obiges beweisen. Meine Idee:
Kurz gefasst soll man ja folgendes zeigen:
Falls H pos. definit ist [mm] \Rightarrow f((1-\lambda)x [/mm] + [mm] \lambda [/mm] y) < [mm] (1-\lambda) [/mm] f(x) + [mm] \lambda [/mm] f(y) .
d.h. es soll gezeigt werden:
[mm] \bruch{1}{2} ((1-\lambda)x [/mm] + [mm] \lambda y)^{T} [/mm] H [mm] ((1-\lambda)x [/mm] + [mm] \lambda [/mm] y) + [mm] b^{T} ((1-\lambda)x [/mm] + [mm] \lambda [/mm] y)< [mm] (1-\lambda) (\bruch{1}{2} x^{T} [/mm] H x + [mm] b^{T}x [/mm] ) + [mm] \lambda (\bruch{1}{2} y^{T} [/mm] H y + [mm] b^{T}y) [/mm]
Wenn ich jetzt mal vor dem "<" Zeichen anfange erhalte ich folgendes:
[mm] \bruch{1}{2} ((1-\lambda)x [/mm] + [mm] \lambda y)^{T} [/mm] H [mm] ((1-\lambda)x [/mm] + [mm] \lambda [/mm] y) + [mm] b^{T} ((1-\lambda)x [/mm] + [mm] \lambda [/mm] y)
= [mm] \bruch{1}{2}(1-\lambda)^{2} x^{T} [/mm] H x + [mm] \lambda^{2} y^{T} [/mm] H y + [mm] \bruch{1}{2} \lambda (1-\lambda) \{ y^{T} H x + x^{T} H y \} [/mm] + [mm] (1-\lambda) b^{T}x [/mm] + [mm] \lambda b^{T} [/mm] y
So weit bin ich schon mal.
Nun kann ja [mm] \lambda^2 [/mm] nach oben abgeschätzt werden durch [mm] \lambda, [/mm] also
[mm] \lambda^2 [/mm] < [mm] \lambda [/mm] , weil [mm] \lambda \in [/mm] (0,1)
und analog für (1- [mm] \lambda) [/mm] :
[mm] (1-\lambda)^2 [/mm] < [mm] (1-\lambda) [/mm]
Also hat man schonmal :
[mm] \bruch{1}{2}(1-\lambda)^{2} x^{T} [/mm] H x + [mm] \lambda^{2} y^{T} [/mm] H y + [mm] \bruch{1}{2} \lambda (1-\lambda) \{ y^{T} H x + x^{T} H y \} [/mm] + [mm] (1-\lambda) b^{T}x [/mm] + [mm] \lambda b^{T} [/mm] y
< [mm] \bruch{1}{2}(1-\lambda)^ x^{T} [/mm] H x + [mm] \lambda^ y^{T} [/mm] H y + [mm] \bruch{1}{2} \lambda (1-\lambda) \{ y^{T} H x + x^{T} H y \} [/mm] + [mm] (1-\lambda) b^{T}x [/mm] + [mm] \lambda b^{T} [/mm] y
So was jetzt aber noch stört sind die Mischterme mit
[mm] \bruch{1}{2} \lambda (1-\lambda) \{ y^{T} H x + x^{T} H y \}
[/mm]
Wie könnte man diese noch abschätzen?
H ist ja positiv definit, aber wie sieht dann z.b. [mm] y^{T} [/mm] H x aus ?
Auch größer 0 ?
Bin dankbar für jeden Hinweis!
LG fussel1000
|
|
|
|
Hallo,
> Zeigen Sie:
> Ist H positiv definit, dann ist die Funktion f(x)=
> [mm]\bruch{1}{2} x^{T}[/mm] H x + [mm]b^{T}x[/mm] streng konvex.
> Hi,
> Also ich soll obiges beweisen. Meine Idee:
> Kurz gefasst soll man ja folgendes zeigen:
> Falls H pos. definit ist [mm]\Rightarrow f((1-\lambda)x[/mm] +
> [mm]\lambda[/mm] y) < [mm](1-\lambda)[/mm] f(x) + [mm]\lambda[/mm] f(y) .
> d.h. es soll gezeigt werden:
>
> [mm]\bruch{1}{2} ((1-\lambda)x[/mm] + [mm]\lambda y)^{T}[/mm] H [mm]((1-\lambda)x[/mm]
> + [mm]\lambda[/mm] y) + [mm]b^{T} ((1-\lambda)x[/mm] + [mm]\lambda[/mm] y)<
> [mm](1-\lambda) (\bruch{1}{2} x^{T}[/mm] H x + [mm]b^{T}x[/mm] ) + [mm]\lambda (\bruch{1}{2} y^{T}[/mm]
> H y + [mm]b^{T}y)[/mm]
>
> Wenn ich jetzt mal vor dem "<" Zeichen anfange erhalte ich
> folgendes:
> [mm]\bruch{1}{2} ((1-\lambda)x[/mm] + [mm]\lambda y)^{T}[/mm] H [mm]((1-\lambda)x[/mm]
> + [mm]\lambda[/mm] y) + [mm]b^{T} ((1-\lambda)x[/mm] + [mm]\lambda[/mm] y)
> = [mm]\bruch{1}{2}(1-\lambda)^{2} x^{T}[/mm] H x + [mm]\lambda^{2} y^{T}[/mm]
> H y + [mm]\bruch{1}{2} \lambda (1-\lambda) \{ y^{T} H x + x^{T} H y \}[/mm]
> + [mm](1-\lambda) b^{T}x[/mm] + [mm]\lambda b^{T}[/mm] y
>
> So weit bin ich schon mal.
> Nun kann ja [mm]\lambda^2[/mm] nach oben abgeschätzt werden durch
> [mm]\lambda,[/mm] also
> [mm]\lambda^2[/mm] < [mm]\lambda[/mm] , weil [mm]\lambda \in[/mm] (0,1)
> und analog für (1- [mm]\lambda)[/mm] :
> [mm](1-\lambda)^2[/mm] < [mm](1-\lambda)[/mm]
>
> Also hat man schonmal :
> [mm]\bruch{1}{2}(1-\lambda)^{2} x^{T}[/mm] H x + [mm]\lambda^{2} y^{T}[/mm] H
> y + [mm]\bruch{1}{2} \lambda (1-\lambda) \{ y^{T} H x + x^{T} H y \}[/mm]
> + [mm](1-\lambda) b^{T}x[/mm] + [mm]\lambda b^{T}[/mm] y
> < [mm]\bruch{1}{2}(1-\lambda)^ x^{T}[/mm] H x + [mm]\lambda^ y^{T}[/mm] H y +
> [mm]\bruch{1}{2} \lambda (1-\lambda) \{ y^{T} H x + x^{T} H y \}[/mm]
> + [mm](1-\lambda) b^{T}x[/mm] + [mm]\lambda b^{T}[/mm] y
>
> So was jetzt aber noch stört sind die Mischterme mit
> [mm]\bruch{1}{2} \lambda (1-\lambda) \{ y^{T} H x + x^{T} H y \}[/mm]
>
> Wie könnte man diese noch abschätzen?
> H ist ja positiv definit, aber wie sieht dann z.b. [mm]y^{T}[/mm] H
> x aus ?
> Auch größer 0 ?
>
> Bin dankbar für jeden Hinweis!
>
> LG fussel1000
>
>
weiss nicht, ob das zum Ziel führt, aber eine methode die gemischten terme noch abzuschätzen, wäre die folgende
[mm] $0<(x+y)^T [/mm] H [mm] (x+y)=x^T [/mm] Hx + [mm] y^T [/mm] Hy+ [mm] x^T [/mm] Hy + [mm] y^T [/mm] Hx$
daraus folgt: $ [mm] x^T [/mm] Hy + [mm] y^T [/mm] Hx > [mm] -(x^T [/mm] Hx [mm] +y^T [/mm] Hy)$ bzw.
$-( [mm] x^T [/mm] Hy + [mm] y^T [/mm] Hx) < [mm] x^T [/mm] Hx [mm] +y^T [/mm] Hy$
vieleicht hilfts dir weiter.
gruss
Matthias
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:38 Mo 24.10.2011 | Autor: | fussel1000 |
Hi,
danke für den Tipp, der war Gold wert, habs geschafft mit deinem Tipp und
der Tatsache, dass [mm] \lambda^{2} [/mm] < [mm] \lambda [/mm] und
(1- [mm] \lambda)^{2} [/mm] < (1- [mm] \lambda) [/mm] für [mm] \lambda \in [/mm] (0,1).
Nochmals vielen Dank!!
LG fussel1000
|
|
|
|