Subdifferential, Affine Funkti < Funktionalanalysis < Analysis < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 15:17 Mi 27.11.2019 | Autor: | TS85 |
Aufgabe | Sei [mm] \alpha_i \in \IR^n, b_i \in \IR [/mm] für i=1,...,m und definiere
[mm] f(x):=max_{1\le i \le m}\{ \alpha_i^Tx-b_i\}
[/mm]
1.) Leite eine explizite Formel für die Richtungsableitung von f am Punkt x her. Wann ist f differenzierbar im traditionellen Kontext?
2.) Durch Nutzen der Identität von der konvexen Analysis
[mm] \partial f(x)=\{g_x \in \IR^n | g_x^Th \le f'(x;h) h \in \IR^n \}
[/mm]
argumentiere dass [mm] \partial [/mm] f(x) eine geschlossene konvexe Hülle der Vektoren [mm] \alpha_j [/mm] enthält, mit [mm] \alpha_j^Tx-b_j=f(x).
[/mm]
Die umgekehrte Richtung ist nicht-trivial und benötigt das Separationstheorem, welches nicht in der Vorlesung behandelt wird. |
Hallo,
da ich aktuell noch keinen Lösungsansatz habe, meine Frage.
zu 1.)
Im traditionellen Kontext ist f diff.bar an der Stelle [mm] x_0,
[/mm]
wenn der beidseitige Grenzwert der Differenzenquotienten
[mm] \limes_{h\rightarrow 0}\bruch{f(x_0+h)-f(x_0)}{h}=\limes_{x\rightarrow x_0}\bruch{f(x)-f(x_0)}{x-x_0}
[/mm]
existiert.
Handelt es sich hierbei um eine implizite Definition?
Und bei folgender um die Explizite
[mm] f(x_0 +h)=f(x_0)+m*h+r(h) [/mm] mit r als Funktion des Approximationsfehlers?
Nach Definition (hier nicht aufgezigt) würde sich die Richtungsableitung folgendermaßen aufstellen:
[mm] D_v f(x)=\limes_{h\rightarrow 0}\bruch{max_{1\le i \le m}\{ \alpha_i^T(x+h-v)-b_i\}-max_{1\le i \le m}\{ \alpha_i^Tx-b_i\}}{h}
[/mm]
mit v [mm] \in \IR^n, [/mm] h [mm] \in \IR.
[/mm]
Handelt es sich hierbei nun um die implizite Darstellung, was ist die explizite?
zu 2.)
Ist folgende Definition einer konvexen Hülle hier richtig:
Die konvexe Hülle einer Teilmenge X eines reellen Vektorraums V ist durch
conv [mm] X:=\cap_{X\subseteq K\subseteq V, K konvex} [/mm] K
definiert. Oder ist hier die Beschreibung mittels Menge aller endlichen Konvexkombinationen gefordert?
Leider habe ich bisher noch nicht mehr erreicht als
Definitionen nachzuschlagen, Hilfe wäre also nett.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 16:32 Mi 27.11.2019 | Autor: | fred97 |
> Sei [mm]\alpha_i \in \IR^n, b_i \in \IR[/mm] für i=1,...,m und
> definiere
> [mm]f(x):=max_{1\le i \le m}\{ \alpha_i^Tx-b_i\}[/mm]
>
> 1.) Leite eine explizite Formel für die Richtungsableitung
> von f am Punkt x her. Wann ist f differenzierbar im
> traditionellen Kontext?
>
> 2.) Durch Nutzen der Identität von der konvexen Analysis
>
> [mm]\partial f(x)=\{g_x \in \IR | g_x^Th \le f'(x;h) h \in \IR^n \}[/mm]
Bei der obigen Menge rechts ist einiges schief gegangen. Sollte [mm] g_x [/mm] nicht im [mm] IR^n [/mm] liegen?
Was bedeutet f'(x;h) ? Ist f'(x;h)h das Skalarprodukt der beteiligten Vektoren? Wenn ja, warum steht dann dahinter [mm] \in IR^n [/mm] ? Das macht keinen Sinn !
>
> argumentiere dass [mm]\partial[/mm] f(x) eine geschlossene konvexe
> Hülle der Vektoren [mm]\alpha_j[/mm] enthält, mit
> [mm]\alpha_j^Tx-b_j=f(x).[/mm]
> Die umgekehrte Richtung ist nicht-trivial und benötigt
> das Separationstheorem, welches nicht in der Vorlesung
> behandelt wird.
> Hallo,
>
> da ich aktuell noch keinen Lösungsansatz habe, meine
> Frage.
>
> zu 1.)
> Im traditionellen Kontext ist f diff.bar an der Stelle
> [mm]x_0,[/mm]
> wenn der beidseitige Grenzwert der Differenzenquotienten
> [mm]\limes_{h\rightarrow 0}\bruch{f(x_0+h)-f(x_0)}{h}=\limes_{x\rightarrow x_0}\bruch{f(x)-f(x_0)}{x-x_0}[/mm]
>
> existiert.
Das ist die Definition, wenn f von nur einer reellen Variablen abhängt. Mach Dich also schlau, wie die Definition im Falle mehrerer Variablen lautet.
> Handelt es sich hierbei um eine implizite Definition?
Was meinst du mit impliziter Definition? ?
>
> Und bei folgender um die Explizite
> [mm]f(x_0 +h)=f(x_0)+m*h+r(h)[/mm] mit r als Funktion des
> Approximationsfehlers?
>
> Nach Definition (hier nicht aufgezigt) würde sich die
> Richtungsableitung folgendermaßen aufstellen:
>
> [mm]D_v f(x)=\limes_{h\rightarrow 0}\bruch{max_{1\le i \le m}\{ \alpha_i^T(x+h-v)-b_i\}-max_{1\le i \le m}\{ \alpha_i^Tx-b_i\}}{h}[/mm]
Das ist auch nicht richtig. Schau also nach, wie die Richtungsableitung def. ist.
>
> mit v [mm]\in \IR^n,[/mm] h [mm]\in \IR.[/mm]
> Handelt es sich hierbei nun um
> die implizite Darstellung, was ist die explizite?
>
> zu 2.)
> Ist folgende Definition einer konvexen Hülle hier
> richtig:
>
> Die konvexe Hülle einer Teilmenge X eines reellen
> Vektorraums V ist durch
> conv [mm]X:=\cap_{X\subseteq K\subseteq V, K konvex}[/mm] K
> definiert.
Das stimmt.
> Oder ist hier die Beschreibung mittels Menge
> aller endlichen Konvexkombinationen gefordert?
Was meinst Du mit "gefordert "?
>
> Leider habe ich bisher noch nicht mehr erreicht als
> Definitionen nachzuschlagen, Hilfe wäre also nett.
>
>
Hilfe kannst du nur erwarten, wenn du alles sauber formulierst und die Definitionen parat hast.
Also räume auf und frage nochmal.
Gruß Fred
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:54 Mi 27.11.2019 | Autor: | TS85 |
Es war [mm] g_x \in \IR^n [/mm] gemeint.
Die restliche Definition ist so auf dem Aufgabenblatt gestellt.
Problem ist eben, dass Übungsaufgaben oftmals ein wenig an der Vorlesung vorbeigehen, wobei diese hier wohl eher noch harmlos ist (und stattdessen teilweise Wissen aus anderen Modulen vorraussetzen, welche man überhaupt nicht gehört hat)
Ich werde wohl noch weiter Research betreiben müssen.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 07:21 Do 28.11.2019 | Autor: | fred97 |
> Es war [mm]g_x \in \IR^n[/mm] gemeint.
> Die restliche Definition ist so auf dem Aufgabenblatt
> gestellt.
Siehst Du denn nicht, dass
$ [mm] \partial f(x)=\{g_x \in \IR^n | g_x^Th \le f'(x;h) h \in \IR^n \} [/mm] $
völlig sinnlos ist ?
Ich vermute es lautet so:
$ [mm] \partial f(x)=\{g_x \in \IR^n | g_x^Th \le f'(x;h)h \quad \forall h \in \IR^n \} [/mm] $
Was $f'(x;h)$ bedeutet wissen wir immer noch nicht
>
> Problem ist eben, dass Übungsaufgaben oftmals ein wenig an
> der Vorlesung vorbeigehen, wobei diese hier wohl eher noch
> harmlos ist (und stattdessen teilweise Wissen aus anderen
> Modulen vorraussetzen, welche man überhaupt nicht gehört
> hat)
> Ich werde wohl noch weiter Research betreiben müssen.
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 11:31 So 01.12.2019 | Autor: | TS85 |
Die Richtungsableitung wird folgend definiert:
[mm] f'(x;w)=\limes_{\lambda \to 0}\bruch{f(x+\lambda w) -f(x)}{\lambda}.
[/mm]
Falls diese Grenzen existieren und nicht in alle Richtungen variieren, ist f diff.bar, d.h. es existiert ein Gradient
[mm] \nabla [/mm] f, sodass [mm] \nabla f^{T}w=f'(x;w) [/mm] ist.
Diesbezüglich ist mir unklar, was an meinem ersten Post mit
der gegebenen max-Funktion in der Richtungsableitungsdefinition falsch sein soll?
Soweit die Definition, was ist aber nun bei (i) zu tun?
Bekannt ist mir nur das Ableiten einer Funktion wie [mm] f(x)=max(0,(1-x)^2) [/mm] durch Fallunterscheidung (und durch Grenzwertbetrachtung an Unstetigkeitsstellen).
Ist es richtig, dass es sich bei f(x) um den Maximalwert
eines Vektors handelt, der durch x skaliert wird und um [mm] b_i [/mm] reduziert? (Oder ist x ein Vektor?)
zu (ii): Nach der Literatur der Vorlesung ist vermutlich
die konvexe Menge nach folgender Definition gemeint:
[mm] \summe_{i=1}^{n}\alpha^i x^i, \summe_{i=1}^{n}\alpha^i=1,\alpha^i>=0,i=1,...,n
[/mm]
Nach der Identität der konvexen Analysis würde dann gelten:
[mm] \partialf(x)=\{g_x \in \IR^n | g_x^Th \le f'(x;h)=\limes_{\lambda \to 0}\bruch{\alpha_j^T(x+\lambda h)-b_j-\alpha_j^T x+b_j}{\lambda}=\limes_{\lambda \to 0}\bruch{\alpha_j^T\lambda h}{\lambda}=\alpha_j^Th \forall h \in \IR^n\}
[/mm]
Zusatzfrage:
Sind mit Separationstheoreme folgende gemeint:
https://en.wikipedia.org/wiki/Hyperplane_separation_theorem
Gerne lasse ich mich jetzt eines besseren belehren, aber eben dann bitte mit Hilfe. Ich hoffe, dass mir nun keine Tippfehler unterlaufen sind.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:20 Di 03.12.2019 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|