Hallo!
Vielleicht schaut hier ja mal der ein oder andere rein, der auch Machine Learning hört/gehört hat, und kann mir folgende Frage beantworten:
Man sagt die Trennebene für eine SVM zu finden, sei ein Optimierungsproblem der Form:
Finde die Trennebene die 0.5 * ||w||^2 minimiert unter der Bedingung, dass t_n ( w^T x_n + b) >= 1 für alle n.
Dabei hat die Hyperebene die Form w^T x + b = 0 und t_n ist der gewünschte Output für das Eingabebeispiel x_n.
Meine Frage ist nun:
Wieso sollen wir 0.5 * ||w||^2 minimieren? Eigentlich wollen wir die Hyperebene mit dem größten "Margin" finden, und der Margin betragt 2/||w||. Wir wollen also ||w|| minimieren. Woher kommt der Exponent und der Faktor?
Danke euch!