Notes

❯

❯

04_optimization

index

Mar 06, 20261 min read

Optimization

Mathematical theory of finding minima and maxima of functions, with and without constraints. Answers the question: how do we find the parameters that minimize a loss function?

Notes

Convex Optimization — convex sets, convex functions, KKT conditions, duality, common ML problems
Gradient Descent and Variants — batch GD, SGD, momentum, Adam, AdamW, learning rate schedules
Lagrangian and Constrained Optimization — Lagrange multipliers, KKT, dual problem, sensitivity, SVM dual

Links

← 03 — Probability & Statistics → 05 — Statistical Learning Theory

Optimization Algorithms (Modeling)
Gradient Descent (DL Theory)

3 items under this folder.

Mar 06, 2026
convex_optimization
- theory
Mar 06, 2026
gradient_descent_optimization
- algorithm
- training
Mar 06, 2026
lagrangian_and_constrained_optimization
- theory

Created with Quartz v4.5.2 © 2026

GitHub