Gradient Descent er en optimaliseringsalgoritme for å finne et lok alt minimum av en differensierbar funksjon. Gradientnedstigning brukes ganske enkelt i maskinlæring for å finne verdiene til en funksjons parametere (koeffisienter) som minimerer en kostnadsfunksjon så langt som mulig.
Hvorfor bruker vi gradientnedstigning i lineær regresjon?
Hovedgrunnen til at gradientnedstigning brukes til lineær regresjon er beregningskompleksiteten: det er beregningsmessig billigere (raskere) å finne løsningen ved å bruke gradientnedstigningen i noen tilfeller. Her må du beregne matrisen X′X og deretter invertere den (se merknad nedenfor). Det er et dyrt regnestykke.
Hvorfor brukes gradientnedstigning i nevrale nettverk?
Gradientnedstigning er en optimaliseringsalgoritme som ofte brukes til å trene maskinlæringsmodeller og nevrale nettverk. Treningsdata hjelper disse modellene å lære over tid, og kostnadsfunksjonen innen gradientnedstigning fungerer spesifikt som et barometer, som måler nøyaktigheten med hver iterasjon av parameteroppdateringer.
Hvorfor fungerer gradientnedstigning for dyp læring?
Gradientnedstigning er en optimaliseringsalgoritme som brukes til å minimere en funksjon ved å iterativt bevege seg i retningen av den bratteste nedstigningen som definert av det negative til gradienten. I maskinlæring bruker vi gradientnedstigning for å oppdatere parametrene til modellen vår.
Hvor brukes gradientnedstigning?
Gradientnedstigning brukes best når parameterne ikke kan beregnes analytisk (f.eks. ved hjelp av lineær algebra) og må søkes etter med en optimaliseringsalgoritme.