I motstandstrening blir treningsdataene forsterket av "motstridende" prøver generert ved hjelp av en angrepsalgoritme Hvis angriperen bruker en lignende angrepsalgoritme for å generere motstridende eksempler, vil de motstridende trente nettverket kan være ganske robust mot angrepet.
Hvordan fungerer motstridende læring?
Adversariell maskinlæring er en maskinlæringsteknikk som prøver å lure modeller ved å gi villedende input. … De fleste maskinlæringsteknikker ble utviklet for å fungere på spesifikke problemsett der trenings- og testdataene genereres fra den samme statistiske distribusjonen (IID).
Hvordan fungerer motstridende eksempler?
Modstridige eksempler er inndata til maskinlæringsmodeller som en angriper med vilje har designet for å få modellen til å gjøre en feil; de er som optiske illusjoner for maskiner.… En motstridende input, lagt over et typisk bilde, kan føre til at en klassifiserer feilkategoriserer en panda som en gibbon.
Hva er motstandertrening i dyp læring?
Et motstandsangrep kan innebære å presentere en maskinlæringsmodell med unøyaktige eller feilrepresentative data mens den trenes, eller introdusere skadelig utformede data for å lure en allerede opplært modell til å gjøre feil.
Hva er selvmotsigende trening?
For ytterligere å styrke forsvarsevnen, foreslås selvovervåket motstandertrening, som maksimerer den gjensidige informasjonen mellom representasjonene av originaleksempler og de tilsvarende motstandseksemplene.