Når skal jeg bruke akkumulator?

Når skal jeg bruke akkumulator?
Når skal jeg bruke akkumulator?
Anonim

Akkumulatorer er variabler som bare "legges til" gjennom en assosiativ operasjon og kan derfor effektivt støttes parallelt. De kan brukes for å implementere tellere (som i MapReduce) eller summer. Spark støtter naturlig akkumulatorer av numeriske typer, og programmerere kan legge til støtte for nye typer.

Hvorfor bruker vi akkumulator?

Hydrauliske akkumulatorer brukes i en lang rekke industrier for å lagre energi; opprettholde trykket; dempe vibrasjoner, pulsasjoner og støt; og mye mer. Energilagring – Akkumulatorer kan ta imot, lagre og frigjøre energi i form av trykksatt væske for å forbedre effektiviteten av det hydrauliske systemet.

Hva er forskjellen mellom kringkasting og akkumulator i Spark?

Nøkkelforskjellen mellom en kringkastingsvariabel og en akkumulator er at mens kringkastingsvariabelen er skrivebeskyttet, kan akkumulatoren legges til. … Hver arbeidernode kan bare få tilgang til og legge til sin egen lokale akkumulatorverdi, og bare driverprogrammet har tilgang til den globale verdien.

Hvordan fungerer Spark-akkumulatoren?

Akkumulatorer er variabler som brukes for å samle informasjon på tvers av utførerne. Denne informasjonen kan for eksempel gjelde data eller API-diagnose som hvor mange poster som er ødelagt eller hvor mange ganger et bestemt bibliotek-API ble k alt.

Hvorfor skal ikke akkumulatorvariabelen i Spark brukes av arbeidere for transformasjonsoperasjoner?

Akkumulator vil gi feil utdata. Hvis en oppgave går sakte, kan Spark starte en spekulativ kopi av den oppgaven på en annen node. Bedømmelse: Ikke håndtert. Akkumulator vil gi feil utdata.

Anbefalt: