Sunday, 15 October 2017

Sentrert Bevegelse Gjennomsnittet Konsept


Når du beregner et løpende bevegelig gjennomsnitt, er gjennomsnittet i midtperioden fornuftig. I forrige eksempel beregner vi gjennomsnittet av de første 3 tidsperiodene og plasserte det ved siden av periode 3. Vi kunne ha plassert gjennomsnittet midt i tidsintervall på tre perioder, det vil si ved siden av periode 2. Dette fungerer bra med ulike tidsperioder, men ikke så bra for jevne tidsperioder. Så hvor skulle vi plassere det første glidende gjennomsnittet når M 4 Teknisk sett ville det bevegelige gjennomsnittet falle på t 2,5, 3,5. For å unngå dette problemet, slipper vi MAs ved hjelp av M 2. Dermed glatter vi de jevne verdiene. Hvis vi gjennomsnittlig et jevnt antall termer, må vi glatte de jevne verdiene. Følgende tabell viser resultatene ved å bruke M 4.David, Yes, MapReduce er ment å operere på en stor mengde data. Og ideen er at generelt, kartet og redusere funksjoner shouldn39t bry deg hvor mange mappers eller hvor mange reduksjonsmaskiner det er, det er bare optimalisering. Hvis du tenker nøye på algoritmen jeg postet, kan du se at det ikke betyr noe hvilken mapper får hvilke deler av dataene. Hver inngangspost vil være tilgjengelig for alle reduksjoner som krever det. ndash Joe K Sep 18 12 kl 22:30 I beste av min forståelse er glidende gjennomsnitt ikke pent kart til MapReduce-paradigmet siden beregningen er i hovedsak skyvevindu over sorterte data, mens MR behandler ikke-kryssede områder av sorterte data. Løsningen ser jeg som følger: a) Å implementere tilpasset partisjoner for å kunne lage to forskjellige partisjoner i to løp. I hvert løp vil reduksjonene dine få forskjellige dataområder og beregne glidende gjennomsnitt hvor passende jeg vil prøve å illustrere: I første omgang skal data for reduksjonsapparater være: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . her vil du cacluate glidende gjennomsnitt for noen Qs. I neste runde bør reduksjonsapparatene få data som: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Og caclulate resten av bevegelige gjennomsnitt. Deretter må du samle resultater. Ideen til tilpasset partisjoner at den vil ha to driftsformer - hver gang å dele inn i like rekkevidde, men med litt skift. I en pseudokode vil det se slik ut. partisjon (keySHIFT) (MAXKEYnumOfPartitions) der: SHIFT vil bli tatt fra konfigurasjonen. MAXKEY maksimum verdi av nøkkelen. Jeg antar for enkelhet at de starter med null. RecordReader, IMHO er ikke en løsning siden den er begrenset til spesifikk splitt og kan ikke glide over splitsgrense. En annen løsning ville være å implementere egendefinert logikk for å dele inndataene (det er en del av InputFormat). Det kan gjøres å gjøre 2 forskjellige lysbilder, ligner på partisjonering. besvart 17. september 12 kl. 8: 59Virkende gjennomsnitt og sentrert flytteverdi Et par poeng om sesongmessighet i en tidsserie har gjentatt, selv om de virker åpenbare. Den ene er at begrepet 8220season8221 ikke nødvendigvis refererer til årets fire årstider som skyldes at A8282-aksen er vippet. I predictive analytics betyr 8220season8221 ofte akkurat det, fordi mange av fenomenene vi studerer, varierer sammen med utviklingen av våren til vinteren: salg av vinter - eller sommerutstyr, forekomst av visse utbredte sykdommer, værhendelser forårsaket av plasseringen av jet stream og endringer i temperaturen på vannet i østlige Stillehavet, og så videre. Tilsvarende kan hendelser som skjer regelmessig virke som meteorologiske sesonger, selv om de bare har en tøff forbindelse til solstikkene og equinoxene. Åtte timers skift på sykehus og fabrikker blir ofte uttrykt i forekomsten av inntak og utgifter av energi der, en sesong er åtte timer lang og årstidene sykler hver dag, ikke hvert år. Forfallsdatoer for skatt signaler begynnelsen av en flom av dollar til kommunale, statlige og føderale skattemyndigheter der, kan sesongen være ett år lang (personlig inntektsskatt), seks måneder (eiendomsskatt i mange stater), kvartalsvis (mange bedriftsskatter ), og så videre. It8217 er litt rart at vi har ordet 8220season8221 å referere generelt til den jevnlig gjenværende tidsperioden, men ingen generell betegnelse for tidsperioden i hvilken en full snu sesongene oppstår. 8220Cycle8221 er mulig, men i analyser og prognoser er begrepet vanligvis sett til å bety en periode med ubestemt lengde, for eksempel en konjunktursyklus. I fravær av et bedre uttrykk, brukte I8217ve 8220enomfattende periode8221 i dette og de etterfølgende kapitlene. Dette er ikke bare terminologisk musing. Måtene vi identifiserer sesonger og tidsperioden der årstidene blir svarte, har virkelige, om ofte små, konsekvenser for hvordan vi måler deres effekter. I de følgende avsnittene diskuteres hvordan enkelte analytikere varierer slik de beregner glidende gjennomsnitt, avhengig av om antall sesonger er merkelige eller like. Bruke Flytte Gjennomsnitt I stedet for Enkle Gjennomsnitt Anta at en stor by vurderer omfordeling av trafikkpolitiet for å bedre takle forekomsten av kjøring mens svekket, som byen mener har økt. For fire uker siden trådte ny lovgivning i kraft, legalisering av besittelse og rekreasjonsbruk av marihuana. Siden da ser det ut til at det daglige antallet trafikkarrestasjoner for DWI er trending opp. Kompliserende saker er det faktum at antall anholdelser ser ut til å pigg på fredager og lørdager. For å bidra til å planlegge arbeidskraftkrav inn i fremtiden, vil du forutse hvilken underliggende trend som er etablert. You8217d liker også å distribuere ressursene dine for å ta hensyn til hvilken som helst helgrelatert sesongmessighet som8217s finner sted. Figur 5.9 har de relevante dataene du må jobbe med. Figur 5.9 Med dette datasettet utgjør hver ukedag en sesong. Selv ved å bare øye på diagrammet i figur 5.9. du kan fortelle at trenden med antall daglige anholdelser er oppe. You8217ll må planlegge å utvide antall trafikkoffiserer, og håper at trenden går ut snart. Videre utgjør dataene tanken om at flere arrestasjoner forekommer rutinemessig på fredager og lørdager, så ressursallokeringen må adressere disse pigger. Men du må kvantifisere den underliggende trenden, for å avgjøre hvor mange flere politi du skal ha med deg. Du må også kvantifisere den forventede størrelsen på weekendspydene, for å finne ut hvor mange flere politi du trenger å se på uberegnelige drivere på de dagene. Problemet er at fra og med vet du ikke hvor mye av den daglige økningen skyldes trenden, og hvor mye skyldes den helgenseffekten. Du kan starte med å ødelegge tidsserien. Tidligere i dette kapittelet, i 8220Simple Seasonal Averages, 8221 så du et eksempel på hvordan du kan forstyrre en tidsserie for å isolere sesongmessige effekter ved hjelp av metoden for enkle gjennomsnitt. I denne delen you8217ll se hvordan du gjør det ved å bruke bevegelige gjennomsnitt8212sannsynlig, er gjennomsnittlig tilnærming benyttet oftere i prediktiv analyse enn det enkle gjennomsnittet tilnærming. Det er ulike grunner til at den økende populariteten til bevegelige gjennomsnitt, blant dem, at den gjennomsnittlige tilnærmingen ikke ber deg om å kollapse dataene dine i prosessen med å kvantifisere en trend. Husk at det tidligere eksemplet gjorde det nødvendig å kollapse kvartals gjennomsnitt til årlige gjennomsnitt, beregne en årlig trend, og deretter distribuere en fjerdedel av den årlige trenden over hvert kvartal i året. Dette trinnet var nødvendig for å fjerne trenden fra sesongvirkningen. I motsetning til den gjennomsnittlige tilnærmingen tilnærming gjør det mulig å forstyrre tidsserien uten å ty til den slags maskinering. Figur 5.10 viser hvordan gjennomsnittlig tilnærming fungerer i dette eksemplet. Figur 5.10 Det glidende gjennomsnittet i det andre diagrammet klargjør den underliggende trenden. Figur 5.10 legger til en glidende gjennomsnittskolonne, og en kolonne for bestemte sesonger. til datasettet i figur 5.9. Begge tilleggene krever litt diskusjon. Piggene i arrester som foregår i helgene gir deg grunn til å tro at du arbeider med sesonger som gjentar en gang hver uke. Begynn derfor med å få gjennomsnittet for den perioden som omfattes av perioden8212, det er de første syv sesongene, mandag til søndag. Formelen for gjennomsnittet i celle D5, det første tilgjengelige glidende gjennomsnittet, er som følger: Den formelen kopieres og limes ned gjennom celle D29, slik at du har 25 bevegelige gjennomsnitt basert på 25 runder på syv sammenhengende dager. Legg merke til at for å vise både de første og de siste observasjonene i tidsseriene, har jeg skjulte rader 10 til 17. Du kan forklare dem, om du vil, i dette kapittel8217s arbeidsbok, tilgjengelig fra publisher8217s nettsted. Gjør et flertall utvalg av synlige rader 9 og 18, høyreklikk en av radhodene, og velg Unhide fra hurtigmenyen. Når du skjuler et regneark8217s rader, som jeg har gjort i Figur 5.10. alle kartlagte data i de skjulte rader er også skjult på diagrammet. X-akse-etikettene identifiserer bare datapunkter som vises på diagrammet. Fordi hvert glidende gjennomsnitt i figur 5.10 omfatter syv dager, er ingen glidende gjennomsnitt parret med de tre første eller siste tre faktiske observasjonene. Kopier og lim inn formelen i celle D5 opp en dag til celle D4 kjører deg ut av observasjoner8212.Det er ingen observasjon registrert i celle C1. På samme måte er det ikke noe bevegelige gjennomsnitt registrert under celle D29. Kopier og lim inn formelen i D29 til D30 vil kreve en observasjon i celle C33, og ingen observasjon er tilgjengelig for den dagen cellen ville representere. Det ville selvfølgelig være mulig å forkorte lengden på det bevegelige gjennomsnittet for å si fem i stedet for syv. Det vil si at de bevegelige gjennomsnittsformlene i Figur 5.10 kan starte i celle D4 i stedet for D5. Men i denne typen analyse vil du ha lengden på det bevegelige gjennomsnittet til antall årstider: syv dager i uken for hendelser som gjentas ukentlig innebærer et glidende gjennomsnitt på lengde sju og fire kvartaler om året for hendelser som gjenta årlig innebærer et glidende gjennomsnitt på lengde fire. Langs like linjer, kvantifiserer vi vanligvis sesongmessige effekter på en slik måte at de blir null i løpet av perioden. Som du så i dette kapitlet8217s første avsnitt, på enkle gjennomsnitt, gjøres dette ved å beregne gjennomsnittet av (si) de fire kvartaler om et år, og deretter trekke gjennomsnittet for året fra hver kvartals tall. På den måten sikrer du at summen av sesongvirkningen er null. I sin tur er that8217s nyttige fordi det setter sesongmessige effekter på en vanlig footing8212a sommer effekt av 11, er så langt fra gjennomsnittet som en vinter effekt av 821111. Hvis du vil gjennomsnittlig fem sesonger i stedet for syv for å få det bevegelige gjennomsnittet, er du bedre av å finne et fenomen som gjentar hver fem sesong i stedet for hver syv. Men når du tar gjennomsnittet av sesongmessige effekter senere i prosessen, er det ikke sannsynlig at disse gjennomsnittene vil oppnå null. Det er nødvendig på det tidspunkt å kalibrere eller normalisere. gjennomsnittene slik at summen deres er null. Når dette er gjort, uttrykker gjennomsnittet sesong gjennomsnittet effekten på en tidsperiode som tilhører en bestemt sesong. Når det er normalisert, kalles sesongmessige gjennomsnitt de sesongbestemte indeksene som dette kapittelet allerede har nevnt flere ganger. You8217ll se hvordan det virker senere i dette kapittelet, i 8220Sette ut serien med Moving Averages.8221 Forstå bestemte sesonger. Figur 5.10 viser også hva som kalles bestemte seasonals i kolonne E. De er what8217s igjen etter å ha trukket det bevegelige gjennomsnittet fra den faktiske observasjonen. For å få en følelse av hva de spesifikke seasonals representerer, vurder det bevegelige gjennomsnittet i celle D5. Det er gjennomsnittet av observasjonene i C2: C8. Avvikene fra hver observasjon fra det bevegelige gjennomsnittet (for eksempel C2 8211 D5) garanteres å summe til null8212that8217s som er karakteristisk for et gjennomsnitt. Derfor uttrykker hver avvikelse effekten av å være assosiert med den aktuelle dagen i den aktuelle uken. It8217 er en spesifikk sesongbestemte, da8212spesifikke fordi avviket gjelder for den aktuelle mandag eller tirsdag og så videre og sesongmessig fordi i dette eksempelet behandler vi hver dag som om det var en sesong i løpet av en uke. Fordi hver spesifikke sesongmessige tiltak effekten av å være i den sesongen vis-224-vis det bevegelige gjennomsnittet for denne gruppen av (her) syv årstider, kan du senere gjennomsnitts de spesifikke sesongene for en bestemt sesong (for eksempel alle fredager i din tidsserier) for å anslå at season8217s generelt, i stedet for spesifikk, effekt. Det gjennomsnittet er ikke forvirret av en underliggende trend i tidsseriene, fordi hver spesifikk sesong uttrykker en avvik fra sitt eget bevegelige gjennomsnitt. Justere de bevegelige gjennomsnittene There8217s er også spørsmålet om å tilpasse de bevegelige gjennomsnittene med det opprinnelige datasettet. I figur 5.10. Jeg har justert hvert glidende gjennomsnitt med midtpunktet av observasjonsintervallet som den inneholder. Så for eksempel, formelen i celle D5, er gjennomsnittet observasjonene i C2: C8, og jeg har justert den med den fjerde observasjonen, midtpunktet av gjennomsnittlig rekkevidde, ved å plassere den i rad 5. Dette arrangementet kalles et sentrert glidende gjennomsnitt . og mange analytikere foretrekker å justere hvert glidende gjennomsnitt med midtpunktet av observasjonene som det er gjennomsnittlig. Husk at i denne sammenheng refererer 8220midpoint8221 til midten av et tidsrom: Torsdag er midtpunktet mandag til søndag. Det refererer ikke til medianen av de observerte verdiene, selv om det selvsagt kan fungere på den måten i praksis. En annen tilnærming er det etterfølgende bevegelige gjennomsnittet. I så fall er hvert glidende gjennomsnitt justert med den endelige observasjonen at den er gjennomsnittlig8212 og derfor går den bak sine argumenter. Dette er ofte det foretrukne arrangementet hvis du vil bruke et glidende gjennomsnitt som en prognose, som gjøres med eksponensiell utjevning, fordi ditt endelige glidende gjennomsnitt forekommer sammenfallende med den endelige tilgjengelige observasjonen. Sentrert Flytende gjennomsnitt med like mange årstider Vi bruker vanligvis en spesiell prosedyre når antall sesonger er jevnlige enn merkelige. At8217 er den typiske tilstanden: Det er en tendens til å være like mange årstider i den omfattende perioden for typiske sesonger som måneder, kvartaler og fjerdedelige perioder (for valg). Sværheten med et jevnt antall sesonger er at det ikke er noe midtpunkt. To er ikke midtpunktet til et område som begynner på 1 og slutter på 4, og det er heller ikke 3 hvis det kan sies å ha en, dens midtpunkt er 2,5. Seks er ikke midtpunktet 1 til 12, og ingen er 7 Det rent teoretiske midtpunktet er 6,5. For å fungere som om et midtpunkt eksisterer, må du legge til et lag av gjennomsnitt på toppen av glidende gjennomsnitt. Se figur 5.11. Figur 5.11 Excel har flere måter å beregne et sentrert glidende gjennomsnitt på. Ideen bak denne tilnærmingen til å få et bevegelige gjennomsnitt som er sentrert på et eksisterende midtpunkt, når det er et jevnt antall sesonger, er å trekke midtpunktet fremover med en halv sesong. Du beregner et glidende gjennomsnitt som ville være sentrert til, for eksempel, det tredje punktet i tid hvis fem sesonger i stedet for fire utgjør en fullstendig tur i kalenderen. At8217 er gjort ved å ta to påfølgende glidende gjennomsnitt og gjennomsnittlig dem. Så i figur 5.11. there8217s er et bevegelige gjennomsnitt i celle E6 som gjennomsnittsverdiene i D3: D9. Fordi det er fire sesongverdier i D3: D9, regnes det bevegelige gjennomsnittet i E6 som sentrert i den imaginære sesongen 2,5, et halvt punkt kort fra den første tilgjengelige kandidat sesongen 3. (Årstider 1 og 2 er utilgjengelige som midtpunkter for mangel på data i gjennomsnitt før sesong 1.) Vær oppmerksom på at det bevegelige gjennomsnittet i celle E8 er gjennomsnittet av verdiene i D5: D11, den andre gjennom den femte i tidsseriene. Det gjennomsnittet er sentrert på (imaginært) punkt 3.5, en full periode foran gjennomsnittet sentrert på 2,5. Ved å beregne de to glidende gjennomsnittene, så tenkningen går, kan du trekke midtpunktet for det første glidende gjennomsnittet fremover med et halvt punkt, fra 2,5 til 3. Det er gjennomsnittet i kolonne F i figur 5.11. Cell F7 gir gjennomsnittet av de bevegelige gjennomsnittene i E6 og E8. Og gjennomsnittet i F7 er justert med det tredje datapunktet i den originale tidsserien, i celle D7, for å understreke at gjennomsnittet er sentrert på den sesongen. Hvis du utvider formelen i celle F7, så vel som de bevegelige gjennomsnittene i cellene E6 og E8, ser du8217ll at det viser seg å være et veid gjennomsnitt av de fem første verdiene i tidsseriene, med den første og femte verdien gitt vekt av 1 og den andre gjennom fjerde verdier gitt en vekt på 2. Det fører oss til en raskere og enklere måte å beregne et sentrert glidende gjennomsnitt med et jevnt antall sesonger. Fortsatt i figur 5.11. Vektene lagres i området H3: H11. Denne formelen returnerer det første sentrert glidende gjennomsnittet, i celle I7: Den formelen returnerer 13.75. som er identisk med verdien beregnet av den dobbelte gjennomsnittlige formel i celle F7. Henvisning til vekter absolutt, ved hjelp av dollartegnene i H3: H11. Du kan kopiere formelen og lime den ned så langt som nødvendig for å få resten av de sentriske glidende gjennomsnittene. Avvikling av serien med bevegelige gjennomsnittsverdier Når du har trukket de bevegelige gjennomsnittene fra de opprinnelige observasjonene for å få de spesifikke årstidene, har du fjernet den underliggende trenden fra serien. What8217s igjen i de spesifikke seasonals er normalt en stasjonær, horisontal serie med to effekter som forårsaker at bestemte seasonals å avvike fra en helt rett linje: de sesongmessige effekter og tilfeldig feil i de opprinnelige observasjonene. Figur 5.12 viser resultatene for dette eksemplet. Figur 5.12 De spesifikke sesongmessige effektene for fredag ​​og lørdag forblir klare i den avgrensede serien. Det øvre diagrammet i figur 5.12 viser de opprinnelige daglige observasjonene. Både den generelle oppadgående trenden og helgen sesongens toppene er klare. Det nedre diagrammet viser de spesifikke sesongene: Resultatet av å avverge den opprinnelige serien med et gjennomsiktig filter som beskrevet tidligere i 8220Utståelse av bestemte sesongbestemte årstider.8221 Du kan se at den avgrensede serien nå er nesten horisontal (en lineær trendlinje for de spesifikke sesongene har en liten nedadgående drift), men sesongens fredag ​​og lørdagspikes er fortsatt på plass. Det neste trinnet er å bevege seg utover de spesifikke sesongene til sesongindeksene. Se figur 5.13. Figur 5.13 De spesifikke seasonals-effektene blir først i gjennomsnitt og deretter normalisert for å nå sesongindeksene. I figur 5.13. De spesifikke sesongene i kolonne E er omarrangert i tabellformen vist i området H4: N7. Hensikten er bare å gjøre det enklere å beregne sesongens gjennomsnitt. Disse gjennomsnittene er vist i H11: N11. Tallene i H11: N11 er imidlertid gjennomsnitt, ikke avvik fra et gjennomsnitt, og derfor kan vi ikke forvente at de skal summeres til null. Vi må fortsatt justere dem slik at de uttrykker avvik fra et stort middel. Det store gjennomsnittet vises i celle N13, og er gjennomsnittet av sesongens gjennomsnitt. Vi kan komme til sesongbestemte indekser ved å trekke det store gjennomsnittet i N13 fra hvert sesongmidlertid. Resultatet ligger i området H17: N17. Disse sesongindeksene er ikke lenger spesifikke for et bestemt bevegelige gjennomsnitt, som det er tilfelle med de spesifikke årstidene i kolonne E. Fordi de8217er er basert på et gjennomsnitt av hver forekomst av en gitt sesong, uttrykker de den gjennomsnittlige effekten av en gitt sesong over hele fire uker i tidsseriene. Videre er de tiltak av en sesong8217s8212here, en dag8217s8212effekt på trafikkarrestasjoner vis-224-vis gjennomsnittet for en syv-dagers periode. Vi kan nå bruke de årstidlige indeksene til å desaasonalisere serien. We8217ll bruker deseasonalized serien for å få prognoser ved hjelp av lineær regresjon eller Holt8217s metode for utjevning av trendserier (diskutert i kapittel 4). Da legger vi ganske enkelt til sesongindeksene tilbake i prognosene for å reseasonalize dem. Alt dette vises i figur 5.14. Figur 5.14 Etter at du har sesongindeksene, er de ferdige detaljene som er brukt her, de samme som i metoden for enkle gjennomsnitt. Trinnene som er illustrert i figur 5.14 er stort sett de samme som de i figurene 5.6 og 5.7. diskutert i de følgende avsnittene. Deseasonalizing observasjonene Trekk de sesongbestemte indeksene fra de opprinnelige observasjonene for å deseasonalisere dataene. Du kan gjøre dette som vist i Figur 5.14. der de opprinnelige observasjonene og sesongindeksene er arrangert som to lister som begynner i samme rad, kolonner C og F. Dette arrangementet gjør det litt enklere å strukturere beregningene. Du kan også gjøre subtraksjonen som vist i Figur 5.6. der de kvartalsvise indeksene (C8: F8) og de desasonale resultatene (C20: F24) er oppført i tabellformat. Det arrangementet gjør det litt lettere å fokusere på sesongindeksene og deseasoned kvartalsvis. Prognose fra Deseasonalized Observations I Figur 5.14. deseasonalized observasjoner er i kolonne H, og i Figur 5.7 de8217er i kolonne C. Uansett om du vil bruke en regresjonsmetode eller en utjevningsmessig tilnærming til prognosen, er it8217s best å arrangere deseasonaliserte observasjoner i en enkelkolonniste. På figur 5.14. prognosene er i kolonne J. Følgende matriseformel er angitt i området J2: J32. Tidligere i dette kapittelet påpekte jeg at hvis du utelater argumentet x-verdier fra TREND () - funksjon8217-argumentene, leverer Excel standardverdiene 1. 2. n. hvor n er antall y-verdier. I formelen nettopp gitt, inneholder H2: H32 31 y-verdier. Fordi argumentet som normalt inneholder x-verdiene, mangler, leverer Excel standardverdiene 1. 2. 31. Det er de verdiene vi vil bruke uansett, i kolonne B, så formelen som gitt er ekvivalent med TREND (H2: H32, B2: B32). Og that8217s strukturen som ble brukt i D5: D24 i figur 5.7: Gjør ett-trinns prognosen Hittil har du arrangert for prognoser for deseasonaliserte tidsserier fra t 1 til t 31 i figur 5.14. og fra t 1 til t 20 i figur 5.7. Disse prognosene utgjør nyttig informasjon for ulike formål, herunder vurdering av prognosens nøyaktighet ved hjelp av en RMSE-analyse. Men hovedformålet er å prognose minst den neste, ennå uoppdagede tidsperioden. For å få det, kan du først prognose fra funksjonen TREND () eller LINEST () hvis you8217re bruker regresjon, eller fra eksponensiell utjevning formel hvis du8217 bruker Holt8217s metode. Deretter kan du legge til tilhørende sesongindeks til regresjons - eller utjevningsprognosen, for å få en prognose som inkluderer både trenden og sesongens effekt. På figur 5.14. du får regresjonsprognosen i celle J33 med denne formelen: I denne formelen er y-verdiene i H2: H32 de samme som i de andre TREND () - formlene i kolonne J. Så er (standard) x-verdiene på 1 gjennom 32. Nå leverer du imidlertid en ny x-verdi som funksjon8217s tredje argument, som du forteller TREND () for å se etter i celle B33. It8217s 32. den neste verdien av t. Og Excel returnerer verdien 156.3 i celle J33. Funksjonen TREND () i celle J33 forteller Excel, i virkeligheten, 8220 Beregn regresjonsligningen for verdiene i H2: H32 regresert på t-verdiene 1 til 31. Bruk den regresjonsligningen til den nye x-verdien på 32 og returner resultatet.8221 You8217ll finner den samme tilnærmingen som er tatt i celle D25 i figur 5.7. hvor formelen for å få en-trinns prognosen er dette: Legge til de årlige indeksene Tilbake I det siste trinnet er å omarbeide prognosene ved å legge til sesongindeksene i trendprognosene, reversere det du gjorde fire trinn tilbake da du trukket fra indekser fra de opprinnelige observasjonene. Dette gjøres i kolonne F i figur 5.7 og kolonne K i figur 5.14. Don8217t glemmer å legge til riktig sesongindeks for den en-trinns prognosen, med resultatene vist i celle F25 i figur 5.7 og i celle K33 på figur 5.14. (I8217ve skygget fram de første trinnene i begge figurene 5.7 og Figur 5.14 for å markere prognosene.) Du kan finne diagrammer av tre representasjoner av trafikkarrestdataene på Figur 5.15. den desesasonalized serien, den lineære prognosen fra deseasonalized data, og de resesasonalized prognosene. Vær oppmerksom på at prognosene innbefatter både den generelle trenden for de opprinnelige dataene og dens FridaySaturday spikes. Figur 5.15 Diagrammer for prognosene.6.2 Flytende gjennomsnitt ma 40 elekvisser, rekkefølge 5 41 I den andre kolonnen i denne tabellen vises et glidende gjennomsnitt av rekkefølge 5, noe som gir et estimat av trendsyklusen. Den første verdien i denne kolonnen er gjennomsnittet av de fem første observasjonene (1989-1993). Den andre verdien i 5-MA kolonnen er gjennomsnittet av verdiene 1990-1994 og så videre. Hver verdi i 5-MA kolonnen er gjennomsnittet av observasjonene i femårsperioden sentrert på tilsvarende år. Det er ingen verdier for de to første årene eller de siste to årene fordi vi ikke har to observasjoner på hver side. I formelen ovenfor inneholder kolonne 5-MA verdiene for hatten med k2. For å se hva trendsyklusestimatet ser ut, plotter vi det sammen med de opprinnelige dataene i figur 6.7. plot 40 elecsales, main quotResidential electricity salesquot, ylab quotGWhquot. xlab quotYearquot 41 linjer 40 ma 40 elecsales, 5 41. col quotredquot 41 Legg merke til hvordan trenden (i rødt) er jevnere enn de opprinnelige dataene og fanger hovedrørelsen til tidsseriene uten alle de små svingningene. Den bevegelige gjennomsnittlige metoden tillater ikke estimater av T hvor t er nær seriens ender, derfor strekker den røde linjen ikke til kantene på grafen på hver side. Senere vil vi bruke mer sofistikerte metoder for trendsyklusestimering som gjør det mulig å anslå estimater nær endepunktene. Ordren av det bevegelige gjennomsnittet bestemmer glattheten i trend-syklusestimatet. Generelt betyr en større ordre en jevnere kurve. Følgende graf viser effekten av å endre rekkefølgen på det bevegelige gjennomsnittet for el-salgsdata for bolig. Enkle bevegelige gjennomsnitt som disse er vanligvis av merkelig rekkefølge (f. eks. 3, 5, 7 osv.) Dette er slik at de er symmetriske: I et bevegelige gjennomsnitt av rekkefølge m2k1 er det k tidligere observasjoner, k senere observasjoner og midtobservasjonen som er i gjennomsnitt. Men hvis m var jevn, ville det ikke lenger være symmetrisk. Flytte gjennomsnitt av glidende gjennomsnitt Det er mulig å bruke et glidende gjennomsnitt til et glidende gjennomsnitt. En grunn til å gjøre dette er å lage en jevn rekkefølge som beveger gjennomsnittlig symmetrisk. For eksempel kan vi ta et glidende gjennomsnitt på rekkefølge 4, og deretter bruke et annet glidende gjennomsnitt av rekkefølge 2 til resultatene. I tabell 6.2 er dette gjort for de første årene av australske kvartalsvise ølproduksjonsdata. beer2 lt - window 40 ausbeer, start 1992 41 ma4 lt 40 øl2, ordre 4. senter FALSK 41 ma2x4 lt 40 øl2, orden 4. senter SANN 41 Notatet 2times4-MA i den siste kolonnen betyr en 4-MA etterfulgt av en 2-MA. Verdiene i siste kolonne er oppnådd ved å ta et glidende gjennomsnitt av rekkefølge 2 av verdiene i forrige kolonne. For eksempel er de to første verdiene i 4-MA-kolonnen 451,2 (443410420532) 4 og 448,8 (410420532433) 4. Den første verdien i kolonnen 2times4-MA er gjennomsnittet av disse to: 450,0 (451.2448.8) 2. Når en 2-MA følger et glidende gjennomsnitt av like rekkefølge (som 4), kalles det et sentrert glidende gjennomsnitt på rekkefølge 4. Dette skyldes at resultatene nå er symmetriske. For å se at dette er tilfelle, kan vi skrive 2times4-MA på følgende måte: start hodes amp frac Bigfrac (y y y y) frac (y y y y) Stor forsterker frac14y frac14y frac14y frac18y. ende Det er nå et veid gjennomsnitt av observasjoner, men det er symmetrisk. Andre kombinasjoner av bevegelige gjennomsnitt er også mulige. For eksempel brukes en 3times3-MA ofte, og består av et glidende gjennomsnitt av rekkefølge 3 etterfulgt av et annet glidende gjennomsnitt av rekkefølge 3. Generelt bør en jevn rekkefølge MA følges av en jevn rekkefølge MA for å gjøre den symmetrisk. På samme måte bør en merkelig ordre MA følges av en merkelig ordre MA. Beregner trendsyklusen med sesongdata Det vanligste bruket av sentrert glidende gjennomsnitt er å estimere trendsyklusen fra sesongdata. Vurder 2times4-MA: hatten frac y frac14y frac14y frac14y frac18y. Når det gjelder kvartalsdata, blir hvert kvartal av året gitt like vekt som de første og siste vilkårene gjelder for samme kvartal i påfølgende år. Følgelig vil sesongvariasjonen bli gjennomsnittet ut, og de resulterende verdiene av hat t vil ha liten eller ingen sesongvariasjon igjen. En lignende effekt ville bli oppnådd ved bruk av en 2 x 8-MA eller en 2 x 12-MA. Generelt er en 2-timers m-MA ekvivalent med et vektet glidende gjennomsnitt av rekkefølge m1 med alle observasjoner som tar vekt 1m unntatt de første og siste vilkårene som tar vekter 1 (2m). Så hvis sesongperioden er jevn og av rekkefølge m, bruk en 2-timers m-MA for å estimere trendsyklusen. Hvis sesongperioden er merkelig og av ordre m, bruk en m-MA for å estimere trendsyklusen. Spesielt kan en 2times 12-MA brukes til å estimere trendsyklusen av månedlige data, og en 7-MA kan brukes til å estimere utviklingssyklusen av daglige data. Andre valg for rekkefølgen av MA vil vanligvis resultere i at trend-syklus estimater blir forurenset av sesongmessigheten i dataene. Eksempel 6.2 Produksjon av elektrisk utstyr Figur 6.9 viser en 2times12-MA anvendt på ordreindeksen for elektrisk utstyr. Legg merke til at den glatte linjen viser ingen sesongmessighet, det er nesten det samme som trend-syklusen vist i figur 6.2, som ble estimert ved hjelp av en mye mer sofistikert metode enn flytende gjennomsnitt. Ethvert annet valg for rekkefølge av glidende gjennomsnitt (unntatt 24, 36, etc.) ville ha resultert i en jevn linje som viser noen sesongmessige svingninger. plott 40 elecequip, ylab quotNew ordre indexquot. Col quotgrayquot, hovedkurselektrisk produksjonsproduksjon (euroområde) kvitt 41 linjer 40 ma 40 elecequip, rekkefølge 12 41. col quotedquot 41 Veidede bevegelige gjennomsnitt Sammendrag av bevegelige gjennomsnitt resulterer i veide glidende gjennomsnitt. For eksempel er 2x4-MA diskutert ovenfor ekvivalent med en vektet 5-MA med vekter gitt av frac, frac, frac, frac, frac. Generelt kan en vektet m-MA skrives som hat t sum k aj y, hvor k (m-1) 2 og vekter er gitt med a, prikker, ak. Det er viktig at vektene alle summerer til en og at de er symmetriske slik at aj a. Den enkle m-MA er et spesielt tilfelle der alle vekter er lik 1m. En stor fordel ved vektede glidende gjennomsnitt er at de gir et jevnere estimat av trend-syklusen. I stedet for observasjoner som går inn og ut av beregningen i full vekt, økes vektene langsomt og senker sakte ned, noe som resulterer i en jevnere kurve. Noen spesifikke sett med vekter er mye brukt. Noen av disse er gitt i tabell 6.3.

No comments:

Post a Comment