Glidande medelvärde data utjämning
Utjämning av Excel-diagramdata med dynamisk utjämning Utjämning av Excel-diagramdata med fasta rörliga medelvärden när du har erfarenhet av data och hur variabel det är. Men om uppgifterna ändras eller dess nya du eller ledningen kanske vill experimentera med ett annat antal perioder i utjämningsgenomsnittet. I det här exemplet används en OFFSET-formel för att skapa ett genomsnitt över ett dynamiskt intervall. Du skriver in det antal månader du vill använda för en utjämningsperiod, och AVERAGE och OFFSET beräknar hur många celler som är genomsnittliga över. Innan du gör AVERAGE-dynamiken börjar let8217s genom att förstå hur OFFSET fungerar. I följande figur innehåller cellen G26 formeln för utjämning av data i rad 20, OFFSET anger intervallet AVERAGE släpper data över. Denna formel är ett mellansteg för att hjälpa dig att förstå hur den dynamiska formeln fungerar. Funktionen OFFSET returnerar ett intervall som AVERAGE kommer att fungera på. OFFSETs attribut är, i det här exemplet, den räckvidd som OFFSET beräknar börjar vid G20 och den har noll rad eller kolumnförskjutning. Med andra ord, det övre vänstra hörnet av intervallet OFFSET beräknar är bara G20. Det kommer inte att flyttas eller kompenseras av några rader eller kolumner. Det beräknade intervallet kommer att vara 1 rad högt och inkludera den aktuella cellen G26 och två till vänster (det vill säga en -3). Så det här beräknade intervallet blir G20: E20. Kopiera den här formeln i G26 till höger och du kommer att se att den medeltar datacellen ovanför den i rad 20 och de två föregående två cellerna till vänster. Så, heres tricket som gör detta till ett dynamiskt och medelvärde över ett intervall du väljer. Vad händer om du ersätter en cellreferens för det -3 i formeln I figuren nedan har formeln i cell G26 ändrats så att bredden anges med siffran i cell E24, E24 är den gröna skuggade cellen. Numret du skriver i cell E24 kommer att bestämma bredden på celler som används i genomsnitt över. Om du anger ett värde i E24 ändras det intervall som används för att jämföra data. Vid denna tidpunkt kan du använda en spinnare eller rullgardinsmeny för att ge användaren ett val av hur brett det är för att göra utjämningsgenomsnittet. Resultatet av deras val bör gå i cell E24. Det finns ett problem med detta arrangemang. Om användaren anger ett större antal i E24 än det finns celler till vänster kommer OFFSET att innehålla tomma celler och etiketten. Detta ger ett felaktigt medelvärde. Om E24 är så stor att OFFSET går av arket ger AVERAGE ett fel. Vad vi behöver Vi behöver en lösning som inte bara stoppar ett fel, som ISERROR, vi behöver en som stannar felaktiga svar. I denna nästa figur är formeln cell G26 justerad. Rad 25 har en serie siffror som är gränserna för giltiga områden till vänster. Den nya formeln i cell G26 ser ut att rad 25 och om numret i cell E24 är större än gränsen i rad 25, produceras NA (). Den här nya felkorrigeringsformeln i G26 är, när ett Excel-diagram hänvisar NA () till en cell, plottar det ingenting. Det förhindrar att utjämningslinjen faller till noll. Ändra den dynamiska utjämningsformeln för att förhindra fel. Problem med utjämning av data och hur man tar sig runt dem Nu kan du låta din användare prova någon utjämningsperiod som de vill ha. Men (verkar som om det alltid är en men eller en men i detta fall) är det ett problem med utjämning av data. Utjämning tar ut volatiliteten, men det innebär också att du inte ser förändringar i riktning, inflektionspunkter eller nya trender till ungefär halvvägs genom utjämningsperioden. Du är bakom kurvan. Det bästa av båda världarna är att använda en vägt genomsnittlig utjämningsfunktion. På det sättet kan du ge mer vikt vid närmaste data så att du ser trender, men du kan smidigt utgå från äldre data för att eliminera en del av volatiliteten. Låter som ett bra fall för en annan artikel, utjämning av Excel-diagramdata med hjälp av ett vägt genomsnitt. Hämta exempelfilen för utjämning av Excel-diagramdata med rörlig eller dynamisk utjämning. Hjälp en vän genom att dela det här: Utjämning av data tar bort slumpmässig variation och visar trender och cykliska komponenter. Det är någon form av slumpmässig variation som är inkonsekvent i samlingen av data som tagits över tiden. Det finns metoder för att minska avbrytandet av effekten på grund av slumpmässig variation. En ofta använd teknik inom industrin är utjämning. Denna teknik, när den tillämpas korrekt, avslöjar tydligare den underliggande trenden, säsongs - och cykliska komponenter. Det finns två olika grupper av utjämningsmetoder. Medelvärden Metoder Exponentiella utjämningsmetoder Med medelvärden är det enklaste sättet att släta data. Vi ska först undersöka några medelvärden, till exempel det enkla genomsnittet av alla tidigare data. En lagerförare vill veta hur mycket en typisk leverantör levererar i 1000 dollar-enheter. Heshe tar slumpmässigt ett urval av 12 leverantörer med följande resultat: Beräknat medelvärde eller medelvärde av data 10. Chefen bestämmer sig för att använda detta som uppskattning av utgifter för en typisk leverantör. Är detta en bra eller dålig uppskattning Medelkvadratfel är ett sätt att bedöma hur bra en modell är Vi ska beräkna det genomsnittliga kvadratfelet. Det felaktiga beloppet använts minus den beräknade mängden. Felet kvadrerade är felet ovan, kvadrerat. SSE är summan av kvadrerade fel. MSE är medelvärdet av de kvadratiska felen. MSE-resultat till exempel Resultaten är: Fel och kvadrater Fel Uppskattningen 10 Frågan uppstår: kan vi använda medelvärdet för att prognostisera inkomst om vi misstänker en trend En titt på diagrammet nedan visar tydligt att vi inte borde göra det här. Genomsnittet väger alla tidigare observationer lika Sammanfattningsvis säger vi att Det enkla genomsnittet eller medelvärdet av alla tidigare observationer är enbart en användbar uppskattning för prognoser när det inte finns några trender. Om det finns trender, använd olika uppskattningar som tar hänsyn till trenden. Medeltalet väger alla tidigare observationer lika. Medelvärdet av värdena 3, 4, 5 är till exempel 4. Vi vet självklart att ett medel beräknas genom att lägga till alla värden och dela summan med antalet värden. Ett annat sätt att beräkna medelvärdet är att lägga till varje värde dividerat med antalet värden eller 33 43 53 1 1.3333 1.6667 4. Multiplikatorn 13 kallas vikten. Generellt: bar frac summa vänster (frac right) x1 left (frac right) x2,. ,, vänster (frac höger) xn. De (vänster (frac höger)) är vikterna och de räknas naturligtvis till 1.Moving-medel och exponentiella utjämningsmodeller Som ett första steg för att flytta bortom genomsnittliga modeller, slumpmässiga gångmodeller och linjära trendmodeller, nonseasonal mönster och trender kan extrapoleras med hjälp av en rörlig genomsnitts - eller utjämningsmodell. Det grundläggande antagandet bakom medelvärdes - och utjämningsmodeller är att tidsserierna är lokalt stationära med ett långsamt varierande medelvärde. Därför tar vi ett rörligt (lokalt) medelvärde för att uppskatta det nuvarande värdet av medelvärdet och sedan använda det som prognosen för den närmaste framtiden. Detta kan betraktas som en kompromiss mellan medelmodellen och slumpmässig-walk-without-drift-modellen. Samma strategi kan användas för att uppskatta och extrapolera en lokal trend. Ett rörligt medelvärde kallas ofta en quotsmoothedquot-version av den ursprungliga serien, eftersom kortsiktig medelvärde har en effekt att utjämna stötarna i originalserien. Genom att justera graden av utjämning (bredden på glidande medelvärdet) kan vi hoppas att hitta någon form av optimal balans mellan prestandan hos medel och slumpmässiga gångmodeller. Den enklaste typen av medelvärdesmodell är. Enkelt (lika viktat) Flyttande medelvärde: Prognosen för värdet av Y vid tiden t1 som är gjord vid tiden t motsvarar det enkla genomsnittet av de senaste m-observationerna: (Här och på annat håll använder jag symbolen 8220Y-hat8221 för att stå för en prognos av tidsserie Y som gjordes så tidigt som möjligt enligt en given modell.) Detta medel är centrerat vid period-t (m1) 2, vilket innebär att uppskattningen av det lokala medelvärdet tenderar att ligga bakom den sanna värdet av det lokala medelvärdet med ca (m1) 2 perioder. Således säger vi att medelåldern för data i det enkla glidande medlet är (m1) 2 i förhållande till den period för vilken prognosen beräknas: det här är hur lång tid prognoserna tenderar att ligga bakom vändpunkter i data . Om du till exempel medger de senaste 5 värdena, kommer prognoserna att vara cirka 3 perioder sent för att svara på vändpunkter. Observera att om m1 är den enkla glidande genomsnittsmodellen (SMA) motsvarar den slumpmässiga gångmodellen (utan tillväxt). Om m är mycket stor (jämförbar med längden på uppskattningsperioden), motsvarar SMA-modellen den genomsnittliga modellen. Precis som med vilken parameter som helst av en prognosmodell, är det vanligt att justera värdet på k för att få den bästa kvotkvoten till data, dvs de minsta prognosfelen i genomsnitt. Här är ett exempel på en serie som verkar utgöra slumpmässiga fluktuationer runt ett långsamt varierande medelvärde. Först kan vi försöka passa den med en slumpmässig promenadmodell, vilket motsvarar ett enkelt glidande medelvärde på 1 term: Slumpmässig gångmodell svarar väldigt snabbt på förändringar i serien, men därmed väljer den mycket av kvotenhetskvoten i data (de slumpmässiga fluktuationerna) samt quotsignalquot (det lokala medelvärdet). Om vi istället försöker ett enkelt glidande medelvärde på 5 termer får vi en snyggare uppsättning prognoser: Det 5-åriga enkla glidande medlet ger betydligt mindre fel än den slumpmässiga promenadmodellen i det här fallet. Medelåldern för data i denna prognos är 3 ((51) 2), så att den tenderar att ligga bakom vändpunkter med cirka tre perioder. (Till exempel verkar en nedgång ha skett i period 21, men prognoserna vänder inte om till flera perioder senare.) Notera att de långsiktiga prognoserna från SMA-modellen är en horisontell rak linje, precis som i slumpmässig promenad modell. Således antar SMA-modellen att det inte finns någon trend i data. Men medan prognoserna från den slumpmässiga promenadmodellen helt enkelt motsvarar det senast observerade värdet är prognoserna från SMA-modellen lika med ett vägt genomsnitt av de senaste värdena. De konfidensbegränsningar som beräknas av Statgraphics för de långsiktiga prognoserna för det enkla glidande genomsnittet blir inte större eftersom prognostiseringshorisonten ökar. Det här är uppenbarligen inte korrekt Tyvärr finns det ingen underliggande statistisk teori som berättar hur förtroendeintervallen borde utvidgas för denna modell. Det är emellertid inte så svårt att beräkna empiriska uppskattningar av konfidensgränserna för prognosen för längre tid. Du kan till exempel skapa ett kalkylblad där SMA-modellen skulle användas för att prognostisera två steg framåt, 3 steg framåt etc. i det historiska dataprov. Därefter kan du beräkna felfunktionens avvikelser vid varje prognoshorisont och sedan konstruera konfidensintervaller för längre siktprognoser genom att lägga till och subtrahera multiplar med lämplig standardavvikelse. Om vi försöker ett 9-sikt enkelt glidande medelvärde får vi ännu smidigare prognoser och mer av en långsammare effekt: Medelåldern är nu 5 perioder (91) 2). Om vi tar ett 19-årigt glidande medel ökar medeltiden till 10: Observera att prognoserna nu försvinner nu bakom vändpunkter med cirka 10 perioder. Vilken mängd utjämning är bäst för denna serie Här är en tabell som jämför deras felstatistik, inklusive ett 3-årigt genomsnitt: Modell C, det 5-åriga glidande genomsnittet, ger det lägsta värdet av RMSE med en liten marginal över 3 term och medellång sikt, och deras andra statistik är nästan identiska. Så, bland modeller med mycket liknande felstatistik kan vi välja om vi föredrar lite mer lyhördhet eller lite mer jämnhet i prognoserna. (Return to top of page.) Browns Enkel exponentiell utjämning (exponentiellt viktad glidande medelvärde) Den enkla glidande medelmodellen beskriven ovan har den oönskade egenskapen som den behandlar de sista k-observationerna lika och fullständigt ignorerar alla föregående observationer. Intuitivt bör tidigare data diskonteras på ett mer gradvis sätt - till exempel bör den senaste observationen få lite mer vikt än 2: a senast, och den 2: a senaste bör få lite mer vikt än den 3: e senaste, och så vidare. Den enkla exponentiella utjämningens (SES) - modellen åstadkommer detta. Låt 945 beteckna en quotsmoothing constantquot (ett tal mellan 0 och 1). Ett sätt att skriva modellen är att definiera en serie L som representerar den nuvarande nivån (dvs lokal medelvärde) för serien som uppskattad från data fram till idag. Värdet på L vid tid t beräknas rekursivt från sitt eget tidigare värde så här: Således är det nuvarande utjämnade värdet en interpolation mellan det tidigare jämnda värdet och den aktuella observationen, där 945 styr närheten av det interpolerade värdet till det senaste observation. Prognosen för nästa period är helt enkelt det nuvarande utjämnade värdet: Likvärdigt kan vi uttrycka nästa prognos direkt i form av tidigare prognoser och tidigare observationer, i någon av följande ekvivalenta versioner. I den första versionen är prognosen en interpolation mellan föregående prognos och tidigare observation: I den andra versionen erhålls nästa prognos genom att justera föregående prognos i riktning mot det föregående felet med en bråkdel av 945. Är felet gjort vid tid t. I den tredje versionen är prognosen ett exponentiellt vägt (dvs. rabatterat) glidande medelvärde med rabattfaktor 1-945: Interpolationsversionen av prognosformeln är det enklaste att använda om du genomför modellen på ett kalkylblad: det passar in i en encell och innehåller cellreferenser som pekar på föregående prognos, föregående observation och cellen där värdet 945 lagras. Observera att om 945 1 motsvarar SES-modellen en slumpmässig gångmodell (utan tillväxt). Om 945 0 motsvarar SES-modellen den genomsnittliga modellen, förutsatt att det första släta värdet sätts lika med medelvärdet. (Återgå till början av sidan.) Medelåldern för data i prognosen för enkel exponentiell utjämning är 1 945 i förhållande till den period som prognosen beräknas för. (Detta är inte tänkt att vara uppenbart, men det kan enkelt visas genom att utvärdera en oändlig serie.) Den enkla, snabba genomsnittliga prognosen tenderar därför att ligga bakom vändpunkter med cirka 1 945 perioder. Till exempel, när 945 0,5 är fördröjningen 2 perioder när 945 0,2 är fördröjningen 5 perioder när 945 0,1 är fördröjningen 10 perioder, och så vidare. För en given genomsnittlig ålder (dvs mängden fördröjning) är prognosen för enkel exponentiell utjämning (SES) något överlägsen SMA-prognosen (Simple Moving Average) eftersom den lägger relativt större vikt vid den senaste observationen, dvs. det är något mer quotresponsivequot för förändringar som inträffade under det senaste förflutna. Exempelvis har en SMA-modell med 9 villkor och en SES-modell med 945 0,2 båda en genomsnittlig ålder på 5 för data i sina prognoser, men SES-modellen lägger mer vikt på de sista 3 värdena än SMA-modellen och vid Samtidigt gör det inte helt 8220forget8221 om värden som är mer än 9 perioder gamla, vilket visas i det här diagrammet. En annan viktig fördel med SES-modellen över SMA-modellen är att SES-modellen använder en utjämningsparameter som kontinuerligt varierar, så att den lätt kan optimeras genom att använda en kvotsolverquot-algoritm för att minimera medelkvadratfelet. Det optimala värdet på 945 i SES-modellen för denna serie visar sig vara 0,2961, som visas här: Medelåldern för data i denna prognos är 10,2961 3,4 perioder, vilket liknar det för ett 6-sikt enkelt glidande medelvärde. De långsiktiga prognoserna från SES-modellen är en horisontell rak linje. som i SMA-modellen och den slumpmässiga promenadmodellen utan tillväxt. Observera dock att de konfidensintervaller som beräknas av Statgraphics avviker nu på ett rimligt sätt, och att de är väsentligt smalare än konfidensintervallen för slumpmässig promenadmodell. SES-modellen förutsätter att serien är något mer förutsägbar än den slumpmässiga promenadmodellen. En SES-modell är egentligen ett speciellt fall av en ARIMA-modell. så ger den statistiska teorin om ARIMA-modeller en bra grund för beräkning av konfidensintervall för SES-modellen. I synnerhet är en SES-modell en ARIMA-modell med en icke-säsongsskillnad, en MA (1) term och ingen konstant term. annars känd som en quotARIMA (0,1,1) modell utan constantquot. MA (1) - koefficienten i ARIMA-modellen motsvarar kvantiteten 1-945 i SES-modellen. Om du till exempel passar en ARIMA (0,1,1) modell utan konstant till serien som analyseras här, visar den uppskattade MA (1) - koefficienten sig att vara 0.7029, vilket är nästan exakt en minus 0,2961. Det är möjligt att lägga till antagandet om en icke-noll konstant linjär trend till en SES-modell. För att göra detta, ange bara en ARIMA-modell med en icke-sekundär skillnad och en MA (1) term med en konstant, dvs en ARIMA (0,1,1) modell med konstant. De långsiktiga prognoserna kommer då att ha en trend som är lika med den genomsnittliga trenden som observerats under hela estimeringsperioden. Det går inte att göra detta i samband med säsongjustering, eftersom säsongsjusteringsalternativen är inaktiverade när modelltypen är inställd på ARIMA. Du kan emellertid lägga till en konstant långsiktig exponentiell trend till en enkel exponentiell utjämningsmodell (med eller utan säsongsjustering) genom att använda inflationsjusteringsalternativet i prognosproceduren. Den lämpliga quotinflationen (procentuell tillväxt) per period kan beräknas som lutningskoefficienten i en linjär trendmodell som är anpassad till data i samband med en naturlig logaritmtransformation, eller det kan baseras på annan oberoende information om långsiktiga tillväxtutsikter . (Återgå till början av sidan.) Browns Linear (ie double) Exponentiell utjämning SMA-modellerna och SES-modellerna antar att det inte finns någon trend av något slag i data (vilket vanligtvis är OK eller åtminstone inte för dåligt för 1- stegprognoser när data är relativt bullriga), och de kan modifieras för att införliva en konstant linjär trend som visas ovan. Vad sägs om kortsiktiga trender Om en serie visar en växande växthastighet eller ett konjunkturmönster som uppenbarar sig klart mot bruset, och om det finns behov av att prognostisera mer än en period framåt, kan uppskattningen av en lokal trend också vara en fråga. Den enkla exponentiella utjämningsmodellen kan generaliseras för att erhålla en linjär exponentiell utjämning (LES) - modell som beräknar lokala uppskattningar av både nivå och trend. Den enklaste tidsvarierande trendmodellen är Browns linjära exponentiell utjämningsmodell, som använder två olika slätmade serier som centreras vid olika tidpunkter. Prognosformeln baseras på en extrapolering av en linje genom de två centra. (En mer sofistikerad version av denna modell, Holt8217s, diskuteras nedan.) Den algebraiska formen av Brown8217s linjär exponentiell utjämningsmodell, som den enkla exponentiella utjämningsmodellen, kan uttryckas i ett antal olika men likvärdiga former. Den här kvotens kvotstandardkvot uttrycks vanligtvis enligt följande: Låt S beteckna den singeljämnade serien som erhållits genom att använda enkel exponentiell utjämning till serie Y. Dvs, värdet på S vid period t ges av: (Minns att, under enkel exponentiell utjämning, detta skulle vara prognosen för Y vid period t1.) Låt sedan Squot beteckna den dubbelsidiga serien erhållen genom att applicera enkel exponentiell utjämning (med samma 945) till serie S: Slutligen prognosen för Y tk. för vilken kgt1 som helst, ges av: Detta ger e 1 0 (det vill säga lura lite och låt den första prognosen motsvara den faktiska första observationen) och e 2 Y 2 8211 Y 1. varefter prognoser genereras med hjälp av ekvationen ovan. Detta ger samma monterade värden som formeln baserad på S och S om de senare startades med användning av S1S1Y1. Denna version av modellen används på nästa sida som illustrerar en kombination av exponentiell utjämning med säsongsjustering. Holt8217s linjär exponentiell utjämning Brown8217s LES-modell beräknar lokala uppskattningar av nivå och trend genom att utjämna de senaste uppgifterna, men det faktum att det gör det med en enda utjämningsparameter ställer in en begränsning av de datamönster som den kan passa: nivån och trenden får inte variera till oberoende priser. Holt8217s LES-modell adresserar problemet genom att inkludera två utjämningskonstanter, en för nivån och en för trenden. När som helst t, som i Brown8217s modell, finns det en uppskattning L t på lokal nivå och en uppskattning T t av den lokala trenden. Här rekryteras de rekursivt från värdet av Y observerat vid tid t och de tidigare uppskattningarna av nivån och trenden med två ekvationer som applicerar exponentiell utjämning till dem separat. Om den beräknade nivån och trenden vid tiden t-1 är L t82091 och T t-1. respektive prognosen för Y tshy som skulle ha gjorts vid tid t-1 är lika med L t-1 T t-1. När det verkliga värdet observeras beräknas den uppdaterade uppskattningen av nivån rekursivt genom interpolering mellan Y tshy och dess prognos L t-1 T t 1 med vikter av 945 och 1- 945. Förändringen i beräknad nivå, nämligen L t 8209 L t82091. kan tolkas som en bullrig mätning av trenden vid tiden t. Den uppdaterade uppskattningen av trenden beräknas sedan rekursivt genom interpolering mellan L t 8209 L t82091 och den tidigare uppskattningen av trenden T t-1. Användning av vikter av 946 och 1-946: Tolkningen av trendutjämningskonstanten 946 är analog med den för nivåutjämningskonstanten 945. Modeller med små värden av 946 förutsätter att trenden ändras endast mycket långsamt över tiden, medan modeller med större 946 antar att det förändras snabbare. En modell med en stor 946 tror att den avlägsna framtiden är väldigt osäker, eftersom fel i trendberäkning blir ganska viktiga vid prognoser mer än en period framåt. (Återgå till början av sidan.) Utjämningskonstanterna 945 och 946 kan beräknas på vanligt sätt genom att minimera medelkvadratfelet i de 1-stegs-prognoserna. När detta görs i Statgraphics visar uppskattningarna att vara 945 0.3048 och 946 0.008. Det mycket lilla värdet av 946 innebär att modellen antar mycket liten förändring i trenden från en period till nästa, så i grunden försöker denna modell att uppskatta en långsiktig trend. I analogi med begreppet medelålder för de data som används för att uppskatta den lokala nivån i serien, är medelåldern för de data som används för att uppskatta den lokala trenden proportionell mot 1 946, men inte exakt lika med den . I detta fall visar det sig att vara 10.006 125. Detta är ett mycket exakt nummer eftersom precisionen av uppskattningen av 946 är verkligen 3 decimaler, men den har samma generella storleksordning som provstorleken på 100, så denna modell är medeltal över ganska mycket historia för att beräkna trenden. Prognosplotten nedan visar att LES-modellen beräknar en något större lokal trend i slutet av serien än den ständiga trenden som beräknas i SEStrend-modellen. Det uppskattade värdet på 945 är också nästan identiskt med det som erhållits genom att montera SES-modellen med eller utan trend, så det är nästan samma modell. Nu ser dessa ut som rimliga prognoser för en modell som beräknas beräkna en lokal trend. Om du 8220eyeball8221 ser det här, ser det ut som om den lokala trenden har vänt sig nedåt i slutet av serien. Vad har hänt Parametrarna i denna modell har uppskattats genom att minimera det kvadrerade felet i 1-stegs-prognoser, inte längre prognoser, i vilket fall trenden gör inte en stor skillnad. Om allt du tittar på är 1 steg framåt, ser du inte den större bilden av trender över (säg) 10 eller 20 perioder. För att få denna modell mer i linje med vår ögonbolls extrapolering av data kan vi manuellt justera trendutjämningskonstanten så att den använder en kortare baslinje för trendberäkning. Om vi till exempel väljer att ställa in 946 0,1, är medelåldern för de data som används vid uppskattning av den lokala trenden 10 perioder, vilket innebär att vi medeltar trenden över de senaste 20 perioderna eller så. Here8217s vad prognosplottet ser ut om vi sätter 946 0,1 samtidigt som ni håller 945 0.3. Detta ser intuitivt rimligt ut för denna serie, men det är troligen farligt att extrapolera denna trend mer än 10 perioder i framtiden. Vad sägs om felstatistik Här är en modelljämförelse för de två modellerna ovan och tre SES-modeller. Det optimala värdet på 945. För SES-modellen är ungefär 0,3, men liknande resultat (med något mer eller mindre responsivitet) erhålls med 0,5 och 0,2. (A) Hål linjär exp. utjämning med alfa 0,3048 och beta 0,008 (B) Hål linjär exp. utjämning med alfa 0,3 och beta 0,1 (C) Enkel exponentiell utjämning med alfa 0,5 (D) Enkel exponentiell utjämning med alfa 0,3 (E) Enkel exponentiell utjämning med alfa 0,2 Deras statistik är nästan identisk, så vi kan verkligen göra valet på grundval av prognosfel i 1 steg före proverna. Vi måste falla tillbaka på andra överväganden. Om vi starkt tror att det är vettigt att basera den nuvarande trendberäkningen på vad som hänt under de senaste 20 perioderna eller så kan vi göra ett ärende för LES-modellen med 945 0,3 och 946 0,1. Om vi vill vara agnostiska om det finns en lokal trend, kan en av SES-modellerna vara enklare att förklara och skulle också ge fler mitten av vägtrafikprognoserna för de kommande 5 eller 10 perioderna. (Tillbaka till början av sidan.) Vilken typ av trend-extrapolation är bäst: Horisontell eller linjär. Empiriska bevis tyder på att om uppgifterna redan har justerats (om det behövs) för inflationen, kan det vara oskäligt att extrapolera kortsiktiga linjära trender mycket långt in i framtiden. Tendenser som uppenbaras idag kan sänkas i framtiden på grund av olika orsaker som produktförstörelse, ökad konkurrens och konjunkturnedgångar eller uppgångar i en bransch. Av denna anledning utför enkel exponentiell utjämning ofta bättre utom provet än vad som annars skulle kunna förväntas, trots sin kvotiv kvot horisontell trend extrapolering. Dämpade trendmodifieringar av den linjära exponentiella utjämningsmodellen används också i praktiken för att införa en konservatismedel i sina trendprognoser. Den demoniserade trenden LES-modellen kan implementeras som ett speciellt fall av en ARIMA-modell, i synnerhet en ARIMA-modell (1,1,2). Det är möjligt att beräkna konfidensintervaller kring långsiktiga prognoser som produceras av exponentiella utjämningsmodeller, genom att betrakta dem som speciella fall av ARIMA-modeller. (Var försiktig: inte alla mjukvaror beräknar konfidensintervall för dessa modeller korrekt.) Bredden på konfidensintervallet beror på (i) modellens RMS-fel, (ii) utjämningstypen (enkel eller linjär) (iii) värdet (er) av utjämningskonstanten (erna) och (iv) antalet perioder framåt du prognoserar. I allmänhet sprids intervallet snabbare, eftersom 945 blir större i SES-modellen och de sprider sig mycket snabbare när linjär snarare än enkel utjämning används. Detta ämne diskuteras vidare i avsnittet ARIMA-modeller i anteckningarna. (Återgå till början av sidan.) 5.2 Utjämning av tidsserie Utjämning görs vanligtvis för att vi bättre ska kunna se mönster, trender till exempel i tidsserier. Glatt ut den oregelbundna råheten i allmänhet för att se en tydligare signal. För säsongsdata kan vi sänka säsongsläget så att vi kan identifiera trenden. Utjämning ger oss inte en modell, men det kan vara ett bra första steg i att beskriva olika komponenter i serien. Termen filter används ibland för att beskriva ett utjämningsförfarande. Om exempelvis det jämnvärda värdet för en viss tid beräknas som en linjär kombination av observationer för omgivande tider kan det sägas att weve tillämpat ett linjärt filter på data (inte detsamma som att resultatet är en rak linje, genom att vägen). Den traditionella användningen av begreppet glidande medelvärde är att vid varje tidpunkt bestämmer vi (möjligen viktade) medelvärden av observerade värden som omger en viss tid. Till exempel vid tid t. ett centrerat rörligt medelvärde av längd 3 med lika vikter skulle vara medelvärdet av värden vid tider t -1. t. och t1. För att ta bort säsongsscenariet från en serie, så vi bättre kan se trenden, skulle vi använda ett glidande medelvärde med en längd säsongsspann. Således har i de släta serierna varje utjämnat värde varit medelvärde över alla årstider. Detta kan göras genom att titta på ett ensidigt glidande medelvärde där du i genomsnitt alla värden för tidigare år värda data eller ett centrerat glidande medelvärde där du använder värden både före och efter aktuell tid. För kvartalsdata kan vi till exempel definiera ett jämnt värde för tiden t som (x t x t-1 x t-2 x t-3) 4, genomsnittet av denna tid och de föregående 3 kvartalen. I R-kod kommer detta att vara ett ensidigt filter. Ett centrerat glidande medelvärde skapar lite svårighet när vi har ett jämnt antal tidsperioder i säsongsspannet (som vi brukar göra). Att släpa säsongen i kvartalsdata. För att identifiera trenden är den vanliga konventionen att använda det glidande medlet jämnas vid tidpunkten t. Att släpa säsongen i månadsdata. För att identifiera trenden är den vanliga konventionen att använda det glidande medlet glatt vid tidpunkt t. Det vill säga, vi applicerar vikt 124 till värden ibland t6 och t6 och vikt 112 till alla värden vid alla tidpunkter mellan t5 och t5. I R-filterkommandot anger du ett tvåsidigt filter när vi vill använda värden som kommer både före och efter tiden för utjämning. Observera att på sidan 71 i vår bok gäller författarna lika vikter över ett centrerat säsongsmässigt rörligt medelvärde. Det är okej också. Exempelvis kan en kvartalsmjukare glättas vid tidpunkten t är frac x frac x frac xt frac x frac x En månatlig mjukare kan tillämpa en vikt på 113 till alla värden från tiderna t-6 till t6. Koden som författarna använder på sidan 72 utnyttjar ett rep-kommando som upprepar ett värde ett visst antal gånger. De använder inte filterparametern inom filterkommandot. Exempel 1 Kvartals ölproduktion i Australien I både lektion 1 och lektion 4 såg vi på en serie kvartalsvis ölproduktion i Australien. Den följande R-koden skapar en jämn serie som låter oss se trendmönstret och plottar det här trendmönstret i samma graf som tidsserien. Det andra kommandot skapar och lagrar den släta serien i objektet som kallas trendpattern. Observera att det i filterkommandot ger det parametervärde filtret koefficienterna för utjämningen och sidor 2 medför att en centrerad smidig beräknas. ölprodskanning (beerprod. dat) trendpatternfilter (ölprod, filter c (18, 14, 14, 14, 18), sidor2) plot (ölprod, typ b, huvudrörande genomsnittliga årliga trend) linjer (trendpattern) Heres resultatet: Vi kan subtrahera trendmönstret från datavärdena för att få en bättre titt på säsongsalder. Heres hur det skulle bli gjort: seasonals beerprod - trendpattern plot (säsonger, typ b, huvudsäsongsmönster för ölproduktion) Resultatet följer: En annan möjlighet för utjämning av serier för att se trenden är det ensidiga filtret trendpattern2 filteret (beerprod, filter c (14, 14, 14, 14), sidor1) Med detta är det släta värdet genomsnittet för det gångna året. Exempel 2 USA: s månatliga arbetslöshet I läxan för vecka 4 såg du på en månadsserie av arbetslöshet i USA för 1948-1978. Här är en utjämning gjord för att titta på trenden. trendunemployfilter (arbetslös, filterc (124,112,112,112,112,112,112,112,112,112,112,112,124), sidor2) trendunemploy ts (trendunemploy, start c (1948,1), freq 12) plot (trendunemploy, mainTrend i USAs arbetslöshet, 1948-1978, xlab Year) Endast den släta trenden är planerad. Det andra kommandot identifierar kalendertidsegenskaperna för serien. Det gör att tomten har en mer meningsfull axel. Grunden följer. För serier som inte är säsongsbundna, binder du sig till en jämn spänning. För utjämning bör du experimentera med glidande medelvärden av olika spänner. Dessa spänner över tiden kan vara relativt korta. Målet är att slå av de grova kanterna för att se vilken trend eller mönster som kan vara där. Andra utjämningsmetoder (avsnitt 2.4) Avsnitt 2.4 beskriver flera sofistikerade och användbara alternativ för att flytta genomsnittlig utjämning. Detaljerna kan verka sketchy, men det är okej för att vi inte vill få boggat ner i massor av detaljer för dessa metoder. Av de alternativa metoder som beskrivs i avsnitt 2.4 kan lowess (lokalt viktad regression) vara den mest använda. Exempel 2 Fortsatt Följande diagram är en jämn trendlinje för USA: s arbetslöshetsserie, som användes med en lågare mjukare, där en betydande mängd (23) bidrog till varje jämn uppskattning. Observera att detta slätte serien mer aggressivt än det glidande medlet. De kommandon som användes var arbetslösa ts (arbetslös, start c (1948,1), freq12) plot (lowess (arbetslös, f 23), främsta Lowess-utjämning av USA: s arbetslöshetstendens) Enkel exponentiell utjämning Den grundläggande prognosekvationen för enkel exponentiell utjämning är ofta angiven som hatt alfa xt (1-alfa) hat t-text Vi förutser värdet av x vid tid t1 för att vara en viktad kombination av det observerade värdet vid tid t och det prognostiserade värdet vid tiden t. Även om metoden kallas en utjämningsmetod används den huvudsakligen för prognoser på kort sikt. Värdet av kallas utjämningskonstanten. Oavsett anledning är 0,2 ett populärt standardprogramval. Detta lägger en vikt på .2 på den senaste observationen och en vikt av 1,2, 8 på den senaste prognosen. Med ett relativt litet värde kommer utjämningen att bli relativt mer omfattande. Med ett relativt stort värde är utjämningen relativt mindre omfattande, eftersom mer vikt kommer att sättas på det observerade värdet. Det här är en enkel prognosmetod med ett steg framåtblickande som vid första anblicken inte verkar ha behov av en modell för data. Faktum är att denna metod motsvarar användningen av en ARIMA (0,1,1) modell utan konstant. Det optimala förfarandet är att passa en ARIMA (0,1,1) modell till det observerade datasetet och använda resultaten för att bestämma värdet på. Detta är optimalt i den meningen att det bäst ska skapas för de data som redan observerats. Även om målet är utjämning och ett steg framåt prognoser, motsvarar likvärdigheten till ARIMA (0,1,1) modellen en bra punkt. Vi bör inte blint tillämpa exponentiell utjämning eftersom den underliggande processen kanske inte är välmodellerad av en ARIMA (0,1,1). ARIMA (0,1,1) och exponentiell utjämningsekvivalens Överväg en ARIMA (0,1,1) med medelvärde 0 för de första skillnaderna, xt - x t-1: starta häftapparat amp xt theta1 wt amp amp xt theta1 (xt - som t) amp amp (1 theta1) xt-theta1hat tenderar. Om vi låter (1 1) och därmed - (1) 1, ser vi ekvivalensen till ekvation (1) ovan. Varför metoden kallas exponentiell utjämning Detta ger följande: starthatt amp amp alpha xt (1-alfa) alfa x (1-alfa) hatt amp amp alpha xt alfa (1-alfa) x (1-alfa) 2hat än Fortsätt på detta sätt genom successivt att ersätta det prognostiserade värdet på ekvations högra sida. Detta leder till: hatt alfa xt alfa (1-alfa) x alfa (1-alfa) 2 x prick alfa (1-alfa) jx prick alfa (1-alfa) x1 text ekvation 2 visar att det prognostiserade värdet är ett vägt genomsnitt av alla tidigare värden av serien, med exponentiellt förändrade vikter när vi flyttar tillbaka i serien. Optimal exponentiell utjämning i R I grund och botten passar vi bara en ARIMA (0,1,1) till data och bestämmer koefficienten. Vi kan undersöka passformen för den smidiga genom att jämföra de förutspådda värdena till den aktuella serien. Exponentiell utjämning tenderar att användas mer som ett prognosverktyg än en riktigt mjukare, så letade efter att se om vi har en bra passform. Exempel 3 n 100 månatliga observationer av logaritmen för ett oljeprisindex i USA. Dataserien är: En ARIMA (0,1,1) passning i R gav en MA (1) koefficient 0,3877. Således (11) 1,3877 och 1--0,3877. Exponential utjämning prognos ekvationen är hatt 1.3877xt - 0.3877hat t Vid tiden 100 är det observerade värdet av serien x 100 0.86601. Det förutspådda värdet för serien vid den tiden är sålunda prognosen för tid 101 är hatten 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 Följande är hur bra den mjukare passar serien. Det är en bra passform. Det är ett bra tecken på prognoser, det huvudsakliga syftet med detta är smidigare. Här är kommandon som används för att generera produktionen för det här exemplet: oilindex scan (oildata. dat) plot (oilindex, typ b, Main Log of Oil Index Series) expsmoothfit arima (oilindex, order c (0,1,1)) expsmoothfit för att se arima resultat förutsäger oilindex - expsmoothfitresiduals predicted values plot (oilindex, typeb, huvudexponentiell utjämning av log of oil index) linjer (förutsägda) 1.3877oilindex100-0.3877predicteds100 prognos för tid 101 Dubbel exponentiell utjämning Dubbel exponentiell utjämning kan användas när theres trend (antingen långsiktig eller kort sikt), men ingen säsongsmässighet. I grunden skapar metoden en prognos genom att kombinera exponentiellt jämnade uppskattningar av trenden (lutning av en rak linje) och nivån (i princip avlyssningen av en rak linje). Två olika vikter, eller utjämningsparametrar, används för att uppdatera dessa två komponenter vid varje tillfälle. Den släta nivån är mer eller mindre ekvivalent med en enkel exponentiell utjämning av datavärdena och den släta trenden är mer eller mindre lika med en enkel exponentiell utjämning av de första skillnaderna. Proceduren motsvarar montering av en ARIMA (0,2,2) modell, utan konstant kan den utföras med en ARIMA (0,2,2) passform. (1-B) 2x (1theta1B theta2B2) vikt. Navigering
Comments
Post a Comment