Sigblad implementering van seisoenale aanpassing en eksponensiële gladstryking Dit is maklik om seisoenale aanpassing voer en pas eksponensiële gladstryking modelle met behulp van Excel. Die skerm beelde en kaarte hieronder is geneem uit 'n sigblad wat is opgestel om multiplikatiewe seisoenale aanpassing en lineêre eksponensiële gladstryking op die volgende kwartaallikse verkope data van Buitenboord Marine illustreer: Om 'n afskrif van die sigbladlêer self te bekom, kliek hier. Die weergawe van lineêre eksponensiële gladstryking wat hier gebruik sal word vir doeleindes van demonstrasie is Brown8217s weergawe, bloot omdat dit geïmplementeer kan word met 'n enkele kolom van formules en daar is net een glad konstante te optimaliseer. Gewoonlik is dit beter om Holt8217s weergawe dat afsonderlike glad konstantes vir vlak en tendens het gebruik. Die vooruitskatting proses verloop soos volg: (i) die eerste keer die data is seisoenaal-aangepaste (ii) dan voorspellings gegenereer vir die seisoenaal-aangepaste data via lineêre eksponensiële gladstryking en (iii) Ten slotte het die seisoensaangesuiwerde voorspellings is quotreseasonalizedquot om voorspellings vir die oorspronklike reeks te verkry . Die aanpassingsproses seisoenale word in kolomme gedoen D deur G. Die eerste stap in seisoenale aanpassing is om te bereken 'n gesentreerde bewegende gemiddelde (hier opgevoer in kolom D). Dit kan gedoen word deur die gemiddelde van twee een-jaar-wye gemiddeldes wat geneutraliseer deur 'n tydperk relatief tot mekaar. ( 'N kombinasie van twee geneutraliseer gemiddeldes eerder as 'n enkele gemiddelde nodig vir sentrering doeleindes wanneer die aantal seisoene is selfs.) Die volgende stap is om die verhouding te bereken om bewegende gemiddelde --i. e. die oorspronklike data gedeel deur die bewegende gemiddelde in elke tydperk - wat hier uitgevoer word in kolom E. (Dit is ook die quottrend-cyclequot komponent van die patroon genoem, sover tendens en besigheid-siklus effekte kan oorweeg word om almal wat bly nadat gemiddeld meer as 'n geheel jaar se data. natuurlik, maand-tot-maand veranderinge wat nie as gevolg van seisoenale kan bepaal word deur baie ander faktore, maar die 12-maande-gemiddelde glad oor hulle 'n groot mate.) die na raming seisoenale indeks vir elke seisoen word bereken deur die eerste gemiddeld al die verhoudings vir daardie spesifieke seisoen, wat gedoen word in selle G3-G6 behulp van 'n AVERAGEIF formule. Die gemiddelde verhoudings word dan verklein sodat hulle som presies 100 keer die aantal periodes in 'n seisoen, of 400 in hierdie geval, wat gedoen word in selle H3-H6. Onder in kolom F, word VLOOKUP formules wat gebruik word om die toepaslike seisoenale indeks waarde in elke ry van die datatabel voeg, volgens die kwartaal van die jaar wat dit verteenwoordig. Die gesentreerde bewegende gemiddelde en die seisoensaangepaste data beland lyk soos hierdie: Let daarop dat die bewegende gemiddelde lyk tipies soos 'n gladder weergawe van die seisoensaangepaste reeks, en dit is korter aan beide kante. Nog 'n werkblad in dieselfde Excel lêer toon die toepassing van die lineêre eksponensiële gladstryking model om die seisoensaangepaste data, begin in kolom G. 'n Waarde vir die glad konstante (alfa) bo die voorspelling kolom ingeskryf (hier, in sel H9) en vir gerief dit die omvang naam quotAlpha. quot (die naam is opgedra deur die opdrag quotInsert / naam / Createquot.) die LES model is geïnisialiseer deur die oprigting van die eerste twee voorspellings gelyk aan die eerste werklike waarde van die seisoensaangepaste reeks toegeken. Die formule wat hier gebruik word vir die LES voorspelling is die enkel-vergelyking rekursiewe vorm van Brown8217s model: Hierdie formule is in die sel wat ooreenstem met die derde tydperk (hier, sel H15) aangegaan en kopieer af van daar af. Let daarop dat die LES voorspelling vir die huidige tydperk verwys na die twee voorafgaande waarnemings en die twee voorafgaande voorspelling foute, sowel as om die waarde van alfa. So, die voorspelling formule in ry 15 slegs verwys na data wat beskikbaar is in ry 14 en vroeër was. (Natuurlik, as ons wou eenvoudig in plaas van lineêre eksponensiële gladstryking te gebruik, kan ons die SES formule hier vervang in plaas. Ons kan ook gebruik Holt8217s eerder as Brown8217s LES model, wat nog twee kolomme van formules sou vereis dat die vlak en tendens bereken wat gebruik word in die vooruitsig.) die foute word bereken in die volgende kolom (hier, kolom J) deur die aftrekking van die voorspellings van die werklike waardes. Die wortel beteken kwadraat fout is bereken as die vierkantswortel van die variansie van die foute plus die vierkant van die gemiddelde. (Dit volg uit die wiskundige identiteit. MSE afwyking (foute) (gemiddeld (foute)) 2) By die berekening van die gemiddelde en variansie van die foute in hierdie formule, is die eerste twee periodes uitgesluit omdat die model vooruitskatting nie eintlik nie begin totdat die derde tydperk (ry 15 op die sigblad). Die optimale waarde van alfa kan óf gevind word deur die hand verander alfa tot die minimum RMSE is gevind, of anders kan jy die quotSolverquot gebruik om 'n presiese minimering. Die waarde van alfa dat die Solver gevind word hier (alpha0.471) getoon. Dit is gewoonlik 'n goeie idee om die foute van die model (in omskep eenhede) te plot en ook om te bereken en stip hul outokorrelasies by lags van tot een seisoen. Hier is 'n tydreeks plot van die (seisoenaangepaste) foute: Die fout outokorrelasies word bereken deur gebruik te maak van die funksie CORREL () om die korrelasies van die foute te bereken met hulself uitgestel word deur een of meer periodes - besonderhede word in die sigblad model . Hier is 'n plot van die outokorrelasies van die foute by die eerste vyf lags: Die outokorrelasies by lags 1 tot 3 is baie naby aan nul, maar die pen op lag 4 (wie se waarde is 0.35) is 'n bietjie lastig - dit dui daarop dat die seisoenale aanpassing proses het nie heeltemal suksesvol. Maar dit is eintlik net effens betekenisvol. 95 betekenis bands om te toets of outokorrelasies is aansienlik verskil van nul is min of meer plus-of-minus 2 / SQRT (N-k), waar n die steekproefgrootte en k is die lag. Hier N 38 en k wissel van 1 tot 5, so die vierkant-wortel-van-n-minus-k is ongeveer 6 vir almal, en vandaar die perke vir die toets van die statistiese betekenisvolheid van afwykings van nul is min of meer plus - of-minus 2/6, of 0.33. As jy die waarde van alfa wissel met die hand in hierdie Excel model, kan jy die effek op die tydreeks en outokorrelasie erwe van die foute in ag te neem, sowel as op die wortel-gemiddelde-kwadraat fout, wat onder sal wees geïllustreer. Aan die onderkant van die sigblad, is die voorspelling formule quotbootstrappedquot in die toekoms deur bloot vervang voorspellings vir werklike waardes by die punt waar die werklike data loop uit - d. w.z. waar quotthe futurequot begin. (Met ander woorde, in elke sel waar 'n toekomstige datawaarde sou plaasvind, 'n selverwysing is ingevoeg wat daarop dui dat die voorspelling gemaak vir daardie tydperk.) Al die ander formules is eenvoudig van bo af gekopieer: Let daarop dat die foute vir voorspellings van die toekoms is al bereken as nul. Dit beteken nie dat die werklike foute sal nul wees nie, maar eerder dit weerspieël bloot die feit dat vir doeleindes van voorspelling is ons veronderstelling dat die toekoms data die voorspellings sal gelyk gemiddeld. Die gevolglike LES voorspellings vir die seisoenaal-aangepaste data soos volg lyk: Met hierdie besondere waarde van Alpha, wat is optimaal vir een-periode-vooruit voorspellings, die geprojekteerde tendens is effens opwaarts, wat die plaaslike tendens wat oor die afgelope 2 jaar is waargeneem of so. Vir ander waardes van Alpha dalk 'n heel ander tendens projeksie verkry. Dit is gewoonlik 'n goeie idee om te sien wat gebeur met die langtermyn-tendens projeksie wanneer Alpha is uiteenlopend, omdat die waarde wat die beste vir 'n kort termyn vooruitskatting sal nie noodwendig die beste waarde vir die voorspelling van die meer verre toekoms wees. Byvoorbeeld, hier is die resultaat wat verkry word indien die waarde van alfa hand is ingestel op 0,25: Die geprojekteerde langtermyn-tendens is nou negatiewe eerder as positiewe Met 'n kleiner waarde van Alpha model plaas meer gewig op ouer data in sy skatting van die huidige vlak en tendens, en sy voorspellings langtermyn weerspieël die afwaartse neiging waargeneem oor die afgelope 5 jaar, eerder as die meer onlangse opwaartse neiging. Hierdie grafiek ook duidelik illustreer hoe die model met 'n kleiner waarde van Alpha is stadiger te reageer op quotturning pointsquot in die data en dus geneig is om 'n fout van die dieselfde teken maak vir baie tye in 'n ry. Die 1-stap-ahead voorspelling foute is groter gemiddeld as dié verkry voordat (RMSE van 34,4 eerder as 27.4) en sterk positief autocorrelated. Die lag-1 outokorrelasie van 0,56 oorskry grootliks die waarde van 0.33 hierbo bereken vir 'n statisties beduidende afwyking van nul. As 'n alternatief vir slingerspoed die waarde van alfa ten einde meer konserwatisme te voer in 'n lang termyn voorspellings, is 'n quottrend dampeningquot faktor soms by die model ten einde te maak die geprojekteerde tendens plat uit na 'n paar periodes. Die finale stap in die bou van die voorspelling model is om die LES voorspellings quotreasonalizequot deur hulle deur die toepaslike seisoenale indekse te vermenigvuldig. So, die reseasonalized voorspellings in kolom Ek is net die produk van die seisoenale indekse in kolom F en die seisoensaangepaste LES voorspellings in kolom H. Dit is relatief maklik om vertrouensintervalle bereken vir een-stap-ahead voorspellings gemaak deur hierdie model: eerste bereken die RMSE (wortel-gemiddelde-kwadraat fout, wat net die vierkantswortel van die MSE) en dan bereken 'n vertrouensinterval vir die seisoensaangepaste voorspel deur optelling en aftrekking twee keer die RMSE. (Oor die algemeen 'n 95 vertrouensinterval vir 'n een-tydperk lig voorspelling is min of meer gelyk aan die punt voorspelling plus-of-minus twee keer die geskatte standaardafwyking van die voorspelling foute, die aanvaarding van die fout verspreiding is ongeveer normale en die steekproefgrootte groot genoeg is, sê, 20 of meer. Hier is die RMSE eerder as die monster standaardafwyking van die foute is die beste raming van die standaard afwyking van toekomstige vooruitsig foute, want dit neem vooroordeel sowel toevallige variasies in ag.) die vertroue perke vir die seisoensaangepaste voorspelling is dan reseasonalized. saam met die voorspelling, deur hulle met die toepaslike seisoenale indekse te vermenigvuldig. In hierdie geval is die RMSE is gelyk aan 27.4 en die seisoensaangepaste voorspelling vir die eerste toekoms tydperk (Desember-93) is 273,2. sodat die seisoensaangepaste 95 vertrouensinterval is 273,2-227,4 218,4 te 273.2227.4 328,0. Vermenigvuldig hierdie perke deur Decembers seisoenale indeks van 68,61. Ons kry onderste en boonste vertroue grense van 149,8 en 225,0 rondom die Desember-93 punt voorspelling van 187,4. Vertroue perke vir voorspellings meer as een tydperk wat voorlê, sal oor die algemeen uit te brei as die voorspelling horison toeneem, as gevolg van onsekerheid oor die vlak en tendens asook die seisoenale faktore, maar dit is moeilik om hulle te bereken in die algemeen deur analitiese metodes. (Die geskikte manier om vertroue perke vir die LES voorspelling bereken is deur die gebruik van ARIMA teorie, maar die onsekerheid in die seisoenale indekse is 'n ander saak.) As jy 'n realistiese vertroue interval vir 'n voorspelling wil meer as een tydperk wat voorlê, met al die bronne van fout in ag, jou beste bet is om empiriese metodes gebruik: byvoorbeeld, 'n vertrouensinterval vir 'n 2-stap vorentoe voorspel verkry, jy kan 'n ander kolom skep op die sigblad om 'n 2-stap-ahead voorspelling bereken vir elke tydperk ( deur Opstarten die een-stap-ahead voorspelling). bereken dan die RMSE van die 2-stap-ahead voorspelling foute en gebruik dit as die basis vir 'n 2-stap-ahead vertroue interval. Moving gemiddelde A bewegende gemiddelde is 'n metode vir die glad tydreekse deur gemiddeld (met of sonder gewigte) 'n vaste aantal opeenvolgende terme. Die gemiddelde ldquomovesrdquo met verloop van tyd, in die sin dat elke datapunt van die reeks is agtermekaar in die gemiddelde, terwyl die oudste data punt in die span van die gemiddelde verwyder. Oor die algemeen, hoe langer die span van die gemiddelde, die gladder is die gevolg reeks. Bewegende gemiddeldes word gebruik om skommelinge glad in tydreekse of om tydreekse komponente, soos die tendens, die siklus, die seisoenale, identifiseer ens 'n bewegende gemiddelde vervang elke waarde van 'n tydreeks deur 'n (geweegde) gemiddeld van p voorafgaande waardes die gegewe waarde, en f volgende waardes van 'n reeks. As p f die bewegende gemiddelde word gesê dat centered. The bewegende gemiddelde is gesê simmetriese te wees indien dit gesentreer, en as vir elke k 1, 2, hellip. p f. die gewig van die k - ste voorafgaande waarde is gelyk aan die gewig van die k - ste volgende een. Die bewegende gemiddelde is nie gedefinieer vir die eerste p en die laaste f tydreekse waardes. Met die oog op die bewegende gemiddelde vir daardie waardes te bereken, moet die reeks word backcasted en voorspel. Bron: Taakmag op data en metadata aanbieding vir die OECD Korttermyn Ekonomiese Statistiek Werkgroep (STESWP), Parys, 2004 Konsep van stasionariteit Hipoteties, die huidige waarneming kan afhang van al die afgelope waarnemings. Sulke outoregressiewe model is onmoontlik om te skat as dit te veel parameters bevat. Maar as x t as 'n lineêre funksie van alle afgelope lags, dit bewys kan word dat outoregressiewe model is soortgelyk aan x t as 'n lineêre funksie van slegs 'n paar afgelope skokke. In 'n bewegende gemiddelde model die huidige waarde van x t word beskryf as 'n lineêre funksie van konkurrente skok (fout) en verlede skokke (foute). Inleiding Seisoene aanpassing resultate stabiel beskou as hulle relatief bestand teen kansellasie of byvoeging datapunte aan beide kante van die reeks. Stabiliteit is een van die belangrikste eienskappe van die SA uitkomste. As aanbring of vertraag paar waarnemings die seisoensaangepaste reeks of beraamde tendens-siklus aansienlik verander, sou die interpretasie van die seisoensaangepaste reeks onbetroubaar wees. Wat is die SI verhoudings Die SI verhoudings is waardes van seisoenale-onreëlmatige (SI) komponent, bereken as die verhouding van die oorspronklike reeks om die beraamde tendens. Met ander woorde, SI verhoudings is skattings van die detrended reeks. SI kaarte is handig vir ondersoek of kort termyn bewegings word veroorsaak deur seisoenale of onreëlmatige skommelinge. Hierdie grafiek is 'n diagnostiese hulpmiddel gebruik vir die ontleding van die seisoenale gedrag, vakansie patrone, uitskieters beweeg en die identifisering van die seisoenale breek in die reeks. Seisoenale aanpassing sagteware vertoon tipies die volgende inligting oor die RegARIMA model: Model keuringskriteria (inligting kriteria) is maatreëls van die relatiewe passingstoetse van 'n statistiese model. In seisoenale aanpassing programme wat hulle gebruik vir die kies van die optimale volgorde van die RegARMIA model. Vir die gegewe inligting kriteria die voorkeur model is die een met die minimum inligting kriteria waarde. Inleiding In iterasie B, (Tabel B7), iterasie C (Tabel C7) en iterasie D (Table D7 en Table D12) die Trend-siklus komponent is 'n uittreksel uit 'n skatting van die seisoensaangepaste reeks met behulp van die Henderson bewegende gemiddeldes. Die lengte van die Henderson filter word outomaties gekies deur X-12-ARIMA in 'n twee-stap procedure. Moving gemiddeldes faseverskuiwing is die verskil in die opsporing van draaipunte tussen oorspronklike en stryk data. Hierdie effek is 'n nadeel as dit veroorsaak 'n vertraging in die opsporing van die draaipunte van die tydreeks, veral in die mees onlangse tydperk. Die simmetriese, gesentreer bewegende gemiddeldes is bestand teen hierdie effek. Maar aan die einde (en die begin) van tydreekse simmetriese tydreeks kan nie gebruik word nie. Met die oog op die stryk waardes in die beide kante van die tydreeks die asimmetriese filter gebruik word bereken, maar hulle veroorsaak dat die fase krag. Tags / Keywords: Jy kan kliek en sleep in die plot area in U zoom kan muis oor datapunte om die werklike waarde wat weergegee As daar 'n legende boks te sien, kliek op die naam reeks om weg te steek / toon hulle Introduction bewegende gemiddeldes is rekenkundige gemiddeldes van toepassing op opeenvolgende tyd strek van vaste lengte van die reeks. Wanneer dit toegepas word om die oorspronklike tydreekse produseer hulle 'n reeks van gemiddeld waardes. Die algemene formule vir bewegende gemiddelde M van koëffisiënte is: die bewegende gemiddeldes koëffisiënte is gewigte genoem. Die hoeveelheid p f 1 is die bewegende gemiddelde bestel. Die bewegende gemiddelde genoem gesentreer as die aantal waarnemings in die verlede is gelyk aan die aantal waarneming in die toekoms (bv as p gelyk is aan f). Bewegende gemiddeldes te vervang die oorspronklike tydreekse deur geweegde gemiddeldes van die huidige waardes, p Waarnemings voor die huidige waarneming en f Waarnemings na aanleiding van die huidige waarneming. Hulle word gebruik om die oorspronklike tydreekse gladder. Voorbeeld Die tabel toon die aantal passasiers gereis deur die lug deur Finland berig in 2001. Dieselfde data word op die grafiek: Tipe bewegende gemiddeldes op grond van gewig patrone, bewegende gemiddeldes kan wees: Simmetriese die gewig van patroon gebruik word vir die berekening van bewegende gemiddeldes is simmetries om die teiken data punt. Deur middel van simmetriese bewegende gemiddeldes is dit nie moontlik om die reëlmatige waardes vir die eerste p en laaste p waarnemings te verkry (vir simmetriese bewegende gemiddeldes PF). Voorbeeld Asimmetriese die gewig van patroon gebruik word vir die berekening van bewegende gemiddeldes is nie simmetries om die teiken data punt Voorbeeld bewegende gemiddeldes kan ook geklassifiseer word volgens hul bydrae tot die finale waarde as: Eenvoudige bewegende gemiddeldes, naamlik die bewegende gemiddeldes waarvoor alle gewigte is dieselfde in geval van 'n eenvoudige bewegende gemiddeldes al die waarnemings ewe bydra tot die finale waarde. Nodeloos om te sê, al eenvoudig bewegende gemiddeldes is simmetriese. Formeel, vir simmetriese bewegende gemiddelde van orde P 2p 1 al die gewigte is gelyk aan 1 / P. Voorbeeld Die prentjie hieronder vergelyk die mate van gladstryking bereik deur die toepassing van 3 termyn en 7 termyn eenvoudige bewegende gemiddeldes. Die uiterste Waarnemings (bv April 2010 of Junie 2011) het 'n laer impak op die langer bewegende gemiddelde as die korter een. Nie eenvoudige bewegende gemiddeldes, naamlik die bewegende gemiddeldes waarvoor alle gewigte is nie dieselfde nie. Die spesiale gevalle van nie-eenvoudige bewegende gemiddeldes is: Saamgestelde bewegende gemiddeldes, wat verkry word deur die saamstel van 'n eenvoudige bewegende gemiddelde van orde P, wie se koëffisiënte is almal gelyk aan 1 P en 'n eenvoudige bewegende gemiddelde van orde Q, wie se koëffisiënte is almal gelyk tot 1 Vraag Asimmetriese bewegende gemiddeldes. Eienskappe van bewegende gemiddeldes Die bewegende gemiddeldes gladder die tydreeks. Wanneer dit toegepas word om 'n tydreeks, verminder hulle die amplitude van die waargeneem skommelinge en op te tree as 'n filter wat onreëlmatige bewegings verwyder daaruit. Die bewegende gemiddeldes met toepaslike gewig patroon kan gebruik word om siklusse van 'n sekere lengte in die tyd reeks uit te skakel. In X-12-ARIMA seisoensaanpassing metode verskillende soorte bewegende gemiddeldes word gebruik om die tendens-siklus en seisoenale komponent skat. As die som van die koëffisiënte gelyk aan 1 is, dan is die bewegende gemiddelde behoud van die tendens. Bewegende gemiddeldes het twee belangrike gebreke: Hulle is nie sterk en kan diep geraak deur uitskieters Die smoothing aan die einde van die reeks kan nie gedoen word nie, maar met asimmetriese bewegende gemiddeldes watter fase verskuiwings en vertragings te voer in die opsporing van draaipunte in die X11 metode , simmetriese bewegende gemiddeldes speel 'n belangrike rol as hulle nie 'n faseverskuiwing in die stryk reeks bekend te stel. Maar, om te verhoed dat die verlies van inligting op die reeks eindig, is dit óf aangevul deur ad hoc asimmetriese bewegende gemiddeldes of toegepas op die reeks voltooi deur voorspellings. Reg boxTime Series Analysis: Die Proses van seisoensaanpassings Wat is die twee belangrikste filosofieë van seisoenale aanpassing Wat is 'n filter Wat is die eindpunt probleem Hoe weet ons besluit watter filter gebruik Wat is 'n aanwins funksie Wat is 'n faseverskuiwing Wat is Henderson bewegende gemiddeldes Hoe hanteer ons die eindpunt probleem Wat is seisoenale bewegende gemiddeldes Hoekom is tendens skattings hersiene Hoeveel data word benodig om aanvaarbare seisoensaangepaste skattings verkry gevorderde Hoe die twee seisoenale aanpassing filosofieë vergelyk wat is die twee belangrikste filosofieë van seisoensaanpassings die twee belangrikste filosofieë vir seisoenale aanpassing is die model gebaseerde metode en die filter gebaseer metode. Filter gebaseerde metodes Hierdie metode is van toepassing 'n stel van vaste filters (bewegende gemiddeldes) om die tydreeks ontbind in 'n tendens, seisoenale en onreëlmatige komponent. Die onderliggende idee is dat ekonomiese data bestaan uit 'n reeks van siklusse, insluitend sakesiklusse (die tendens), seisoenale siklusse (seisoenaliteit) en geraas (die onreëlmatige komponent). 'N filter wese verwyder of verminder die krag van sekere siklusse van die insette data. Om 'n seisoensaangepaste reeks van data maandelikse ingesamel, gebeure wat plaasvind elke 12, 6, 4, 3, 2.4 en 2 maande moet verwyder word te produseer. Hierdie stem ooreen met seisoenale frekwensies van 1, 2, 3, 4, 5 en 6 siklusse per jaar. Hoe langer nie-seisoenale siklusse word beskou as deel van die tendens en die korter nie-seisoenale siklusse vorm die onreëlmatige wees. Maar die grens tussen die tendens en onreëlmatige siklusse kan wissel met die lengte van die filter wat gebruik word om die tendens te kry. In ABS seisoenale aanpassing, siklusse wat aansienlik bydra tot die tendens is tipies groter as ongeveer 8 maande vir maandelikse reeks en 4/4 vir kwartaallikse reeks. Die tendens, seisoenale en onreëlmatige komponente nie eksplisiete individuele modelle nodig. Die onreëlmatige komponent word gedefinieer as wat oorbly na die tendens en seisoenale komponente is verwyder deur filters. Irregulars nie wit geraas eienskappe vertoon. Filter gebaseerde metodes word dikwels bekend as X11 styl metodes. Dit sluit in X11 (ontwikkel deur Amerikaanse Sensus Buro), X11ARIMA (ontwikkel deur Statistiek Kanada), X12ARIMA (ontwikkel deur Amerikaanse Sensus Buro), STL, SABL en SEASABS (die pakket wat gebruik word deur die ABS). Computational verskille tussen verskillende metodes in X11 familie is hoofsaaklik die gevolg van verskillende tegnieke wat gebruik word in die uithoeke van die tydreeks. Byvoorbeeld, sommige metodes gebruik asimmetriese filters aan die einde, terwyl ander metodes ekstrapoleer die tydreeks en simmetriese filters toe te pas om die uitgebreide reeks. Model gebaseerde metodes Hierdie benadering vereis dat die tendens, seisoenale en onreëlmatige komponente van die tydreeks apart geskoei. Dit veronderstel die onreëlmatige komponent is 8220white noise8221 - dit is al siklus lengtes is ewe verteenwoordig. Die onreëlmatig het 'n zero gemiddelde en 'n konstante stryd. Die seisoenale komponent het sy eie geraas element. Twee wyd gebruik sagteware pakkette wat model gebaseerde metodes kan toepas stempel en SITPLEKKE / TRAMO (ontwikkel deur die Bank van Spanje. Groot computational verskille tussen die verskillende model gebaseerde metodes is gewoonlik as gevolg van spesifikasies model. In sommige gevalle is die komponente direk geskoei. ander metodes vereis dat die oorspronklike tydreekse eers geskoei, en die komponent modelle ontbinde van daardie. vir 'n vergelyking van die twee filosofieë op 'n meer gevorderde vlak, sien Hoe die twee seisoenale aanpassing filosofieë vergelyk wat is 'n filter filters gebruik kan word 'n tydreeks in 'n tendens, seisoenale en onreëlmatige komponent ontbind. bewegende gemiddeldes is 'n soort van filter wat agtereenvolgens gemiddeld 'n verskuiwing tydsduur van data ten einde 'n reëlmatige skatting van 'n tydreeks te produseer. dit stryk reeks oorweeg kan word om is afgelei deur die loop insette reeks deur 'n proses wat h filters uit sekere siklusse. Gevolglik is 'n bewegende gemiddelde is dikwels na verwys as 'n filter. Die basiese proses behels die definisie van 'n stel gewigte van lengte m 1 m 2 1 as: Let wel: 'n simmetriese stel gewigte het m 1 m 2 en WJW - J 'n gefilterde waarde op tydstip t kan bereken word deur waar Y t beskryf die waarde van die tydreeks op tydstip t. Byvoorbeeld, kyk na die volgende reekse: Die gebruik van 'n eenvoudige 3 termyn simmetriese filter (bv m 1 m 2 1 en al gewigte is 1/3), die eerste kwartaal van die reëlmatige reeks word verkry deur die toepassing van die gewigte aan die eerste drie kwartale van die oorspronklike reeks: die tweede stryk waarde is vervaardig deur die toepassing van die gewigte aan die tweede, derde en vierde kwartale in die oorspronklike reeks: Wat is die eindpunt PROBLEEM Heroorweeg die reeks: Hierdie reeks bevat 8 terme. Maar die stryk reeks verkry deur die toepassing van simmetriese filter om die oorspronklike data bevat slegs 6 terme: Dit is omdat daar nie genoeg data aan die einde van die reeks 'n simmetriese filter toe te pas. Die eerste kwartaal van die reëlmatige reeks is 'n geweegde gemiddelde van drie terme, gesentreer op die tweede kwartaal van die oorspronklike reeks. 'N Geweegde gemiddelde gesentreer op die eerste kwartaal van die oorspronklike reeks kan nie verkry word as data voor hierdie punt is nie beskikbaar nie. Net so is dit nie moontlik om 'n geweegde gemiddelde gesentreer op die laaste kwartaal van die reeks te bereken, want daar is geen data na hierdie punt. Om hierdie rede, kan simmetriese filters nie gebruik word op beide kante van 'n reeks. Dit staan bekend as die eindpunt probleem. Tydreeks ontleders kan asimmetriese filters gebruik om reëlmatige skattings in hierdie streke te produseer. In hierdie geval, is die reëlmatige waarde bereken 8216off centre8217, met die gemiddelde bepaal word met behulp van meer data van die een kant van die punt as die ander volgens wat beskikbaar is. Alternatiewelik kan modelleringstegnieke gebruik word om die tydreeks te ekstrapoleer en dan simmetriese filters toe te pas om die uitgebreide reeks. HOE ONS besluit watter FILTER om te gebruik Die tydreekse ontleder kies 'n geskikte filter op grond van sy eienskappe, soos wat siklusse die filter verwyder wanneer dit toegepas word. Die eienskappe van 'n filter ondersoek kan word met behulp van 'n wins funksie. Kry funksies word gebruik om die effek van 'n filter op 'n gegewe frekwensie op die amplitude van 'n siklus vir 'n bepaalde tyd reeks te ondersoek. Vir meer besonderhede oor die wiskunde wat verband hou met wins funksies, kan jy die aflaai van die Tyd Reeks kursusnotas, 'n inleidende gids tot tydreeksanalise uitgegee deur die Tydreeksanalise Afdeling van die ABS (verwys na afdeling 4.4). Die volgende diagram is die wins funksie vir die simmetriese 3 termyn filter ons vroeër bestudeer. Figuur 1: Kry funksie vir Simmetriese 3 Kwartaal Filter Die horisontale as stel die lengte van 'n inset-siklus met betrekking tot die tydperk tussen waarneming punte in die oorspronklike tyd reeks. So 'n inset-siklus van lengte 2 voltooi is in 2 periodes, wat 2 maande vir 'n maandelikse reeks, en 2/4 vir 'n kwartaallikse reeks verteenwoordig. Die vertikale as dui die amplitude van die uitset-siklus met betrekking tot 'n inset-siklus. Dit filter verminder die krag van 3 tydperk siklusse aan nul. Dit wil sê, dit heeltemal verwyder siklusse van ongeveer hierdie lengte. Dit beteken dat vir 'n tydreeks waar data maandelikse versamel, enige seisoenale effekte wat kwartaalliks voorkom sal uitgeskakel word deur die toepassing van hierdie filter om die oorspronklike reeks. A faseverskuiwing is die tyd verskuiwing tussen die gefilterde siklus en die ongefiltreerde siklus. 'N Positiewe faseverskuiwing beteken dat die gefilterde siklus agtertoe geskuif en 'n negatiewe fase skuif dit verskuif voorspelers in die tyd. Fase verskuiwing vind plaas wanneer tydsberekening van draaipunte is verdraai, byvoorbeeld wanneer die bewegende gemiddelde is geplaas off-sentrum deur die asimmetriese filters. Dit is, sal hulle óf vroeër of later in die gefilterde reeks, as in die oorspronklike voorkom. Vreemd lengte simmetriese bewegende gemiddeldes (soos gebruik deur die ABS), waar die uitslag sentraal geplaas word, veroorsaak nie tyd faseverskuiwing. Dit is belangrik vir filters wat gebruik word om die tendens om die tyd fase behou lei, en vandaar die tydsberekening van enige draaipunte. Syfers 2 en 3 toon die uitwerking van die toepassing van 'n 2x12 simmetriese bewegende gemiddelde wat off-sentrum. Die deurlopende kurwes verteenwoordig die aanvanklike siklusse en die gebreekte kurwes verteenwoordig die uitset siklusse na die toepassing van die bewegende gemiddelde filter. Figuur 2: 24 maande siklus, Fase -5,5 maande Amplitude 63 Figuur 3: 8 maande siklus, Fase -1,5 maande Amplitude 22 WAT IS HENDERSON bewegende gemiddeldes Henderson bewegende gemiddeldes is filters wat deur Robert Henderson is afgelei in 1916 vir gebruik in aktuariële programme. Hulle is tendens filters, wat algemeen gebruik word in tydreeksanalise om seisoenaal aangepaste beramings glad ten einde 'n tendens beraming te genereer. Hulle word gebruik in die voorkeur aan eenvoudiger bewegende gemiddeldes, want hulle polinome van kan reproduseer tot graad 3 en sodoende vas te lê tendens draaipunte. Die ABS gebruik Henderson bewegende gemiddeldes te tendens skat produseer van 'n seisoensaangepaste reeks. Die tendens skattings gepubliseer deur die ABS is tipies afgelei met behulp van 'n 13 termyn Henderson filter vir maandelikse reeks, en 'n 7 termyn Henderson filter vir kwartaallikse reeks. Henderson filters kan óf simmetriese of asimmetriese wees. Simmetriese bewegende gemiddeldes toegepas kan word op punte wat voldoende is ver weg van die kante van 'n tydreeks. In hierdie geval, is die reëlmatige waarde vir 'n gegewe punt in die tyd reeks bereken vanaf 'n gelyke aantal waardes aan weerskante van die data punt. Om die gewigte te kry, is 'n kompromie getref tussen die twee eienskappe algemeen verwag van 'n tendens reeks. Dit is dat die tendens sal in staat wees om 'n wye verskeidenheid van kurwes verteenwoordig en dat dit moet ook so glad as moontlik te wees. Vir die wiskundige afleiding van die gewigte, verwys na afdeling 5.3 van die Tyd Reeks kursusnotas. wat kan vry wees van die ABS webwerf afgelaai word. Die gewig patrone vir 'n verskeidenheid van simmetriese Henderson bewegende gemiddeldes word in die volgende tabel: Simmetriese Gewig Patroon vir Henderson bewegende gemiddelde In die algemeen, hoe langer die tendens filter, die gladder die gevolglike tendens, soos blyk uit 'n vergelyking van die wins funksies hierbo. A 5 termyn Henderson verminder siklusse van ongeveer 2.4 tydperke of minder deur ten minste 80, terwyl 'n 23 termyn Henderson verminder siklusse van ongeveer 8 periodes of minder deur ten minste 90. In werklikheid 'n 23 termyn Henderson filter heeltemal verwyder siklusse van minder as 4 periodes . Henderson bewegende gemiddeldes ook demp die seisoenale siklusse in wisselende grade. Maar die wins funksies in figure 4-8 toon dat die jaarlikse siklusse in maandelikse en kwartaallikse reeks nie beduidend genoeg om te regverdig toepassing van 'n Henderson filter direk na die oorspronklike raming is gedemp. Dit is die rede waarom hulle net toegepas word om 'n seisoensaangepaste reeks, waar die kalender verwante effekte is reeds verwyder word met spesifiek ontwerp filters. Figuur 9 toon die glad gevolge van die toepassing van 'n Henderson filter om 'n reeks: Figuur 9: 23-Term Henderson Filter - waarde van nie-residensiële gebou goedkeurings HOE hanteer ons die eindpunt probleem Die simmetriese Henderson filter kan slegs toegepas word op gebiede data wat voldoende is ver van die einde van die reeks. Byvoorbeeld die standaard 13 termyn Henderson kan slegs toegepas word op maandelikse data wat ten minste 6 waarnemings van die begin of einde van die data. Dit is omdat die filter gladheid die reeks deur die neem van 'n geweegde gemiddelde van die 6 terme aan weerskante van die data punt asook die punt self. As ons probeer om dit toe te pas op 'n punt wat minder as 6 waarnemings van die einde van die data, dan is daar nie genoeg inligting beskikbaar op die een kant van die punt om die gemiddelde te bereken. Om tendens skattings van hierdie datapunte verskaf, is 'n aangepaste of asimmetriese bewegende gemiddelde gebruik. Berekening van asimmetriese Henderson filters kan gegenereer word deur 'n aantal verskillende metodes wat soortgelyk, maar nie identies resultate te lewer. Die vier belangrikste metodes is die Musgrave metode, die Minimalisering van die gemiddelde-kwadraat Hersiening metode, die beste lineêre onsydige Beramings (Blue) metode, en die Kenny en Durbin metode. Shiskin et. al (1967) afgelei van die oorspronklike asimmetriese gewigte vir die Henderson bewegende gemiddelde wat gebruik word in die X11 pakkette. Vir meer inligting oor die herkoms van die asimmetriese gewigte, sien afdeling 5.3 van die Tyd Reeks kursusnotas. Oorweeg 'n tydreeks waar die laaste waargenome data punt kom ten tye N. Dan is 'n 13 term simmetriese Henderson filter kan nie toegepas word op data punte wat gemeet te eniger tyd na en met tyd N-5. Vir al hierdie punte, moet 'n asimmetriese stel gewigte gebruik word. Die volgende tabel gee die asimmetriese gewig patroon vir 'n standaard 13 termyn Henderson bewegende gemiddelde. Die asimmetriese 13 termyn Henderson filters nie verwyder of demp dieselfde siklusse as die simmetriese 13 termyn Henderson filter. In die feit dat die asimmetriese gewig patroon gebruik om die tendens op die laaste waarneming skat versterk die krag van 12 tydperk siklusse. Ook asimmetriese filters produseer 'n geruime tyd faseverskuiwing. WAT is seisoenaal bewegende gemiddeldes Byna al die ondersoek deur die ABS data het seisoenale kenmerke. Sedert die Henderson bewegende gemiddeldes gebruik om die tendens reeks skat nie seisoenaliteit nie uit te skakel, moet die data seisoenaal aangepas eerste gebruik van seisoenale filters. 'N seisoenale filter het gewigte wat toegepas word om dieselfde tydperk met verloop van tyd. 'N Voorbeeld van die gewig patroon vir 'n seisoenale filter sal wees: (1/3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1/3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1/3) waar, byvoorbeeld, 'n gewig van 'n derde is van toepassing op drie agtereenvolgende Januarys. Binne X11, 'n verskeidenheid van seisoenale filters is beskikbaar om van te kies. Dit is 'n geweegde 3 termyn bewegende gemiddelde (MA) S 3x1. geweegde 5 termyn ma S 3x3. geweegde 7 termyn ma S 3x5. en 'n geweegde 11-termyn ma S 3x9. Die gewig struktuur van geweegde bewegende gemiddeldes van die vorm, S nxm. is dat 'n eenvoudige gemiddelde van m terme bereken, en dan 'n bewegende gemiddelde van N van hierdie gemiddeldes bepaal. Dit beteken dat nm-1 terme word gebruik om elke laaste stryk waarde te bereken. Byvoorbeeld, 'n 11-termyn S 3x9 bereken. 'n gewig van 1/9 toegepas met dieselfde tydperk in 9 agtereenvolgende jaar. Dan is 'n eenvoudige 3 termyn bewegende gemiddelde word oor die gemiddelde waardes: Dit gee 'n finale gewig patroon van (1/27, 2/27, 09/01, 09/01, 09/01, 09/01, 09/01, 09/01, 09/01, 27/02, 27/01). Die wins funksie vir 'n 11 termyn seisoenale filter, S 3x9. lyk: Figure 10: Kry funksie vir 11 term (e 3x9) Seisoene Filter Toepassing van 'n seisoenale filter om data sal 'n skatting van die seisoen komponent van die tydreeks te genereer, want dit behou die krag van seisoenale harmonieke en smoor siklusse van nie - seisoenale lengtes. Asimmetriese seisoenale filters word gebruik aan die einde van die reeks. Die asimmetriese gewigte vir elk van die seisoenale filters gebruik in X11 kan gevind word in artikel 5.4 van die Tyd Reeks kursusnotas. WAAROM IS TREND RAMINGS HERSIENE Teen die huidige einde van 'n tydreeks, is dit nie moontlik om simmetriese filters gebruik om die tendens te skat as gevolg van die eindpunt probleem. In plaas daarvan, is asimmetriese filters wat gebruik word om voorlopige tendens skat produseer. Maar, soos meer data beskikbaar raak, is dit moontlik om die tendens met behulp van simmetriese filters herbereken en die verbetering van die aanvanklike ramings. Dit staan bekend as 'n tendens hersiening. Hoeveel data nodig om aanvaarbare SEISOENSAANGEPASTE RAMINGS verwerf indien 'n tydreeks uitstallings relatief stabiel seisoenaliteit en nie oorheers word deur die onreëlmatige komponent, kan dan 5 jaar van data word beskou as 'n aanvaarbare lengte te seisoensaangepaste skattings trek uit. Vir 'n reeks wat besonder sterk en stabiele seisoenaliteit toon, kan 'n ru-aanpassing word gemaak met 3 jaar van data. Dit is oor die algemeen beter om ten minste 7 jaar van data vir 'n normale tydreekse het, om seisoenale patrone, handel dag en beweeg vakansie effekte, tendens en seisoenale breek, asook uitskieters presies te identifiseer. ADVANCED Hoe verskil die TWEE seisoensaanpassings filosofieë VERGELYK Model-gebaseerde benaderings voorsiening te maak vir die stogastiese eienskappe (willekeur) van die reeks onder ontleding, in die sin dat hulle op maat van die filter gewigte gebaseer op die aard van die reeks. Die model8217s vermoë om akkuraat te beskryf die gedrag van die reeks geëvalueer kan word, en statistiese afleidings vir die skattings is beskikbaar gebaseer op die aanname dat die onreëlmatige komponent is wit geraas. Filter gebaseerde metodes is minder afhanklik van die stogastiese eienskappe van die tydreeks. Dit is die tyd reeks analyst8217s verantwoordelikheid om die mees geskikte filter van 'n beperkte versameling kies vir 'n spesifieke reeks. Dit is nie moontlik om streng kontrole uit te voer op die geskiktheid van die geïmpliseer model en presiese mate presisie en statistiese inferensie is nie beskikbaar nie. Daarom kan 'n vertrouensinterval nie gebou word rondom die skatting. Die volgende diagramme vergelyk die teenwoordigheid van elk van die model komponente by die seisoenale frekwensies vir die twee seisoenale aanpassing filosofieë. Die x-as is die tydperk lengte van die siklus en die y-as verteenwoordig die sterkte van die siklusse wat elke komponent bestaan uit: Figuur 11: Vergelyking van die twee seisoenale aanpassing filosofieë Filter gebaseerde metodes aanvaar dat die elke komponent bestaan slegs 'n sekere siklus lengtes. Hoe langer siklusse vorm die tendens, die seisoenale komponent is teenwoordig by seisoenale frekwensies en die onreëlmatige komponent word gedefinieer as siklusse van enige ander lengte. Onder 'n model wat gebaseer is filosofie, die neiging, seisoenale en onreëlmatige komponent teenwoordig is glad siklus lengtes. Die onreëlmatige komponent is van konstante krag, die seisoenale komponent pieke op seisoenale frekwensies en die tendens komponent is die sterkste in die langer siklusse. Hierdie bladsy die eerste keer gepubliseer 14 November 2005, laas 25 Julie 2008Spreadsheet implementering van seisoenale aanpassing en eksponensiële gladstryking Dit is maklik om seisoenale aanpassing voer en pas eksponensiële gladstryking modelle met behulp van 'n sigbladprogram soos Excel. Die skerm beelde en kaarte hieronder is geneem uit 'n sigblad wat is opgestel om multiplikatiewe seisoenale aanpassing en lineêre eksponensiële gladstryking illustreer op die Buitenboord Marine data van jou handboek. Om 'n afskrif van die sigbladlêer self te bekom, kliek hier. Die vooruitskatting proses verloop soos volg: (i) die eerste keer die data is seisoenaal-aangepaste (ii) dan voorspellings gegenereer vir die seisoenaal-aangepaste data via lineêre eksponensiële gladstryking en (iii) Ten slotte het die seisoensaangesuiwerde voorspellings is reseasonalized om voorspellings vir die oorspronklike reeks te verkry . Die aanpassingsproses seisoenale is in die eerste ses kolomme gedra. Die eerste stap in seisoenale aanpassing is om 'n gesentreerde bewegende gemiddelde (hier opgevoer in kolom C) te bereken. Dit kan gedoen word deur eenvoudig die gemiddelde van twee een-jaar-wye gemiddeldes wat geneutraliseer deur 'n tydperk relatief tot mekaar. Die volgende stap is om die verhouding te bereken om bewegende gemiddelde --i. e. die oorspronklike data gedeel deur die bewegende gemiddelde in elke tydperk - wat hier uitgevoer word in kolom D. Die geskatte seisoenale indeks vir elke seisoen word bereken deur die eerste gemiddeld al die verhoudings vir daardie spesifieke seisoen, en dan renormalizing die verhoudings indien nodig, sodat hulle vat om presies 100 keer die aantal periodes in 'n seisoen, of 400 in hierdie geval. (Dit word gedoen in die eerste paar rye kolomme E en F. Daar is meer elegante maniere om die verhoudings gemiddeld, maar omdat dit in hierdie geval die aantal rye is klein, ek het net met die hand getik die ry getalle vir al die Junie verhoudings binne die GEMIDDELDE () formule in sel D10, en dan het ek kopieer hierdie formule in die selle D11-D13 dit is nie moeilik om te tel deur 4s -. of deur 12s as jou data is maandeliks - totdat jy die onderkant van die datastel bereik. Let daarop dat jy nie die seisoenale indeks formule in AL die ander selle in dieselfde kolom kopieer - jy moet net herhaal dit genoeg keer na die seisoenale indeks keer bereken vir elke seisoen in die jaar wat op daardie, in die res van die selle in die. kolom, jy selverwysings voeg verwys na die seisoenale indeks gebruik word in dieselfde seisoen in die vorige jaar.) die seisoensaangepaste data word verkry deur die oorspronklike data deur die kolom van seisoenale indekse (hier, word deur kolom B by kolom E) . Die gesentreerde bewegende gemiddelde en die seisoensaangepaste data beland lyk soos hierdie: Let daarop dat die bewegende gemiddelde lyk tipies soos 'n reëlmatige weergawe van die seisoensaangepaste reeks. Dieselfde sigblad toon ook die toepassing van die lineêre eksponensiële gladstryking model om die seisoensaangepaste data, begin in kolom G. 'n Waarde vir die glad konstante (alfa) bo die voorspelling kolom ingeskryf (hier, in sel G9) en vir die gerief dit is die reeks naam Alpha opgedra. (Die naam is opgedra deur die Insert / Naam / Skep opdrag.) Die LES model is geïnisialiseer deur die oprigting van die eerste twee voorspellings gelyk aan die eerste werklike waarde van die seisoensaangepaste reeks. Die formule wat hier gebruik word vir die LES voorspelling is die rekursiewe vorm van die voorspelling vergelyking, naamlik in die sel wat ooreenstem met die derde tydperk (hier, sel G15) Hierdie formule is ingevoer en af van daar af gekopieer. Let daarop dat die LES voorspelling vir die huidige tydperk verwys na die twee voorafgaande waarnemings en die twee voorafgaande voorspelling foute, sowel as om die waarde van alfa. So, die voorspelling formule in ry 15 slegs verwys na data wat beskikbaar is in ry 14 en vroeër was. (Natuurlik, as ons wou eenvoudig in plaas van lineêre eksponensiële gladstryking te gebruik, kan ons die SES formule plaasvervanger hier plaas.) Die foute is in die volgende kolom (hier, kolom H) bereken deur die aftrekking van die voorspellings van die werklike waardes. Die wortel beteken kwadraat fout is bereken as die vierkantswortel van die variansie van die foute plus die vierkant van die gemiddelde. (Dit volg uit die wiskundige identiteit. MSE afwyking (foute) (gemiddeld (foute)) 2) By die berekening van die gemiddelde en variansie van die foute in hierdie formule, is die eerste twee periodes uitgesluit omdat die model vooruitskatting nie eintlik nie begin totdat die derde tydperk (ry 15 op die sigblad). Die optimale waarde van alfa kan óf gevind word deur die hand verander alfa tot die minimum RMSE is gevind, of anders kan jy die Solver gebruik om 'n presiese minimering. Die waarde van alfa dat die Solver gevind word hier (alpha0.471154) getoon. Dit is gewoonlik 'n goeie idee om die foute van die model (in omskep eenhede) te plot en ook om te bereken en stip hul outokorrelasies by lags tot een seisoen. Hier is 'n tydreeks plot van die (seisoenaangepaste) foute: Die fout outokorrelasies word bereken deur gebruik te maak van die funksie CORREL () om die korrelasies van die foute te bereken met hulself uitgestel word deur een of meer periodes - besonderhede word in die sigblad model . Hier is 'n plot van die outokorrelasies van die foute by die eerste vyf lags: Die pen op lag 4 is 'n bietjie lastig - dit dui daarop dat die aanpassing proses seisoenale nie heeltemal suksesvol was. Maar dit is eintlik net effens betekenisvol. Die 95 beduidende beperkings vir outokorrelasies is min of meer plus-of-minus-2-oor-die-vierkante-wortel-van-n, waar n die steekproefgrootte. Hier is die steekproefgrootte vir die outokorrelasies wissel 34-38 afhangende van die lag, so die vierkant-wortel-van-n ongeveer 6, en vandaar die vertroue perke is min of meer plus-of-minus 2/6, of 0.33. As jy die waarde van alfa wissel met die hand, kan jy die effek op die tydreeks en outokorrelasie erwe van die foute in ag te neem, sowel as op die gemiddelde kwadraat fout. Aan die onderkant van die sigblad, is die voorspelling formule bootstrapped in die toekoms deur bloot vervang voorspellings vir werklike waardes by die punt waar die werklike data loop uit - d. w.z. waar die toekoms begin. (Met ander woorde, in elke sel waar 'n toekomstige datawaarde sou plaasvind, 'n selverwysing is ingevoeg wat daarop dui dat die voorspelling gemaak vir daardie tydperk.) Al die ander formules is eenvoudig van bo af gekopieer: Let daarop dat die foute vir voorspellings van die toekoms is al bereken as nul. Dit beteken nie dat die werklike foute sal nul wees nie, maar eerder dit weerspieël bloot die feit dat vir doeleindes van ekstrapolasie ons die veronderstelling dat die toekoms data die voorspellings sal gelyk. Die gevolglike LES voorspellings vir die seisoenaal-aangepaste data soos volg lyk: Let daarop dat met hierdie besondere waarde van Alpha - die optimale waarde vir een-stap-ahead voorspelling - die geprojekteerde tendens is effens opwaarts, wat die plaaslike tendens wat waargeneem oor die laaste 2 jaar of so. Vir ander waardes van Alpha dalk 'n ander tendens projeksie verkry. Die finale stap in die bou van die voorspelling model is om die LES voorspellings reasonalize deur hulle deur die toepaslike seisoenale indekse te vermenigvuldig. So, die reseasonalized voorspellings in kolom Ek is net die produk van die seisoenale indekse in kolom E en die seisoensaangepaste LES voorspel in kolom G. Dit is relatief maklik om vertrouensintervalle bereken vir een-stap-ahead voorspellings gemaak deur hierdie model: eerste bereken die RMSE (wortel-gemiddelde-kwadraat fout, wat net die vierkantswortel van die MSE) en dan bereken 'n vertrouensinterval vir die seisoensaangepaste voorspel deur optelling en aftrekking twee keer die RMSE. (Onthou dat 'n 95 vertrouensinterval is min of meer gelyk aan die punt voorspelling plus-of-minus twee-standaardafwykings, die aanvaarding van die fout verspreiding is ongeveer normale en die steekproefgrootte is 20 of meer. Hier is die RMSE is die beste raming van die fout standaardafwyking.) die vertroue perke vir die seisoensaangepaste voorspelling is dan reseasonalized. saam met die voorspelling, deur hulle met die toepaslike seisoenale indekse te vermenigvuldig. In hierdie geval is die RMSE is gelyk aan 27.4 en die seisoensaangepaste voorspelling vir die eerste toekoms tydperk (Desember-93) is 273,2. sodat die seisoensaangepaste 95 vertrouensinterval is 273,2-227,4 218,4 te 273.2227.4 328,0. Vermenigvuldig hierdie perke deur Decembers seisoenale indeks van 68,61. Ons kry onderste en boonste vertroue grense van 149,8 en 225,0 rondom die Desember-93 punt voorspelling van 187,4. Vertroue perke vir voorspellings meer as een tydperk wat voorlê, sal oor die algemeen uit te brei as die voorspelling horison toeneem, as gevolg van onsekerheid oor die vlak en tendens asook die seisoenale faktore, maar dit is moeilik om hulle te bereken in die algemeen deur analitiese metodes. (Die geskikte manier om vertroue perke vir die LES voorspelling bereken is deur die gebruik van ARIMA teorie, maar die onsekerheid in die seisoenale indekse is 'n ander saak.) As jy 'n realistiese vertroue interval vir 'n voorspelling wil meer as een tydperk wat voorlê, met al die bronne van fout in ag, jou beste bet is om empiriese metodes gebruik: byvoorbeeld, 'n vertrouensinterval vir 'n 2-stap vorentoe voorspel verkry, jy kan 'n ander kolom skep op die sigblad om 'n 2-stap-ahead voorspelling bereken vir elke tydperk ( deur Opstarten die een-stap-ahead voorspelling). bereken dan die RMSE van die 2-stap-ahead voorspelling foute en gebruik dit as die basis vir 'n 2-stap-ahead vertroue interval.
No comments:
Post a Comment