Sunday 23 April 2017

Saisonale Anpassung Zentriert Gleitender Durchschnitt

Moving averages. Phase Verschiebung ist der Unterschied in der Erkennung von Wendepunkten zwischen ursprünglichen und geglätteten Daten Dieser Effekt ist ein Nachteil, da es eine Verzögerung bei der Erkennung der Wendepunkte der Zeitreihe verursacht, vor allem in der aktuellsten Periode Die symmetrischen, zentrierten Bewegungsdurchschnitte sind Resistent gegen diesen Effekt Am Ende und am Anfang der Zeit können jedoch symmetrische Zeitreihen verwendet werden. Um die geglätteten Werte in den beiden Enden der Zeitreihen zu berechnen, wird der asymmetrische Filter verwendet, jedoch verursachen sie den Phaseneffekt Kann klicken und ziehen in den Plot-Bereich zu vergrößern. Sie können Maus über Daten Punkte, um den tatsächlichen Wert, der graphed. If gibt es eine Legende-Box, klicken Sie auf die Serie Namen zu verstecken zeigen sie. Moving Durchschnitte sind arithmetische Mittelwerte angewendet Zu aufeinanderfolgenden Zeitspannen der festen Länge der Serie Wenn sie auf die ursprünglichen Zeitreihen angewendet werden, erzeugen sie eine Reihe von gemittelten Werten. Die allgemeine Formel für das Bewegen des durchschnittlichen M der Koeffizienten ist Ergiebigkeitskoeffizienten werden Gewichte genannt. Die Größe pf 1 ist die gleitende Durchschnittsordnung. Der gleitende Mittelwert wird als zentriert bezeichnet, wenn die Anzahl der Beobachtungen in der Vergangenheit gleich der Nummernbeobachtung in der Zukunft ist, dh wenn p gleich f ist. Die Durchführungsdurchschnitte ersetzen die Original-Zeitreihen durch gewichtete Durchschnittswerte der aktuellen Werte, P Beobachtungen vor der aktuellen Beobachtung und f Beobachtungen nach der aktuellen Beobachtung Sie werden verwendet, um die ursprüngliche Zeitreihe zu glätten. Die Tabelle zeigt die Anzahl der Passagiere, die mit der von Finnland im Jahr 2001 gemeldeten Passagiere reisen. Die gleichen Daten werden auf dem Diagramm dargestellt. Typen der sich bewegenden Mittelwerte. Auf der Grundlage von Gewichtungsmustern können sich die gleitenden Mittelwerte bilden. Symmetrisch ist das für die Berechnung der Bewegungsdurchschnitte verwendete Wiegemuster symmetrisch um den Zieldatenpunkt. Mit Hilfe von symmetrischen gleitenden Mittelwerten ist es möglich Nicht möglich, die geglätteten Werte für die ersten p - und letzten p-Beobachtungen für symmetrische gleitende Mittelwerte pf zu erhalten. Symmetrisch das Wiegemuster u Sed für die Berechnung der sich bewegenden Mittelwerte ist nicht symmetrisch um den Zieldatenpunkt. Moving Mittelwerte können auch nach ihrem Beitrag zum Endwert eingestuft werden. Einfache gleitende Durchschnitte, dh die gleitenden Durchschnitte, für die alle Gewichte gleich sind Im Falle von einfachen gleitenden Durchschnitten Alle Beobachtungen tragen gleichermaßen zum Endwert bei. Unnötig zu sagen, alle einfachen gleitenden Mittelwerte sind symmetrisch. Für den symmetrischen gleitenden Durchschnitt der Ordnung P 2p 1 sind alle Gewichte gleich 1 P. Das Bild unten vergleicht den Glanzgrad, der durch die Anwendung erreicht wird 3-term und 7-term einfache gleitende Durchschnitte Die extremen Beobachtungen zB April 2010 oder Juni 2011 haben einen geringeren Einfluss auf den längeren gleitenden Durchschnitt als auf die kürzere. Nicht-einfache gleitende Durchschnitte, dh die gleitenden Durchschnitte, für die alle Gewichte nicht die sind Gleiche Die Sonderfälle von nicht einfachen gleitenden Durchschnitten sind mögliche Bewegungsdurchschnitte, die durch Zusammensetzen eines einfachen gleitenden Mittels der Ordnung P erhalten werden, deren Koeffizienten alle gleich 1 sind P und ein einfacher gleitender Durchschnitt der Ordnung Q, deren Koeffizienten alle gleich 1 Q sind. Symmetrische Bewegungsdurchschnitte. Eigenschaften der sich bewegenden Mittelwerte. Die gleitenden Mittelwerte glatten die Zeitreihen. Wenn sie auf eine Zeitreihe angewendet werden, reduzieren sie die Amplitude der beobachteten Schwankungen und fungieren als Filter, der unregelmäßige Bewegungen von ihm entfernt. Die bewegten Mittelwerte mit entsprechendem Gewichtungsmuster können verwendet werden, um Zyklen einer bestimmten Länge in der Zeitreihe zu eliminieren. In der X-12-ARIMA saisonalen Anpassungsmethode werden verschiedene Arten von gleitenden Durchschnitten verwendet Um die Tendenz-Zyklus und saisonale Komponente zu schätzen. Wenn die Summe der Koeffizienten gleich 1 ist, dann behalten die gleitenden Durchschnitt den Trend. Moving Durchschnitte haben zwei wichtige Vorgaben. Sie sind nicht robust und könnte tief beeinflusst werden von Ausreißern. Die Glättung An den Enden der Serie kann nicht getan werden, aber mit asymmetrischen gleitenden Durchschnitten, die Phasenverschiebungen und Verzögerungen bei der Erkennung von Wendepunkten einführen. Im X11-Verfahren werden symmetrische Bewegungsdurchschnitte pl Eine wichtige Rolle, da sie keine Phasenverschiebung in der geglätteten Serie einführen. Um jedoch zu vermeiden, dass die Informationen an den Serienenden verloren gehen, werden sie entweder durch Ad-hoc-asymmetrische gleitende Durchschnitte ergänzt oder auf die von Prognosen abgeschlossene Serie angewendet Gleitender Durchschnitt ist ein Verfahren zum Glätten von Zeitreihen durch Mittelung mit oder ohne Gewichte einer festen Anzahl von aufeinanderfolgenden Begriffen Die Mittelung bewegt sich im Laufe der Zeit, indem jeder Datenpunkt der Reihe sequentiell in die Mittelung eingeschlossen wird, während der älteste Datenpunkt in der Spanne ist Des Mittelwertes ist im Allgemeinen, je länger die Spanne des Durchschnitts ist, desto glatter ist die resultierende Reihe Bewegliche Mittelwerte werden verwendet, um Schwankungen in Zeitreihen zu glätten oder um Zeitreihenkomponenten wie den Trend, den Zyklus, die saisonalen, Etc Ein gleitender Durchschnitt ersetzt jeden Wert einer Zeitreihe durch einen gewichteten Durchschnitt von p vorangehenden Werten, den gegebenen Wert und f folgenden Werten einer Reihe Wenn pf der gleitende Durchschnitt m ist Der Durchschnitt wird gesagt, dass er symmetrisch ist, wenn er zentriert ist und wenn für jedes k 1, 2, pf das Gewicht des k - ten vorhergehenden Wertes gleich dem Gewicht des k - ten folgenden ist. Der gleitende Durchschnitt ist nicht definiert Die ersten p und die letzten f Zeitreihenwerte Um den gleitenden Durchschnitt für diese Werte zu berechnen, muss die Serie rückvergütet und prognostiziert werden. Source Task Force auf Daten - und Metadaten-Präsentation für die OECD-Kurzzeit-Wirtschaftsstatistik-Arbeitsgruppe STESWP, Paris , 2004.Konzept der Stationarität. Hypothetisch kann die aktuelle Beobachtung von allen vergangenen Beobachtungen abhängen. Dieses autoregressive Modell ist unmöglich zu schätzen, da es zu viele Parameter enthält. Wenn jedoch xt als lineare Funktion aller vergangenen Verzögerungen vorliegt, kann man beweisen, dass autoregressive Modell ist äquivalent zu xt als lineare Funktion von nur wenigen vergangenen Schocks In einem gleitenden Durchschnittsmodell wird der aktuelle Wert von xt als eine lineare Funktion des gleichzeitigen Schockfehlers und vorbei an Schockfehlern beschrieben Ergebnisse gelten als stabil, wenn sie relativ resistent gegen das Entfernen oder Hinzufügen von Datenpunkten an beiden Enden der Serie sind. Stabilität ist eine der wichtigsten Eigenschaften der SA-Ergebnisse Wenn das Anhängen oder Verzögern von wenigen Beobachtungen die saisonbereinigte Reihe oder den geschätzten Trendzyklus wesentlich verändern, Die Interpretation der saisonbereinigten Reihen wäre unzuverlässig. Was sind die SI-Verhältnisse. Die SI-Verhältnisse sind Werte der saisonal-irregulären SI-Komponente, berechnet als Verhältnis der ursprünglichen Serie zum geschätzten Trend. Mit anderen Worten, SI-Verhältnisse sind Schätzungen von Die verzweigten Serien-SI-Charts sind nützlich, um zu untersuchen, ob kurzfristige Bewegungen durch saisonale oder unregelmäßige Schwankungen verursacht werden. Dieses Diagramm ist ein Diagnosewerkzeug, das für die Analyse des saisonalen Verhaltens, die Bewegung von Urlaubsmustern, Ausreißern und die Identifizierung der Saisonpausen in der Serie verwendet wird Software zeigt in der Regel die folgenden Informationen über das RegARIMA-Modell an. Model Auswahlkriterien informat Ionen-Kriterien sind Maßnahmen der relativen Güte der Anpassung eines statistischen Modells In saisonalen Anpassungsprogrammen werden sie für die Auswahl der optimalen Ordnung des RegARMIA-Modells verwendet. Für die gegebenen Informationskriterien ist das bevorzugte Modell dasjenige mit dem minimalen Informationskriterienwert. Iteration B, Tabelle B7, Iteration C Tabelle C7 und Iteration D Tabelle D7 und Tabelle D12 Die Trend-Cycle-Komponente wird aus einer Schätzung der saisonbereinigten Serien mit den Henderson-Bewegungsdurchschnitten extrahiert. Die Länge des Henderson-Filters wird automatisch von X-12 gewählt - ARIMA in einem zweistufigen Verfahren. Spreadsheet Umsetzung der saisonalen Anpassung und exponentielle Glättung. Es ist einfach zu saisonalen Anpassung und passen exponentielle Glättung Modelle mit Excel Die Bildschirmbilder und Diagramme unten sind aus einer Kalkulationstabelle, die eingerichtet wurde, um zu illustrieren Multiplikative saisonale Anpassung und lineare exponentielle Glättung auf den folgenden vierteljährlichen Verkaufsdaten von Outboard M Arine. Um eine Kopie der Tabellenkalkulation selbst zu erhalten, klicken Sie hier Die Version der linearen exponentiellen Glättung, die hier zum Zwecke der Demonstration verwendet wird, ist die Brown-Version, nur weil sie mit einer einzigen Spalte von Formeln implementiert werden kann und es gibt nur Eine Glättung Konstante zu optimieren In der Regel ist es besser, Holt s Version verwenden, die separate Glättung Konstanten für Ebene und Trend hat. Der Prognoseprozess läuft wie folgt i zuerst die Daten saisonbereinigt ii dann Prognosen für die saisonbereinigten Daten über lineare exponential generiert werden Glättung und iii schließlich werden die saisonbereinigten Prognosen wiederhergestellt, um Prognosen für die ursprüngliche Serie zu erhalten. Der saisonale Anpassungsprozess wird in den Spalten D bis G durchgeführt. Der erste Schritt in der saisonalen Anpassung besteht darin, einen zentrierten gleitenden Durchschnitt zu berechnen, der hier in Spalte D durchgeführt wird Getan werden, indem man den Durchschnitt von zwei einjährigen Durchschnitten nimmt, die um eine Periode relativ zueinander versetzt sind Eine Kombination von zwei Offset-Mittelwerten anstatt einem einzigen Durchschnitt wird für Zentrierungszwecke benötigt, wenn die Anzahl der Jahreszeiten gleich ist. Der nächste Schritt ist, das Verhältnis zum gleitenden Durchschnitt zu berechnen - die ursprünglichen Daten, die durch den gleitenden Durchschnitt in jeder Periode geteilt werden - Die hier in Spalte E durchgeführt wird. Dies wird auch als Trend-Zyklus-Komponente des Musters bezeichnet, insofern als Trend - und Konjunktureffekte als alles verbleiben, was nach dem Mittelwert über ein ganzes Jahr im Wert von Daten liegt - Mon-Monats-Änderungen, die nicht auf Saisonalität zurückzuführen sind, könnten durch viele andere Faktoren bestimmt werden, aber der 12-Monats-Durchschnitt glättet über sie zu einem großen Teil Der geschätzte saisonale Index für jede Saison wird berechnet, indem zuerst alle Verhältnisse für diese besondere Mittelwerte gemittelt werden Saison, die in den Zellen G3-G6 unter Verwendung einer AVERAGEIF-Formel durchgeführt wird. Die durchschnittlichen Verhältnisse werden dann neu skaliert, so dass sie auf genau das 100-fache der Anzahl der Perioden in einer Jahreszeit oder 400 in diesem Fall, die in den Zellen H3-H6 durchgeführt wird, summierenUnterhalb der Spalte F werden die VLOOKUP-Formeln verwendet, um den entsprechenden saisonalen Indexwert in jede Zeile der Datentabelle einzufügen, je nach dem Quartal des Jahres, den es repräsentiert Der zentrierte gleitende Durchschnitt und die saisonbereinigten Daten am Ende so aussehen Der gleitende Durchschnitt sieht typischerweise wie eine glattere Version der saisonbereinigten Serien aus und ist an beiden Enden kürzer. Ein anderes Arbeitsblatt in der gleichen Excel-Datei zeigt die Anwendung des linearen exponentiellen Glättungsmodells auf die saisonbereinigten Daten, beginnend mit Spalten-GA-Wert Für die Glättungskonstante Alpha wird hier oberhalb der Prognosespalte eingegeben, in Zelle H9 und der Bequemlichkeit wird der Bereichsname Alpha zugewiesen. Der Name wird mit dem Befehl "Name anlegen" zugewiesen. Das LES-Modell wird initialisiert, indem die ersten beiden Prognosen gleich gesetzt werden Erster aktueller Wert der saisonbereinigten Serie Die hier verwendete Formel für die LES-Prognose ist die rekursive Formulare von Browns. Dies ist die Mula wird in die Zelle eingegeben, die der dritten Periode hier entspricht, Zelle H15 und von dort abgemeldet. Beachten Sie, dass die LES-Prognose für die aktuelle Periode sich auf die beiden vorhergehenden Beobachtungen und die beiden vorangegangenen Prognosefehler sowie auf den Wert von alpha bezieht So bezieht sich die Prognoseformel in Zeile 15 nur auf Daten, die in Zeile 14 und früher verfügbar waren. Natürlich, wenn wir einfach anstelle einer linearen exponentiellen Glättung verwenden wollten, könnten wir hier die SES-Formel ersetzen. Wir könnten auch Holt s verwenden Als Browns LES-Modell, das zwei weitere Spalten von Formeln erfordern würde, um den Level und den Trend zu berechnen, die in der Prognose verwendet werden. Die Fehler werden in der nächsten Spalte hier berechnet, Spalte J durch Subtrahieren der Prognosen von den tatsächlichen Werten Der Wurzelmittelwert Quadratischer Fehler wird als Quadratwurzel der Varianz der Fehler plus dem Quadrat des Mittels berechnet. Dies folgt aus der mathematischen Identität MSE VARIANCE Fehler AVERAGE Fehler 2 Bei der Berechnung des Mittelwerts Und Abweichung der Fehler in dieser Formel sind die ersten beiden Perioden ausgeschlossen, weil das Modell eigentlich nicht mit der Prognose beginnt, bis die dritte Periode Zeile 15 auf der Kalkulationstabelle Der optimale Wert von alpha kann entweder durch manuelles Ändern von alpha bis zum minimalen RMSE gefunden werden Gefunden, oder Sie können den Solver verwenden, um eine exakte Minimierung durchzuführen Der Wert von alpha, dass der Solver gefunden wird hier gezeigt alpha 0 471.Es ist in der Regel eine gute Idee, die Fehler des Modells in transformierten Einheiten zu plotten und auch zu berechnen und Plot ihre Autokorrelationen bei Verzögerungen von bis zu einer Saison Hier ist eine Zeitreihenfolge der saisonbereinigten Fehler. Die Fehlerautokorrelationen werden mit der CORREL-Funktion berechnet, um die Korrelationen der Fehler mit sich selbst zu berechnen, die von einer oder mehreren Perioden hinterhergestellt wurden Werden im Tabellenkalkulationsmodell gezeigt Hier ist eine Auftragung der Autokorrelationen der Fehler bei den ersten fünf Verzögerungen. Die Autokorrelationen bei den Verzögerungen 1 bis 3 sind sehr nahe bei Null, aber die Spitze bei Verzögerung 4 Deren Wert 0 35 ist, ist etwas lästig - es deutet darauf hin, dass der saisonale Anpassungsprozess nicht vollständig erfolgreich war. Allerdings sind es eigentlich nur geringfügig signifikante 95 Signifikanzbänder zum Testen, ob Autokorrelationen signifikant von Null verschieden sind, etwa plus-oder-minus 2 SQRT nk, wobei n die Stichprobengröße und k die Verzögerung ist Hier n ist 38 und k variiert von 1 bis 5, so dass die Quadratwurzel-von-n-minus-k etwa 6 für alle von ihnen ist, und daher die Grenzen für die Prüfung der statistischen Signifikanz von Abweichungen von Null sind etwa plus-oder-minus 2 6 oder 0 33 Wenn Sie den Wert von alpha von Hand in diesem Excel-Modell variieren, können Sie den Effekt auf die Zeitreihen und Autokorrelations-Plots von beobachten Die Fehler, sowie auf den root-mean-squared-Fehler, der unten dargestellt wird. Am unteren Rand der Kalkulationstabelle wird die Prognoseformel in die Zukunft bootstrapped, indem sie lediglich Prognosen für Istwerte an der Stelle, an der die tatsächlichen Daten liegen, ersetzt werden Läuft ab - dh wh Wenn die Zukunft beginnt Mit anderen Worten, in jeder Zelle, wo ein zukünftiger Datenwert auftreten würde, wird eine Zellreferenz eingefügt, die auf die Prognose für diesen Zeitraum hinweist. Alle anderen Formeln werden einfach von oben kopiert. Nichts, dass die Fehler für Prognosen Der Zukunft werden alle berechnet, um null zu sein. Das bedeutet nicht, dass die tatsächlichen Fehler null sind, sondern vielmehr nur die Tatsache, dass für die Zwecke der Vorhersage wir davon ausgehen, dass die zukünftigen Daten die Prognosen im Durchschnitt entsprechen. Die resultierenden LES-Prognosen für Die saisonbereinigten Daten sehen so aus. Mit diesem besonderen Wert von alpha, der für einperiodische Vorhersagen optimal ist, ist der projizierte Trend leicht nach oben gerichtet und spiegelt den lokalen Trend wider, der in den letzten zwei Jahren beobachtet wurde. Für andere Werte Von alpha, kann eine ganz andere trendprojektion erhalten werden Es ist in der Regel eine gute Idee zu sehen, was passiert mit der langfristigen Trendprojektion, wenn Alpha variiert wird, weil der Wert, der am besten für short-t ist Erm Prognose wird nicht unbedingt der beste Wert für die Vorhersage der weiter entfernten Zukunft sein Zum Beispiel ist hier das Ergebnis, das erhalten wird, wenn der Wert von alpha manuell auf 0 25 gesetzt wird. Der projizierte langfristige Trend ist nun eher negativ als positiv mit Ein kleinerer Wert von alpha, das Modell ist mehr Gewicht auf ältere Daten in seiner Einschätzung der aktuellen Ebene und Trend, und seine langfristigen Prognosen spiegeln die Abwärtstrend in den letzten 5 Jahren beobachtet, anstatt der jüngsten Aufwärtstrend Diese Tabelle Zeigt auch deutlich, wie das Modell mit einem kleineren Wert von Alpha langsamer ist, um auf Wendepunkte in den Daten zu reagieren und neigt daher dazu, einen Fehler des gleichen Vorzeichens für viele Perioden in einer Reihe zu machen. Seine 1-Schritt-voraus Prognosefehler sind größer auf Durchschnittlich als diejenigen, die vor RMSE von 34 4 anstatt von 27 4 erhalten wurden und stark positiv autokorreliert werden. Die Verzögerungs-Autokorrelation von 0 56 übersteigt weitgehend den oben berechneten Wert von 0 33 für eine statistisch signifikante Abweichung Von null Als Alternative zum Anreißen des Wertes von Alpha, um mehr Konservatismus in langfristige Prognosen einzuführen, wird dem Modell manchmal ein Trenddämpfungsfaktor hinzugefügt, um den projizierten Trend nach einigen Perioden abzubauen Schritt für die Erstellung des Prognosemodells ist es, die LES-Prognosen durch Multiplikation mit den entsprechenden saisonalen Indizes zu verwerten. Somit sind die neu gestellten Prognosen in Spalte I einfach das Produkt der Saisonindizes in Spalte F und die saisonbereinigten LES-Prognosen in Spalte H. It Ist relativ einfach, Konfidenzintervalle für einstufige Prognosen zu berechnen, die von diesem Modell gemacht werden, zuerst den RMSE-Wurzel-Mittelquadrat-Fehler, der nur die Quadratwurzel der MSE ist, und dann ein Konfidenzintervall für die saisonbereinigte Prognose berechnen Hinzufügen und Subtrahieren zweimal der RMSE Im Allgemeinen ist ein 95-Konfidenzintervall für eine Prognose für eine Periode vorausgehend gleich der Punktprognose plus-oder-minus-zwei mal Die geschätzte Standardabweichung der Prognosefehler unter der Annahme, dass die Fehlerverteilung annähernd normal ist und die Stichprobengröße groß genug ist, z. B. 20 oder mehr Hier ist die RMSE anstelle der Stichprobenstandardabweichung der Fehler die beste Schätzung der Standardabweichung Von zukünftigen Prognosefehlern, weil es Bias sowie zufällige Variationen berücksichtigt Die Vertrauensgrenzen für die saisonbereinigte Prognose werden dann zusammen mit der Prognose neu vervielfacht, indem sie mit den entsprechenden saisonalen Indizes multipliziert werden. In diesem Fall ist die RMSE gleich 27 4 und die Saisonbereinigte Prognose für die erste zukünftige Periode Dez-93 ist 273 2 so dass das saisonbereinigte 95 Konfidenzintervall von 273 2-2 27 4 218 4 bis 273 2 2 27 4 328 0 Multiplikation dieser Limits bis Dezember saisonalen Index von 68 61 Wir erhalten niedrigere und obere Konfidenzgrenzen von 149 8 und 225 0 um die Dez-93-Punkt-Prognose von 187 4.Confidence-Limits für Prognosen mehr als eine Periode voraus wird im Allgemeinen breit N, da der prognostizierte Horizont aufgrund der Unsicherheit über das Niveau und den Trend sowie die saisonalen Faktoren zunimmt, aber es ist schwierig, sie im Allgemeinen durch analytische Methoden zu berechnen. Die geeignete Methode, die Vertrauensgrenzen für die LES-Prognose zu berechnen, ist die Verwendung der ARIMA-Theorie , Aber die Ungewissheit in den saisonalen Indizes ist eine andere Sache Wenn Sie ein realistisches Konfidenzintervall für eine Prognose mehr als einen Zeitraum voran wollen, wobei alle Fehlerquellen berücksichtigt werden, ist Ihre beste Wette, empirische Methoden zum Beispiel zu verwenden, um ein Vertrauen zu erhalten Intervall für eine Vorhersage im Voraus mit 2 Schritten, können Sie eine weitere Spalte auf der Kalkulationstabelle erstellen, um eine 2-Schritt-Prognose für jede Periode zu berechnen, indem Sie die Vorstufe für die Vorausschreitung starten. Berechnen Sie dann die RMSE der 2-Schritt-Prognose Fehler und verwenden Sie diese als Grundlage für ein 2-Schritt-voraus Vertrauensintervall.


No comments:

Post a Comment