David, Ja, MapReduce ist beabsichtigt, auf einer großen Menge an Daten zu operieren Und die Idee ist, dass im Allgemeinen die Karte und die reduzierten Funktionen nicht darauf achten sollten, wie viele Mapper oder wie viele Reduzierstücke es gibt, das ist nur Optimierung Wenn Sie sorgfältig darüber nachdenken Der Algorithmus, den ich gepostet habe, können Sie sehen, dass es nicht wichtig ist, welcher Mapper bekommt, welche Teile der Daten jeder Eingabedatensatz für jeden reduzierenden Betrieb verfügbar sein wird, der es benötigt Joe K Sep 18 12 bei 22 30. Im besten meiner Verständnis gleitenden Durchschnitt Ist nicht schön Karten zum MapReduce-Paradigma, da seine Berechnung im Wesentlichen Schiebefenster über sortierte Daten ist, während MR die Verarbeitung von nicht geschnittenen Bereichen von sortierten Daten ist. Solution, die ich sehe, ist wie folgt a Um benutzerdefinierte Partitionierer zu implementieren, um zwei verschiedene Partitionen erstellen zu können In zwei Läufen In jedem Durchlauf werden Ihre Reduzierstücke unterschiedliche Datenbereiche erhalten und den gleitenden Durchschnitt berechnen, wo es angemessen ist, zu veranschaulichen. Im ersten Lauf werden Daten für Reduzierstücke R1 Q1, Q2, Q3, Q4 R2 Q5, Q6, Q7, Q8 sein. Hier werden Sie cacluate gleitenden Durchschnitt für einige Qs. In nächsten Lauf Ihre Reduzierer sollten Daten wie R1 Q1 Q6 R2 Q6 Q10 R3 Q10 Q14.And caclulate den Rest der sich bewegenden Mitteln Dann müssen Sie aggregieren results. Idea der benutzerdefinierten Partitionierer, dass es Wird zwei Betriebsarten haben - jedes Mal in gleiche Bereiche, aber mit einigen Verschiebung In einem Pseudocode wird es wie diese Partitionstaste aussehen SHIFT MAXKEY numOfPartitions wo SHIFT aus der Konfiguration genommen wird MAXKEY Maximalwert des Schlüssels Ich nehme für die Einfachheit, dass sie Start mit zero. RecordReader, IMHO ist keine Lösung, da es auf bestimmte Split begrenzt ist und kann nicht über Split s Grenze gleiten. Eine andere Lösung wäre, um benutzerdefinierte Logik der Aufteilung von Eingabedaten zu implementieren ist es Teil der InputFormat Es kann getan werden Mache 2 verschiedene Dias, ähnlich wie partitioning. answered Sep 17 12 bei 8 59.Wenn das Rechnen eines laufenden gleitenden Durchschnitts, Platzierung der Durchschnitt in der mittleren Zeitspanne macht Sinn. Im vorherigen Beispiel haben wir den Durchschnitt der ersten 3 Zeiträume und berechnet Platziert es neben Periode 3 Wir hätten den Mittelpunkt in der Mitte des Zeitintervalls von drei Perioden platzieren können, das heißt, neben Periode 2 Das funktioniert gut mit seltsamen Zeiträumen, aber nicht so gut für gleichzeitige Zeiträume Also wo würden wir Platzieren Sie den ersten gleitenden Durchschnitt, wenn M 4.Technisch, würde der Moving Average fallen auf t 2 5, 3 5. Um dieses Problem zu vermeiden, glätten wir die MA s mit M 2 So glätten wir die geglätteten Werte. Wenn wir durchschnittlich eine gerade Anzahl von Begriffe, müssen wir die geglätteten Werte glätten. Die folgende Tabelle zeigt die Ergebnisse mit M 4.Predictive Analytics mit Microsoft Excel Arbeiten mit saisonalen Zeitreihen. In diesem Kapitel. Einfache saisonale Mittelwerte. Moving Mittelwerte und zentrierte Moving Averages. Linear Regression mit Coded Vektoren. Einfache saisonale exponentielle Glättung. Holt-Winters Modelle. Matters werden inkrementell komplizierter, wenn Sie eine Zeitreihe haben, die sich zum Teil durch Saisonalität die Tendenz seines Niveaus zu steigen und fallen in Übereinstimmung mit der Verabschiedung der Jahreszeiten Wir verwenden die Langfristige Jahreszeit in einem allgemeineren Sinn als die alltägliche Bedeutung des Jahres s vier Jahreszeiten Im Rahmen der prädiktiven Analytik kann eine Jahreszeit ein Tag sein, wenn Muster wöchentlich wiederholen oder ein Jahr in Bezug auf Präsidentschaftswahlzyklen oder gerade über irgendetwas in Zwischen einer achtstündigen Schicht in einem Krankenhaus kann eine Saison darstellen. Dieses Kapitel nimmt einen Blick auf, wie man eine Zeitreihe zu zerlegen, so dass Sie sehen können, wie seine Saisonalität funktioniert abgesehen von seinem Trend, wenn überhaupt Wie Sie von dem Material in Kapiteln erwarten könnte 3 und 4, stehen Ihnen mehrere Ansätze zur Verfügung. Einfache saisonale Mittelwerte Die Verwendung von einfachen saisonalen Mittelwerten, um eine Zeitreihe zu modellieren, kann Ihnen manchmal ein ziemlich grobes Modell für die Daten geben. Aber der Ansatz berücksichtigt die Jahreszeiten im Datensatz , Und es kann leicht viel genauer als eine Prognose-Technik als einfache exponentielle Glättung, wenn die Saisonalität ausgesprochen wird Sicherlich dient es als nützliche Einführung in einige der Verfahren mit Zeitreihen, die sowohl saisonale und trended sind, so werfen Sie einen Blick auf Das Beispiel in Abbildung 5 1.Figure 5 1 Mit einem horizontalen Modell ergeben einfache Mittelwerte Prognosen, die nicht mehr als saisonale Mittel sind. Die in Abbildung 5 1 dargestellten Daten und Grafiken repräsentieren die durchschnittliche Anzahl der täglichen Treffer auf eine Website, Fans der Nationalen Fußball-Liga Jede Beobachtung in Spalte D stellt die durchschnittliche Anzahl von Hits pro Tag in jedem von vier Vierteln über eine Fünf-Jahres-Zeitspanne dar. Erzählung eines Saisonmusters. Sie können aus den Mittelwerten im Bereich G2 G5 sagen, dass a Deutliche vierteljährliche Wirkung findet statt Die größte durchschnittliche Anzahl von Hits findet im Herbst und Winter statt, wenn die wichtigsten 16 Spiele und die Playoffs geplant sind. Zinsen, gemessen an durchschnittlichen täglichen Hits, sinken während der Frühjahrs - und Sommermonate. Die Durchschnittswerte sind leicht Berechnen Sie, ob Sie sich mit Array-Formeln wohl fühlen oder nicht. Um den Mittelwert aller fünf Instanzen von Quartal 1 zu erhalten, können Sie diese Array-Formel in Zelle G2 von Abbildung 5 verwenden. 1.Array-geben Sie sie mit Ctrl Shift Enter ein oder Sie können Verwenden Sie die AVERAGEIF-Funktion, die Sie auf die normale Art und Weise eingeben können, indem Sie die Enter-Taste drücken. Im Allgemeinen bevorzuge ich den Array-Formel-Ansatz, weil es mir Raum für eine bessere Kontrolle über die Funktionen und Kriterien gibt. Die Charted-Datenreihe enthält Daten-Labels, die zeigen Welches Viertel jeder Datenpunkt gehört Das Diagramm erinnert an die Meldung der Mittelwerte in G2 G5 Quarters 1 und 4 wiederholt die meisten Hits Es gibt eine klare Saisonalität in diesem Datensatz. Begrenzende saisonale Indizes. Nachdem du entschieden hast, dass eine Zeitreihe eine Saisonale Komponente, Sie möchten die Größe des Effekts quantifizieren Die Mittelwerte, die in Abbildung 5 2 gezeigt werden, stellen dar, wie die Methode der einfachen Mittelwerte über diese Aufgabe geht. Figure 5 2 Kombiniere den großartigen Mittel mit den saisonalen Mittelwerten, um die saisonalen Indizes zu erhalten Abbildung 5 2 Sie erhalten additive saisonale Indizes im Bereich G10 G13 durch Subtrahieren des Großmittels in Zelle G7 von jedem saisonalen Durchschnitt in G2 G5 Das Ergebnis ist die Wirkung des Seins im Quartal 1, das im zweiten Quartal 2 und so weiter If Ein gegebener Monat ist im 1. Quartal, Sie erwarten, dass es 99 65 durchschnittlichere Tageshits hat als der große Mittelwert von 140 35 Hits pro Tag. Diese Information gibt Ihnen ein Gefühl, wie wichtig es ist, in einer bestimmten Saison zu sein Angenommen, dass Sie Besitzen die Website in Frage und Sie wollen Werbefläche auf sie verkaufen Sie können sicherlich einen höheren Preis von Werbetreibenden während des ersten und vierten Quartals fragen als während der zweiten und dritten Mehr auf den Punkt, können Sie wahrscheinlich berechnen doppelt so viel während der Im ersten Quartal als bei der zweiten oder der dritten. Mit den saisonalen Indizes in der Hand, sind Sie auch in der Lage, saisonale Anpassungen zu berechnen Zum Beispiel noch in Abbildung 5 2 die saisonbereinigten Werte für jedes Quartal im Jahr 2005 erscheinen in G16 G19 Sie Re berechnet durch Subtrahieren des Index von der damit verbundenen vierteljährlichen Messung. Toleranz bezieht sich der Begriff saisonaler Index auf die Zunahme oder Abnahme des Niveaus einer Serie, die mit jeder Jahreszeit verbunden ist. Der synchrone Begriff saisonale Effekt ist in der Literatur in den letzten Jahren erschienen Sie sehen beide Begriffe, ich habe sie beide in diesem Buch benutzt. Es ist eine kleine Sache, die nur bedenkt, dass die beiden Begriffe die gleiche Bedeutung haben. Nichts, dass im normalen Verlauf von 2001 bis 2005 das zweite Quartal erwartet wird Ergebnisse liegen hinter dem Ergebnis des ersten Quartals um 133 6 Das heißt, 99 65 minus 33 95 Aber in den Jahren 2004 und 2005 übersteigen die saisonbereinigten Ergebnisse für das zweite Quartal die für das erste Quartal. Das Ergebnis könnte Sie vielleicht bitten, zu fragen, was Hat sich in den letzten zwei Jahren geändert, die die Beziehung zwischen den saisonbereinigten Ergebnissen für die ersten beiden Quartale umkehrt, die ich hier nicht anspreche. Hiermit gebe ich Ihnen vor, dass Sie sich oft die beobachteten und saisonbereinigten Blicke ansehen lassen wollen Figuren. Forecasting von einfachen saisonalen Mitteln kein Trend. Obwohl die Methode der einfachen Mittelwerte ist, wie ich schon früher grob gesagt habe, kann es viel genauer sein als die anspruchsvollere Alternative der exponentiellen Glättung, besonders wenn die saisonalen Effekte ausgeprägt und zuverlässig sind Zeit-Serie ist untrended, wie es der Fall mit dem Beispiel dieser Abschnitt diskutiert hat, sind die einfachen saisonalen Prognosen nichts weiter als die saisonalen Mittelwerte Wenn die Serie nicht nach oben oder unten tendiert, ist Ihre beste Schätzung des Wertes für die nächste Saison Dieser Jahreszeit s historischer Durchschnitt Siehe Abbildung 5 3.Figure 5 3 Kombiniere den großartigen Mittel mit den saisonalen Mitteln, um die saisonalen Indizes zu erhalten. In der Grafik in Abbildung 5 3 stellt die gestrichelte Linie die Prognosen von der einfachen Glättung dar. Die beiden durchgezogenen Linien stellen die tatsächlichen dar Saisonale Beobachtungen und die saisonalen Mittelwerte Beachten Sie, dass die saisonalen Mittelwerte die tatsächlichen saisonalen Beobachtungen ganz genau näher betrachten als die geglätteten Prognosen Sie können sehen, wie viel mehr von den beiden RMSEs in den Zellen F23 und H23 Die RMSE für die saisonalen Mittelwerte ist gerade Ein bisschen mehr als ein Drittel der RMSE für die geglätteten Prognosen. Sie können Kreide, dass bis zu der Größe der saisonalen Effekte sowie ihre Konsistenz. Zu den Beispiel, dass der Unterschied zwischen dem durchschnittlichen ersten und zweiten Quartal waren 35 0 Anstelle von 133 6, was der Unterschied zwischen den Zellen G2 und G3 in Abbildung 5 2 ist. Dann wäre in einem Glättungskontext der tatsächliche Wert für Quartal 1 ein viel besserer Prädiktor für den Wert für Quartal 2, als dies bei dieser Zeitreihe der Fall ist Und die exponentielle Glättung kann sich stark auf den Wert der aktuellen Beobachtung für ihre Prognose der nächsten Periode verlassen. Wenn die Glättungskonstante auf 1 0 gesetzt ist, wird die exponentielle Glättung auf na ve Prognose aufgelöst und die Prognose ist immer gleich der vorherigen Ist Größe jeder Saison Swing ist so konsistent von Quartal zu Quartal bedeutet, dass die einfache saisonale Durchschnittswerte sind zuverlässige Prognosen Keine tatsächliche vierteljährliche Beobachtung fährt sehr weit von der gesamten saisonalen Durchschnitt. Einfache saisonale Mittelwerte mit Trend. Die Verwendung von einfachen saisonalen Mittelwerte mit einer trendigen Serie Hat einige echte Nachteile, und ich habe versucht, vorzuschlagen, dass wir es ignorieren und auf fleißigere Themen weitergehen. Aber es ist möglich, dass du in Situationen rennen wirst, in denen jemand diese Methode benutzt hat und dann hat es gewonnen, dass es weh tut, um zu wissen, wie es funktioniert Und warum gibt es bessere Entscheidungen. Jeder Methode der Umgang mit Saisonalität in einer trendigen Serie muss mit dem grundlegenden Problem der Entwirrung der Wirkung des Trends von der der Saisonalität Saisonalität Tendenz zu dunklen Trend und umgekehrt Siehe Abbildung 5 4.Figure 5 4 Die Anwesenheit von Trend kompliziert die Berechnung von saisonalen Effekten. Die Tatsache, dass der Trend in der Serie im Laufe der Zeit aufwärts ist, bedeutet, dass die durchschnittliche Wertung der Beobachtungen jeder Saison, wie es im No-Trend-Fall der Fall war, den allgemeinen Trend mit dem Saisonale Variation Die übliche Idee ist, den Trend getrennt von den saisonalen Effekten zu berücksichtigen. Sie könnten den Trend quantifizieren und den Effekt von den beobachteten Daten subtrahieren. Das Ergebnis ist eine ungestreitete Serie, die die saisonale Variation beibehält. Es könnte in der gleichen Weise wie ich gehandhabt werden Veranschaulicht früher in diesem Kapitel. Berechnen der Mittel für jedes Jahr. Ein Weg, um die Daten zu vernachlässigen und andere Möglichkeiten wird zweifellos auftreten, ist es, den Trend auf der Grundlage der jährlichen Mittelwerte anstatt vierteljährlichen Daten zu berechnen Die Idee ist, dass der jährliche Durchschnitt unempfindlich ist Die saisonalen Effekte Das heißt, wenn man ein Jahr s von dem Wert für jedes seiner Quartiere subtrahiert, ist die Summe und damit der Durchschnitt der vier vierteljährlichen Effekte genau Null. Ein Trend, der mit den Jahresdurchschnitten berechnet wird, ist von den saisonalen Schwankungen nicht betroffen Diese Berechnung erscheint in Abbildung 5 5.Figure 5 5 Diese Methode setzt nun eine lineare Regression auf die einfachen Mittelwerte ein. Der erste Schritt, um die Daten zu verteilen, besteht darin, die durchschnittlichen täglichen Hits für jedes Jahr zu erhalten. Das ist im Bereich H3 H7 in Abbildung 5 5 Die Formel in Zelle H3 z. B. ist AVERAGE D3 D6.Bearbeitung der Tendenz basiert auf Jährlichen Mitteln. Mit den jährlichen Mittelwerten in der Hand, sind Sie in der Lage, ihre Tendenz zu berechnen, die man mit LINEST im Bereich I3 J7 verwaltet hat , Mit diesem Array formula. Wenn Sie don t liefern x-Werte als das zweite Argument zu LINEST Excel liefert Standard-x-Werte für Sie Die Vorgaben sind einfach die aufeinanderfolgenden Ganzzahlen beginnend mit 1 und enden mit der Anzahl der y-Werte, die Sie anrufen Für das erste Argument In diesem Beispiel sind die voreingestellten x-Werte identisch mit denen, die auf dem Arbeitsblatt in G3 G7 angegeben sind, also könntest du LINEST H3 H7 TRUE verwenden. Diese Formel verwendet zwei Vorgaben für die x-Werte und die Konstante, dargestellt Durch die drei aufeinanderfolgenden Kommas. Der Punkt dieser Übung ist es, den Jahres-zu-Jahres-Trend zu quantifizieren, und LINEST tut das für dich in Zelle I3 Diese Zelle enthält den Regressionskoeffizienten für die x-Werte Multiply 106 08 von 1 dann um 2 Dann um 3, 4 und 5 und fügen Sie zu jedem Ergebnis der Abschnitts von 84 63 Obwohl das bekommt Sie jährliche Prognosen, ist der wichtige Punkt für dieses Verfahren der Wert des Koeffizienten 106 08, die den jährlichen Trend quantifiziert. Der Schritt ich gerade Diskutiert ist die Quelle meiner Bedenken über den gesamten Ansatz, den dieser Abschnitt beschreibt Sie haben in der Regel eine kleine Anzahl von umgreifenden Perioden in diesem Beispiel, dass s Jahre, um durch die Regression Regression s Ergebnisse neigen dazu, schrecklich instabil, wenn, wie hier, sie Re basiert auf einer kleinen Anzahl von Beobachtungen Und doch diese Prozedur beruht auf diesen Ergebnissen stark, um die Zeitreihen zu vernachlässigen. Verfolgung der Trend über Jahreszeiten. Die einfache Mittelwerte Methode des Umgangs mit einer trendigen, saisonalen Serien wie diese weiter vorbei Trennung der Tendenz durch die Anzahl der Perioden in der Umfuhrperiode, um einen Per-Perioden-Trend zu erhalten Hier ist die Anzahl der Perioden pro Jahr vier wir arbeiten mit vierteljährlichen Daten, so dass wir teilen 106 08 von 4, um den Trend pro Quartal bei 26 zu schätzen 5.Das Verfahren nutzt diese periodische Tendenz, indem es sie von dem durchschnittlichen periodischen Ergebnis subtrahiert. Ziel ist es, den Effekt des Jahresverlaufs aus den saisonalen Effekten zu beseitigen. Zunächst müssen wir das durchschnittliche Ergebnis über alle fünf Jahre für den Zeitraum 1, Für Periode 2 und so weiter Um dies zu tun, hilft es, die Liste der tatsächlichen vierteljährlichen Treffer, die im Bereich D3 D22 von Abbildung 5 5 gezeigt ist, in eine Matrix von fünf Jahren um vier Viertel, die im Bereich G11 J15 gezeigt ist, anzuzeigen Werte in dieser Matrix entsprechen der Liste in Spalte D. Mit den auf diese Weise angeordneten Daten ist es einfach, den durchschnittlichen vierteljährlichen Wert über die fünf Jahre im Datensatz zu berechnen, der im Bereich G18 J18 erfolgt Trend, der von LINEST zurückgekehrt wird, erscheint im Bereich G19 J19 Der Startwert für jedes Jahr ist die beobachtete mittlere Täuschung für das erste Quartal, so dass wir für das erste Quartal keine Anpassungen vornehmen. Ein Vierteltrategie oder 26 5 wird abgezogen Die im zweiten Quartal bedeutende Hits, was zu einem angepassten zweiten Quartalwert von 329 9 führt, siehe Zelle H21, Abbildung 5 5 Zwei Viertel im Trend, 2 26 5 oder 53 in Zelle I19, wird vom dritten Quartal abgezogen Ein bereinigter 3. Quartal Wert von 282 6 in Zelle I21 Und ähnlich für das vierte Quartal, subtrahieren drei Viertel der Trend von 454 4 zu bekommen 374 8 in Zelle J21.Halten Sie daran, dass, wenn der Trend waren eher als oben, wie in In diesem Beispiel würden Sie den periodischen Trendwert zu den beobachteten periodischen Mitteln hinzufügen, anstatt sie zu subtrahieren. Konvertieren der angepassten saisonalen Mittel zu saisonalen Effekten. Die Logik dieser Methode sind die in den Zeilen 20, 21 der Abbildung 5 5 gezeigten Werte der Durchschnitt Vierteljährliche Ergebnisse für jedes von vier Quartalen mit der Auswirkung des allgemeinen Aufwärtstrends im Datensatz entfernt Die Reihen 20 und 21 werden in den Spalten G bis J zusammengeführt. Mit ihrem Trend aus dem Weg können wir diese Zahlen auf saure Effekte umsetzen Das Ergebnis des Seins im ersten Quartal, im zweiten Quartal und so weiter Um diese Effekte zu erzielen, beginnen wir mit der Berechnung des großen Mittels der angepassten vierteljährlichen Mittel. Der bereinigte Großmittelwert erscheint in Zelle I23. Die Analyse geht weiter in Abbildung 5 6. Abbildung 5 6 Die vierteljährlichen Effekte oder Indizes werden verwendet, um die beobachteten Quartalsgeschäfte zu entschlüsseln. Figur 5 6 wiederholt die vierteljährlichen Anpassungen und den angepassten Mittelwert aus der Unterseite von Abbildung 5 5 Sie werden kombiniert, um die vierteljährlichen Indizes zu bestimmen, die Sie auch denken können Als saisonale Effekte Zum Beispiel ist die Formel in Zelle D8 wie folgt. Es gibt 33 2 Das ist die Wirkung des Seins im zweiten Quartal, vis - - vis der großartige Mittel In Bezug auf den großen Mittelwert, können wir ein Ergebnis erwarten Das gehört zum zweiten Quartal, um unter dem großen Mittelwert um 33 2 Einheiten zu fallen. Die saisonalen Effekte auf die beobachteten Quarterlies zu setzen. Um zu rekapitieren Bisher haben wir den jährlichen Trend in den Daten durch Regression quantifiziert und diesen Trend um 4 geteilt, um zu prorieren Es zu einem vierteljährlichen Wert Abholung in Abbildung 5 6 Wir haben den Mittelwert für jedes Quartal in C3 F3 durch Subtraktion der angestrebten Trends in C4 F4 Das Ergebnis ist eine abgesetzte Schätzung der Mittelwert für jedes Quartal, unabhängig von dem Jahr, in dem das Quartal Findet in C5 F5 statt. Wir haben den eingestellten Großmittel in der Zelle G5 von den angepassten vierteljährlichen Mitteln in C5 F5 subtrahiert. Das wandelt jedes Quartal zu einem Maß für die Wirkung jedes Quartals gegenüber dem angepassten Großartigen. Das sind saisonal Indizes oder Effekte in C8 F8.Next entfernen wir die saisonalen Effekte aus den beobachteten Quartalen Wie in Abbildung 5 6 gezeigt, machst du dies durch Subtrahieren der vierteljährlichen Indizes in C8 F8 von den entsprechenden Werten in C12 F16 und der einfachste Weg, dies zu tun Geben Sie diese Formel in Zelle C20.Hinweis der einzelnen Dollar-Zeichen vor dem 8 in der Referenz auf C 8 Das sa gemischte Referenz teilweise relativ und teilweise absolut Das Dollarzeichen verankert die Referenz auf die achte Zeile, aber der Spaltenteil der Referenz ist frei Zu variieren. Daher, nachdem die letztere Formel in Zelle C20 eingegeben wird, können Sie auf die Zelle s Auswahl Handle das kleine Quadrat in der unteren rechten Ecke einer ausgewählten Zelle und ziehen Sie rechts in Zelle F20 Die Adressen passen, wie Sie nach rechts ziehen Und Sie winden sich mit den Werten, mit den saisonalen Effekten entfernt, für das Jahr 2001 in C20 F20 Wählen Sie diese Reihe von vier Zellen und verwenden Sie die Mehrfachauswahl s Griff, jetzt in F20, um in Zeile 24 zu ziehen. So füllt der Rest von Die Matrix. Es ist wichtig, hier zu bedenken, dass wir die ursprünglichen vierteljährlichen Werte für die saisonalen Effekte anpassen. Was auch immer der Trend in den ursprünglichen Werten bestand, ist immer noch da, und in der Theorie bleibt zumindest dort, nachdem wir die Anpassungen für saisonale gemacht haben Effekte Wir haben einen Trend entfernt, ja, aber nur aus den saisonalen Effekten So, wenn wir die verstorbenen saisonalen Effekte von den ursprünglichen vierteljährlichen Beobachtungen subtrahieren, sind die ursprünglichen Beobachtungen mit dem Trend aber ohne die saisonalen Effekte. Ich habe jene saisonal gezeichnet Angepaßte Werte in Abbildung 5 6 Vergleiche dieses Diagramm mit dem Diagramm in Abbildung 5 4 Beachten Sie in Abbildung 5 6, dass, obwohl die entsorgten Werte nicht genau auf einer Geraden liegen, ein Großteil des saisonalen Effekts entfernt wurde. Das Auslaufen der Deseasonalized Quarterlies auf die Zeit-Perioden. Der nächste Schritt ist es, Prognosen aus den saisonbereinigten, trendigen Daten in Abbildung 5 6 Zellen C20 F24 zu erstellen, und an diesem Punkt haben Sie mehrere Alternativen verfügbar Sie könnten den differenzierenden Ansatz kombinieren mit einfacher exponentieller Glättung, die in Kapitel diskutiert wurde 3, Arbeiten mit Trended Time Series Sie können auch Holt's Ansatz zur Glättung von trendigen Serien, die in Kapitel 3 und Kapitel 4 diskutiert werden, Initialisieren von Prognosen Beide Methoden setzen Sie in die Lage, eine One-Step-Ahead-Prognose zu erstellen, zu der Sie Würde den entsprechenden saisonalen Index hinzufügen. Ein anderer Ansatz, den ich hier verwende, legt zuerst die trendigen Daten durch eine andere Instanz der linearen Regression und fügt dann den saisonalen Index hinzu. Siehe Abbildung 5 7.Figure 5 7 Die erste wahre Prognose ist in Zeile 25. Fig. 5 7 gibt die entsorgten vierteljährlichen Mittel aus der tabellarischen Anordnung in C20 F24 von Fig. 5 6 zu der Listenanordnung im Bereich C5 C24 von Fig. 5 zurück. 7Wir könnten LINEST in Verbindung mit den Daten in B5 C24 in Fig. 5 bis 7 verwenden Berechnen Sie die Abgrenzungsgleichung s Abgrenzung und Koeffizient dann können wir den Koeffizienten durch jeden Wert in Spalte B multiplizieren und fügen Sie den Abschnitts zu jedem Produkt hinzu, um die Prognosen in Spalte D zu erstellen. Aber obwohl LINEST nützliche Informationen außer dem Koeffizienten und dem Abfangen zurückgibt, TREND ist ein schnellerer Weg, um die Prognosen zu erhalten, und ich benutze es in Abbildung 5 7.Die Reichweite D5 D24 enthält die Prognosen, die sich aus dem Umschalten der entsetzten Quartalszahlen in C5 C24 auf die Periodennummern in B5 B24 ergeben. Die in D5 verwendete Arrayformel D24 ist das. Dieser Satz von Ergebnissen spiegelt die Auswirkung des allgemeinen Aufwärtstrends in der Zeitreihe dar. Da die Werte, die TREND prognostiziert hat, entstellt wurden, bleibt es, die saisonalen Effekte, auch als saisonale Indizes bekannt, wieder hinzuzufügen Trended Prognose. Haben die saisonalen Indizes zurück In. Die saisonalen Indizes, die in Abbildung 5 6 berechnet werden, sind in Abbildung 5 7 zuerst im Bereich C2 F2 und dann wiederholt im Bereich E5 E8, E9 E12 und so weiter vorgesehen. Die neu geschätzten Prognosen sind Platziert in F5 F24 durch Hinzufügen der saisonalen Effekte in Spalte E zu den Trendvorhersagen in Spalte D. Um die einstufige Prognose in Zelle F25 von Abbildung 5 7 zu erhalten, geht der Wert von t für den nächsten Zeitraum in die Zelle B25 Formel wird in Zelle D25 eingegeben. Es weist Excel an, die Regressionsgleichung zu berechnen, die Werte im Bereich C5 C24 von denen in B5 B24 prognostiziert und diese Gleichung auf den neuen x-Wert in Zelle B25 anwenden wird. Der entsprechende saisonale Index wird platziert Zelle E25, und die Summe von D25 und E25 wird in F25 als die erste wahre Prognose der trendigen und saisonalen Zeitreihen platziert. Sie finden den ganzen Satz von entsetzten Quartalen und die Prognosen, die in Abbildung 5 dargestellt sind 8.Figure 5 8 Die Saison Effekte werden auf die Prognosen zurückgegeben. Evaluating Simple Averages. Der Ansatz für den Umgang mit einer saisonalen Zeitreihen, diskutiert in mehreren früheren Abschnitten, hat eine intuitive Anziehungskraft Die Grundidee scheint einfach. Calculieren Sie einen jährlichen Trend durch die Rückkehr der jährlichen Mittel gegen ein Maß der Zeit PeriodenDie endgültige Tendenz zwischen den Perioden innerhalb des Jahres. Subtrahieren Sie die verteilten Trend von den periodischen Effekten, um angepasst Effekte zu erhalten. Sammeln Sie die angepassten Effekte aus den tatsächlichen Maßnahmen, um die Zeitreihen zu entschlüsseln. Geben Sie Prognosen aus der entsorgten Serie, und fügen Sie die Angepasste saisonale Effekte zurück in. Meine eigene Ansicht ist, dass einige Probleme den Ansatz schwächen, und ich würde es nicht in dieses Buch aufgenommen haben, außer dass Sie wahrscheinlich es zu begegnen und deshalb sollte es vertraut sein und es bietet eine nützliche Sprungbrett zu diskutieren Einige konzeption und verfahren in anderen, stärkeren ansätzen. Erstens gibt es die Frage, über die ich mich in diesem Kapitel über die sehr kleine Stichprobengröße für die Regression der jährlichen Mittel auf aufeinanderfolgende Ganzzahlen, die jedes Jahr identifizieren, selbst mit nur einem Prädiktor, So wenig wie 10 Beobachtungen ist wirklich kratzen die Unterseite des Fasses Zumindest sollten Sie sich die resultierende R 2 bereinigt auf Schrumpfung und wahrscheinlich neu berechnen die Standard-Fehler der Schätzung entsprechend. Es ist wahr, dass je stärker die Korrelation in der Bevölkerung, Je kleiner die Probe, die du wegschmeißen kannst, sondern auch mit den Vierteln innerhalb von Jahren zu arbeiten, du bist glücklich, so viele wie 10 Jahre im Wert von aufeinanderfolgenden vierteljährlichen Beobachtungen zu finden, die jeweils in gleicher Weise über diese Zeitspanne hinweg gemessen wurden. Ich bin nicht davon überzeugt, dass die Antwort auf das problematische Auf-und-Ab-Muster finden Sie innerhalb eines Jahres sehen Sie das Diagramm in Abbildung 5 4 ist es, die Gipfel und Täler zu durchschnittlich und erhalten eine Trendschätzung aus dem jährlichen Mittel Sicherlich ist es eine Antwort auf dieses Problem, aber, Wie Sie sehen werden, gibt es eine viel stärkere Methode, die saisonalen Effekte von einer zugrunde liegenden Tendenz zu trennen, sie zu berücksichtigen, und prognostiziert dementsprechend, dass ich diese Methode später in diesem Kapitel, in der Linear Regression mit Coded Vectors Abschnitt S keine Grundlage in der Theorie für die Verteilung der jährlichen Tendenz gleichmäßig unter den Perioden, die das Jahr komponieren Es ist wahr, dass lineare Regression etwas Ähnliches tut, wenn es seine Prognosen auf eine gerade Linie Aber es gibt eine riesige Kluft zwischen eine grundlegende Annahme, weil das analytische Modell Kann sonst nicht mit den Daten umgehen und ein fehlerhaftes Ergebnis akzeptieren, dessen Fehler in den Prognosen fehlerhaft gemessen und ausgewertet werden können. Das heißt, lass s auf die Verwendung von gleitenden Durchschnitten statt einfacher Mittelwerte als Weg des Umgangs mit Saisonalität übergehen.
No comments:
Post a Comment